2019备战高考数学全国真题精练(2016-2018)第10章 第3节 用样本估计总体

文档属性

名称 2019备战高考数学全国真题精练(2016-2018)第10章 第3节 用样本估计总体
格式 zip
文件大小 2.8MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2019-01-05 10:03:49

文档简介

2019年备战高考数学全国各地真题精练(2016-2018)
第10章 第3节 用样本估计总体(学生版)
备战基础·零风险
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用 表示,各小长方形的面积总和等于 .
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为 ,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
用样本的数字特征估计总体的数字特征
众数
中位数
平均数
①众数:
在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:
样本数据的算术平均数,即= .在频率分布直方图中,中位数左边和右边的直方图的面积 .
样本方差
标准差
标准差s= .
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
备战方法·巧解题
规律
方法
1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
2.两个防范 一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频率;
二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3. 解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.
4. 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.
小结
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. 
备战练习·固基石
一、单选题
1.已知两组样本数据的平均数为h,的平均数为k, 则把两组数据合并成一组以后,这组样本的平均数为(?? )
A.??????????????????????????????????B.??????????????????????????????????C.??????????????????????????????????D.?
2.某校高一学生进行测试,随机抽取20名学生的测试成绩,绘制茎叶图如图所示,则这组数据的众数和中位数分别为(?? )
A.?86,77??????????????????????????????B.?86,78??????????????????????????????C.?77,77??????????????????????????????D.?77,78
3.某校男子足球队16名队员的年龄如下:17? 17? 18? 18? 16? 18? 17? 15? 18? 18? 17? 16? 18? 17? 18? 14?,这些队员年龄的众数 (???)
A.?17岁??????????????????????????????????B.?18岁??????????????????????????????????C.?17.5岁??????????????????????????????????D.?18.5岁
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是(??)
A.?20?????????????????????????????????????????B.?30?????????????????????????????????????????C.?40?????????????????????????????????????????D.?50
5.某车间加工零件的数量 与加工时间 的统计数据如下表:
零件数 (个)
10
20
30
加工时间 (分钟)
21
30
39
现已求得上表数据的回归方程 中的 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为(?? )
A.?84分钟??????????????????????????????B.?94分钟??????????????????????????????C.?102分钟??????????????????????????????D.?112分钟
6.为了让人们感受到丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31,如果该班有45名同学,那么根据提供的数据估计这周全班同学各家总共丢弃塑料袋的数量约为(? )
A.?900????????????????????????????????????B.?1080????????????????????????????????????C.?1260????????????????????????????????????D.?1800
7.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 , ,则下列说法正确的是( ??)
A.?,乙比甲成绩稳定,应选乙参加比赛??????????B.?,甲比乙成绩稳定,应选甲参加比赛 C.?,甲比乙成绩稳定,应选甲参加比赛??????????D.?,乙比甲成绩稳定,应选乙参加比赛
8.学校举行“好声音”歌曲演唱比赛,五位评委为学生甲打出的演唱分数茎叶图如图所示,已知这组数据的中位数为 ,则这组数据的平均数不可能为(??? ).
A.??????????????????????????????????????B.??????????????????????????????????????C.??????????????????????????????????????D.?
9.甲、乙两名同学在某项测试中的6次成绩的茎叶图如图所示,, 分别表示甲乙两名同学这项测试成绩的平均数,分别表示甲乙两名同学这项测试成绩的标准差,则有(????? )
A.??????????B.?????????C.?????????D.?
10.由下表可计算出变量x,y的线性回归方程为(  )
x
5
4
3
2
1
y
2
1.5
1
1
0.5
A.?=0.35x+0.15????????????B.?=﹣0.35x+0.25????????????C.?=﹣0.35x+0.15????????????D.?=0.35x+0.25
11.某设计运动员在一次测试中射击10次,其测试成绩如表:则该运动员测试成绩的中位数为(  )
环数
7
8
9
10
频数
3
2
2
3
A.?2??????????????????????????????????????????B.?8??????????????????????????????????????????C.?8.5??????????????????????????????????????????D.?9
12.某单位为了了解用电量y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并作了如下的对照表:由表中数据,得回归直线方程 = + ,若 =﹣2,则 =(?? )
气温X(℃)
18
13
10
﹣1
用电量y
24
34
38
64
A.?60????????????????????????????????????????B.?58??????????????????????????????????????????C.?62????????????????????????????????????????D.?64
13.若某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图1),其中茎为十位数, 叶为个位数,则这组数据的中位数和平均数分别是(  )
A.?91,91.5???????????????????????????B.?91,92???????????????????????????C.?91.5,91.5???????????????????????????D.?91.5,92
14.为调查某中学学生平均每人每天参加体育锻炼时间X(单位:分钟),按锻炼时间分下列四种情况统计:①0~10分钟;②10~20分钟;③20~30分钟;④30分钟以上.有2000名中学生参加了此项活动.下表是此次调查中的频数分布表.国家规定中学生每天参加体育锻炼时间达到30分钟以上者,才能保持良好健康的身体发展,则平均每天保持良好健康的身体发展的学生的频率是(  )
组距
[0,10)
[10,20)
[20,30)
[30,+)
频数
400
600
800
200
A.?0.1???????????????????????????????????????B.?0.2???????????????????????????????????????C.?0.3???????????????????????????????????????D.?0.4
15.某商品销售量y(件)与销售价格x(元/件)负相关,则可能作为其回归方程是(?)
A.???????????B.???????C.???????????D.?
16.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地作10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2 . 已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是(  )
A.?直线l1和l2相交,但是交点未必是点(s,t)???????B.?直线l1和l2有交点(s,t) C.?直线l1和l2由于斜率相等,所以必定平行?????????????D.?直线l1和l2必定重合
17.下列抽样中,最适宜用系统抽样法的是(  )
A.?某市的4个区共有2000名学生,且4个区的学生人数之比为3:2:8:2,从中抽取200人做样本 B.?从某厂生产的2000个电子元件中随机抽取5个做样本 C.?从某厂生产的2000个电子元件中随机抽取200个做样本 D.?从某厂生产的20个电子元件中随机抽取5个做样本
18.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做100次和150次试验,并且利用线性回归方法,求得回归直线分别为t1和t2 , 已知两人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是,那么下列说法正确的是(?????)
A.?和t2有交点(s,t)?????B.?与t2相交,但交点不一定是(s,t)?????C.?与t2必定平行?????D.?与t2必定重合
二、填空题
19.已知数据x1 , x2 , …,x8的方差为16,则数据2x1+1,2x2+1,…,2x8+1的标准差为________?
20.分类变量X和Y的列表如下,则下列说法判断正确的是________.(填序号)
①ad-bc越小,说明X与Y的关系越弱;②ad-bc越大,说明X与Y的关系越强;
③(ad-bc)2越大,说明X与Y的关系越强;④(ad-bc)2越接近于0,说明X与Y的关系越强.
21.如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为________?.
22.在下列各图中,其中,每个图的来年改革变量具有相关关系的图是________ (把所有正确序号都填上)
23.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的, 且样本容量为200,则第8组的频数为________?
24.如图所示,图中有5组数据,去掉________?组数据后(填字母代号),剩下的4组数据的线性相关性最大.
25.某产品的广告费用x与销售额y的统计数据如表:
广告费x(万元)
2
3
4
5
利润y(万元)
26
49
56
根据表格已得回归方程为=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________?
26.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________?.
三、解答题
27.已知产品 的质量采用综合指标值 进行衡量, 为一等品; 为二等品; 为三等品.我市一家工厂准备购进新型设备以提高生产产品 的效益,在某供应商提供的设备中任选一个试用,生产了一批产品并统计相关数据,得到频率分布直方图:
(1)估计该新型设备生产的产品 为二等品的概率;
(2)根据这家工厂的记录,产品各等次的销售率(某等次产品销量与其对应产量的比值)及单件售价情况如下:
一等品
二等品
三等品
销售率
???????????
????????????
????????????
单件售价



根据以往的销售方案,未售出的产品统一按原售价的 全部处理完.已知该工厂认购该新型设备的前提条件是,该新型设备生产的产品同时满足下列两个条件:
①综合指标值的平均数不小于 (同一组中的数据用该组区间的中点值作代表);
②单件平均利润值不低于 元.
若该新型设备生产的产品 的成本为 元/件,月产量为 件,在销售方案不变的情况下,根据以上图表数据,分析该新型设备是否达到该工厂的认购条件.
28.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主. (1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯; (2)根据茎叶图,指出50岁以下的亲属当中饮食指数高于70的人数,并计算这些人的饮食指数的平均数和方差(精确到整数)
29.经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润. (Ⅰ)将T表示为X的函数; (Ⅱ)根据直方图估计利润T不少于57000元的概率.
30.今年5月,某商业集团公司根据相关评分细则,对其所属25家商业连锁店进行了考核评估,将各连锁店的评估分数按[60,70],[70,80],[80,90],[90,100]分成4组,其频率分布直方图如图所示,集团公司还依据评估得分,将这些连锁店划分为A、B、C、D四个等级,等级评定标准如下表所示:
评估得分
[60,70]
[70,80]
[80,90]
[90,100]
评定等级
D
C
B
A
(Ⅰ)估计该商业集团各连锁店评估得分的众数和平均数; (Ⅱ)从评估分数不少于80分的连锁店中任选2家介绍营销经验,求至少选一家A等级的概率.
备战真题·勇闯天涯
一、单选题
1.(2018?卷Ⅲ)某群体中的每位成员使用移动支付的概率都为 ,各成员的支付方式相互独立,设 为该群体的10位成员中使用移动支付的人数, , ,则 (??? )
A.?0.7???????????????????????????????????????B.?0.6???????????????????????????????????????C.?0.4???????????????????????????????????????D.?0.3
2.(2017?山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为 = x+ ,已知 xi=225, yi=1600, =4,该班某学生的脚长为24,据此估计其身高为(  )
A.?160??????????????????????????????????????B.?163??????????????????????????????????????C.?166??????????????????????????????????????D.?170
3.(2017·山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为(  )
A.?3,5????????????????????????????????????B.?5,5????????????????????????????????????C.?3,7????????????????????????????????????D.?5,7
4.(2017?新课标Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田,这n块地的亩产量(单位:kg)分别是x1 , x2 , …,xn , 下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.?x1 , x2 , …,xn的平均数????????????????????????????????B.?x1 , x2 , …,xn的标准差 C.?x1 , x2 , …,xn的最大值????????????????????????????????D.?x1 , x2 , …,xn的中位数
5.(2016?山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.?56???????????????????????????????????????B.?60???????????????????????????????????????C.?120???????????????????????????????????????D.?140
二、填空题
6.?? (2018?江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
7.(2016?江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________?
8.(2016?上海)某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是________(米).
三、解答题
9.(2018?卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,,0.3
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图
(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
10.(2018?卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图。 为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量 的值依次为1,2,…,17)建立模型①:=-30.4+13.5t .根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由。
11.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
12.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
13.(2017?新课标Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.(12分)
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
14.(2017?北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图: (Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
15.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率; (Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
16.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).(12分)
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = =9.97,s= = ≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16. 用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( ﹣3 +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01). 附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592, ≈0.09.
17.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:(12分)
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = xi=9.97,s= = =0.212, ≈18.439, (xi﹣ )(i﹣8.5)=﹣2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi , i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在( ﹣3s, +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ⅱ)在( ﹣3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi , yi)(i=1,2,…,n)的相关系数r= , ≈0.09.
18.(2016?全国)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据: =9.32, =40.17, =0.55, ≈2.646. 参考公式: , 回归方程 中斜率和截距的最小二乘估计公式分别为: , .
19.(2016?北京)A、B、C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时);
A班
6??? 6.5??? 7???? 7.5????? 8
B班
6??? 7????? 8???? 9????? 10??? 11??? 12
C班
3??? 4.5???? 6??? 7.5????? 9??? 10.5?? 12???? 13.5
(1)试估计C班的学生人数;
(2)从A班和C班抽出的学生中,各随机选取一人,A班选出的人记为甲,C班选出的人记为乙,假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从A、B、C三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记?? ,表格中数据的平均数记为 ?,试判断 ? 和 的大小,(结论不要求证明)
20.(2016?全国)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图: 记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
21.(2016?全国)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
22.(2016?四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的a值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(3)估计居民月均用水量的中位数.

2019年备战高考数学全国各地真题精练(2016-2018)
第10章 第3节 用样本估计总体(教师版)
备战基础·零风险
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
用样本的数字特征估计总体的数字特征
众数
中位数
平均数
①众数:
在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:
样本数据的算术平均数,即=(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等.
样本方差
标准差
标准差s= .
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
备战方法·巧解题
规律
方法
1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
2.两个防范 一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频率;
二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3. 解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.
4. 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.
小结
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. 
备战练习·固基石
一、单选题
1.已知两组样本数据的平均数为h,的平均数为k, 则把两组数据合并成一组以后,这组样本的平均数为(?? )
A.??????????????????????????????????B.??????????????????????????????????C.??????????????????????????????????D.?
【答案】B
【考点】众数、中位数、平均数
【解析】【解答】∵样本数据x1 , x2 , …xn的平均数为h, y1 , y2 , …ym的平均数为k,∴第一组数据的和是nh,第二组数据的和是mk,把两组数据合成一组以后,数据的个数是m+n,所有数据的和是nh+mk,∴这组数据的平均数是 , 故选B.
2.某校高一学生进行测试,随机抽取20名学生的测试成绩,绘制茎叶图如图所示,则这组数据的众数和中位数分别为(?? )
A.?86,77??????????????????????????????B.?86,78??????????????????????????????C.?77,77??????????????????????????????D.?77,78
【答案】B
【考点】茎叶图,众数、中位数、平均数
【解析】【解答】解:由茎叶图可知, 在所有数据中出频率最多,所以众数是 , 从小到大排列后,第 与第 位数分别是 与 , 所以中位数为 , 故答案为:B. 【分析】 茎叶图中出现次数最多的是众数,中间的数是中位数,注意在求解中位数时要先把数据从大到小或从小到大排列。
3.某校男子足球队16名队员的年龄如下:17? 17? 18? 18? 16? 18? 17? 15? 18? 18? 17? 16? 18? 17? 18? 14?,这些队员年龄的众数 (???)
A.?17岁??????????????????????????????????B.?18岁??????????????????????????????????C.?17.5岁??????????????????????????????????D.?18.5岁
【答案】B
【考点】众数、中位数、平均数
【解析】【分析】这组数据中18出现了7次,出现的次数最多,所以众数为18岁。 【点评】直接考查众数的概念:出现次数最多的数。
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是(??)
A.?20?????????????????????????????????????????B.?30?????????????????????????????????????????C.?40?????????????????????????????????????????D.?50
【答案】C
【考点】频率分布直方图
【解析】【分析】由图可知:则56.5~64.5段的频率为(0.03+0.05×2+0.07)×2=0.4, 则频数为100×0.4=40人. 故选C.
5.某车间加工零件的数量 与加工时间 的统计数据如下表:
零件数 (个)
10
20
30
加工时间 (分钟)
21
30
39
现已求得上表数据的回归方程 中的 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为(?? )
A.?84分钟??????????????????????????????B.?94分钟??????????????????????????????C.?102分钟??????????????????????????????D.?112分钟
【答案】C
【考点】线性回归方程
【解析】【解答】 , ,回归直线过样本点的中心, ,解得 ,加工100个零件大约需要 分钟. 故答案为:C【分析】首先求出数据的平均值,根据已知回归直线过样本点的中心,将代入回归方程,求得a=12,得到回归方程,求出结果。
6.为了让人们感受到丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33、25、28、26、25、31,如果该班有45名同学,那么根据提供的数据估计这周全班同学各家总共丢弃塑料袋的数量约为(? )
A.?900????????????????????????????????????B.?1080????????????????????????????????????C.?1260????????????????????????????????????D.?1800
【答案】C
【考点】用样本的数字特征估计总体的数字特征
【解析】【分析】由已知抽样数据可得平均数为(33+25+28+26+25+31)÷6=28个,据此可以估计本周全班同学各家共丢弃塑料袋的数量约为28×45=1260个. 故选C 【点评】用样本数字特征估计总体的数字特征,属于基础题.此题体现出数学的应用价值。
7.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 , ,则下列说法正确的是( ??)
A.? ,乙比甲成绩稳定,应选乙参加比赛??????????B.? ,甲比乙成绩稳定,应选甲参加比赛 C.? ,甲比乙成绩稳定,应选甲参加比赛??????????D.? ,乙比甲成绩稳定,应选乙参加比赛
【答案】D
【考点】收集数据的方法,茎叶图
【解析】【解答】 由茎叶图可知, ?甲的平均数是 , ?乙的平均数是 , ?所以乙的平均数大于甲的平均数,即 , ?从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛, 故答案为:D. 【分析】由甲、乙两人的得分情况茎叶图得到甲的得分位于茎叶图的左上方,乙的得分位于茎叶图的右下方,甲的成绩相对分散,乙的成绩相对集中,由此能求出结果.
8.学校举行“好声音”歌曲演唱比赛,五位评委为学生甲打出的演唱分数茎叶图如图所示,已知这组数据的中位数为 ,则这组数据的平均数不可能为(??? ).
A.??????????????????????????????????????B.??????????????????????????????????????C.??????????????????????????????????????D.?
【答案】A
【考点】茎叶图,众数、中位数、平均数
【解析】【解答】由题意 , 当 时,平均数为 , 当 时,平均数为 , 即平均数在 区间内, 项排除. 故答案为: . 【分析】根据中位数相同求出 6 ≤ x ≤ 9 ,从而求出平均数的取值范围即可.
9.甲、乙两名同学在某项测试中的6次成绩的茎叶图如图所示, , 分别表示甲乙两名同学这项测试成绩的平均数,分别表示甲乙两名同学这项测试成绩的标准差,则有(????? )
A.??????B.??????????C.???????D.?
【答案】B
【考点】茎叶图,众数、中位数、平均数,极差、方差与标准差
【解析】【解答】由茎叶图可看出甲的平均数是, 乙的平均数是?, ∴两组数据的平均数相等.甲的方差是, 乙的方差是, ∴甲的标准差小于乙的标准差,故选B.
10.由下表可计算出变量x,y的线性回归方程为(  )
x
5
4
3
2
1
y
2
1.5
1
1
0.5
A.?=0.35x+0.15????????????B.?y∧=﹣0.35x+0.25????????????C.?y∧=﹣0.35x+0.15????????????D.?y∧=0.35x+0.25
【答案】A
【考点】线性回归方程
【解析】【解答】 ∴ a=1.2﹣0.35×3=0.15, ∴线性回归方程为y=0.35x+0.15. 故选:A. 【分析】利用平均数公式求得平均数,代入公式求回归系数,可得回归直线方程.
11.某设计运动员在一次测试中射击10次,其测试成绩如表:则该运动员测试成绩的中位数为(  )
环数
7
8
9
10
频数
3
2
2
3
A.?2??????????????????????????????????????????B.?8??????????????????????????????????????????C.?8.5??????????????????????????????????????????D.?9
【答案】C
【考点】众数、中位数、平均数
【解析】【解答】解:根据题意,得; 该运动员射击10次命中环数从小到大的顺序如下, 7、7、7、8、8、9、9、10、10、10; ∴则该运动员测试成绩的中位数为 =8.5. 故选:C. 【分析】根据中位数的定义,结合表中数据,求出答案来.
12.某单位为了了解用电量y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并作了如下的对照表:由表中数据,得回归直线方程 = + ,若 =﹣2,则 =(?? )
气温X(℃)
18
13
10
﹣1
用电量y
24
34
38
64
A.?60????????????????????????????????????????B.?58??????????????????????????????????????????C.?62????????????????????????????????????????D.?64
【答案】A
【考点】线性回归方程
【解析】【解答】由题意, =(18+13+10﹣1)=10, =(24+34+38+64)=40 将(10,40)代入y=﹣2x+a,∴40=10×(﹣2)+a, 解得:a=60, 故选:A. 【分析】根据所给的表格求出本组数据的样本中心点,结合样本中心点在线性回归直线上求得a值
13.若某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图1),其中茎为十位数,
叶为个位数,则这组数据的中位数和平均数分别是(  )
A.?91,91.5 B.?91,92 ????C.?91.5,91.5 ????D.?91.5,92
【答案】C
【考点】茎叶图
【解析】【解答】把茎叶图中的数据按大小顺序排列,如下;
87、88、90、91、92、93、94、97;
∴这组数据的中位数为=91.5,
平均数是(87+88+90+91+92+93+94+97)=91.5.
故选:C.
【分析】根据茎叶图中的数据,计算这组数据的中位数与平均数即可。
14.为调查某中学学生平均每人每天参加体育锻炼时间X(单位:分钟),按锻炼时间分下列四种情况统计:①0~10分钟;②10~20分钟;③20~30分钟;④30分钟以上.有2000名中学生参加了此项活动.下表是此次调查中的频数分布表.国家规定中学生每天参加体育锻炼时间达到30分钟以上者,才能保持良好健康的身体发展,则平均每天保持良好健康的身体发展的学生的频率是(  )
组距
[0,10)
[10,20)
[20,30)
[30,+)
频数
400
600
800
200
A.?0.1???????????????????????????????????????B.?0.2???????????????????????????????????????C.?0.3???????????????????????????????????????D.?0.4
【答案】A
【考点】频率分布表
【解析】【解答】根据频率分布表,得; 每天保持良好健康的身体发展的学生的频率, 即每天参加体育锻炼时间达30分钟以上的学生的频率是 =0.1. 故选:A. 【分析】根据频率分布表,利用频率=, 求出频率即可。
15.某商品销售量y(件)与销售价格x(元/件)负相关,则可能作为其回归方程是(?)
A.????????B.???????C.????????D.?
【答案】A
【考点】两个变量的线性相关
【解析】【解答】由x与y负相关,可排除B、D两项,而C项中的<0不符合题意.故选A 【分析】本题考查的知识点是回归分析的基本概念,两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负
16.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地作10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2 . 已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是(  )
A.?直线l1和l2相交,但是交点未必是点(s,t)???????B.?直线l1和l2有交点(s,t) C.?直线l1和l2由于斜率相等,所以必定平行?????????????D.?直线l1和l2必定重合
【答案】B
【考点】变量间的相关关系
【解析】【解答】解:∵两组数据变量x的观测值的平均值都是s, 对变量y的观测值的平均值都是t, ∴两组数据的样本中心点都是(s,t) ∵数据的样本中心点一定在线性回归直线上, ∴回归直线l1和l2都过点(s,t) ∴两条直线有公共点(s,t) 故选:B. 【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).
17.下列抽样中,最适宜用系统抽样法的是(  )
A.?某市的4个区共有2000名学生,且4个区的学生人数之比为3:2:8:2,从中抽取200人做样本 B.?从某厂生产的2000个电子元件中随机抽取5个做样本 C.?从某厂生产的2000个电子元件中随机抽取200个做样本 D.?从某厂生产的20个电子元件中随机抽取5个做样本
【答案】C
【考点】收集数据的方法
【解析】【解答】系统抽样的特点是从比较多比较均衡的个体中抽取一定的样本, 并且抽取的样本具有一定的规律性, 在所给的四个抽样中, 从某厂生产的2000个电子元件中随机抽取5个做样本或从某厂生产的20个电子元件中随机抽取5个做样本, 它们都是一个简单随机抽样; 对于某市的4个区共有2000名学生,且4个区的学生人数之比为3:2:8:2,从中抽取200人做样本,由于个体是由差别明显的几部分组成,故采用分层抽样, 只有在从某厂生产的2000个电子元件中随机抽取200个做样本, 这是一个最适宜用系统抽样法的. 故选C. 【分析】根据系统抽样的特点,样本是在总体个数比较多的情况下,遵循一定的规则,具有相同的间隔,得到的一系列样本。
18.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做100次和150次试验,并且利用线性回归方法,求得回归直线分别为t1和t2 , 已知两人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是,那么下列说法正确的是(?????)
A.?和t2有交点(s,t)?????B.?与t2相交,但交点不一定是(s,t)?????C.?与t2必定平行?????D.?与t2必定重合
【答案】A
【考点】线性回归方程
【解析】【分析】由题意知两组数据的样本中心点都是(s,t),根据数据的样本中心点一定在线性回归直线上,得到回归直线t1和t2都过点(s,t),得到结论.
二、填空题
19.已知数据x1 , x2 , …,x8的方差为16,则数据2x1+1,2x2+1,…,2x8+1的标准差为________?
【答案】8
【考点】众数、中位数、平均数,极差、方差与标准差
【解析】【解答】∵数据x1 , x2 , …,x8的方差为16, ∴由方差的性质得: 数据2x1+1,2x2+1,…,2x8+1的方差为:S2=22×16=64, ∴数据2x1+1,2x2+1,…,2x8+1的标准差为:S==8. 故答案为:8. 【分析】由方差的性质先求出数据2x1+1,2x2+1,…,2x8+1的方差,再求出数据2x1+1,2x2+1,…,2x8+1的标准差.
20.分类变量X和Y的列表如下,则下列说法判断正确的是________.(填序号)
①ad-bc越小,说明X与Y的关系越弱;②ad-bc越大,说明X与Y的关系越强;
③(ad-bc)2越大,说明X与Y的关系越强;④(ad-bc)2越接近于0,说明X与Y的关系越强.
【答案】③
【考点】两个变量的线性相关
【解析】【解答】列联表可以较为准确地判断两个变量之间的相关关系程度,
由 ,
当(ad-bc)2越大,k2越大,表明X与Y的关系越强.
(ad-bc)2越接近0,说明两个分类变量X和Y无关的可能性越大.
即所给说法判断正确的是③.
【分析】结合相关系数计算公式,即可得出答案。
21.如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为________?.
【答案】9
【考点】用样本的频率分布估计总体分布
【解析】【解答】解:根据频率分布直方图,得: 日销售量不少于150个的频率为(0.004+0.002)×50=0.3, 则估计这家面包店一个月内日销售量不少于150个的天数为:30×0.3=9. 故答案为:9. 【分析】根据频率分布直方图,求出对应的频率与频数即可.
22.在下列各图中,其中,每个图的来年改革变量具有相关关系的图是________ (把所有正确序号都填上)
【答案】(2)(3)
【考点】散点图
【解析】【解答】图(1)中,所有的散点都在一条曲线上,∴(1)是函数关系; 图(2)中,所有的散点都分布在一条直线的附近,∴(2)具有相关关系; 图(3)中,所有的散点都分布在一条曲线的附近,∴(3)具有相关关系; 图(4)中,所有的散点杂乱无章,没有分布在一条曲线的附近,∴(4)没有相关关系. 故答案为:(2)(3). 【分析】根据相关关系的意义,观察所给的散点图中的点是否在一条曲线附近排列,由此得出正确的答案。
23.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的 , 且样本容量为200,则第8组的频数为________?
【答案】40
【考点】频率分布表
【解析】【解答】在频率分布直方图中,共有8个小长方形, 且最后一个小长方形的面积等于其它7个小长方形的面积和的 , 则第8组的频率为= , 又样本容量为200,则第8组的频数为200×=40. 故答案为:40. 【分析】根据频率和为1,求出第8组的频率与对应的频数即可。
24.如图所示,图中有5组数据,去掉________?组数据后(填字母代号),剩下的4组数据的线性相关性最大.
【答案】E
【考点】散点图
【解析】【解答】∵A、B、C、D四点分布在一条直线附近且贴近某一直线, E点离得远. ∴去掉E点剩下的4组数据的线性相关性最大 故答案为:E. 【分析】根据线性相关的意义知,当所有的数据在一条直线附近排列时,这些事件具有很强的线性相关关系,在条件中所给的五组数据中只有E不在这条线附近,故去掉E点。
25.某产品的广告费用x与销售额y的统计数据如表:
广告费x(万元)
2
3
4
5
利润y(万元)
26
49
56
根据表格已得回归方程为=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________?
【答案】37
【考点】线性回归方程
【解析】【解答】解:设数据的值为a, 依题意知, ∵利用回归直线方程恒过样本中心点, ∴(131+a)=3.5×9.4+9.1, ∴a=37, 故答案为:37. 【分析】设数据的值为a,利用回归直线方程恒过样本中心点,求出a.
26.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________?.
【答案】120
【考点】用样本的数字特征估计总体的数字特征
【解析】【解答】解:根据题意,得 样本容量为=120. 故答案为:120. 【分析】根据样本容量与频率、频数的关系是频率=, 求出答案即可.
三、解答题
27.已知产品 的质量采用综合指标值 进行衡量, 为一等品; 为二等品; 为三等品.我市一家工厂准备购进新型设备以提高生产产品 的效益,在某供应商提供的设备中任选一个试用,生产了一批产品并统计相关数据,得到频率分布直方图:
(1)估计该新型设备生产的产品 为二等品的概率;
(2)根据这家工厂的记录,产品各等次的销售率(某等次产品销量与其对应产量的比值)及单件售价情况如下:
一等品
二等品
三等品
销售率
???????????
????????????
????????????
单件售价



根据以往的销售方案,未售出的产品统一按原售价的 全部处理完.已知该工厂认购该新型设备的前提条件是,该新型设备生产的产品同时满足下列两个条件:
①综合指标值的平均数不小于 (同一组中的数据用该组区间的中点值作代表);
②单件平均利润值不低于 元.
若该新型设备生产的产品 的成本为 元/件,月产量为 件,在销售方案不变的情况下,根据以上图表数据,分析该新型设备是否达到该工厂的认购条件.
【答案】(1)解:记 为事件“该新型设备生产的产品 为二等品”.
由直方图可知,该新型设备生产的产品 为二等品的频率为:

故事件 的概率估计值为
(2)解:①先分析该新型设备生产的产品 的综合指标值的平均数:
由直方图可知综合指标值的平均数
? .
所以该设备生产出的产品 的综合指标值的平均数的估计值 ,
故满足认购条件①.
②再分析该窑炉烧制的单件平均利润值:
由直方图可知该设备生产出的产品 为一、二、三等品的概率估计值分别为: , , .
故 件产品中,一、二、三等品的件数估计值分别为: 件, 件, 件.
一等品的销售润为 元;
二等品的销售总利润为 元;
三等品的销售总利润为 元.
故 件产品的单件平均利润值的估计值为:
元.
满足认购条件②.
综上所述,该新型设备达到认购条件.
【考点】频率分布直方图,众数、中位数、平均数
【解析】【分析】(1)根据频率分布直方图的基本性质:纵坐标乘以组距即是频率,代入数据计算,即可得出答案。 (2)由频率分布直方图,将每组的平均值乘以概率,相加所得结果即是平均数,根据条件列出利润的表达式,代入数据计算,即可得出答案。
28.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.
(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;
(2)根据茎叶图,指出50岁以下的亲属当中饮食指数高于70的人数,并计算这些人的饮食指数的平均数和方差(精确到整数)
【答案】解:(1)30为亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;
(2)根据茎叶图可知:50岁以下的亲属当中饮食指数高于70的有8人,
这8人的饮食指数的平均数为=×(74+78+77+76+82+83+85+90)=81;
这8人的饮食指数的方差为S2=×[(74﹣81)2+(78﹣81)2+(77﹣81)2+(76﹣81)2+(82﹣81)2+(83﹣81)2+(85﹣81)2+(90﹣81)2]≈25.
【考点】茎叶图,极差、方差与标准差
【解析】【分析】(1)观察茎叶图,描述这位学生的亲属30人的饮食习惯即可;
(2)根据茎叶图找出50岁以下的亲属当中饮食指数高于70的人数,分别求出平均数与方差即可.
29.经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润. (Ⅰ)将T表示为X的函数; (Ⅱ)根据直方图估计利润T不少于57000元的概率.
【答案】解:(I)由题意得,当X∈[100,130)时,T=500X﹣300(130﹣X)=800X﹣39000, 当X∈[130,150]时,T=500×130=65000, ∴T= . (II)由(I)知,利润T不少于57000元,当且仅当120≤X≤150. 由直方图知需求量X∈[120,150]的频率为0.7, 所以下一个销售季度的利润T不少于57000元的概率的估计值为0.7.
【考点】频率分布直方图
【解析】【分析】(1)根据题意,分别写出当X∈[100,130)时,当X∈[130,150]时T与X的关系式,(2)由(I)知,利润T不少于57000元,当且仅当120≤X≤150,结合频率直方图,可得出下一个销售季度的利润T不少于57000元的概率的估计值为0.7.
30.今年5月,某商业集团公司根据相关评分细则,对其所属25家商业连锁店进行了考核评估,将各连锁店的评估分数按[60,70],[70,80],[80,90],[90,100]分成4组,其频率分布直方图如图所示,集团公司还依据评估得分,将这些连锁店划分为A、B、C、D四个等级,等级评定标准如下表所示:
评估得分
[60,70]
[70,80]
[80,90]
[90,100]
评定等级
D
C
B
A
(Ⅰ)估计该商业集团各连锁店评估得分的众数和平均数;
(Ⅱ)从评估分数不少于80分的连锁店中任选2家介绍营销经验,求至少选一家A等级的概率.
【答案】解:(Ⅰ)∵最高小矩形下底边的中点值为75,
∴估计评估得分的众数为75;
∵直方图中从左至右第一、三、四个小矩形的面积分别为0.28、0.16、0.08,
∴第二个小矩形的面积为
1﹣0.28﹣0.16﹣0.08=0.48;
∴=65×0.28+75×0.48+85×0.16+95×0.08=18.2+36+13.6+7.6=75.4,
即估计该商业集团各连锁店评估得分的平均数为75.4;
(Ⅱ)∵A等级的频数为25×0.08=2,
B等级的频数为25×0.16=4,
∴从6家连锁店中任选2家,共有=15种选法,
其中选1家A等级和1家B等级的选法有2×4=8种,
选2家A等级的选法有1种;
∴P=,
即至少选一家A等级的概率是.
【考点】频率分布直方图,众数、中位数、平均数
【解析】【分析】(Ⅰ)根据最高小矩形下底边的中点值为得出众数是多少,根据直方图中各小矩形的面积及底边中点值求出数据的平均数;
(Ⅱ)求出A、B等级的频数是多少,利用古典概型求出至少选一家A等级的概率.
备战真题·勇闯天涯
一、单选题
1.(2018?卷Ⅲ)某群体中的每位成员使用移动支付的概率都为 ,各成员的支付方式相互独立,设 为该群体的10位成员中使用移动支付的人数, , ,则 (??? )
A.?0.7???????????????????????????????????????B.?0.6???????????????????????????????????????C.?0.4???????????????????????????????????????D.?0.3
【答案】B
【考点】一元二次不等式,极差、方差与标准差,二项式定理,二项式定理的应用
【解析】【解答】由题意可知x服从二项分布 则 又 所以 =0.6 故答案为:B 【分析】由题可知x服从二项分布,由二项分布方差求出P,再由 排除其中-P.
2.(2017?山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为 = x+ ,已知 xi=225, yi=1600, =4,该班某学生的脚长为24,据此估计其身高为(  )
A.?160??????????????????????????????????????B.?163??????????????????????????????????????C.?166??????????????????????????????????????D.?170
【答案】C
【考点】线性回归方程
【解析】【解答】解:由线性回归方程为 =4x+ , 则 = xi=22.5, = yi=160, 则数据的样本中心点(22.5,160), 由回归直线经过样本中心点,则 = ﹣4x=160﹣4×22.5=70, ∴回归直线方程为 =4x+70, 当x=24时, =4×24+70=166, 则估计其身高为166, 故选C. 【分析】由数据求得样本中心点,由回归直线方程必过样本中心点,代入即可求得 ,将x=24代入回归直线方程即可估计其身高.
3.(2017·山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为(  )
A.?3,5????????????????????????????????????B.?5,5????????????????????????????????????C.?3,7????????????????????????????????????D.?5,7
【答案】A
【考点】茎叶图,众数、中位数、平均数
【解析】【解答】解:由已知中甲组数据的中位数为65, 故乙组数据的中位数也为65, 即y=5, 则乙组数据的平均数为:66, 故x=3, 故选:A. 【分析】由已知有中这两组数据的中位数相等,且平均值也相等,可得x,y的值.
4.(2017?新课标Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田,这n块地的亩产量(单位:kg)分别是x1 , x2 , …,xn , 下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.?x1 , x2 , …,xn的平均数????????????????????????????????B.?x1 , x2 , …,xn的标准差 C.?x1 , x2 , …,xn的最大值????????????????????????????????D.?x1 , x2 , …,xn的中位数
【答案】B
【考点】极差、方差与标准差
【解析】【解答】解:在A中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标, 故A不可以用来评估这种农作物亩产量稳定程度; 在B 中,标准差能反映一个数据集的离散程度,故B可以用来评估这种农作物亩产量稳定程度; 在C中,最大值是一组数据最大的量,故C可以用来评估这种农作物亩产量稳定程度; 在D中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”, 故D不可以用来评估这种农作物亩产量稳定程度. 故选:B. 【分析】利用平均数、标准差、最大值、中位数的定义和意义直接求解.
5.(2016?山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.?56???????????????????????????????????????B.?60???????????????????????????????????????C.?120???????????????????????????????????????D.?140
【答案】D
【考点】频率分布直方图
【解析】【解答】解:自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,故自习时间不少于22.5小时的频率为:0.7×200=140, 故选:D 【分析】根据已知中的频率分布直方图,先计算出自习时间不少于22.5小时的频率,进而可得自习时间不少于22.5小时的频数.;本题考查的知识点是频率分布直方图,难度不大,属于基础题目.
二、填空题
6.?? (2018?江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
【答案】90
【考点】众数、中位数、平均数
【解析】【解答】解: 【分析】将所有数字加起来除以总个数。
7.(2016?江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________?
【答案】0.1
【考点】极差、方差与标准差
【解析】【解答】 , 【分析】先求出数据4.7,4.8,5.1,5.4,5.5的平均数,由此能求出该组数据的方差.
8.(2016?上海)某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是________(米).
【答案】1.76
【考点】众数、中位数、平均数
【解析】【解答】解:∵6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77, 从小到大排列为:1.69,1.72,1.75,1.77,1.78,1.80, 位于中间的两个数值为1.75,1.77, ∴这组数据的中位数是:? =1.76(米). 故答案为:1.76. 【分析】先把这组数据按从小到大排列,求出位于中间的两个数值的平均数,得到这组数据的中位数.本题考查中位数的求法,是基础题,解题时要认真审题,注意中位数的定义的合理运用.
三、解答题
9.(2018?卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,,0.3
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图
(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
【答案】(1)解: (2)解:(0.2+1.0+2.6+1) 0.1=0.48∴所用水量小于0.35的概率为0.48 (3)解:该家庭未使用节水龙头50天日用水量的平均数为 . 该家庭使用了节水龙头后50天日用水量的平均数为 . 估计使用节水龙头后,一年可节省水 .
【考点】频率分布表,频率分布直方图
【解析】【分析】(1)根据频率分布表中的数据完成频率分布直方图;(2)由直方图得到日用水量小于0.35 所对应的组,由频率和为概率;(3)由直方图求日用水量的出平均值,与节水前比较得到一年中节约水量.
10.(2018?卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图。 为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量 的值依次为1,2,…,17)建立模型①:=-30.4+13.5t .根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由。
【答案】(1)由题意可知模型①中,2018年对应的t=19,
预测值 =-30.4+13.5×19=226.1亿元
此时基础设施的投资预测值为226.1亿元;
模型②中,2018年对应的t=9,
预测值 =99+17.5×9=256.5亿元
此时基础设施的投资预测值为:256.5亿元; (2)用模型②预测得到的2018年的基础设施的投资更可靠。因为从折线图上看,基础设施的投资在2009年到2010年发生了很大程度上的突变,所以用模型①预测2018年的会有一定程度的失真。
【考点】线性回归方程
【解析】【分析】(1)根据函数表达式可求预估值;(2)看图易知可靠性.
11.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
【答案】(1)解:第二种生产方式效率更高,因为第二组多数数据集中在70min~80min之间,第一组多数数据集中在80min~90min,所以第一组完成任务的平均时间大于第二组, , E1> 则第二种生产方式的效率更高。 (2)解:由题意
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)解: 有99%的把握认为两种生产方式的效率有差异
【考点】众数、中位数、平均数,独立性检验
【解析】【分析】第一问是算平均数,第二三问是列出连表,算独立性检验
12.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
【答案】(1)解:第二种生产方式效率更高,因为第二组多数数据集中在70min~80min之间,第一组多数数据集中在80min~90min,所以第一组完成任务的平均时间大于第二组, , E1> 则第二种生产方式的效率更高。 (2)解:由题意
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)解: 有99%的把握认为两种生产方式的效率有差异
【考点】众数、中位数、平均数,独立性检验
【解析】【分析】第一问是算平均数,第二三问是列出连表,算独立性检验.
13.(2017?新课标Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.(12分)
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
【答案】(1)解:由前三年六月份各天的最高气温数据, 得到最高气温位于区间[20,25)和最高气温低于20的天数为2+16+36=54, 根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关. 如果最高气温不低于25,需求量为500瓶, 如果最高气温位于区间[20,25),需求量为300瓶, 如果最高气温低于20,需求量为200瓶, ∴六月份这种酸奶一天的需求量不超过300瓶的概率p= = . (2)解:当温度大于等于25°C时,需求量为500, Y=450×2=900元, 当温度在[20,25)°C时,需求量为300, Y=300×2﹣(450﹣300)×2=300元, 当温度低于20°C时,需求量为200, Y=400﹣(450﹣200)×2=﹣100元, 当温度大于等于20时,Y>0, 由前三年六月份各天的最高气温数据得,温度大于等于20°C的天数有: 90﹣(2+16)=72, ∴估计Y大于零的概率P= .
【考点】频率分布表,用样本的频率分布估计总体分布,概率的意义,古典概型及其概率计算公式
【解析】【分析】(1.)由前三年六月份各天的最高气温数据,求出最高气温位于区间[20,25)和最高气温低于20的天数,由此能求出六月份这种酸奶一天的需求量不超过300瓶的概率. (2.)当温度大于等于25°C时,需求量为500,求出Y=900元;当温度在[20,25)°C时,需求量为300,求出Y=300元;当温度低于20°C时,需求量为200,求出Y=﹣100元,从而当温度大于等于20时,Y>0,由此能估计估计Y大于零的概率.
14.(2017?北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图: (Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【答案】解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1﹣(0.04+0.02)×10=0.4 故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4; (Ⅱ)已知样本中分数小于40的学生有5人, 故样本中分数小于40的频率为:0.05, 则分数在区间[40,50)内的频率为:1﹣(0.04+0.02+0.02+0.01)×10﹣0.05=0.05, 估计总体中分数在区间[40,50)内的人数为400×0.05=20人, (Ⅲ)样本中分数不小于70的频率为:0.6, 由于样本中分数不小于70的男女生人数相等. 故分数不小于70的男生的频率为:0.3, 由样本中有一半男生的分数不小于70, 故男生的频率为:0.6, 即女生的频率为:0.4, 即总体中男生和女生人数的比例约为:3:2.
【考点】频率分布直方图,用样本的频率分布估计总体分布,古典概型及其概率计算公式
【解析】【分析】(Ⅰ)根据频率=组距×高,可得分数小于70的概率为:1﹣(0.04+0.02)×10; (Ⅱ)先计算样本中分数小于40的频率,进而计算分数在区间[40,50)内的频率,可估计总体中分数在区间[40,50)内的人数; (Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.进而得到答案.
15.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率; (Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
【答案】解:(Ⅰ)根据题意,由旧养殖法的频率分布直方图可得: P(A)=(0.012+0.014+0.024+0.034+0.040)×5=0.62; (Ⅱ)根据题意,补全列联表可得:
箱产量<50kg
箱产量≥50kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
则有K2= ≈7.853>6.635, 故有99%的把握认为箱产量与养殖方法有关; (Ⅲ)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数 1=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.032+62.5×0.012+67.5×0.012)×5=5×9.42=47.1; 新养殖法100个网箱产量的平均数 2=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.068+57.5×0.046+62.5×0.010+67.5×0.008)×5=5×10.47=52.35; 比较可得: 1< 2 , 故新养殖法更加优于旧养殖法.
【考点】频率分布直方图,独立性检验,独立性检验的应用
【解析】【分析】(Ⅰ)根据题意,由旧养殖法的频率分布直方图计算可得答案; (Ⅱ)由频率分布直方图可以将列联表补全,进而计算可得K2= ≈7.853>6.635,与附表比较即可得答案; (Ⅲ)由频率分布直方图计算新旧养殖法产量的平均数,比较即可得答案.
16.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).(12分)
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = =9.97,s= = ≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16. 用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( ﹣3 +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01). 附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592, ≈0.09.
【答案】(1)解:由题可知尺寸落在(μ﹣3σ,μ+3σ)之内的概率为0.9974, 则落在(μ﹣3σ,μ+3σ)之外的概率为1﹣0.9974=0.0026, 因为P(X=0)= ×(1﹣0.9974)0×0.997416≈0.9592, 所以P(X≥1)=1﹣P(X=0)=0.0408, 又因为X~B(16,0.0026), 所以E(X)=16×0.0026=0.0416; (2)(ⅰ)由(1)知尺寸落在(μ﹣3σ,μ+3σ)之外的概率为0.0026, 由正态分布知尺寸落在(μ﹣3σ,μ+3σ)之外为小概率事件, 因此上述监控生产过程方法合理; (ⅱ)因为用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 , 且 = =9.97,s= = ≈0.212, 所以 ﹣3 =9.97﹣3×0.212=9.334, +3 =9.97+3×0.212=10.606, 所以9.22?( ﹣3 +3 )=(9.334,10.606), 因此需要对当天的生产过程进行检查,剔除( ﹣3 +3 )之外的数据9.22, 则剩下的数据估计μ= =10.02, 将剔除掉9.22后剩下的15个数据,利用方差的计算公式代入计算可知σ2≈0.008, 所以σ≈0.09.
【考点】用样本的数字特征估计总体的数字特征,离散型随机变量的期望与方差,二项分布与n次独立重复试验的模型,正态分布曲线的特点及曲线所表示的意义
【解析】【分析】(1.)通过P(X=0)可求出P(X≥1)=1﹣P(X=0)=0.0408,利用二项分布的期望公式计算可得结论; (2.)(ⅰ)由(1)及知落在(μ﹣3σ,μ+3σ)之外为小概率事件可知该监控生产过程方法合理; (ⅱ)通过样本平均数 、样本标准差s估计 、 可知( ﹣3 +3 )=(9.334,10.606),进而需剔除( ﹣3 +3 )之外的数据9.22,利用公式计算即得结论.
17.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:(12分)
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = xi=9.97,s= = =0.212, ≈18.439, (xi﹣ )(i﹣8.5)=﹣2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi , i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在( ﹣3s, +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ⅱ)在( ﹣3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi , yi)(i=1,2,…,n)的相关系数r= , ≈0.09.
【答案】(1)解:r= = =﹣0.18. ∵|r|<0.25,∴可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i) =9.97,s=0.212,∴合格零件尺寸范围是(9.334,10,606), 显然第13号零件尺寸不在此范围之内, ∴需要对当天的生产过程进行检查. (ii)剔除离群值后,剩下的数据平均值为 =10.22, =16×0.2122+16×9.972=1591.134, ∴剔除离群值后样本方差为 (1591.134﹣9.222﹣15×10.022)=0.008, ∴剔除离群值后样本标准差为 ≈0.09.
【考点】众数、中位数、平均数,极差、方差与标准差,相关系数
【解析】【分析】(1.)代入数据计算,比较|r|与0.25的大小作出结论; (2.)(i)计算合格零件尺寸范围,得出结论; (ii)代入公式计算即可.
18.(2016?全国)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据: =9.32, =40.17, =0.55, ≈2.646. 参考公式: , 回归方程 中斜率和截距的最小二乘估计公式分别为: , .
【答案】(1)解:由折线图看出,y与t之间存在较强的正相关关系,理由如下: ∵ = ≈ ≈ ≈0.996, ∵0.996>0.75, 故y与t之间存在较强的正相关关系; (2)解: = ≈ ≈0.10, ≈1.331﹣0.10×4≈0.93, ∴y关于t的回归方程 =0.103+0.93, 2016年对应的t值为9, 故 =0.10×9+0.93=1.83, 预测2016年我国生活垃圾无害化处理量为1.83亿吨.
【考点】线性回归方程
【解析】【分析】(1)由折线图看出,y与t之间存在较强的正相关关系,将已知数据代入相关系数方程,可得答案;(2)根据已知中的数据,求出回归系数,可得回归方程,2016年对应的t值为9,代入可预测2016年我国生活垃圾无害化处理量.本题考查的知识点是线性回归方程,回归分析,计算量比较大,计算时要细心.
19.(2016?北京)A、B、C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时);
A班
6??? 6.5??? 7???? 7.5????? 8
B班
6??? 7????? 8???? 9????? 10??? 11??? 12
C班
3??? 4.5???? 6??? 7.5????? 9??? 10.5?? 12???? 13.5
(1)试估计C班的学生人数;
(2)从A班和C班抽出的学生中,各随机选取一人,A班选出的人记为甲,C班选出的人记为乙,假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从A、B、C三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记?? ,表格中数据的平均数记为 ?,试判断 ? 和 的大小,(结论不要求证明)
【答案】(1)解: ,C班学生40人 (2)解:在A班中取到每个人的概率相同均为 设 班中取到第 个人事件为 C班中取到第 个人事件为 班中取到 的概率为 所求事件为 则 (3)解: 三组平均数分别为 总均值 但 中多加的三个数据 平均值为 ,比 小, 故拉低了平均值
【考点】用样本的频率分布估计总体分布,古典概型及其概率计算公式
【解析】【分析】(1)由已知先计算出抽样比,进而可估计C班的学生人数;(2)根据古典概型概率计算公式,可求出该周甲的锻炼时间比乙的锻炼时间长的概率;(3)根据平均数的定义,可判断出μ0>μ1
20.(2016?全国)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图: 记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【答案】(1)解:当n=19时, y= ?= (2)解:由柱状图知,更换的易损零件数为16个频率为0.06, 更换的易损零件数为17个频率为0.16, 更换的易损零件数为18个频率为0.24, 更换的易损零件数为19个频率为0.24 又∵更换易损零件不大于n的频率为不小于0.5. 则n≥19 ∴n的最小值为19件 (3)解:假设这100台机器在购机的同时每台都购买19个易损零件, 所须费用平均数为: (70×19×200+4300×20+4800×10)=4000(元) ?假设这100台机器在购机的同时每台都购买20个易损零件, 所须费用平均数为 (90×4000+10×4500)=4050(元) ∵4000<4050? ∴购买1台机器的同时应购买19台易损零件
【考点】函数的最值及其几何意义,频率分布直方图,函数模型的选择与应用
【解析】【分析】(1)若n=19,结合题意,可得y与x的分段函数解析式;(2)由柱状图分别求出各组的频率,结合“需更换的易损零件数不大于n”的频率不小于0.5,可得n的最小值;(3)分别求出每台都购买19个易损零件,或每台都购买20个易损零件时的平均费用,比较后,可得答案.;本题考查的知识点是分段函数的应用,频率分布条形图,方案选择,难度中档.
21.(2016?全国)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
【答案】(1)解:记A为事件:“一续保人本年度的保费不高于基本保费”.事件A的人数为:60+50=110,该险种的200名续保, P(A)的估计值为: = (2)解:记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.事件B的人数为:30+30=60,P(B)的估计值为: = (3)解:续保人本年度的平均保费估计值为 =1.1925a
【考点】随机抽样和样本估计总体的实际应用
【解析】【分析】(1)求出A为事件:“一续保人本年度的保费不高于基本保费”的人数.总事件人数,即可求P(A)的估计值; (2)求出B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”的人数.然后求P(B)的估计值; (3)利用人数与保费乘积的和除以总续保人数,可得本年度的平均保费估计值. 本题考查样本估计总体的实际应用,考查计算能力.
22.(2016?四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的a值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;
(3)估计居民月均用水量的中位数.
【答案】(1)解:∵1=(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5,整理可得:2=1.4+2a, ∴解得:a=0.3. (2)解:估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下: 由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12, 又样本容量=30万, 则样本中月均用水量不低于3吨的户数为30×0.12=3.6万 (3)解:根据频率分布直方图,得; 0.08×0.5+0.16×0.5+0.30×0.5+0.42×0.5=0.48<0.5, 0.48+0.5×0.5=0.73>0.5, 设中位数为a,则中位数a=2+ =2.04
【考点】频率分布直方图,众数、中位数、平均数
【解析】【分析】(1)先根据频率分布直方图中的频率等于纵坐标乘以组距求出9个矩形的面积即频率,再根据直方图的总频率为1求出a的值;(II)根据已知中的频率分布直方图先求出月均用水量不低于3吨的频率,结合样本容量为30万,进而得解.(Ⅲ)根据频率分布直方图,求出使直方图中左右两边频率相等对应的横坐标的值;本题用样本估计总体,是研究统计问题的一个基本思想方法.频率分布直方图中小长方形的面积=组距× ,各个矩形面积之和等于1,能根据直方图求众数和中位数,属于常规题型.
同课章节目录