(共25张PPT)
5.1 统计
5.1.4 用样本估计总体
第2课时 用样本的分布来估计总体的分布
◆ 课前预习
◆ 课中探究
◆ 课堂评价
◆ 备课素材
【学习目标】
能用样本的分布来估计总体的分布.
知识点 用样本的分布估计总体的分布
1.如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不
多.特别地,每一组的频率与总体对应的频率相差不会太大.
2.如果容许有一定误差,则可以用____________去估计总体的分布.而且,在总
体的分布不可能获得时,只能用样本的分布去估计总体的分布.
同数字特征的估计一样,分布的估计一般也有误差.同样,大数定律可以保证,
当____________________时,误差很小的可能性将越来越大.
样本的分布
样本的容量越来越大
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)用样本分布估计总体分布难免有误差,如果总体在每一个分组的频率记为
,, ,,样本在每一组对应的频率记为,, , ,则公式
可以去除误差.( )
×
[解析] 误差是不可能去除的,大数定律可以保证,当样本的容量越来越大时,
很小的可能性将越来越大.
(2)在用样本分布估计总体分布的过程中,总体容量越大,估计越精确.( )
×
[解析] 在用样本分布估计总体分布的过程中,样本容量越大,估计越精确.
探究点 用样本的分布估计总体的分布
例1 某校高三共有500名学生,为了了解学生
的体能情况,采用分层抽样的方法从中随机抽
取了100名学生进行体能测试,整理他们的成绩
得到如图所示的频率分布直方图.
(1)估计高三500名学生体能测试成绩低于50的人数.
解:依题意,样本中成绩不低于50的频率为
,
所以成绩低于50的频率为 ,
所以估计高三500名学生体能测试成绩低于50的人数为 .
(2)从样本中的男同学中随机抽取1人,该同学成绩不低于70的概率为 ,从样
本中成绩不低于70的学生中随机抽取1人,该学生为男生的概率也为 .试估计该
校高三学生中男生和女生人数的比.
解:样本中成绩不低于70的频率为 ,
所以样本中成绩不低于70的人数为 .
因为从样本中成绩不低于70的学生中随机抽取1人,该学生为男生的概率为 ,
所以样本中成绩不低于70的男生有30人.
因为从样本中的男同学中随机抽取1人,该同学成绩不低于70的概率为 ,
所以样本中有男生60人,所以样本中有女生40人,
所以估计该校高三学生中男生和女生人数的比为 .
例2 某学院采用线下和线上相结合的方式开展了300名学员参加的一项专题培
训.为了了解参训学员对于线上培训、线下培训的满意程度,随机选取了50名学
员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,
根据学员的评分(满分100分)绘制了如图所示的茎叶图.
(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高,并说明理由.
解:对线下培训的满意度更高,理由如下:
①由茎叶图可知,在线上培训中,学员满意度评分至多79分的有18人,即有
的学员满意度评分至多79分,
在线下培训中,学员满意度评分至少80分的有18人,即有 的学员满意度评
分至少80分.因此学员对线下培训的满意度更高.
②由茎叶图可知,线上培训满意度评分的中位数为76,线下培训满意度评分的
中位数为85.因此学员对线下培训的满意度更高.
③由茎叶图可知,线上培训的满意度评分的平均数低于80,线下培训满意度评
分的平均数高于80.因此学员对线下培训的满意度更高.
④由茎叶图可知,线上培训的满意度评分在茎7上的最多,关于茎7大致呈对称
分布,线下培训的满意度评分在茎8上的最多,关于茎8大致呈对称分布,又两
种培训方式评分的分布区间相同,故可以认为线下培训评分比线上培训评分更
高.因此学员对线下培训的满意度更高.
(注:以上给出了4种理由,答出其中任意一种或其他合理理由均可)
(2)求这50名学员满意度评分的中位数,并将评分不超过、超过 分别视
为“基本满意”“非常满意”两个等级.利用样本估计总体的思想,估算本次培训共
有多少名学员对线上培训非常满意.
解:由茎叶图知 .
参加线上培训满意度调查的25名学员中共有7名对线上培训非常满意,频率为 ,
又本次培训共有300名学员,所以对线上培训非常满意的学员约为
(名).
变式 某校的3000名高三学生参加了一次联考,为了分析此
次联考数学学科的情况,现随机从中抽取15名学生的数学成
绩(满分:150分),并绘制成如图所示的茎叶图,将成绩低
于90分的称为不及格,不低于120分的称为优秀,其余的称为
良好.根据样本的分布估计总体的分布.
(1)估计此次联考该校高三学生的数学学科的平均成绩.
解:因为抽取的15名学生的数学学科的平均成绩为
(分),所以估计此次联考该校高三学生的数学学科的平均成绩为112分.
(2)估计此次联考该校高三学生数学成绩不及格和优秀的人数.
解:依题意知,随机抽取的15人中,不及格的人数为1,优秀的人数为5,
所以不及格率为,优秀率为 ,
所以估计此次联考中该校高三学生数学成绩不及格的人数为
,优秀的人数为 .
(3)该地教育部门提出了教育“扶贫”活动,要求对此次数学成绩不及格的学生
分两期进行学业辅导:一期由优秀学生对不及格学生进行一对一帮扶辅导,二
期由老师对仍不及格学生进行集中辅导.根据实践总结,优秀学生进行一对一辅
导的转化率为;老师集中辅导的转化率为 .试估计经过两期辅导后,该校
高三学生中数学成绩仍不及格的人数.
注:转化率 .
解:由(2)知,不及格的人数为200.
设一期辅导后不及格的人数为,则,解得 .
设二期辅导后不及格的人数为,则,解得 .
所以估计经过两期辅导后,该校高三学生中数学成绩仍不及格的人数为112.
[素养小结]
用样本的分布估计总体的分布是从样本分布状况的角度分析总体的规律,涉及的
内容有图表和数字特征.其中图表包括频率分布表、频率分布直方图、折线图、
茎叶图等.数字特征包括平均数、中位数、众数、方差、标准差等.
1.某高校进行自主招生,先从报名者中筛选出500人参加笔试,再按笔试成绩择
优选出100人参加面试,现随机抽取25名笔试者的成绩,如下表所示:
分数段
人数 2 3 4 9 2 5
据此估计参加面试的分数线是( )
C
A.75 B.80 C.85 D.90
[解析] 由题意,25名笔试者中只有 的人能参加面试,即有5人能参加面试,
分数在区间 内的恰有5人,故估计参加面试的分数线是85.
2.(多选题)某农业科学研究所分别抽取了试验
田中的海水稻以及对照田中的普通水稻各10株,
测量了它们的根系深度(单位: ),得到了
ABC
A.若根系深度超过更有利于水稻生长,则海水稻有 达到这一标准
B.普通水稻根系深度的众数是32
C.海水稻根系深度的平均数大于普通水稻根系深度的平均数
D.普通水稻根系深度的极差小于海水稻根系深度的极差
如图所示的茎叶图,则下列说法正确的是 ( )
[解析] 对于A,海水稻根系深度超过的有7株,故海水稻有 达到这一
标准,故A正确.
对于B,普通水稻根系深度的众数是32,故B正确.
对于C,海水稻根系深度的平均数为 ,
普通水稻根系深度的平均数为
,故C正确.
对于D,普通水稻根系深度的极差为,海水稻根系深度的极差为
,故D错误.故选 .
3.对一批底部周长(单位:)在 内的
树木进行研究,从中随机抽出200株树木并测出其底
部周长,得到频率分布直方图如图所示,由此估计,
这批树木的底部周长的众数是_____ ,中位数是
____ .
105
[解析] 由题图知,估计这批树木的底部周长的众数是 ,中位
数是 .
4.从某企业的某种产品中抽取1000件,测量该种产
品的一项质量指标值,由测量结果得到如图所示的
频率分布直方图.若这项质量指标值在
内,则这项指标合格,估计该企业这种产品在这项
指标上的合格率为_____.
[解析] 由频率分布直方图得质量指标值在
内的频率为 ,故估计该企业
这种产品在这项指标上的合格率为 .
用样本分布估计总体分布
例 移动支付极大地方便了我们的生活,也为整个社会节约了大量的资源与时
间成本.移动支付推出前,高速公路只有两种支付方式:现金支付或 支付,
其中使用现金支付的车辆占,使用支付的车辆占 .移动支付推出后,
越来越多的车主选择非现金支付,下表是移动支付推出后,随机抽取的某时间
段内所有经过某高速公路收费站驶出高速的车辆的通行费支付方式分布及其他
相关数据:
支付方式 是否需要在入 口处取卡 是否需要停 车支付 数量统计 (辆) 平均每辆车耗
时(秒)
现金支付 是 是 135 30
扫码支付 是 是 240 15
否 否 750 4
车辆识别支付 否 否 375 4
并以此作为样本来估计所有在此高速路上行驶的车辆支付方式的分布.已知需要
取卡的车辆进入高速平均每车耗时10秒,不需要取卡的车辆进入高速平均每车
耗时4秒.
(1)若此高速公路的日均车流量为9080辆,估计移动支付推出后比移动支付推
出前日均可以少发卡多少张?
解:移动支付推出前,需在入口处停车取卡的车辆大约有 (辆),
移动支付推出后,需在入口处停车取卡的车辆大约有
(辆),
可估计移动支付推出后比移动支付推出前日均可少发卡
(张).
(2)在此高速公路上,移动支付推出后平均每辆车进出高速收费站总耗时能否
比移动支付推出前大约减少一半?并说明理由.
解:移动支付推出前,平均每辆车进出高速收费站大约耗时为
(秒),
移动支付推出后,平均每辆车进出高速收费站大约耗时为
(秒),
所以移动支付推出后平均每辆车进出高速收费站总耗时比移动支付推出前大约
减少一半.第2课时 用样本的分布来估计总体的分布
【课前预习】
知识点
2.样本的分布 样本的容量越来越大
诊断分析
(1)× (2)× [解析] (1)误差是不可能去除的,大数定律可以保证,当样本的容量越来越大时,很小的可能性将越来越大.
(2)在用样本分布估计总体分布的过程中,样本容量越大,估计越精确.
【课中探究】
例1 解:(1)依题意,样本中成绩不低于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
所以成绩低于50的频率为0.1,
所以估计高三500名学生体能测试成绩低于50的人数为500×0.1=50.
(2)样本中成绩不低于70的频率为(0.04+0.02)×10=0.6,
所以样本中成绩不低于70的人数为0.6×100=60.
因为从样本中成绩不低于70的学生中随机抽取1人,该学生为男生的概率为,
所以样本中成绩不低于70的男生有30人.
因为从样本中的男同学中随机抽取1人,该同学成绩不低于70的概率为,
所以样本中有男生60人,所以样本中有女生40人,
所以估计该校高三学生中男生和女生人数的比为3∶2.
例2 解:(1)对线下培训的满意度更高,理由如下:
①由茎叶图可知,在线上培训中,学员满意度评分至多79分的有18人,即有72%的学员满意度评分至多79分,
在线下培训中,学员满意度评分至少80分的有18人,即有72%的学员满意度评分至少80分.因此学员对线下培训的满意度更高.
②由茎叶图可知,线上培训满意度评分的中位数为76,线下培训满意度评分的中位数为85.因此学员对线下培训的满意度更高.
③由茎叶图可知,线上培训的满意度评分的平均数低于80,线下培训满意度评分的平均数高于80.因此学员对线下培训的满意度更高.
④由茎叶图可知,线上培训的满意度评分在茎7上的最多,关于茎7大致呈对称分布,线下培训的满意度评分在茎8上的最多,关于茎8大致呈对称分布,又两种培训方式评分的分布区间相同,故可以认为线下培训评分比线上培训评分更高.因此学员对线下培训的满意度更高.
(注:以上给出了4种理由,答出其中任意一种或其他合理理由均可)
(2)由茎叶图知m==79.5.
参加线上培训满意度调查的25名学员中共有7名对线上培训非常满意,频率为,
又本次培训共有300名学员,所以对线上培训非常满意的学员约为300×=84(名).
变式 解:(1)因为抽取的15名学生的数学学科的平均成绩为×[1+0+3+5+6+8+0+3+6+8+2+4+6+3+5+(8+2×9+3×10+4×11+3×12+2×13)×10]=112(分),所以估计此次联考该校高三学生的数学学科的平均成绩为112分.
(2)依题意知,随机抽取的15人中,不及格的人数为1,优秀的人数为5,
所以不及格率为,优秀率为,
所以估计此次联考中该校高三学生数学成绩不及格的人数为
3000×=200,优秀的人数为3000×=1000.
(3)由(2)知,不及格的人数为200.
设一期辅导后不及格的人数为x,则=,解得x=160.
设二期辅导后不及格的人数为y,则=,解得y=112.
所以估计经过两期辅导后,该校高三学生中数学成绩仍不及格的人数为112.
【课堂评价】
1.C [解析] 由题意,25名笔试者中只有20%的人能参加面试,即有5人能参加面试,分数在区间[85,90]内的恰有5人,故估计参加面试的分数线是85.
2.ABC [解析] 对于A,海水稻根系深度超过40 cm的有7株,故海水稻有70%达到这一标准,故A正确.对于B,普通水稻根系深度的众数是32,故B正确.对于C,海水稻根系深度的平均数为=45,普通水稻根系深度的平均数为
=35,故C正确.对于D,普通水稻根系深度的极差为45-25=20,海水稻根系深度的极差为51-38=13,故D错误.故选ABC.
3.105 [解析] 由题图知,估计这批树木的底部周长的众数是=105(cm),中位数是×10+100=+100=(cm).
4.79% [解析] 由频率分布直方图得质量指标值在(185,215]内的频率为0.022×10+0.033×10+0.024×10=0.79,故估计该企业这种产品在这项指标上的合格率为79%.第2课时 用样本的分布来估计总体的分布
【学习目标】
能用样本的分布来估计总体的分布.
◆ 知识点 用样本的分布估计总体的分布
1.如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
2.如果容许有一定误差,则可以用 去估计总体的分布.而且,在总体的分布不可能获得时,只能用样本的分布去估计总体的分布.
同数字特征的估计一样,分布的估计一般也有误差.同样,大数定律可以保证,当 时,误差很小的可能性将越来越大.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)用样本分布估计总体分布难免有误差,( )
(2)在用样本分布估计总体分布的过程中,总体容量越大,估计越精确. ( )
◆ 探究点 用样本的分布估计总体的分布
例1 某校高三共有500名学生,为了了解学生的体能情况,采用分层抽样的方法从中随机抽取了100名学生进行体能测试,整理他们的成绩得到如图所示的频率分布直方图.
(1)估计高三500名学生体能测试成绩低于50的人数.
(2)从样本中的男同学中随机抽取1人,该同学成绩不低于70的概率为,从样本中成绩不低于70的学生中随机抽取1人,该学生为男生的概率也为.试估计该校高三学生中男生和女生人数的比.
例2 某学院采用线下和线上相结合的方式开展了300名学员参加的一项专题培训.为了了解参训学员对于线上培训、线下培训的满意程度,随机选取了50名学员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,根据学员的评分(满分100分)绘制了如图所示的茎叶图.
(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高,并说明理由.
(2)求这50名学员满意度评分的中位数m,并将评分不超过m、超过m分别视为“基本满意”“非常满意”两个等级.利用样本估计总体的思想,估算本次培训共有多少名学员对线上培训非常满意.
变式 某校的3000名高三学生参加了一次联考,为了分析此次联考数学学科的情况,现随机从中抽取15名学生的数学成绩(满分:150分),并绘制成如图所示的茎叶图,将成绩低于90分的称为不及格,不低于120分的称为优秀,其余的称为良好.根据样本的分布估计总体的分布.
(1)估计此次联考该校高三学生的数学学科的平均成绩.
(2)估计此次联考该校高三学生数学成绩不及格和优秀的人数.
(3)该地教育部门提出了教育“扶贫”活动,要求对此次数学成绩不及格的学生分两期进行学业辅导:一期由优秀学生对不及格学生进行一对一帮扶辅导,二期由老师对仍不及格学生进行集中辅导.根据实践总结,优秀学生进行一对一辅导的转化率为20%;老师集中辅导的转化率为30%.试估计经过两期辅导后,该校高三学生中数学成绩仍不及格的人数.
注:转化率=×100%.
[素养小结]
用样本的分布估计总体的分布是从样本分布状况的角度分析总体的规律,涉及的内容有图表和数字特征.其中图表包括频率分布表、频率分布直方图、折线图、茎叶图等.数字特征包括平均数、中位数、众数、方差、标准差等.
1.某高校进行自主招生,先从报名者中筛选出500人参加笔试,再按笔试成绩择优选出100人参加面试,现随机抽取25名笔试者的成绩,如下表所示:
分数段 [60, 65) [65, 70) [70, 75) [75, 80) [80, 85) [85, 90]
人数 2 3 4 9 2 5
据此估计参加面试的分数线是 ( )
A.75 B.80
C.85 D.90
2.(多选题)某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,则下列说法正确的是 ( )
A.若根系深度超过40 cm更有利于水稻生长,则海水稻有70%达到这一标准
B.普通水稻根系深度的众数是32
C.海水稻根系深度的平均数大于普通水稻根系深度的平均数
D.普通水稻根系深度的极差小于海水稻根系深度的极差
3.对一批底部周长(单位:cm)在[80,130]内的树木进行研究,从中随机抽出200株树木并测出其底部周长,得到频率分布直方图如图所示,由此估计,这批树木的底部周长的众数是 cm,中位数是 cm.
4.从某企业的某种产品中抽取1000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图.若这项质量指标值在(185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为 . 第2课时 用样本的分布来估计总体的分布
1.C [解析] 样本容量越大,样本的频率分布越接近相应的总体分布.故选C.
2.B [解析] 设该校男生的人数为2n,女生的人数为3n,则估计该校全体学生每天的平均运动时间为==88(分钟).故选B.
3.C [解析] 由题图可知,血液中酒精浓度大于或等于80 mg/100 mL的频率为0.15,则估计这28 800人中属于醉酒驾车的人数为28 800×0.15=4320.故选C.
4.A [解析] 根据频率分布直方图可得下表:
阅读时间 (分钟) [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]
抽样人数 10 18 22 25 20 5
这100名学生中有50名为“阅读霸”,据此可估计该校有一半学生为“阅读霸”.故选A.
5.D [解析] 由频率分布直方图得,平均数为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73,故A错误;众数为=65,故B错误;∵成绩在[50,70)内的频率为(0.005+0.04)×10=0.45,在[70,80)内的频率为0.03×10=0.3,∴中位数为70+×10=,故C错误;样本中该校数学月考成绩在80分以上的学生的频率为(0.02+0.005)×10=0.25,∴估计该校数学月考成绩在80分以上的学生占总人数的25%,故D正确.故选D.
6.A [解析] 由频率分布直方图得0.02×2+0.03×2+0.05×2+0.05×2+0.15×2+2a+0.05×2+0.04×2+0.01×2=1,解得a=0.10,所以估计该普通高中的学生周平均阅读时间在[10,12)内的频率为2a=0.20.故选A.
7.C [解析] 对于①,从表中的数据来看不管样本量为50还是为100,不同样本的平均数往往是不同的,故①正确;对于②,由表中数据可知最小数据是162.8,故②错误;对于③,由题图可得大部分样本平均数离总体平均数不远,在总体平均数附近波动,故③正确;对于④,由题图可发现样本量为100的波动幅度明显小于样本量为50的,这与我们对增加样本量可以提高估计效果的认识是一致的,故④正确.故选C.
8.AB [解析] 对于A,由该行业从业者学历分布扇形图知该高科技行业从业人员中学历为博士的占一半以上,故A正确;对于B,由从事该行业岗位分布条形图知该高科技行业中从事技术岗位的人数超过总人数的30%,故B正确;对于C,由该行业从业者学历分布扇形图,从事该行业岗位分布条形图无法得到该高科技行业中从事运营岗位的人员主要是本科生,故C错误;对于D,无法得知该高科技行业从业人员对于学历要求比较高,故D错误.故选AB.
9.ACD [解析] 由(0.005+0.005+0.010+a+0.025+0.035)×10=1,得a=0.020,故A正确;不及格的频率为(0.005+0.005)×10=0.1,则6万名考生中不及格的人数约为60 000×0.1=6000,故B错误;选取的2000人的成绩中,成绩落在[70,80),[80,90)内的频率分别为0.2,0.35,则成绩落在[70,80)内的人数是成绩落在[80,90)内的人数的=,故C正确;以频率估计概率,从6万名考生中随机抽取1人,则该学生成绩优秀的概率为0.025×10=0.25,故D正确.故选ACD.
10.6 75% [解析] 因为各组的频率和等于1,所以问卷分数低于50分的频率为1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的被问卷人数为60×0.1=6.依题意,问卷分数在60分及以上的频率为(0.015+0.030+0.025+0.005)×10=0.75,所以样本中满意度在60分及以上的百分比为75%,所以可以估计全市市民满意度在60分及以上的百分比为75%.
11.50 1015 [解析] 第一分厂应抽取的件数为100×50%=50.估计该产品的平均使用寿命为1020×50%+980×20%+1030×30%=1015(h).
12.(1)54° (2)16 000 [解析] (1)根据题意得D所在圆心角的度数为360°×(1-40%-25%-20%)=54°.
(2)根据题意得30 000×=16 000,则估计视力在4.9以下的学生有16 000名.
13.解:(1)根据题目中的数据,计算每一小组的频率,完成频率分布表如下.
分组 频数 频率
[1000,2000) 20 0.10
[2000,3000) 30 0.15
[3000,4000) 80 0.40
[4000,5000) 40 0.20
[5000,6000] 30 0.15
合计 200 1.00
(2)画出频率分布直方图和折线图如图:
(3)根据频率分布表,得该电子元件的寿命在[1000,4000)内的频率是0.10+0.15+0.40=0.65,
所以估计该电子元件的寿命在[1000,4000)内的百分比为65%.
(4)根据频率分布表,得电子元件的寿命在4000 h及以上的频率为0.20+0.15=0.35,
所以估计该电子元件的寿命在4000 h及以上的百分比为35%.
14.解:(1)分数在[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]内的频率分别为0.05,0.05,0.1,0.15,0.25,0.3,0.1,
所以此次测试的及格率的估计值为0.15+0.25+0.3+0.1=0.8,
此次测试的优秀率的估计值为+0.1=0.25.
(2)由频率分布直方图知,分数在[30,70)内的频率为0.05+0.05+0.1+0.15=0.35,分数在[30,80)内的频率为0.05+0.05+0.1+0.15+0.25=0.6,
所以此次测试学生分数的中位数在[70,80)内,则中位数为70+×10=76.
(3)样本中分数不低于80的学生共有100×(0.3+0.1)=40(人),
而样本中分数不低于80的男女生人数相等,所以样本中分数不低于80分的男生有20人,
又样本中有的男生分数不低于80,所以样本中男生有60人,女生有40人.
由分层抽样可得参加测试的高中男生有×3000=1800(人),女生有×3000=1200(人).第2课时 用样本的分布来估计总体的分布
一、选择题
1.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.以上说法都不正确
2.某校学生的男女生人数之比为2∶3,按照男女比例通过分层抽样的方法抽取一个样本,样本中男生每天的平均运动时间为100分钟,女生每天的平均运动时间为80分钟.结合此数据,估计该校全体学生每天的平均运动时间为( )
A.98分钟 B.88分钟
C.90分钟 D.85分钟
3.依据相关法律可知,车辆驾驶员血液中所含的酒精浓度大于或等于80 mg/100 mL时,属醉酒驾车.某地对涉嫌酒后驾车的28 800人进行血液检测,从中随机抽取500人的检测结果,根据检测结果绘制的频率分布直方图如图所示,则估计这28 800人中属于醉酒驾车的人数为 ( )
A.8640 B.5760
C.4320 D.2880
4.学校为了解提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制出这100名学生周末阅读时间的频率分布直方图,如图所示.将阅读时间不低于30分钟的学生称为“阅读霸”,则下列说法正确的是 ( )
A.抽样表明,该校约有一半学生为“阅读霸”
B.这100名学生中有5名学生的阅读时间在[30,60]内
C.这100名学生中阅读时间在[10,20)内的频率为0.018
D.抽样表明,该校约有50名学生为“阅读霸”
5.如图是某校随机抽取100名学生数学月考成绩(满分为100分)后制成的频率分布直方图,据此估计该校本次月考数学成绩的总体情况(同一组中的数据用该组区间的中点值为代表),下列说法正确的是 ( )
A.平均数为74
B.众数为60或70
C.中位数为75
D.估计该校数学月考成绩在80分以上的学生占总人数的25%
6.为了解某普通高中学生的阅读时间,从该校随机抽取了800名学生进行调查,得到了这800名学生一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图,从该普通高中的学生中随机抽取一人,他的周平均阅读时间在[10,12)内的频率为 ( )
A.0.20 B.0.10 C.0.15 D.0.30
7.[2024·天津西青区高一期末] 树人中学跨学科项目研学小组的同学们准备研究高一年级新生的身高情况.他们从学校医务室得到高一年级学生身高的所有数据,计算出整个年级学生的平均身高为165 cm.然后同学们用简单随机抽样的方法,从这些数据中抽取了样本量为50和100的样本各10个,分别计算出样本平均数,如下表.
抽样序号
1 2 3 4 5 6 7 8 9 10
样本量为50的平均数 165.2 162.8 164.4 164.4 165.6 164.8 165.3 164.7 165.7 165.0
样本量为100的平均数 164.4 165.0 164.7 164.9 164.6 164.9 165.1 165.2 165.1 165.2
为了更方便地观察数据,以便我们分析样本平均数的特点以及与总体平均数的关系,我们把这20次试验的平均数用图形表示出来,如图所示.
从试验结果看,有以下四种说法:①不管样本量为50还是为100,不同样本的平均数往往是不同的;②样本平均数偏离总体平均数都不超过1 cm;③大部分样本平均数离总体平均数不远,在总体平均数附近波动;④比较样本量为50和样本量为100的样本平均数,还可以发现样本量为100的波动幅度明显小于样本量为50的,这与我们对增加样本量可以提高估计效果的认识是一致的.其中正确说法的个数是 ( )
A.1 B.2 C.3 D.4
8.(多选题)调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布扇形图、从事该行业岗位分布条形图,如图所示.
则下列说法正确的为 ( )
A.该高科技行业从业人员中学历为博士的占一半以上
B.该高科技行业中从事技术岗位的人数超过总人数的30%
C.该高科技行业中从事运营岗位的人员主要是本科生
D.该高科技行业从业人员对于学历要求比较高
9.(多选题)某市为了解2023年普通高中学业水平考试的数学成绩,在6万名考生中随机抽取2000人的成绩作为样本(满分100分,60分及以上为及格,90分及以上为优秀),可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则下列说法正确的是 ( )
A.a=0.020
B.6万名考生中约有3000人不及格
C.选取的2000人的成绩中,成绩落在[70,80)内的人数是成绩落在[80,90)内的人数的
D.以频率估计概率,从6万名考生中随机抽取1人,则该学生成绩优秀的概率为0.25
二、填空题
10.为了迎接某市作为全国文明城市的复查,某协会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设路人的回答是客观的),以分数表示问卷结果(满分为100分),并统计他们的问卷分数,把问卷分数分成六组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],画出如图所示的部分频率分布直方图.观察图中信息,问卷分数低于50分的被问卷人数为 ,估计全市市民满意度在60分及以上的百分比为 .
11.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层抽样的方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为 ;由所得样品的测试结果计算出第一、二、三分厂抽取的产品的使 用寿命平均值分别为1020 h,980 h,1030 h,估计这个企业所生产的该产品的平均使用寿命为 h.
12.现在的青少年由于沉迷电视、手机、网络游戏等,视力日渐减退,某市为了了解学生的视力变化情况,从全市九年级的学生中随机抽取了1500名,统计了每名学生近三年视力检查的结果,根据视力在4.9以下的人数变化制成折线图,并对视力下降的主要因素进行调查,制成扇形图,如图所示.
解答下列问题:
(1)图中D所在扇形的圆心角度数为 .
(2)若全市共有30 000名九年级学生,则估计视力在4.9以下的学生有 名.
三、解答题
13.对某种电子元件进行寿命追踪调查,情况如下表:
寿命/h [1000, 2000) [2000, 3000) [3000, 4000) [4000, 5000) [5000, 6000]
个数 20 30 80 40 30
(1)列出样本数据的频率分布表;
(2)画出频率分布直方图和折线图;
(3)估计该电子元件的寿命在[1000,4000)内的百分比;
(4)估计该电子元件的寿命在4000 h及以上的百分比.
14.[2023·广东珠海高一期末] 为弘扬中华民族优秀传统文化,树立正确的价值导向,落实立德树人根本任务,某市组织3000名高中学生进行古典诗词知识测试.根据男女学生人数比例,使用分层抽样的方法从中随机抽取100名学生,记录他们的分数,整理得到频率分布直方图如图所示.
(1)规定分数不低于60为及格,不低于85为优秀,试估计此次测试的及格率及优秀率;
(2)试估计此次测试学生分数的中位数;
(3)已知样本中分数不低于80的男女生人数相等,且样本中有的男生分数不低于80,试估计参加本次测试的3000名高中生中男生和女生的人数.