[A 基础达标]
1.下列说法中错误的是( )
①用样本的频率分布估计总体频率分布的过程中,样本容量越大,估计越精确;
②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为240;
③频率分布直方图中,小长方形的高等于该小组的频率;
④将频率分布直方图中各小长方形上端的一个端点顺次连接起来,就可以得到频率分布折线图;
⑤每一个总体都有一条总体密度曲线,它反映了总体在各个范围内取值的百分比.
A.①③ B.②③④
C.②③④⑤ D.①②③④⑤
解析:选C.样本越多往往越接近于总体,所以①正确;②中n=40÷0.125=320;③中频率分布直方图中,小长方形的高等于该小组的频率÷组距;④中应将频率分布直方图中各小长方形上端的中点顺次连接起来得到频率分布折线图;⑤中有一些总体不存在总体密度曲线,如“掷硬币”这样的离散型总体(结果是固定的,只有正面和反面两种可能,且可能性相等),故②③④⑤错误.
2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.
3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的 ,已知样本容量是80,则该组的频数为( )
A.20 B.16
C.30 D.35
解析:选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x=16,即该组的频数为16,故选B.
4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是( )
A.12 B.18
C.25 D.90
解析:选D.净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.
5.(2019·广东省肇庆市检测)某频率分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)的数据个数之和是________.
分组
[10,20)
[20,30)
[30,40)
频数
3
4
5
解析:由于样本容量为50,故在[20,60)内的频数为50×0.6=30,故在[40,60)内的数据个数之和为30-4-5=21.
答案:21
6.(2019·山西省大同市铁路一中期末考试)为了解某校高三学生的身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为1∶2∶3,第二小组频数为12,若全校男、女生比例为3∶2,则全校抽取学生数为________.
解析:根据图可知第四与第五组的频率和为(0.012 5+0.037 5)×5=0.25,
因为从左到右前三个小组频率之比为1∶2∶3,第二小组频数为12,
所以前三个小组的频数为36,从而男生有=48(人).
因为全校男、女生比例为3∶2,所以全校抽取学生数为48×=80.
答案:80
7.为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
[20,25)
5
0.05
[25,30)
①
0.20
[30,35)
35
②
[35,40)
30
0.30
[40,45]
10
0.10
合计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.
解:(1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.
法一:根据题意可得=0.20,=y,
解得x=20,y=0.35,故①处应填20,②处应填0.35.
法二:由题意得5+x+35+30+10=100,
0.05+0.20+y+0.30+0.10=1,
解得x=20,y=0.35,故①处填20,②处填0.35.
(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5.
所以==0.04.
补全频率分布直方图如图所示.
根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为500×0.35=175.
8.某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)画出两组数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
解:(1)茎叶图如图所示:
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产量比品种B高;②品种A的亩产量比较分散,故品种A的亩产量稳定性较差.
[B 能力提升]
9.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是( )
解析:选A.由频率分布直方图知,各组频数统计如下表:
分组
[0,5)
[5,10)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40]
频数
1
1
4
2
4
3
3
2
结合各选项茎叶图中的数据可知选项A正确.
10.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
解:(1)x=[1-(0.002+0.009 5+0.011+0.012 5+0.005+0.002 5)×20]÷20=0.007 5.
(2)由频率分布直方图知,月平均用电量为[220,240),[240,260),[260,280),[280,300]的共有[(0.012 5+0.007 5+0.005+0.002 5)×20]×100=55(户),其中在[220,240)中的有0.012 5×20×100=25(户),因此,在所抽取的11户居民中,月平均用电量在[220,240)的用户中应抽取×11=5(户).
11.(选做题)某高校在2017年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下:
组号
分组
频数
频率
第1组
[160,165)
5
0.05
第2组
[165,170)
①
0.35
第3组
[170,175)
30
②
第4组
[175,180)
20
0.20
第5组
[180,185]
10
0.10
合计
100
1.00
(1)请先求出频率分布表中①②处应填写的数据,并完成如图所示的频率分布直方图;
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各应抽取多少名学生进入第二轮面试.
解:(1)由题意可知,第2组的频数为0.35×100=35,第3组的频率为=0.30,故①处填35,②处填0.30.
频率分布直方图如图所示.
(2)因为第3,4,5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,抽样比为=,故第3组应抽取30×=3(名)学生,第4组应抽取20×=2(名)学生,第5组应抽取10×=1(名)学生,所以第3,4,5组应抽取的学生人数分别为3,2,1.
课件43张PPT。第二章 统计第二章 统计中点组距茎叶本部分内容讲解结束按ESC键退出全屏播放