9.2.1
总体取值规律的估计
9.2.2
总体百分位数的估计
一、知识梳理
1.制作频率分布表、画频率分布直方图的步骤:
⑴求极差:极差为一组数据中_______的差。
⑵决定组数与组距:当样本容量不超过100时,常分成_______组。
⑶将数据分组:可以使第一组的左端点略小于数据中的______,最后一组的右端点略大于数据中的________。
⑷列频率分布表:.
⑸画频率分布直方图:纵轴表示________。
2.统计图:统计图除了直方图外,还有_______、________、折线图、频数分布直方图等。
3.总体百分为数的估计:
⑴第p百分位数:它使得这组数据中至少有p%的数据__________这个值,且至少有
的数据__________这个值。
⑵计算n个数据的第p百分位数的步骤:
第1步,按_________排列原始数据。
第2步,计算。
第3步,若不是整数,而大于的比邻整数为,则第p百分位数为第项数据;
若是整数,则第p百分位数为_______________________。
二、重要题型
知识点一:频率分布直方图的画法及应用
1.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图高为h,则|a-b|=( )
A.hm
B.
C.
D.h+m
2.如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于( )
A.0.120
B.0.180
C.0.012
D.0.018
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10000位居民,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000位居民中再用比例分配的分层随机抽样抽出100位居民做进一步调查,则在[2.5,3.0)(小时)时间段内应抽出的人数是( )
A.25
B.30
C.50
D.75
4.下表给出了在某校500名10岁学生中,用随机抽样得出的120人的身高(单位:cm).
(1)列出样本频率分布表(频率精确到0.01);
(2)画出频率分布直方图;
(3)估计身高小于134
cm的人数占总人数的百分比.
知识点二:百分位数的计算
5.一次数学测试中,高一(1)班某小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试该小组12名学生成绩的75%分位数是( )
A.88分
B.89分
C.90分
D.91分
6.某校调查某班30名同学所穿的鞋的尺码如下表所示:
码号
33
34
35
36
37
人数
7
6
14
1
2
则这组数据的25%分位数是( )
A.33
B.34
C.35
D.36
知识点三、百分位数的实际应用
7.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
三、巩固练习
1.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到扇形图:
则下面结论中不正确的是
( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
2.某校从高一年级学生中随机抽取部分学生,将他们的成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,高一年级期末数学成绩不少于60分的学生人数为( )
A.588
B.480
C.450
D.120
3.已知样本:
7 10 14 8 7 12 11 10 8 10
13 10 8 11 8 9 12 9 13 12
那么这组样本数据落在范围8.5~11.5内的频率为________.?
4.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的10%分位数是________,20%分位数是________.
5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长方形的面积和的,且样本容量为200,则第8组的频数为 .?
6.某地为了了解该地区10000户家庭的用电情况,采用分层随机抽样的方法抽取了500户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图如图所示,则该地区10000户家庭中月平均用电度数在[70,80)内的家庭约有________户.
7.对某市“四城同创”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.
8.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值.
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分.
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
9.2.1
总体取值规律的估计
9.2.2
总体百分位数的估计
参考答案
一、知识梳理
1.
⑴最大值与最小值,
⑵5~12,
⑶最小值,
最大值,
⑷,⑸.
2.
条形图,
扇形图.
3.
⑴小于或等于,
大于或等于,
⑵从小到大,
,第项与第项数据的平均数.
二、重要题型
1.B
根据频率分布直方图中每组的高为,可知=h,所以|a-b|=.故选B.
2.D
由图可知纵坐标表示.故x=0.1-0.054-0.010-0.006-0.006-0.006
=0.018.
3.A
抽出的100位居民中平均每天看电视的时间在[2.5,3.0)(小时)内的频率为0.5×0.5=0.25,所以这10000位居民中平均每天看电视的时间在[2.5,3.0)(小时)内的人数是10000×0.25=2500.依题意知抽样比是=,则在[2.5,3.0)(小时)时间段内应抽出的人数是2500×=25.
4.解:(1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1
(2)其频率分布直方图如下:
(3)由样本频率分布表可知,身高小于134
cm的学生出现的频率为0.04+0.07+0.08
=0.19,所以我们估计身高小于134
cm的人数占总人数的19%.
5.D
因为12×75%=9,所以这组数据的75%分位数为=91(分).故选D.
6.B
因为30×25%=7.5,所以这组数据的25%分位数为34.故选B.
7.解:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1.解得a=0.30.
(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85.
而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,由0.3×(x-2.5)
=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
三、巩固练习
1.A.
设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为2×0.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B,C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,
故D正确.
2.B
在频率分布直方图中,长方形的面积表示其频率.该校高一年级期末数学成绩不少于60分的频率为1-(0.005+0.015)×10=0.8,所以对应的学生人数为600×0.8=480.
3.
0.4
样本量是20,落在8.5~11.5内的数据有2个9,4个10,2个11,共8个数据,所以要求的频率是8÷20=0.4.
4.15 17
这组数据从小到大排列后,∵5×10%=0.5,∴该组数据的10%分位数是15,∵5×20%=1,∴该组数据的20%分位数是=17.
5.40
设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而所以.故第8组的频数为.
6.1200
根据频率分布直方图得该地区10000户家庭中月平均用电度数在[70,
80)内的家庭约有10000×0.012×10=1200(户).
7.(1)0.04 (2)440
(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
8.解:(1)由频率分布直方图知,因此.
(2)估计这次成绩的平均分为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05.
所以这100名学生语文成绩的平均分为73分.
(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为
0.05×1005,0.4×10040,0.3×10030,0.2×10020.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.
所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)10(人).