9.2.2 总体百分位数的估计
学习目标
1. 了解百分位数的概念。
1. 能用样本估计百分位数。
1. 理解百分位数的统计意义。
基础梳理
1. 百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
随堂训练
1. 若某校高一年级8个班参加合唱比赛的得分如下:87,89,90,91,92,93,94,96,则这组数据的中位数和分位数分别是( )
A.和 B.和 C.91和 D.92和
2. 某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数、分位数分别为( )
A.85分,85分,85分,90分 B.87分,85分,85分,92.5分
C.87分,85分,85分,90分 D.87分,85分,90分,92.5分
3.某班的全体学生参加消防安全知识竞赛,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].估计本班学生的消防安全知识成绩的第90百分位数是( )
A.93 B.80 C.90 D.95
4.已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124,125,127,126.则这组数据的第25百分位数和第80百分位数分别是( )
A.125 128 B.124 128
C.125 129 D.125 128.5
5.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15 C.16 D.17
6.一组数据4.3, 6.5, 7.8, 6.2, 9.6, 15.9, 7.6, 8.1, 10, 12.3, 11, 3,则它们的75%分位数是( )
A.10.3 B.10.4 C.10.5 D.10.6
7.2019年学期末,某学校对100间学生公寓进行综合评比,依考核分数分为A,B,C,D四种等级,其中分数在[60,70)为D等级,有15间;分数在[70,80)为C等级,有40间;分数在[80,90)为B等级,有20间;分数在[90,100]为A等级,有25间.考核评估后,得其频率分布直方图如图所示,估计这100间学生公寓评估得分的80%分位数是( )
A.90 B.92 C.95 D.80
8.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表.
组合 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
合计 100
估计本校学生的一周课外阅读时间的第90百分位数________.
9.某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65, 65, 66, 74, 73, 81, 80,则它们的第三四分位数是( )
A.66 B.80 C.74 D.65
10.从某校高一新生中随机抽取一个容量为20的身高样本,数据从小到大排序如下(单位:cm),152,155,158, 164, 164, 165, 165, 165, 166, 167, 168, 168, 169, 170, 170, 170, 171,x, 174, 175.若样本数据的第90百分位数是173,则x的值为( )
A.171 B.172 C.173 D.174
11.从某城市随机抽取14台自动售货机,对其销售额进行统计,数据如下:8,8,10,12,
22,23,20,23,32,34,31,34,42,43.则这14台自动售货机的销售额的第50,80百分位数分别为________、________.
12.山东省教育厅为了了解和掌握2019年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如图所示的频率分布表:
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1
(1)求样本数据的第60,80百分位数.
(2)估计2019年高考考生的数学成绩的90%分位数.
答案
随堂训练
1.答案:A
解析:因为这组数据为,所以其中位数为.数据共有8个,,则它的分位数为.故选A.
2.答案:C
解析:平均数为(分);众数为85分;中位数为85分;∵数据共有10个,,∴,∴它的分位数为90分.故选C.
3.答案:A
解析:由直方图得,从左到右的第一、二、三、四小组的频率分别是0.10、0.20、0.40、0.30.第一、二、三小组的频率之和为0.10+0.20+0.40=0.70<0.90,
所以第90百分位数处在第四组[80,100]内,为80+20×=93.
4.答案:D
解析:把这15个数据按从小到大排序,可得121,123,124,125,125,125,125,126,126,127,
127,128,129,129,130,由25%×15=3.75,80%×15=12,可知数据的第25百分位数为第4项数据为125,第80百分位数为第12项与第13项数据的平均数,即×(128+129)=128.5.
5.答案:A
解析:第1组[5,10)的频率为0.04×(10-5)=0.20;第2组[10,15)的频率为0.10×5=0.50;
所以第60百分位数是10+5×=14.
6.答案:C
解析:把数据从小到大排序,得3, 4.3, 6.2, 6.5, 7.6,7.8, 8.1, 9.6, 10, 11, 12.3, 15.9,共有12个数.因为12×75%=9,所以75%分位数是第9项和第10项数据的平均数,即×(10+11)=10.5.
7.答案:B
解析:根据题意,由直方图可知,在[60,70)内的频率为0.15,在[70,80)内的频率为0.40,在[80,90)内的频率为0.20,其和为0.75,故可知80%分位数在90~100之间,由90+10×=92,可知满足题意的80%分位数为92.
8.答案:12
解析:因为前6组的频率之和为0.90,所以第90百分位数为12.
据此可以估计本校学生的一周课外阅读时间的第90百分位数约为12.
9.答案:B
解析:从小到大排序为65, 65, 66, 73, 74, 80, 81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.
10.答案:B
解析:因为20×90%=18,所以第90百分位数是第18项和第19项数据的平均数,即(x+174)=173,所以x=172.
11.答案:23 34
解析:把14台自动售货机的销售额按从小到大排序,得8,8,10,12,20,22,23,23,31,32,34,
34,42,43.因为14×50%=7,14×80%=11.2,所以第50百分位数是第7项和第8项数据的平均数,即×(23+23)=23,第80百分位数是第12项数据34.
12. 解析:从频率分布表得,
前六组的频率之和为0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
(1)由前六组的频率之和为0.60,得样本数据的第60百分位数为110,样本数据的第80百分位数一定在第八组[115,120)内,由115+5×=119.4,估计样本数据的第80百分位数约为119.4.
(2)由前八组的频率之和为0.81,前九组的频率之和为0.92,知90%分位数一定在第九组[120,125)内,由120+5×=124.1,估计2019年高考考生的数学成绩的90%分位数为124.1.
2