9.2.2 总体百分位数的估计
[学习目标]
1.结合实例,能用样本估计百分位数.
2.理解百分位数的统计含义.
一、百分位数的定义
问题1 请阅读课本第202页到第203页,思考问题2中居民用户月均用水量标准转化为数学问题具体指什么?
问题2 你能制定一下具体方案吗?
知识梳理
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据________________这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按________________排列原始数据.
第2步,计算i=________.
第3步,若________不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的____________.
3.一组数据常用的分位数:
(1)中位数相当于是第________百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组________________排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为________四分位数或下四分位数等,第75百分位数也称为________四分位数或上四分位数等.
例1 下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
反思感悟 分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
跟踪训练1 15%分位数的含义是( )
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
二、由原始数据求百分位数
例2 (1)已知一组数据从小到大排列为0,4,5,6,8,10,12,15,则这组数据的45%分位数、75%分位数分别是( )
A.5.5,10 B.5.5,12 C.6,11 D.6,10
(2)若下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的第30百分位数是( )
班级得分 7 8 9 10 11 13 14
频数 2 1 2 3 1 2 1
A.11 B.10.5 C.9.5 D.9
反思感悟 计算一组n个数据的第p百分位数的一般步骤
(1)排列:按从小到大排列原始数据;
(2)算i:计算i=n×p%;
(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
跟踪训练2 已知按从小到大顺序排列的两组数据:甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则等于( )
A. B. C. D.
三、统计图表中的百分位数
例3 我国是一个严重缺水的国家,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.
(1)求a,m的值;
(2)如果我们称m为这组数据的86%分位数,那么这组数据的50%分位数是多少?
延伸探究 根据例3中的频率分布直方图计算月均用水量的15%分位数.
反思感悟 由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)可采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
跟踪训练3 某班60名学生期中考试物理成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100],则该成绩的第70百分位数约为( )
A.73.6 B.75.5 C.76.2 D.78.3
1.知识清单:
(1)百分位数的定义.
(2)由样本数据求百分位数.
(3)由频数(频率)分布表及频率分布直方图求百分位数.
2.方法归纳:数据分析、数形结合.
3.常见误区:求第p百分位数时,应先将数据从小到大排列.
1.(多选)已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中至少有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
2.数据12,14,15,17,19,23,27,30的第70百分位数是( )
A.14 B.17
C.19 D.23
3.下表记录了某地区某个月连续8天的空气质量指数(AQI).
时间 1 2 3 4 5 6 7 8
空气质量指数(AQI) 20 28 24 33 31 35 36 38
则这组空气质量指数的25%分位数为( )
A.24 B.26
C.28 D.31
4.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.
9.2.2 总体百分位数的估计
问题1 寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
问题2 把得到的100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7.
知识梳理
1.p% 小于或等于
2.从小到大 n×p% i 平均数
3.(1)50 (2)由小到大 (3)第一
第三
例1 C 跟踪训练1 B
例2 (1)C (2)D
跟踪训练2 A
例3 解 (1)由频率分布直方图得
(0.16+0.30+0.40+0.50+0.30+0.16+a+a+a)×0.5=1,
解得a=0.06.
由频率分布直方图得月均用水量在[0,3)内的频率为1-(0.16+0.06+0.06)×0.5=0.86.
∵计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.
∴m≈3.
(2)由频率分布直方图知,数据在[0,2)内的频率为(0.06+0.16+0.30+0.40)×0.5=0.46,在[2,2.5)内的频率为0.50×0.5=0.25,
∴这组数据的50%分位数是
2+×0.5=2.08(吨).
延伸探究 解 由例3的频率分布直方图可知,月均用水量在[0,1)内的频率为(0.06+0.16)×0.5=0.11,
在[1,1.5)内的频率为
0.30×0.5=0.15.
∴月均用水量的15%分位数约为1+×0.5≈1.133(吨).
跟踪训练3 D [由题意可求得a=0.005,则[50,70)对应的频率为0.005×10+0.04×10=0.45,[70,80)对应的频率为0.03×10=0.3,0.3+0.45=0.75>0.7,所以第70百分位数在[70,80)之间,即第70百分位数为70+×10≈78.3.]
随堂演练
1.AC 2.D 3.B 4.