(共23张PPT)
9.2.2 总体百分位数的估计
【学习目标】
1.理解百分位数的概念;
2.掌握求一组数据的百分位数的基本步骤;
3.通过具体问题,让学生感受总体百分位数在解决实际问题中的运用,发展学生数学抽象、逻辑推理的核心素养。
学习重点:求百分位数的步骤,会求样本数据的百分位数,并能利用样本数据的百分位数估计总体数据的百分位数.
学习难点:求样本数据的百分位数.
【环节一:复习引入】
在上节课中,我们通过作频率分布表、频率分布直方图表述了居民用户月均用水量的样本数据,并通过对图表进行分析,我们得出了一些样本数据的频率分布规律,并推测了该市全体居民用户月均用水量的分布情况。得出:“大多数的居民用户的月均用水量集中在一个较低值区域”。
【环节二:探究问题一】
(如何理解使80%的居民用户生活用水支出不受影响?)
接下来我们的问题是该如何利用这些信息,为政府决策服务呢?请同学们来想一想:如果该市政府希望使80%的居民生活用水费支出不受影响,根据上节课中的100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
引例 某市政府为了节约生活用水,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。
如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
分析:首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%, 大于a的占20%.
下面我们通过样本数据对a的值进行估计.
【环节三:探究问题二】
(100个样本数据的第80百分位数如何求?)
称此数13.7为这组数据的第80百分位数或80%分位数
1.3 1.3 2.0 2.0 ··· 13.3 13.6 13.8 13.8 ··· 28.0
(2)得到第80和第81个数据分别是13.6和13.8
(3)一般地,我们取这两个数的平均数
可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
解: (1)把100个样本数据按从小到大排序
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右. 由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
注意:求百分位数时,一定要将数据按照从小到大的顺序排列.
1.百分位数定义
判断正误:
(1)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.( )
(2)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.( )
(3)若一组样本数据各不相等,则其75%分位数大于25%分位数.( )
×
√
√
探究新知
探究新知
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
例如:
样本量n=100,则由80%×100=80,知80%分位数即是从小到大排列的第80个与第81个数的平均数,如果n=101,则由80%×101=80.8,得80%分位数即是第81个数.
(1)求百分位数的步骤
2.用原始数据求百分位数
常用分位数:第25百分位数,第50百分位数(中位数),第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
第25百分位数也称为第一四分位数或下四分位数.
第75百分位数也称为第三四分位数或上四分位数.
(2)几个重要的百分位数
像第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用.
①第0百分数为数据组中的最小数,第100百分位数为数据中的最大数;
②一组数据的百分位数既可能是这组数据中的数,也可能不是这组数据中的数;
③一组数据的某些百分位数可能是同一个数.
(3)百分位数的特点
【环节四:探究问题三】
(总体百分位数的概念理解及总体百分位数估计在实际生活中的应用)
例1:已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排序后,9.3是第75个数据
C.把这100个数据从小到大排序后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排序后,9.3是第75个数据和第74个数据的平均数
C
例2 : 根据9.1.2节问题3中27名女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0
162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0
155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
解:
把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.
据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
【解析】把甲、乙两名学生的数学成绩从小到大排序,可得
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:78,79,83,86,88,93,98,98,99,101,103,106,114.
由13×25%=3.25,13×50%=6.5.
可得数据的第25,50百分位数为第4,7项数据,即学生甲的第25,50的百分位数为76,88.
学生乙的第25,50的百分位数为86,98.
例3 根据下表估计月均用水量的样本数据的80%和95%分位数.
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2] 2 0.02
合计 100 1.00
有些情况下,我们只能获得整理好的统计表或统计图与原始数据相比,他们损失了一些信息。
3.用频率分布表、频率分布直方图估算百分位数
解:
由频率分布表可知,月均用水量在13.2t以下的居民用户所占比例为
在16.2t以下的居民用户所占比例为
∴80%分位数一定位于[13.2,16.2)内.由
可以估计月均用水量的样本数据的80%分位数约为14.2
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2] 2 0.02
合计 100 1.00
类似地,由
可以估计月均用水量的样本数据的95%分位数约为22.95
例4 根据下图估计月均用水量的样本数据的80%和95%分位数.
先算各组的频率,解题步骤如上
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.23
设80%分位数为m,则
0.77+(m-13.2)×0.030=0.80,解得
m=14.2.
设95%分位数为m,则
0.94+(n-22.2)×0.013=0.95,解得
n=22.97.
0.02
2. 某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩的70%分位数约为 秒.
16.5
解析:设成绩的70%分位数为x,
所以x∈[16,17),
解得x=16.5(秒).
【变式训练】
达标练习【练】
在居民用户月均用水量标准制定的问题中,根据教科书中的调查数据,如果要让60%的居民不超出标准,居民用户月均用水量标准定为多少合适?
教材202页
解:将100户居民的月均用水量按小到大的顺序排列如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
由于100×60%=60.
∴第60百分位数为第60个和第61个数据的平均数,即
因此居民用户月均用水量标准应定为8.0合适.
解:把23名男生的样本数据按从小到大排序,结果如下:
164.0 165.0 165.0 166.0 167.0 168.0 168.0 168.0 170.0 170.0 170.0 172.0
172.0 172.0 173.0 173.0 173.0 173.0 174.0 175.0 175.0 175.0 176.0
由23×25%=5.75,23×50%=11.5,23×75%=17.25,可知样本数据的第25,50,75百分位数为第6,12,18项数据,分别为168.0,172.0,173.0.
据此可以估计树人中学高一年级男生的第25,50,75百分位数分别约为168.0,172.0,173.0.
通过增加样本量,可以减少估计的误差.
2. 根据9.1.2节问题3中男生的样本数据,请你估计树人中学高一年级男生的第25,50,75百分位数. 如果要减少估计的误差,你觉得应该怎么做
达标练习【练】
教材202页
1.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是 .
13.7,14.7,15.3
解析:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,
由i=12×50%=6,得的给数据的第50百分位数是第6个数据与第7个数据的平均数,
由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,
补充练习
2.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.
0.04
42.5
解析:(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由题图可知年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,且所有志愿者的年龄都小于45岁,
所以志愿者年龄的95%分位数在[40,45]内,因此志愿者年龄的95%分位数为
补充练习
课堂小结
①按从小到大排列原始数据.
②计算i=n×p%.
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
2.用原始数据求百分位数
3.用频率分布表、频率分布直方图估算百分位数
1.百分位数定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
布置作业
课时规范训练(三十五)