(共16张PPT)
9.2.2 总体百分位数的估计
1.正确理解第p百分位数的概念,掌握第p百分位数的求法
问题:某市政府为了减少水资源的浪费,计划对居民生活用水实施阶梯水价制度,即确定一户居民月用水量标准a用水量不超过a的部分按平价收费,超出a的部分按议价收费如果希望80%的家庭能享受平价,如何确定a
知识点1:第p百分数的概念
寻找一个数a,使全市居民用户月用水量中不超过a的占80%,大于a的占20%.我们将通过样本数据对a的值进行估计.
80%
20%
问题2:根据上一节中某市100名居民的月均用水量数据,如果该市政府希望使 80% 居民用户生活用水费用支出不受影响,如何给市政府提出确定居民用户月均用水量标准的建议?
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
将100个数据按从小到大的顺序排列
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3
2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9
5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7
6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2
10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9
18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
在区间(13.6,13.8)内任意一个数都能把样本数据分成符合要求的两部分,
一般取这两个数的平均数
第80百分位数(80%分位数)
误差主要来自于抽样的方法和样本的随机性.
思考:这个标准一定能够保证80%的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?
注意:求百分位数时,一定要将数据按照从小到大的顺序排列.
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
归纳总结
判断正误:
(1)若一组样本数据各不相等,则其75%分位数大于25%分位数.
(2)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.
(3)第50百分位数一定是这组数据中的一个数据.
练一练
×
×
√
求百分位数的步骤:
知识点2:第p百分数的计算
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:①若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
②若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
几个重要的百分位数
常用分位数:第25百分位数,第50百分位数(中位数),第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
像第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用.
25%
第一四分位数
(下四分位数)
50%
75%
中位数
第三四分位数
(上四分位数)
百分位数的特点
(1)第0百分位数是数据组中的最小数,第100百分位数是数据组中的最大数;
(2)一组数据的第p百分位数可能是这组数据中的数,也可能不是这组数据中的数;
(3)一组数据中的某些百分位数可能是同一个数.
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 151.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
例2:以下是树人中学高一年级抽取27名女生的样本数据:
请估计树人中学高一年级女生的第25,50,75百分位数.
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.
由于女生的样本量比较小,所以这里对总体的估计可能会存在比较大的误差
例2:根据下表估计月均用水量的样本数据的80%和95%分位数.
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2) 2 0.02
合计 100 1.00
解:月均用水量在13.2t以下的居民用户所占比例为
在16.2t以下的居民用户所占比例为
因此,80%分位数一定位于[13.2,16.2)内
由
可以估计月均用水量的样本数据的80%分位数约为14.2.
类似地,由
可以估计月均用水量的样本数据的95%分位数约为22.95.
要点概括整合
总体百分位数的估计
第p百分数
计算步骤
四分位数