2022
第九章统计
9.2.2总体百分位数的估计
目录
CONTENTS
01
知识回顾
03
根据频率分布直方图计算样本数据的 百分位数
02
总体百分位数的估计
04
课堂总结
01
知识回顾
1. 频率分布直方图?
所有小长方形的面积之和=1
2. 其他统计图?
02
总体百分位数的估计
思考
我们根据频率分布直方图得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断.
那么,如何利用这些信息,为政府决策服务呢?如果该市政府希望使80%的居民用户生活用水费支出不受影响,你能给市政府提出确定居民用户月均用水量标准的建议吗?
要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,
大于a的占20%.
80%
20%
a
下面我们通过样本数据对a的值进行估计. 我们首先把100个样本数据按从小到大排序
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 19.4 16.8 17.0 17.9 18.3 20.5 21.6 22.2 24.3 22.4 24.5 25.6 28.0
第80,81个数据分别为13.6和13.8.
区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
一般地,我们取这两个数的平均数13.7,并称此数为这组数据的第80百分位数或80%分位数.
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.
由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
第p位百分数
注:第50百分位数就是中位数,中位数是百分位数的特例.
p%
(100-p)%
第p百分位数
百分位数是刻画一组
样本数据百分位置的量.
第p百分位数的计算
四分位数
25%
第一四分位数
下四分位数
50%
75%
中位数
第三四分位数
上四分位数
我们也常用到第1百分位数,第5百分位数,第95百分位数,第99百分位数.
在某些情况下,我们只能获得整理好的统计表或统计图,与原始数据相比,他们损失了一些信息.那么该如何根据样本的频率分布表或频率分布直方图估计总体的百分位数呢?
03
根据频率分布直方图计算样本数据的百分位数
根据频率分布直方图计算样本数据的百分位数
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2)
2
0.02
合计
100
1.00
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}累计频率
0.23
0.55
0.68
0.77
0.86
0.91
0.94
0.98
1.00
月均用水量在13.2t以下77%,
月均用水量在16.2t以下86%,
80%分位数一定位于[13.2,16.2)
由上节课的例题,估计月均用水量的样本数据的80%分位数.
假定区间[13.2, 16.2)上的数据是均匀分布的
23%
98%
94%
91%
86%
16.2
68%
55%
80%
????????.????+????×????.?????????????.????????????.?????????????.????????=????????.????
?
可以估计月均用水量的样本数据的80%分位数约为14.2.
77%
13.2
77%
86%
100%
1.2
4.2
10.2
16.2
13.2
7.2
19.2
22.2
25.2
28.2
解析:由频率分布直方图依次算出各小组的频率为:0.231,0.321,0.129、0.09、……
月均用水量在13.2t以下的居民所占比例为0.231+0.321+0.129+0.09=0.771
月均用水量在16.2t以下的居民所占比例为:0.771+0.09=0.861
所以,第80百分位数一定位于[13.2,16.2)
设第80百分位数为m,则0.771+(m-13.2)X0.030=0.80
解得m≈14.2
所以,可以估计月均用水量的样本数据的80%分位数约为14.2.
根据频率分布表或频率分布直方图求百分位数的步骤:
1. 计算各小组的累计频率
2.确定第p百分位数所在的小组区间
3.按比例算出不足频率部分对应的区间长度
4.计算得出第p百分位数
注:在频率分布直方图中,第p百分位数左侧的长方形面积之和=p %.
计算的关键:假定样本在区间内是均匀分布的.
04
课堂总结
课堂总结
2. 根据频率分布直方图就是样本数据的百分位数
1. 总体百分数的估计
THANKS
感谢观看