9.2.2 总体百分位数的估计
§9.2 用样本估计总体
第九章
复习回顾
2
整理数据
3
分析数据
4
提取信息
1
获取数据
统计问题
分布规律
简单随机抽样
数据的分布规律
表格:
5
解决问题
图形:
分层抽样
频率分布表
频率分布直方图
用样本估计总体
条形图
扇形图
折线图
情景导入
上节课我们用频率分布表,频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断. 接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.
问题2 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9. 2.1节问题1中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准 a 的建议吗?
新课讲解
问题2:市政府要定的居民用户月均用水量标准a,就是使全市居民用户月均用水量中不超过a的占80%, 大于a的占20%.
下面我们通过样本数据对 a 的值进行估计.
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8. 可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
一般地,我们取这两个数的平均数13.6与13.8的平均值13.7, 并称此数为这组数据的第80百分位数或80%分位数.
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右. 由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策何題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14 t,或者把年用水量标准定为168 t
一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有P%的数据小于或等于这个值,且至少有(100-P)%的数据大于或等于这个值.
分位数的定义
一组 n 个数据的第P百分位数计算步骤:
第1步,按从小到大排列原始数据;
第2步,计算 i =n×P%;
第3步, ①若 i 不是整数,而大于 i 的比邻整数为 j ,
则第P百分位数为第 j 项数据;
②若 i 是整数,则第P百分位数为第 i 项与
第 (i +1) 项数据的平均数.
我们在初中学过的中位数,相当于是第50百分位数. 在实际应用中,除了中位数外, 常用的分位数还有第25百分位数,第75百分位数. 这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
另外,像第1百分位数, 第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
题型一:
题型一:
据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.
阅读课本P.202 / 例2
题型一:
例2 已知某市2015年全年空气质量等级如表所示.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}空气质量等级 (空气质量指数(AQI) )
频数
频率
优 ( AQI ≤ 50 )
83
22.8%
良 ( 50
121
33.2%
轻度污染 (10068
18.6%
中度污染 (15049
13.4%
重度污染 (20030
8.2%
严重污染(AQI >300 )
14
3.8%
合计
365
100%
2016年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60 191 62 55 58 56 53
89 90 125 124 103 81 89 44 34 53 79 81 62 116 88
课本P.198 / 例1
6月 63 92 110 122 102 116 81 163 158 76 33 102 65 53 38
55 52 76 99 127 120 80 108 33 35 73 82 90 146 95
选择合适的统计图描述数据,并回答下列问题:
(1) 分析该市2016年6月的空气质量情况.
(2) 比较该市2016年5月和6月的空气质量,哪个月的空
气质量较好?
(3) 比较该市2016年6月与该市2015年全年的空气质量,
2016年6月的空气质量是否好于去年?
(4) 求该市2015年全年空气质量的第80百分位数.
解:(1)根据该市2016年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表.
从表中可以看出,“优” “良”的天数达19天,占了整月的63.33%,没有出现“重度污染"和,严重污染”.
我们还可以用条形图、扇形图和折线图对数据作出直观的描述.
从条形图中可以看出:在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少.
我们还可以用条形图、扇形图和折线图对数据作出直观的描述.
从扇形图中可以看出:空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优” “良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.
我们还可以用条形图、扇形图和折线图对数据作出直观的描述.
从折线图容易发现:6月份的空气质量指数在100附近波动.
选择合适的统计图描述数据,并回答下列问题:
(1) 分析该市2016年6月的空气质量情况.
(2) 比较该市2016年5月和6月的空气质量,哪个月的空
气质量较好?
(3) 比较该市2016年6月与该市2015年全年的空气质量,
2016年6月的空气质量是否好于去年?
(4) 求该市2015年全年空气质量的第80百分位数.
解:(2)根据2016年5月的空气质量指数和空气质量等级分级标准,可以画出该市5月的不同空气质量等级的频数与频率分布表.
为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(如图).
由图可以发现:5月空气质量为“优”和“良”的总天数比6月多. 所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.
选择合适的统计图描述数据,并回答下列问题:
(1) 分析该市2016年6月的空气质量情况.
(2) 比较该市2016年5月和6月的空气质量,哪个月的空
气质量较好?
(3) 比较该市2016年6月与该市2015年全年的空气质量,
2016年6月的空气质量是否好于去年?
(4) 求该市2015年全年空气质量的第80百分位数.
解:(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较.
通过图可以看出,虽然2016年6月的空气质量为"优”的频率略低于2015年,但“良”的频率明显高于2015年,而且2016年6月中度以上的污染天气频率明显小于2015年. 所以从整体上看,2016年6月的空气质量要好于2015年全年的空气质量.
思考:这与例1有何不同?
回答:(4) 求该市2015年全年空气质量的第80百分位数.
分析:从这张表可以看出:第80百分位数落在中度污染 (150例2 已知某市2015年全年空气质量等级如表所示.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}空气质量等级 (空气质量指数(AQI) )
频数
频率
优 ( AQI ≤ 50 )
83
22.8%
良 ( 50121
33.2%
轻度污染 (10068
18.6%
中度污染 (15049
13.4%
重度污染 (20030
8.2%
严重污染(AQI >300 )
14
3.8%
合计
365
100%
此时,我们通常把它们看成均匀地分布在此区间上.
回答:(4) 求该市2015年全年空气质量的第80百分位数.
解:(4)从这张表可以看出:前三项频率之和为74.6%,而第四项占比13.4%,所以第80百分位数落在中度污染 (150例2 已知某市2015年全年空气质量等级如表所示.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}空气质量等级 (空气质量指数(AQI) )
频数
频率
优 ( AQI ≤ 50 )
83
22.8%
良 ( 50121
33.2%
轻度污染 (10068
18.6%
中度污染 (15049
13.4%
重度污染 (20030
8.2%
严重污染(AQI >300 )
14
3.8%
合计
365
100%
回答:(4) 求该市2015年全年空气质量的第80百分位数.
150+50×
例2 已知某市2015年全年空气质量等级如表所示.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}空气质量等级 (空气质量指数(AQI) )
频数
频率
优 ( AQI ≤ 50 )
83
22.8%
良 ( 50121
33.2%
轻度污染 (10068
18.6%
中度污染 (15049
13.4%
重度污染 (20030
8.2%
严重污染(AQI >300 )
14
3.8%
合计
365
100%
80%-74.6%
13.4%
≈150+20.15=170.15
可以估计2015年空气质量的样本数据的80%分位数约为171.
阅读课本P.202 / 例3
课堂小结
1. 课本P.200 【练习】1、2(选做)
3. 课本P.214 【习题9.1】1(2)
4. 课时跟踪检测 (三十七)(做标有高亮的题)
5. 预习课本P.203 ~P.209
今天只做 A级/5、6、8、10
B级/5、6
C级/(2)、(3)
2. 课本P.203 【练习】1、2、3
课后作业
“夯基提能·落实素养”见“课时跟踪检测(三十七)”
(单击进入电子文档)