2021-2022学年高一下学期数学人教A版(2019)必修第二册9.2.2 总体百分位数的估计 课件(共23张PPT)

文档属性

名称 2021-2022学年高一下学期数学人教A版(2019)必修第二册9.2.2 总体百分位数的估计 课件(共23张PPT)
格式 pptx
文件大小 584.6KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-01-05 11:16:49

图片预览

文档简介

(共23张PPT)
9.2.2总体百分位数的估计
复习回顾,导入新课
问题:某市政府为了减少水资源的浪费,计划对居民生活用水实施阶梯水价制度,即确定一户居民月用水量标准用水量不超过的部分按平价收费,超出的部分按议价收费.如果希望80%的家庭能享受平价,如何确定?
就是要寻找一个数,使全市居民用户月用水量中不超过的占80%,大于的占20%.我们将通过样本数据对的值进行估计.
80%
20%
怎么去找这个位置参数?在以往的学习中遇到过类似问题吗?
问题1:根据上一节中某市 100 名居民的月均用水量数据,如果该市政府希望使 80% 居民用户生活用水费用支出不受影响,如何给市政府提出确定居民用户月均用水量标准的建议?
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
百分位数的引入
先将80%换成50%
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3
2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9
5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7
6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2
10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9
18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
因为50%100=50,所以中位数为第50和第51个数据的平均数
解:将100个数据按从小到大的顺序排列如下:
6.7
6.9
6.8.
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3
2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9
5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7
6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2
10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9
18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
因为80%100=80,
解:将100个数据按从小到大的顺序排列如下:
我们称13.7为这组数据的第80百分位数
13.6
13.8
在区间(13.6,13.8)内任意一个数都能把样本数据
分成符合要求的两部分,我们一般取这两个数的平均数13.7.
由于样本的取值规律与总体的取值规律之间会存在误差,而在决策问题中,只要临界值近似为第80百分位数即可,因此,为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者将年标准用水量定为168t.
误差主要来自于抽样的方法和样本的随机性.
请阅读课本202页例2上方的内容,回答以下问题:
(1)什么是第p百分位数?
(2)一组数据的中位数和第p百分位数有什么关系?
(3)你能说说求一组数据的第p百分位数的步骤吗?
(4)什么是四分位数?什么是下四分位数?什么是上四分位数?
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100- p) %的数据大于或等于这个值.
第p百分位数(或 p %分位数 )的定义
第50百分位数就是中位数,中位数是百分位数的特例.
p%
(100-p)%
第p百分位数
百分位数是刻画一组
样本数据百分位置的量.
百分位数定义的理解
为什么要求至少有p%的数据小于或等于这个值,且至少有(100- p) %的数据大于或等于这个值?
1
5
2
4
3
1
2
3
4
5
6


中位数为3,此时有60%(至少有50%)的数小于或等于3,且有60%(至少有50%)的数大于或等于3.
中位数为3.5,此时有50%(至少有50%)的数小于或等于3.5,且有50%(至少有50%)的数大于或等于3.5.
练习:求以下数据的第80百分位数: 1,2,3,4,5,6,7,8.
解:共8个数据,则80%8=6.4, 20%8=1.6,
所以第80百分位数为第7项数据,即为7.
实际上,此时有87.5%(至少有80%)的数小于或等于7,
且有25%(至少有20%)的数大于或等于7.
不存在那样的数,使得小于等于它的样本数恰好等于80%.
计算一组n个数据的第p百分位数的步骤
按照从小到大的顺序排列原始数据
大于i的比邻整数为j,则第p百分位数为第j项数据;
第p百分位数为第i项和第i+1项数据的平均数.
i不是整数
i是整数
计算
i=n×p%
课本上提供的是一种简单便于计算的方法.
实际上,不同的统计软件计算百分位数的方法不尽相同,常见的求百分位数的软件有: Excel、R软件、SPSS等统计软件.
(1)一组数据的第0百分位数对应哪个数?第100百分位数对应哪个数?
(2)一组数据的第p百分位数一定是这组数据中的数吗?为什么?
思考
(3)一组数据中的各百分位数一定互不相同吗?
例:1,2,3,4,5,6,7,8,9,10这组数据的第72百分位和第79百分位数都是8.
百分位数的特点
(1)第0百分位数是数据组中的最小数,第100百分位数是数据组中的最大数;
(2)一组数据的第p百分位数可能是这组数据中的数,也可能不是这组数据中的数;
(3)一组数据中的某些百分位数可能是同一个数.
四分位数
25%
第一四分位数
下四分位数
50%
75%
中位数
第三四分位数
上四分位数
另外,在后面的学习中,我们也常用到第1百分位数,第5百分位数,第95百分位数,第99百分位数.
例2、以下是树人中学高一年级抽取27名女生的样本数据:
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
请估计树人中学高一年级女生的第25,50,75百分位数.
由于女生的样本量比较小,所以这里对总体的估计可能会存在比较大的误差
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
解:把27名女生的样本数据按照由小到大排序(利用Excel排序):
由25%×27=6.75,
由50%×27=13.5,
由75%×27=20.25,
百分位数的计算方法的巩固训练
155.5
则第25百分位数(下四分位数)为第7项数据,即为155.5.
则第50百分位数为第14项数据,即为161.
则第75百分位数(上四分位数)为第21项数据,即为164.
161.0
164.0
在某些情况下,我们只能获得整理好的统计表或统计图,与原始数据相比,他们损失了一些信息.那么该如何根据样本的频率分布表或频率分布直方图估计总体的百分位数呢?
根据频率分布表或频率分布直方图估计百分位数
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2) 2 0.02
合计 100 1.00
累计频率
0.23
0.55
0.68
0.77
0.86
0.91
0.94
0.98
1.00
解:月均用水量在13.2t以下77%,
月均用水量在16.2t以下86%,
80%分位数一定位于[13.2,16.2)
表9. 2-1
例3:根据教材中表9. 2-1或图9.2-1.估计月均用水量的样本数据的80%分位数.
假定区间[13.2, 16.2)上的数据是均匀分布的
23%
98%
94%
91%
86%
16.2
68%
55%
80%
所以,可以估计月均用水量的样本数据的80%分位数约为14.2.
77%
13.2
77%
86%
100%
1.2
4.2
10.2
16.2
13.2
7.2
19.2
22.2
25.2
28.2
解析:由频率分布直方图依次算出各小组的频率为:0.231、0.321、0.129、0.09、0.09……
所以月均用水量在13.2t以下的居民所占比例为:0.231+0.321+0.129+0.09=0.771
月均用水量在16.2t以下的居民所占比例为:0.771+0.09=0.861
所以,第80百分位数一定位于[13.2,16.2)
设第80百分位数为m,则
0.771+(m-13.2)X0.030=0.80
解得m≈14.2
所以,可以估计月均用水量的样本数据的80%分位数约为14.2.
原始数据: 13.7
频率分布表: 14.2
频率分布直方图:14.2
根据频率分布表或频率分布直方图求百分位数的步骤
计算各小组的累计频率
确定第p百分位数所在的小组区间
按比例算出不足频率部分对应的区间长度
计算得出第p百分位数
特别地,在频率分布直方图中,第p百分位数左侧的长方形面积之和等于p %.
计算的关键:假定样本在区间内是均匀分布的.
小结:
中位数的定义
百分位数的定义
由原始数据求百分位数
类比、从特殊到一般的数学思想
数学建模
由样本数据的百分位数估计总体的百分位数
百分位数的计算步骤
中位数的计算步骤
由分组数据(频率分布表、
频率分布直方图)求百分位数
适用范围:确定定额、制定标准
课后思考
空气质量指数AQI是反映空气质量状况的指数,AQI指数越小,表明空气质量越好,图1是经整理后的武汉市2019年2月与2020年2月的空气质量指数频率分布直方图.估计武汉市2019年2月与2020年2月的空气重量指数的60%分位数.
感谢您的聆听
Thanks