(共16张PPT)
人教A版高中数学必修第二册
9.2
用样本估计总体
9.2.2
总体百分位数的估计
第一步:
求极差
(一组数据中的最大值与最小值的差).
第二步:
决定组距与组数:
组距:指每个小组的两个端点的距离;
组数:k=极差÷组距,若k为整数,则组数=k,否则,组数=[k]+1.
将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
温故知新
第四步:列频率分布表.
计算各小组的频率,作出下面的频率分布表.
第三步:确定分点,将数据分组.
各组均为左闭右开区间,最后一组是闭区间
画频率分布直方图的步骤
温故知新
第五步:画出频率分布直方图
小长方形的面积=组距
×
=频率。
频率
组距
提出问题
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断.
接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.
提出问题
问题2
如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.
2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,
大于a的占20%.
下面我们通过样本数据对
a
的值进行估计.
解决问题
称此数13.7为这组数据的第80百分位数或80%分位数
解:
(1)把100个样本数据按从小到大排序
1.3
1.3
2.0
2.0···13.3
13.6
13.8
13.8
···
28.0
(2)得到第80和第81个数据分别是13.6和13.8
(3)我们取这两个数的平均数
可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
解决问题
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.
由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策何題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14
t,或者把年用水量标准定为168
t
引入新知
一般地,一组数据的第
p
百分位数是这样一个值,
它使得这组数据中至少
有
p%
的数据小于
或等于这个值,且至少有
(100-p)%的数据大于或等于这个值.
百分位数定义:
备注:
求百分位数时,一定要将数据按照从小到大的顺序排列.
引入新知
可以通过下面的步骤计算一组
n
个数据的第p百分位数:
第1步,按从小到大排列原始数据;
第2步,计算
i
=n×P%;
第3步,
①若
i
不是整数,而大于
i
的比邻整数为
j
,
则第p百分位数为第
j
项数据;
②若
i
是整数,则第p百分位数为第
i
项与第
(i
+1)
项数据的平均数.
引入新知
我们在初中学过的中位数,相当于是第50百分位数.
在实际应用中,除了中位数外,
常用的分位数还有第25百分位数,第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,
第75百分位数也称为第三四分位数或上四分位数等.
另外,像第1百分位数,
第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
课堂典例
例2.根据9.1.2节问题3中27名女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
解:
把27名女生的样本数据按从小到大排序,可得
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1.00
例3、根据下表估计月均用水量的样本数据的80%和95%分位数.
解:
由频率分布表可知,月均用水量在13.2t以下的居民用户所占比例为
在16.2t以下的居民用户所占比例为
因此,80%分位数一定位于[13.2,16.2)内。由
可以估计月均用水量的样本数据的80%分位数约为14.2
课堂典例
课堂典例
类似地,由
可以估计月均用水量的样本数据的95%分位数约为22.95
例3、根据下图估计月均用水量的样本数据的80%和95%分位数.
先算各组的频率,
解题步骤如上
课堂典例
课堂小结
计算一组
n
个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据;
第2步,计算
i
=n×P%;
第3步,
①若
i
不是整数,而大于
i
的比邻整数为
j
,
则第p百分位数为第
j
项数据;
②若
i
是整数,则第p百分位数为第
i
项与第
(i
+1)
项数据的平均数.