(共21张PPT)
09人教A版
必修二
7.1复数的概念
9.2
用样本估计总体
9.
2.
2
总体百分位数的估计
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了
“大部分居民用户的月均用水量集中在一个较低值区域”
等推断接下来的问题是,如何利用这些信息,
为政府决策服务呢?下面我们对此进行讨论.
问题
2
如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据
9.
2.1节中
100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.下面我们通过样本数据对a的值进行估计.
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.
7左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14
t,
或者把年用水量标准定为168
t.
你认为14
t这个标准一定能保证80%的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?
可以通过下面的步骤计算一组n个数据的第p百分位数:
第
1步,按从小到大排列原始数据.
我们在初中学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.另外,像第1百分位数,第5百分位数,第95百分位数和第
99百分位数在统计中也经常被使用.
例2
根据9.1.
2节问题3中女生的样本数据,估计树人中学高一年级女生的第25,
50,
75百分位数.
解:把
27
名女生的样本数据按从小到大排序,可得
148.0
149.0
154.0
154.0
155.0
155.0
155.5
157.0
157.0
158.0
158.0
159.0
161.0
161.0
162.0
162.5
162.5
163.0
163.0
164.0
164.0
164.0
165.0
170.0
171.0
171.0
172.0
由于女性的样本量比较小,所以这里对总体的估计可能会存在比较大的误差.
例3
根据表
9.2-1
或图
9.2-1,
估计月均用水量的样本数据的80%和95%分位数.
分析:在某些情况下,我们只能获得整理好的统计表或统计图,与原始数据相比,它们损失了一些信息.例如由表
9.2-1,
我们知道在[16.2,
19,2)内有5个数据,但不知这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
1.
在居民用户月均用水量标准制定的问题中,根据教科书中的调查数据,如果要让60%的居民不超出标准,居民用户月均用水星标准定为多少合适?
解:把样本数据从小到大排序,可得
1.3
1.3
1.8
2
2
2
2
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3
3.2
3.2
3.6
3.6
3.7
3.8
4
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6
6
6.4
6.4
6.8
6.8
7
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
8.1
8.6
8.8
9
9.5
9.9
10
10.1
10.2
10.2
10.5
10.8
11.1
11.2
12
12
12.4
13.3
13.6
13.6
13.8
13.8
14
14.9
15.7
16
16.7
16.8
17
17.9
18.3
19.4
20.5
21.6
22.2
22.4
24.3
24.5
25.6
28
2.
根据
9.1.2节问题3中男生的样本数据,请你估计树人中学高一年级男生的第25,
50,75
百分位数.如果要减少估计的误差,你觉得应该怎么做?
解:把23名男生的样本数据按从小到大排列,排序结果如下:
164.0
165.0
165.0
166.0
167.0
168.0
168.0
168.0
170.0
170.0
170.0
172.0
172.0
172.0
173.0
173.0
173.0
173.0
174.0
175.0
175.0
175.0
176.0
如果要减少估计的误差,
应增加男生的样本量.
3.分别根据图
9.2-2(1)(2)中的数据,估计这组数据的月均用水量的第80和95百分位数.与根据图9.2-1估计的结果比较,它们一样吗?你认为根据哪个图得到的估计更好?为什么?
在三个直方图中,图
9.2-2(2)分组最多,样本数据的信息损失最少,因此根据此直方图估计这组数据的百分位数更好.