2021-2022学年人教A版必修二高一数学课件★★ 总体百分位数的估计 总体集中趋势的估计(共33张PPT)

文档属性

名称 2021-2022学年人教A版必修二高一数学课件★★ 总体百分位数的估计 总体集中趋势的估计(共33张PPT)
格式 pptx
文件大小 2.4MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-05-12 11:24:25

图片预览

文档简介

(共33张PPT)
第9章 统计
2021-2022学年人教A版必修二高一数学课件★★
9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
1
知识回顾
1.画频率分布直方图的步骤
求极差
决定组距和组数
将数据分组
列频率分布表
画频率分布直方图
1
知识回顾
2.频率分布直方图的性质
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.
这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)=样本量.
(4)在频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比.
2
百分位数
问题:某市政府为了减少水资源的浪费,计划对居民生活用水实施阶梯水价制度,即确定一户居民月用水量标准用水量不超过的部分按平价收费,超出的部分按议价收费.如果希望80%的家庭能享受平价,如何确定?
就是要寻找一个数,使全市居民用户月用水量中不超过的占80%,大于的占20%.我们将通过样本数据对的值进行估计.
80%
20%
怎么去找这个位置参数?在以往的学习中遇到过类似问题吗?
2
百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
第一步
第二步
第三步
计算一组n个数据的第p百分位数步骤:
按从小到大排列原始数据
计算i=n×p%.
若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第项与第(i+1)项数据的平均数.
定百分位数的定义
2
百分位数
百分位数定义的理解
为什么要求至少有p%的数据小于或等于这个值,且至少有(100- p) %的数据大于或等于这个值?
1
5
2
4
3
1
2
3
4
5
6


中位数为3,此时有60%(至少有50%)的数小于或等于3,且有60%(至少有50%)的数大于或等于3.
中位数为3.5,此时有50%(至少有50%)的数小于或等于3.5,且有50%(至少有50%)的数大于或等于3.5.
2
百分位数
四分位数的理解
25%
第一四分位数或下四分位数
50%
75%
中位数
第三四分位数或上四分位数
我们在初中学过的中位数,相当于是第50百分位数。
在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数。这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等。
另外,像第1百分位数,第5百分位数,第95百分位数,和第99百分位数在统计中也经常被使用。
2
百分位数
题型一:百分位数的计算
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
例1、根据下面女生的身高的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由25%×27=6.75, 50%×27=13.5, 75%×27=20.25,
可知样本数据的第25,50,75百分位数为第7, 14,21项数据,分别为155.5,161,164.
据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
2
百分位数
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0
167.0 170.0 175.0
变式训练:估计下表中树人中学高一年级男生的25,50,75百分位数,如果要减少估计的误差,你觉得应该怎么做?
解析:(1)把23名男生的样本数据按从小到大排序,可得164 165 165 166 167 168 168 168 170 170 170 172 172 172 173 173 173 173 174 175 175 175 176
因为23×25%=5.75,所以第25百分位数为第6项数据168;
因为23×50%=11.5,所以第50百分位数为第12项数据172
因为23×75%=17.25,所以第75百分位数为第18项数据173
(2)扩大抽取样本量.
2
百分位数
例1、根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.
分析:统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
题型二:对总体百分位数的估计
解:由表可知,月均用水量在13.2t以下的居民用户所占比例为23%+32%+13%+9%=77%.
在16.2t以下的居民用户所占的比例为77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2)内.
由13.2+3× =14.2,
可以估计月均用水量的样本数据的80%分位数约为14.2.
类似地,由22.2+3×=22.95,
可以估计月均用水量的样本数据的95%分位数约为22.95.
2
百分位数
2
百分位数




1、已知数据按从小大大的顺序排列为25,28,28,29,30,31,32,则这组数据的75百分位数为( )
A.28
B.29
C.31
D.32
2
百分位数
2、在居民用户月均用水量标准制定的问题中,根据教科书中的调查数据,如果要让60%的居民不超出标准,居民用户月均用水量标准定为多少合适
解:将100户居民的月均用水量按小到大的顺序排列如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
由于100×60%=60.
∴第60百分位数为第60个和第61个数据的平均数,即
因此居民用户月均用水量标准应定为8.0合适.
3
总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势. 那你是否还记得平均数、中位数、众数是什么吗?这些统计量刻画了数据的什么特点?
众数:一组数据中出现次数最多的数.
中位数:一组数据按大小顺序依次排序后,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数.
平均数:
3
总体集中趋势的估计
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
例4 利用9.2.1节中100户居民用户的月均用水量的调查数据, 计算样本数据的平均数和中位数, 并据此估计全市居民用户月均用水量的平均数和中位数.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
解:① 根据已知100户居民用户月均用水量的数据,可得样本平均数为
即100户居民的月均用水量的平均数为8. 79 t.
3
总体集中趋势的估计
解:
由上述数据可得,第50个数和第51个数均为6.8,由中位数的定义,可得100户居民的月均用水量的中位数是6.8 t.
②将样本数据按从小到大排序,结果如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79 t,其中位数约为6.8 t,众数是2.0和5.5t.
由众数的定义,可得100户居民的月均用水量的众数是2.0和5.5 t.
3
总体集中趋势的估计
探究1 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关. 在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说, 对一个单峰的频率分布直方图来说, 如果直方图的形状是对称的(如图(1)), 那么平均数和中位数大体上差不多;
如果直方图在右边“拖尾”(如图(2)),那么平均数大于中位数;
如果直方图在左边“拖尾”(如图(3)),那么平均数小于中位数.
也就是说,平均数总是在“长尾巴”那边.
3
总体集中趋势的估计
加权平均数与频率平均数
一般地,如果在n个数中, 出现的频数为, 出现的频数为,…, 出现的频数为(其中),那么
叫做这个数的频数平均数,也称为加权平均数.
一般地,若数据的频率分别,则这个n个数的频率平均数的计算公式为
加权平均数
频率平均数
3
总体集中趋势的估计
探究2 样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据. 例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图. 这时该如何估计样本的平均数、中位数和众数?你能以下面的频率分布直方图提供的信息为例,给出估计方法吗?
思考1 根据频率分布直方图如何计算样本平均数?
3
总体集中趋势的估计
1. 根据频率分布直方图计算样本平均数:
因为样本平均数可以表示为数据与它的频率的乘积之和.
所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
所以由上图可得样本平均数为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
3
总体集中趋势的估计
由于0.077×3=0.231,(0.077+0.107)×3=0.552,
因此中位数落在区间[4.2, 7.2)内.
设中位数为x,由0.077×3+0.107×(x-4.2)=0.5,解得x≈6.71.
因此,中位数约为6.71.
2. 根据频率分布直方图计算样本中位数:
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数. 因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
这个结果与根据原始数据计算的样本中位数6.8相差不大.
3
总体集中趋势的估计
3. 根据频率分布直方图计算样本众数:
根据众数定义得,在样本数据中出现次数最多数据就是众数. 因此在频率分布直方图中,我们常常把最高直方图底边的中点作为众数的估计值.
在此频率分布直方图中,月均用水量在区间[4.2, 7.2)内的居民最多,所以将这个区间的中点5.7作为众数的估计值.
3
总体集中趋势的估计
平均数、中位数、众数各自的含义、特点及优缺点:
平均数 中位数 众数
在频率分布直方图中的含义
特点
优点
缺点
每个小矩形面积乘以小矩形底边中点的横坐标之和
与每一个数据有关,任何一个数的改变都会引起它的改变
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
最高矩形底边中点的横坐标
只利用了出现次数最多的那个值的信息
受极端数据的影响较大.
代表了样本数据更多的信息.
只能表达样本数据中的少量信息.
容易计算,不受少数几个极端值的影响.
3
总体集中趋势的估计
3
总体集中趋势的估计
3
总体集中趋势的估计
3
总体集中趋势的估计
3
总体集中趋势的估计
3
总体集中趋势的估计
[训练]
1.一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为(  )
A.14,14 B.12,14
C.14,15.5 D.12,15.5
解析 把这组数据按从小到大排列为:10,12,12,14,14,14,17,18,19,23,27,则可知其众数为14,中位数为14.
答案 A
3
总体集中趋势的估计
2. 某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示 :
甲:20,22,27,8,12,13,37,25,24,26
乙:14,9,13,18,19,20,23,21,21,11
则下面结论中正确的是________(填序号).
①甲的极差是29;②乙的众数是21;③甲的平均数为21.4;④甲的中位数是24.
3
总体集中趋势的估计
解析 把两组数据按从小到大的顺序排列,得
甲:8,12,13,20,22,24,25,26,27,37
乙:9,11,13,14,18,19,20,21,21,23
答案 ①②③
3
总体集中趋势的估计
3 、 从高三年级抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.
试利用频率分布直方图估计:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
3
总体集中趋势的估计
频率分布直方图中,从左到右前3个和前4个矩形的面积和分别是(0.004+0.006+0.02)×10=0.3<0.5,(0.004+0.006+0.02+0.03)×10=0.6>0.5,设中位数是m,则70<m<80,则0.3+(m-70)×0.03=0.5,解得m≈76.7(分),即这50名学生成绩的中位数约是76.7分.
即这50名学生的平均成绩约是76.2分.