9.2.3总体集中趋势的估计课件-2020-2021学年高一下学期数学人教A版(2019)必修第二册第九章(24张PPT)

文档属性

名称 9.2.3总体集中趋势的估计课件-2020-2021学年高一下学期数学人教A版(2019)必修第二册第九章(24张PPT)
格式 pptx
文件大小 428.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-26 12:35:47

图片预览

文档简介

9.2.3 总体集中趋势的估计
本课主要学习用样本的数字特征估计总体的数字特征的相关内容,具体包括频率分布直方图中众数、中位数、平均数的求法。
本课开始简单回顾了初中学习的众数、中位数及平均数的概念,并通过一个简单的题目回顾了三数的算法。接着提问“如何从频率分布直方图中求出三数”作为课前导入,以教材月平均用水量的频率分布直方图为案例,让学生想办法解决。这里便分为三个部分分别介绍如何从频率分布直方图中求出三数,并分别分析所得数据偏差的原因。

1. 能利用频率分布直方图估计总体的众数、中位数、平均数。
2.能用样本的众数、中位数、平均数估计总体的众数、中位数、
平均数,并结合实际,对问题作出合理判断,制定解决问题
的有效方法。
回顾初中所学三数概念:
1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数.
2、中位数: 将一组数据按大小依次排列,把处在最中
间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.
3、平均数:一组数据的总和除以数据的个数所得的值.
平均数、中位数、众数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
例 由于城市居民比较多,因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.下面是通过抽样得到的100户居民的月均用水量数据(单位:t)
9.0 13 .6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6
13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8
6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8
5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0
3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0
16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3
13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9
10.1 5.5 4.6 3.2 21.6
计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
解:由样本平均数的定义,可得
即100户居民的月均用水量的平均数为8.79t.
由中位数的定义,可得
即100户居民的月均用水量的中位数为6.6t.
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民的月均用水量约为8.79t,其中位数约为6.6t.
思考:小明用统计软件计算了100 户居民月用水量的平均数和中位数,但录入数据时把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较.哪个量的值变化更大?你能解释其中的原因吗?
计算发现:平均数由8.79t变为9.483t,中位数没有变化.
样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,所以不是任何一个样本数据的改变都会引起中位数的改变.
思考:平均数估计总体情况有什么优缺点?
平均数与每一个样本的数据有关,与中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大(更加敏感),使平均数在估计时可靠性降低。
想一想:
某次数学期中考试,毛毛同学得了78分。全班共30人,其他同学的成绩为1个100分, 4个90分, 22个80分, 以及一个2分和一个10分。毛毛计算出全班的平均分为77分,所以毛毛回家告诉妈妈说,他这次成绩处于班级“中上水平”。这种说法对吗?
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在上图的三种分布形态中,平均数和中位数的大小存在什么关系?
如果直方图是单峰的,它的形状对称,两个量应该大体上差不多;如果直方图在右边“拖尾”,则平均数大于中位数;若直方图在左边“拖尾”,则中位数大于平均数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
例2 某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如下表所示.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
如果用一个量来代表该校高一年级所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.
解:为了更直观地观察数据特征,我们用条形图来表示表中的数据.可以发现,选则校服规格为“165”的女生频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少的一部分,对极端值也不敏感.
众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
探究:如何根据下图估计样本的平均数、中位数和众数?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.
样本平均数可以表示为数据与它的频率的乘积之和.
思考:每个小组的平均数如何估计?
每个小组的平均数可以用每个小矩形底边中点的横坐标近似代替.
思考:在频率分布直方图中,样本平均数如何估计?
样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
于是
这个结果与根据原始数据计算的样本平均数8.79相差不大.
思考:中位数又该如何计算呢?
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
思考:中位数左边和右边的直方图的面积有何关系?
相等

思考:中位数落在那个区间内?
思考:怎么计算?
设中位数是 ,由
所以,中位数约为6.71,这个结果与根据原始数据求得的中位数6.6相差不大.
6.71
8.96
从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。
思考:中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?
考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。
对极端值不敏感有利的例子:
思考:6.71这个中位数的估计值,与样本数据的中位数6.6不同,为什么?
特征:唯一确定的一个数。不受极端值的影响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误信息时,应该用抗极端性很强的中位数表示数据的中心值。
思考:众数如何估计?
在频率分布直方图中,月均用水量在区间 内的居民最多,可以将这个区间的中点5.7作为众数的估计值.
众数常用在描述分类型数据中,众数5.7让我们知道月均用水量在区间 的居民用户最多.
5.7
思考:
“用数据说话”,这是我们经常听到的一句话。但是,数据有时也会被利用,从而产生误导。例如,一个企业中,绝大多数人是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入过到几十万元.这时年收入的平均数比中位数大得多.尽管这时的中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇的指问.
你认为“我们单位的平均收入水平比别的单位高”这句话应当怎么解释?
我认为这句话是这样解释的:这个企业的老板以员工平均工资收入水平去描述他们单位的收入情况。我觉得这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,所以平均数不能反映该单位员工的收入水平.中位数或众数比用平均数更合理些.这个老板的话有误导与蒙骗行为.
我们强调“用数据说话”,但同时又要防止被数据误导,这就需要掌握更多的统计知识和方法.
三种数字特征的优缺点
特征数
优 点
缺 点
众数
体现了样本数据的最大集中点
无法客观反映总体特征
中位数
不受少数极端值的影响
不受少数极端值的影响有时也是缺点
平均数
与每一个数据有关,更能反映全体的信息.
受少数极端值的影响较大,使其在估计总体时的可靠性降低.
归纳小结
由样本频率分布直方图,分别估计总体的众数、中位数和平均数的方法:
(1)众数:最高矩形下端中点的横坐标.
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.