9.2.3 总体集中趋势的估计(共16张ppt)

文档属性

名称 9.2.3 总体集中趋势的估计(共16张ppt)
格式 pptx
文件大小 4.7MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-04-22 16:02:04

图片预览

文档简介

(共16张PPT)
第九章 统计
9.2.3 总体集中趋势的估计
学习目标
1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数).
2.会求样本数据的众数、中位数、平均数.
3.理解集中趋势参数的统计含义.
数学学科素养
1.数学运算:求样本数据的众数、中位数、平均数;
2. 数据分析:频率分布直方图中的众数、中位数、平均数.
学习 重难点
能用样本估计总体的集中趋势参数,平均数,中位数,众数
探索新知
你还记得平均数、中位数、众数是什么吗?这些统计量刻画了数据的什么特点?
众 数:一组数据中出现次数最多的数
中位数:一组数据按大小顺序依次排序后,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数。
平均数:
这些统计量刻画了数据的“中心位置”,即数据的集中趋势。
问题
解析
探索新知
思考一
根据下表中100户居民的月均用水量,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数。
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
解:由已知得:样本平均即100户居民的月均用水量的平均数8.79t.
将样本数据按从小到大排序,得第50个数和第51个数分别为6.8和6.8则中位数为=6.8,即100户居民的月均用水量的中位数是6.8t。
因为数据是抽自全市居民的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79t,中位数约为6.8t。
探索新知
思考二
假设某个居民小区有2000户,你能估计该小区的月用水总量吗?
根据上述思考可得:全市居民用户的月均用水量约为8.79t,则2000户居民的月用水总量为:
2000×8.79=17580t
小明用统计软件计算了100户居民用水量的平均数和中位数。但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数。
通过计算发现,平均数由原来的8.79t变为9.483t,中位数没有变化,还是6.8t。
思考三
探索新知
思考四
与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?
平均数变化较大。
这是因为样本平均数与每一个样本数据有关,样本中的任何一个数的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变。
因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感。
探索新知
思考五
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关。在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
如果直方图的形状是对称的,那么平均数和中位数大体上差不多
如果直方图在右边“拖尾”,那么平均数大于中位数;
如果直方图在左边“拖尾”,那么平均数小于中位数。
单峰
平均数总是在“长尾巴”那边。
例一
某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格。根据统计,高一年级女生需要不同规格校服的频数如下表所示:
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论上表数据估计全国高一年级女生校服规格的合理性。
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据。
可以发现,选择校服规格为“165”的女生频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适。
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理。
平均数 中位数 众数
在频率分布直方图中的含义
特点
探索新知
思考六
从上述思考题和例题中,你能总结出平均数、中位数、众数各自的特点吗?
每个小矩形面积乘以小矩形底边中点的横坐标之和
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
最高矩形的中点的横坐标
与每一个数据有关,任何一个数的改变都会引起它的改变
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
只利用了出现次数最多的那个值的信息
思考七
根据平均数、中位数、众数各自的特点,我们应如何选择适合的统计量来表示数据的集中趋势?
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数。
描述集中趋势统计量的选择
样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据。例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图。这时该如何估计样本的平均数、中位数和众数?你能以下面的频率分布直方图提供的信息为例,给出估计方法吗?
探索新知
思考八
例二
根据下面的频率分布直方图,估计月均用水量样本数据的平均数、中位数和众数
因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替。即每一组的平均数为该组小矩形底边中点横坐标。
根据中位数的意义可得,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。
由上图可得平均数为:
+....+=8.96
由于0.077×3=0.231,(0.077+0.107)×3=0.552
因此中位数落在区间[4.2,7.2)内。
设中位数为x,由0.077×3+0.107×(x-4.2)=0.5,得到x≈6.71因此,中位数约为6.71。
根据众数定义得,出现次数最多数据是众数。
如上图所示,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值。
VS
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
探索新知
思考九
根据上述计算出的样本平均数、中位数和众数,你有什么结论?
100户居民的月均用水量的平均数8.79t.
100户居民的月均用水量的中位数是6.8t。
100户居民的月均用水量的平均数8.96t.
100户居民的月均用水量的中位数是6.71t。
结果基本一致
这句话是真实的,但它可能描述的是差异巨大的实际情况。例如,可能这个公司的工资水平普遍较高,也就是员工收入的中位数、众数与平均数差不多;
也可能是绝大多数员工的年收入较低,而少数员工的年收入很高;在这种情况下,年收入的平均数就比中位数大得多。
尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为了招揽员工,却用了平均数。
所以,我们要强调”用数据说话”,但同时又要防止被误导。
探索新知
思考十
假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元“。你如何理解这句话?
你能总结用样本的众数、中位数和平均数来估计总体的数字特征各自的优缺点吗?
受极端数据的影响较大.
代表了样本数据更多的信息.
只能表达样本数据中的少量信息.
容易计算,不受少数几个极端值的影响.
平均数
众数和
中位数
缺点
优点
探索新知
在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收人水平很高”“去年,在50名员工中,最高年收入达到了200万,员工年收人的平均数是10万”,而你的预期是获得9万元年薪.
(1)你是否能够判断年薪为9万元的员工在这家公司算高收入者
(2)如果招聘员继续告诉你,“员工年收入的变化范围是从3万到200万”,这个信息是否足以使你作出自己是否受聘的决定 为什么
(3)如果招聘员继续给你提供了如下信息,员工收入的第一四分位数为4.5万,第三四分位数为9.5万,你又该如何使用这条信息来作出是否受聘的决定
(4)根据(3)中招聘员提供的信息,你能估计出这家公司员工收入的中位数是多少吗 为什么平均数比估计出的中位数高很多
课堂检测(215页练习9)
1、样本的数字特征:众数、中位数和平均数;
2、用样本频率分布直方图估计样本的众数、中位数、平均数。
(1)众数规定为频率分布直方图中最高矩形下端的中点;
(2)中位数两边的直方图的面积相等;
(3)频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数。
课堂小结