(共29张PPT)
第九章
9.2.3 总体集中趋势的估计
人教A版(2019)
教学目标
学习目标 数学素养
1.理解一组数据的平均数、中位数、众数的概念,会求平均数、中位数、众数. 1.数据分析素养.
2.能利用频率分布直方图估计总体的众数、中位数、平均数. 2.数据分析素养和运算素养.
知新引入
1.平均数
对于一组数据x1,x2,…,xn,那么叫做它们的平均数.
记作.
加权平均数
一般地,如果在n个数中, 出现的频数为, 出现的频数为,…, 出现的频数为(其中),那么
叫做 这个数的频数平均数,也称为加权平均数.
频率平均数
一般地,若数据的频率分别,则这个n个数的频率平均数的计算公式为
知新引入
2.中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.
3.众数
一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.
知新引入
对三种数字特征的深层理解
①一组数据的平均数、中位数都是唯一的.
②众数可能不唯一,可以有一个或多个.如果有两个数据出现的次数相同,并且比其它数据出现的次数都多,那么这两个数据都是这组数据的众数.
③众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
④实际问题中,求平均数要比求中位数和众数难,而求得的平均数、中位数和众数都应带上单位.
知新引入
为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县小麦的收成情况.我们可能更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能更关注身高的平均数或中位数,而不是身高的分布;等等.
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
知新探究
【例1】根据9.2.1节利用100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
知新探究
根据100户居民用户月均用水量的数据,由样本平均数的定义,可得
解:
=8.79
即100户居民的月均用水量的平均数为8.79t.
将样本数据从小到大排序,第50个数和第51个数均为6.8,由中位数的定义,可得100户居民用户月均用水量的中位数是6.8t.
因为数据是抽自全市居民户的简单随机样本,据此估计全市居民的月均用水量约为8.79t,其中位数约为6.8t.
假设某个居民小区有2000户,你能估计该小区的月用水总量吗
知新探究
小明用统计软件计算了100户居民月用水量的平均数和中位数,但录入数据时,不小心把一个数据7.7录成了77. 请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较. 哪个的值变化更大?你能解释其中原因吗?
通过简单计算可以发现,平均数由8.79t变为9.481t,中位数没有变化,还是6.8t.
这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;中位数只利用了样本数据中间位置的一个或两个值,所以不是任何一个样本数据的改变都会引起中位数的改变.
因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
知新探究
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对于一个单峰的频率分布直方图,如果直方图的形状是对称的(如图⑴),那么平均数和中位数应该大体上差不多;
如果直方图在左边“拖尾”(如图⑶),那么平均数小于中位数;
如果直方图在右边“拖尾”(如图⑵),那么平均数大于中位数;
也就是说,和中位数相比,平均数总是在“长尾巴”那边.
知新探究
如果一组数据的平均数和中位数相差较大,那么可以推断这组数据一定是不对称的.
如果样本平均数大于样本中位数,说明数据中存在较大的极端值;反之,说明数据中不存在较大的极端值.
知新探究
【例2】某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如下表所示
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
分析:虽然校服规格是用数字表示的,但它们事实上是不同类别.对于这样的分类数据,用众数作为这组数据的代表比较合适.
知新探究
解:
为了更直观地观察数据,我们用条形图来表示表中的数据(如图).
可以发现,选择校服规格为“165”的女生的频数最高,
所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
知新探究
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
知新探究
样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估
计,但在某些情况下我们无法获知原始的样本数据.例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图.这时该如何估计样本的 平均数、中位数和众数?你能以下图中频率分布直方图提供的信息为例,给出估计方法吗?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.这样就可以获得样本的平均数、中位数和众数,进而估计总体的平均数、中位数和众数.
知新探究
因为样本平均数可以表示为数据与它的频率的乘积之和.所以样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
如下图所示,可以测出每个小矩形的高度,于是平均数的近似值为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
知新探究
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
由于0.077×3=0.231,(0.077+0.107)×3=0.552,
因此中位数落在区间[4.2,7.2)内.
设中位数是x,由
解得x≈6.71.
这个结果与根据原始数据求得的中位数6.8相差不大.
因此,中位数约为6.71.
知新探究
在频率分布直方图中,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.
即
如图,众数常用在描述分类型数据中,在实际问题中,众数“5.7”让我们知道月均用水量在区间[4.2,7.2)的居民用户最多.
知新探究
由频率分布直方图估计总体的集中趋势
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
中位数:中位数左边的直方图面积和右边的直方图面积相等.
众数:最高矩形的中点.
名称 优点 缺点
平均数
中位数
众 数
三种数值特征的优缺点
①体现了样本数据的最大集中点
②容易得到
①只能表达样本数据中较少的信息
②无法客观地反映总体特征
①不受少数几个极端数据,即排序
靠前或靠后的几个数据的影响
②容易得到,便于利用其中的信息
对极端值不敏感
能反映出更多关于样本数据全体的信息
任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大
知新探究
以上我们讨论了平均数、中位数和众数等特征量在刻画一组数据的集中趋势的各自特点,并研究了用样本特征量估计总体特征量的方法.需要注意的是,这些特征量也会被利用而产生误导.例如,假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”.你如何理解这句话?
这句话是真实的,但它可能描述的是差异巨大的实际情况.例如,可能这个企业的工资水平普遍较高,也就是员工年收入的中位数、众数与平均数差不多;也可能绝大多数员工的年收入较低(如大多数是5万元左右),而少数员工的年收入很高,甚至达到100万元.在这种情况下年收入的平均数就比中位数大很多.尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为招揽员工,却用了平均数.
所以,我们要强调“用数据说话”,但同时要防止被数据误导.这就需要掌握更多的统计知识和方法.
知新探究
【例3】某某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
⑴估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
⑵估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
知新探究
解:
⑴众数是频率分布直方图中最高小矩形中点的横坐标,所以众数为m==75.0.
前3个小矩形面积为0.01×10+0.015×10+0.015×10=0.4<0.5,
所以估计这次考试的物理成绩的及格率是75%.
⑵依题意,60及60以上的分数在第三、四、五、六组,频率为(0.015+0.03+0.025+0.005)×10=0.75,
所以中位数n=70+73.3.
前4个小矩形的面积为0.4+0.03×10=0.7>0.5,
利用抽样学生成绩估算平均分
5×f1+55×f2+65×f3+75×f4+85×f5+95×f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
估计这次考试物理成绩的平均分是71分.
初试身手
1.某鞋店试销一种新女鞋,销售情况如下表:
如果你是鞋店经理,那么下列统计量中对你来说最重要的是( )
A.平均数 B.众数 C.中位数 D.极差
解:
鞋店经理最关心的是哪个鞋号的鞋销量最大,由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据最重要的是众数.故选B.
B
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
初试身手
1. 某校100名高一学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60) ,[60,70) ,[70,80) ,[80,90) ,[90,100] .
⑴求图中a的值;
⑵根据频率分布直方图,估计这100名学生语文成绩的平均分.
解:
⑵这100名学生语文成绩的平均分为
⑴由题意,得 10×(0.005+0.04+0..03+a)=1,
解得a=0.02.
55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.
课堂小结
利用频率分布直方图求众数、中位数以及平均数的方法
⑴众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.
⑵中位数即为从小到大中间的数(或中间两数的平均数).
⑶平均数为每个小矩形中点的横坐标与小矩形面积乘积之和.
用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
作业布置
作业: P209 练习 第1,2,3题.
补充:
我国是世界上严重缺水的国家,某市为了制定
合理的节水方案,对居民用水情况进行了调查.
通过抽样,获得了某年100位居民每人的月均
用水量(单位:吨),将数据按照[0,0.5),
[0.5,1),…,[4,4.5]分成9组,制成了如图
所示的频率分布直方图.估计居民月均用水量
的中位数.
尽情享受学习数学的快乐吧!
我们下节课再见!
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
兼职招聘:
https://www.21cnjy.com/recruitment/home/admin