(共21张PPT)
高中数学 高一年级
课题:9.2.3总体集中趋势的估计
复习引入
某市居民用水频率分布直方图
平均数,中位数,众数
1.众数、中位数和平均数的定义
(1)众数:一组数据中______________的数.
(2)中位数:一组数据按大小顺序排列后,处于_______位置的数.如果个数是偶数,则取_______两个数据的平均数.即第50百分位数.
(3)平均数:一组数据的____除以数据个数所得到的数.
出现次数最多
中间
中间
和
新知梳理
通过简单随机抽样,获得济南市100户居民用户的月均用水量数据(单位:t)
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 7.7 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 2.0 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
典例分析
【例1】利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
附:通过简单随机抽样,获得济南市100户居民用户的月均用水量数据(单位:t)
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 7.7 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 2.0 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
【例1】利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
解:用样本平均数的定义,可得,即100户居民月均用水量的平均数是8.79t
将样本数据从小到大排序,得到第50个数和第51个数分别是6.4,6,8,由中位数的定义,可得,即100户居民的月均用水量的中位数是6.6t
据此估计全市居民用户月均用水量的平均数约为8.79t,中位数约为6.6t
77
典例分析
思考:小明用统计软件计算100户居民用水量的平均数和中位数,在录入数据时不小心把一个数据7.7录成了77,与真实的样本平均数和中位数做比较,哪个量的值变化更大,你能解释其中的原因吗?
因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变,但是中位数只是利用了样本数据中间位置的一个或两个值,并未利用其它数据,所以不是任何一个样本数据的改变都会引起中位数的改变。
因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感。
新知梳理
探究1:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在下图三种分布形态中,平均数和中位数的大小存在什么关系?
一般,对一个单峰的频率分布直方图来说,
如果直方图的形状是对称的(图1),那么平均数和中位数应该大体上差不多;
和中位数相比,平均数总是在“长尾巴”的那边
新知梳理
如果直方图在右边“拖尾”(图2),那么平均数大于中位数;
如果直方图在左边“拖尾”(图3),那么平均数小于中位数
【例2】我校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如图所示
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表我校高一年级女生所需校服的规格,那么在中位数,平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性.
解:通过上表的数据,可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为我校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
典例分析
2.众数、中位数和平均数的比较
名称 优点 缺点
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大
一般地,对数值型数据(如用水量,收入,产量等)集中趋势的描述,可以用平均数,中位数;而对分类型数据(如校服规格,性格,产品质量等级等)集中趋势的描述,可以用众数.
新知梳理
探究2 你能以居民用水量的频率分布直方图提供的信息为例,给出估计方法吗?
假设每一组内的数据是均匀分布的
新知梳理
样本平均数的估计
……
小矩形面积
每一矩形底边中点横坐标
样本平均数可以用每一个小矩形底边
中点的横坐标与小矩形的面积的乘积之和
近似值代替
新知梳理
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
因此中位数落在内,设中位数为,由
,可得
根据频率分布直方图,月均用水量在区间内的居民最多,可以将这个区间的中点作为众数的估计值.
规律方法 众数、中位数、平均数与频率分布直方图的联系
(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标.
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.
【例3】 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
(3)求这次测试数学成绩的平均分.
典例分析
(2)由题干图知,设中位数为,由于前三个矩形面积之和为0.4,第四个矩形面积为,因此中位数位于第四个矩形内,设为,得所以,即这80名学生的数学成绩的中位数为73.3分.
规律方法 众数、中位数、平均数与频率分布直方图的联系
(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标.
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.
1.通过学习平均数、中位数和众数的计算及应用,重点培养数学运算素养及数据分析素养.
2.一组数据中的众数可能不止一个,中位数是唯一的,求中位数时,必须先排序.
3.利用频率分布直方图求数字特征:
(1)众数是最高矩形的底边中点的横坐标.
(2)中位数左右两边直方图的面积应相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
课堂小结
思考:假设你到人才市场去找工作,有一个企业的老板告诉你,“我们企业员工的年平均收入是20万元”,你该如何理解这句话?
布置作业
1.阅读教材
2.完成配套练习