数学人教A版(2019)必修第二册9.2.3总体集中趋势的估计 课件(共31张ppt)

文档属性

名称 数学人教A版(2019)必修第二册9.2.3总体集中趋势的估计 课件(共31张ppt)
格式 pptx
文件大小 2.0MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-06-13 06:39:12

图片预览

文档简介

(共31张PPT)
9.2.3 总体集中趋势的估计
为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律。但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征. 例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等.
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
问题导入
平均数:
众数:一组数据中出现次数最多的数.
中位数:一组数据按大小顺序依次排序后,
当数据个数是奇数时,处在最中间的数是中位数;
当数据个数是偶数时,最中间两个数的平均数是中位数.
一组数据的平均数
问题1:平均数、中位数、众数是什么?
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
复习回顾
例4:利用9.2.1节中100户居民用户的月均用水量的调查数据, 计算样本数据的平均数和中位数, 并据此估计全市居民用户月均用水量的平均数和中位数.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
解:①根据已知100户居民用户月均用水量的数据,可得样本平均数为
即100户居民的月均用水量的平均数为8. 79 t.
新知探究
解:
由上述数据可得,第50个数和第51个数均为6.8,由中位数的定义,
可得100户居民的月均用水量的中位数是6.8 t.
②将样本数据按从小到大排序,结果如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79 t,其中位数约为6.8 t,众数是2.0和5.5t.
③由众数的定义,可得100户居民的月均用水量的众数是2.0和5.5 t.
新知探究
根据上述思考可得:全市居民用户的月均用水量约为8.79t,则2000户居民的月用水总量为2000×8.79=17580t.
问题2:假设某个居民小区有2000户,你能估计该小区的月用水总量吗?
问题3:小明用统计软件计算了100户居民用水量的平均数和中位数.但录入数据时把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较.哪个量的值变化更大?你能解释其中的原因吗?
通过计算可得,平均数由原来的8.79t变为9.483t,中位数没有变化,还是6.8t.
样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;
中位数只利用了样本数据中间位置的一个或两个值,所以不是任何一个样本数据的改变都会引起中位数的改变
与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
新知探究
1.平均数与中位数的区别与联系
探究1:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
(1)直方图的形状是对称的,平均数和中位数应该大体上差不多
和中位数相比,平均数总是在“长尾巴”那边.
(2)直方图在右边“拖尾”,平均数大于中位数
(3)直方图在左边“拖尾”,那么平均数小于中位数
新知探究
如果一组数据的平均数和中位数相差较大,那么可以推断这组数据一定是不对称的.
如果样本平均数大于样本中位数,说明数据中存在较大的极端值;
如果样本平均数小于样本中位数,说明数据中存在较小的极端值;
新知探究
例5:某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.根据统计,高一年级女生需要不同规格校服的频数如下表所示:
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论上表数据估计全国高一年级女生校服规格的合理性.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据.
通过观察条形图可以发现,选择校服规格为“165”的女生频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
新知探究
众数只利用了出现次数最多的那个值的信息.
众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.
因此,众数只能传递数据中的信息的很少的一部分,对极端值也不敏感.
总结:
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
新知探究
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.
探究2:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据.
如何由频率分布表或频率分布直方图估计样本的平均数、中位数和众数?
你能以图9.2-1中频率分布直方图提供的信息为例,给出估计方法吗
新知探究
平均数、中位数、众数各自的含义、特点及优缺点:
平均数 中位数 众数
在频率分布直方图中的含义
特点
优点 缺点 每个小矩形面积乘以小矩形底边中点的横坐标之和
与每一个数据有关,任何一个数的改变都会引起它的改变
把频率分布直方图划分左右两个面积相等的分界线与轴交点的横坐标
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
最高矩形底边中点的横坐标
只利用了出现次数最多的那个值的信息
受极端数据的影响较大
代表了样本数据更多的信息.
只能表达样本数据中的少量信息
容易计算,不受少数几个极端值的影响.
新知探究
2.根据频率分布直方图计算样本平均数、中位数、众数:
①估计平均数
假设数据在组内均匀分布
分组
小矩形底边中点的横坐标
频率
(小矩形面积)



新知探究
于是平均数的近似值为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
↑小矩形面积
↓小矩形底边中点横坐标
新知探究
①估计平均数
根据中位数的意义,在样本中,
有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
∴中位数落在区间内
设中位数是,则
这个结果与根据原始数据求得的中位数6.8相差不大.
中位数左边的直方图面积和右边的直方图面积相等
x-4.2
②估计中位数
新知探究
众数常用在描述分类型数据中,众数5.7让我们知道月均用水量在区间[4.2,7.2)的居民用户最多. 这个信息具有实际意义.
在频率分布直方图中,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.
最高矩形的中点
③估计众数
新知探究
总结:
由频率分布直方图估计总体的集中趋势——找众数、中位数、平均数
众数:最高矩形的中点
中位数:中位数左边的直方图面积和右边的直方图面积相等
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
新知探究
例1:某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
(3)求这次测试数学成绩的平均分.
练习巩固 大册P136例2
题型一:总体集中趋势在频率分布直方图中的估计
(2)中位数
∴中位数落在区间[70,80)内,
设中位数是x ,则
∴中位数约为73.3
众数为最高矩形的中点
中位数左边的直方图面积和右边的直方图面积相等
0.05
0.15
0.2
0.3
练习巩固
(3)平均数=
每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
45
55
65
75
85
95
练习巩固
变式1-1:某中学举行电脑知识竞赛,现将高一参赛学生的成绩整理后分成五组,绘制成频率分布直方图如图所示.已知图中从左到右的第一、二、三、四、五小组的频率依次是0.30,0.40,0.15,0.10,0.05.
练习巩固 大册P136变式训练2
(1)估计高一参赛学生的成绩的众数、中位数;
(2)估计高一参赛学生的平均成绩.
解:(1) 众数为65;中位数为60+5=65.
(2)由题图,估计高一参赛学生的平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
例2:高一(3)班有男同学27名、女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班的平均分(精确到0.01分);
(2)估计全班成绩在80分及以下的同学至少有多少人;
(3)分析男同学的平均分与中位数相差较大的主要原因.
练习巩固 大册P135例1
题型二:总体集中趋势在具体数据中的估计
(2)因为27名男同学成绩的中位数是75,所以至少有14人得分不超过75分.
又因为21名女同学成绩的中位数是80,所以至少有11人得分不超过80分.
所以估计全班至少有25人得分不超过80分.
(3)男同学的平均分与中位数的相差较大,说明男同学的成绩中两极分化现象严重,分数高的和低的相差较大.
变式2-1:某工厂人员及周工资构成如下表:
练习巩固 大册P136变式训练1
(1)求工厂人员周工资的众数、中位数、平均数;
(2)平均数能客观地反映该工厂人员的周工资水平吗 为什么
解:(1)由题中表格可知,众数为1 200,中位数为1 220,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230.
(2)虽然平均数为1 230元/周,但从题干表格中所列出的数据可见,只有经理和6名管理人员的周工资在平均数以上,其余人员的周工资都在平均数以下,故用平均数不能客观真实地反映该厂人员的周工资水平.
练习巩固 大册P137典例
用分类讨论思想求平均数
典例:某班4个小组的人数分别为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的平均数.
练习巩固 大册P138变式训练
用分类讨论思想求平均数
变式训练:已知由正整数组成的一组数据1,x,y,3,其平均数和中位数都是2,则这组数据为         .(从小到大排列)
答案:1,1,3,3或1,2,2,3
总体的各种数字特征都可以由两种途径来估计:
①直接利用样本数据; ②由频率分布直方图来估计
两者可能不同
①众数:最高矩形的中点.
由频率分布直方图估计总体的集中趋势
②中位数:中位数左边的直方图面积和右边的直方图面积相等.
③平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
课堂小结
解:(1) 由直方图可知,众数为75分.
中位数约为
练习巩固
变式:为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:
(1) 这20名工人中一天生产该产品数量在[55, 75)的人数是______;
(2) 这20名工人中一天生产该产品数量的中位数为______;
(3) 这20名工人中一天生产该产品数量的平均数为______.
练习巩固
1. 根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
空气质量等级(空气质量指数(AQD) 频数 频率
优(AQI≤50) 83 22.8%
良(50轻度污染(100< AQI≤150) 68 18.6%
中度污染(150重度污染(200< AQI≤300) 30 8.2%
严重污染(AQI> 300) 14 3.8%
合计 365 100%
解:平均数的估计值为
25×22.8%+75×33.2%+125×18.6%+175×13.4%+250×8.2%+350×3.8%≈111.
练习巩固
1. 根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
空气质量等级(空气质量指数(AQD) 频数 频率
优(AQI≤50) 83 22.8%
良(50轻度污染(100< AQI≤150) 68 18.6%
中度污染(150重度污染(200< AQI≤300) 30 8.2%
严重污染(AQI> 300) 14 3.8%
合计 365 100%
解:
由上表数据可知,中位数在50~100之间,其估计值为
练习巩固
1. 根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
空气质量等级(空气质量指数(AQD) 频数 频率
优(AQI≤50) 83 22.8%
良(50轻度污染(100< AQI≤150) 68 18.6%
中度污染(150重度污染(200< AQI≤300) 30 8.2%
严重污染(AQI> 300) 14 3.8%
合计 365 100%
解:
由上表数据可知,空气质量指数在0~150的频率为0.746,0~200的频率为0.88.
所以第80百分位数在150~200之间,其估计值为
练习巩固