高一数学人教A版(2019)必修第二册教案 :9.2.3总体集中趋势的估计 教学设计

文档属性

名称 高一数学人教A版(2019)必修第二册教案 :9.2.3总体集中趋势的估计 教学设计
格式 doc
文件大小 506.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-11-05 17:25:57

图片预览

文档简介

第九章 统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
教学设计
1、教学目标
1. 理解样本数据基本数字特征的意义和作用,对样本数据中提取的基本数字特征(如众数、中位数、平均数)作出合理解释;
2. 体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;
3. 体会样本数字特征的随机性;
4. 会用样本估计总体的思想解决实际问题.
2、教学重难点
1. 教学重点
(1) 理解样本数据基本数字特征的意义和作用;
(2) 会用样本的基本数字特征估计总体的基本数字特征.
2. 教学难点
对总体分布的理解及统计思维的建立.
3、教学过程
(1) 新课导入
为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等.
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
(2) 探索新知
例4 利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
解:根据100户居民用户月均用水量的数据,由样本平均数的定义,可得
即100户居民的月均用水量的平均数为8.79 t.
将样本数据按从小到大排序,得第50个数和第51个数分别为6.4,6.8,由中位数的定义,可得
即100户居民的月均用水量的中位数是6.6 t.
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79 t,其中位数约为6.6 t.
问题1 小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较.哪个量的值变化更大?
平均数由原来的8.79 t变为9.483 t,中位数没有变化,还是6.6 t.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
问题2 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(图(3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
例5 某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表所示.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据(如图).可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
问题3 样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据.例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图.这时该如何估计样本的平均数、中位数和众数?你能以图9.2-1中频率分布直方图提供的信息为例,给出估计方法吗?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.如图9.2-10所示,可以测出图中每个小矩形的高度,于是平均数的近似值为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.由于
因此中位数落在区间 [4.2,7.2)内.设中位数为x,由

得到. 因此,中位数约为6.71,如图9.2-11所示.这个结果与根据原始数据求得的中位数6.6相差不大.
在频率分布直方图9.2-1中,月均用水量在区间 [4.2,7.2) 内的居民最多,可以将这个区间的中点5.7作为众数的估计值,如图9.2-12所示.众数常用在描述分类型数据中,在这个实际问题中,众数“5.7”让我们知道月均用水量在区间 [4.2,7.2) 内的居民用户最多.这个信息具有实际意义.
以上我们讨论了平均数、中位数和众数等特征量在刻画一组数据的集中趋势时的各自特点,并研究了用样本的特征量估计总体的特征量的方法.需要注意的是,这些特征量有时也会被利用而产生误导.
问题4 假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”,你该如何理解这句话?
这句话是真实的,但它可能描述的是差异巨大的实际情况.例如,可能这个企业的工资水平普遍较高,也就是员工年收入的中位数、众数与平均数差不多;也可能是绝大多数员工的年收入较低(如大多数是5万元左右),而少数员工的年收入很高,甚至达到100万元,在这种情况下年收入的平均数就比中位数大得多.
(3) 课堂练习
1. 200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为( )
A. B. C. D.
答案:C
解析:∵最高的矩形为第三个矩形,∴时速的众数的估计值为65.
前两个矩形的面积为.
∵,
∴中位数的估计值为.故选C.
2. 统计局就某地居民的月收入(元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(下图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[4000,4500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
答案:解:(1)∵(0.0002+0.0004+0.0003+0.0001)×500=0.5,∴a==0.0005,
月收入在[4000,4500)内的频率为0.25,
∴100人中月收入在[4000,4500)内的人数为0.25×100=25.
(2)∵0.0002×500=0.1,0.0004×500=0.2,0.0005×500=0.25,0.1+0.2+0.25=0.55>0.5.
∴样本数据的中位数是3500+=3900(元).
(3)样本平均数为
(2750×0.0002+3250×0.0004+3750×0.0005+4250×0.0005+4750×0.0003+5250×0.0001)×500=3900(元).
3. 某工厂人员及月工资构成如下:
人员 经理 管理人员 高级技工 工人 学徒 合计
月工资(元) 22 000 2 500 2 200 2 000 1 000 29 700
人数 1 6 5 10 1 23
合计 22 000 15 000 11 000 20 000 1 000 69 000
(1)指出这个表格中月工资的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
答案:(1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为69 000÷23=3 000(元).
(2)虽然平均数为3 000元,但由表格中所列出的数据可见,只有经理的工资在平均数以上,其余人的工资都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
(4) 小结作业
小结:
1. 理解样本数据基本数字特征的意义和作用;
2. 会用样本的基本数字特征估计总体的基本数字特征.
作业:
4、板书设计
9.2.3 总体集中趋势的估计
用样本的基本数字特征估计总体的基本数字特征.
2