(共42张PPT)
9.2.3 总体集中趋势的估计9.2.4 总体离散程度的估计
藏宝图只能够标出宝藏所在的具体位置及路线图,但真正探索宝藏的秘密还有很多工作要做,统计图表能够把所有的信息都表述出来吗 还有哪些关键性的特征是我们迫切需要的呢 杂乱无章的数据仅用统计图表来分析显然是不全面的,不同的数字特征往往具有不同的意义和作用,本节介绍数据的数字特征,根据不同问题的需要选择适当的数字特征来表达数据的信息.
1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数)
及离散程度参数(标准差、方差、极差) .
2.会求样本数据的众数、中位数、平均数、标准差、方差、极差 .
3.理解集中趋势、离散程度参数的统计含义.
1.数学运算:求样本数据的众数、中位数、平均数、方差、标准差;
2. 数据分析:频率分布直方图中的众数、中位数、平均数,
. 用样本平均数和样本标准差估计总体
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起 吧!
进
走
课
堂
微课1 平均数、中位数、众数
思考: 利用9.2.1节中100户居民用户的月均用水量的调查数据,能否计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
思考1:该市某小区有2000户,你能估计该小区的月用水总量吗?
思考2:小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数.
中位数没有变化,还是6.6t
思考3:并与真实的样本平均数和中位数作比较。哪个量的值变化更大?你能解释其中的原因吗?
平均数由原来的8.79t变为9.483t,中位数没有变化.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变,因此,与中位数较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
微课2:中位数和平均数的大小与数据分布形态的关系
思考:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系
(1) 单峰,直方图形状对称:
(2) 右边“拖尾”:
(3) 左边“拖尾”:
结论:和中位数相比,平均数总是在“长尾巴”那边.
例1:某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格,据统计,高一年级女生需要不同规格校服的频数如下表所示,
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.
分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的
类别,对于这样的分类数据,用众数作为这组数据的代表比较
合适.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据(下图)可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
微课3:由频率分布直方图估计平均数、中位数、众数
思考:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
例2 你能以下图居民用水的频率分布直方图提供的信息,估计出样本的平均数、中位数和众数吗
1.由频率分布直方图估计平均数
2.由频率分布直方图估计中位数
取最高矩形下端中点的横坐标5.7作为众数.
3.由频率分布直方图估计众数
类题通法(知频率分布直方图中求平均数、中位数、众数)
(1)众 数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个
面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横
坐标与小矩形的面积的乘积之和.
变式训练 如图为学生身高频率分布直方图.
(1)如何在样本数据的频率分布直方图中估计出众数的值
(2)如何在样本数据的频率分布直方图中估计出中位数的值
(3)如何在样本数据的频率分布直方图中估计出平均数的值
(4)从样本数据可知,该样本的众数是166 cm,172 cm,中位数是171 cm,平均数是170.1 cm,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗
解:(1)众数大致的值就是样本数据的频率分布直方图中最高小长方形的中点的横坐标.由直方图可估计学生身高众数应为174.5 cm.
(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积相等,由此可以估计中位数的值,如图,由于0.08+0.22=0.3,0.08+0.22+0.22=0.52,所以中位数落在区间[167,172)内.
设中位数是x,由0.08+0.22+(x-167)× =0.5,解得x≈171.55.所以学生身高的中位数约为171.55 cm.
(3)平均数是频率分布直方图的“重心”,是频率分布直方图的平衡点,因此,每个小长方形的面积与小长方形底边中点的横坐标的乘积之和为平均数.由159.5×0.08+164.5×0.22+169.5×0.22+174.5×0.36+179.5×0.12=170.6,得学生身高的平均数为170.6 cm.
(4)因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据的信息,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.
微课4: 方差、标准差
思考:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价
计算 平均数、方差
思考1:甲、乙两人本次射击的平均成绩分别为多少环
他们的平均成绩一样吗
提示:经计算得
(7+8+7+9+5+4+9+10+7+4)=7,
同理可得 他们的平均成绩一样.
.
=7
思考2:难道这两个人的水平就没有什么差异了吗 你能作出这两人成绩的频率分布条形图来说明其水平差异在哪里吗
提示:频率分布条形图如下:
从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成绩相对集中.
思考:如何度量数据的离散程度?
一种简单的度量数据离散程度的方法就是用极差,根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6 乙命中环数的极差=9-5=4.
这种方法有什么不足?
极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
是否还有更合适的方法?
思考:对于样本数据x1,x2,…,xn,用 表示这组数据的平均数设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?
为了避免式中含有绝对值,通常改用平方来代替,即
方差
对于样本数据x1,x2,…,xn,用 表示这组数据的平均数,称下式为这组数据的方差(variance).
有时为了计算方差的方便,我们还把方差写成
由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开平方,取它的算术平方根,即
我们称上式为这组数据的标准差(standard deviation).
思考3:现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢
提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
例3 在对树人中学高一年级学生身高的调查中,采用样本量比例分
配的分层随机抽样,如果不知道样本数据,只知道抽取了男生
23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,
其平均数和方差分别为160.6和38.62.你能由这些数据计算出
总样本的方差,并对高一年级全体学生身高方差作出估计吗
解:把男生样本记为x1,x2,…,x23,其平均数记为 ,方差记为 ;把女生样本记为y1,y2,...y27,其平均数记为 ,方差记为 ;把总样本数据的平均数记为 ,方差记为 .根据方差的定义,总样本方差为
男生23人,其平均数和方差分别为170.6和12.59,
女生27人,其平均数和方差分别为160.6和38.62
把已知的男生、女生样本平均数和方差的取值代入,可得
并据此估计高一年级学生身高的总体方差为51.4862.
(1)中位数不受少数极端值的影响
(2)众数无法客观地反映总体的特征(3)平均数受极端值的影响较大
数
字
特
征
(1)数学抽象:通过样本的数字
特征,培养数学抽象的核心素养
(2)数学运算:通过数字特征的计算,培养数学运算的核心素养
(3)数据分析:利用样本的数字特征的分析数据、预测问题
利用频率分布直方图求数字特征的方法
(1)众数是最高的矩形的底边的中点的横坐标.
(2)中位数左右两侧直方图的面积相等。
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
中位数
众数
频率分布直方图中的数字特征
平均数
标准差:
方差:
集中
离散
易错提醒
核心知识
核心素养
方法总结
总体集中趋势的估计
总体离散程度的估计
1.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,
其中位数为22,则x等于( )
A.21 B.22 C.20 D.23
解析:根据题意知,中位数22= ,则x=21.
A
A
D
D
4
6.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,
则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________;
(2)这20名工人中一天生产该产品的数量的中位数为_______;
(3)这20名工人中一天生产该产品的数量的平均数为______.
即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.