(共19张PPT)
9.2.3总体集中趋势的估计
学习目标
1.能利用频率分布直方图估计总体的众数、中位数、平均数.
2能用样本的数字特征估计总体的数字特征,并结合实际,对问题作出合理判断,制定解决问题的有效方法.
3.体会样本数字特征的随机性,会用样本估计总体的思想解决问题.
1、定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2、计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为
第i项与第(i+1)项数据的平均数.
温故知新
总体集中趋势的估计
平均数
一组数据的和与这组数据个数的商.如:
定义
?
?
特征
平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变,都会引起平均数的变化,这是众数和中位数都不具有的性质,所以与众数中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.
但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.
总体集中趋势的估计
平均数
加权平均数与频率平均数
?
加权平均数
?
?
频率平均数
?
?
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
探究
一般来说,对一个单峰的频率分布直方图来说,
如果直方图的形状是对称的(如图(1)),那么平均数和中位数大体
上差不多;
如果直方图在右边“拖尾”(如图(2)),那么平均数大于中位数;
如果直方图在左边“拖尾”(如图(3)),那么平均数小于中位数,
也就是说,平均数总是在“长尾巴”那边.
总体集中趋势的估计
众数
一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.
定义
特征
一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势
1,2,3,4,5,6,7,8,9
,10
没有众数
1,2,3,4,4,5,5,6,7
众数有两个,分别是4和5
1,2,3,4,5,5,6,7,8
众数是5
总体集中趋势的估计
中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.
定义
特征
一组数据的中位数是唯一的反映了该组数据的集中趋势,在频率分布直方图中中位数左边和右边的直方图的面积相等
众数只利用了出现次数最多的那个值的信息,众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
思考5.什么叫方差?有什么意义?
定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式
思考5.什么叫方差?有什么意义?
定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式
意义:反应了数据的离散程度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.
思考5.什么叫方差?有什么意义?
定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式
思考6.什么叫标准差?有什么意义?
定义:标准差等于方差的算数平方根,计算公式:
意义:反应了数据的离散程度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.
小试牛刀
×
×
×
题型一
平均数、中位数和众数的计算
跟踪训练2
课堂小结
1、计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
课堂小结
2、通过频率分布直方图估计平均数、中位数、众数:
样本平均数:可以用每个小矩形底边中点的横坐标与小矩形的面积的
乘积之和近似代替.
样本中位数:把每个矩形的面积从左加起,加到接近0.5时(没超过)用0.5减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数.
样本众数:频率分布直方图的众数估计值为最高矩形底边的中点.
课堂小结