(共19张PPT)
人教A版高中数学必修第二册
9.2
用样本估计总体
9.2.4
总体离散程度的估计
把一组数据按大小顺序排列,处在最中间的一个数据(或两个数据的平均数);
从频率分布直方图中估计中位数左右两边的直方图的面积相等.
一组数据中重复出现次数最多的数;
从频率分布直方图
中估计众数是最高的矩形的中点.
1.众数
2中位数
3平均数
如果有n个数据
那么这n个数的平均数
也可以从频率分布直方图中估计平均数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中的横坐标之和.
温故知新
课堂引入
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.
但仅知道集中趋势的信息,很多时候还不能使我们做出有效的决策.
提出问题
问题3、有两名射击队员在一次射击测试中各射靶10次,每次命中的环数如下:
甲
7
8
7
9
5
4
9
10
7
4
乙
9
5
7
8
7
6
8
6
7
7
如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
解决问题
通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数众数都是7.从这个角度看,两名运动员之间没有差别。
但从上图中看,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定。他们的射击成绩是存在差异的,那么,如何度量成绩的这种差异呢?
引入新知
一种简单的度量数据离散程度的方法就是用极差。
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6
乙命中环数的极差=9-5=4
可以发现甲的成绩波动范围比乙大。极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少。
提出问题
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远。因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度。
思考:如何定义“平均距离”?
为了避免式中含有绝对值,通常改用平方来代替,即
假设一组数据是
,用
表示这组数据的平均数。
用每个数据与平均数的差的绝对值作为“距离”,即
则这组数据到
的“平均距离”为
我们将其定义为这组数据的方差:
引入新知
引入新知
有时为了计算方差的方便,我们还把方差写成以下形式
由于方差的单位是原始数据的单位的平方,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即
我们称其为这组数据的标准差
总体方差和总体标准差
样本方差和样本标准差
引入新知
标准差刻画了数据的数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小;
显然,在刻画数据的分散程度上,方差和标准差是一样的,但在解决实际问题中,一般多采用标准差。
通常我们用样本方差、标准差估计总体方差、标准差
即乙比甲的射击成绩稳定
如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置。如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲。
引入新知
课堂典例
例6、在对树人中学高一学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?
解:把男生样本记为
,其平均数记为
,方差记为
;
把女生样本记为
,其平均数记为
,方差记为
;
把总体数据样本的平均数记为
,方差记为
;
课堂典例
由
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为
∴高一年级全体学生的身高方差为51.4862
课堂典例
样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差一起能反映数据取值的信息.
如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数和样本标准差分别为
课堂典例
1、用定义计算样本方差和样本标准差
2、分层抽样总样本方差的计算
3、用频率分布直方图估计样本方差
方差的估计值等于每一个小矩形底边中点值减去平均数的平方乘小矩形的面积的和.
课堂小结
课堂小结
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小;
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性;
(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差;
(4)标准差的单位与样本数据一致.
标准差与方差的特征: