(共27张PPT)
2.2.2
用样本的数字特征估计总体的数字特征
标准差
平均数:
一组数据的算术平均数,即
x=
一、
众数、中位数、平均数的概念
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
众数:在一组数据中,出现次数最多
的数据叫做这组数据的众数.
复习旧知
二
、
众数、中位数、平均数与频率分布直方图的关系
1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。
二
、
众数、中位数、平均数与频率分布直方图的关系
3、平均数是频率分布直方图的“重心”.是直方图的平衡点.频率直方图中每个小长方形的面积乘以小矩形底边中点的横坐标之和。
二
、
众数、中位数、平均数与频率分布直方图的关系
三、
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.
2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。
3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此
,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
问题引入:
有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:
甲
7
8
7
9
5
4
9
10
7
4
乙
9
5
7
8
7
6
8
6
7
7
如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
两人射击
的平均成绩是一样的.
那么两个人的水平就没有什么差异吗?
4
5
6
7
8
9
10
环数
频率
0.1
0.2
0.3
(甲)
4
5
6
7
8
9
10
0.1
0.2
0.3
0.4
环数
频率
(乙)
频率
知识新授:
考察样本数据的分散程度的大小,最常用的统计量是标准差.
标准差是样本数据到平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
1.标准差定义:是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。
假设样本数据是
平均数是
2、标准差算法及其公式为:
1)算出样本数据的平均数
。
2)算出每个样本数据与样本数据平均数的差:
3)算出(2)中
的平方。
4)算出(3)中n个平方数的平均数,即为样本方差。
5)算出(4)中平均数的算术平方根,即为样本标准差。
3.关于标准差的说明:
1)标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
规律:标准差越大,
则a越大,数据的
离散程度越大;反
之,数据的离散程
度越小。
3.关于标准差的说明:
1)标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
2)从标准差的定义和计算公式都可以得出S≥0。
3)
当S=0
时,则所有的样本数据都等于样
本平均数。
4.方差
从数学的角度考虑,人们有时用标准差的平方
(即方差)来代替标准差,作为测量样本数据分散程度的工具:
说明:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
问题
有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:
甲
7
8
7
9
5
4
9
10
7
4
乙
9
5
7
8
7
6
8
6
7
7
问题1解答
解:可计算知S甲=2,S乙≈1.095,由S甲>S乙可以知道甲的成绩离散程度大,乙的成绩离散程度小。由此可以估计乙比甲的射击成绩稳定。
例1、画出下列四组样本数据的直方图,说明它们的异同点。
(1)
(2)
(3)
(4)
例2、甲乙两人同时生产内径为25.40mm的一种零件。为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm
)
甲
乙
从生产的零件内径的尺寸来看,谁生产的质量较高?
解:用计算器计算可得:
1.标准差定义及公式:是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。
2、标准差算法及其公式为:
1)算出样本数据的平均数
。
2)算出每个样本数据与样本数据平均数的差:
3)算出(2)中
的平方。
4)算出(3)中n个平方数的平均数,即为样本方差。
5)算出(4)中平均数的算术平方根,即为样本标准差。
课堂小结
3.关于标准差:
1)标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
2)从标准差的定义和计算公式都可以得出:
。当
时,意味着所有的样本数据都等于样本平均数。
课后作业:
课本
P81
习题2.2
A组
6、7.
P79练习答案
解:
依题意计算可得
x1=900
x2=900
s1≈23.8
s2
≈42.6
甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.
解
:
(1)
平均重量约为496.86
g
,
标准差约为6.55
(2)重量位于(x-s
,
x+s)之间有14袋白糖,所占
百分比为66.67%.
解:平均数x≈19.25,
中位数为15.2,
标准差s≈12.50.
这些数据表明这些国家男性患该病的平均死亡率约为
19.25,
有一半国家的死亡率不超过15.2,
x
>
15.2
说
明存在大的异常数据,
这些异常数据使得标准差增大.