(共18张PPT)
第6章 数据的分析
6.2 方差
学习目标
掌握方差的定义和计算方法,理解方差的统计意义和在具体问题中的实际意义.(重、难点)
新课导入
动脑筋
刘亮和李飞参加射击训练的成绩(单位:环)如下:
刘亮:7,8,8,9,7,8,8,9,7,9;
李飞:6,8,7,7,8,9,10,7,9,9.
刘亮成绩的平均数是 =8.0;
李飞成绩的平均数是 =8.0.
即两人的平均成绩相同.
为了直观地看出这两组数据与其平均数的偏离程度,我们用图6-3来表示数据的分布情况.
由上面两幅图,可以发现刘亮的射击成绩大多集中在平均成绩8环附近,而李飞的射击成绩与其平均成绩的偏差较大.
刘亮的射击成绩
李飞的射击成绩
图6-3
一组数据中的数与这组数据的平均数的偏离程度是数据的一个重要特征,它反映了一组数据的离散程度或波动大小.
那么如何找到一个特征值来反映一组数据与其平均数的离散程度呢?
把各个数与平均数之差取绝对值,再取它们的平均值.
将各个数与平均数之差相加.但是相加的结果为0啊!
把各个数与平均数之差平方,再取它们的平均值.
为了反映了一组数据的离散程度,可以采用很多方法,统计中常采用以下做法:
设一组数据为x1,x2,…,xn,各数据与平均数 之差的平方的平均值,叫做这组数据的方差,记做S2。
即 .
由此我们可以算出刘亮、李飞的射击成绩的方差分别是
S2刘亮= [(7-8)2+(8-8)2+…+(7-8)2]=0.6.
计算结果表明:S2李飞>S2刘亮,这说明李飞的射击成绩波动大,而刘亮的射击成绩波动小,因此刘亮的射击成绩稳定.
S2李飞= [(6-8)2+(8-8)2+…+(9-8)2]=1.4.
一般地,一组数据的方差越小,说明这组数据离散或波动的程度就越小,这组数据也就越稳定.
【例】有两个女声小合唱队,各由5名队员组成.她们的身高(单位:厘米)为:
甲队:160,162,159,160,159;
乙队:180,160,150,150,160.
如果单从队员的身高考虑,哪队的演出形象效果好?
解 甲队队员的平均身高是
乙队队员的平均身高是
甲队队员身高的方差是
乙队队员身高的方差是
计算的结果表明:乙队队员身高的方差比甲队队员身高的方差大得多,这说明乙队中各队员的身高波动大,而甲队中各队员的身高波动小,所以甲队队员的身高比较整齐,形象效果好.
从例1的计算过程可以看到,求方差的运算量很大.当一组数据所含的数很多时,我们可以借助计算器来求一组数据的方差.不同型号的计算器其操作步骤可能不同,请先阅读计算器的说明书.通常先按统计键,使计算器进入统计运算模式,然后依次输入数据,最后按求方差的功能键,即可求出该组数据的方差.
练习
A
1.有甲、乙两组数据,已知甲组数据的方差为0.5,乙组数据的方差为0.2,那么甲、乙两组数据的波动程度是( )
A.甲组数据的波动比较大
B.乙组数据的波动比较大
C.甲、乙两组数据的波动程度相同
D.甲、乙两组数据的波动程度无法比较
解析:因为方差越小数据越稳定,且0.2<0.5,
所以甲组数据波动比较大.
A
解析:因为甲和丙的平均分高于乙和丁,所以甲和丙同学成绩较好;
甲的方差小于丙,所以甲的成绩较丙更稳定,所以应该选择甲.
2.为了参加学校举行的“汉字听写大赛”,八(1)班组织了三轮班级预选赛,下表记录了该班甲、乙、丙、丁四名同学三轮预选赛成绩的平均分与方差,根据表中数据,要从中选择一名成绩好又发挥稳定的同学参赛,应该选择( )
A.甲 B.乙 C.丙 D.丁
甲 乙 丙 丁
平均分 98 96 98 96
方差 0.30 0.36 0.35 0.94
3.若一组数据x1+1,x2+1,…,xn+1的平均数为17,方差为2,则另一组数据x1+2,x2+2,…,xn+2的平均数和方差分别为( )
A.17,2 B.17,3 C.18,1 D.18,2
解析:因为数据x1+1,x2+1,…,xn+1的平均数为17,
所以数据x1+2,x2+2,…,xn+2的平均数为17+1=18,
因为数据x1+1,x2+1,…,xn+1的方差为2,
所以数据x1+2,x2+2,…,xn+2的方差不变,还是2.
D
4. “杂交水稻之父”袁隆平为提高水稻的产量贡献了自己的一生.某研究员随机从甲、乙两块试验田中各抽取100株杂交水稻苗测试高度,计算平均数和方差的结果为 =12, =12,S2甲=3.2,S2乙=4.6,则杂交水稻长势比较整齐的是______.
解析:因为 =12, =12,S2甲=3.2,S2乙=4.6,
所以S2甲<S2乙,
所以杂交水稻长势比较整齐的是甲.
甲
5. 已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是1,则数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数是________,方差是_________.
解析:一组数据x1,x2,x3,x4,x5的平均数是2,所以 =2.
那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数是
(3x1-2+3x2-2+3x3-2+3x4-2+3x5-2)=3× (x+x2+x3+x4+x5)-2=3 -2=4.
9
4
因为S2=1,
所以 [(3x1-2-4)2+(3x2-2-4)2+(3x3-2-4)2+(3x4-2-4)2+(3x5-2-4)2]
= [9(x1-2)2+9(x2-2)2+9(x3-2)2+9(x4-2)2+9(x5-2)2]
=9× ×[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2]
=9×S2=9.
6. 甲、乙两门大炮在相同的条件下向同一目标各发射50发炮弹,炮弹落点情况如下表:
为了比较甲、乙两门大炮的成绩,制作了如下统计表:
炮弹落点与目标距离(单位:m) 20 15 10 5 0
甲炮发射的炮弹个数 0 3 9 13 25
乙炮发射的炮弹个数 1 5 9 a b
平均数 中位数 众数 方差
甲 c m n 22
乙 4 0 0 S2
32
3
解析:(1)根据炮弹个数可得:a+b+1+5+9=50,a+b=35,
根据乙的平均数可得:1×20+5×15+9×10+5a+0b=4×50,a=3,
所以a=3,b=32.
(1)根据以上表格填空:a=______,b=______;
(2)不写计算过程,直接写出:c=______,m=______,n=______;
(3)求乙大炮的方差S2,并分析指出哪门大炮射击的稳定性好?
(2)甲的平均数=(3×15+9×10+13×5)÷50=3.6,
共50发,中位数是第25发和第26发的平均值,(0+0)÷2=0,即m=0,
距离是0的结果出现了25次,次数最多,所以n=0.
3.6
0
0
(3)S2=[(20-4)2 ×1+(15-4)2 ×5+(10-4)2 ×9+(5-4)2 ×3+(0-4)2×32]÷50=34,
因为乙的方差大于甲的方差,所以甲的稳定性好.
课堂小结
求方差的步骤:
1.计算各数据与平均值的偏离,各种偏离可正可负.
2.将各偏离值平方,其目的是化为非负数,且平方以后的数,仍能反映数据与平均数的偏离程度.
3.求偏差的平方和,使偏差积累起来(不会正、负抵消)以反映总的偏差.
4.求偏差的平方和的平均数,以反映数据与其平均数的偏离的一般程度.
方差的统计学意义:判断数据的波动程度.
方差越大(小),数据的波动越大(小).