(共22张PPT)
第二十章 数据的分析
20.2.1 方差、用样本方差
估计总体方差
1.理解方差的概念及统计学意义.
2.会计算一组数据的方差.
3.能够运用方差判断数据的波动程度,并解决简单的实际问题.
在统计学中,除了平均数、中位数、众数这类刻画数据集中趋势的量以外,还有一类刻画数据波动(离散)程度的量,其中最重要的就是方差. 本节我们将在实际问题情境中,了解方差的统计意义并运用方差解决问题.
问题 农科院计划为某地选择合适的甜玉米种子.选择种子时,甜玉米的产量和产量的稳定性是农科院所关心的问题.为了解甲、乙两种甜玉米种子的相关情况,农科院各用10块自然条件相同的试验田进行试验,得到各试验田每公顷的产量 (单位:t) 如下表所示.
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
根据这些数据估计,农科院应该选择哪种甜玉米种子呢
上面两组数据的平均数分别是
说明在试验田中,甲、乙两种甜玉米的平均产量 相差不大.由此可以估计出这个地区种植这两种甜玉米,它们的平均产量相差不大.
由样本平均数估计总体平均数
怎样直观地看出甲、乙两种甜玉米产量的情况呢?
可以画出统计图如图所示:
甲种甜玉米的产量
乙种甜玉米的产量
甲种甜玉米的产量
乙种甜玉米的产量
比较上面的两幅图可以看出,甲种甜玉米在各试验田的产量波动较大, 乙种甜玉米在各试验田的产量较集中地分布在平均产量附近.
从图中看出的结果能否用一个量来刻画呢?
为了刻画一组数据波动的大小,可以采用很多方法. 统计中常采用下面的做法:设有n个数据x1, x2 ,… ,xn,各数据与它们的平均数 的差的平方分别是 …, 我们用这些值的平均数,即用
来衡量这组数据波动的大小,并把它叫做这组数据的方差,记作s2.
方差的意义
方差用来衡量一组数据的波动大小(即这组数据偏离平均数的大小).
方差越大,数据的波动越大;
方差越小,数据的波动越小.
你能利用方差公式分析甲、乙两种甜玉米产量的波动程度吗?
据样本估计总体的统计思想,种乙种甜玉米产量较稳定.
显然 > ,即说明甲种甜玉米的波动较大,
例 在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧《天鹅 湖》, 参加表演的女演员的身高(单位:cm)如表所示.
哪个芭蕾舞团女演员的身高更整齐?
甲 163 164 164 165 165 166 166 167
乙 163 165 165 166 166 167 168 168
解:甲、乙两团演员的身高平均数分别是
方差分别是
由s甲2 < s乙2 可知,甲芭蕾舞团女演员的身高更整齐.
一般地,设n个数据x1,x2,…,xn的平均数为 ,则方差
s2=
它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.
如何使用计算器求方差?
使用计算器的统计功能可以求方差.操作时通常需要先按动有关键,使计算器进入统计状态,然后依次输入数据,最后按动求方差的功能键,计算器便会求出方差的值.
例 人数相同的八年级甲、乙两班学生在同一次数学单元测试中,班级平均分和方差如下: =80,s2甲=240,s2乙=180,则成绩较为稳定的班级是( )
A.甲班 B.乙班 C.两班成绩一样稳定 D.无法确定
B
解析:稳定性,也就是指成绩的波动.成绩波动越小,成绩越稳定.根据“方差越大,数据的波动越大:方差越小,数据的波动越小,我们很容易发现乙班的方差比甲班的小,所以乙班的成绩较稳定.
在利用方差比较两组数据的波动情况时,一定要先计算两组数据的平均数.一般说来,平均数可能反映数据的优劣程度,如果在平均数上已经能够区分几组数据的优劣,那么就不用再考虑方差的大小了.但在实际的习题中,往往都是平均值相同,那么此时就要考虑数据的方差情况了.由此可得到:在解决问题时,要先算平均数,当平均值不同时,择优选取;当平均数相同时,比较方差,选择波动较小的一组数据.
1.对于一组统计数据3,3,6,5, 3. 下列说法错误的是( )
A.众数是3 B.平均数是4
C.方差是1.6 D.中位数是6
D
2.设数据x1,x2,…,xn的平均数为x,方差为s2,若s2=0,则( )
A.x=0
B.x1+x2+…+xn=0
C.x1=x2=…=xn=0
D.x1=x2=…=xn
D
4.一组数据1,2,a,4,5的平均数是3,则这组数据的方差是_______.
2
乙
3.甲、乙两名射击手的100次测试的平均成绩都是9环,方差分别是0.8和0.35,则成绩比较稳定的是_______ (填“甲”或“乙”).
5.甲、乙两班举行计算机打字比赛,参赛学生每分钟打字的个数统计结果如下表:
某同学分析上表后得出如下结论:①甲、乙两班学生成绩平均水平相同;②乙班优秀的人数多于甲班优秀的人数(每分钟打字个数≥150为优秀);③甲班成绩的波动比乙班大.上述结论正确的有 .
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
①②③
方差
公式
意义
方差越大(小),数据的波动越大(小)