2.3.2两个变量的线性相关

文档属性

名称 2.3.2两个变量的线性相关
格式 rar
文件大小 8.5MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2011-01-24 13:48:00

文档简介

(共35张PPT)
探究:我们已经发现人体的脂肪含量和年龄之间有相关关系,那么当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?
0
年龄
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
脂肪含量
从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.
像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线叫回归方程.
“ 回归 ” 这个词是由英国著名的统计学家Francils Galton提出来的.人们把由一个变量的变化去推测另一个变量的变化的方法称为回归方法.
探究:我们该怎样来求出这个回归方程呢?
小组讨论
方案1:先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程.
0
年龄
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
脂肪含量
方案2:在图中选两点作直线,使直线两侧的点的个数基本相同.
如图:
0
年龄
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
脂肪含量
方案3:如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距,得回归方程.
如图:
0
年龄
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
脂肪含量
思考:我们还可以找到更多的方法,但这些方法都可行吗?科学吗?准确吗?怎样的方法是最好的?
分析:上面给出的几种方案可靠性都不是很强,
实际上,求回归直线的关键是如何用数学的方法
来刻画“从整体上看,各点到此直线的距离最小”.
问题:你能解释“从整体上看,各点到此直线的距离最小”的含义吗?
设所求回归方程为y =bx+a,其中a,b是待定参数.
则yi=bxi +a(i=1,2,…,n).于是得到的各个偏
差yi -yi =yi -(bxi +a)(i=1,2,…,n).
用这n个偏差的和来刻画 “各点到此直线的整体偏差”.



最小二乘法
由于偏差yi –yi 可正可负,为了避免相互抵消,
可考虑用 来代替,但它含有绝对值,运
算不方便,故采用n个偏差的平方和
Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yx-bxx-a)2
来刻画n个点与回归直线在整体上的偏差.

∑|yi –yi |
n
i-1

最小二乘法:通过求上式的最小值而得到回归直线的方法,即求回归直线,使样本数据的点到该直线的距离的平方和最小的方法.
问题:a,b取什么值时Q最小,即总体偏差最小.
下面是计算回归方程的斜率和截距的一般公式.
∑(xi -x)(yi -y)
i-1
n
∑(xi -x)2
i-1
n
∑xi yi -nxy
i-1
n
∑ xi 2-nx-2
i-1
n
=
b=
a=y –bx .
其中,b是回归方程的斜率,a是截距.
根据最小二乘法的思想和上述公式,利用计算器可以方便地求出回归方程.
以Excel为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:
(1)在Excel中选定散点图,在菜单中选定“图表”
中的 “添加趋势线” 选项,弹出 “添加趋势线” 对
话框.
(2)单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按纽,得到回归直线.
(3)双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的方程.
思考:将表2-3中的年龄作为x代入上述回归方
程,看看得出的数值与真实数值之间的关系.
从中你体会到什么?
分析:利用回归直线,我们可以进行预测.例如,某人37岁,我们预测他的体内脂肪含量在20.90%(0.577×37-0.448=20.90%)附近的可能性比较大.
例1:观察两相关变量得如下表:
x -1 -2 -3 -4 -5 5 4 3 2 1
y -9 -7 -5 -3 -1 1 5 3 7 9
求两变量间的回归方程.
i 1 2 3 4 5 6 7 8 9 10
x -1 -2 -3 -4 -5 5 4 3 2 1
y -9 -7 -5 -3 -1 1 5 3 7 9
xy 9 14 15 12 5 5 15 12 14 9
解1:列表
计算得:x =0,y =0, ,
∑xi2=110
10
i-1
∑xi yi =110
10
i-1
∑ xi yi -10xy
i-1
10
∑ xi 2-10x 2
i-1
10
=
b=
a=y –bx =0-b·0=0.
110-10×0
110-10×0
=1
∴所求回归直线方程为.
解2:用Excel求线性回归方程.
小结:求线性回归直线方程的步骤:
第一步:列表 xi ,yi ,xi yi ;
第二步:计算x,y, , ;
∑xi 2
n
i-1
∑xi yi
n
i-1
第三步:代入公式计算b,a的值;
第四步:写出直线方程.
例3 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x / s 5 10 15 20 30 40 50 60 70 90 120
y /
μm 6 10 10 13 16 17 19 23 25 29 46
(1)画出表中数据的散点图;
(2)求回归方程;
(3)试预测腐蚀时间为100s时腐蚀深度是多少.
解:(1)散点图如下
y
t
10
20
30
40
50
5
10
15
20
30
40
50
60
70
90
120
(2)从散点图可以看出,这些点大致分布在一
条直线的附近,因此,可用相关公式求出回归方
程的系数.根据相关公式求腐蚀深度y对腐蚀时间
x的回归方程的步骤如下:
第一步:计算a,b的值.
由上表分别计算的平均数得:x = , y = ,
510
11
214
11
∑xi yi =13910,
11
i-1
∑xi 2=36750
11
i-1
代入相关公式得b=
13910-11× ×
510
11
214
11
36750-11×( )2
510
11
≈0.304
a= -0.304× ≈5.346
214
11
510
11
第二步:写出回归归方程.
腐蚀深度y对腐蚀时间x的回归直线方程为
y =0.304x +5.346.
<
(3)令x=100s代入回归方程,得y =0.304×
100+5.346=35.746(μm), 所以腐蚀深度大
约是35.746μm .
<
例4 设对变量x,y有如下观察数据,试使用函数型计算器求回归方程.
x 151 152 153 154 156 157 158 160 160 162 163 164
y 40 41 41 41.5 42 42.5 43 44 45 45 46 45.5
练习:
1.已知回归直线方程为:y =0.5x -0.81,则x=
20时,y的估计值为 .
2.线性回归直线方程y =a+bx必过定点 ( )
A. (0,0) B. (x,0)
C. (0,y) D. (x,y)
3. 对某种机器购置后运营年限x(1,2,3,…)与当年增加利润y的统计分析知具备线性相关关系,回归方程为:y =10.47-1.3x估计该台机器使用 年最合算.
<
<
<
9.19
D
8
4.已知两个变量x和y之间具有线性相关系,5次
试验的观测数据如下:
x 100 120 140 160 180
y 45 54 62 75 92
经计算得回归方程y =bx +a的系数b=0.575,则a等
于 ( )
A. -14.9 B. -13.9
C. -12.9 D. 14.9
<
A
5.某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这件服装件数x(件)之间有如下一组数据:
服装件数x(件) 3 4 5 6 7 8 9
某周内获纯利y(元) 66 69 73 81 89 90 91
(1)求x,y;
(2)若纯利y与每天销售这件服装件数x之间是线性相关的,求回归方程;
(3)若该店每天至少要获利200元,请你预测该店每天至少要销售这种服装多少件?
3+4+5+6+7+8+9
7
解:(1)x = =6,
y = =79.86;
66+69+73+81+89+90+91
7
(2)因为x =6,y =79.86,
∑xi yi =3487,
7
i-1
∑xi 2=280,所以b =
7
i-1
∑xi yi -7x y
7
i-1
∑xi 2-7x 2
7
i-1
3487-7×6×79.86
280-7×62
=
=4.75
a=y -bx =79.86-4.75×6=51.36
故回归方程为y =4.75x +51.36.
<
(3)令y=200,代入回归方程中得200=4.75x +
51.36,解之得x=31.29≈32.
6.在英语教学中,为了了解学生的词汇量,设计了一份包含100个单词的试卷,现抽取15名学生进行测试,得到学生掌握试卷中单词个数x与该生实际掌握单词量y的对应数据如下:
(1)作散点图;
(2)如果y与x之间具有线性相关关系,则求y 对x的回归直线方程.
解:
(1)
(2)因为x =68.93,y =22.8,
∑xi yi =2.29×106
15
i-1
∑xi 2 =71822, 所以b=
15
i-1
∑xi 2 -15x 2
15
i-1
∑xi yi -15x y
15
i-1
2.29×106-15×68.93×2208
71822-15×68.932
=
a =y -bx =79.86-4.75×6=51.36
故回归方程为y =4.75x+51.36
<
回归直线方程为y =13.5x +1277
<
7.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x的数据:
房屋面积(m2) 115 110 80 135 105
销售价格(万元) 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.
解:(1)数据对应的散点图如图所示:
5
70
10
15
20
25
30
90
110
130
150
(2)x =
1
5
∑xi =109, y =
5
i-1
1
5
∑yi =23.2,
5
i-1
b =
∑(xi -x)(yi -y)
5
i-1
∑(xi -x)2
5
i-1
308
1570
=
≈0.1962,
308
1570
则a=y -bx=23.2-109× ≈1.8166,
故所求回归直线方程为y =0.1962x+1.8166.
<
(3)据(2),当x =150m2时,销售价格的估计
值为:y =0.1962×150+1.8166=31.2466(万元).
<
下面是我国居民生活污水排放量的一组数据:
年份 1998 1999 2000 2001 2002 2003 2004 2005
排放量 151 189.1 194.8 203.8 220.9 227.7 232.3
  试由此估计1999年我国居民生活污水排放量,并预测2007年生活污水排放量(单位:10st) ,并查阅有关资料证实你的结论.