1.8
最小二乘法
学案
一、学习目标
1.掌握最小二乘法的思想
2.能根据给出的线性回归方程系数公式建立线性回归方程
二、重点、难点
重点:最小二乘法的思想
难点:线性回归方程系数公式的应用
三、课前预习
1、用什么样的线性关系刻画会更好一些?
2、用什么样的方法刻画点与直线的距离会方便有效?
3、怎样刻画多个点与直线的接近程度?
4、怎样使达到最小值?
5.求回归直线方程的思想方法
观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?
四、堂中互动
【教师点拨】求线性回归方程,通常是用计算器来完成的.在有的计算器中,可通过直接按键的得出线性回归方程的系数.如果用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的那些相关数据,线性回归方程中的系数也就很容易求出来了.
(另:线性回归方程中,)
例1
在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y)与当天气温(x)之间是线性相关的。数据如下表
气温(xi)/oC[
26
18
13
10
4
-1
杯数(yi)/杯
20
24
34
38
50
64
试用最小二乘法求出线性回归方程。
如果某天的气温是-3
oC,请预测可能会卖出热茶多少杯。
点评:了解最小二乘法的概念,熟记求线性回归方程公式.
五、即学即练
1.正常情况下,年龄在18岁到38岁的人们,体重y(kg)依身高x(cm)的回归方程为y=0.72x-58.5。张红红同学不胖不瘦,身高1米78,他的体重应在
kg左右。
2.已知x,y之间的一组数据如下表,则y与x的线性回归方程y=a+bx必经过点(
)
x
0
1
2
3
y
1
3
5
7
3.某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
商店名称
A
B
C
D
E
销售额(x)/千万元
3
5
6
7
9
利润额(y)/百万元
2
3
3
4
5
画出销售额和利润额的散点图;
若销售额和利润额具有相关关系,计算利润额y对销售额x的回归直线方程。
练案
A组
1、下列说法中正确的是(
)
A.任何两个变量都具有相关关系
B.人的知识与其年龄具有相关关系
C.散点图中的各点是分散的没有规律
D.根据散点图求得的回归直线方程都是有意义的
2.对于回归方程=2.75x+9,当x=4时,y的估计值是
.
3.给出施化肥量对水稻产量影响的试验数据:
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
(1)画出上表的散点图;
(2)求出回归直线并且画出图形
B组
1.变量y与x之间的回归方程()
A.表示y与x之间的函数关系
B.表示y和x之间的不确定关系
C.反映y和x之间真实关系的形式
D.反映y与x之间的真实关系达到最大限度的吻合
2.线性回归方程=bx+a必过(
)
A、(0,0)点
B、(,0)点
C、(0,)点
D、(,)点
3.设一个回归方程为=3—1.2x,则变量x增加一个单位时(
)
A、y平均增加1.2个单位
B、y平均增加3个单位
C、y平均减少1.2个单位
D、y平均减少3个单位
4.在某种产品表面进行腐蚀线试验,得到腐蚀深度y与腐蚀时间x之间对应的一组数据:
时间t(s)
5
10
15
20
30
40
50
60
70
90
120
深度y(μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。
1.8
最小二乘法答案
三、课前预习
1、想法:保证这条直线与所有点都近(也就是距离最小)。
最小二乘法就是基于这种想法。
2、设直线方程为y=a+bx,样本点A(xi,yi)
方法一、点到直线的距离公式
方法二、
显然方法二能有效地表示点A与直线y=a+bx的距离,而且比方法一更方便计算,所以我们用它来表示二者之间的接近程度。
3、例如有5个样本点,其坐标分别为(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)与直线y=a+bx的接近程度:
从而我们可以推广到n个样本点:(x1,y1),(x2,y2),…(xn,yn)与直线y=a+bx的接近程度:
使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法
4、先来讨论3个样本点的情况
设有3个点(x1,y1),(x2,y2),(x3,y3),则由最小二乘法可知直线y=a+bx与这3个点的接近程度由下面表达式刻画:
…………………①
整理成为关于a的一元二次函数,如下所示:
利用配方法可得
从而当时,使得函数达到最小值。
将代入①式,整理成为关于b的一元二次函数,
同样使用配方法可以得到,当
时,使得函数达到最小值。
从而得到直线y=a+bx的系数a,b,且称直线y=a+bx为这3个样本点的线性回归方程。
用同样的方法我们可以推导出n个点的线性回归方程的系数:
其中
由我们知道线性回归直线y=a+bx一定过。
5.引导学生分析,最能代表变量x与y之间关系的直线的特征:即n个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a、b是待定系数。
则,于是得到各个偏差。
显见,偏差的符号有正负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和
表示n个点与相应直线在整体上的接近程度。
记。
上述式子展开后,是一个关于a,b的二次多项式,应用配方法,可求出使Q为最小值时的a,b的值,即
其中
以上方法称为最小二乘法。
四、堂中互动
例1
解:(1)先画出其散点图
i
xi
yi
xi2
xiyi
1
26
20
676
520
2
18
24
324
432
3
13
34
169
442
4
10
38
100
380
5
4
50
16
200
6
-1
64
1
-64
合计
70
230
1286
1910
可以求得
则线性回归方程为y
=57.557-1.648x
(2)当某天的气温是-3
oC时,卖出热茶的杯数估计为:
五、即学即练
1.
69.66
2.D
3解:(1)
(2)数据如下表:
i
xi
yi
xi2
xiyi
1
3
2
9
6
2
5
3
25
15
3
6
3
36
18
4
7
4
49
28
5
9
5
81
45
合计
30
17
200
112
可以求得b=0.5,a=0.4
线性回归方程为:
练案
A组
1、B
2.
20
3.解:(1)散点图(略).
(2)表中的数据进行具体计算,列成以下表格
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330
345
365
405
445
450
455
xiyi
4950
6900
9125
12150
15575
18000
20475
,
故可得到
B组
1.
D
2.
D
3.
C
4.解:(1)散点图略,呈直线形.
(2)经计算可得:
故所求的回归直线方程为。