1.8 最小二乘估计 学案3(含答案)

文档属性

名称 1.8 最小二乘估计 学案3(含答案)
格式 zip
文件大小 1.2MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2016-08-16 21:00:10

图片预览

文档简介

1.8
最小二乘估计
学案
课标解读
1.了解最小二乘法的思想及意义(重点).2.会求线性回归方程并进行简单应用(难点).
知识1
最小二乘法
【问题导思】 
 一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:
转速x(转/秒)
16
14
12
8
每小时生产有缺陷的零件数y(件)
11
9
8
5
1.在平面直角坐标系中作出散点图.
【提示】 
2.从散点图中判断x和y之间是否具有相关关系?
【提示】 有.
3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?
【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.
 利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈现一定的规律性,我们再根据这个规律进行拟合.如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的曲线进行拟合.
知识2
线性回归方程
 如果用表示,用表示,则可以求得
b=
=eq
\f(x1y1+x2y2+…+xnyn-n\x\to(x),x+x+…+x-n2)
a=-b,这样得到的直线方程称为线性回归方程,a,b是线性回归方程的系数.
类型1
求线性回归方程
 下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃)
-1
4
10
13
18
26
数量(百个)
20
24
34
38
50
64
试判断游客数量与平均气温对应两个变量是否线性相关,若线性相关,求出其回归直线方程.
【思路探究】 确定横、纵轴的意义画出散点图,若样本点分布在某条直线附近,则两变量之间是有线性关系.
【自主解答】 (1)散点图如图所示:
可知气温与游客数量呈线性相关关系,下面求其回归直线方程.
∵==,==,
x+x+…+x
=1+16+100+169+324+676=1
286,
x1y1+x2y2+…+x6y6
=-20+96+340+13×38+18×50+26×64=3
474.
∴b=
=≈1.68,
a=-b≈18.73,
即所求的线性回归方程为y=1.68x+18.73.
1.知道x与y呈线性相关关系,无需进行相关性检验,否则,应首先进行相关性检验,如果两个变量之间本身不具有相关关系,即使求出回归方程也是毫无意义的.
2.求线性回归方程的步骤
(1)计算平均数、;
(2)计算x1y1+x2y2+…+xnyn;
(3)计算x+x+…+x;
(4)将上述有关结果代入公式
求b、a,把b、a代入方程y=a+bx,写出回归方程.
 以下是某地搜集到的新房屋的销售价格y和新房屋的面积x的数据:
新房屋面积/m2
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程.
【解】 (1)作出散点图如下图所示:
(2)由(1)中的散点图可知y与x具有线性相关关系.
=xi=109,
(xi-)2=1
570,
=yi=23.2,
(xi-)(yi-)=308,
设所求线性回归方程为y=bx+a,b==≈0.196.a=-b=23.2-109×≈1.816
6.
故所求线性回归方程为y=0.196x+1.816
6.
类型2
线性回归方程的应用
 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料知,y与x线性相关.
(1)求回归直线方程y=bx+a中a与b的值;
(2)估计使用年限为10年时,维修费用是多少?
【思路探究】 先求出回归直线方程.若回归方程为y=bx+a,则在x=x0处的估计值为y0=bx0+a.
【自主解答】 (1)列表:
i
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
=4,=5.=90,iyi=112.3.
其中,b====1.23
a=-b=5-1.23×4=0.08.
(2)回归直线方程为y=1.23x+0.08.
当x=1时,y=1.23×10+0.08=12.38.
即使用年限为10年时,维修费用约为12.38万元.
1.本题中正确求出回归直线方程后,可预测使用年限为5年、10年、15年、20年等时总支出费用的值,当然这仅是一种分析预测,事实上,可能因其他因素会产生偏差,我们认为12.38万元仅是一种估计.
2.利用线性回归方程进行回归分析,在实际问题中,应先正确求出回归直线方程,然后才能准确求解.当一个变量确定时,另一变量的值,也才能准确分析和预测.
 一台机器由于使用时间较长,生产的零件有一些会有缺损,按不同转速生产出来的零件有缺损的统计数据如下表所示:
转速x(转/秒)
16
14
12
8
每小时生产有缺损零件数y(个)
11
9
8
5
(1)作出散点图;
(2)如果y与x线性相关,求出回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?
【解】 (1)作散点图如图所示:
(2)由散点图可知y与x线性相关.
故可设回归直线方程为y=bx+a.
依题意,用计算器可算得:
=12.5,=8.25,
=660,
iyi=438.
∴b=≈0.73,
a=-b=8.25-0.73×12.5=-0.875.
∴所求回归直线方程为y=0.73x-0.875.
(3)令y=10,得0.73x-0.875=10,
解得x=15,
即机器的运转速度应控制在15转/秒内.
散点图及回归直线方程在实际中的应用有误
 有人统计了同一个省的6个城市一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:
人均GDP(万元)
10
8
6
4
3
1
患白血病的儿童人数
351
312
207
175
132
180
(1)画出散点图,并判定两个变量是否具有线性相关关系;
(2)通过计算可得两个变量的回归直线方程为y=23.25x+102.25,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?
【错解】 (1)根据表中数据画出散点图.如图所示,从图中可以看出,虽然后5个点大致分布在一条直线附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关关系.
(2)将x=12代入y=23.25x+102.25,得y=23.25×12+102.25=381.25,所以上述断言是正确的.
【错因分析】 在第(1)问中,是否具有线性相关关系,要看大部分点,主流点是否分布在一条直线附近,个别点是不影响“大局”的,所以可断定这两个变量具有线性相关关系.在第(2)问中,381.25只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人.如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护的很好,则人数就有可能远远低于380.
【防范措施】 正确理解线性相关的概念和最小二乘法思想是解决本题的关键.
【正解】 (1)根据表中数据画散点图,如错解中的图所示,从图上可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.
(2)将x=12代入y=23.25x+102.25,得y=23.25×12+102.25=381.25>380,
即便如此,但因381.25只是一个估计值,会受其他情况的影响,
所以不能断言这个城市患白血病的儿童一定超过380人.
1.求回归直线方程时应注意的问题
(1)知道x与y呈线性相关关系,则可根据有关数据求其回归直线方程,如果两个变量之间本身不具有相关关系,即使求出回归方程也是毫无意义的.
(2)用公式计算a、b的值时,要先算出b,然后才能算出a,由a=-b知回归直线必经过点(,).
2.利用回归方程,我们可以进行估计和预测.若回归直线方程为y=bx+a,则x=x0处的估计值为y0=bx0+a.
1.变量y与x之间的线性回归方程(  )
A.表示y与x之间的函数关系
B.表示y与x之间的不确定性关系
C.反映y与x之间真实关系的形式
D.反映y与x之间的真实关系达到最大限度的吻合
【解析】 由回归方程的求解过程及意义可知D正确.
【答案】 D
2.设有一个回归方程y=3-5x,变量x增加一个单位时(  )
A.y平均增加3个单位  B.y平均减少5个单位
C.y平均增加5个单位
D.y平均减少3个单位
【解析】 由回归方程中x的系数-5可知.x增加一个单位时,y平均减少5个单位.
【答案】 B
3.已知x与y之间的一组数据如下表:
x
0
1
2
3
y
1
2
4
6
则y与x的线性回归方程y=bx+a,必过点(  )
A.(2,3)
B.(1.5,3)
C.(1.5,3.25)
D.(2,3.25)
【解析】 ==1.5,
==3.25.
回归直线必过点(,).
【答案】 C
4.已知变量x,y具有线性相关关系,在某次试验中测得(x,y)的4组值为(0,2),(3,3),(-3,0),(6,5),求y与x之间的回归方程.
【解】 ==1.5,==2.5,
x1y1+x2y2+x3y3+x4y4=0×2+3×3+(-3)×0+6×5=39,
x+x+x+x=02+32+(-3)2+62=54,
∴b==.
a=-b=2.5-×1.5=1.7,
∴回归方程为y=x+.
一、选择题
1.利用最小二乘法估计回归直线方程中系数a,b时,使函数Q(a,b)取最小值,其中函数Q(a,b)等于(  )
A.iyi      B.(xi-)2
C.
D.(yi-bxi-a)2
【解析】 根据求回归直线方程中系数a、b的过程可知Q(a,b)=(yi-bxi-a)2.
【答案】 D
2.(2012·湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1
cm,则其体重约增加0.85
kg
D.若该大学某女生身高为170
cm,则可断定其体重必为58.79
kg
【解析】 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本中心点(,),因此B正确.由线性回归方程中系数的意义知,x每增加1
cm,其体重约增加0.85
kg,故C正确.当某女生的身高为170
cm时,其体重估计值是58.79
kg,而不是具体值,因此D不正确.
【答案】 D
3.若在一次试验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6).则y与x之间的回归直线方程是(  )
A.y=x+1.9
B.y=1.04x+1.9
C.y=0.95x+1.04
D.y=1.05x-0.9
【解析】 ==2.5,==4.5,将(2.5,4.5)代入选项验证得B正确.
【答案】 B
4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为(  )
A.y=x-1
B.y=x+1
C.y=88+x
D.y=176
【解析】 由题意得:==176,
==176,
由于(,)一定满足线性回归方程,经验证知C正确.
【答案】 C
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为(  )
A.63.6万元
B.65.5万元
C.67.7万元
D.72.0万元
【解析】 ==3.5,
==42,
又y=bx+a,必过(,).
∴回归方程为y=9.4x+9.1,
∴当x=6时,y=9.4×6+9.1=65.5(万元).
【答案】 B
二、填空题
6.期中考试后,某班对50名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为y=6+0.4x,由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩相差________分.
【解析】 y1-y2=0.4×(x2-x1),故x2-x1=50时,y1-y2=20.
【答案】 20
7.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
【解析】 设这5天的平均投篮命中率为P,
则P=×(0.4+0.5+0.6+0.6+0.4)=0.5,
由题可求得:b=0.01,a=0.47,
∴线性回归方程为y=0.01x+0.47,
当x=6时,y=0.01×6+0.47=0.53.
【答案】 0.5 0.53
8.某单位为了解用电量y千瓦·时与汽温x
℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(千瓦·时)
24
34
38
64
由表中数据得线性回归方程y=bx+a中b=-2,预测当气温为-4
℃时,用电量约为________千瓦·时.
【解析】 ==10,==40,
则a=-b=40+2×10=60,则y=-2x+60,
则当x=-4时,y=-2×(-4)+60=68.
【答案】 68
三、解答题
9.假若某公司的广告费支出x(百万元)与销售额y(百万元)之间有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)如果已知y与x之间具有线性相关关系,求回归方程.
(2)若实际销售额不少于60百万元,则广告费支出应不少于多少?
【解】 (1)=5,=50,=145,
iyi=1
380,
故b=
==6.5,
a=-b=50-6.5×5=17.5.
故所求的回归方程为y=6.5x+17.5.
(2)令y≥60,
即6.5x+17.5≥60,x≥6.54,
故广告费支出不应少于6.54百万元.
10.在某种产品表面进行腐蚀刻线度验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x(s)
5
10
15
20
30
40
50
60
70
90
120
y(μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出表中数据的散点图,由散点图判断y与x是否具有线性相关关系?
(2)若y与x具有线性相关关系,求回归直线方程.
【解】 (1)散点图如图所示:
由图知,y与x具有线性相关关系.
(2)先把数据列成表.
i
xi
yi
x
xiyi
1
5
6
25
30
2
10
10
100
100
3
15
10
225
150
4
20
13
400
260
5
30
16
900
480
6
40
17
1
600
680
7
50
19
1
500
950
8
60
23
3
600
1
380
9
70
25
4
900
1
750
10
90
29
8
100
2
610
11
120
46
14
400
5
520
合计
510
214
36
750
13
190
由上表可得=,=代入公式得
b=≈0.304,a=-0.304×=5.36.即所求的回归直线方程为y=0.304x+5.36.
11.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【解】 (1)由题设所给数据,可得散点图如图所示:
(2)先把数据制成表:
i
xi
yi
x
xiyi
1
3
2.5
9
7.5
2
4
3
16
12
3
5
4
25
20
4
6
4.5
36
27
合计
18
14
86
66.5
进而可求得=4.5,=3.5,
b==0.7.
a=-b
=3.5-0.7×4.5=0.35.
∴y=0.35+0.7x.
(3)当x=100时,y=70.35.即生产100吨甲产品的生产能耗比技改前降低19.65吨.