8.2 一元线性回归模型及其应用
第1课时 一元线性回归模型及其参数的最小二乘估计
学习目标
1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义. 2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法. 3.了解回归分析的基本思想方法和初步应用,针对实际问题,会用一元线性回归模型进行预测.
eq \o(\s\up7( INCLUDEPICTURE "新知学习探究LLL.TIF" INCLUDEPICTURE "新知学习探究LLL.TIF" \* MERGEFORMAT ),\s\do5( ))
INCLUDEPICTURE "新课导学1LLL.TIF" INCLUDEPICTURE "新课导学1LLL.TIF" \* MERGEFORMAT
通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系,是正相关还是负相关,以及线性相关程度的强弱等.
思考 是否能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型来刻画两个变量之间的相关关系,并通过模型进行预测?
提示:能,当两个变量之间有较强的线性相关关系时,可以用一元线性回归模型刻画两个变量之间的关系.
一 一元线性回归模型
一元线性回归模型的完整表达式为其中,Y称为__________或__________,x称为自变量或__________;a和b为模型的未知参数,a称为截距参数,b称为斜率参数,e是Y与bx+a之间的____________.
[答案自填] 因变量 响应变量 解释变量
随机误差
【即时练】
1.判断正误,正确的打“√”,错误的打“×”.
(1)随机误差是一个随机变量,产生的原因是多方面的.( )
(2)在一元线性回归模型中,e是bx+a与真实值y的随机误差,它是一个可观测的量.( )
答案:(1)√ (2)×
2.若某制造企业年收入x与支出Y满足一元线性回归模型Y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该制造企业收入为10亿元,年支出预计不会超过( )
A.9亿元 B.9.5亿元
C.10亿元 D.10.5亿元
解析:选D.由题意得,Y=0.7x+3+e.
当x=10时,得Y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤Y≤10.5,所以年支出预计不会超过10.5亿元.故选D.
二 经验回归方程与最小二乘法
1.经验回归方程的系数计算公式
经验回归方程 的计算公式 的计算公式
=__________ == eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) =-
2.最小二乘法
=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.
3.经验回归方程的性质
(1)经验回归方程一定过点(____________);
(2)一次函数=x+的单调性由的符号决定,函数递增的充要条件是____________;
(3)(>0)的实际意义:当x增大一个单位时,________个单位.
[答案自填] x+ , >0 增大
INCLUDEPICTURE "例1LLL.TIF" INCLUDEPICTURE "例1LLL.TIF" \* MERGEFORMAT 某班5名学生的数学和物理成绩如下表:
学生 A B C D E
数学成绩x/分 88 76 73 66 63
物理成绩y/分 78 65 71 64 61
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的经验回归方程.
参考公式:= eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) =,=-.
【解】 (1)散点图如图所示.
INCLUDEPICTURE "25RJS8-10.TIF" INCLUDEPICTURE "25RJS8-10.TIF" \* MERGEFORMAT
(2)因为=×(88+76+73+66+63)=73.2,
=×(78+65+71+64+61)=67.8,
iyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174,
所以= eq \f(\i\su(i=1,5,x)iyi-5\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,5,x)-5\o(x,\s\up6(-))2) ≈0.625,
=-≈67.8-0.625×73.2=22.05.
因此y关于x的经验回归方程为=0.625x+22.05.
INCLUDEPICTURE "解题技法LLL.TIF" INCLUDEPICTURE "解题技法LLL.TIF" \* MERGEFORMAT
求经验回归方程的基本步骤
(1)画出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算,,,iyi等的值;
(3)代入公式,求出=x+中参数,的值;
(4)写出经验回归方程并对实际问题作出估计.
[注意] 只有在散点图大致呈线性相关关系时,求出的经验回归方程才有实际意义.
[跟踪训练1] (1)对两个具有线性相关关系的变量x和y进行统计时,得到一组数据(1,0.3),(2,4.7),(3,m),(4,8),通过这组数据求得经验回归方程为=2.4x-2,则m的值为( )
A.3 B.5 C.5.2 D.6
解析:选A.易知==,=,代入=2.4x-2得=2.4×-2,解得m=3.故选A.
(2)为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知i=52,i=228,=478,iyi=1 849,则y关于x的经验回归方程是_____________________.(精确到0.01)
解析:由题意知,i=52和i=228,
可得=,=,
可得= eq \f(\i\su(i=1,8,x)iyi-8\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,8,x)-8\o(x,\s\up6(-))2) ≈2.62,
则=-≈-2.62×=11.47,
所以经验回归方程为=2.62x+11.47.
答案:=2.62x+11.47
三 利用经验回归方程对总体进行估计
INCLUDEPICTURE "例2LLL.TIF" INCLUDEPICTURE "例2LLL.TIF" \* MERGEFORMAT 《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”.下表是某市一主干路口监控设备所抓拍的2024年1-5月份内驾驶员不“礼让斑马线”行为的统计数据:
月份 1 2 3 4 5
违法驾驶员人数 120 105 100 90 85
参考公式:=,=-.
(1)请利用所给数据求违法驾驶员人数y与月份x之间的经验回归方程=x+;
(2)预测该路口9月份的不“礼让斑马线”违法驾驶员人数.
【解】 (1)由题表中的数据可得==3,
==100,
所以(xi-)(yi-)=-2×20-5+0+1×(-10)+2×(-15)=-85,
(xi-)2=(-2)2+(-1)2+0+12+22=10,
所以==-=-8.5,=-=100+8.5×3=125.5,
所以违法驾驶员人数y与月份x之间的经验回归方程为=-8.5x+125.5.
(2)当x=9时,=-8.5×9+125.5=49,因此,预测该路口9月份的不“礼让斑马线”违法驾驶员人数为49.
【变式探究】
(综合变式)假如该市在6月份针对不“礼让斑马线”进行为期一个月的整治活动后,在11月份抓拍不“礼让斑马线”违法驾驶员20人,问这次整治活动有无效果?
解:如果不进行整治活动,根据例2(1)所得经验回归方程=-8.5x+125.5,当x=11时,=-8.5×11+125.5=32,即11月份大约不“礼让斑马线”违法驾驶员32人,而实际只有20人,说明这次整治活动有效果.
INCLUDEPICTURE "解题技法LLL.TIF" INCLUDEPICTURE "解题技法LLL.TIF" \* MERGEFORMAT
(1)判断两个变量是否线性相关:可以利用样本相关系数,也可以画散点图.
(2)求经验回归方程,注意运算的正确性.
(3)根据经验回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.
[跟踪训练2] (1)(多选)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(单位:次/分钟)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的经验回归方程=0.25x+k,则下列说法正确的是( )
x 20 30 40 50 60
y 25 27.5 29 32.5 36
A.k的值是20
B.变量x,y呈正相关关系
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀每分钟鸣叫52次时,该地当时的气温预测值为33.5 ℃
解析:选ABC.由题表中的数据,可得=×(20+30+40+50+60)=40,=×(25+27.5+29+32.5+36)=30.
由经验回归方程为=0.25x+k,可得k=-0.25=30-0.25×40=20,所以A正确;由经验回归方程可知=0.25>0,可得变量x,y呈正相关关系,所以B正确;由=0.25,可得x的值增加1,则y的值约增加0.25,所以C正确;当x=52时,可得=0.25×52+20=33,所以D不正确.故选ABC.
(2)中医是中华民族五千年传统文化的瑰宝,是千百年医疗实践的结晶,也是世界优秀文化的精华.某中医药企业根据市场调研与模拟,得到研发投入x(单位:亿元)与产品收益 y(单位:亿元)的数据统计如下表:
研发投入x/亿元 1 2 3 4 5
产品收益y/亿元 3 7 9 10 11
用最小二乘法求得 y关于x的经验回归方程是=x+2.9,当研发投入为20亿元时,相应的产品收益估计值为________.
解析:由题表中的数据可得
==3,==8,
将样本中心点(,)代入经验回归方程可得3+2.9=8,解得=1.7,所以经验回归方程为=1.7x+2.9,当x=20时,=1.7×20+2.9=36.9(亿元),因此,当研发投入为20亿元时,相应的产品收益估计值为36.9.
答案:36.9
eq \o(\s\up7( INCLUDEPICTURE "课堂巩固自测LLL.TIF" INCLUDEPICTURE "课堂巩固自测LLL.TIF" \* MERGEFORMAT ),\s\do5( ))
1.用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5,6)的经验回归方程为=2x+3,若i=30,则i=( )
A.11 B.13 C.63 D.78
解析:选D.依题意,因为i=30,所以==5,因为经验回归直线=2x+3一定过点(,),所以=2+3=2×5+3=13,所以i=6×13=78.故选D.
2.(多选)已知某产品的销售额y与广告费用x之间的关系如表:
x/万元 0 1 2 3 4
y/万元 10 15 m 30 35
若根据表中的数据用最小二乘法求得y关于x的经验回归方程为=6.5x+9,则下列说法中正确的是( )
A.产品的销售额与广告费用成正相关
B.该经验回归直线过点(2,22)
C.当广告费用为10万元时,销售额一定为74万元
D.m的值是20
解析:选ABD.对于A,经验回归方程=6.5x+9中=6.5>0,可知产品的销售额与广告费用成正相关,故A正确;对于D,==2,== ,
代入=6.5x+9,得=6.5×2+9,解得m=20,故D正确;对于B,由==22,得该经验回归直线过点(2,22),故B正确;对于C,取x=10,得=6.5×10+9=74,说明当广告费用为10万元时,销售额预计为74万元,故C错误.故选ABD.
3.(教材P113 T2改编)已知女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为=0.81x+25.82,当父亲身高每增加1 cm,则女儿身高平均增加________.
解析:由经验回归方程知,当父亲身高每增加1 cm,则女儿身高平均增加0.81 cm.
答案:0.81 cm
4.(教材P120习题8.2T2改编)某车间为了确定合理的工时定额,需要确定加工零件所花费的时间,为此进行了五次试验,得到数据如下:
零件的个数x/个 1 2 3 4 5
加工的时间y/h 1.5 2.4 3.2 3.9 4.5
(1)求出 y 关于 x 的经验回归方程;
(2)试预测加工 9 个零件需要多少时间?
参考公式:= eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) ,=-.
解:(1)由题表中数据得,
==3,
==3.1,
iyi=54,=55,
根据公式知,= eq \f(\i\su(i=1,5,x)iyi-5\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,5,x)-5\o(x,\s\up6(-))2) ==0.75,
=-=3.1-0.75×3=0.85,
所以经验回归方程为=0.75x+0.85.
(2)将x=9代入经验回归方程得,=0.75×9+0.85=7.6,
所以预测加工9个零件需要7.6 h.
INCLUDEPICTURE "课堂小结.TIF" INCLUDEPICTURE "课堂小结.TIF" \* MERGEFORMAT
1.已学习:(1)一元线性回归模型的概念;(2)由最小二乘法求经验回归方程;(3)利用经验回归方程进行预测.
2.须贯通:求经验回归方程前必须判断两个变量是否线性相关,再利用求经验回归方程的公式求解经验回归方程.
3.应注意:(1)不判断变量间是否具有线性相关关系;(2)盲目求解经验回归方程致误.