8.2.1 一元线性回归模型及参数的最小二乘估计 学案(含答案)-2024春高中数学选择性必修3(人教版)

文档属性

名称 8.2.1 一元线性回归模型及参数的最小二乘估计 学案(含答案)-2024春高中数学选择性必修3(人教版)
格式 docx
文件大小 191.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-03-13 16:33:19

图片预览

文档简介

§8.2.1 一元线性回归模型及参数的最小二乘估计
[学习目标] 
1.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,建立一元线性回归模型进行预测.
2.了解随机误差、残差、残差图的概念.3.会通过残差分析一元线性回归模型的拟合效果.
一、一元线性回归模型
生活经验告诉我们,儿子的身高与父亲的身高具有正相关的关系,为了进一步研究两者之间的关系,有人调查了某所高校14名男大学生的身高及其父亲的身高,得到的数据如表所示:
编号 1 2 3 4 5 6 7
父亲身高/cm 174 170 173 169 182 172 180
儿子身高/cm 176 176 170 170 185 176 178
编号 8 9 10 11 12 13 14
父亲身高/cm 172 168 166 182 173 164 180
儿子身高/cm 174 170 168 178 172 165 182
我们画出散点图(课本105页图8.2-1)并通过计算得到样本相关系数r≈0.886.
问题1 由样本相关系数可以得到什么结论?
问题2 这两个变量之间的关系可以用函数模型来刻画吗?
知识梳理
一元线性回归模型:我们称
为Y关于x的____________________模型,其中,Y称为____________或________________,x称为____________或______________;a和b为模型的未知参数,a称为________参数,b称为________参数;e是Y与bx+a之间的______________.
例1 判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?
(1)某公司的销售收入和广告支出;
(2)某城市写字楼的出租率和每平方米月租金;
(3)航空公司的顾客投诉次数和航班正点率;
(4)某地区的人均消费水平和人均国内生产总值(GDP);
(5)学生期末考试成绩和考前用于复习的时间;
(6)一辆汽车在某段路程中的行驶速度和行驶时间;
(7)正方形的面积与周长.
反思感悟 在函数关系中,变量X对应的是变量Y的确定值,而在相关关系中,变量X对应的是变量Y的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量之间的一种数量依存关系,对于这种关系,通常运用统计方法进行研究.通过对相关关系的研究又可以总结规律,从而指导人们的生活与生活实践.
跟踪训练1 若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入为10亿元,年支出预计不会超过(  )
A.9亿元 B.9.5亿元
C.10亿元 D.10.5亿元
二、最小二乘法和经验回归方程
问题3 在一元线性回归模型中,表达式Y=bx+a+e刻画的是变量Y与x之间的线性相关关系,其中参数a和b未知,确定参数a和b的原则是什么?
知识梳理
最小二乘法:我们将=x+称为Y关于x的________________________,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做________________,求得的,叫做b,a的____________________,
例2 (1)某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
气温x(℃) 18 13 10 -1
用电量y(度) 24 34 38 64
由表中数据得到经验回归方程=-2x+,则当气温为-3 ℃时,预测用电量为(  )
A.68度 B.66度
C.28度 D.12度
(2)某商场为了迎接暑期旅游旺季,确定暑期营销策略,进行了投入促销费用x和商场实际销售额y的试验,得到如下四组数据.
投入促销费用x(万元) 2 3 5 6
商场实际销售额y(万元) 100 200 300 400
①画出上述数据的散点图,并据此判断两个变量是否具有较强的线性相关关系;
②求出x,y之间的经验回归方程=x+;
③若该商场计划实际销售额不低于600万元,则至少要投入多少万元的促销费用?
反思感悟 求经验回归方程的步骤
(3)写:写出经验回归方程.
跟踪训练2 (1)若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为y=6.5x+17.5,则表中m的值为(  )
x 2 4 5 6 8
y 30 40 m 50 70
A.60 B.55 C.50 D.45
(2)重楼,中药名,具有清热解毒、消肿止痛、凉肝定惊之功效,具有极高的药用价值.近年来,随着重楼的药用潜力被不断开发,野生重楼资源已经满足不了市场的需求,巨大的经济价值提升了家种重楼的热度,某机构统计了近几年某地家种重楼年产量y(单位:吨),统计数据如表所示.
年份 2016 2017 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5 6 7
年产量y/吨 130 180 320 390 460 550 630
①根据表中的统计数据,求出y关于x的经验回归方程;
②根据①中所求方程预测2024年该地家种重楼的年产量.
三、线性回归分析
问题4 如果给出了两个模型,那么如何比较这两个模型的拟合效果?
知识梳理
1.残差:对于响应变量Y,通过观测得到的数据称为__________,通过经验回归方程得到的称为__________,____________减去__________称为残差.
2.残差分析:________是随机误差的估计结果,通过对________的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为________________.
3.残差平方和法
残差平方和越________,模型的拟合效果越好.
4.决定系数R2
可以用R2=1-来比较两个模型的拟合效果,R2越________,模型的拟合效果越________,R2越________,模型的拟合效果越________.
例3 (1)(多选)对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则(  )
A.残差平方和越大,模型的拟合效果越好
B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系
(2)假定小麦基本苗数x与成熟期有效穗y之间存在线性相关关系,今测得5组数据如下表:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
并由最小二乘法计算得经验回归方程为=0.29x+34.7.
①计算各组残差,并计算残差平方和;
②求R2.
参考数据:=50.18.
反思感悟 刻画回归效果的三种方法
(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.
(2)残差平方和法:残差平方和越小,模型的拟合效果越好.
(3)决定系数R2法:R2=1-越接近1,表明模型的拟合效果越好.
跟踪训练3 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
求y关于x的经验回归方程,并借助残差平方和及R2说明回归模型拟合效果的好坏.
1.知识清单:
(1)一元线性回归模型.
(2)最小二乘法、经验回归方程的求法.
(3)线性回归分析:残差图法、残差平方和法和R2法.
2.方法归纳:数形结合、转化化归.
3.常见误区:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错.
1.收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,按不同的曲线来拟合y与x之间的关系,并算出了对应的决定系数R2如表所示,
拟合曲线 直线 指数曲线 抛物线 二次曲线
回归模型 y=19.8x-463.7 y=e0.27x-3.84 y=0.367x2-202 y=
R2 0.746 0.996 0.902 0.002
则应选择拟合最好的回归模型为(  )
A.y=19.8x-463.7
B.y=e0.27x-3.84
C.y=0.367x2-202
D.y=
2.(多选)已知变量y与x具有线性相关关系,统计得到6组数据如下表:
x 2 4 7 10 15 22
y 8.1 9.4 12 14.4 18.5 24
若y关于x的经验回归方程为=0.8x+,则(  )
A.变量y与x之间正相关
B.=14.4
C.=6.8
D.当x=12时,y的估计值为15.6
3.某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据列(个数x,加工时间y)为:(10,62),(20,a),(30,75),(40,81),(50,89).若用最小二乘法求得其经验回归方程为=0.67x+54.9,则a的值为________.
4.下表是某饮料专卖店一天卖出奶茶的杯数y与当天气温x(单位:°C)的对比表,已知由表中数据计算得到y关于x的经验回归方程为=x+27,则相应于点(10,20)的残差为________.
气温x/°C 5 10 15 20 25
杯数y 26 20 16 14 14
§8.2 一元线性回归模型及其应用
第1课时 一元线性回归模型及参数的最小二乘估计
问题1 通过样本相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.
问题2 不能.因为这两个变量之间不是函数关系,也就不能用函数模型刻画.
知识梳理
一元线性回归 因变量 响应变量 自变量 解释变量 截距 斜率 
随机误差
例1 解 (1)(2)(3)(4)(5)回归模型,(6)(7)函数模型.
跟踪训练1 D [因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,
所以y=0.7x+3+e.
当x=10时,
得y=0.7×10+3+e=10+e,
又|e|≤0.5,即-0.5≤e≤0.5,
所以9.5≤y≤10.5,
所以年支出预计不会超过10.5亿元.]
问题3 使表示成对样本数据的这些散点在整体上与一条适当的直线尽可能地接近.
知识梳理
经验回归方程 最小二乘法
最小二乘估计
例2 (1)B [由表中数据可知
==10,
==40,
所以经验回归直线=-2x+过点(10,40),
即40=-2×10+,得=60,
则经验回归方程为=-2x+60,
当x=-3时,=-2×(-3)+60=66.]
(2)解 ①散点图如图所示.
从散点图上可以看出两个变量具有较好的线性相关关系.
②因为==4,
==250,
=-=250-70×4=-30.
故所求的经验回归方程为=70x-30.
③由题意得70x-30≥600,即x≥=9,
所以若该商场计划实际销售额不低于600万元,则至少要投入9万元的促销费用.
跟踪训练2 (1)A [由表中数据,得=×(2+4+5+6+8)=5,
=×(30+40+m+50+70)=38+,因为经验回归直线=6.5x+17.5过点,
所以38+=6.5×5+17.5,
解得m=60.]
(2)解 ①由表格数据,得==4,
==380,
则===85,
所以=-=380-85×4=40,
所以y关于x的经验回归方程为=85x+40.
②由题可知,2024年的年份代码为9,即x=9,
将x=9代入经验回归方程,
得=85×9+40=805,
所以预测2024年该地家种重楼的年产量为805吨.
问题4 残差图、残差平方和、决定系数.
知识梳理
1.观测值 预测值 观测值 预测值
2.残差 残差 残差分析
3.小
4.大 好 小 差
例3 (1)BD [因为残差平方和越小,模型的拟合效果越好,故A错误;
在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;
因为决定系数R2越接近1,说明模型的拟合效果越好,故C错误;
由样本相关系数为负且接近-1,可知y和x之间具有很强的负线性相关关系,故D正确.]
(2)解 ①由i=xi+,
可以算得i=yi-i分别为1=0.35,
2=0.718,3=-0.5,
4=-2.214,5=1.624,
残差平方和为8.43.
②R2≈1-≈0.832.
跟踪训练3 解 =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
所以=
=-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是
=-1.15x+28.1.
列出残差表为
yi-i 0 0.3 -0.4 -0.1 0.2
yi- 4.6 2.6 -0.4 -2.4 -4.4
R2≈0.994,
所以回归模型的拟合效果很好.
随堂演练
1.B [由决定系数R2来刻画回归效果,R2的值越大越接近1,说明模型的拟合效果最好.由表可知指数模型的决定系数最接近1.]
2.AB [由y关于x的经验回归方程=0.8x+,可知变量y与x之间正相关,故A正确;
由表中数据可知
==10,
==14.4,故B正确;
又经验回归直线过点(,),将其代入=0.8x+可得=14.4-0.8×10=6.4,故C错误;
因此,y关于x的经验回归方程为=0.8x+6.4,将x=12代入可得,=0.8×12+6.4=16,
即当x=12时,y的估计值为16,故D错误.]
3.68
解析 根据题意可得,
=×
=30,
=×
=61.4+.
又经验回归直线经过点(,),
故可得61.4+=0.67×30+54.9,
解得a=68.
4.-1
解析 ==15,
==18,
代入经验回归方程=x+27得
18=15+27,解得=-0.6,
则经验回归方程为=-0.6x+27.
所以相应于点(10,20)的残差为20-(-0.6×10+27)=-1.