(共56张PPT)
第2课时 回归分析及非线性回归模型
1.结合实例,了解随机误差、残差、残差图的概念. 2.对回归模型会进行残差分析. 3.了解非线性回归模型的基本思想方法,能转化为一元线性回归模型解决实际问题. 4.能利用R2判断回归模型的拟合效果.
学 习
目 标
新知学习 探究
PART
01
第一部分
思考2 对于教材P105表8.2-1中的第6个数据,我们发现当父亲身高为172 cm时,儿子的身高实际为176 cm,实际身高与预测的身高相差了多少?
提示:176-173.265=2.735(cm).
思考3 只要给出一组成对样本数据,利用最小二乘法就可求出经验回归方程吗?
提示:不一定,成对样本数据除了线性相关,还有非线性相关.
观测值
预测值
残差
残差分析
2.残差分析
作图时__________为残差,____________可以选为样本编号,或身高数据等,这样作出的图形称为残差图.若残差点比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,带状区域越窄,则说明拟合效果越好.
纵坐标
横坐标
(1)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是( )
√
【解析】 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.故选D.
x -2 -1 0 1 2
y 5 ? 2 2 1
(2)已知变量x和y的统计数据如下表:
-0.6
√
[跟踪训练1] (1)已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第( )
A.4个
B.5个
C.6个
D.7个
解析:原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.
(2)某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示.(残差=观测值-预测值)
x 3 4 5 6
y 2.5 3 4 m
4.5
二 非线性经验回归方程
1.非线性回归分析的思想
研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.
(对接教材P115问题)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:℃)关于时间x(单位:min)的回归模型,通过实验收集在25 ℃室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据及相应散点图,并对数据做初步处理,如下表:
(2)参考数据:e-0.08≈0.92,e4.09≈60.
解决非线性回归问题的方法及步骤
√
x 1 2 3 4
y e e3 e4 e6
e7.5
x 1 2 3 4
y e e3 e4 e6
z 1 3 4 6
越小
越大
大
小
已知某种汽车新购入价格为14万元,但随着使用年限增加汽车会贬值.通过调查发现使用年限 x(单位:年)与出售价y(单位:万元)之间的关系有如下一组数据:
x 1 2 4 8 10
y 12 10 7 6 5
(1)求y关于x的经验回归方程;
【解】 列出残差表:
(1)回归模型拟合效果的好坏可以通过计算决定系数R2来判断,其值越大,说明拟合效果越好.
(2)在含有一个解释变量的线性回归模型中,决定系数R2恰好等于样本相关系数r的平方.在线性回归模型中有0≤R2≤1,因此R2和两个变量的样本相关系数r都能刻画用线性回归模型拟合数据的效果.|r|越大,R2就越大,线性回归模型拟合数据的效果就越好.
√
则试验结果体现拟合A,B两变量关系的模型拟合精度最高的同学是________.
丁
课堂巩固 自测
PART
02
第二部分
√
√
2.(多选)(教材P116思考改编)某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是( )
A.样本相关系数r变小
B.决定系数R2变大
C.残差平方和变大
D.解释变量x与响应变量y的线性相关程度变强
√
解析:根据题图可知,去掉点D(3,10)后,y与x的线性相关程度加强,且为正相关,样本相关系数r变大,则A错误,D正确;
去掉点D(3,10)后,残差平方和变小,则R2变大,B正确,C错误.故选BD.
x 6 7 8 9 10
y 3.5 4 5 6 6.5
-0.1
4.(教材P120练习T2改编)数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为2018-2023年某市夜间经济的市场发展规模(单位:亿元),其中2018-2023年对应的年份代码依次为1~6.
年份代码x 1 2 3 4 5 6
某市夜间经济的市场发展规模y/亿元 20.5 22.9 26.4 30.9 36.4 42.4
(1)已知可用函数模型y=a·bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.001);
(2)现用(1)中求得的回归方程预测2025年该市夜间经济的市场规模.
参考数据:
1.已学习:(1)残差的概念与残差图;(2)残差平方和及决定系数R2;(3)非线性经验回归方程.
2.须贯通:回归分析时,必须先画散点图,确定两个变量是否有关系,有什么样的关系,然后确定是哪种回归模型才能进一步求解.
3.应注意:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错.