《非线性回归模型》教学设计
一、复习回顾
问题1 如何求经验回归方程
提示:求经验回归方程的一般步骤如下:
(1)画出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系;
(2)当两变量具有线性相关关系时,求系数的最小二乘估计,写出经验回归方程;
(3)进行残差分析,分析模型的拟合效果,不合适时,分析错因,予以纠正.
师生互动:教师让学生举手回答问题,并及时给予纠正.
设计意图:复习上节课所学知识,为本节课解决与线性回归分析有关的实际问题做好铺垫.
二、新知探究
1.线性回归分析
探究1 经验表明,一般树的胸径(树的主干在地面以上处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.
分析:因为要由胸径预测树高,所以要以成对样本数据的胸径为横坐标、树高为纵坐标描出散点,进而得到散点图,再根据散点图推断树高与胸径是否线性相关.如果是,再利用最小二乘估计公式计算出即可.
解:以胸径为横坐标、树高为纵坐标作散点图如下:
在上图中,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.
用表示胸径,表示树高,根据最小二乘法,计算可得经验回归方程为.
相应的经验回归直线如图所示.
思考:上述例子中,是否可以根据所求经验回归方程,由胸径预测树高
提示:根据经验回归方程,由题表中胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示.
以胸径为横坐标,残差为纵坐标,作残差图,得到下图.
观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.
师生互动:教师让学生总结建立线性回归模型的一般步骤.
建立线性回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.
(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型.
(4)按一定规则(如最小二乘法)估计经验回归方程中的参数.
(5)得出结果后分析残差图是否有异常.
设计意图:掌握利用线性回归分析解决实际问题的方法和步骤.
2.非线性回归分析
探究点2 一只红铃虫的产卵数y(个)和温度x(℃)有关.现收集了7组观测数据列于下表中:
试画出散点图分析温度与产卵数的关系.
师:观察散点图,两变量温度与产卵数是否具有线性相关关系
生:温度与产卵数虽然有正相关关系,但散点图并不是分布在某条直线附近,两者不具有线性相关关系.
师:根据散点图,你能大胆猜测对应散点类似在哪种函数图象的附近吗
生:曲线类似于指数函数变换后的图象.
师:借助图形计算器的回归功能我们可以进行指数回归的拟合.
师:指数回归的原理是什么
生:假定所求曲线是,那么这并不是一个线性回归问题,而是一个非线性回归问题.对此式两边取对数,可将等式变换为,取,则有.由表中的数据可得数据,便可把非线性回归问题转化成线性回归问题.从而可由回归系数公式计算出的值.
设计意图:引出非线性回归分析问题,理解解决非线性回归分析问题的思路.
探究点3 人们常将男子短跑的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑世界纪录关于纪录产生年份的经验回归方程.
师:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图如下图所示.由散点图可以看出,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.现在用表示男子短跑的世界纪录,表示纪录产生的年份,你能利用一元线性回归模型求经验回归方程吗
生:根据最小二乘法,由表中的数据得到经验回归方程为:
.①
师:在散点图中画出经验回归直线,你能看出其中存在的问题吗
生:得到下图:
第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.
设计意图:目的是使学生明白,不是所有的两个变量的关系都适合用一元线性回归模型刻画.
师:这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.
师:你能对模型进行修改,以使其更好地反映散点的分布特征吗
生:仔细观察散点图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.回顾已有的函数知识,可以发现函数的图象具有类似的形状特征.
设计意图:提醒学生需熟悉常见非线性函数模型的特点.
师:注意到短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线的周围,其中为未知参数,且.
用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中是待定参数.现在问题转化为如何利用成对数据估计参数和.令,则.对数据进行变化可得下表:
得到散点图如下:
由表中的数据得到经验回归方程
(*)
将(*)式所对应的经验回归直线叠加到散点图,得到下图:
上图表明,经验回归方程(*)对于数据互换后所得表中的成对数据具有非常好的拟合精度.
将代人(*)式,得到由创纪录年份预报世界纪录的经验回归方程
3.②
师:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个经验回归方程①②,你能判断哪个经验回归方程拟合的精度更好吗
生:散点图中各散点都非常靠近②的图象,表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①.
设计意图:分析两个模型的拟合效果,由比较不同回归模型拟合效果的需要,引出评价模型好坏的指标.
师:以此例题为例,判断模型拟合的效果有以下方法:
(1)直接观察法.如教材图8.2-16,在同一坐标系中画出成对数据散点图、非线性经验回归方程②的图象(蓝色)以及经验回归方程①的图象(红色),由此观察得出结论.
(2)残差分析:残差平方和越小,模型拟合效果越好.
可知小于,说明非线性回归模型的拟合效果要优于一元线性回归模型的拟合效果.
(3)决定系数也可以利用决定系数来比较两个模型的拟合效果,的计算公式为.
在表达式中,与经验回归方程无关,残差平方和与经验回归方程有关.因此越大,表示残差平方和越小,即模型的拟合效果越好;越小,表示残差平方和越大,即模型拟合效果越差.
易算出经验回归方程①和②的分别约为和,说明经验回归方程②的刻画效果要优于经验回归方程①.
(4)用新的观测数据来检验模型的拟合效果.事实上,我们还有1968年之后的男子短跑世界纪录数据,如表所示.
在教材图8.2-16所示的散点图中,绘制上表中的散点(绿色),再添加经验回归方程①所对应的经验回归直线(红色),以及经验回归方程②所对应的经验回归曲线(蓝色),得到教材图8.2-17.显然绿色散点分布在蓝色经验回归曲线的附近,远离红色经验回归直线,表明经验回归方程②对于新数据的预报效果远远好于①.
教师讲解:
在使用经验回归方程进行预测时,需要注意下列问题:
(1)经验回归方程只适用于所研究的样本的总体.例如,根据我国父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述美国父亲身高与儿子身高之间的关系.同样,根据生长在南方多雨地区的树高与胸径的数据建立的经验回归方程,不能用来描述北方干旱地区的树高与胸径之间的关系.
(2)经验回归方程一般都有时效性.例如,根据20世纪80年代的父亲身高与儿子身高的数据建立的经验回归方程,不能用来描述现在的父亲身高与儿子身高之间的关系.
(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.
(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.事实上,它是响应变量的可能取值的平均值.
师生互动:学生总结建立非线性回归模型的基本步骤,教师及时补充完善.
建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是响应变量;
(2)由经验确定非线性经验回归方程的模型;
(3)通过变换,将非线性经验回归方程转化为线性经验回归方程;
(4)按照公式计算线性经验回归方程中的参数,得到线性经验回归方程;
(5)消去新元,得到非线性经验回归方程;
(6)得出结果后需进行非线性回归分析.
判断模型的拟合效果的依据如下:
①残差平方和越小,模型的拟合效果越好.
②决定系数取值越大,说明模型的拟合效果越好.
需要注意的是:若题中给出了检验回归方程是否理想的条件,则根据题意进行分析检验即可.
设计意图:探索非线性回归分析问题的求解方法,培养学生的数学应用意识.
三、应用举例
例 下表为收集到的一组数据:
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)根据x与y之间的关系,建立回归模型并计算残差;
(3)利用所得模型,预报x=40时y的值.
师生互动:教师引导学生分析解决问题的思路:
学生自主练习.
解:(1)作出散点图如图,从散点图可以看出与不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线的周围,其中为待定的参数.
(2)对两边取对数,把指数关系变为线性关系.令,则变换后的样本点应分布在直线的周围,这样就可以利用线性回归模型来建立与之间的非经验回归方程了.数据可以转化为:
求得经验回归方程为,
所以.
残差列表如下:
(3)当时,.
设计意图:通过例题,熟练掌握求非线性经验回归方程的一般步骤.
练习 某地区六年来轻工业产品年利润总额(单位:亿元)与年次的试验数据如下表所示:
由经验知,年次与年利润总额(单位:亿元)近似有如下关系:.其中均为正数,求关于的回归方程.
解:对两边取自然对数,得,令,则与的数据如下表:
由及最小二乘估计公式,得
,
即,
故.
四、课堂小结
1.知识
(1)非线性回归模型.
(2)决定系数.
2.思想方法
转化与化归思想.
板书设计:
8.2.2非线性回归模型 1.非线性回归分析 2.决定系数 3.例题 例 4.小结 (1)知识 (2)思想方法
1 / 11