人教A版(2019)高中数学选择性必修第三册 8.2 《一元线性回归模型及其应用第2课时》教学设计

文档属性

名称 人教A版(2019)高中数学选择性必修第三册 8.2 《一元线性回归模型及其应用第2课时》教学设计
格式 doc
文件大小 1.3MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-12-04 16:04:51

图片预览

文档简介

《一元线性回归模型及其应用第2课时》教学设计
一、单元内容及其解析
1.内容
一元线性回归模型,一元线性回归模型参数的最小二乘估计.
本单元教学约需3课时,第1课时,一元线性回归模型;第2课时,一元线性回归模型参数的最小二乘估计;第3课时,一元线性回归模型的应用.
2.内容解析
一元线性回归模型是描述两个随机变量之间相关关系的最简单的回归模型.当两个变量之间具有显著的线性相关关系时,可以建立一元线性回归模型刻画两个变量间的随机关系,并通过模型进行预测.
建立一元线性回归模型的基础是成对样本数据的相关性分析,通过对散点图的直观观察,可以大致确定变量间是否存在线性关系,通过样本相关系数可以分析线性关系的强弱.在此基础上建立一元线性回归模型,用最小二乘法估计线性回归模型中的参数,得到经验回归方程,并利用残差及利用残差构建的指标对模型进行评价和改进,使模型不断完善.最后根据模型进行预测帮助决策.
在建立一元线性回归模型过程中,方程的建立、参数的估计、模型有效性分析等都是培养学生数据分析、数学建模、逻辑推理、数学抽象的重要素材,也是加强学生“四基”,提高“四能”的重要内容.
基于以上分析,确定本单元的教学重点:(1)一元线性回归模型的含义;(2)用最小二乘法估计回归模型参数的方法;(3)残差分析和决定系数的意义;(4)一元线性回归模型的应用.
二、单元目标及其解析
(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理.
(2)掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
(3)掌握残差分析的方法,理解决定系数的意义.
(4)针对实际问题,会用一元线性回归模型进行预测.
2.目标解析
达成上述目标的标志是:
(1)知道线性回归模型与函数模型的区别,知道线性回归模型中误差e的含义,知道假设误差e满足的理由.
(2)能依据用距离来刻画接近程度的数学方法了解最小二乘原理,能利用最小二乘原理推导参数估计值的计算公式.
(3)会利用统计软件画散点图、求样本相关系数、求回归方程,能用残差、残差图和决定系数对回归模型进行评价.
(4)通过具体案例,理解利用一元线性回归模型可以刻画随机变量之间的线性相关关系,在建立一元线性回归模型解决实际问题的过程,提升数据分析、数学建模、逻辑推理等素养.
三、单元教学问题诊断分析
通过“成对数据的统计相关性”的学习,学生已掌握通过散点图直观判断成对样本数据之间相关关系的方法,会用样本相关系数判断成对样本数据线性相关性的强弱,也初步了解用样本估计总体的方法.在本单元的学习中,学生可能对线性回归模型中随机误差的假设、最小二乘原理和方法等存在理解困难.此外,学生对于回归模型中参数的意义可能理解不准确,容易误将根据样本通过最小二乘法求出的参数估计值当作模型中的参数,主要原因是对样本的随机性理解不够到位,对于同一个总体的不同样本会有不同的参数估计缺少体验.
本单元的教学难点是:(1)对随机误差的理解;(2)最小二乘原理与方法;(3)参数的意义及参数估计公式的推导;(4)残差变量的解释与分析;(5)模型的应用及优度的判断.
四、单元教学支持条件分析
一元线性回归模型主要研究两个随机变量的线性相关关系,通过成对样本数据建立数学模型.在教学中,需要利用 GeoGebra,Excel,R,图形计算器等统计软件或工具处理样本数据,画出散点图和回归直线,利用统计软件或工具进行参数估计值的计算和分析.也可利用软件或工具进行模拟,对同一个总体的不同样本作回归分析、比较,以加深对回归模型的理解.
五、课时教学设计
(一)教学内容
一元线性回归模型的应用.
(二)教学目标
1.能通过具体实例说明一元线性回归模型修改的依据与方法.
2.通过对具体问题的进一步分析,能将某些非线性回归问题转化为线性回归问题并加以解决,提高数学运算能力.
3.能通过实例说明决定系数的意义和作用,提高数据分析能力.
(三)教学重点和难点
重点:一元线性回归模型的修改,将非线性回归问题转化为线性回归问题,决定系数的意义和作用.
难点:运用合适的变换将非线性相关问题转化为线性相关问题,用决定系数判断模型的优度.
(四)教学过程设计
1.复习回顾
例 借助统计工具解决以下问题:
经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如表1所示,试根据这些数据建立树高关于胸径的经验回归方程.
表1
师生活动:先让学生使用统计软件工具自主解决问题,通过师生互动平台展示学生的学习结果,最后教师进行分析和点评.如果学生不能熟练使用统计软件工具,教师加以适当引导.下面以使用GeoGebra软件为例给出解决问题的具体过程:
(1)在GeoGebra表格区两列分别输入树的胸径和树高的观测数据.
(2)选中两列,点击工具栏中第2个图标右下角倒三角形下拉标志,选择“双变量回归分析”,出现“数据来源”对话框,按“分析”键,则在“数据分析”区出现样本数据的散点图(如图).
从散点图可以看到,散点大致分布在一条从左下角到右上角的直线附近,表明这两个变量线性相关,而且是正相关.点击“数据分析”区工具栏的,可以看到这组数据的相关系数为,说明相关性很强,因此可以用一元线性回归模型刻画树高与胸径之间关系.
(3)在“数据分析”区的“回归模型”中选择“线性”,调整“选项”菜单的“精确度”中的保留小数的位数(保留4位小数,得到根据最小二乘法计算得到的经验回归方程(如图)
2.若以表示胸径,表示树高,则2.
(4)在表格区可以根据经验回归方程算出树高的预测值以及相应的残差.操作的方法是:在C列的第一行输入“”,按“Enter”键,当光标移动到单元格右下角的小方块上,当光标呈细十字时按住鼠标左键下拉,得到树高的预测值.用类似的方法在列的第一行输入“”,然后下拉充填,求得残差值.从残差表中可以看到,残差在内,有6个正数、6个负数.残差表明随机误差符合一元线性回归模型的假设.
(5)在“数据分析”区,选择“残差图”,便可画出残差图(如图).观察残差表和残差图,可以看到残差的绝对值最大为,残差点均匀地分布在以横轴为对称轴、宽度小于的带状区域内,可见经验回归方程较好地刻画了树高与胸径之间的关系,我们可以由胸径预测树高.
设计意图:通过复习回顾,检查学生对一元线性回归模型掌握的情况,并由此归纳求经验回归方程的一般步骤,要求学生借助统计工具以提高解题效率.
2.案例分析
问题1:男子短跑100m高水平运动员常被称为“百米飞人”,表2给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试根据这些成对数据,建立男子短跑100世界纪录关于纪录产生年份的经验回归方程.
表2
师生活动:要求学生按照例题中建立经验回归方程的步骤求解.
(1)先要求学生以成对数据中世界纪录产生的时间为横坐标,世界纪录为纵坐标画散点图计算样本相关系数.根据散点图和样本相关系数判断是否可以用一元线性回归模型刻画时间和纪录之间的关系,即能否用经验回归方程刻画这两个变量之间的关系.
可以使用 GeoGebra画出散点图,计算样本相关系数,以此来判断样本数据是否有较强的线性相关关系,通过计算得两组数据的相关系数为-0.8559(如图).通过散点图可以发现,各散点大致分布在一条直线附近,只有一个点比较特殊,似乎可以用一元线性回归模型建立经验回归方程.
(2)要求学生先建立一元线性回归模型.若用Y表示男子短跑100m世界纪录,t表示创建纪录的时间, 建立的一元线性回归模型为
利用统计工具,如果选择GeoGebra软件,在菜单“选项”的“精确度”中,选择保留5位小数,得到世界纪录和世界纪录产生时间的关系,同时画出经验回归直线(如图).
设计意图:通过具体案例巩固求经验回归方程的具体步骤,为进一步探求回归分析过程中存在的问题和改进的方法作准备.
追问(1):从图5中可以看到,经验回归方程较好地刻画了散点的变化趋势.请再仔细观察图形,你能看出其中存在的问题吗?
师生活动:引导学生围绕拟合精度与模型选择的贴切性进行讨论,让学生侧重观察经验回归直线与各散点的位置关系,特别是各散点的分布特征,分析经验回归方程的不足.进而教师加以总结:从图上看,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方,这说明散点并不是均匀分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律.而从散点的分布看成对样本数据呈现出明显的非线性相关的特征,而成对样本数据呈现非线性关系在具体的事例中是广泛存在的.
设计意图:通过这个具体实例,使学生发现,虽然成对样本数据的相关系数的绝对值为0.8559,散点的分布也近乎呈线性分布,也可以利用最小二乘法求出经验回归方程,但用直线方程进行拟合可能不是描述这个问题的最好方法.
追问(2):你能对模型进行修改,以更好地反映散点的分布特征吗?
师生活动:教师引导学生观察散点图,发现散点更趋向于落在中间下凸且递减的某条曲线附近.教师要求学生回顾已有的函数知识,找出符合散点图的函数模型,引导学生发现函数的图象具有类似的特征.
设计意图:通过学生自主探究活动,发现在实际问题中除直线模型外,还可以有其他曲线模型,能够更好地体现样本数据的分布特征.
追问(3):类比一元线性回归模型,你能建立以对数函数为回归函数的回归模型吗
师生活动:由于短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线的周围.所以可以建立回归模型为
其中和为未知参数,这是一个非线性回归问题.
设计意图:让学生利用建立一元线性回归模型的经验,能够根据散点图的分布特征选择更加合适的回归模型,并且能够建立非线性回归模型.
问题2:你能通过适当的变换,将上面的非线性回归模型转化为线性回归模型,从而求出非线性的回归方程吗?
师生活动:观察非线性回归模型中方程的结构,可以发现经过适当的代换,可转化为线性方程.设,则回归模型为这是一元线性回归模型.
接着,教师要求学生利用软件求出经验回归方程,具体如下:
(1)在的表格区第C列的第一行输入“”,得到结果后向下充填,得到结果后向下充填,得到变换后的变量的值.
(2)选中两列,在表格区选择工具栏中的第2个图标的下拉菜单中选中“双变量回归分析”,在出现的“数据来源”中点击“分析”,然后在“数据分析”区点击“ ”的图标,选定作为自变量,得到散点图,然后在“回归模型”中选择“线性”,得到经验回归方程和经验回归直线(如图).于是我们得到由创纪录时间预报世界纪录的回归方程
.
从散点图上看,经验回归直线对于成对样本数据具有非常好的拟合精度,而且样本相关系数为,表明非线性回归方程拟合的精度很好.
设计意图:让学生体验通过适当的变换将某些非线性回归的问题转化为线性回归问题的过程与方法.
问题3:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程:和,你能判断哪个回归方程拟合的精度更好吗
师生活动:组织学生讨论,如何比较两个回归方程的优劣.引导学生得出以拟合的精度作为标准来判断回归方程的优劣,由此可以产生以下几种方法:
(1)直接观察法.将散点、两个回归函数图象画在同一坐标系中,分别观察两条曲线与散点接近的程度(如图).从图上看,各散点都非常靠近对数函数的图象,表明非线性回归方程对于原始数据的拟合效果远远好于直线回归方程.
(2)残差分析.利用残差的平方和进行分析,残差平方和小的回归模型拟合的效果更好.在GeoGebra中,在输入框中用命令“误差平方和点列函数〉]”可求点列相对于回归函数的残差平方和,经计算可得两个残差平方和为明显小于,说明非线性回归方程的拟合效果要优于线性回归方程.
(3)在(2)的残差分析中,如果在同一量纲下考虑残差平方和的大小来比较回归模型的优劣是有意义的.但是如果两个回归模型的量纲不同,就不能这样比较.应剔除量纲的影响,用相对误差来比较.用回归平方和占总平方和的比例来表示.
由于,令,
得.在表达式中,与经验回归方程无关,残差平方和与经验回归方程有关.因此,越接近1,意味着残差平方和越小,即模型的拟合效果越好;越接近0,意味着残差平方和越大,即模型的拟合效果越差.
设计意图:引入与残差平方和相关的统计量,用来衡量拟合的程度.
追问(1):利用Geogebra软件,计算两个回归方程的值,以此比较两个回归方程拟合的效果.
师生活动:教师引导学生使用GeoGebra软件进行计算,在GeoGebra中用命令“可决系数方点列函数”便能求出以所列函数为回归函数的的值.可以得到,
,比较这两个数值,可以看到非线性回归方程刻画的效果比线性回归方程要好很多.
如果学生的认知水平较高,教师可提示学生进一步思考与样本相关系数之间的联系.并引导学生得出:在一元线性回归模型中等于成对样本数据相关系数的平方.
追问(2):表3是1968年以后的部分男子短跑世界纪录数据.
表3
通过这组数据,请检验上面两个回归方程预报的精确度.
师生活动:先将这组数据添加到GeoGebra原来的表格之中,在绘图区将新添加的成对样本数据组成一个新的点列,可以看到新添加的样本点都分布在非线性回归曲线的附近(如图),表明非线性回归方程对于数据的预报效果远远好于线性经验回归方程.
设计意图:通过此问题解决两个回归模型优度的判别,主要是引入决定系数衡量回归模型拟合的优劣,这是回归模型有效性检验的重要指标.
使学生了解任何数学模型都是对现实世界的一种近似的数量描述,因此需要有检验模型优劣的指标和方法,以便不断地改进模型,从而提升学生的数学建模素养.
3.归纳总结
教师引导学生回顾本节课所学内容,并让学生回答下列问题:
(1)通过本节课的学习,请你总结使用经验回归方程进行预测时,需要注意哪些问题
(2)如何将一些非线性回归问题转化为线性回归问题?
(3)在回归分析中,分析残差能帮助我们解决哪些问题?
(4)如何判断回归模型的有效性?
师生活动:组织学生依次讨论第(1)(2)(3)(4)问,教师适时点评、总结.
对于(1),教师引导学生总结出使用经验回归方程进行预测时,需要注意以下几个方面:
①经验回归方程只适用所研究的样本所在的总体,应用的范围是有限制的.
②建立的经验回归方程一般都有时间性的,即在一定的时间段内才有效.
③在样本数据的取值范围内,经验回归方程的预报效果好;超出这个范围越远,预报的效果就越差.
对于(2),通过适当的变量代换,可以将一些非线性回归问题转化为线性回归问题.
对于(3),通过残差分析,我们可以判断模型的优劣.
对于(4),判断回归模型的有效性一般有三种方法:
1 利用散点图和残差图直接观察.
2 利用残差表、残差图或残差平方和进行比较.
③利用决定系数进行比较,越接近1模型拟合效果越好.
设计意图:通过归纳总结,系统回顾本节课的重要内容,进一步掌握运用回归分析进行预报的原理和方法.
4.布置作业
教科书第120页练习第1,2题,习题8.2第4,5题.
(五)目标检测设计
由于钢水对耐火材料的侵蚀作用,炼钢厂出钢时所用的盛钢水的钢包,随着使用次数的增加,容积不断增大,实测得到15组数据如表4所示.
表4
试根据散点图建立两种回归方程,并判断哪种回归方程具有更好的拟合效果.
设计意图:考查学生将某些非线性的问题转化为线性问题的方法掌握的情况,以及利用散点图直观判断和利用决定系数判断两种不同的回归方程对原始数据拟合效果的理解情况.
1 / 11