人教A版(2019)高中数学选择性必修第三册 8.2《一元线性回归模型及其应用第3课时》教学设计

文档属性

名称 人教A版(2019)高中数学选择性必修第三册 8.2《一元线性回归模型及其应用第3课时》教学设计
格式 doc
文件大小 532.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-12-04 16:05:35

图片预览

文档简介

《一元线性回归模型及其应用第3课时》教学设计
一、单元内容及其解析
1.内容
一元线性回归模型,一元线性回归模型参数的最小二乘估计.
本单元教学约需3课时,第1课时,一元线性回归模型;第2课时,一元线性回归模型参数的最小二乘估计;第3课时,一元线性回归模型的应用.
2.内容解析
一元线性回归模型是描述两个随机变量之间相关关系的最简单的回归模型.当两个变量之间具有显著的线性相关关系时,可以建立一元线性回归模型刻画两个变量间的随机关系,并通过模型进行预测.
建立一元线性回归模型的基础是成对样本数据的相关性分析,通过对散点图的直观观察,可以大致确定变量间是否存在线性关系,通过样本相关系数可以分析线性关系的强弱.在此基础上建立一元线性回归模型,用最小二乘法估计线性回归模型中的参数,得到经验回归方程,并利用残差及利用残差构建的指标对模型进行评价和改进,使模型不断完善.最后根据模型进行预测帮助决策.
在建立一元线性回归模型过程中,方程的建立、参数的估计、模型有效性分析等都是培养学生数据分析、数学建模、逻辑推理、数学抽象的重要素材,也是加强学生“四基”,提高“四能”的重要内容.
基于以上分析,确定本单元的教学重点:(1)一元线性回归模型的含义;(2)用最小二乘法估计回归模型参数的方法;(3)残差分析和决定系数的意义;(4)一元线性回归模型的应用.
二、单元目标及其解析
(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理.
(2)掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
(3)掌握残差分析的方法,理解决定系数的意义.
(4)针对实际问题,会用一元线性回归模型进行预测.
2.目标解析
达成上述目标的标志是:
(1)知道线性回归模型与函数模型的区别,知道线性回归模型中误差e的含义,知道假设误差e满足的理由.
(2)能依据用距离来刻画接近程度的数学方法了解最小二乘原理,能利用最小二乘原理推导参数估计值的计算公式.
(3)会利用统计软件画散点图、求样本相关系数、求回归方程,能用残差、残差图和决定系数对回归模型进行评价.
(4)通过具体案例,理解利用一元线性回归模型可以刻画随机变量之间的线性相关关系,在建立一元线性回归模型解决实际问题的过程,提升数据分析、数学建模、逻辑推理等素养.
三、单元教学问题诊断分析
通过“成对数据的统计相关性”的学习,学生已掌握通过散点图直观判断成对样本数据之间相关关系的方法,会用样本相关系数判断成对样本数据线性相关性的强弱,也初步了解用样本估计总体的方法.在本单元的学习中,学生可能对线性回归模型中随机误差的假设、最小二乘原理和方法等存在理解困难.此外,学生对于回归模型中参数的意义可能理解不准确,容易误将根据样本通过最小二乘法求出的参数估计值当作模型中的参数,主要原因是对样本的随机性理解不够到位,对于同一个总体的不同样本会有不同的参数估计缺少体验.
本单元的教学难点是:(1)对随机误差的理解;(2)最小二乘原理与方法;(3)参数的意义及参数估计公式的推导;(4)残差变量的解释与分析;(5)模型的应用及优度的判断.
四、单元教学支持条件分析
一元线性回归模型主要研究两个随机变量的线性相关关系,通过成对样本数据建立数学模型.在教学中,需要利用 GeoGebra,Excel,R,图形计算器等统计软件或工具处理样本数据,画出散点图和回归直线,利用统计软件或工具进行参数估计值的计算和分析.也可利用软件或工具进行模拟,对同一个总体的不同样本作回归分析、比较,以加深对回归模型的理解.
五、课时教学设计
(一)教学内容
最小二乘原理,一元线性回归模型参数的最小二乘估计.
(二)教学目标
1.通过用数学方法刻画散点与直线接近的程度,体会一元线性回归模型参数的最小二乘估计原理,能推导参数估计公式,发展数学运算能力.
2.通过对残差和残差图的分析,能用残差判断一元线性回归模型的有效性,发展数据分析能力.
3.会使用相关的统计软件.
(三)教学重点和难点
重点:一元线性回归模型参数的最小二乘估计
难点:参数估计值公式的推导,利用残差分析回归模型.
(四)教学过程设计
1.创设情境
问题1:为了研究两个变量之间的相关关系,我们建立了一元线性回归模型表达式刻画的是变量与变量之间的线性相关关系,其中参数和未知,我们能否通过样本数据估计参数和
师生活动:教师提出问题,学生独立思考、讨论交流后,教师再引导学生总结出结论:与函数模型不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数.
追问(1):怎样利用样本数据估计参数和 你有解决这类问题的经验吗
师生活动:教师引导学生回顾模型的建立过程,可知参数和刻画了变量与变量的线性关系,因此通过样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.
学生可能会利用初中学习一次函数模型的经验,通过选择适当的两点,用待定系数法求出经过这两点的直线方程,并以方程的系数作为参数和的估计值.教师指出这样的估计取决于直观判断,确实是估计模型参数的一种方法,但会存在估计误差比较大的可能.
追问(2):我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”
师生活动:教师引导学生使用信息技术进行如下实验探究.
教师在GeoGebra的绘图区画出的11个点,使这些点分布在一条直线的附近(如图),呈强线性相关,然后将文件发送到每个学生的电脑上,并布置实验任务:画一条直线,使各点在整体上与直线尽可能接近.要求:
(1)先确定一个衡量标准,能够定量描述所作出的直线与各散点整体上接近的程度,衡量的标准要科学合理、简便实用.
(2)比较各同学所画直线,寻找“最好”直线.
在探究过程中,教师适时引入“残差”的概念,指出“残差”是回归模型中随机误差的观测值.引导学生将衡量的标准逐步聚焦到“残差”的绝对值之和最小上.由于“残差”的绝对值之和求最小值较为困难,所以最后统一到利用“残差平方和”作为衡量的标准.
在确定用“残差平方和”作为整体衡量直线与各散点接近的程度以后,要求在GeoGebra的输入框中输入“”,构造一个名为的点列,然后输入“误差平方和”,其中为所画直线的名称(GeoGebra自动命名),就会出现一个计算结果,得到“残差”的平方和.教师可利用师生交互平台,选择学生中拟合程度较好的结果,让学生直观感受一元线性回归模型中回归直线应具有的形态.
设计意图:通过问题1及两个追问,明确一元线性回归模型参数的估计要达到“最好”,就是要找出一条直线,使各散点在整体上与此直线尽可能接近,实质上就给出估计模型参数的标准.由此可以产生估计参数的方法.通过GeoGebra的使用,使学生能够比较方便地计算“误差平方和”,使直观比较成为可能,有助于学生理解最小二乘估计的原理.
2.推导方程
问题2:对于一组具有线性相关关系的数据,利用“残差”平方和最小这个标准,估计一元线性回归模型的参数和b,联想上面的实验探究,你能推导出参数和估计值的公式吗
师生活动:教师首先引导学生将问题数学化:“残差”平方和为,求和的值,使最小.
接着,师生合作解决这个问题,得出参数估计公式,可让学生阅读教科书中相关部分,并尝试自己进行公式推导.
最后,教师给出最小二乘估计的概念.若是参数的最小二乘估计,将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形为经验回归直线.这种求经验回归方程的方法叫做最小二乘法.
对于基础较好的学生,可以要求他们课后思考如何求的最小值问题.
设计意图:通过利用最小二乘原理对回归模型中参数a,b估计公式的推导,加深对一元线性回归模型的理解.通过对残差平方和表达式的代数变形,突破推导的困难,并在公式推导过程中提升数学运算素养.
3.问题探究
问题3:请利用最小二乘法求出前面探究活动中样本数据的回归方程,并与你先前所画的直线作比较,哪个误差平方和最小?
师生活动:继续利用GeoGebra进行探究活动,让学生通过在绘图区的输入框中输入“拟合直线y[L1]”,其中L1为成对样本数据所组成的点列的名称,便可画出经验回归直线,得到经验回归方程.分别计算点列关于两条直线的“误差平方和”作出比较.
设计意图:通过活动进一步感知用最小二乘估计参数的优越性,掌握利用统计工具求经验回归方程、画经验回归直线的方法.
问题4:利用上节课的数据,依据用最小二乘估计一元线性回归模型参数的公式,求出儿子身高关于父亲身高的经验回归方程.
师生活动:教师进行技术操作指导,学生操作,具体如下:
(1)在GeoGebra的表格区的两列中分别输入父亲身高和儿子身高的观测数据.
(2)同时选中两列,点击工具栏中第2个图标的倒三角形标志,选择“双变量回归分析”,出现“数据来源”对话框,按“分析”键,出现“数据分析”区且在“数据分析”区内已画好成对样本数据的散点图.
(3)在“数据分析”区中选择“回归模型”为“线性”,即可画出经验回归直线、求出经验回归方程,即,如图.
设计意图:通过问题3、问题4,建立儿子身高与父亲身高关系的经验回归方程,掌握利用统计工具求经验回归方程的方法.以上的操作实际上是GeoGebra第2种求经验回归方程、画经验回归直线的方法.
4.深化理解
问题5:结合经验回归方程思考并回答以下问题:
(1)当时,,如果一位父亲身高为,他儿子长大后身高一定能长到吗 为什么
(2)根据经验回归方程中斜率的具体含义,高个子的父亲一定生高个子的儿子吗 同样,矮个子的父亲一定生矮个子的儿子吗
(3)根据模型,父亲身高为多少时,长大成人的儿子的平均身高与父亲的身高一样 你怎么看这个判断
师生活动:组织学生依次讨论第(1)(2)(3)问,教师适时点评.
对于第(1)问,学生容易得到如下结论:儿子的身高不一定会是,这是因为还有其他影响儿子身高的因素,回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高.不过,我们可以作出推测,当父亲的身高为时,儿子身高一般在左右.教师进一步指出.实际上,如果把父亲身高为的所有儿子身高作为一个子总体,那么是这个子总体均值的估计值.一般地,因为是的估计值,所以是的估计值.
对于第(2)问,教师引导学生分析得出,经验回归方程中,斜率可以解释为父亲身高每增加,其儿子的身高平均增加.由模型可以发现,高个子父亲有生高个子儿子的趋势,但一群高个子父亲的儿子们的平均身高要低于父亲们的平均身高.例如,则.矮个子父亲有生矮个子儿子的趋势,但一群矮个子父亲的儿子们的平均身高要高于父亲们的平均身高.例如,则).
接着,教师可以介绍有关史实,英国著名统计学家高尔顿(FrancisGalton,1822-1911)把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来人们把由一个变量的变化去推测另一个变量变化的方法称为回归分析.
对于第(3)问,通过经验回归方程,令,则,即当父亲身高为时,儿子的平均身高与父亲的身高一样.在活动过程中要让学生充分发表自己的意见.
设计意图:通过具体实例,理解经验回归方程中变量的含义,分清回归模型与函数模型的区别.了解一元线性回归模型中“回归”的含义,以及回归分析的发展史.通过以上三个问题,让学生进一步理解模型的含义,从而知道利用模型进行预测的意义和方法,了解预测结果的统计意义.
5.残差分析
引导语:我们称为随机变量的观测值,通过经验回归方程得到的为预测值.为了研究回归模型的有效性,定义残差为,残差是随机误差的估计值.通过对残差的分析可判断回归模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面的工作称为残差分析.
问题6:以“儿子身高与父亲身高的关系”的问题为例,你能运用残差分析所得的一元线性回归模型的有效性吗
师生活动:教师指出要研究一个问题,要了解研究的目的、原理与方法,以及结果的表达等.根据最小二乘原理,如果残差比较稳定,残差绝对值比较小,说明回归模型拟合的精度比较高.追问:如何观测残差的情况呢
师生活动:因为学生以往没有这方面的经验,所以教师应加强引导,甚至可以直接讲解.为了观测残差的情况,一般可采用电子表格计算各个残差;也可以以自变量(父亲身高)作为横坐标,残差为纵坐标画出散点图,称为残差图.在GeoGebra的表格区计算各个残差(如图).
在GeoGebra的“数据分析”区,选择(父亲身高和儿子身高的观测数据)两列,用“双变量回归分析”,在所得的“数据分析”区,将“散点图”改成“残差图”,并且在回归模型中选择“线性”,便可得到所要的残差图(如图).
从上面的残差图可以看出,残差有正有负,残差点比较均匀地分布在横轴的两边,可判断样本数据基本满足一元线性回归模型对于随机误差的假设.所以通过观察残差图可以直观判断样本数据是否满足一元线性回归模型的假设,从而判断回归模型拟合的有效性.
设计意图:通过这个问题表明,一般地,建立经验回归方程后,通常需要对回归模型刻画数据的效果进行分析,借助残差分析还可以对模型进行改进,使我们能根据改进的模型作出更符合实际的预测与决策.
6.归纳总结
教师引导学生回顾本节课所学内容,并让学生回答下列问题:
(1)什么是一元线性回归模型参数的最小二乘估计 利用最小二乘法得到的参数估计公式是什么
(2)经验回归直线有什么性质
(3)如何用残差分析一元线性回归模型的有效性
(4)如何利用残差分析分析修正回归模型
师生活动:对于每个问题,先由学生思考后作答,再生生、师生相互补充完善.
对于第(2)问,教师板书或投影经验回归直线的性质:
①直线经过(称为数据的中心).
②是均值的估计值,即是自变量取值为时对应子总体的均值的估计值.
③斜率表示自变量每增加一个单位,因变量的均值增加或减小个单位.
对于第(3)问,教师引导学生认识残差是随机误差的估计值.因为,所以用残差是否比较均匀地落在横轴附近的带状区域,带状区域的宽窄度可以作为经验回归方程预报精度的指标.
对于第(4)问,教师引导学生形成如下共识:通过残差分析,发现异常数据,去掉异常数据后再重新进行回归分析.
设计意图:回顾用最小二乘法估计参数的过程,归纳经验回归方程的性质,理解残差及残差分析的意义.
7.布置作业
教科书第113页练习第题,习题第2题.
(五)目标检测设计
有一个销售公司,每月的广告费和销售额如表1所示.
表1
利用GeoGebra软件,解决以下问题:
(1)以广告费为横坐标、销售额为纵坐标作散点图,直观推断这两个变量是否存在线性相关关系?并说明理由.
(2)建立以广告费为解释变量、销售额为响应变量的一元线性回归模型,利用模型预测投入广告费为15万元时销售额的平均值.
(3)根据残差分析,你认为这个模型能较好地刻画销售额与广告费的关系吗?
设计意图:考查学生能否掌握用一元线性回归模型解决实际问题,能否正确进行模型中的参数估计;考查学生对于利用残差进行模型分析掌握的程度,以及学生运用统计软件进行线性回归的情况.
1 / 10