8.2.1一元线性回归模型(教案) 高中数学人教A版(2019)选择性必修第三册

文档属性

名称 8.2.1一元线性回归模型(教案) 高中数学人教A版(2019)选择性必修第三册
格式 doc
文件大小 171.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-05-06 15:20:02

图片预览

文档简介

第八章 成对数据的统计分析
8.2 一元线性回归模型及其应用
8.2.1一元线性回归模型
教学设计
一、教学目标
1.结合具体实例,了解一元线性回归模型的含义.
2.了解元线性回归模型参数的统计意义.
3.结合具体实例,了解一元线性回归模型随机误差产生的原因.
二、教学重难点
1、教学重点
一元线性回归模型的含义.
2、教学难点
一元线性回归模型的含义.
三、教学过程
(一)新课导入
通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以判断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等. 进一步地,如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测. 接下来我们就来研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.
(二)探索新知
探究一 线性相关
生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高. 为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表.
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182
如图,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表中的成对样本数据表示为散点图. 可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关. 利用统计软件,求得样本相关系数为,表明儿子身高和父亲身高正线性相关,且相关程度较高.
思考:根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?
探究二 一元线性回归模型
在上表的数据中,存在父亲身高相同,而儿子身高不同的情况. 例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm. 可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.
散点图中的散点大致分布在一条直线附近,表明儿子身高和父亲身高这两个变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响而把影响儿子身高的其他因素,如母亲身高、生活环境、饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型. 其中,随机误差是一个随机变量.
用x表示父亲身高,Y表示儿子身高,e表示随机误差. 假定随机误差e的均值为0,方差为与父亲身高无关的定值,则它们之间的关系可以表示为.(1)
我们称(1)式为Y关于x的一元线性回归模型. 其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与之间的随机误差. 模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为与e的和(叠加),前一部分由x所确定,后一部分是随机的. 如果,那么Y与x之间的关系就可用一元线性函数模型来描述.
对于父亲身高x和儿子身高Y的一元线性回归模型(1),可以解释为父亲身高为的所有男大学生的身高组成一个子总体,该子总体的均值为,即该子总体的均值与父亲身高是线性函数关系. 而对于父亲身高为的某一名男大学生,他的身高并不一定为,它仅是该子总体中的一个观测值,这个观测值与均值有一个误差项.
思考:你能结合具体实例解释产生模型(1)中随机误差项的原因吗?
在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:
(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;
(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;
(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.
(三)课堂练习
1.下列关于残差图的描述错误的是( )
A.残差图的纵坐标只能是残差
B.残差图的横坐标可以是编号、解释变量和响应变量
C.残差点分布的带状区域的宽度越窄残差平方和越小
D.残差点分布的带状区域的宽度越窄决定系数越小
答案:D
解析:根据残差图的定义和图象即可得到结论.可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,则对应决定系数越大,故选项D错误.故选D.
2.在建立一组数据的回归模型时,有4个不同的模型可供选择,其中模型1的相关指数为0.85,模型2的相关指数为0.25,模型3的相关指数为0.7,模型4的相关指数为0.3,结合它们的相关指数,判断其中拟合效果最好的为( )
A.模型1 B.模型2 C.模型3 D.模型4
答案:A
解析:相关指数的值越大,模型的拟合效果越好,又,故拟合效果最好的为模型1,故选A.
3.设备的经济寿命是指设备从投入使用开始到因继续使用在经济上不合理而被更新所经历的时间,由维护费用的提高和使用价值的降低决定的.设备的经济寿命有如下计算公式:,其中为设备的经济寿命(单位:年),P为设备目前实际价值,为设备N年末的净残值,为设备的低劣化值.若有一台设备,目前实际价值为8000元,预计经济寿命为7年,设备的低劣化值为300元,则该设备7年末的净残值为( )
A.600元 B.650元 C.700元 D.750元
答案:B
解析:由题意知年,元,元.由,得该设备7年末的净残值(元),(提示:注意对公式中各个字母含义的准确理解)故选B.
4.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为-0.15,则表中m的值为__________.
答案:4.5
解析:由在样本处的残差为,可得,则,解得.
由题表可知,,产量x的平均数为,
由经验回归方程为过点,
可得.则,
解得.
(三)小结作业
小结:本节课我们主要学习了哪些内容?
1. 一元线性回归模型的含义及模型参数的统计意义.
四、板书设计
8.2.1一元线性回归模型
1. 一元线性回归模型的含义及模型参数的统计意义.
2