8.2.1一元线性回归模型
一、内容与内容解析
内容:一元线性回归模型的引入,一元线性回归模型的概念,体会函数模型与回归模型的区别。
内容解析:
(1)一元线性回归模型的引入:根据前面的学习,同学们是可以根据成对样本数据的散点图和样本相关系数,可以推断两个变量的相关关系,正相关,还是负相关,以及线性相关程度的强弱等。进一步地,如果能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,也就可以利用模型研究两个变量之间的随机关系,并通过模型进行预测,这样就帮助我们解决了很多问题。
(2)一元线性回归模型的概念:根据散点图,我们能发现散点大致分布在一条直线附近,表现两个变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子的影响,而把影响儿子身高的其他因素,作为随机误差,得到刻画两个变量之间关系的线性回归模型。其中随机误差是一个随机变量。用x表示父亲身高,Y表示儿子身高,e表示随机误差。
(3)函数模型和回归模型的区别:函数模型刻画的是函数关系,回归模型刻画的事相关关系。比如炮弹发射后的轨迹可用二次函数模型刻画;人的体重和身高的关系可用一元线性回归模型刻画。
3.教学重点:
理解一元线性回归模型的概念,能说明函数模型与回归模型的区别 。
二、目标与目标解析
目标:
(1)理解一元线性回归模型的表达式及模型中参数的意义。
(2)探究如何利用成对样本数据建立统计模型,并利用模型进行预测的问题。
(3)通过探究儿子身高与父亲身高的相关关系,思考这两个变量之间的关系不可以用函数模型来刻画进而引入一元线性回归模型的概念,体会引入一元线性回归模型的重要性。
目标解析:
达成上述目标的标志分别是:
知道一元线性回归模型的参数的意义。
能利用样本数据建立统计模型并会进行预测。
知道一元线性回归模型建立的必要性。
三、教学问题诊断解析
1.问题诊断
(1)让学生体会引入一元线性回归模型的必要性,也是教学的难点,学生在处理两个变量之间的关系时首先想到函数关系进而建立函数模型,结合实例中样本数据,存在父亲身高相同,而儿子身高不同的情况. 例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm. 可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.这就为接下来引入一元线性回归模型做好了铺垫,学生也能体会到引入一元线性回归模型的重要性了。
2.教学难点
体会引入一元线性回归模型的必要性
四、教学过程设计
引导语 前面我们已经了解到,根据成对样本数据的散点图和样本相关关系系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等,进一步地,如果能像建立适当的统计模型刻画两个随机变量的相关关系,你们我们就可以利用这个模型研究两个变量之间的随机关系,并通过模型进行预测。
下面我们研究当两个变量线性相关时,如果利用成对样本数据建立统计模型,并利用模型惊喜预测的问题。
情景引入
生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高。有人调查了14名男大学生的身高及其父亲的身高,得到数据如表所示:
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲 身高 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子 身高 176 176 170 170 185 176 178 174 170 168 178 172 165 182
问题1
利用我们学过的知识画出散点图。
追问1
儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?
合作探究
师生活动:根据样本数据,存在父亲身高相同,而儿子身高不同的情况. 例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm. 可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.
散点图中的散点大致分布在一条直线附近,表明儿子身高和父亲身高这两个变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响而把影响儿子身高的其他因素,如母亲身高、生活环境、饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型. 其中,随机误差是一个随机变量.
3.生产概念
用x表示父亲身高,Y表示儿子身高,e表示随机误差. 假定随机误差e的均值为0,方差为与父亲身高无关的定值,则它们之间的关系可以表示为.(1)
我们称(1)式为Y关于x的一元线性回归模型. 其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与之间的随机误差.
追问2
请结合具体实例解释产生模型(1)中随机误差项的原因。
师生活动:
在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:
(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;
(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;
(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.
五、板书设计
六、目标检测设计
1.说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子.
2.在一元线性回归模型(1)中,参数b的含义是什么?