8.2.1一元线性回归模型-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册课件(13张PPT)

文档属性

名称 8.2.1一元线性回归模型-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册课件(13张PPT)
格式 ppt
文件大小 1.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-25 10:20:23

图片预览

文档简介

8.2.1
一元线性回归模型
高二数学选择性必修 第三册 第八章 成对数据的统计分析
学习目标
1. 结合具体实例,通过分析变量间的关系建立一元线性回归模型;
2. 能说明模型参数的统计意义,提高数据分析能力.
3.核心素养: 直观想象、数据分析、
逻辑推理、数学运算.
通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.
思考:是否可以通过建立适当的统计模型来刻画两个变量之间的相关关系?
一、课前引入
1.生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表1所示.
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
父亲身高/cm
174
170
173
169
182
172
180
172
168
166
182
173
164
180
儿子身高/cm
176
176
170
170
185
176
178
174
170
168
178
172
165
182
从图上看,散点大致分布在一条直线附近
二、探究新知
根据我们学过的整理数据的方法:相关系数r =0.886.
父亲身高/cm
180
175
170
165
160
160
165
170
175
180
185
190
·
·
·
·
·
·
·
儿子身高/cm
·
·
·
·
·
·
·
185
1).问题1:可以得到什么结论?
由散点图的分布趋势表明儿子的身高与父亲的身高线性相关,通过相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.
2).问题2:是否可以用函数模型来刻画?
不能,因为不符合函数的定义.这其中还受其它因素的影响.
3).问题3:那么影响儿子身高的其他因素是什么?
影响儿子身高的因素除父亲的身外,还有 母亲的身高、生活的环境、饮食习惯、营养水平、体育锻炼等随机的因素,儿子身高是父亲身高的函数的原因是存在这些随机的因素.
Y=bx+a+e
4).问题4: 各种随机因素都是独立的,有些因素又无法量化. 你能否考虑到这些随机因素的作用, 用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?
如果用x表示父亲身高,Y表示儿子的身高,用e表示各种其它随机因素影响之和,称e为随机误差, 由于儿子身高与父亲身高线性相关,所以Y=bx+a.
由于随机误差表示大量已知和未知的各种影响之和,它们会相互抵消,为使问题简洁,可以假设随机误差e的均值为0,方差为与父亲身高无关的定值 .
思考:为什么要假设E(e)=0,而不假设其为某个不为0的常数?
因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.
如果随机误差是一个不为0的常数 e,则可以将 e 合并到
截距项a中,否则模型无法确定,即参数没有唯一解.
如果随机误差e=0,那么Y与x之间的关系就可用
一元线性函数模型来描述.
问题5:请根据以上的分析,你能建立一个数学模型表示儿子身高与父亲身高的关系吗?
我们称①式为Y关于x的一元线性回归模型,其中,Y称为因变量或响应变量,x称为自变量或解释变量 . a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.

2、一元线性回归模型
如果用x表示父亲身高,Y表示儿子的身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值 ,则它们之间的关系可以表示为
3.函数模型与回归模型之间的差别
函数模型:
回归模型:
一元线性回归模型Y=bx+a+e增加了随机误差项e,因变量 Y 的值由 自变量 x 和随机误差项e共同确定, 即自变量x只能解释部分Y的变化.
解释变量x (身高)
模型误差e (其它所有变量)
响应变量Y(体重)
你能结合父亲与儿子身高的实例,说明回归模型①的意义?

可以解释为父亲身高为 的所有男大学生身高组成一个子总体,该子总体的均值为 ,即该子总体的均值与父亲的身高是线性函数关系.
而对于父亲身高为 的某一名男大学生,他的身高 并不一定为 ,它不仅是该子总体的一个观测值,这个观测值与均值有一个误差项 .
(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等.
(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差.
(3)实际问题中,我们不知道儿子身高和父亲身高的相关 关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似关系也是产生随机误差e的原因.
产生随机误差e的原因有:
4.问题6:你能结合具体实例解释产生模型①中随机误差项的原因吗?
解: (1),(2),(3),(4),(5)回归模型(6),(7)函数模型.
二、巩固新知
1.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?为什么?函数模型与回归模型有什么区别?
(1)某公司的销售收入和广告支出;
(2)某城市写字楼的出租率和每平米月租金;
(3)航空公司的顾客投诉次数和航班正点率;
(4)某地区的人均消费水平和人均国内生产总值(GDP);
(5)学生期末考试成绩和考前用于复习的时间;
(6)一辆汽车在某段路程中的行驶速度和行驶时间;
(7)正方形的面积与周长.
三、课堂小结
1.一元线性回归模型
2.一元线性回归模型与函数模型的区别
Y称为因变量或响应变量
x称为自变量或解释变量
e是Y与bx+a之间的随机误差.
a称为截距参数
b称为斜率参数
作业: 课本P106 练习 2,3题