2020-2021学年高二数学人教A版选修1-2第一章1.1回归分析的基本思想及其初步应用 (1)word

文档属性

名称 2020-2021学年高二数学人教A版选修1-2第一章1.1回归分析的基本思想及其初步应用 (1)word
格式 doc
文件大小 162.9KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2021-02-23 21:39:13

图片预览

文档简介

1.1回归分析的基本思想及其初步应用 (2课时)
【授课时间】 年 月 日 班级:
【教学目标】 1.知识与技能
介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差分析角度讨论回归模型的拟合效果;
2.过程与方法
(1)会使用电脑画散点图、求回归直线方程;
(2)能正确理解回归方程的预报结果.
3.情感态度与价值观
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.
【教学重点】回归分析的基本方法、随机误差e的认识、残差
【教学难点】回归分析的基本方法
【课 型】新课
【教学用具】 PPT课件,课本
【教学方法】探究法,提问法,讨论法
【教学过程】
初次备课 二次备课
一、新课引入: 必修三的第二章学习了回归方程,回忆用回归方程解决应用问题的步骤:
1.画散点图
2.了解最小二乘法的思想
3.求回归直线方程y=bx+a
4.用回归直线方程解决应用问题
二、新课讲授:
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表所示。
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。
解:
1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的线性相关关系, 因此可以用线性回归方程刻画它们之间的关系。
3、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系。
回归方程:
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。
探究:
身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。
即,用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平均体重的值。
我们可以用下面的线性回归模型来表示:
Y=bx+a+e (3) (4)
其中a和b为模型的未知参数,e称为随机误差。
在线性回归模型(4)中,随机误差e的方差越小,通过回归直线 (5)
预报真实值y的精度越高。随机误差是引起预报值与真实值y之间的误差的原因之一,其大小取决于随机误差的方差。
另一方面,由于公式(1)和(2)中和为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因。
思考:产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般):
1、忽略了其它因素的影响:影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素;
2、用线性回归模型近似真实模型所引起的误差;
3、身高 y 的观测误差。
以上三项误差越小,说明我们的回归模型的拟合效果越好。
对回归模型进行统计检验
假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值,即8个人的体重都为54.5kg。
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
54.5
54.5
54.5
54.5
54.5
54.5
54.5
54.5
在散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解析变量(身高)或随机误差的影响。
思考:
如何刻画预报变量(体重)的变化?这个变化在多大程度上与解析变量(身高)有关?在多大程度上与随机误差有关?
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
例如,编号为6的女大学生的体重并没有落在水平直线上,她的体重为61kg。解析变量(身高)和随机误差共同把这名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以6.5kg是解析变量和随机误差的组合效应。
编号为3的女大学生的体重并也没有落在水平直线上,她的体重为50kg。解析变量(身高)和随机误差共同把这名学生的体重从50kg“推”到了54.5kg,相差-4.5kg,这时解析变量和随机误差的组合效应为-4.5kg。
用这种方法可以对所有预报变量计算组合效应。
数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用表示总的效应,称为总偏差平方和。
那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)?有多少来自于随机误差?
假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归直线上。这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了。
因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称为残差。
例如,编号为6的女大学生,计算随机误差的效应(残差)为:
对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号表示为:称为残差平方和,它代表了随机误差的效应。
在例1中,残差平方和约为128.361。
由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为128.361,所以解析变量的效应为
这个值称为回归平方和。
解析变量和随机误差的总效应(总偏差平方和)
=解析变量的效应(回归平方和)+随机误差的效应(残差平方和)
巩固练习:
在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:
价格x
14
16
18
20
22
需求量Y
12
10
7
5
3
求出Y对的回归直线方程,并说明拟合效果的好坏。

【板书设计】1.引入线性回归模型y=bx+a+e 2.了解模型中随机误差项e产生的原因
3.了解相关指数 R2 和模型拟合的效果之间的关系
4.了解残差图的作用
5.利用线性回归模型解决一类非线性回归问题
6.正确理解分析方法与结果
课堂小结 用身高预报体重时,需要注意下列问题:
——这些问题也使用于其他问题。
1、回归方程只适用于我们所研究的样本的总体;
2、我们所建立的回归方程一般都有时间性;
3、样本采集的范围会影响回归方程的适用范围;
4、不能期望回归方程得到的预报值就是预报变量的精确值。
事实上,它是预报变量的可能取值的平均值。
【布置作业】 课后习题P9 1,3题
备课组长:
教学反思
亮点:


不足及改进措施:



教务处(教学部):