118517
119850
121121
122389
123626
124761
125786
126743
127627
128453
-371.176
-149.079
11.018
168.115
294.212
318.309
232.406
78.503
-148.4
-433.303
习题1.1
【授课时间】 年 月 日 班级:
【教学目标】 1.知识与技能
进一步了解回归分析的基本思想方法及其简单应用, 明确建立回归模型的基本步骤,解决实际问题。
2.过程与方法
了解残差分析和指标R2, 会初步应用。
3.情感态度与价值观
通过本节课的学习,培养应用意识,提升发现问题、解决问题的能力。
【教学重点】残差分析和指标R2。
【教学难点】利用残差和指标R2分析回归模型的拟合效果。
【课 型】习题课
【教学用具】 PPT课件,课本
【教学方法】探究法,提问法,讨论法
【教学过程】
初次备课 二次备课
一、复习引入: 1.建立回归模型的一般步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出两个变量的散点图,观察它们之间的关系(如是否存在线性关系).
(3)由经验确定回归的类型.
(4)按一定规则估计回归方程的参数.
(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若残差存在异常,则应检查数据是否有误,或模型是否合适等.
2.
二、新课讲授:
1.我国1993年至2002年的国内生产总值(GDP)的数据如下:
年份
GDP/亿元
1993
34634.4
1994
46759.4
1995
58478.1
1996
67884.6
1997
74462.6
1998
78345.2
1999
82067.5
2000
89468.1
2001
97314.8
2002
104790.6
(1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么.
(2)建立年份为解释变量,GDP为预报变量的回归模型,并计算残差.
(3)根据你得到的模型,预报2003年的GDP,看看你的预报与实际GDP(117251.9亿元)的误差是多少.
(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由.
解:
(1)如图所示:
(2)从上图中可以看出,x与y之间有近似的线性相关关系,即可以用一个回归直线方程表示,
通过计算可得
∴y对x的回归直线模型为
残差为:
(3)
2003年的实际GDP为117 390亿元,误差为4 333.78亿元.
(4)以样本编号为横坐标,残差为纵坐标作残差图.
从残差图可以看出这个模型能较好地刻画GDP和年份的关系.
3.如下表所示,某地区一段时间内观察到的大于或等于某震级x的地震个数为N,试建立回归方程表示二者之间的关系。
答案
由表中数据得散点图如图1-1-11。
从散点图可以看出,震级x与大于或等于该震级的地震次数N之间不呈线性相关关系,随着x的减少,所考察的地震数N近似地以指数形式增长。做变换y=lg N,得到的数据如下所示:
x和y的散点图如图1-1-12:
从这个散点图中可以看出x和y之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系。根据最小二乘法计算公式,得
故线性回归方程为
相关指数,说明x可以解释y的99.7%的变化。因此,可以用回归方程描述x和N之间的关系。
说明:对非线性相关关系,要选择恰当的变换化为线性相关关系,再用最小二乘法求线性回归方程。
三、巩固练习:
例. 1993年至2002年每年中国人口总数的数据如下表:
数据来源:中国统计年鉴,2003.
年份
1993
1994
1995
1996
1997
年末人数/万人
118517
119850
121121
122389
123626
年份
1998
1999
2000
2001
2002
年末人数/万人
124761
125786
126743
127627
128453
(1)作年份和人口总数的散点图,根据该图猜想它们之间的关系应该是什么形式;
(2)建立年份为解释变量,人口总数为预报变量的回归模型,并计算残差;
(3)计算R2,你认为这个模型能较好地刻画年份和人口总数之间的关系吗?请说明理由.
解:(1)将解释变量年份作为横轴,预报变量人口总数作为纵轴绘制散点图如下:
根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.
(2)由线性回归模型的最小二乘法估计量的计算公式得,
从而线性回归方程为.
年份
1993
1994
1995
1996
1997
年末人数/万人
118517
119850
121121
122389
123626
残差
-371.176
-149.079
11.018
168.115
294.212
年份
1998
1999
2000
2001
2002
年末人数/万人
124761
125786
126743
127627
128453
残差
318.309
232.406
78.503
-148.4
-433.303
其残差值计算结果如下表:
(3)对于(2)中所建立的线性回归方程,由公式 ,
计算得,说明在线性回归模型中年份解释了99.4%的人口总数的变化,所以线性回归模型对数据的拟合非常好.
我们也可以通过残差图观察拟合效果:
探究5:你能总结出建立回归模型的基本步骤吗?
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.
【板书设计】 习题1.1
课堂 小结
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.
【布置作业】 课后习题P19 2题
备课组长:
教学反思
亮点:
不足及改进措施:
教务处(教学部)