本资料来自于资源最齐全的21世纪教育网www.21cnjy.com
1.1
回归分析的基本思想及其初步应用
学案
【学习目标】
1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
2.了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
【重点难点】
1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
2.了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
【学习内容】
一、学前准备
1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.21教育网
二、新课导学
探究新知
问题1:假设身高和随机误差的不同不会对体重产生任何影响,会怎样?
问题2:假设随机误差对体重没有影响,即体重仅受身高的影响,又会怎样?
问题3:如何刻画预报变量(体重)的变化?这个变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?2·1·c·n·j·y
问题4:偏差平方和、残差平方和、回归平方和如何理解和计算
问题5:相关指数如何理解?
问题6:在回归分析中,分析残差能够帮助我们解决哪些问题?
应用示例
例1.关于与有如下数据:
2
4
5
6
8
30
40
60
50
70
为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.
例2.
以下是收集到的房屋的销售价格与房屋的大小的有关数据,
利用计算机可求得其线性回归方程为:
编号
1
2
3
4
5
房屋大小(m2)
80
105
110
115
135
价格(万元)
18.4
22
21.6
24.8
29.2
残差
(1)试说明模型的拟合效果
,(2)算出各样本点的残差,(3)作出残差图,并进行分析.
反馈练习
1.1993年到2002年中国的国内生产总值(GDP)的数据(单位:亿元)如下:
年份
GDP
1993
34634.4
1994
46759.4
1995
58478.1
1996
67884.6
1997
74462.6
1998
78345.2
1999
82067.5
2000
89468.1
2001
97314.8
2002
104790.6
(1)作GDP和年份的散点图,根据该图猜想他们之间的关系应是什么?
(2)建立年份为解释变量,GDP为预报变量的回归模型,并计算残差.
(3)根据你得到的模型,预报2003年的GDP,看看你的预报与实际GDP(117251.9亿元)的误差是多少.21cnjy.com
(4)你认为这个模型能较好地刻画GDP和年份的关系吗?说说你的理由.
【课堂小结与反思】
1.本节学习了哪些内容?
2.分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
【课后作业与练习】
1.一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是(
)
A、作物的产量
B、施肥量
C、试验者
D、降雨量或其他解释产量的变量
2.下列说法正确的有(
)
①回归方程适用于一切样本和总体
②回归方程一般都有时间性
③样本取值的范围会影响回归方程的适用范围
④回归方程得到的预报值是预报变量的精确值
A、①③
B、①②
C、②③
D、③④
3.已知回归直线方程中斜率的估计值为1.23,样本点的中心(4
,5),则回归直线方程为(
)
A、
B、
C、
D、
4.回归分析中,相关指数R2的值越大,说明残差平方和(
)
A、越小
B、越大
C、可能大也可能小
D、以上均不对
5.若回归直线方程中,回归系数
,则相关系数r为(
)
A、1
B、-1
C、0
D、无法确定
6.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R2为(
)
A、
B、
C、
D、
7.某考察团对全国10大城市进行职工人均工资水平(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归直线方程为,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(
)
A、83%
B、72%
C、67%
D、66%
8.一位母亲记录了儿子3
~
9岁的身高,由此建立的身高与年龄的回归模型为,用这个模型预测这孩子10岁时的身高,则正确的叙述是(
)
A、身高一定是145.83cm
B、身高在145.83cm以上
C、身高在145.83cm以下
D、身高在145.83cm左右
9.对两个变量y与x进行回归分析,得到一组样本数据:,,,
,则下列说法不正确的是(
)A、由样本数据得到的回归方程必过样本中心21世纪教育网版权所有
B、残差平方和越小的模型,拟合的效果越好
C、用相关指数来刻画回归效果,越小,
说明模型拟合的效果越好
D、若变量与之间的相关系系数为,则变量与之间具有线性相关关系.
10.
两个变量
y与x的回归模型中,分别选择了
4
个不同模型,它们的相关指数
如下
,其中拟合效果最好的模型是(
).A.
模型
1
的相关指数为
0.98
B.
模型
2
的相关指数为
0.80
C.
模型3
的相关指数为
0.50
D.
模型4
的相关指数为
0.25
11.若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为____
回归平方和为____________21·cn·jy·com
12、若施化肥量(单位:kg)与水稻产量y(单位:kg)的回归直线方程为,当施化肥量为80kg时,预报水稻产量为________________________.www.21-cn-jy.com
13、根据回归系数和回归截距的计算公式
可知:若y与x之间的一组数据为:
则拟合这5组数据的回归直线一定经过的点是________________.
21世纪教育网
--
中国最大型、最专业的中小学教育资源门户网站。
版权所有@21世纪教育网