3.1 回归分析的基本思想及其初步应用(1) 同步学案

文档属性

名称 3.1 回归分析的基本思想及其初步应用(1) 同步学案
格式 zip
文件大小 178.7KB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2019-06-10 13:55:32

图片预览

文档简介

选修2-3 第三章 §3.1 回归分析的基本思想及其初步应用(1)
班级 姓名
学习目标
1.了解回归分析的基本思想,会对两个变量进行回归分析;
2.明确建立回归模型的基本步骤,解决实际应用问题;
3.理解残差产生的原因及残差对预报精度的影响。
学习过程
一、课前准备
复习1:相关关系、正相关、负相关的定义:
复习2:对具有线性相关关系的两个变量做回归分析的一般步骤:
二、新课导学
探究:对于一组具有线性相关关系的数据:() , () ,…, (),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
(1)
(2)
其中:, 的意义分别是:_____ ______ ,()称为:________________
注意:回归直线一定过样本中心.
结论:回归分析的基本步骤:
三、典例分析:
例1、 从某大学中随机选取 8 名女大学生,其身高和体重数据如表
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据女大学生的身高预报体重的回归方程,并预报一名身高为 172 cm 的女大学生的体重.
解:设身高为自变量 x ,体重为因变量 y .
作散点图:
说明:一般地,我们用相关系数来衡量两个变量之间线性相关关系.相关系数的具体计算公式为
当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r的绝对值大于0. 75 时认为两个变量有很强的线性相关关系.
在本例中,可以计算出r =0. 798.
思考1:以上式子能反映身高与体重的真实关系吗?
思考2:真实的关系如何表示?
真实的身高和体重的关系可用下面的线性回归模型来表示:

问:上式中a、b、e的意义分别是什么?x称为_____________,y称为______________
所以:线性回归模型的完整表达式为:
(1)
在线性回归模型(1)中,随机误差e越小,通过回归直线: (2)
预报真实值y的精度越高.
思考3:产生随机误差项e的原因是什么?
思考4:为了衡量预报的精度,需要估计e的值.如何得到随机变量的样本呢?
残差:, 称为相应于点的残差.
思考5:如何减小随机误差来提高预报的精度?
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.下表列出了女大学生身高和体重的原始数据以及相应的残差数据,称为残差表:
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
残差
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
从上表中你能发现什么?怎样修改才能提高预报精度?
我们可以用相关指数来刻画回归的效果,其计算公式是:
显然,取值越大,意味着残差平方和越小,模型的拟合效果越好. 越接近于1,表示回归的效果越好
在例 1 中,=0. 64 ,表明“女大学生的身高解释了64 %的体重变化”,或者说“女大学生的体重差异有 64 %是由身高引起的”.
归纳:一般地,建立回归模型的基本步骤为:
三、总结提升
1.正相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。
2.相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量
3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。
课后作业
1.对于回归分析,下列说法错误的是(  )
A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
2.对于线性相关系数r,下列说法正确的是(  )
A.|r|∈(-∞,+∞),|r|越大,相关程度越大;反之,相关程度越小
B.|r|≤1,r越大,相关程度越大;反之,相关程度越小
C.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
D.以上说法都不正确
3.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要(  )h.
A.6.5    B.5.5    C.3.5    D.0.5
4.设有一个回归方程为=2-2.5x,则变量x增加一个单位时(  )
A.y平均增加2.5个单位 B.y平均增加2个单位
C.y平均减少2.5个单位 D.y平均减少2个单位
5.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y与x的回归直线的斜率为b,纵截距为a,则必有(  )
A.b与r的符号相同 B.a与r的符号相同 C.b与r的符号相反 D.a与r的符号相反
6.工人月工资y(元)关于劳动生产率x(千元)的回归方程为=650+80x,下列说法中正确的个数是(  )21世纪教育网版权所有
①劳动生产率为1000元时,工资为730元;
②劳动生产率提高1000元时,则工资提高80元;
③劳动生产率提高1000元时,则工资提高730元;
④当月工资为810元时,劳动生产率约为2000元.
A.1 B.2
C.3 D.4
设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是(  )
A.直线l过点(,) B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间 D.当n为偶数时,分布在l两侧的样本点的个数一定相同
8.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.
9.若施化肥量x与水稻产量y的回归直线方程为=5x+250,当施化肥量为80 kg时,预报水稻产量为__________.
10.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程=x+其中=-2,预测当气温为-4 ℃时,用电量的度数约为___.
11.已知x、y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
试:(1)分别计算:、、x1y1+x2y2+x3y3+x4y4、x+x+x+x; (2)求出回归方程.
12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程,=x+,并在坐标中画出回归直线;
(3)试预测加工10个零件需要多少时间?
选修2-3 第三章 §3.1 回归分析的基本思想及其初步应用(1)参考答案
1、[答案] D
2、[答案] C
3、[答案] A
4、[答案] C
5、[答案] A
[解析] 线性回归方程为=bx+a,b>0时,x与y正相关,b<0时,x与y负相关.因此b与r的符号相同.
6、[答案] C
[解析] 代入方程计算,可判断①②④正确.
7、[答案] A
[解析] 回归直线过样本中心点(,).
8、[答案] 1
9、[答案] 650 kg
10、[答案] 68
[解析] =(18+13+10-1)=10,=(24+34+38+64)=40.
又=-2,∴=+2=60.
故线性回归方程为=-2x+60.
当x=-4 ℃时,=68(度).
11、【解】 (1)==1.5,==4,
x1y1+x2y2+x3y3+x4y4=0×1+1×3+2×5+3×7=34,
x+x+x+x=02+12+22+32=14;
(2)==2,
=-=4-2×1.5=1,故=2x+1.
12、【解】 (1)散点图如图.
(2)由表中数据得xiyi=52.5,=3.5,=3.5,x=54,
∴=…=0.7.∴=…=1.05.∴=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时),
∴预测加工10个零件需要8.05小时.