2.3变量间的相关关系
学案
【学习目标】
1.了解相关关系、线性相关、回归直线、最小二乘法的定义.
2.会作散点图,并能利用散点图和定义判断两个变量之间是否具有相关关系.
3.会求回归直线方程,并能用回归直线方程解决有关问题.
【学习重点】
变量间的相关性与回归直线方程
课前预习案
【知识链接】
问题1:在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?
请同学们如实填写下表(在空格中打“√”
):
好
中
差
你的数学成绩
你的物理成绩
问题2:
某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?
【知识梳理】
1.相关关系
(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的______性,那么这两个变量之间的关系,叫做相关关系.
(2)两类特殊的相关关系:如果散点图中点的分布是从______角到______角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从______角到______角的区域,那么这两个变量的相关关系称为负相关.
2.线性相关
(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条______附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做__________.
(2)最小二乘法:求线性回归直线方程
=x+时,使得样本数据的点到它的______________最小的方法叫做最小二乘法,其中,的值由以下公式给出:
其中,是回归方程的____________,是回归方程在y轴上的______.
小结:
线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.
自主小测
1、下列图形中具有相关关系的两个变量是( )
2、某单位为了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温/℃
18
13
10
-1
用电量/千瓦时
24
34
38
64
由表中数据得线性回归方程
=x+中≈-2,则
≈__________.
课
上
导
学
案
教师点拨1:
两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.
教师点拨2:①相关关系与函数关系的异同
相同点:两者均是指两个变量的关系.
不同点:函数关系是一种确定的关系.如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.
函数关系是一种因果关系,而相关关系不一定是因果关系,可能是伴随关系.
②线性回归直线方程的性质
(1)回归直线过样本数据的中心.
所谓样本数据的中心,对于单变量样本数据而言,平均数是样本数据的中心;对于以(xn,yn)为样本数据而言,(,)为样本点的中心,根据最小二乘法原理,回归直线一定过样本点的中心.
(2)回归直线的单调性与样本数据的相关性.
如果样本数据对应的点具有线性相关关系,从回归直线方程来看,当系数b>0时,直线单调递增,此时这两个变量正相关;当b<0时,直线单调递减,此时这两个变量负相关.
【例题讲解】
【例题1】
设对变量x,y有如下观察的数据:
x
151
152
153
154
156
157
158
159
160
162
163
164
y
40
41
41
41.5
42
42.5
43
44
45
45
46
45.5
(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是负相关?
【例题2】
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程
=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【例题3】
下列变量之间的关系属于相关关系的是( )
A.圆的周长和它的半径之间的关系
B.价格不变的条件下,商品销售额与销售量之间的关系
C.家庭收入愈多,其消费支出也有增长的趋势
D.正方形面积和它的边长之间的关系
【当堂检测】
1.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从散点图可以看出y与x线性相关,且回归方程为
=0.95x+a,则a=( )
A.3.25
B.2.6
C.2.2
D.0
2.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为
=0.66x+1.562.若某城市居民人均工资为9
000元,则其居民人均消费水平为__________千元.
3.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
则=________,=________,=__________,=__________,回归直线方程为__________.
4.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x成线性相关关系.试求:
(1)线性回归方程=的回归系数与;
(2)估计使用年限为10年时,维修费用是多少?
【问题与收获】
基础知识答案:1.(1)随机 (2)左下 右上 左上 右下
2.(1)直线 回归直线 (2)距离的平方和 - 斜率 截距
自主小测答案:
1、
C A项中显然任给一个x都有唯一确定的y和它对应,是一种函数关系;B项也是一种函数关系;C项中从散点图可以看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关关系;D项中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.
2、60 ==10,==40,
则=-≈40+2×10=60.
例题答案:
【例题1】
解:(1)画出散点图.
(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
【例题2】
解:(1)散点图,如图所示.
(2)由题意,得xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,
==3.5,
x=32+42+52+62=86,
则===0.7,
=-=3.5-0.7×4.5=0.35,
故线性回归方程为=0.7x+0.35.
(3)根据线性回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,
故消耗能源减少了90-70.35=19.65(吨).
【例题3】
正解:因选项A,B,D中的两个变量间都有唯一确定的关系,因而它们都是函数关系;而选项C中家庭收入会对消费支出产生一定的影响,但高收入未必有高消费,因而选项C中的关系才是相关关系.故选C.
当堂检测答案:1.B 线性回归方程一定经过样本取值的平均数点(,),由取值表可计算==2,==,知回归方程为=0.95x+a,又经过点(2,),代入得a=2.6.
2.7.502 当x=9千元时,y=0.66×9+1.562=7.502.
3.6.5 8 327 396 =1.14x+0.59 根据公式代入即可求得,也可以利用计算器求得,=6.5,=8,=327,=396,回归直线方程为=1.14x+0.59.