1.7 相关性
1.8 最小二乘估计
课时训练
课时目标 1.通过收集现实问题中两个有关联变量的数据,作出散点图,并利用散点图直观认识变量间的相关关系.2.经历用不同估算方法描述两个变量线性相关的过程,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
1.散点图
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将____________________描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
2.若两个变量x和y的所有点看上去____________________,则称变量间是线性相关的,此时,我们可以用一条直线来近似.
若所有点看上去________________________________,则称此相关为非线性相关的.此时,可以用一条曲线来拟合.如果所有的点在散点图中____________________________,则称变量间是不相关的.
3.最小二乘法与线性回归方程
如果有n个点:(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.
使得上式达到________的直线y=a+bx就是我们所要求的直线,这种方法称为____________.
如果用表示,用表示,则可以求得
b=
=.
a=__________.
这样得到的直线方程称为线性回归方程,a,b是线性回归方程的系数.
一、选择题
1.下列两个变量之间的关系,哪个不是函数关系?( )
A.匀速行驶车辆的行驶距离与时间
B.圆半径与圆的面积
C.正n边形的边数与内角度数之和
D.人的年龄与身高
2.下列有关线性回归的说法,不正确的是( )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C.线性回归方程最能代表观测值x、y之间的关系
D.任何一组观测值都能得到具有代表意义的线性回归方程
3.工人月工资(元)依劳动生产率(千元)变化的线性回归方程为y=60+90x,下列判断正确的是( )
A.劳动生产率为1千元时,工资为50元
B.劳动生产率提高1千元时,工资提高150元
C.劳动生产率提高1千元时,工资约提高90元
D.劳动生产率为1千元时,工资90元
4.某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是( )
A.y=-10x+200
B.y=10x+200
C.y=-10x-200
D.y=10x-200
5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且线性回归方程:y=a+bx,经计算知:b=-1.4,则a的值为( )
x
4
5
6
7
8
y
12
10
9
8
6
A.17.4
B.-1.74
C.0.6
D.-0.6
6.线性回归方程表示的直线y=a+bx必经过点( )
A.(0,0)
B.(,0)
C.(,)
D.(0,)
题 号
1
2
3
4
5
6
答 案
二、填空题
7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且线性回归方程y=0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.
8.设有一个线性回归方程y=3-2.5x,当变量x增加一个单位时,变量y____________个单位.
9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的线性回归方程为y=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.
三、解答题
10.下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃)
-1
4
10
13
18
26
数量(百个)
20
24
34
38
50
64
若已知游客数量与平均气温是线性相关的,求线性回归方程.
11.5个学生的数学和物理成绩(单位:分)如下表:
学生学科
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
画出散点图,判断它们是否具有相关关系,若相关,求出线性回归方程.
能力提升
12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:
温度x(℃)
0
10
20
50
70
溶解度y
66.7
76.0
85.0
112.3
128.0
则由此得到回归直线的斜率约为________.
13.20世纪初的一项关于16艘轮船的研究显示,轮船的吨位从192~3246吨,船员的数目从5~32人,对船员人数关于轮船的吨位数的回归分析得:船员人数=9.5+0.006
2×轮船吨位(不足1人的舍去).
(1)假设两轮船吨位相差1
000吨,船员人数平均相差多少?
(2)对于最小的轮船估计的船员人数是多少?对于最大的轮船估计的船员人数是多少?
由最小二乘法得
其中:b是线性回归方程的斜率,a是截距.
线性回归方程的求解过程
3.在线性回归方程y=bx+a中,当回归系数b>0时,说明两个变量呈正相关关系,它的意义是:当x每增加一个单位时y就增加b个单位;当b<0时,说明两个变量呈负相关关系,它的意义是:当x每增加一个单位时,y就减少b个单位.
答案
知识梳理
1.变量所对应的点 2.都在一条直线附近波动 都在某条曲线(不是一条直线)附近波动 没有显示任何关系 3.最小值 最小二乘法 -b
作业设计
1.D [人的年龄与身高具有相关关系.]
2.D [只有所有的数据点都分布在一条直线附近时,才能得到具有代表意义的回归直线.]
3.C [因工人月工资与劳动生产率变化的线性回归方程为y=60+90x,当x由a提高到a+1时,y2-y1=60+90(a+1)-60-90a=90.]
4.A [∵y与x负相关,∴排除B、D,
又∵C项中x>0时y<0不合题意,∴C错.]
5.A [=(4+5+6+7+8)=6,
=(12+10+9+8+6)=9.
a=-b
=9+1.4×6=9+8.4=17.4.]
6.C [由a=-b
得=b
+a,即点(,)适合方程y=a+bx.]
7.87.5%
解析 设该地区人均工资收入为,
则=0.7+2.1,
当=10.5时,==12.
×100%=87.5%.
8.减少2.5
解析 y′=3-2.5(x+1)=3-2.5x-2.5=y-2.5,因此,y的值平均减少2.5个单位.
9.20
解析 令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为y=6+0.4x1,y2=6+0.4x2,
所以|y1-y2|=|0.4(x1-x2)|=0.4×50=20.
10.解 ==,==,x=1+16+100+169+324+676=1
286,xiyi=-20+96+340+13×38+18×50+26×64=3
474.
b==≈1.68,
a=-b
≈18.73,即所求的线性回归方程为y=1.68x+18.73.
11.解 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为线性相关.
列表,计算
i
1
2
3
4
5
xi
80
75
70
65
60
yi
70
66
68
64
62
xiyi
5
600
4
950
4
760
4
160
3
720
x
6
400
5
625
4
900
4
225
3
600
=70,=66,x=24
750,xiyi=23
190
设所求回归方程为y=bx+a,则由上表可得
b===0.36,
a=-b
=40.8.
∴所求线性回归方程为y=0.36x+40.8.
12.0.880
9
解析 =30,=93.6,x=7
900,xiyi=17
035,
所以回归直线的斜率
b==≈0.880
9.
13.解 (1)由y=9.5+0.006
2x可知,当x1与x2相差1
000吨时,船员平均人数相差y1-y2=(9.5+0.006
2x1)-(9.5+0.006
2x2)=0.006
2×1000≈6(人).
(2)当取最小吨位192时,预计船员人数为y=9.5+0.006
2×192≈10(人).
当取最大吨位3
246时,预计船员人数为y=9.5+0.006
2×3
246≈29(人).