2019年数学湘教版选修1-2新设计同步(讲义):第4章 4.4 一元线性回归案例

文档属性

名称 2019年数学湘教版选修1-2新设计同步(讲义):第4章 4.4 一元线性回归案例
格式 zip
文件大小 314.3KB
资源类型 教案
版本资源 湘教版
科目 数学
更新时间 2019-04-30 16:44:18

图片预览

文档简介

4.4一元线性回归案例
[读教材·填要点]
1.相关系数
(1)定义:样本量是n的成对观测数据用(x1,y1),(x2,y2),…,(xn,yn)表示,用表示数据x1,x2,…,xn,用表示数据y1,y2,…,yn,用与分别表示和的均值,用sx表示的标准差,用sy表示的标准差,再引入
sxy=- .
当sxsy≠0时,称rxy=为和的相关系数.
①当rxy>0,我们称和正相关;
②当rxy<0,我们称和负相关;
③当rxy=0,我们称和不相关.
(2)性质:
①rxy总在区间[-1,1]中取值;
②当rxy越接近于1时,x增加,y也倾向于增加,这时数据(x1,y1),(x2,y2),…,(xn,yn),分散在一条上升的直线附近;
③当rxy越接近于-1时,x增加,y倾向于减少,这时数据(x1,y1),(x2,y2),…,(xn,yn),分散在一条减少的直线附近.
2.一元线性回归
(1)回归直线方程:
l:y=bx+a,其中b=,a=-b .
(2)一元线性回归模型:
若样本量n的成对观测数据(x1,y1),(x2,y2),…,(xn,yn)中yi和xi满足关系:yi=bxi+a+ei,i=1,2,…,n,其中e1,e2,…,en表示随机误差,则称该模型为一元线性回归模型.
[小问题·大思维]
1.|rxy|越接近1,及越接近于0,表示两个变量x与y之间线性相关程度如何?
提示:|rxy|越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|rxy|越接近0,表明两个变量的线性相关程度越弱,通常|rxy|>0.8时,认为有很强的相关关系.
2.在一元线性回归模型中,变量y由变量x唯一确定吗?
提示:不唯一.y值由x和随机误差e共同确定,即自变量x只能解释部分y的变化.
3.随机误差e产生的主要原因有哪些?
提示:随机误差e产生的主要原因有:
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差.
4.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?
提示:不一定是真实值.利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.
相关性检验
在某种产品表面进行腐蚀性刻线实验,得到腐蚀深度Y与腐蚀时间X之间相应的一组观察值,如下表:
X(s)
5
10
15
20
30
40
50
60
70
90
120
Y(μm)
6
10
10
13
16
17
19
23
25
29
46
用散点图及相关系数两种方法判断X与Y的相关性.
[自主解答] (1)作出如图所示的散点图.
从散点图可看出腐蚀深度Y(μm)与腐蚀时间X(s)之间存在着较强的线性相关关系.
(2)相关系数rxy=,其中
sxy=- =362.562.
sx≈34.515 8,
sy≈10.697 1.
∴rxy=≈0.98.
显然|rxy|>0.8,所以腐蚀深度Y与腐蚀时间X之间有很强的线性相关关系.
判断两个变量X和Y线性相关的方法:
(1)画出散点图,呈条状分布,则X与Y线性相关.
(2)用公式求出相关系数,据其判断X与Y的相关性.
如果|rxy|>0.8,则有很强的线性相关关系.
1.要分析学生初中升学的数学成绩对高中一年级数学学习有什么影响,在高中一年级学生中随机抽选10名学生,分析他们入学的数学成绩(x)和高中一年级期末数学考试成绩(y)(如表):
编号
1
2
3
4
5
6
7
8
9
10
x
63
67
45
88
81
71
52
99
58
76
y
65
78
52
82
92
89
73
98
56
75
用散点图及相关系数两种方法判断x与y的相关性.
解:(1)入学成绩(x)与高一期末考试成绩(y)两组变量的散点图(如图),从散点图看,这两组变量具有线性相关关系.
(2)因为=70,=76,
sxy=189.4,sx=15.729,sy=14.339.
由rxy=,得rxy≈0.839 8>0.8.
所以x与y有较强的线性关系.
线性回归分析
为了研究某种细菌在特定环境下随时间变化的系列情况,得如下实验数据:
天数t(天)
3
4
5
6
7
繁殖个数y(千个)
2.5
3
4
4.5
6
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,预测t=8时,细菌繁殖个数.
[自主解答] (1)由表中数据得=5,=4, yi=108.5,
则Sty=-t=1.7,S=2.
∴b==0.85,a=-b=-0.25,
∴回归方程式为y=0.85t-0.25.
(2)将t=8代入(1)的回归方程中得
y=0.85×8-0.25=6.55.
故预测t=8时,细菌繁殖个数为6.55千个.
进行线性回归分析的关键是画出样本点的散点图,确定出变量具有线性相关关系,再求出回归直线方程.如果x,y的线性相关关系具有统计意义,就可以用线性回归方程来作预测和控制.
2.某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:摄氏度)之间有下列 数据:
x
-2
-1
0
1
2
y
5
4
2
2
1
甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6.其中正确的是(  )
A.①    B.②    C.③    D.①③
解析:回归方程y=bx+a表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.
答案:A
一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间y(分)
62
68
75
81
89
95
102
108
115
122
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程.
[巧思] (1)利用相关系数rxy判断;
(2)利用最小二乘法求得a,b的值,进而求得回归方程.
[妙解] (1)列出下表,并用科学计算器进行计算.
i
1
2
3
4
5
6
7
8
9
10
xi
10
20
30
40
50
60
70
80
90
100
yi
62
68
75
81
89
95
102
108
115
122
xiyi
620
1 360
2 250
3 240
4 450
5 700
7 140
8 640
10 350
12 200
于是rxy=
=≈0.999 8.
所以y与x具有线性相关关系.
(2)设所求的回归直线方程为y=bx+a,
那么由上表可得b=≈0.668,
a=-b=91.7-0.668×55≈54.96,
即所求的回归直线方程为y=0.668x+54.96.
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是(  )
A.①②⑤③④        B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D.
答案:D
2.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析:因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,
故x与z负相关.
答案:C
3.相关变量x,y的样本数据如下表:
x
1
2
3
4
5
y
2
2
3
5
6
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为y=1.1x+a,则a=(  )
A.0.1           B.0.2
C.0.3 D.0.4
解析:∵回归直线经过样本中心点(,),且由题意得(,)=(3,3.6),
∴3.6=1.1×3+a,∴a=0.3.
答案:C
4.在关于两个变量的回归分析中,作散点图的目的是________________________.
答案:观察两个变量之间是否存在线性相关关系
5.某服装厂的产品产量x(万件)与单位成本y(元/件)之间的回归直线方程是y=52.15-19.5x,当产量每增加一万件时,单位成本下降________元.
解析:由回归系数的意义得下降19.5元.
答案:19.5
6.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:
1
2
3
4
5
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
已知iyi=62,=16.6.
(1)画出散点图;
(2)求出y对x的回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).
解:(1)散点图如下图所示:
(2)因为=×9=1.8,=×37=7.4,
iyi=62,=16.6,
sxy=- =12.4-13.32=-0.92.
所以b===-11.5,
a=-b=7.4+11.5×1.8=28.1,
故y对x的回归方程为y=28.1-11.5x.
(3)y=28.1-11.5×1.9=6.25(t).

一、选择题
1.下表是x与y之间的一组数据,则y关于x的线性回归方程必过(  )
x
0
1
2
3
y
1
3
5
7
A.点(2,2)        B.点(1.5,2)
C.点(1,2) D.点(1.5,4)
解析:===1.5,==4,
∴线性回归方程必过点(1.5,4).
答案:D
2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为(  )
A.y=0.4x+2.3 B.y=2x-2.4
C.y=-2x+9.5 D.y=-0.3x+4.4
解析:依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5)代入A、B得A正确.
答案:A
3.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温(℃)
18
13
10
-1
销售量(个)
24
34
38
64
由表中数据,得线性回归方程y=-2x+a.当气温为-4 ℃时,预测销售量约为(  )
A.68 B.66
C.72 D.70
解析:∵=(18+13+10-1)=10,=(24+34+38+64)=40,
∴40=-2×10+a,∴a=60,
当x=-4时,y=-2×(-4)+60=68.
答案:A
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程y=bx+a,其中b=0.76,a=-b.据此估计,该社区一户年收入为15万元家庭的年支出为(  )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:由题意知,==10,
==8,
∴a=8-0.76×10=0.4,
∴当x=15时,y=0.76×15+0.4=11.8(万元).
答案:B
二、填空题
5.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
答案:0.254
6.下表是某厂1~4月份用水量(单位:百吨)的一组数据,
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y=-0.7x+a,则a=________.
解析:=2.5,=3.5,b=-0.7,∴a=3.5+0.7×2.5=5.25.
答案:5.25
7.已知回归直线的斜率的估计值为1.23.样本点的中心为(4,5),则回归直线方程是________________.
解析:由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),
可得y-5=1.23(x-4),即y=1.23x+0.08.
答案:y=1.23x+0.08
8.在研究硝酸钠的可溶性程度时,观察它在不同温度的水中的溶解度,得观测结果 如下:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
由此,得到回归直线的斜率是________.
解析:根据sxy=- ,及b=,得b=0.880 9.
答案:0.880 9
三、解答题
9.在关于人体的脂肪含量(百分比)和年龄关系研究中,研究人员获得了如下一组数据:
年龄x
22
26
38
41
45
48
50
53
54
56
57
脂肪含量y
9.4
17.8
21.2
24.9
26.5
27.1
28.2
29.4
30.2
31.4
32.6
(1)画出散点图;
(2)求y与x之间的回归方程;
(3)预测39岁的人脂肪含量.(保留四位有效数字)
解:(1)画出散点图.
(2)由散点图可以看出y与x之间有较强的线性相关关系,
可算得=i≈44.545 5,
=i≈25.336 4,iyi=13 205,=23 224,
∴b=≈0.565 7,a=-b ≈0.137 0.
∴y与x之间的线性回归方程为y=0.565 7x+0.137 0.
(3)当x=39时,y=0.565 7×39+0.137 0≈22.20,
∴39岁的人的脂肪含量约为22.20%.
10.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2013
2014
2015
2016
2017
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+;
(2)用所求回归方程预测该地区2018年(t=6)的人民币储蓄存款.
附:回归方程=t+中,=,=-,
解:(1)列表计算如下:
i
ti
yi
t
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50

15
36
55
120
这里n=5,=I ==3,=i==7.2.
又ltt=-n2=55-5×32=10,
lty=iyi-n=120-5×3×7.2=12,
从而===1.2,=-=7.2-1.2×3=3.6,
故所求回归方程为=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2018年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
同课章节目录