2019年数学人教B版选修1-2新设计同步(讲义+课件+课时跟踪训练): 第一章 1.2 回归分析

文档属性

名称 2019年数学人教B版选修1-2新设计同步(讲义+课件+课时跟踪训练): 第一章 1.2 回归分析
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-04-28 08:19:43

文档简介

1.2回归分析

1.线性回归模型
在回归直线方程=x+中
==,=-.
其中=i,=i, (,)称为样本点的中心.
2.线性相关性检验
(1)对于变量x与Y随机抽取到的n对数据(x1,y1),(x2,y2)…,(xn,yn),检验统计量是样本相关系数
r=
=
r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(2)检验步骤如下:
①作统计假设:x与Y不具有线性相关关系.
②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05.
③根据样本相关系数计算公式算出r的值.
④作出统计推断.如果|r|>r0.05,表明有95%把握认为x与Y之间具有线性相关关系.
如果|r|≤r0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.
1.线性回归分析的方法、步骤
(1)确定研究对象,明确是求哪一个变量对哪一个变量的回归方程.
(2)画散点图或计算相关系数r,判断两个变量之间是否线性相关.
(3)若两变量线性相关,可用公式计算,的值.
(4)写出线性回归方程,利用它来预测一些变量的对应值.
2.在求线性回归直线方程时,要先判断两变量的相关性,否则求出的回归直线方程,可能没有任何意义.

回归直线方程
[例1] 假设某设备的使用年限x(年)和所支出的维修费用Y(万元)有如下的统计资料:
x
2
3
4
5
6
Y
2.2
3.8
5.5
6.5
7.0
试求:
(1)Y对x的回归直线方程;
(2)当使用年限为10年时,估计维修费用是多少?
[思路点拨] 先作出散点图,再根据散点图分析支出的维修费用与使用年限是否线性相关,若相关,再利用线性回归方程求解,最后根据求得的方程估计10年时的维修费用.
[精解详析] (1)根据表中数据作散点图,如图所示:
从散点图可以看出,样本点都集中分布在一条直线附近,因此Y与x之间具有线性相关关系.利用题中数据得:
i
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
=4,=5,=90,iyi=112.3
所以===1.23,
=-=5-1.23×4=0.08,
∴线性回归方程为=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38(万元),即当使用10年时,估计维修费用是12.38万元.
[一点通] 求回归直线方程的步骤:
(1)作出散点图,从直观上分析相关关系;
(2)计算,,,iyi;
(3)代入公式计算,的值;
(4)写出回归方程.
1.(辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.
解析:以x+1代替x,得=0.254(x+1)+0.321,与=0.254x+0.321相减得年饮食支出平均增加0.254万元.
答案:0.254
2.某班5名学生的数学和物理成绩如下表:
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
物理成绩(Y)
78
65
71
64
61
(1)画出散点图;
(2)求物理成绩Y对数学成绩x的回归直线方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
解:(1)如图所示.
(2)因为=×(88+76+73+66+63)=73.2,
=×(78+65+71+64+61)=67.8,
iyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174.
所以==≈0.625,
=- ≈67.8-0.625×73.2=22.05.
所以Y对x的回归直线方程是=0.625x+22.05.
(3)当x=96时,则=0.625×96+22.05≈82,
即可以预测他的物理成绩是82.
相关性检验
[例2] 抽测10名15岁男生的身高x(单位:cm)和体重Y(单位:kg),得到如下数据:
x
157
153
151
158
155
156
159
160
158
163
Y
45.5
44
42
46
44.5
45
46.5
47
45
49
(1)Y与x之间是否具有线性相关关系?
(2)如果Y与x之间具有线性相关关系,求Y对x的回归直线方程.
[思路点拨] 利用相关系数计算公式求出r;
与临界值比较判断其相关性.
[精解详析] (1)列出下表,并用科学计算器进行有关计算.
i
1
2
3
4
5
6
7
8
9
10
xi
157
153
151
158
155
156
159
160
158
163
yi
45.5
44
42
46
44.5
45
46.5
47
45
49
xiyi
7 143.5
6 732
6 342
7 268
6 897.5
7 020
7 393.5
7 520
7 110
7 987
=157,=45.45,
=246 598,=20 688.75,iyi=71 413.5
于是-102=246 598-10×1572=108,
-102=20 688.75-10×45.452=31.725,
iyi-10 =71 413.5-10×157×45.45=57,
r=
=≈0.974.
查相关性检验的临界值表,得r0.05=0.632.由于|r|>r0.05,因此认为Y与x之间有较强的线性相关关系.
(2)设Y对x的回归直线方程为=x+,则
==≈0.528,
=- ≈45.45-0.528×157=-37.446,
故所求的Y对x的回归直线方程为=0.528x-37.466.
[一点通] 
(1)在研究两个变量之间的关系时,一般通过散点图进行相关性检验,若具备线性相关关系,再求回归直线方程.
如果两个变量不具备线性相关关系,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
(2)回归直线方程能定量地描述两个变量的关系,系数,刻画了两个变量之间的变化趋势,其中表示x变化一个单位时,y的平均变化量.利用回归直线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.
(3)线性回归分析中:
相关系数r的绝对值越大说明y与x的线性相关性越强.
3.某种产品的广告费支出x与销售额Y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
Y
30
40
60
50
70
(1)画出散点图;
(2)对两个变量进行相关性检验;
(3)求回归直线方程.
解:(1)散点图如图所示
(2)计算各数据如下:
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
=5,=50,
=145,=13 500,iyi=1 380
r=≈0.92,查得r0.05=0.878,r>r0.05,故有95%的把握认为该产品的广告费支出与销售额之间具有线性相关关系.
(3)===6.5,
=- =50-6.5×5=17.5,
于是所求的回归直线方程是=6.5x+17.5.
非线性回归分析
[例3] (12分)有一个测量水流量的实验装置,测得试验数据如下表:
i
1
2
3
4
5
6
7
水高h(厘米)
0.7
1.1
2.5
4.9
8.1
10.2
13.5
流量Q(升/分钟)
0.082
0.25
1.8
11.2
37.5
66.5
134
根据表中数据,建立Q与h之间的回归方程.
[精解详析] 由表中测得的数据可以作出散点图,如图
?(4分)
观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数)两边取常用对数,
则lg Q=lg m+n·lg h.
令y=lg Q,x=lg h,那么y=nx+lg m,
即为 线性函数模型y=bx+a的形式(其中b=n,a=lg m).?(6分)
由下面的数据表,用最小二乘法可求得≈2.5 097,=-0.7 077,所以n≈2.51,m≈0.196.
i
hi
Qi
xi=lg hi
yi=lg Qi
x
xiyi
1
0.7
0.082
-0.1 549
-1.0 862
0.024
0.1 683
2
1.1
0.25
0.0 414
-0.6 021
0.0 017
-0.0 249
3
2.5
1.8
0.3 979
0.2 553
0.1 583
0.1 016
4
4.9
11.2
0.6 902
1.0 492
0.4 764
0.7 242
5
8.1
37.5
0.9 085
1.5 740
0.8 254
1.4 300
6
10.2
66.5
1.0 086
1.8 228
1.0 173
1.8 385
7
13.5
134
1.1 303
2.1 271
1.2 776
2.4 043

4.022
5.1401
3.7807
6.642
于是所求得的回归方程为:Q=0.196·h2.51.?(12分)
[一点通] 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
4.在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25
0.5
1
2
4
Y
16
12
5
2
1
试建立Y对x之间的回归方程.
解:作出变量Y与x之间的散点图如图所示.
由图可知变量Y与x近似地呈反比例函数关系.
设Y=,令t=,则Y=kt.由Y与x的数据表可得Y与t的数据表:
t
4
2
1
0.5
0.25
Y
16
12
5
2
1
作出Y与t的散点图如图所示.
由图可知Y与t呈近似的线性相关关系,
又=1.55,=7.2,iyi=94.25,=21.3125.
==≈4.134 4.
=-=7.2-4.134 4×1.55≈0.8,
∴=4.134 4t+0.8.
所以Y对x的回归方程是=+0.8.
1.求回归直线方程时,一般不直接代入公式计算,可以分别计算公式中的相关部分(统计量),从而减少运算出错的可能性.
2.利用回归直线方程求出的值,大多数时候是个预报值,与真实值之间可能有差异,因为真实值还会受到其他因素的影响.
3.两个变量之间的相关关系的样本相关系数,可用于线性相关的定性检验,衡量是否线性相关以及线性相关关系的强弱.

1.关于用最小二乘法求得的变量Y对x的回归直线方程,下列叙述正确的是(  )
A.表示Y与x之间的一种确定性关系
B.表示Y与x之间的相关关系
C.表示Y与x之间的最真实的关系
D.表示Y与x之间真实关系的一种效果最好的拟合
解析:线性回归方程能最大可能地反映Y与x之间的真实关系.
答案:D
2.(湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①②         B.②③
C.③④ D.①④
解析:①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.
答案:D
3.下表是x和Y之间的一组数据,则Y对x的回归直线必过(  )
x
1
2
3
4
Y
1
3
5
7
A.点(2,3)         B.点(1.5,4)
C.点(2.5,4) D.点(2.5,5)
解析:回归直线必过样本点的中心(,),即(2.5,4).
答案:C
4.一位母亲记录了儿子3岁~9岁的身高.由此建立的身高与年龄的回归模型为=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高一定是145.83 cm B.身高在145.83 cm以上
C.身高在145.83 cm以下 D.身高在145.83 cm左右
解析:当x=10时,y=7.19×10+73.93=145.83.
答案:D
5.为了考查两个变量Y与x的线性相关性,测得x,Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是 .
解析:相关系数临界值r0.05=0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的范围是(0.553,1].
答案:(0.553,1]
6.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:
尿汞含量x
2
4
6
8
10
消光系数Y
64
138
205
285
360
若Y与x具有线性相关关系,则回归直线方程是 .
解析:由已知表格中的数据,利用科学计算器进行计算得=6,=210.4,=220,
iyi=7 790,
所以==36.95,=-=-11.3.
所以回归直线方程为=-11.3+36.95x.
答案:=-11.3+36.95x
7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据:
x
3
4
5
6
Y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出Y关于x的回归直线方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)如下图.
(2)xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,==3.5,
x=32+42+52+62=86.
===0.7,
=-=3.5-0.7×4.5=0.35.
因此,所求的回归直线方程为=0.7x+0.35.
(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能减少了90-70.35=19.65(吨).
8.在7块并排的形状大小相同的试验田上进行施肥,施化肥量对水稻产量影响的试验,得到如下表所示的一组数据.
施化肥量x
15
20
25
30
35
40
45
水稻产量Y
330
345
365
405
445
450
455
试对x与Y进行线性回归分析,并预测施化肥量为50时,水稻的产量为多少?
解:∵=×(15+20+25+…+45)=×210=30,
=×(330+345+…+455)≈399.3,
=152+202+…+402+452=7 000,
=3302+3452+…+4552=1 132 725,
iyi=15×330+20×345+…+45×455=87 175,
∴r=
=
=0.973 3.
∴|r|=0.973 3>0.754,从而有95%的把握认为x与Y之间具有线性相关关系.
设Y对x的线回归直线方程为=+x
∴=
=
≈4.746,
∴=- ≈399.3-4.74 6×30=256.9.
∴回归直线方程为=256.9+4.746x.
当x=50时,=256.9+4.746×50=494.2,这就是说当施化肥量为50时,水稻的产量大致接近494.2.
课件35张PPT。第一章把握热点考向考点一理解教材新知考点二应用创新演练1.2
回归分析应用创新演练见课时跟踪训练(二)课时跟踪训练(二) 回归分析
1.关于用最小二乘法求得的变量Y对x的回归直线方程,下列叙述正确的是(  )
A.表示Y与x之间的一种确定性关系
B.表示Y与x之间的相关关系
C.表示Y与x之间的最真实的关系
D.表示Y与x之间真实关系的一种效果最好的拟合
2.(湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①②         B.②③
C.③④ D.①④
3.下表是x和Y之间的一组数据,则Y对x的回归直线必过(  )
x
1
2
3
4
Y
1
3
5
7
A.点(2,3)        B.点(1.5,4)
C.点(2.5,4) D.点(2.5,5)
4.一位母亲记录了儿子3岁~9岁的身高.由此建立的身高与年龄的回归模型为=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
5.为了考查两个变量Y与x的线性相关性,测得x,Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是________.
6.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:
尿汞含量x
2
4
6
8
10
消光系数Y
64
138
205
285
360
若Y与x具有线性相关关系,则回归直线方程是______________________________.
7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据:
x
3
4
5
6
Y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出Y关于x的回归直线方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
8.在7块并排的形状大小相同的试验田上进行施肥,施化肥量对水稻产量影响的试验,得到如下表所示的一组数据.
施化肥量x
15
20
25
30
35
40
45
水稻产量Y
330
345
365
405
445
450
455
试对x与Y进行线性回归分析,并预测施化肥量为50时,水稻的产量为多少?
答 案
1.选D 线性回归方程能最大可能地反映Y与x之间的真实关系.
2.选D ①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.
3.选C 回归直线必过样本点的中心(,),即(2.5,4).
4.选D 当x=10时,y=7.19×10+73.93=145.83.
5.解析:相关系数临界值r0.05=0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的范围是(0.553,1].
答案:(0.553,1]
6.解析:由已知表格中的数据,利用科学计算器进行计算得
=6,=210.4,=220,iyi=7 790,
所以==36.95,=-=-11.3.
所以回归直线方程为=-11.3+36.95x.
答案:=-11.3+36.95x
7.解:(1)如下图.
(2)xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,==3.5,
x=32+42+52+62=86.
===0.7,
=-=3.5-0.7×4.5=0.35.
因此,所求的回归直线方程为=0.7x+0.35.
(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能减少了90-70.35=19.65(吨).
8.解:∵=×(15+20+25+…+45)=×210=30,
=×(330+345+…+455)≈399.3,
=152+202+…+402+452=7 000,
=3302+3452+…+4552=1 132 725,
iyi=15×330+20×345+…+45×455=87 175,
∴r=
=
=0.973 3.
∴|r|=0.973 3>0.754,从而有95%的把握认为x与Y之间具有线性相关关系.
设Y对x的线回归直线方程为=+x
∴==≈4.746,
∴=- ≈399.3-4.74 6×30=256.9.
∴回归直线方程为=256.9+4.746x.
当x=50时,=256.9+4.746×50=494.2,这就是说当施化肥量为50时,水稻的产量大致接近494.2.