2019年数学人教B版选修2-3新设计同步(讲义+课件+课时跟踪检测): 第三章 3.2 回归分析

文档属性

名称 2019年数学人教B版选修2-3新设计同步(讲义+课件+课时跟踪检测): 第三章 3.2 回归分析
格式 zip
文件大小 1.4MB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-04-28 07:56:19

文档简介

_3.2/回归分析

1.线性模型
在回归直线方程=x+中,
==,=-.
其中=i,=i,(,)称为样本点的中心.
2.线性相关性检验
(1)对于变量x与Y随机抽取到的n对数据(x1,y1),(x2,y2),…,(xn,yn),检验统计量是样本相关系数
r=
=
r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(2)检验步骤如下:
①作统计假设:x与Y不具有线性相关关系.
②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05.
③根据样本相关系数计算公式算出r的值.
④作出统计推断.如果|r|>r0.05,表明有95%把握认为x与Y之间具有线性相关关系.
如果|r|≤r0.05,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.
/
1.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用样本相关系数来判断.
2.|r|越接近1,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据的效果就越好.
3.样本相关系数r只能描述两个变量之间的变化方向及密切程度,不能揭示二者之间的本质联系.
4.样本相关系数r可以定量地反映出变量间的相关程度,明确的给出有无必要建立两变量间的回归方程.
/

/
求回归直线方程
[例1] 某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:
x/百万元
2
4
5
6
8
Y/百万元
30
40
60
50
70
(1)画出散点图;
(2)求回归直线方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
[思路点拨] (1)按表中的数据在平面直角坐标系中描点即得散点图;
(2)由公式求出,,写出回归直线方程;
(3)利用回归方程分析.
[精解详析] (1)散点图如图所示:
/
(2)列出下表,并用科学计算器进行有关计算:
i
1
2
3
4
5
合计
xi
2
4
5
6
8
25
yi
30
40
60
50
70
250
xiyi
60
160
300
300
560
1 380
x
4
16
25
36
64
145
所以,==5,==50,=145,
iyi=1 380.
于是可得===6.5,
=- =50-6.5×5=17.5.
所以所求的线性回归方程为=6.5x+17.5.
(3)根据上面求得的线性回归方程,当广告费用支出为10百万元时,
=6.5×10+17.5=82.5(百万元),
即广告费用支出为10百万元时,销售额大约为82.5百万元.
[一点通] 
求线性回归方程的步骤:
(1)列表表示xi,yi,xiyi;
(2)计算,,,iyi;
(3)代入公式计算,的值;
(4)写出线性回归方程.
/
1.已知线性回归方程为=2-2.5x,则x=25时,y的估计值为________.
解析:当x=25时,=2-2.5×25=-60.5,即y的估计值为-60.5.
答案:-60.5
2.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得观测结果如下表:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
由此得到回归直线的斜率是0.880 9,则线性回归方程为________.
解析:因为线性回归方程=0.880 9x+过样本点的中心(30,93.6),所以=67.173, =0.880 9x+67.173.
答案:=0.880 9x+67.173
/
相关性检验
[例2] 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
Y(min)
100
200
210
185
155
135
170
205
235
125
作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
[思路点拨] 判断两变量之间是否具有相关关系,要计算出相关系数r,比较r与临界值的大小.
[精解详析] 由已知数据列成下表.
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
=26 5448,=31 2350,iyi=28 7640
于是r=≈0.990 6.
又查表知相应于显著性水平0.05和n-2的相关系数临界值r0.05=0.632.
由r>r0.05知,Y与x具有线性相关关系.
[一点通] 
已知x与Y呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验.如果两个变量不具备相关关系,或者相关关系不显著,即使求出回归直线方程也是毫无意义的,用其估计和预测也是不可信的.如果通过散点图能发现线性相关关系,也可以避免求相关系数的麻烦.
/
3.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应关系:
x
2
4
6
8
Y
30
40
50
70
x与Y之间是否具有线性相关关系?若有,求其回归直线方程.
解:画出(x,y)的散点图如图所示,由图可知x,Y有线性关系.
/
=5,=47.5,=120,=9 900,iyi=1 080,
r=
=≈0.982 7.
|r|=0.982 7>r0.05=0.950,从而有95%的把握认为x与Y之间具有线性相关关系,
由公式得回归系数
===6.5,
=- =47.5-6.5×5=15.
故Y对x的回归直线方程为=6.5x+15.
/
非线性回归问题
[例3] (12分)下表为收集到的一组数据:
x
21
23
25
27
29
32
35
Y
7
11
21
24
66
115
325
试建立Y与x之间的回归方程.
[思路点拨] 画出散点图或进行相关性检验,确定两变量x,Y是否线性相关.由散点图得x,Y之间的回归模型,求回归方程.
[精解详析] 作出散点图,如图.
/
从散点图中可以看出x与Y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.?(5分)
对两边取对数,把指数关系变为线性关系.令Z=ln Y,则变换后的样本点分布在直线z=bx+a(a=ln c1,b=c2)的周围,这样就可以利用线性回归模型来建立非线性回归方程了,数据可以转化为:
x
21
23
25
27
29
32
35
Z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
求得线性回归方程为=0.272x-3.849, ?(10分)
∴=e0.272x-3.849. ?(12分)
[一点通] 
非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.
/
4.某地区不同身高的男性的体重平均值如下表:
身高x/cm
60
70
80
90
100
110
体重Y/kg
6.13
7.90
9.99
12.15
15.02
17.50
身高x/cm
120
130
140
150
160
170
体重Y/kg
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立Y与x之间的回归方程;
(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm体重为82 kg的在校男生体重是否正常?
解:(1)根据上表中的数据画出散点图(如图所示).
/
由图可看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令Z=ln Y,得下表:
x
60
70
80
90
100
110
Z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
Z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图如图所示.
/
由表中数据可得Z与x之间的回归直线方程为
=0.693+0.020x,则有=e0.693+0.020x.
(2)当x=175时,预测平均体重为=e0.693+0.020×175≈66.22,
由于66.22×1.2=79.464<82,所以这个男生偏胖.
/
1.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r,前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.
2.应用回归方程时应注意:
(1)回归方程只适用于我们所研究的样本的总体;
(2)我们所建立的回归方程一般都有时间性;
(3)样本取值的范围会影响回归方程的适用范围,一般不能超过这个适用范围,否则,将没有实用价值;
(4)不能期望回归方程得到的预报值就是预报变量的准确值,事实上,它是预报变量的可能取值的平均值.
3.建立回归模型的基本步骤如下:
(1)确定研究对象.
(2)画出散点图,观察它们之间的关系.
(3)由经验确定好回归方程的类型.
(4)按照一定的规则估计回归方程中的参数.
/

1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是(  )
/
A.①②           B.①③
C.②③ D.③④
解析:①③中的点分布在一条直线附近,适合线性回归模型.
答案:B
2.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线方程的回归系数为,回归截距是,那么必有(  )
A.与r的符号相同     B.与r的符号相同
C.与r的符号相反 D.与r的符号相同
解析:由公式可知与r的符号相同.
答案:A
3.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:样本点的中心是(3.5,42),
则=-=42-9.4×3.5=9.1,
所以回归直线方程是=9.4x+9.1,
把x=6代入得=65.5(万元).
答案:B
4.(江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高Y(cm)
175
175
176
177
177
则Y对x的线性回归方程为(  )
A.=x-1 B.=x+1
C.=88+x D.=176
解析:设Y对x的线性回归方程为=x+,
因为==,=- =176-×176=88,所以Y对x的回归直线方程为=x+88.
答案:C
5.若回归直线方程中的回归系数=0,则相关系数r=________.
解析:相关系数r=与=的分子相同,故r=0.
答案:0
6.已知x,Y的取值如下表:
x
2
3
4
5
Y
2.2
3.8
5.5
6.5
从散点图分析,Y与x线性相关,且回归直线方程为=1.42x+a,则a的取值为________.
解析:由已知得 ==3.5,=4.5.
又∵回归直线过(,)
∴4.5=3.5×1.42+a
∴a=-0.47
答案:-0.47
7.某电脑公司有6名产品推销员,其中5名的工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额Y/万元
2
3
3
4
5
(1)求年推销金额Y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解:(1)设所求的线性回归方程为=x+,
则===0.5,=- =0.4.
所以年推销金额Y关于工作年限x的线性回归方程为=0.5x+0.4.
(2)当x=11时,
=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.
8.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对应数据.
x
3
4
5
6
Y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小平方法求出Y关于x的线性回归方程=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)由题设所给数据,可得散点图如下图.
/
(2)由对照数据,计算得:
=86,
==4.5,
==3.5,
已知iyi=66.5,
所以,由最小平方法确定的回归方程的系数为:
===0.7,
=-b =3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
课件30张PPT。第三章把握热点考向理解教材新知应用创新演练3.2
回归分析考点一考点二考点三应用创新演练见课时跟踪训练(十九)课时跟踪训练(十九) 回 归 分 析
1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是(  )
A.①②           B.①③
C.②③ D.③④
2.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线方程的回归系数为,回归截距是,那么必有(  )
A.与r的符号相同     B.与r的符号相同
C.与r的符号相反 D.与r的符号相同
3.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
4.(江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高Y(cm)
175
175
176
177
177
则Y对x的线性回归方程为(  )
A.=x-1 B.=x+1
C.=88+x D.=176
5.若回归直线方程中的回归系数=0,则相关系数r=________.
6.已知x,Y的取值如下表:
x
2
3
4
5
Y
2.2
3.8
5.5
6.5
从散点图分析,Y与x线性相关,且回归直线方程为=1.42x+a,则a的取值为________.
7.某电脑公司有6名产品推销员,其中5名的工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额Y/万元
2
3
3
4
5
(1)求年推销金额Y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
8.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对应数据.
x
3
4
5
6
Y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小平方法求出Y关于x的线性回归方程=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
答 案
1.选B ①③中的点分布在一条直线附近,适合线性回归模型.
2.选A 由公式可知与r的符号相同.
3.选B 样本点的中心是(3.5,42),
则=-=42-9.4×3.5=9.1,
所以回归直线方程是=9.4x+9.1,
把x=6代入得=65.5(万元).
4.选C 设Y对x的线性回归方程为=x+,
因为==,=- =176-×176=88,所以Y对x的回归直线方程为=x+88.
5.解析:相关系数r=与=
的分子相同,故r=0.
答案:0
6.解析:由已知得 ==3.5,=4.5.
又∵回归直线过(,)
∴4.5=3.5×1.42+a
∴a=-0.47
答案:-0.47
7.解:(1)设所求的线性回归方程为=x+,
则===0.5,=- =0.4.
所以年推销金额Y关于工作年限x的线性回归方程为=0.5x+0.4.
(2)当x=11时,
=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.
8.解:(1)由题设所给数据,可得散点图如右图.
(2)由对照数据,计算得:
=86,
==4.5,
==3.5,
已知iyi=66.5,
所以,由最小平方法确定的回归方程的系数为:
===0.7,
=-b =3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).