2016-2017学年高二数学北师大版选修1-2学案:1.1回归分析

文档属性

名称 2016-2017学年高二数学北师大版选修1-2学案:1.1回归分析
格式 zip
文件大小 871.8KB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2017-01-15 23:35:01

图片预览

文档简介

§1 回归分析
1.1 回归分析
1.2 相关系数
1.3 可线性化的回归分析
1.了解回归分析的思想和方法.(重点)
2.掌握相关系数的计算和判断线性相关的方法.(重点)
3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)
[基础·初探]
教材整理1 回归分析
阅读教材P3~P6“练习”以上部分,完成下列问题.
设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:
b===,a=-b.
某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为(  )
A.63.6万元    
B.65.5万元
C.67.7万元
D.72.0万元
【解析】 ==3.5,==42,∴a=-b=42-9.4×3.5=9.1,
∴回归方程为y=9.4x+9.1,
∴当x=6时,y=9.4×6+9.1=65.5,故选B.
【答案】 B
教材整理2 相关系数
阅读教材P6“练习”以下至P9“练习”以上部分,完成下列问题.
1.相关系数r的计算
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数
r==
=.
2.相关系数r与线性相关程度的关系
(1)r的取值范围为[-1,1];
(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高;
(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.
3.相关性的分类
(1)当r>0时,两个变量正相关;
(2)当r<0时,两个变量负相关;
(3)当r=0时,两个变量线性不相关.
判断(正确的打“√”,错误的打“×”)
(1)两个变量的相关系数r>0,则两个变量正相关.(  )
(2)两个变量的相关系数越大,它们的相关程度越强.(  )
(3)若两个变量负相关,那么其回归直线的斜率为负.(  )
【答案】 (1)√ (2)× (3)√
教材整理3 可线性化的回归分析
阅读教材P9~P13“练习”以上部分,完成下列问题.
1.非线性回归分析
对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.
2.非线性回归方程
曲线方程
曲线图形
变换公式
变换后的线性函数
y=axb
(a=1,b>0) (a=1,b<0)
c=ln
av=ln
xu=ln
y
u=c+bv
y=aebx
(a>0,b>0) (a>0,b<0)
c=ln
au=ln
y
u=c+bx
曲线方程
曲线图形
变换公式
变换后的线性函数
y=ae
(a>0,b>0) (a>0,b<0)
c=ln
av=u=ln
y
u=c+bv
y=a+bln
x
(b>0)  (b<0)
v=ln
xu=y
u=a+bv
下列数据x,y符合哪一种函数模型(  )
x
1
2
3
4
5
6
7
8
9
10
y
2
2.69
3
3.38
3.6
3.8
4
4.08
4.2
4.3
A.y=2+x    
B.y=2ex
C.y=2e
D.y=2+ln
x
【解析】 分别将x的值代入解析式判断知满足y=2+ln
x.
【答案】 D
[质疑·手记]
预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:
疑问1:___________________________________________
解惑:_____________________________________________________
疑问2:_____________________________________________________
解惑:_____________________________________________________
疑问3:_____________________________________________________
解惑:___________________________________________
[小组合作型]
,变量间的相关关系及判定
 (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1 1 1①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图1 1 1②.由这两个散点图可以判断(  )
图1 1 1
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法:
①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有(  )
A.①②       
B.②③
C.①③
D.①②③
(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是(  )
A.①③
B.②④
C.②⑤
D.④⑤
【精彩点拨】 可借助于线性相关概念及性质作出判断.
【自主解答】 (1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.
(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.
(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.
【答案】 (1)C (2)C (3)C
1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.
2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.
[再练一题]
1.下列两变量中具有相关关系的是(  )
A.正方体的体积与边长
B.人的身高与体重
C.匀速行驶车辆的行驶距离与时间
D.球的半径与体积
【解析】 选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的体积是π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.
【答案】 B
,求线性回归方程
 (2016·九江高二检测)某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃)
17
13
8
2
月销售量y(件)
24
33
40
55
(1)算出线性回归方程y=bx+a(a,b精确到0.1);
(2)气象部门预测下个月的平均气温约为6
℃,据此估计该商场下个月毛衣的销售量.
【精彩点拨】 (1)可利用公式求解;
(2)把月平均气温代入回归方程求解.
【自主解答】 
(1)由散点图易判断y与x具有线性相关关系.
=(17+13+8+2)÷4=10,
=(24+33+40+55)÷4=38,
xiyi=17×24+13×33+8×40+2×55=1
267,
x=526,
b=

≈-2.01,
a=-b≈38-(-2.01)×10=58.1,
所以线性回归方程为y=-2.01x+58.1.
(2)气象部门预测下个月的平均气温约为6
℃,据此估计,该商场下个月毛衣的销售量为y=-2.01x+58.1=-2.01×6+58.1≈46(件).
1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.
2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.
3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.
4.回归直线必过样本点的中心点.
[再练一题]
2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图(要求:点要描粗);
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
【解】 (1)如图:
(2)xiyi=6×2+8×3+10×5+12×6=158,
==9,
==4,
x=62+82+102+122=344,
b===0.7,
a=-b=4-0.7×9=-2.3,
故线性回归方程为y=0.7x-2.3.
(3)由(2)中线性回归方程知当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.
[探究共研型]
,可线性化的回归分析
探究1 如何解答非线性回归问题?
【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
探究2 已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?
x
1
2
3
y
3
5.99
12.01
①y=3×2x-1;
②y=log2x;
③y=4x;
④y=x2.
【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.
 某地区不同身高的未成年男性的体重平均值如下表:
身高x(cm)
60
70
80
90
100
110
体重y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高x(cm)
120
130
140
150
160
170
体重y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立y与x之间的回归方程;
(2)如果一名在校男生身高为168
cm,预测他的体重约为多少?
【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
【自主解答】 (1)根据表中的数据画出散点图,如下:
由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=ln
y,列表如下:
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图,如下:
由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y=e0.693+0.020x.
(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168
cm,预测他的体重约为57.57
kg.
两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln
y,则变换后样本点应该分布在直线z=bx+a(a=ln
c1,b=c2)的周围.
[再练一题]
3.在一次抽样调查中测得样本的5个样本点,数据如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
【解】 作出变量y与x之间的散点图如图所示.
由图可知变量y与x近似地呈反比例函数关系.
设y=,令t=,则y=kt.由y与x的数据表可得y与t的数据表:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图所示.
由图可知y与t呈近似的线性相关关系.
又=1.55,=7.2,iyi=94.25,=21.312
5,
b=
=≈4.134
4,
a=-b=7.2-4.134
4×1.55≈0.8,
∴y=4.134
4t+0.8.
所以y与x的回归方程是y=+0.8.
[构建·体系]
1.下列结论正确的是(  )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①②       
B.①②③
C.①②④
D.①②③④
【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.
【答案】 C
2.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点(  )
x
1
2
3
4
y
1
3
5
7
A.(2,3)     
B.(1.5,4)
C.(2.5,4)
D.(2.5,5)
【解析】 线性回归方程必过样本点的中心(,),
即(2.5,4),故选C.
【答案】 C
3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.
【解析】 由题意知=2,=3,b=6.5,所以a=-b=3-6.5×2=-10,即回归直线的方程为y=-10+6.5x.
【答案】 y=-10+6.5x
4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):
固定资产价值
3
3
5
6
6
7
8
9
9
10
工业增加值
15
17
25
28
30
36
37
42
40
45
根据上表资料计算的相关系数为________.
【解析】 ==6.6.
==31.5.
所以r=eq
\f(\o(\s\up6())\o()
xi-\x\to(x) yi-\x\to(y) ,\r(\o()
xi-\x\to(x) 2\o()
yi-\x\to(y) 2))≈0.991
8.
【答案】 0.991
8
5.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程y=bt+a;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程y=bt+a中,
b=,a=-b
.
【解】 (1)列表计算如下:
i
ti
yi
t
tiyi
12345
12345
567810
1491625
512213250

15
36
55
120
这里n=5,=i==3,=i==7.2.
又ltt=-n2=55-5×32=10,
lty=iyi-n=120-5×3×7.2=12,
从而b===1.2,
a=-b=7.2-1.2×3=3.6,
故所求回归方程为y=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
我还有这些不足:
(1)______________________________________________________
(2)
______________________________________________________
我的课下提升方案:
(1)
______________________________________________________
(2)
____________________________________________
学业分层测评(一) 
(建议用时:45分钟)
[学业达标]
一、选择题
1.为了考查两个变量x和y之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都为t,那么下列说法中正确的是(  )
A.直线l1和l2都过点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.直线l1和l2必平行
D.直线l1和l2必重合
【解析】 线性回归方程y=bx+a恒过点(,),故直线l1和l2都过点(s,t).
【答案】 A
2.已知人的年龄x与人体脂肪含量的百分数y的回归方程为y=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量(  )
A.一定是20.3%
B.在20.3%附近的可能性比较大
C.无任何参考数据
D.以上解释都无道理
【解析】 将x=36代入回归方程得y=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.
【答案】 B
3.关于回归分析,下列说法错误的是(  )
A.回归分析是研究两个具有相关关系的变量的方法
B.线性相关系数可以是正的或负的
C.回归模型中一定存在随机误差
D.散点图反映变量间的确定关系
【解析】 用散点图反映两个变量间的关系时,存在误差,故D错误.
【答案】 D
4.某学校开展研究性学习活动,某同学获得一组试验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是(  )
A.y=2x-2   
B.y=x
C.y=log2x
D.y=(x2-1)
【解析】 代入检验,当x取相应的值时,所得y值与已知数据差的平方和最小的便是拟合程度最高的.
【答案】 D
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都有直线y=x+1上,则这组样本数据的样本相关系数为(  )
A.-1
B.0
C.
D.1
【解析】 所有点均在直线上,则样本相关系数最大即为1,故选D.
【答案】 D
二、填空题
6.回归分析是处理变量之间________关系的一种数量统计方法.
【解析】 回归分析是处理变量之间相关关系的一种数量统计方法.
【答案】 相关
7.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
【解析】 ∵r<0时b<0,
∴大多数点落在第二、四象限.
【答案】 二、四
8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:
  学生学科  
1
2
3
4
5
总成绩(x)
482
383
421
364
362
外语成绩(y)
78
65
71
64
61
则外语成绩对总成绩的回归直线方程是________.
【解析】 ∵==402.4,
==79.8,
∴b=
≈0.132,
∴a=79.8-0.132×402.4=14.5,
∴方程为y=0.132x+14.5.
【答案】 y=0.132x+14.5
三、解答题
9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对x呈线性相关关系.试求:
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
【解】 (1)==4,
==5,
=90,iyi=112.3,
b===1.23.
于是a=-b=5-1.23×4=0.08.
所以线性回归方程为y=1.23x+0.08.
(2)当x=10时,y=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.
气温/℃
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.
【解】 画出散点图如图所示.
=(26+18+13+10+4-1)≈11.7,
=(20+24+34+38+50+64)≈38.3,
eq
\o(∑,\s\up6( 6,))xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1
910,
eq
\o(∑,\s\up6( 6,))x=262+182+132+102+42+(-1)2=1
286,
eq
\o(∑,\s\up6( 6,))y=202+242+342+382+502+642=10
172,eq
\o(∑,\s\up6( n,))
由r=eq
\f(\o(eq
\o(∑,\s\up6( n,)))\o(
,\s\do4())xiyi-n\a\vs4\al(\x\to(x))
\a\vs4\al(\x\to(y)),\r(\o(eq
\o(∑,\s\up6( n,)))\o(
,\s\do4())x\o\al(2,i)-n\x\to(x)2)\r(\o(eq
\o(∑,\s\up6( n,)))\o(
,\s\do4())y\o\al(2,i)-n\x\to(y)2)),
可得r
≈0.97.
由于r的值接近于1,所以x与y具有很强的线性相关关系.
[能力提升]
1.(2016·安徽皖南八校联考)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份)
1
2
3
4
5
y(万盒)
5
5
6
6
8
若x,y线性相关,线性回归方程为y=0.7x+a,则估计该制药厂6月份生产甲胶囊产量为(  )
A.8.1万盒
B.8.2万盒
C.8.9万盒
D.8.6万盒
【解析】 由题意知=3,=6,则a=-0.7=3.9,
∴x=6时,y=8.1.
【答案】 A
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为y=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )
A.b>b′,a>a′
B.b>b′,aC.ba′
D.b【解析】 由(1,0),(2,2)求b′,a′.
b′==2,
a′=0-2×1=-2.
求b,a时,
iyi=0+4+3+12+15+24=58,
=3.5,=,
=1+4+9+16+25+36=91,
∴b==,
a=-×3.5=-=-,
∴ba′.
【答案】 C
3.(2016·江西吉安高二检测)已知x,y的取值如下表所示,由散点图分析可知y与x线性相关,且线性回归方程为y=0.95x+2.6,那么表格中的数据m的值为________.
x
0
1
3
4
y
2.2
4.3
4.8
m
【解析】 ==2,==,把(,)代入回归方程得=0.95×2+2.6,解得m=6.7.
【答案】 6.7
4.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:
x
9.5
11.5
13.5
15.5
17.5
y
6
4.6
4
3.2
2.8
x
19.5
21.5
23.5
25.5
27.5
y
2.5
2.4
2.3
2.2
2.1
散点图显示出x与y的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.
【解】 设u=,则y≈a+bu,得下表数据:
u
0.105
3
0.087
0
0.074
1
0.064
5
0.057
1
y
6
4.6
4
3.2
2.8
u
0.051
3
0.046
5
0.042
6
0.039
2
0.036
4
y
2.5
2.4
2.3
2.2
2.1
进而可得n=10,≈0.060
4,=3.21,
u-102≈0.004
557
3,
iyi-10
≈0.256
35,
b≈≈56.25,
a=-b·≈-0.187
5,
所求的回归方程为y=-0.187
5+.
当x=30时,y=1.687
5,即商品零售额为30万元时,商品流通率约为1.687
5%.
同课章节目录