温馨提示:
此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。
课时素养评价
十七 一元线性回归模型
(25分钟·50分)
一、选择题(每小题5分,共20分.多选题全部选对的得5分,选对但不全的得3分,有选错的得0分)
1.(多选题)下列说法正确的是( )
A.两个变量之间若没有确定的函数关系,则这两个变量不相关
B.正相关是两个变量相关关系中的一种
C.“庄稼一枝花,全靠粪当家”说明农作物产量与施肥量之间具有相关关系
D.根据散点图可判断两个变量之间有无相关关系
【解析】选BCD.若两个变量之间有关系,但不是确定的函数关系,则它们具有相关关系,所以A是错误的.BCD是正确的.
【加练·固】
(多选题)下列有关回归直线方程=x+叙述正确的是
( )
A.反映与x之间的函数关系
B.反映y与x之间的函数关系
C.表示与x之间不确定关系
D.表示最接近y与x之间真实关系的一条直线
【解析】选AD.=x+表示与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系.
2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是
( )
A.=0.4x+2.3
B.=2x-2.4
C.=-2x+9.5
D.=-0.3x+4.4
【解析】选A.因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B.
3.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),
(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),
(13,1).r1表示变量Y与X之间的线性相关系数.r2表示变量V与U之间的线性相关系数,则( )
A.r2
B.0C.r2<0D.r2=r1
【解析】选C.对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<04.两个相关变量满足如表关系:
x
10
15
20
25
30
y
1
003
1
005
1
010
1
011
1
014
两变量的回归直线方程为( )
A.=0.56x+997.4
B.=0.63x-231.2
C.=50.2x+501.4
D.=60.4x+400.7
【解析】选A.方法一:
利用公式==0.56.=-=997.4.
所以回归直线方程为=0.56x+997.4.
方法二:=20,=1
008.6,将,代入各直线方程检验可知选A.
【加练·固】
为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如表:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为( )
A.=x-1
B.=x+1
C.=88+x
D.=176
【解析】选C.计算得,
==176,
==176,根据回归直线经过样本中心(,)检验知,C符合.
二、填空题(每小题5分,共10分)
5.如图所示的五组数据(x,y)中,去掉________后,剩下的四组数据相关性增强.?
【解析】去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强.
答案:(4,10)
【加练·固】
如图所示是具有相关关系的两个变量的一组数据的散点图,去掉________点后,两个变量的相关关系更明显.?
【解析】A,B,C,D,E五点分布在一条直线附近且贴近该直线,而F点离得远,故去掉点F.
答案:F
6.若回归直线方程中的回归系数=0,则相关系数r=________.?
【解析】相关系数r=
与=的分子相同,故r=0.
答案:0
三、解答题(每小题10分,共20分)
7.某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:
x
3
4
5
6
7
8
9
y
66
69
73
81
89
90
91
已知=280,xiyi=3
487.
(1)求,;
(2)已知纯利y与每天销售件数x线性相关,试求出其回归直线方程.
【解析】(1)==6,
==.
(2)因为y与x有线性相关关系,
所以===4.75,
=-6×4.75=≈51.36.
故回归直线方程为=4.75
x+51.36.
8.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有如下数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单位:万元)
12
28
42
56
根据以上数据算得:yi=138,xiyi=418.
(1)求出y对x的回归直线方程=x+,并判断变量y与x之间是正相关还是负相关;
(2)若销售收入最少为144万元,则广告支出费用至少需要投入多少万元?
【解析】(1)由表中数据得:==2.5,
==34.5,
所以===14.6,
=-=34.5-14.6×2.5=-2,
所以回归直线方程为=14.6x-2,且变量y与x之间是正相关.
(2)依题意有:=14.6x-2≥144,解得x≥10,
所以广告支出费用至少需要投入10万元.
(15分钟·30分)
1.(5分)已知x与y之间的几组数据如表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据表中数据所得线性回归直线方程为=x+.若某同学根据表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′
B.>b′,C.a′
D.【解析】选C.由(1,0),(2,2)得b′==2,
a′=0-2×1=-2.
求,时,xiyi=0+4+3+12+15+24=58,
=3.5,=,=1+4+9+16+25+36=91,
所以==,=-×3.5=-=-,所以a′.
2.(5分)下列数据符合的函数模型为
( )
x
1
2
3
4
5
6
7
8
9
10
y
2
2.69
3
3.38
3.6
3.8
4
4.08
4.2
4.3
A.y=2+x
B.y=2ex
C.y=2
D.y=2+ln
x
【解析】选D.分别将x值代入解析式判断知满足y=2+ln
x.
3.(5分)对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具备线性相关关系,回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为________年.?
【解析】当年利润小于或等于零时应该报废该机器,当y=0时,令10.47-1.3x=0,解得x≈8,故估计该台机器最为划算的使用年限为8年.
答案:8
4.(5分)以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln
y,其变换后得到线性回归方程z=0.3x+4,则c=________.?
【解析】由题意,得ln(cekx)=0.3x+4,
所以ln
c+kx=0.3x+4,
所以ln
c=4,所以c=e4.
答案:e4
5.(10分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
Y(min)
100
200
210
185
155
135
170
205
235
125
判断含碳量与冶炼时间的相关关系的强弱.
【解析】由已知数据列出表格.
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10
400
36
000
39
900
32
745
22
785
18
090
25
500
39
155
47
940
15
125
=159.8,=172,=265
448,=312
350,xiyi=287
640
于是r=≈0.990
6.故Y与x具有很强的线性相关关系.
1.同一资料,如果将x作为自变量,y作为因变量,得回归系数b;将y作为自变量,x作为因变量,得回归系数b′,则相关系数r与b,b′的关系是________.?
【解析】当x作自变量时得b=.
当y作自变量时得b′=
而r=,
从而bb′=r2,所以=.
答案:=
2.在一次抽样调查中测得样本的5个样本点,数值如表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
【解析】由数值表可作散点图如图:
根据散点图可知y与x近似地呈反比例函数关系,
设y=,令t=,
则y=kt,原数据变为:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
由置换后的数值表作散点图如图:
由散点图可以看出y与t近似地呈线性相关关系,列表如下:
i
ti
yi
tiyi
1
4
16
64
16
256
2
2
12
24
4
144
3
1
5
5
1
25
4
0.5
2
1
0.25
4
5
0.25
1
0.25
0.062
5
1
∑
7.75
36
94.25
21.312
5
430
所以=1.55,=7.2.
所以=≈4.1.
=-≈0.8.所以=4.1t+0.8.
所以y与x的回归方程是=+0.8.
关闭Word文档返回原板块
PAGE(共66张PPT)
4.3 统
计
模
型
4.3.1 一元线性回归模型
1.相关关系
(1)两个变量的关系
必备知识·素养奠基
分类
函数关系
相关关系
特征
两变量关系具有_______
两变量关系带有_______
确定性
随机性
(2)散点图:将样本中n对数据(xi,yi)(i=1,2,…,n)描在_______________
中得到的图形.
(3)线性相关:如果变量x与变量y之间的关系可以近似地用_________
来刻画,则称x与y线性相关.
(4)正相关与负相关
正相关
负相关
一个变量增大,另一个变量大体上
也_____
一个变量增大,另一个变量大体
上_____
平面直角坐标系
一次函数
增大
减少
【思考】
正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?
提示:不对,正相关与负相关是针对线性相关关系而言的.
2.回归直线方程及其性质
(1)最小二乘法
一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n,任意给定一个
一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值
i=bxi+a,如果一次函数
=
x+
能使残差平方和即
___________________________________________取得最小值,
则
=
x+
称为y关于x的回归直线方程(对应的直线称为回归直线).
因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
(2)回归直线方程的系数计算公式
(3)回归直线方程的性质
①回归直线方程一定过点______.
②一次函数
=
x+
的单调性由
的符号决定,函数递增的充要条件
是______.
③回归系数
的实际意义:当x增大一个单位时,
增大
个单位.
【思考】
1.求回归直线方程的目的是什么?
提示:回归直线方程确定之后,就可用于预测.
2.正相关、负相关与
的符号有何关系?
提示:y与x正相关的充要条件是
>0,y与x负相关的充要条件是
<0.
3.相关系数
(1)相关系数:统计学里一般用r=
来衡量y与x的_______________,这里的r称为线性相关系数(简称为相关系数).
线性相关性强弱
(2)相关系数的性质
性质1
|r|≤1,且y与x正相关的充要条件是____,y与x负相关的充要
条件是____.
性质2
|r|越小,两个变量之间的线性相关性越___,
|r|越大,两个
变量之间的线性相关性越___.
性质3
|r|=1的充要条件是成对数据构成的点都在_________上.
r>0
r<0
弱
强
回归直线
【思考】
|r|的大小有何实际意义?
提示:
|r|越小,两个变量之间的线性相关性越弱,得到的回归直线方程越没有价值,即方程越不能反映真实情况;|r|越大,两个变量之间的线性相关性越强,得出的回归直线方程越有价值.
【基础小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)回归直线方程一定过样本中的某一个点.
( )
(2)两个变量的相关系数越大,它们的相关程度越强.
( )
(3)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.
提示:(1)×.回归直线方程一定过点
,可能过样本中的某个或某些点,也可能不过样本中的任意一个点.
(2)×.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(3)×.选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程不一定是同一个方程.
2.根据一组数据判断是否线性相关时,应选哪个图
( )
A.茎叶图
B.频率分布直方图
C.散点图
D.频率分布折线图
【解析】选C.判断两个变量是否有线性相关关系时,应先画出散点图.若这些点大体分布在一条直线附近,则数据具有线性相关关系.
3.若施肥量x(kg)与水稻产量y(kg)的线性回归方程为
=5x+250,当施肥量为80
kg时,预计水稻产量约为________kg.?
【解析】把x=80代入回归方程可得其预测值
=5×80+250=650(kg).
答案:650
关键能力·素养形成
类型一 相关关系与线性相关关系的判断
角度1 相关关系的判断
【典例】(多选题)下列关系中,属于相关关系的是
( )
A.正方形的边长与面积之间的关系
B.生活习惯与健康状况的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
【思维·引】紧扣相关关系的概念加以判断.
【解析】选BD.在A中,正方形的边长与面积之间的关系是函数关系;在B中,生活习惯与健康状况不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.
角度2 线性相关关系的判断
【典例】某市天然气消耗量y(单位:百万立方米)与使用天然气户数x(单位:万户)的历史记录的资料如表所示:
第i年
1
2
3
4
5
户数x/万户
1
1.2
1.6
1.8
2
天然气消耗量
y/百万立方米
6
7
9.8
12
12.1
第i年
6
7
8
9
10
户数x/万户
2.5
3.2
4
4.2
4.5
天然气消耗量
y/百万立方米
14.5
20
24
25.4
27.5
判断变量x,y之间是否具有线性相关关系.
【思维·引】根据散点图判断.
【解析】画出散点图如图所示,
由散点图可知,各点分布在一条直线附近,故天然气消耗量y(百万立方米)与使用天然气户数x(万户)具有线性相关关系.
【类题·通】
1.函数关系与相关关系
函数关系是一种确定的关系,而相关关系是一种不确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.两个变量是否相关的两种判断方法
(1)实际经验法:借助积累的经验进行分析判断;
(2)散点图法:绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
【习练·破】
1.对变量x,y由观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v由观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【解析】选C.由图像知,变量x与y呈负相关关系;u与v呈正相关关系.
2.下列两个变量间的关系不是函数关系的是
( )
A.圆的半径与周长
B.角的度数与它的正切值
C.粮食亩产量为常数时,土地面积与粮食总产量
D.日照时间与水稻的单位产量
【解析】选D.函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项C=2πr,B项y=tan
α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系;D项是相关关系.
类型二 回归直线方程及其应用
角度1 求回归直线方程并预测
【典例】某种产品的广告费用支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x/百万元
2
4
5
6
8
y/百万元
30
40
60
50
70
(1)画出散点图;
(2)求回归直线方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
【思维·引】(1)按表中的数据在平面直角坐标系中描点即得散点图;
(2)由公式求出
,
,写出回归直线方程;
(3)利用回归方程分析.
【解析】(1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
所以
=5,
=50,
=145,
xiyi=1
380.
于是可得
=6.5,
=
-
=50-6.5×5=17.5.
所以所求的线性回归方程为
=6.5x+17.5.
(3)根据(2)求得的线性回归方程,当广告费用支出为10百万元时,
=6.5×10+17.5=82.5(百万元),
即广告费用支出为10百万元时,销售额大约为82.5百万元.
【素养·探】
★本例考查求回归直线方程,并利用回归方程进行预测,同时考查了数据分析与数学运算的核心素养.
本例条件不变,若已知线性回归方程为
=
x+5,预测当广告费用支出为1百万元时,销售额大约为多少百万元?
【解析】由题意得,
=5,
=50,代入回归直线方程得50=5
+5,
所以
=9,所以回归直线方程为
=9x+5,当x=1时,
=14.
即广告费用支出
为1百万元时,销售额大约为14百万元.
角度2 相关性强弱的判断
【典例】某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:
x/百万元
2
4
6
8
y/百万元
30
40
50
70
x与y之间是否具有线性相关关系?若有,判断相关性的强弱,并求其回归直线方程.
【思维·引】利用散点图判断是否线性相关,利用相关系数判断相关性的强弱.
【解析】散点图如图所示,由图可知x,y有线性相关关系.
=5,
=47.5,
=120,
=9
900,
xiyi=1
080,r=
=
≈0.982
7.
故x与y之间具有很强的线性相关关系.
由公式得回归系数
=
=6.5,
=
-
=47.5-6.5×5=15.
故y对x的回归直线方程为
=6.5x+15.
【类题·通】
线性回归分析的步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出);
(2)作出散点图,确定x,y具有线性相关关系;
(3)计算
,
,
,
xiyi;
(4)代入公式计算相关系数,确定相关性的强弱;
(5)代入公式计算
,
,写出回归直线方程
=
x+
;
(6)利用回归直线方程进行预测.
【习练·破】
一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高x与右手长度y进行测量得到如表数据(单位:cm):
身高x
168
170
171
172
174
176
178
178
180
181
右手
长度y
19.0
20.0
21.0
21.5
21.0
22.0
24.0
23.0
22.5
23.0
(1)判断两者有无线性相关关系;
(2)如果具有线性相关关系,判断相关性的强弱并求回归直线方程;
(3)如果一名同学身高为185
cm,估计他的右手长度.
【解析】(1)散点图如图所示.
可见,身高与右手长度之间的总体趋势成一条直线,即它们具有线性相关关系.
(2)设回归直线方程是
=
+
x.
根据表中数据可由计算器计算得
=174.8,
=21.7,
=305
730,
x
iyi=37
986,
=4
729.5.
r=
故两者有很强的线性相关关系.
=
≈0.303,
=
-
≈-31.264.
所以回归直线方程为
=0.303x-31.264.
(3)当x=185时,
=0.303×185-31.264=24.791≈24.8(cm),故该同学的
右手长度可估测为24.8
cm.
类型三 非线性回归
【典例】某地区不同身高的未成年男性的体重平均值如表:
身高
x(cm)
60
70
80
90
100
110
体重
y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高
x(cm)
120
130
140
150
160
170
体重
y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立y与x之间的回归方程;
(2)如果一名在校男生身高为168
cm,预测他的体重约为多少?
【思维·引】先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
【解析】(1)根据表中的数据画出散点图,如图:
由图看出,这些点分布在某条指数型函数曲线的周围,于是令z=ln
y,列出表格:
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图,如图:
由表中数据可求得z与x之间的回归直线方程为
=0.663+0.020x,
则有
=e0.663+0.020x.
(2)由(1)知,当x=168时,
=e0.663+0.020×168≈55.87,所以在校男生身高为
168
cm,预测他的体重约为55.87
kg.
【内化·悟】
将非线性相关问题转化为线性相关问题的依据是什么?
提示:根据散点图确定.
【类题·通】非线性回归问题的解题步骤
【习练·破】
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到如图所示的散点图及一些统计量的值.
表中wi=
,
wi.
(1)根据散点图判断,y=a+bx与y=c+d
哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预测值是多少?
②年宣传费x为何值时,年利润的预测值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu
的斜率和截距的最小二乘估计分别为
【解析】(1)由散点图可以判断,y=c+d
适宜作为年销售量y关于年宣传费
x的回归方程类型.
(2)已知w=
,先建立y关于w的线性回归方程.
由于
=68,
=
-
=563-68×6.8=100.6,
所以y关于w的线性回归方程为
=100.6+68w,因此y关于x的回归方程为
=100.6+68
.
(3)①由(2)知,当x=49时,年销售量y的预测值
=100.6+68
=576.6,
年利润z的预测值
=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预测值
=0.2(100.6+68
)-x
=-x+13.6
+20.12.
所以当
=
=6.8,即x=46.24时,
取得最大值.
故年宣传费为46.24千元时,年利润的预测值最大.
课堂检测·素养达标
1.设一个回归方程
=3+1.2x,则变量x增加一个单位时
( )
A.y平均增加1.2个单位
B.y平均增加3个单位
C.y平均减少1.2个单位
D.y平均减少3个单位
【解析】选A.由b=1.2>0,故x增加一个单位时,y平均增加1.2个单位.
2.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
若y与x线性相关,则y与x的回归直线
=
x+
必过
( )
A.点(2,2)
B.点(1.5,0)
C.点(1,2)
D.点(1.5,4)
【解析】选D.因为
=1.5,
=4,
所以回归直线必过点(1.5,4).
3.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为
=0.72x-58.2,张红同学(20岁)身高为178
cm,她的体重应该在________kg
左右.?
【解析】用回归方程对身高为178
cm的人的体重进行预测,当x=178时,
=0.72×178-58.2=69.96(kg).
答案:69.96
4.某个男孩的年龄与身高的统计数据如表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
【解析】(1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
【新情境·新思维】
已知变量x,y之间具有线性相关关系,其散点图如图所示,
则其回归方程可能为
( )
A.
=1.5x+2
B.
=-1.5x+2
C.
=1.5x-2
D.
=-1.5x-2
【解析】选B.设回归方程为
=
x+
,由散点图可知变量x,y之间负相关,
回归直线在y轴上的截距为正数,所以
<0,
>0,因此方程可能为
=-1.5x+2.