人教B版(2019) 高中数学 选择性必修第二册 4.3.1 一元线性回归模型课件+课时练(53+72张ppt)

文档属性

名称 人教B版(2019) 高中数学 选择性必修第二册 4.3.1 一元线性回归模型课件+课时练(53+72张ppt)
格式 zip
文件大小 5.0MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2020-09-04 19:28:41

文档简介

课时分层作业(二十) 相关关系与回归直线方程
(建议用时:40分钟)
一、选择题
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为(  )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
B [结合散点图可知,变量x,y之间是负相关,且纵截距大于0,故选B.]
2.某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是(  )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
A [由题图左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.]
3.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数b(  )
A.不能小于0 
B.不能大于0
C.不能等于0 
D.只能小于0
C [当=0时,这时不具有线性相关关系,但能大于0,也能小于0.]
4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高一定是145.83
cm
B.身高在145.83
cm以上
C.身高在145.83
cm左右
D.身高在145.83
cm以下
C [将x的值代入回归方程=7.19x+73.93,可以预测孩子10岁时的身高为=7.19×10+73.93=145.83,故选C.]
5.已知x与y之间的一组数据.
x
0
1
2
3
y
m
3
5.5
7
已求得关于y与x的线性回归方程为=2.2x+0.7,则m的值为(  )
A.1   
B.0.85
C.0.7
D.0.5
D [==1.5,=,将其代入=2.2x+0.7,可得m=0.5,故选D.]
二、填空题
6.设有一个回归方程为=2-1.5x,则变量x每增加1个单位时,y平均减少________个单位.
1.5 [因为=2-1.5x,所以变量x每增加1个单位时,y平均减少1.5个单位.]
7.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.
650 [当x=80时,=400+250=650.]
8.下列五个命题,正确命题的序号为________.
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
③④⑤ [变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.]
三、解答题
9.某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
[解] (1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
10.
通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示.
资金投入x
2
3
4
5
6
利润y
2
3
5
6
9
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(2)现投入资金10万元,估计获得的利润为多少万元?
[解] 
(1)==4,
==5,

==1.7.
∴=-
=-1.8,∴=1.7x-1.8.
(2)当x=10万元时,=15.2万元,
即估计获得的利润为15.2万元.
11.已知x与y之间的几组数据如下表.
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )
A.>b′,>a′
B.>b′,<a′
C.<b′,>a′  
D.<b′,<a′
C [由(1,0),(2,2)求b′,a′.
b′==2,a′=0-2×1=-2.
求,时,xiyi=0+4+3+12+15+24=58,
=,=,x=1+4+9+16+25+36=91,
∴=eq
\f(58-6×\f(7,2)×\f(13,6),91-6×\b\lc\(\rc\)(\a\vs4\al\co1(\f(7,2))))=,
=-×=-=-,∴<b′,>a′.]
12.(多选题)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x
2
4
5
6
8
y

40
60
50
70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的有(  )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
AB [由回归方程=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以D不正确.故选AB.]
13.某数学老师身高176
cm,他爷爷、父亲和儿子的身高分别是173
cm,170
cm和182
cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
185 [因为儿子的身高与父亲的身高有关,所以设儿子的身高为Y(单位:cm),父亲身高为X(单位:cm),根据数据列表如下.
X
173
170
176
Y
170
176
182
由数据列表,得回归系数=1,=3.
于是儿子身高与父亲身高的关系式为Y=X+3.
当X=182时,Y=185.
故预测该老师的孙子的身高为185
cm.]
14.(一题两空)某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表.
时间
二月上旬
二月中旬
二月下旬
三月上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出线性回归方程=bx+a中的b=-2,样本中心点为(10,38).
(1)表中数据m=________;
(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________件.
(1)40 (2)14 [(1)由=38,得m=40.
(2)由=-得=58,故=-2x+58,
当x=22时,=14,
故三月中旬的销售量约为14件.]
15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
[解] (1)由于==8.5,
==80.
所以=-=80+20×8.5=250,
从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)=-20x2+330x-1
000=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润.
7/7课时分层作业(二十一) 相关系数与非线性回归
(建议用时:40分钟)
一、选择题
1.如果两个变量之间的线性相关程度很高,则其相关系数r的绝对值应接近于(  )
A.
0.5    B.
2    C.
0
    D.
1
D [相关系数|r|越接近于1,相关程度越高.故选D.]
2.两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是(  )
A.y=a·xb
B.y=a+bln
x
C.y=a·ebx
D.y=a·eeq
\s\up12()
B [由散点图可知,此曲线类似对数函数型曲线,因此可用函数y=a+bln
x模型进行拟合.]
3.若回归直线的斜率∈(0,+∞),则相关系数r的取值范围为(  )
A.(0,1]
B.[-1,0)
C.0
D.无法确定
A [由相关系数与回归直线的斜率之间的关系可知相关系数的取值范围是04.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )
A.-1
B.0
C.
D.1
D [因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.]
5.已知变量y关于x的回归方程为=ebx-0.5,其一组数据如下表所示:
x
1
2
3
4
y
e
e3
e4
e6
若x=5,则预测y的值可能为(  )
A.e5
B.eeq
\s\up12()
C.e7
D.eeq
\s\up12()
D [将式子两边取对数,得到ln
=bx-0.5,令z=ln
,得到z=bx-0.5,列出x,z的取值对应的表格,
x
1
2
3
4
z
1
3
4
6
则==2.5,==3.5,
∵(,)满足z=bx-0.5,∴3.5=b×2.5-0.5,
解得b=1.6,∴z=1.6x-0.5,∴y=e1.6x-0.5,当x=5时,=e1.6×5-0.5=eeq
\s\up12(),故选D.]
二、填空题
6.若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个)
丙 [两个变量y与x的回归模型中,它们的相关系数|r|越接近于1,这个模型的两个变量线性相关程度就越强,在甲、乙、丙中,所给的数值中-0.90的绝对值最接近1,所以丙的线性相关程度最强.]
7.已知数据点(xi,yi)(i=1,2,3,…,n)在一条直线上,则相关系数r=________.
±1 [由题易知,相关系数r=±1.]
8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图像附近,令u=ln
y,则可通过转换得到的线性回归方程为________.
u=1+ln
3+2x [由y=3e2x+1,得ln
y=ln(3e2x+1),
即ln
y=ln
3+2x+1.
令u=ln
y,则线性回归方程为u=1+ln
3+2x.]
三、解答题
9.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
月份代码t
1
2
3
4
5
6
7
销售量y(万件)
y1
y2
y3
y4
y5
y6
y7
但其中数据污损不清,经查证yi=9.32,
tiyi=40.17,=0.55.
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈2.646,相关系数
r=,当|r|>0.75时,认为两个变量有很强的线性相关关系,回归方程=t+中斜率和截距的最小二乘估计公式分别为
=,=-.
[解] (1)由题中的数据和附注中的参考数据得
=4,
(ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi
=40.17-4×9.32=2.89,
∴r=≈0.99>0.75,
所以销售量y与月份代码t有很强的线性相关关系.
(2)由=≈1.331及(1)得
==≈0.103,
=-≈1.331-0.103×4≈0.92,
所以y关于t的回归方程为=0.10t+0.92,
(3)当t=8时,代入回归方程得
=0.10×8+0.92=1.72(万件),
故第8个月的毛利润为
z=10×1.72-=17.2-2×1.414=14.372,
因为14.372<15,
预测第8个月的毛利润不能突破15万元.
10.如图是某企业2014年至2020年的污水净化量(单位:吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,预测2021年该企业的污水净化量.
参考数据:=54,
(ti-)(yi-)=21,
≈3.74,
(yi-i)2=,
参考公式:相关系数r=,
线性回归方程=+t,=,
=-.
[解] (1)由折线图中的数据得,
=4,
(ti-t)2=28,
(yi-)2=18,
所以r=≈0.94.
因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大,所以可以用线性回归模型拟合y与t的关系.
(2)因为=54,===,
所以=-=54-×4=51,
所以y关于t的线性回归方程为=t+=t+51,将2021年对应的t=8代入上式,得
=×8+51=57,
所以预测2021年该企业污水净化量约为57吨.
11.若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的线性回归方程,需做变换t=(  )
A.x2
B.(x+a)2
C.
D.以上都不对
C [y=ax2+bx+c(a≠0)=a+,
根据线性回归方程是一次函数可知,令t=,
则y=at+为t的线性回归方程,所以C正确.]
12.(多选题)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l1:y=0.68x+,计算其相关系数为r1.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为l2:y=x+0.68,相关系数为r2,以下结论中,正确的是(  )
A.r1>0,r2>0
B.r1>r2
C.=0.12
D.0<<0.68
ACD [由图可知两变量呈现正相关,故
r1>0,r2>0,且r1所以=0.44,也可直接根据图像判断0<<0.68(比较两直线的倾斜程度),故ACD正确.]
13.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln
y,其变换后得到线性回归方程z=0.3x+4,则c=________.
e4 [∵y=cekx,∴两边取对数,
可得ln
y=ln(cekx)=ln
c+ln
ekx=ln
c+kx,
令z=ln
y,可得z=ln
c+kx,
∵z=0.3x+4,∴ln
c=4,∴c=e4.故答案为e4.]
14.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9)其变量间的相关系数为r2.则r1,r2的大小关系为________.
r1>r2 [由第1组数据可知,两变量间成正相关,故r1>0,由第2组数据可知,两变量间成负相关,故r2<0,故r1>0>r2.]
15.某公司为了了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响,对公司近12年的年研发资金投入量xi和年销售额yi的数据,进行了对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数,并得到一些统计量的值.令ui=x,vi=ln
yi(i=1,2,…,12),经计算得如下数据:
(xi-)2
(yi-)2
20
66
77
2
460
4.20
(ui-)2
(ui-)(yi-)
(vi-)2
(xi-)(vi-)
31
250
215
3.08
14
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程;
(ⅱ)若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?
附:①相关系数r=,
回归直线=+x中公式分别为:=,=-;
②参考数据:308=4×77,≈9.486
8,e4.499
8≈90.
[解] (1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,由题意,
r1====0.86,
r2===≈0.91,
则|r1|<|r2|,因此从相关系数的角度,模型y=eλx+t的拟合程度更好.
(2)(ⅰ)先建立v关于x的线性回归方程,
由y=eλx+t,得ln
y=t+λx,即v=t+λx.
由于λ==≈0.182,
t=-λ=4.20-×20≈0.56,
所以v关于x的线性回归方程为=0.18x+0.56,
所以ln
=0.18x+0.56,则=e0.18x+0.56.
(ⅱ)下一年销售额y需达到90亿元,
即y=90,代入=e0.18x+0.56,得90=e0.18x+0.56,
又e4.499
8≈90,所以4.499
8≈0.18x+0.56,
所以x≈≈21.89,
所以预测下一年的研发资金投入量约是21.89亿元.
8/8