8.2一元线性回归模型及其应用-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修三练习(Word版含答案)

文档属性

名称 8.2一元线性回归模型及其应用-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修三练习(Word版含答案)
格式 doc
文件大小 98.1KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-04-12 18:57:13

图片预览

文档简介

一元线性回归模型及其应用练习
一、单选题
下列关于回归分析的说法中错误的是(????)
A. 回归直线一定过样本中心点(x,y)
B. 残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适
C. 若甲、乙两个模型的相关指数R2分别约为0.98和0.80,则模型乙的拟合效果更好
D. 两个模型中残差平方和越小的模型拟合的效果越好
对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(????)
A. 由样本数据得到的线性回归方程y=bx+a必过样本点的中心(x,y)
B. 残差平方和越小的模型,拟合的效果越好
C. 用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D. 若变量y和x之间的相关系数r=?0.936?2,则变量y与x之间具有线性相关关系
根据一组样本数据(x1,y1),(x2,y2),?,(xn,yn)的散点图分析x与y之间是否存在线性相关关系,求得其线性回归方程为y=0.85x?85.7,则在样本点(165,57)处的残差为(????)
A. 54.55 B. 2.45 C. 3.45 D. 111.55
经计算得到高中女学生的体重y(单位:kg)关于身高x(单位:cm)的回归直线方程为y=0.75x?69.72,对于身高为162cm的高中女学生,则(????)
A. 可以预测其体重大约为51.78kg
B. 其体重准确值为51.78kg
C. 其体重大于51.78kg
D. 由于存在随机误差,其体重无法预测
随机选取5名高二男生,其身高和体重的数据如下表所示:
? ?身高x(cm)
160
165
170
175
180
体重y(kg)
56
61
65
69
74
由上表可得回归直线方程y=0.9x+a,据此模型预报身高为172cm的男生的体重大约为(? ? )
A. 65.8kg B. 66.3kg C. 66.8kg D. 67.3?kg
在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与x间的回归方程为(????)
A. y=x+1 B. y=x+2 C. y=2x+1 D. y=x?1
根据下表样本数据
x
6
8
9
10
12
y
6
5
4
3
2
? 用最小二乘法求得线性回归方程为y=bx+10.3,则当x=4时,y的估计值为(? ? ?)
A. 6.5 B. 7 C. 7.5 D. 8
研究变量x,y得到一组样本数据,进行回归分析,有以下结论
①残差平方和越小的模型,拟合的效果越好;
②用相关指数R2来刻画回归效果,R2越小说明拟合效果越好;
③线性回归方程对应的直线y=bx+a至少经过其样本数据点中的一个点;
④若变量y和x之间的相关系数为r=?0.9462,则变量y和x之间的负相关很强.
以上正确说法的个数是(????)
A. 1 B. 2 C. 3 D. 4
根据一组样本数据(x1,y1),(x2,y2),?,(xn,yn)的散点图分析x与y之间是否存在线性相关关系,求得其线性回归方程为y=0.85x?85.7,则在样本点(165,57)处的残差为(????)
A. 54.55 B. 2.45 C. 3.45 D. 111.55
已知变量x和y满足相关关系y=?0.1x+1,变量y与z正相关.下列结论中正确的是(?? )
A. x与y正相关,x与z负相关 B. x与y正相关,x与z正相关
C. x与y负相关,x与z负相关 D. x与y负相关,x与z正相关
在线性回归模型中,分别选择了4个不同的模型,它们的相关指数R2依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数R2为(????)
A. 0.95 B. 0.81 C. 0.74 D. 0.36
已知变量x,y之间的线性回归方程为y=?0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是(? ?)
x
6
8
10
12
y
6
a
3
2
A. 变量x,y之间呈负相关关系
B. a=4
C. 可以预测,当x=20时,y=?3.7
D. 该回归直线必过点(9,4)
二、多空题
某产品的广告费用x(万元)与销售额y(万元)的统计数据如表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程y=bx+a中的b=9.4,则:
①回归方程y=bx+a中a=??????????
②据此模型预测广告费用为6万元时销售额为??????????万元.
如图所示是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的线性回归方程为y=bx+1,则b=??????????,点??????????一定在回归直线上.
若身高x(单位:m)与体重y(单位:kg)之间的回归直线方程为y=85x?a(a∈R),样本点的中心为1.2,30,则a=???(1)???;据此模型当身高为1.7m时,预计体重为???(2)???kg.
已知样本容量为11,计算得i=1nxi=510,i=1nyi=214,回归方程为y=0.3x+a,则x≈??????????,a≈??????????.(精确到0.01)
三、解答题
PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x/万辆
50
51
54
57
58
PM2.5的浓度y/微克/立方米
69
70
74
78
79
(1)根据上表数据,请在下列坐标系中画出散点图;
?
b∧=i=15(xi?x)(yi?y)i=15(xi?x)2
(2)根据上表数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)若周六同一时间段的车流量是25万辆,试根据(2)求出的线性回归方程预测,此时PM2.5的浓度为多少(保留整数)?
新冠肺炎疫情发生以来,我国某科研机构开展应急科研攻关,研制了一种新型冠状病毒疫苗,并已进入二期临床试验.根据普遍规律.志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.通过检测,用x表示注射疫苗后的天数.y表示人体中抗体含量水平(单位:miu/mL,即:百万国际单位/毫升),现测得某志愿者的相关数据如下表所示:
天数x
1
2
3
4
5
6
抗体含量水平y
5
10
26
50
96
195
根据以上数据,绘制了散点图.
(1)根据散点图判断,y=c·edx与y=a+bx(a,b,c,d均为大于零的常数)哪一个更适宜作为描述y与x关系的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果求出y关于x的同归方程,并预测该志愿者在注射疫苗后的第10天的抗体含量水平值;
(3)从这位志愿者的前6天的检测数据中随机抽取4天的数据作进一步的分析,记其中的y值大于50的天数为X,求X的分布列与数学期望.
参考数据:
x
y
ω
i=16(x1?x)2
i=16(ω1?ω)2
i=16(ωi?ω)(xi?x)
i=16(xi?x)(yi?y)
e8.3
3.50
63.67
3.49
17.50
9.49
12.95
519.01
4023.87
其中ω=lny.
参考公式:用最小二乘法求经过点(u1,v1),(u2,v2),(u3,v3),….(ui,vi)的线性回归方程v=bu+a的系数公式,b=i=1n(ui?u)(vi?v)i=1n(ui?u)2=i=1nuivi?nuvi=1nui2?nu2,a=v?bu.
答案和解析
1.【答案】C
【解答】
解:对于A,回归直线一定过样本中心,故A正确;
对于B,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.故B正确;
对于C,R2取值越大,说明残差平方和越小,模型的拟合效果越好,又∵甲、乙两个模型的相关指数R2的值分别约为0.98和0.80,0.98>0.80,∴甲模型的拟合效果好,故C不正确;
对于D,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故D正确.
2.【答案】C
【解答】
解:对于A,样本中心点在直线上,故A正确;
对于B,残差平方和越小的模型,拟合效果越好,故B正确;
对于C,R2越大拟合效果越好,故C不正确;
对于D,变量?y和?x之间的相关系数?r=?0.9362,表示两个变量具有线性负相关关系,故D正确.
3.【答案】B
【解答】
解:把x=165代入y=0.85x?85.7,得y=0.85×165?85.7=54.55,所以在样本点(165,57)处的残差e=y?y=57?54.55=2.45.
4.【答案】A
【解答】
解:由于线性回归方程为y=0.75x?69.72,
当x=162cm,y=0.75×162?69.72=51.78(kg),
故选A.
5.【答案】C
【解答】
解:由表中数据可得x=160+165+170+175+1805=170,
y=56+61+65+69+745=65.
∵(x,y)一定在回归直线方程y=0.9x+a上,
故65=0.9×170+a,
解得a=?88.
故y=0.9x?88.
当x=172时,y=0.9×172?88=66.8.
故选C.
6.【答案】A
7.【答案】C
【解答】
解:由图表可知x=6+8+9+10+125=9,y=6+5+4+3+25=4,
所以样本中心点为(9,4),
把样本中心点代入y=bx+10.3,得4=9b+10.3,b=?0.7,
所以线性回归方程为y=?0.7x+10.3,
则x=4时,y=?0.7×4+10.3=7.5,
故答案选C.
8.【答案】B
【解答】
解:用相关指数R2来刻画回归的效果时,R2取值越大,则残差平方和越小,模型拟合的效果就越好;①正确,②错误,
由线性回归方程y=bx+a中,知一定过样本中心点,但不一定经过其样本数据点,故③错误;
因为?0.9362<0,变量y和x负相关相关,故④正确.
故①④正确.
9.【答案】B
【解答】
解:把x=165代入y=0.85x?85.7,
得y=0.85×165?85.7=54.55,
所以在样本点(165,57)处的残差e=y?y=57?54.55=2.45.
10.【答案】C
【解答】
解:因为y=?0.1x+1,x的系数为负,
故x与y负相关;而y与z正相关,
故x与z负相关.
11.【答案】A
【解答】
解:两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果就越好,
在所给的四个选项中0.95是相关指数最大的值,
∴其拟合效果也最好.
12.【答案】B
【解答】
解:A.线性回归方程的一次项系数为负,故变量x、y之间呈现负相关关系,所以正确;
B.x?=6+8+10+124=9,∴y?=?0.7×9+10.3=4,∴6+a+3+24=4,解得a=5,则B选项错误;
C.当x=20时,代入方程得y=?3.7,所以正确;
D.由表格数据知,该回归直线必过点(9,4),所以正确.
故选B.
13.【答案】9.1
65.5
【解答】
解:∵x=4+2+3+54=3.5,
y=49+26+39+544=42,
∵数据的样本中心点在线性回归直线上,
回归方程y=bx+a中的b为9.4,
∴42=9.4×3.5+a,
∴a=9.1,
∴线性回归方程是y=9.4x+9.1,
∴广告费用为6万元时预测销售额为9.4×6+9.1=65.5万元,
故答案为9.1;65.5.
14.【答案】0.8
(2,2.6)
【解答】
解:由题图知x=0+1+3+44=2,
y=0.9+1.9+3.2+4.44=2.6,
将(2,2.6)代入y=bx+1中,解得b=0.8.
15.【答案】72
72.5
【解答】
解:由y=85x?a,且样本点的中心为(1.2,30),
得30=85×1.2?a,则a=72.
∴回归直线方程为y=85x?72,
取x=1.7,得y=85×1.7?72=72.5kg.
故答案为72;72.5.
16.【答案】46.36
5.55
【解答】
解:由题意得x=111i=111xi=51011≈46.36,y=111i=111yi=21411,
因为y=0.3x+a,所以21411=0.3×51011+a,可得a≈5.55.
故答案为46.36;5.55.
17.【答案】解:(1)散点图如图所示,
(2)∵x=50+51+54+57+585=54,y=69+70+74+78+795=74,
i=15(xi?x)(yi?y)=4×5+3×4+3×4+4×5=64,
i=15(xi?x)2=(?4)2+(?3)2+32+42=50,
b=i=15(xi?x)(yi?y)i=15(xi?x)2=6450=1.28,
a=y?bx=74?1.28×54=4.88,
故y关于x的线性回归方程是:y=1.28x+4.88;
(3)当x=25时,y=1.28×25+4.88=36.88≈37所以可以预测此时PM2.5的浓度约为37.
18.【答案】解:(1)根据散点图判断,更适合作为描述y与x关系的回归方程类型.
(2)设ω=lny,变换后可得ω=lnc+dx,
设p=lnc,建立ω关于x的回归方程ω=p+dx,
d=i=16(ωi?ω)(xi?x)i=16(xi?x)2=12.9517.50=0.74,
p=ω?dx=3.49?0.74×3.50=0.90,
所以ω关于x的回归方程为ω=0.74x+0.90,
所以y=e0.74x+0.90,
当x=10时,y=e0.74×10+0.90=e8.3≈4023.87,
即该志愿者在注射疫苗后的第10天的抗体含量水平值约为4023.87miu/mL.
(3)由表格数据可知,第5,6天的y值大于50,
故x的可能取值为0,1,2,
P(X=0)=C44C64=115,
P(X=1)=C43C21C64=815,
p(X=2)=C42C22C64=25,
X的分布列为
X
0
1
2
P
115
815
25
E(X)=0×115+1×815+2×25=43.