人教A版高中数学选择性必修三
8.2第3课时 指数函数模型与幂函数模型-同步练习
1.某公司对某产品做市场调查,获得了该产品的定价x(单位:万元/吨)和一天的销量y(吨)的一组数据,根据这组数据制作了如图所示的统计表和散点图.
iyi iyi
0.33 10 3 0.164 100 68 350
表中t=.
(1)根据散点图判断,=x+与=x-1+哪一个更适合作为y关于x的经验回归方程(给出判断即可,不必说明理由);
(2)根据(1)的判断结果,建立y关于x的经验回归方程;
(3)若生产1吨该产品的成本为0.25万元,依据(2)的经验回归方程,预计每吨定价多少时,该产品一天的销售利润最大?最大利润是多少?
(经验回归方程=x+中,==,=-)
2.根据党的“扶贫同扶志、扶智相结合”精准扶贫、精准脱贫政策,中国儿童少年基金会为了丰富留守儿童的课余文化生活,培养良好的阅读习惯,在农村留守儿童聚居地区捐建“小候鸟爱心图书角”.2022年某村在寒假和暑假组织开展“小候鸟爱心图书角读书活动”,号召全村少年儿童积极读书,养成良好的阅读习惯,下表是对2018年以来近5年该村庄100位少年儿童的假期周人均读书时间的统计:
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
每周人均读书时间y(小时) 1.3 2.8 5.7 8.9 13.8
现要建立y关于x的经验回归方程,有两个不同的经验回归模型可以选择,模型一=x+;模型二=x2+,即使画出y关于x的散点图,也无法确定哪个经验回归模型拟合效果更好,现用最小二乘法原理,已经求得模型一的经验回归方程为=3.1x-2.8.
(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的经验回归方程(计算结果保留到小数点后一位);
(2)用计算残差平方和的方法比较哪个模型拟合效果更好,已经计算出模型一的残差平方和为(yi-i)2=3.7.
参考数据:≈0.52,其中ti=x,i=1,2,3,4,5.
参考公式:经验回归方程=x+中,==,=-.
3.中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有关.经验表明,某种绿茶用85 ℃的水泡制,再等到茶水温度降至60 ℃时饮用,可以产生最佳口感.某学习研究小组通过测量,得到了下面表格中的数据(室温是20 ℃).
泡制时间x/min 0 1 2 3 4
水温y/℃ 85 79 74 71 65
(1)小组成员根据上面表格中的数据绘制散点图(图略),并根据散点图分布情况,考虑到茶水温度降到室温(即20 ℃)就不能再降的事实,决定选择函数模型y=kcx+20(x≥0)来刻画.
①令z=ln(y-20),求出z关于x的经验回归方程;
②利用①的结论,求出y=kcx+20(x≥0,c>0)中的k与c.
(2)你认为该品种绿茶用85 ℃的水大约泡制多久后饮用,可以产生最佳口感?
参考数据:ln 65≈4.2,ln 59≈4.1,ln 54≈4.0,ln 51≈3.9,ln 45≈3.8,log0.90.6≈4.8,e-0.1≈0.9,e4.2≈66.7,≈0.6,
参考公式:=x+,=,=-.
4.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份 1 2 3 4 5 6
广告投入量x/万元 2 4 6 8 10 12
收益y/万元 14.21 20.31 31.8 31.18 37.83 44.67
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的经验回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
iyi
7 30 1 464.24 364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:
①剔除异常数据后,求出(1)中所选模型的经验回归方程;
②广告投入量x=18时,(1)中所选模型收益的预测值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=x+的斜率和截距的最小二乘估计分别为==,=-.
参考答案与详细解析
1.解 (1)根据散点图可知,=x-1+更适合作为y关于x的经验回归方程.
(2)由t=,得=t+,
所以===5,
所以=-=10-5×3=-5,
所以y关于t的经验回归方程为=5t-5,
故y关于x的经验回归方程为=-5.
(3)设一天的利润为W,W=y(x-0.25)=(x-0.25)=6.25-5≤6.25-5×2
=6.25-5×2×0.5=1.25,
当且仅当x=即x=0.5时等号成立,
所以预计每吨定价为0.5万元时,该产品一天的销售利润最大,最大利润是1.25万元.
2.解 (1)令t=x2,则模型二可化为y关于t的线性经验回归方程=t+,则==11,
==6.5,
则由参考数据可得=≈0.52≈0.5,
=- =6.5-0.52×11≈0.8,
则模型二的经验回归方程为=0.5x2+0.8.
(2)由模型二的经验回归方程可得,=0.5×1+0.8=1.3,=0.5×4+0.8=2.8,=0.5×9+0.8=5.3,=0.5×16+0.8=8.8,=0.5×25+0.8=13.3,
∴(yi-)2=02+02+0.42+0.12+0.52=0.42<3.7,
故模型二的拟合效果更好.
3.解 (1)①由已知得出x与z的关系,如下表:
泡制时间x/min 0 1 2 3 4
z 4.2 4.1 4.0 3.9 3.8
设经验回归方程=x+,
由题意,得==2,
==4,
∴(xi-)(zi-)=(-2)×0.2+(-1)×0.1+1×(-0.1)+2×(-0.2)=-1,
(xi-)2=(-2)2+(-1)2+12+22=10,
则===-0.1,
=-=4+0.1×2=4.2,
则z关于x的经验回归方程为=-0.1x+4.2.
②由y=kcx+20(x≥0),
得y-20=kcx(x≥0),
两边取对数得,ln(y-20)=ln k+xln c,
利用①的结论得,ln c=-0.1,ln k=4.2,
∴c=e-0.1≈0.9,k=e4.2≈66.7.
(2)由(1)得,=66.7×0.9x+20(x≥0),
令=60,得x=log0.90.6≈4.8.
∴该品种绿茶用85 ℃的水大约泡制4.8 min后饮用,口感最佳.
4.解 (1)应该选择模型①,因为模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预测精度高.
(2)①剔除异常数据,即3月份的数据后,得
=×(7×6-6)=7.2,
=×(30×6-31.8)=29.64.
iyi=1 464.24-6×31.8=1 273.44,
=364-62=328.
====3,
=-=29.64-3×7.2=8.04.
所以y关于x的经验回归方程为=3x+8.04.
②把x=18代入①中所求经验回归方程,
得=3×18+8.04=62.04,故预测值为62.04万元.人教A版高中数学选择性必修三
8.2第2课时 一元线性回归模型的综合问题-同步练习
1.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归方程=x+,对应的残差如图所示,模型误差( )
A.满足一元线性回归模型的所有假设
B.满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型E(e)=0和D(e)=σ2的假设
2.中国茶文化博大精深,茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间x和茶水温度y的一组数据(xi,yi).经过分析,提出了四种回归模型,①②③④四种模型的残差平方和(yi-)2的值分别是0.98,0.80,0.12,1.36.则拟合效果最好的模型是( )
A.模型① B.模型②
C.模型③ D.模型④
3.(多选)对变量y和x的一组样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则( )
A.残差平方和越大,模型的拟合效果越好
B.若由样本数据得到经验回归直线=x+,则其必过点(,)
C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系
4.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的经验回归方程,则需作变换t等于( )
A.sin2α B.(sin α+1)2
C.sin α+ D.以上都不对
5.已知两个线性相关变量x与y的统计数据如下表:
x 3 4 5 6
y 2.5 3 4 m
其经验回归方程是=0.7x+,据此计算,样本(4,3)处的残差为-0.15,则表中m的值为( )
A.4 B.4.5 C.5 D.5.5
6.(多选)对于表中x,y之间的一组数据:
x 1 3 6 7 8
y 1 2 3 4 5
甲、乙两位同学给出的拟合直线方程分别为①=x+1和②=x+,若通过分析得出②的拟合效果好,则下列分析理由正确的是( )
A.①的残差和大于②的残差和,所以②拟合效果更好
B.①的残差平方和大于②的残差平方和,所以②拟合效果更好
C.①的R2小于②的R2,所以②拟合效果更好
D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好
7.某同学计算两个线性相关变量x与y的经验回归方程是=-3.2x+40,则相对应于点(11,5)的残差 (i=yi-i)为________.
8.若一个样本的观测值与均值的差的平方和为80,残差平方和为60,决定系数R2为________.
9.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成如图所示的散点图.光照时长为x(单位:小时),大棚蔬菜产量为y(单位:千斤每亩),记w=ln x.
(1)根据散点图判断,y=a+bx与y=c+dln x,哪一个更适合作为大棚蔬菜产量y关于光照时长x的经验回归方程模型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程(结果保留小数点后两位);
(3)根据实际种植情况,发现上述经验回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为e2小时时(自然对数的底数e≈2.718 28),大棚蔬菜亩产约为多少.
参考数据:
i i i iyi iyi
290 102.4 52 4 870 540.28 137 1 578.2 272.1
参考公式:β关于α的经验回归方程=α+中,=,=-.
10.耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为=x+0.88.
海水浓度xi(‰) 3 4 5 6 7
亩产量yi(吨) 0.62 0.58 0.49 0.4 0.31
残差i
(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;
(2)①完成上述残差表:
②统计学中常用决定系数R2来刻画回归效果,R2越大,模型拟合效果越好,如假设R2=0.8,就说明预报变量y的差异有80%是由解释变量x引起的.请计算决定系数R2(精确到0.01),并指出亩产量的变化多大程度上是由海水浓度引起的?
附:残差公式=yi-,
决定系数R2=1-.
11.(多选)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2015年到2023年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2015年作为第1年)的函数.运用excel软件,分别选择经验回归直线和三次函数回归曲线进行拟合,效果如图,则下列说法正确的是( )
A.销售额y与年份序号x呈正相关关系
B.三次函数回归模型的残差平方和大于线性回归模型的残差平方和
C.三次函数回归曲线的拟合效果好于经验回归直线的拟合效果
D.根据三次函数回归曲线可以预测2024年“年货节”期间的销售额约为1 698.719亿元
12.(多选)下列说法正确的是( )
A.经验回归直线一定经过点(,)
B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,决定系数R2越接近于1,说明回归模型的拟合效果越好
13.某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:
广告支出费用x 2.2 2.6 4.0 5.3 5.9
销售量y 3.8 5.4 7.0 11.6 12.2
根据表中的数据可得经验回归方程=2.27x-1.08,R2≈0.96,以下说法正确的是( )
A.第三个样本点对应的残差3=-1,回归模型的拟合效果一般
B.第三个样本点对应的残差3=1,回归模型的拟合效果较好
C.销售量y的多少有96%是由广告支出费用引起的
D.销售量y的多少有4%是由广告支出费用引起的
14.已知经验回归方程=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.2),则残差平方和是________.
15.若对于变量x,y的10组统计数据的回归模型中,计算R2=0.95,又知残差平方和为120.55,那么(yi-)2的值为( )
A.241.1 B.245.1
C.2 411 D.2 451
16.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:
月份 1 2 3 4
物流成本x 83 83.5 80 86.5
利润y 114 116 106 122
残差=yi- 0.2 0.6 1.8 -3
月份 5 6 7 8
物流成本x 89 84.5 79 86.5
利润y 132 114 m 132
残差=yi- -1 -4.6 -1
根据最小二乘法求得经验回归方程为=3.2x-151.8.
(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值8;
(2)请先求出线性回归模型=3.2x-151.8的决定系数R2(精确到0.000 1);若根据非线性经验回归方程y=267.76ln x-1 069.2求得解释变量(物流成本)对于响应变量(利润)决定系数R=0.905 7,请说明以上两种模型哪种模型拟合效果更好?
(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.
附1(修正前的参考数据):
iyi=78 880,=56 528,
=84,(yi-)2=904.
附2:R2=1-.
附3:==,=-.
参考答案与详细解析
1.D [由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.]
2.C [对于回归模型,残差平方和越小,回归模型的拟合效果越好,故拟合效果最好的模型是模型③.]
3.BD [因为残差平方和越小,模型的拟合效果越好,故选项A错误;
因为经验回归直线必过点(,),故选项B正确;
因为决定系数R2越接近1,说明模型的拟合效果越好,故选项C错误;
由样本相关系数为负且接近1,则y和x之间具有很强的负线性相关关系,故选项D正确.]
4.B [因为y是关于t的经验回归方程,实际上即y是关于t的一次函数,又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.]
5.B [由题意,样本(4,3)处的残差为-0.15,所以3.15=0.7×4+,所以=0.35,由经验回归方程=0.7x+0.35过点(,),且=×(3+4+5+6)=4.5,所以可得=0.7 +0.35=0.7×4.5+0.35=3.5,由=×(2.5+3+4+m)=3.5,得m=4.5.]
6.BCD [不可以根据残差和的大小来分析模型的拟合效果的好坏,故A错误;
用=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和即残差平方和为S1=2+(2-2)2+(3-3)2+2+2=,用=x+作为拟合直线时,所得残差平方和为S2=(1-1)2+(2-2)2+2+(4-4)2+2=.
∴S2①的R2=1-=,②的R2=1-=,
∴①的R2小于②的R2,∴②拟合效果更好,故C正确;
残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,
∴直线②拟合效果更好,故D正确.]
7.0.2
解析 因为=-3.2x+40.
当x=11时,=-3.2×11+40=4.8,
故=5-4.8=0.2.
8.0.25
解析 R2=1-=0.25.
9.解 (1)根据散点图,开始的点在某条直线附近,但后面的点会越来越偏离这条直线,因此y=c+dln x更适合作为y关于x的经验回归方程模型.
(2)因为w=ln x.所以y=c+dln x为y=c+dw,
===5.12,===2.6,
=≈3.26,=5.12-3.26×2.6≈-3.36,
所以=3.26w-3.36,即=3.26ln x-3.36.
(3)当x=e2时,=3.26ln e2-3.36=3.16.
所以大棚蔬菜亩产约为3.16千斤.
10.解 (1)经计算,=5,=0.48,
由0.48=5+0.88可得,=-0.08,
当x=8时,=-0.08×8+0.88=0.24,
所以当浇灌海水浓度为8‰时,该品种的亩产量约为0.24吨.
(2)①由(1)知=-0.08x+0.88,从而有
海水浓度xi(‰) 3 4 5 6 7
亩产量yi(吨) 0.62 0.58 0.49 0.4 0.31
残差 -0.02 0.02 0.01 0 -0.01
②R2=1-=1-=≈0.98,
所以亩产量的变化有98%是由海水浓度引起的.
11.AC [由散点图的变化趋势可知,销售额y与年份序号x呈正相关关系,故选项A正确;
由散点图以及线性回归模型和三次函数回归模型的位置关系可知,三次函数回归模型的残差平方和小于线性回归模型的残差平方和,故选项B错误;
因为0.999>0.936,所以三次函数回归曲线的拟合效果好于经验回归直线的拟合效果,故选项C正确;因为三次函数为y1=0.168x3+28.141x2-29.027x+6.889,
则当x=10时,y1=2 698.719(亿元),故选项D错误.]
12.ACD [对于选项A,因为经验回归直线一定经过点(,),故选项A正确;
对于选项B,由样本相关系数的绝对值越趋近于1,相关性越强可知,若两个变量负相关,其相关性越强,则样本相关系数r的值越接近于-1,故选项B错误;
对于选项C,因为在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故选项C正确;
对于选项D,因为在线性回归模型中,决定系数R2越接近于1,说明线性回归模型的拟合效果越好,故选项D正确.]
13.C [由题意得3=7-(2.27×4-1.08)=-1,
由于R2≈0.96,所以该回归模型拟合的效果比较好,故A,B错误;
在线性回归模型中,R2表示解释变量对于响应变量的贡献率,R2≈0.96,
则销售量y的多少有96%是由广告支出费用引起的,C正确,D错误.]
14.0.06
解析 因为=2x+1,
故当x=2时,=5,1=-0.1,
x=3,=7,2=0.1,
x=4,=9,3=0.2,
则++=0.01+0.01+0.04=0.06.
15.C [由题意知残差平方和(yi-i)2=120.55,
又R2=1-=0.95,所以(yi-)2
=2 411.]
16.解 (1)因为=3.2x-151.8,=84,所以=3.2×84-151.8=117,
114+116+106+122+132+114+m+132=117×8,
解得m=100,
8月份对应的残差值8=132-3.2×86.5+151.8=7.
(2)由已知公式得(yi-)2=0.22+0.62+1.82+(-3)2+(-1)2+(-4.6)2+(-1)2+72=84.8,
R2=1-=1-≈0.906 2>R,
所以=3.2x-151.8的拟合效果更好.
(3)由(1)可知,第八组数据的利润应为116(万元),
此时iyi=78 880-86.5×16=77 496,
又=56 528,=84,
=117-=115,
所以===2.7,
所以=115-2.7×84=-111.8,
所以重新采集数据后,经验回归方程为=2.7x-111.8.人教A版高中数学选择性必修三
8.2第1课时 一元线性回归模型及参数的最小二乘估计-同步练习
1.在线性回归模型Y=bx+a+e中,下列说法正确的是( )
A.Y=bx+a+e是一次函数
B.因变量Y是由自变量x唯一确定的
C.因变量Y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其经验回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
3.研究两个变量x,y的相关关系,得到了7个数据,作出其散点图如图所示,对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程=1x+1,样本相关系数为r1;方案二:剔除点3对应的数据,根据剩下的数据得到经验回归方程:=2x+2,样本相关系数为r2,则( )
A.1<0,2<0,-1B.1>0,2>0,-1C.1>0,2>0,0D.1>0,2>0,04.在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:
x 4 m 8 10 12
y 1 2 3 5 6
由表中数据求得y关于x的经验回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中与经验回归直线的竖直距离最近的点是( )
A.(4,1) B.(m,2)
C.(8,3) D.(4,1)和(m,2)
5.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知i=400,i=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )
A.99 B.101 C.103 D.105
6.(多选)设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是( )
A.直线l过点(,)
B.直线l过点(x1 012,y1 012)
C.x和y的样本相关系数在区间[-1,0)上
D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同
7.已知经验回归直线的斜率的估计值是1.23,且过定点(4,5),则经验回归方程是___________.
8.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为=0.8x+,则=________.
9.某单位为了了解用电量y(度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温的数据如表:
气温(℃) 14 12 8 6
用电量(度) 22 26 34 38
(1)求用电量y与气温x的经验回归方程;
(2)由(1)的方程预测气温为5 ℃时,用电量的度数.
10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的经验回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:经验回归方程=x+中,=,=-.
11.(多选)已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,n∈R),则( )
A.变量y与x正相关
B.m<3
C.n<4.5
D.经验回归直线=mx+n经过点(4,16.5)
12.(多选)湖北潜江素有“中国小龙虾之乡”之称,是我国小龙虾的主要产区.已知某种饲料的投放量x(单位:吨)与小龙虾的产量y(单位:吨)的统计数据如表:
投放量x(吨) 2 3 4 5 6
产量y(吨) 31 42 52 64 73
由表中的数据,得到经验回归方程为=10.6x+,则下列结论正确的是( )
A.=9
B.产量y与投放量x正相关
C.经验回归直线=10.6x+过点(4,52.4)
D.当x=8时,小龙虾产量的预测值是93.8
13.某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知经验回归方程为=6.3x+6.8,下列说法正确的是( )
x 2 3 4 5 6
y 19 25 ★ 40 44
A.看不清的数据★的值为33
B.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨
C.据此模型预测产量为8吨时,相应的生产能耗为50.9吨
D.经验回归直线=6.3x+6.8恰好经过点(4,★)
14.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x 1 2 3 4 5
命中率y 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为________,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为________.
15.已知x与y之间的几组数据如表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得经验回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的经验回归方程为=′x+′,则以下结论正确的是( )
A.>′,>′ B.>′,<′
C.<′,>′ D.<′,<′
16.改革开放以来,我国高等教育事业迅速发展,尤其是城市高中的本科录取率.现得到某城市从2016-2020年的本科录取成绩,为了便于计算,将2016年编号为1、2017年编号为2、…、2020年编号为5,如果将每年的本科录取率记作y%,把年份对应编号1到5作为自变量,记作x,得到如下数据:
年份 2016 2017 2018 2019 2020
自变量x 1 2 3 4 5
本科录取率y% 24.5% 27.5% 29% 31.5% 32.5%
(1)试建立y关于x的经验回归方程;
(2)已知该城市2021年本科录取率为35.5%,2022年本科录取率为37.4%.若|-y|≤0.5,则认为该经验回归方程精确度较高,试用2021和2022年的数据判断能否用该方程预测2023年该城市的本科录取率,若不能,请说明理由;若能,请预测2023年该城市的本科录取率.
参考公式:= = ,=-.
参考答案与详细解析
1.C [选项A,在线性回归模型Y=bx+a+e中,方程表示的不是函数关系,因此不是一次函数,故A错误;
选项B,因变量Y不是由自变量x唯一确定的,故B错误;
选项D,随机误差是不能避免的,只能将误差缩小,但是不能没有误差,故D错误,只有选项C成立.]
2.A [x的系数为负数,表示负相关,排除B,D;由实际意义可知x>0,y>0,显然C不满足.]
3.D [根据相关变量x,y的散点图知,变量x,y具有正线性相关关系,故1>0,2>0.方案一中,没剔除点3,线性相关性弱些;方案二中,剔除点3,线性相关性强些,故相关系数04.B [由表中的数据,得=×(4+m+8+10+12)=,=×(1+2+3+5+6)=3.4,
将代入经验回归方程,有3.4=0.65×-1.8,解得m=6.
所以当x=4时,=0.65×4-1.8=0.8,|1-0.8|=0.2;
当x=6时,=0.65×6-1.8=2.1,|2-2.1|
=0.1;
当x=8时,=0.65×8-1.8=3.4,|3-3.4|
=0.4.
综上,(4,1),(m,2),(8,3)三个样本点中,距离经验回归直线最近的点是(m,2).]
5.C [i=400,故==20;i=1 580,故==79,
故点(20,79)在经验回归直线上,即79=20-1,得=4,即=4x-1,
当x=26时,代入计算得到=103.]
6.AC [经验回归方程一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.]
7.=1.23x+0.08
解析 经验回归直线的斜率的估计值为1.23,
即=1.23,
又经验回归直线过定点(4,5),
∴=5-1.23×4=0.08,
∴=1.23x+0.08.
8.1
解析 因为==2,
==2.6,
所以2.6=0.8×2+,所以=1.
9.解 (1)由题意知,n=4,=10,=30,则
=
=
=-=-2,
=-=30-(-2)×10=50,
所以经验回归方程为=-2x+50.
(2)由(1)知,当x=5时,=-2×5+50=40,所以预测当气温是5 ℃时,用电量是40度.
10.解 (1)由题意知
n=10,=i==8,
=i==2,
又-102=720-10×82=80,
iyi-10 =184-10×8×2=24,
则==0.3,
=-=2-0.3×8=-0.4,
故所求经验回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
11.ABD [设A(2,11),B(6,22),由kAB=<3,
而8个数据点的经验回归方程中,=3,∴0而10个数据点的′==4,==16.5,∴经验回归直线过定点(4,16.5),则16.5=4m+n,n=16.5-4m,012.BC [由表可知,投放量x的均值==4,
小龙虾的产量y的均值==52.4,
所以经验回归直线恒过定点(4,52.4).故选项C正确;
代入经验回归方程=10.6x+,解得=10,故选项A错误;
经验回归方程为=10.6x+10,故选项B正确;
当x=8时,=10.6×8+10=94.8,故选项D错误.]
13.D [对于A,因为==4,
将=4代入=6.3x+6.8,
故=6.3×4+6.8=32,
∴★=32×5-(19+25+40+44)=32,故A错误;
对于B,回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,故B错误;
对于C,当x=8时,=6.3×8+6.8=57.2,故C错误;
对于D,因为=4,=32,故=6.3x+6.8必经过点(4,32),故D正确.]
14.0.5 0.53
解析 ===0.5,
==3.
由公式,得=0.01,
从而=-=0.5-0.01×3=0.47,
所以经验回归方程为=0.47+0.01x,
所以当x=6时,=0.47+0.01×6=0.53.
15.C [==,
==,
==,
=-=-,
′==2>,′=-2<.]
16.解 (1)由表中数据可以计算出=3,=29,
则=55,iyi=455,52=45,5 =435,
===2,=-=29-2×3=23,
故y关于x的经验回归方程为=2x+23.
(2)当x=6时,=35,|-y|=|35-35.5|≤0.5;
当x=7时,=37,|-y|=|37-37.4|≤0.5,
则该经验回归方程可用来预测2023年该城市的本科录取率,
当x=8时,=39,
故预测2023年该城市的本科录取率为39%.