8.2一元线性回归模型及其应用练习题2020-2021学年高二数学人教A版(2019)选择性必修第三册第八章成对数据的统计分析

文档属性

名称 8.2一元线性回归模型及其应用练习题2020-2021学年高二数学人教A版(2019)选择性必修第三册第八章成对数据的统计分析
格式 doc
文件大小 661.0KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-03-10 16:55:49

图片预览

文档简介

一元线性回归模型及其应用
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
哪位同学建立的回归模型拟合效果最好(  )
A.甲 B.乙
C.丙 D.丁
2.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:
周数(x) 1 2 3 4 5
治愈人数(Y) 2 17 36 103 142
由表格可得Y关于x的非线性经验回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为(  )
A.5 B.-13 C.13 D.0
3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x/万元 8.2 8.6 10.0 11.3 11.9
支出Y/万元 6.2 7.5 8.0 8.5 9.8
根据上表可得经验回归方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元的家庭的年支出为(  )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
4.已知具有线性相关关系的变量x,Y满足一组数据如表所示.若Y关于x的经验回归方程为=3x-1.5,则m的值为(  )
x 0 1 2 3
Y -1 1 m 8
A.4 B. C.5 D.6
5.已知x与Y之间的几组数据如表:
x 1 2 3 4 5 6
Y 0 2 1 3 3 4
假设根据上表数据所得经验回归方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是(  )
A.>b′,>a′ B.>b′,C.a′ D.6.已知具有线性相关的变量x,y,设其样本点为Pi(xi,yi)(i=1,2,…,6),经验回归方程为=2x+,若++…+=(12,18)(O为坐标原点),则=________.?
7.已知n组成对样本数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两组成对样本数据(-1.7,2.9),(-2.3,5.1)误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为-1.5,则当x=-4时,=________.?
8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量Y(件) 90 84 83 80 75 68
(1)求经验回归方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
9.在一段时间内,某淘宝网店一种商品的销售价格x(元)和日销售量Y(件)之间的一组数据为:
价格x(元) 22 20 18 16 14
日销售量Y(件) 37 41 43 50 56
求出Y关于x的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:xiyi=3 992,=1 660.
扩展练习
1.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的经验回归方程,则需作变换t等于(  )
A.sin2α B.(sin α+1)2
C. D.以上都不对
2.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与预报变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为(  )
A.58 kg B.61 kg C.65 kg D.68 kg
3.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润Y的统计分析知x,Y具备线性相关关系,经验回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为______年.?
4.以模型y=cekx去拟合一组数据时,为了求出非经验回归方程,设z=ln y,其变换后得到经验回归方程=0.3x+4,则c=________.?
5.如表为收集到的一组数据:
x 21 23 25 27 29 32 35
Y 7 11 21 24 66 115 325
试建立Y与x之间的回归方程.
6.5 G网络是一种先进的高频传输技术,我国的5 G技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款5 G手机,现调查得到该款5 G手机上市时间x和市场占有率Y(单位:%)的几组相关对应数据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月,……,5代表2019年12月,根据数据得出Y关于x的经验回归方程为=0.042x-.若用此方程分析并预测该款手机市场占有率的变化趋势,则最早何时该款5 G手机市场占有率能超过0.5%(精确到月)(  )
A.2020年6月 B.2020年7月
C.2020年8月 D.2020年9月
参考答案
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
哪位同学建立的回归模型拟合效果最好(  )
A.甲 B.乙
C.丙 D.丁
分析:选A.相关指数R2越大,表示回归模型的效果越好.
2.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:
周数(x) 1 2 3 4 5
治愈人数(Y) 2 17 36 103 142
由表格可得Y关于x的非线性经验回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为(  )
A.5 B.-13 C.13 D.0
分析:选C.因为=(1+4+9+16+25)=11,=(2+17+36+103+142)=60,
所以a=60-6×11=-6,则Y关于x的非线性经验回归方程为=6x2-6.取x=4,得=6×42-6=90,
所以此回归模型第4周的预报值为90,
则此回归模型第4周的残差为103-90=13.
3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x/万元 8.2 8.6 10.0 11.3 11.9
支出Y/万元 6.2 7.5 8.0 8.5 9.8
根据上表可得经验回归方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元的家庭的年支出为(  )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
分析:选B.由题意可得=×(8.2+8.6+10.0+11.3+11.9)=10,
=×(6.2+7.5+8.0+8.5+9.8)=8,
所以=8-0.76×10=0.4,
所以线性经验回归方程为=0.76x+0.4,
把x=15代入,可得=0.76×15+0.4=11.8.
4.已知具有线性相关关系的变量x,Y满足一组数据如表所示.若Y关于x的经验回归方程为=3x-1.5,则m的值为(  )
x 0 1 2 3
Y -1 1 m 8
A.4 B. C.5 D.6
分析:选A.由题意可知,样本点的中心一定在回归直线上,所以代入方程可得m=4.
5.已知x与Y之间的几组数据如表:
x 1 2 3 4 5 6
Y 0 2 1 3 3 4
假设根据上表数据所得经验回归方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是(  )
A.>b′,>a′ B.>b′,C.a′ D.分析:选C.过(1,0)和(2,2)的直线方程为y′=2x-2,画出六点的散点图,回归直线的大概位置如图所示,
显然,b′>,>a′.
6.已知具有线性相关的变量x,y,设其样本点为Pi(xi,yi)(i=1,2,…,6),经验回归方程为=2x+,若++…+=(12,18)(O为坐标原点),则=________.?
分析:由题意可得,=(x1+x2+x3+x4+x5+x6)==2,=(y1+y2+…+y6)==3.
经验回归方程为=2x+,所以3=2×2+,
解得=-1.
答案:-1
7.已知n组成对样本数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两组成对样本数据(-1.7,2.9),(-2.3,5.1)误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为-1.5,则当x=-4时,=________.?
分析:由样本数据点集{(xi,yi)|i=1,2,…,n}求得的经验回归方程为=-x+2,且=4,所以=-2,
故数据的样本中心点为(-2,4),
去掉(-1.7,2.9),(-2.3,5.1),
重新求得的经验回归直线的斜率估计值为-1.5,
经验回归方程设为:=-1.5x+,代入(-2,4),求得=1,
所以经验回归直线的方程为:y=-1.5x+1,
将x=-4代入经验回归方程,求得y的估计值为-1.5×(-4)+1=7.
答案:7
8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量Y(件) 90 84 83 80 75 68
(1)求经验回归方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
分析:(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.
=×(90+84+83+80+75+68)=80.
=+20=80+20×8.5=250,
所以经验回归方程为=-20x+250.
(2)工厂获得的利润z=(x-4)y=-20x2+330x-1 000,由二次函数知识可知当x=时,zmax=361.25(元).
故该产品的单价应定为8.25元.
9.在一段时间内,某淘宝网店一种商品的销售价格x(元)和日销售量Y(件)之间的一组数据为:
价格x(元) 22 20 18 16 14
日销售量Y(件) 37 41 43 50 56
求出Y关于x的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:xiyi=3 992,=1 660.
分析:作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.
因为==18,
==45.4.
所以==-2.35,
=45.4-(-2.35)×18=87.7.
所以经验回归方程为=-2.35x+87.7.
yi-i与yi-的值如表:
yi-i 1 0.3 -2.4 -0.1 1.2
yi- -8.4 -4.4 -2.4 4.6 10.6
计算得(yi-i)2=8.3,(yi-)2=229.2,
所以R2=1-≈0.964.
因为0.964很接近于1,
所以该模型的拟合效果比较好.
扩展练习
1.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的经验回归方程,则需作变换t等于(  )
A.sin2α B.(sin α+1)2
C. D.以上都不对
分析:选B.因为y是关于t的经验回归方程,实际上就是y是关于t的一次函数,
又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.
2.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与预报变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为(  )
A.58 kg B.61 kg C.65 kg D.68 kg
分析:选B.由于体重是隔代遗传,且呈线性相关,
则取数据(58,58),(64,62),(58,60),
得==60,==60,
即样本点的中心为(60,60),代入=x+,
得=60-0.5×60=30,则=0.5x+30,
取x=62,可得=0.5×62+30=61 kg.
故预测他的孙子的体重约为61 kg.
3.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润Y的统计分析知x,Y具备线性相关关系,经验回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为______年.?
分析:当年利润小于或等于零时应该报废该机器,
当y=0时,令10.47-1.3x=0,解得x≈8,
故估计该台机器最为划算的使用年限为8年.
答案:8
4.以模型y=cekx去拟合一组数据时,为了求出非经验回归方程,设z=ln y,其变换后得到经验回归方程=0.3x+4,则c=________.?
分析:由题意,得ln(cekx)=0.3x+4,
所以ln c+kx=0.3x+4,
所以ln c=4,所以c=e4.
答案:e4
5.如表为收集到的一组数据:
x 21 23 25 27 29 32 35
Y 7 11 21 24 66 115 325
试建立Y与x之间的回归方程.
分析:作出散点图,如图.
从散点图中可以看出x与Y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线的周围.
令Z=ln Y,则变换后的样本点分布在直线=x+的周围,这样就可以利用线性经验回归模型来建立非线性经验回归方程了,数据可以转化为:
x 21 23 25 27 29 32 35
Z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
求得经验回归方程为=0.272x-3.849,
所以=e0.272x-3.849.
6.5 G网络是一种先进的高频传输技术,我国的5 G技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款5 G手机,现调查得到该款5 G手机上市时间x和市场占有率Y(单位:%)的几组相关对应数据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月,……,5代表2019年12月,根据数据得出Y关于x的经验回归方程为=0.042x-.若用此方程分析并预测该款手机市场占有率的变化趋势,则最早何时该款5 G手机市场占有率能超过0.5%(精确到月)(  )
A.2020年6月 B.2020年7月
C.2020年8月 D.2020年9月
分析:选C.根据表中数据,得==3,
=(0.02+0.05+0.1+0.15+0.18)=0.1,
所以0.1=0.042×3-,=0.026,
所以经验回归方程为y=0.042x-0.026,
由0.042x-0.026>0.5,得x≥13,
预计上市13个月时,即最早在2020年8月,市场占有率能超过0.5%.