《第二节 一元线性回归模型及其应用》同步练习
参考公式:对于经验回归方程x+, ,
样本相关系数r= ,
决定系数R2=1-.
一、基础巩固
知识点1 经验回归方程
1.下列四个残差图对应的一元线性回归模型的拟合效果最好的是( )
2.[2022海南高二下学业水平诊断]某植物研究所收集了某种树的高h(单位:m)与胸径d(树的主干在地面以上1.3 m处的直径,单位:cm)的一些数据,并求得=20,=20,h与d之间的经验回归方程为=ad+15.若某棵这种树的主干在地面以上1.3 m处的横截面周长为40π cm(将横截面看作圆),则估计这棵树的高为( )
A.15 m B.20 m C.25 m D.27 m
3.[2022北京朝阳区高二下质检]已知一组样本数据(x1,y1),(x2,y2),…,(xn,yn),根据这组数据的散点图分析知x与y之间具有线性相关关系,若求得其经验回归方程为=0.85x-85.7,则在样本点(165,57)处的残差为( )
A.-2.45 B.2.45 C.3.45 D.54.55
4.(多选)[2023辽宁丹东高三上阶段检测]某直播带货平台统计了2022年连续5个月该平台的手机销量,得到如下数据统计表:
月份 5月 6月 7月 8月 9月
月份编号x 1 2 3 4 5
月销售量y/部 52 95 m 185 227
已知y与x线性相关,由表中数据计算得y关于x的经验回归方程为=8+44x,则( )
A.m=138
B.月销售量y与月份编号x正相关
C.该平台手机销售量平均每月增加44部
D.该平台11月份手机销售量为316部
5.(多选)已知变量x和y的取值如下表所示,且2.5x 2 3 4 5
y 6.5 m n 2.5
A.=-1.4x+9.4 B.=-2x+14.2
C.=1.5x+8.8 D.=-1.6x+10.6
6.[2022四川省南充高级中学高三上月考]为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生对其成绩进行统计并获得散点图,发现x与y之间有线性相关关系,设其经验回归方程为x+.已知xi=400,yi=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为 .
7.[2022江西抚州高二上期末]为保护生态环境,某地区提倡环保出行,从2016年开始大力提倡新能源汽车,每年抽取1 000辆汽车调查,得到新能源汽车辆数y与年份代码x的数据如下表:
年份 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5
新能源汽车辆数y 30 50 70 100 110
(1)建立y关于x的经验回归方程;
(2)假设该地区2023年共有30万辆汽车,用样本估计总体,预测该地区2023年有多少辆新能源汽车
8.[2022江苏南京一中高三上阶段检测]某网络电视剧已开播一段时间,其每日播放量统计如下:
开播天数x 1 2 3 4 5
当天播放量y/百万次 3 3 5 9 10
(1)请用经验回归模型拟合y与x的关系,并用样本相关系数加以说明.
(2)假设开播后的两周内(除前5天),当天播放量y与开播天数x符合(1)中的经验回归模型.若每百万次播放量可为制作方带来0.7万元的收益,且每开播一天需支出1万元的广告费,估计制作方在该剧开播两周内获得的利润.
附:①一般地,样本相关系数r的绝对值在0.95以上(含0.95)认为线性相关程度较强;否则,线性相关程度较弱.
②利润=收益-广告费.
知识点2 非线性经验回归方程
9.每天,随着清晨第一缕阳光升起,北京天安门广场都会举行庄严肃穆的升旗仪式,每天升国旗的时间随着日出时间的改变而改变.下表给出了2020年1月至12月,每个月第一天北京天安门广场举行升旗礼的时间:
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
7:36 7:23 6:48 5:59 5:15 4:48 4:49 5:12 5:41 6:10 6:42 7:16
若据此以月份x为横轴、时间y为纵轴,画出散点图,并用曲线去拟合这些数据,则适合模拟的函数模型是( )
A.y=ax2+bx+c(a≠0)
B.y=kax(k≠0,a>0且a≠1)
C.y=Asin(ωx+φ)+b(A,ω≠0)
D.y=klogax(k≠0,a>0且a≠1)
10.[2022河南郑州高二下期末]用模型y=menx+2(m>0)拟合一组数据时,设z=ln y,将其变换后得到经验回归方程=3x+2,则n-m=( )
A.-1 B.1 C.-2 D.2
11.[2022江苏省响水中学高二下期中]已知变量y关于变量x的回归方程为=bln x+0.24,其一组数据如下表所示:
x e e3 e4 e6 e7
y 1 2 3 4 5
若x=e10,则y的值大约为( )
A.4.94 B.5.74 C.6.81 D.8.04
12.由样本数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)得到非线性经验回归方程x2+m,已知数据:xi=12,yi=22,=27,则实数m的值为 .
13.[2022福建三明教研联盟校高二下期中]某景区的各景点从2011年取消门票实行免费开放后,旅游人数不断增加,不仅带动了该市淡季的旅游业,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”的结构快速转变.从2011年至2020年,该景区的旅游人数y(万人)与年份编号x的散点图如下:
该景区为了预测2023年的旅游人数,建立了y与x的两个回归模型:
模型①:由最小二乘法公式求得y与x的经验回归方程=50.8x+169.7;
模型②:由散点图的样本点分布,认为样本点集中在曲线y=aebx的附近.
参考数据:e5.45≈233,e1.43≈4.2,ui=ln yi,=5.5,=449,≈6.05,≈83,(xi-)(yi-)≈4 195,(xi-)(ui-)≈9.00.
经验回归方程 ①=50.8x+169.7 ②=aebx
(yi-)2 30 407 14 607
(1)求模型②的非线性经验回归方程=aebx(a精确到个位,b精确到0.01);
(2)比较两种模型的决定系数R2,并选择拟合精度更高、更可靠的模型,预测2023年该景区的旅游人数(精确到万人).
二、能力提升
1.[2022湖北宜昌二中月考]根据如下样本数据,得到经验回归方程为=nx+m,若样本点的中心(,)为(5,0.9),则当x每增加1个单位时,y平均( )
x 3 4 5 6 7
y 4.0 m-5.4 -0.5 0.5 n-0.6
A.增加1.4个单位 B.减少1.4个单位
C.增加7.9个单位 D.减少7.9个单位
2.已知由样本数据(xi,yi)(i=1,2,…,n)求得的回归直线l1的方程为=1.5x+0.5,且=3,现发现两个数据点(0.9,2.4)和(5.1,7.6)的误差较大,去除后求得的回归直线l2的斜率为1.2,则当x=2时,由l2的方程可得y的估计值为( )
A.2.9 B.3.5 C.3.8 D.4.1
3.某企业生产一种新产品,其每件产品的非物料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,经统计得到下列一组数据:
x 1 2 3 4 5 6 7 8
y 112 61 44.5 35 30.5 28 25 24
观察其散点图可知,y=a+适宜作为每件产品的非物料成本y与产量x的回归模型.若每件产品的成本=物料成本+非物料成本,其中每件产品的物料成本固定为48元.根据经验回归方程预测:若要使每件产品的总成本不高于68.55元,则最少应生产这种产品约( )
uiyi
183.4 0.34 1.53 0.116
参考公式与数据如下(其中u=):
A.8.246千件 B.9.282千件
C.10.133千件 D.11.266千件
4.(多选)[2022福建莆田高二下质量监测]为预测某电子商务平台2022年的销售额(单位:亿元),建立了年销售额y与年份代码x的两个回归模型,根据该平台2012年至2021年的数据(年份代码x的值依次为1,2,…,10)作出散点图(如图),建立模型①y=493x+a和模型②y=7x3-60x2+400x-205,则下列说法正确的是( )
A.模型②更适合作为回归模型
B.年销售额y与年份代码x正相关
C.根据模型②计算得,当x=11时,=6 252,可预测该平台2022年的年销售额为6 252亿元
D.若该平台2012年至2021年间年销售额的平均值为1 845亿元,则a=-620
5.[2022广西桂林高二质检]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下表中数据,求得经验回归方程为=-20x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为 .
单价x/元 8 8.2 8.4 8.6 8.8 9
销量y/件 90 84 83 80 75 68
6.[2022湖南长沙市一中高二期末]某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店的个数x及单店日平均营业额y(万元)的数据如下:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根据上表可得y与x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为 .
7.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x和月销售量y之间的一组数据如表所示:
月份 7 8 9 10 11 12
销售单价x/元 9 9.5 10 10.5 11 8
月销售量y/件 11 10 8 6 5 14
(1)根据7月份至11月份的数据,求出y关于x的经验回归方程.
参考数据:xiyi=392,=502.5.
(2)若由经验回归方程得到的估计数据与剩下的检验数据的误差不超过0.5,则认为所得到的经验回归方程是理想的.试依据12月份的数据判断(1)中所得到的经验回归方程是否理想.
(3)预计在今后的销售中,月销售量y与销售单价x仍然服从(1)中的关系,若该种机械配件的成本是2.5元/件,则该配件的销售单价应定为多少元,才能获得最大月利润 (注:利润=销售收入-成本)
8.[2022安徽省怀宁中学高二下月考]化肥的施用对粮食增产增收起到了重要作用,研究粮食产量与化肥施用量的关系是做到合理施用化肥,使其最大程度地促进粮食增产的前提.某研究团队收集了10组某作物亩化肥施用量和亩产量的数据(xi,yi),i=1,2,3,…,10,其中xi(单位:千克)表示亩化肥施用量,yi(单位:百千克)表示该作物亩产量.通过分析这10组数据,发现当亩化肥施用量在合理范围内变化时,可用函数y=cxd来模拟该作物亩产量y与亩化肥施用量x之间的关系.
(1)求y关于x的非线性经验回归方程.
参考数据:
tizi ti zi
38.5 15 17.5 47
表中ti=ln xi,zi=ln yi,i=1,2,3,…,10.
(2)实际生产中,在其他生产条件相同的条件下,出现了亩施肥量为30千克时,该作物亩产量仅约为510千克的情况,请给出解释.
(3)经试验统计可知,该研究团队的投资效益(投资效益=产出与投入比)ξ~N(4,1),政府对该研究团队的奖励方案如下:若ξ<3,则不予奖励;若3≤ξ≤6,则奖励10万元;若ξ>6,则奖励30万元.求政府对该研究团队的奖励金额的数学期望.
附:①ln 15≈2.7,ln 30≈3.4;
②若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
参考答案
一、基础巩固
1.A 残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域中,说明选用的模型比较合适,选A.
2.C 将=20,=20代入=ad+15,可得a=0.25.又由πd=40π,可知这棵树的胸径d=40,所以=0.25×40+15=25,即估计这棵树的高为25 m.
3.B x=165时,=0.85×165-85.7=54.55,所以在样本点(165,57)处的残差为57-54.55=2.45.
4.BC
5.AD 因为2.56.103
7.(1)=3,×(30+50+70+100+110)=72,xiyi=1×30+2×50+3×70+4×100+5×110
=1 290,
=21,
因为,所以=72-21×3=9,
所以=21x+9.
(2)当x=8时,=21×8+9=177,故预测2023年该地区共有新能源汽车300 000×=53 100(辆).
8.(1)由题得(1+2+3+4+5)=3,(3+3+5+9+10)=6,所以=2,
所以=6-2×3=0,
所以经验回归方程为=2x.
样本相关系数r=≈≈0.952>0.95,
所以y与x的线性相关程度较强,可用线性经验回归模型拟合y与x的关系.
(2)设利润为p万元,则p=[+2×(6+7+8+9+10+11+12+13+14)]×0.7-14=133,
故估计制作方在该剧开播两周内获得的利润为133万元.
9.C 如图,画出散点图,则根据散点图可知,可用正弦型曲线拟合这些数据,故选C.
10.D 对y=menx+2(m>0)两边取对数得,ln y=nx+2+ln m,即z=nx+2+ln m.又=3x+2,所以解得所以n-m=2.
11.C 由=bln x+0.24,令t=ln x,则=bt+0.24.由题意,(1+3+4+6+7)=4.2,(1+2+3+4+5)=3,所以3=b×4.2+0.24,解得b=,所以ln x+0.24.当x=e10时,≈6.81.
12.-
13.(1)对y=aebx等式两边取对数,得ln y=bx+ln a,设u=ln y,c=ln a,则u=bx+c,先建立u关于x的经验回归方程x+.
≈≈0.11,
≈6.05-0.11×5.5≈5.45,
所以=0.11x+5.45,
所以模型②的非线性经验回归方程为=233e0.11x.
(2)由题中的数据,有30 407>14 607,
即,即1-<1-,
所以,说明回归模型②的拟合效果更好.
2023年时,x=13,此时=233e0.11×13=233e1.43≈233×4.2≈979,
故预测2023年该景区的旅游人数为979万人.
二、能力提升
1.B 由样本点的中心(,)为(5,0.9),得=0.9,故m+n=6.5,且0.9=5n+m,解得n=-1.4,m=7.9,则=-1.4x+7.9,可知当x每增加1个单位时,y平均减少1.4个单位.
2.C 因为回归直线l1的方程为=1.5x+0.5,且=3,所以=1.5×3+0.5=5,所以这组数据的样本中心点是(3,5),又=3,=5,所以去除数据点(0.9,2.4)和(5.1,7.6)后数据的样本中心点还是(3,5),又回归直线l2的斜率为1.2,所以5=1.2×3+,解得=1.4,即回归直线l2的方程为=1.2x+1.4,当x=2时,=1.2×2+1.4=3.8,故选C.
3.C 非物料成本y关于u的经验回归方程为u.由条件可得=45,于是≈101.33,≈10.55,所以=10.55+101.33u,即y关于x的非线性经验回归方程为=10.55+.由10.55++48≤68.55,可得x≥10.133,所以至少生产该产品约10.133千件.故选C.
4.ABC
5.
6.5,6,7
7.(1)因为(9+9.5+10+10.5+11)=10, (11+10+8+6+5)=8,
所以=-3.2,
则=8-(-3.2)×10=40,
所以y关于x的经验回归方程为=-3.2x+40.
(2)当x=8时,=-3.2×8+40=14.4,
则|-y|=14.4-14=0.4<0.5,
所以可以认为所得到的经验回归方程是理想的.
(3)设月销售利润为W,则W=(x-2.5)(-3.2x+40)=-3.2x2+48x-100=-3.2(x-7.5)2+80,
所以当x=7.5时,W取最大值.
所以该配件的销售单价定为7.5元时,获得的月利润最大.
8.(1)对y=cxd两边取对数得ln y=ln c+dln x,即z=ln c+dt,由表中数据得ti==1.5,zi==1.75,=0.5,所以ln =1.75-0.5×1.5=1,
所以=1+0.5t,即ln =1+0.5ln x,
所以y关于x的非线性经验回归方程为=e.
(2)由(1)得,当x=30时,ln =1+≈2.7,所以≈15,所以当亩化肥施用量为30千克时,估计该作物亩产量应约为1 500千克.
而实际亩产量仅约为510千克的情况,可能是因为施肥过量,导致作物有部分被烧坏,从而导致产量下降.
(3)因为μ-σ=3,μ+2σ=6,所以P(3≤ξ≤6)=P(μ-σ≤ξ≤μ+2σ)≈0.682 7+=0.818 6,P(ξ>6)=P(ξ>μ+2σ)≈=
0.022 75,设政府对该研究团队的奖励金额为η,则E(η)=100 000×0.818 6+300 000×0.022 75=88 685(元).