中小学教育资源及组卷应用平台
8.2 一元线性回归模型及其应用 同步巩固练
2024-2025学年数学人教A版(2019) 选择性必修第三册
一、单选题
1.已知x与y之间的一组数据:
x 0 1 2 3
y 1 3 5 7
则y与x的线性回归方程为必过点 ( )
A.(2,2) B.(1.5,0)
C.(1.5,4) D.(1, 2)
2.已知变量x,y呈线性相关关系,回归方程为,且变量x,y的样本数据如下表所示
x -2 -1 0 1 2
y 5 4 m 2 1
据此计算出在时,预测值为-0.2,则m的值为( )
A.3 B.2.8 C.2 D.1
3.已知取表中的数值,若具有线性相关关系,线性回归方程为,则=( )
0 1 3 4
a 4.3 4.8 6.7
A.2.2 B.2.4 C.2.5 D.2.6
4.某公司一种型号的产品近期销售情况如表:
月份 2 3 4 5 6
销售额(万元) 15.1 16.3 17.0 17.2 18.4
根据上表可得到回归直线方程,据此估计,该公司7月份这种型号产品的销售额为( )
A.18.85万元 B.19.3万元 C.19.25万元 D.19.05万元
5.已知在特定的时期内某人在一个月内每天投入的体育锻炼时间(分钟)与一个月内减轻的体重(斤)的一组数据如表所示:
30 40 50 60 70
一个月内减轻的体重与每天投入的体育锻炼时间之间具有较强的线性相关关系,其线性回归直线方程是,据此模型估计当此人在一个月内每天投入的体育锻炼时间为90分钟时,该月内减轻的体重约为( )
A.斤 B.斤 C.斤 D.斤
6.对于一组具有线性相关关系的样本数据,其样本中心为,回归方程为,则相应于样本点的残差为( )
A. B.
C. D.
7.对两个变量和进行回归分析,得到一组样本数据:、、、,则下列说法中不正确的是( )
A.由样本数据得到的线性回归方程必过样本点的中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越好
D.若变量和之间的相关系数,则变量与之间具有线性相关关系
8.某校课外学习小组研究某作物种子的发芽率和温度(单位:)的关系,由实验数据得到如图所示的散点图.由此散点图判断,最适宜作为发芽率和温度的回归方程类型的是( )
A. B.
C. D.
9.用模型拟合一组数据时,设,将其变换后得到回归方程为,则( )
A. B.1 C. D.2
10.为研究每平方米平均建筑费用与楼层数的关系,某开发商收集了一栋住宅楼在建筑过程中,建筑费用的相关信息,将总楼层数与每平米平均建筑成本(单位:万元)的数据整理成如图所示的散点图:
则下面四个回归方程类型中最适宜作为每平米平均建筑费用和楼层数的回归方程类型的是( )
A. B.
C. D.
二、填空题
11.某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:
温度 4 8 10 18
微生物数量(个) 30 22 18 14
由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.
12.对具有线性相关关系的变量有一组观测数据(),其经验回归方程为,且,,则相应于点的残差为 .
13.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
建立的回归模型拟合效果最好的同学是 .
14.下列关于回归分析的说法正确的是 (填上所有正确说法的序号)
①相关系数越小,两个变量的相关程度越弱;
②残差平方和越大的模型,拟合效果越好;
③用相关指数来刻画回归效果时,越小,说明模型的拟合效果越好;
④用最小二乘法求回归直线方程,是寻求使取最小值时的、的值;
⑤在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高.
三、解答题
15.某种产品的广告费支出x(单位:万元)与销售额y(万元)之间有如下一组数据:
广告费支出x 2 4 5 6 8
销售额y 30 40 60 50 70
(1)求出样本点中心
(2)求回归直线方程(其中,)
16.大气污染物(直径不大于2.5的颗粒物)的浓度超过一定限度会影响人的身体健康.为研究浓度y(单位:)与汽车流量x(单位:千辆)的线性关系,研究人员选定了10个城市,在每个城市建立交通监测点,统计了24h内过往的汽车流量以及同时段空气中的浓度,得到如下数据:
城市编号 1 2 3 4 5 6 7 8 9 10 总和
x 1.300 1.444 0.786 1.652 1.756 1.754 1.200 1.500 1.200 0.908 13.5
y 66 76 21 170 156 120 72 120 100 129 1030
并计算得,,.
(1)求变量关于的线性回归方程;
(2)根据内浓度确定空气质量等级,浓度在0~35为优,35~75为良,75~115为轻度污染,115~150为中度污染,150~250为重度污染,已知某城市内过往的汽车流量为1360辆,判断该城市的空气质量等级.
参考公式:线性回归方程为,其中以.
17.已知与之间的数据如下表:
(1)求关于的线性回归方程;
(2)完成下面的残差表:
并判断(1)中线性回归方程的回归效果是否良好(若,则认为回归效果良好).
附:,,,.
18.在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长. 已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
年份(年) 2014 2015 2016 2017 2018 2019 2020 2021
年份代码x 1 2 3 4 5 6 7 8
保有量y/千辆 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
参考数据:,,其中
(1)根据统计表中的数据画出散点图(如图),请判断与哪一个更适合作为y关于x的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的经验回归方程:
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考公式:对于一组数据,v1),),…,,其经验回归直线的斜率和截距的最小二乘估计公式分别为,;
19.在政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据,如表所示:
单价 千元
销量 百件
(1)若变量,具有线性相关关系,求产品销量百件关于试销单价千元的线性回归方程;
(2)用(1)中所求的线性回归方程得到与对应的产品销量的估计值当销售数据对应的残差的绝对值时,则将销售数据称为一个“好数据”现从个销售数据中任取个,求“好数据”至少有个的概率.
参考数据:参考公式:线性回归方程中,的估计值分别为,
参考答案
题号 1 2 3 4 5 6 7 8 9 10
答案 C C A D A C C D D C
1.C
分别求出的均值即得.
由已知,,
所以回归直线一定过中心点.
故选:C.
2.C
由题意求出,即得回归直线方程,表示出样本中心点坐标,代入回归方程,即可求得答案.
由题意知回归方程为过点,则,
即;
又,,
由于回归方程为必过样本中心点,
故,
故选:C
3.A
根据线性回归方程经过样本中心,计算即可求解.
由题意可知:,,
所以样本中心为,
代入回归方程有:,解得.
故选:.
4.D
根据题意,由回归直线方程过样本点的中心,即可求得,然后代入计算,即可得到结果.
由表中数据可得,,
因为回归直线过样本点的中心,所以,解得,
所以回归直线方程为,
则该公司7月份这种型号产品的销售额为万元.
故选:D
5.A
先求出样本点中心,代入回归方程求出,再将代入计算即可.
由表中数据可得
,
,
将代入得,解得,
即,
则当时,.
故选:A.
6.C
根据残差的定义可得选项.
因为残差是实际观察值与估计值(拟合值)之间的差,所以相应于样本点的残差为,
故选:C.
7.C
根据回归直线过样本中心点可判断A选项;利用残差平方和与拟合效果的关系可判断B选项;利用相关指数与拟合效果的关系可判断C选项;利用相关系数与线性相关关系可判断D选项.
对于A选项,由样本数据得到的线性回归方程必过样本点的中心,A对;
对于B选项,残差平方和越小的模型,拟合的效果越好,B对;
对于C选项,用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越差,C错;
对于D选项,若变量和之间的相关系数,,则变量与之间具有线性相关关系,D对.
故选:C.
8.D
根据散点的分布可得出合适的回归方程类型.
由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢.
A中,是直线型,均匀增长,不符合要求;
B中,是二次函数型,图象呈现下凸,增长也较快,不符合要求;
C中,是指数型,爆炸式增长,增长快,不符合要求;
D中,是对数型,增长缓慢,符合要求.
故对数型最适宜该回归模型.
故选:D.
9.D
由两边取对数,与,利用待定系数法求解.
解:因为,,
所以,
又,
所以,解得,
所以,
故选:D
10.C
通过观察散点图并结合选项函数的类型得出结果.
观察散点图,可知是一个单调递减的曲线图,结合选项函数的类型可得回归方程类型是反比例类型,故C正确.
故选:C.
11.9
求出样本点中心,代入回归方程得到,得回归方程,可进行预测.
由表格数据可知,,,
因为点在直线上,所以,
即,故当时,,
即预测当温度为时,微生物数量为9个.
故答案为:9
12./
利用样本中心在其经验回归方程为上,求出,再计算当时的残差即可.
经验回归直线过样本点的中心,,,
经验回归方程为.当时,,残差为.
故答案为:.
13.选甲 相关指数R2越大,表示回归模型拟合效果越好.
相关指数越大,相关性越强,拟合效果越好.根据相关指数的大小即可判断.
相关指数 越大,相关性越强,回归模型拟合效果越好,所以效果最好的是甲.
如果两个变量间的关系是相关关系,相关指数 越大,相关系数 越接近1,残差平方和越接近0,都代表拟合效果越好.
14.④⑤
利用相关系数与两个变量的相关程度的关系可判断①;利用残差的定义可判断②;利用相关指数与模型的拟合效果之间的关系可判断③;利用最小二乘法的概念可判断④;利用残差图可判断⑤.
对于①,对于相关系数,越接近于,两个变量的相关程度越弱,①错;
对于②,残差平方和越小的模型,拟合效果越好,②错;
对于③,用相关指数来刻画回归效果时,越大,说明模型的拟合效果越好,③错;
对于④,用最小二乘法求回归直线方程,是寻求使取最小值时的、的值,④对;
对于⑤,在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,⑤对.
故答案为:④⑤.
15.(1)
(2)
(1)根据题意求,进而可得结果;
(2)根据题意先求,,代入公式运算求解即可.
(1)由题意可得:,
,
所以样本点中心为.
(2)由题意可得:,
,
所以,,
所以回归直线方程为.
16.(1)
(2)轻度污染
(1)根据公式,求线性回归方程;
(2)根据线性回归直线方程,预测空气中的浓度,进行判断.
(1)由题意得,
又因为,
所以
所以
所以变量y关于x的线性回归方程为.
(2)当辆千辆时,可得
因为
所以该城市的空气质量等级为轻度污染.
17.(1);(2)表格见解析,良好.
(1)由题意求出,,代入公式求值,从而得到回归直线方程;(2)根据公式计算并填写残差表;由公式计算相关指数,结合题意得出统计结论.
(1)由已知图表可得,,,,
则,,
故.
(2)∵,∴,,,,,则残差表如下表所示,
∵ ,
∴,
∴该线性回归方程的回归效果良好.
本题考查了线性回归直线方程与相关系数的应用问题,是中档题.
18.(1)作图见解析,选择的函数模型是,;
(2)2028年.
(1)根据题中所给公式,结合对数函数的性质进行求解即可;
(2)根据指数函数的性质,结合对数运算性质进行求解即可.
(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是,令,则
因为,
所以,,
,所以;
(2)设传统能源汽车保有量每年下降的百分比为r,依题意得,),解得,设从2021年底起经过x年后的传统能源汽车保有量为y千辆,则有x,设从2021年底起经过x年后新能源汽车的数量将超过传统能源汽车,则有
,所以,
解得,故从2021年底起经过7年后,即2028年底新能源汽车的数量将超过传统能源汽车.
19.(1);
(2).
(1)利用最小二乘法求出回归直线.
(2)根据回归直线分别计算出各个估计值,从而得到好数据的个数,利用古典概型求得结果.
(1)依题意,,,
而,于是,
,
所以所求线性回归方程为.
(2)利用(1)中所求的线性回归方程得:
当时,;当时,;
当时,;当时,;
当时,;当时,,
与销售数据对比知满足的共有个“好数据”:,
记个销售数据中的4个“好数据”分别为,另两个数据为,
从个销售数据中任取个的试验的样本空间:
,共15个样本点,
“好数据”至少有个的事件,其对立事件,
故,
所以“好数据”至少有个的概率为.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)