专题8.4 一元线性回归模型及其应用(重难点题型检测)
【人教A版2019】
考试时间:60分钟;满分:100分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共22题,单选8题,多选4题,填空4题,解答6题,满分100分,限时60分钟,本卷题型针对性较高,覆盖面广,选题有深度,可衡量学生掌握本节内容的具体情况!
一.选择题(共8小题,满分24分,每小题3分)
1.(3分)(2022·天津津南·天津市模拟预测)对两个变量和进行回归分析,得到一组样本数据:、、、,则下列说法中不正确的是( )
A.由样本数据得到的线性回归方程必过样本点的中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越好
D.若变量和之间的相关系数,则变量与之间具有线性相关关系
2.(3分)(2023春·河南·高三阶段练习)经济学专业的学生们为研究流通费率y和销售额x(单位:千万元)的关系,对同类型10家企业的相关数据()进行整理,并得到如下散点图:
由此散点图,在2千万元至1亿元之间,下面四个回归方程类型中最适宜作为流通费率y和销售额x的回归方程类型的是( )
A. B.
C. D.
3.(3分)(2023春·湖南长沙·高三阶段练习)据一组样本数据,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.1,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.1
4.(3分)(2023·吉林通化·校考一模)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:
苗木长度x(cm) 38 48 58 68 78 88
售价y(元) 16.8 18.8 20.8 22.8 24 25.8
若苗木长度x(cm)与售价y(元)之间存在线性相关关系,其回归方程为,则当售价大约为38.9元时,苗木长度大约为( )
A.148cm B.150cm C.152cm D.154cm
5.(3分)(2022春·河南郑州·高二阶段练习)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份) 1 2 3 4 5
y(万盒) 5 6 5 6 8
若x,y线性相关,线性回归方程为,则以下判断正确的是( )A.x增加1个单位长度,则y一定增加0.7个单位长度
B.x减少1个单位长度,则y必减少0.7个单位长度
C.当时,y的预测值为8.1万盒
D.线性回归直线,经过点
6.(3分)(2023·河南·高三阶段练习)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月 1 2 3
繁殖数量
A.百只 B.百只 C.百只 D.百只
7.(3分)(2022春·湖南益阳·高二期末)设两个相关变量和分别满足,,,2,…,6,若相关变量和可拟合为非线性回归方程,则当时,的估计值为( )
A.32 B.63 C.64 D.128
8.(3分)(2022·高二单元测试)某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
营养成分含量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )
A. B.
C. D.
二.多选题(共4小题,满分16分,每小题4分)
9.(4分)(2022秋·山东东营·高三阶段练习)已知变量与具有线性相关关系,统计得到6组数据如下表:
2 4 7 10 15 22
8.1 9.4 12 14.4 18.5 24
若关于的线性回归方程为,则( )
A.变量与之间正相关 B.
C. D.当时,的估计值为15.6
10.(4分)(2023秋·江苏无锡·高三期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
11.(4分)(2023·全国·高三专题练习)自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到海拔6千米~15千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为 ,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程可知,海拔每升高1千米,大气压强必定降低4.0kPa
C.由方程可知,样本点的残差为
D.对比两个回归模型,结合实际情况,方程的预报效果更好
12.(4分)(2023·重庆渝中·高三阶段练习)小明在家独自用下表分析高三前5次月考中数学的班级排名y与考试次数x的相关性时,忘记了第二次和第四次月考排名,但小明记得平均排名,于是分别用m=6和m=8得到了两条回归直线方程:,,对应的相关系数分别为、,排名y对应的方差分别为、,则下列结论正确的是( )
x 1 2 3 4 5
y 10 m 6 n 2
(附:,)
A. B. C. D.
三.填空题(共4小题,满分16分,每小题4分)
13.(4分)(2022春·黑龙江齐齐哈尔·高二期末)变量X与Y相对应的5组数据和变量U与V相对应的5组数据统计如表:
X 10 11.3 11.8 12.5 13
Y 1 2 3 4 5
U 10 11.3 11.8 12.5 13
V 5 4 3 2 1
用b1表示变量Y与X之间的回归系数,b2表示变量V与U之间的回归系数,则b1与b2的大小关系是 .
14.(4分)(2023·全国·模拟预测)某农业科研所在5块面积相同的长方形试验田中均种植了同-一种农作物,每一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系:
施肥量x/kg 20 40 50 60 80
产量y/kg 600 800 1200 1000 1400
已知y与x满足线性回归方程,则当施肥量为80kg时,残差为 .
15.(4分)(2022·高二课时练习)年初以来, 技术在我国已经进入高速发展的阶段, 手机的销量也逐渐上升,某手机商城统计了近个月来 手机的实际销量,如下表所示:
月份 年月 年月 年月 年月 年月
月份编号
销量/千部
若与线性相关,且求得线性回归方程为,则下列说法:
;②与正相关;③与的相关系数为负数;④月份该手机商城的 手机销量约为万部.
其中正确的是 .(把正确的序号填在横线上)
16.(4分)(2023·高二单元测试)在新冠疫情政策改变后,某社区统计了核酸检测为阳性的人数,用表示天数,表示每天核酸检测为阳性的人数,统计数据如下表所示:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据散点图判断,核酸检测为阳性的人数关于天数的回归方程适合用来表示,则其回归方程为
.
参考数据:设,,,
参考公式:对于一组数据,,….其回归直线的斜率和截距的最小二乘估计公式分别为:,.
四.解答题(共6小题,满分44分)
17.(6分)(2022春·山东·高二阶段练习)某大学一男生统计了本宿舍7名舍友的体重y(单位:kg)与身高x(单位:cm)的数据,见下表:
姓名 吕聪 梁力 李泽文 张天哲 王硕 武勇 商宝清
身高 161 175 169 178 173 168 180
体重 52 62 54 70 66 57 73
(1)若根据表中数据计算得到y关于x的线性回归方程为,求;
(2)为判断(1)中回归方程的拟合效果,请求出相关指数的值(保留两位小数).
参考公式及数据:,.
18.(6分)(2023·四川南充·四川省模拟预测)南中数学教研室对高二学生的记忆力 和判断力进行统计分析, 所得数据如下表所示:
x 6 8 10 12
y 2 3 5 6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据, 用最小二乘法求出 关于的线性回归方程
(3)根据 (2) 中求出的线性回归方程, 预测记忆力为 11 的学生的判断力.
(参考公式:)
19.(8分)(2022春·陕西西安·高二期中)2021年2月25日,在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告“经过全党全国各族人民共同努力,在迎来中国共产党成立一百周年的重要时刻,我国脱贫攻坚战取得了全面胜利,……,完成了消除绝对贫困的艰巨任务.”从已经脱贫的家庭中随机抽取10个家庭,获得第个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得,,,.(是求和符号)
(1)求家庭的月储蓄对月收入的线性回归方程.
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附.线性回归方程中,,,其中,为样本平均值,线性回归方程也可写为.
20.(8分)(2023秋·四川绵阳·高二期末)如图是某采矿厂的污水排放量(单位:吨)与矿产品年产量(单位:吨)的折线图:
(1)依据折线图计算,的相关系数,并据此判断是否可用线性回归模型拟合与的关系 (若,则线性相关程度很高,可用线性回归模型拟合)
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为20吨时的污水排放量.
相关公式:
回归方程中,,.
21.(8分)(2023·全国·高三专题练习)为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:
x 5 10 15 20 25 30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求回归直线方程;
(2)求出R2并说明回归模型拟合的程度;
(3)进行残差分析.
22.(8分)(2022春·全国·高三专题练习)某企业为确定下一年度投入某种产品的生产所需的资金,需了解每投入2千万资金后,工人人数(单位:百人)对年产能(单位:千万元)的影响,对投入的人力和年产能的数据作了初步处理,得到散点图和统计量表.
(1)根据散点图判断:与哪一个适宜作为年产能关于投入的人力的回归方程类型?并说明理由?
(2)根据(1)的判断结果及相关的计算数据,建立关于的回归方程;
(3)现该企业共有2000名生产工人,资金非常充足,为了使得年产能达到最大值,则下一年度共需投入多少资金(单位:千万元)?
附注:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,(说明:的导函数为)专题8.4 一元线性回归模型及其应用(重难点题型检测)
参考答案与试题解析
一.选择题(共8小题,满分24分,每小题3分)
1.(3分)(2022·天津津南·天津市模拟预测)对两个变量和进行回归分析,得到一组样本数据:、、、,则下列说法中不正确的是( )
A.由样本数据得到的线性回归方程必过样本点的中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越好
D.若变量和之间的相关系数,则变量与之间具有线性相关关系
【解题思路】根据回归直线过样本中心点可判断A选项;利用残差平方和与拟合效果的关系可判断B选项;利用相关指数与拟合效果的关系可判断C选项;利用相关系数与线性相关关系可判断D选项.
【解答过程】对于A选项,由样本数据得到的线性回归方程必过样本点的中心,A对;
对于B选项,残差平方和越小的模型,拟合的效果越好,B对;
对于C选项,用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越差,C错;
对于D选项,若变量和之间的相关系数,,则变量与之间具有线性相关关系,D对.
故选:C.
2.(3分)(2023春·河南·高三阶段练习)经济学专业的学生们为研究流通费率y和销售额x(单位:千万元)的关系,对同类型10家企业的相关数据()进行整理,并得到如下散点图:
由此散点图,在2千万元至1亿元之间,下面四个回归方程类型中最适宜作为流通费率y和销售额x的回归方程类型的是( )
A. B.
C. D.
【解题思路】根据散点图的变化趋势,分析各选项中方程表示的曲线的特点,看是否合乎题意,即可得答案.
【解答过程】根据散点图,可以知道各点基本上是沿着一条具有递减趋势的曲线分布,并且变化趋势较平缓,
A中表示直线,变化趋势是定的,不合题意;
B中表示的曲线既有上升又有下降部分,不合题意;
C中表示的曲线不论是上升还是下降,都将比较快,曲线较“陡峭”,不合题意,
D中表示的曲线不论是上升还是下降,都将比较平缓,合乎题意,
故选:D.
3.(3分)(2023春·湖南长沙·高三阶段练习)据一组样本数据,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.1,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.1
【解题思路】根据直线的斜率大小判断A;求出判断B;再求出经验回归方程判断C;计算残差判断D作答.
【解答过程】对于A,因为去除两个误差较大的样本点后,经验回归直线的斜率变小,则的估计值增加速度变慢,A错误;
对于B,由及得:,因为去除的两个样本点和,
并且,因此去除两个样本点后,样本的中心点仍为,
因此重新求得的回归方程对应直线一定过点,B错误;
对于C,设去除后重新求得的经验回归直线的方程为,由选项B知,,解得,
所以重新求得的回归方程为,C正确;
对于D,由选项C知,,当时,,则,
因此去除两个误差较大的样本点后,相应于样本点的残差为,D错误.
故选:C.
4.(3分)(2023·吉林通化·校考一模)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:
苗木长度x(cm) 38 48 58 68 78 88
售价y(元) 16.8 18.8 20.8 22.8 24 25.8
若苗木长度x(cm)与售价y(元)之间存在线性相关关系,其回归方程为,则当售价大约为38.9元时,苗木长度大约为( )
A.148cm B.150cm C.152cm D.154cm
【解题思路】根据表格中的数据求出样本点中心,根据回归直线经过样本点中心求出,再将代入回归方程可求出结果.
【解答过程】因为 ,
,
所以样本点中心为,
又回归直线经过,
所以,所以,
所以回归方程为,
当元时,厘米.
则当售价大约为元时,苗木长度大约为150厘米.
故选:B.
5.(3分)(2022春·河南郑州·高二阶段练习)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份) 1 2 3 4 5
y(万盒) 5 6 5 6 8
若x,y线性相关,线性回归方程为,则以下判断正确的是( )A.x增加1个单位长度,则y一定增加0.7个单位长度
B.x减少1个单位长度,则y必减少0.7个单位长度
C.当时,y的预测值为8.1万盒
D.线性回归直线,经过点
【解题思路】首先求得平均数,代入求得回归直线方程,再对选项再对选项逐一判断,即可得出结果.
【解答过程】,,
代入线性回归方程中得,,
故线性回归方程为,
对于A:回归直线方程是点分布在直线附近或在直线上,x增加1个单位长度,则y可能增加0.7个单位长度,A错误;
对于B:回归直线方程是点分布在直线附近或在直线上,x减少1个单位长度,则y可能减少0.7个单位长度,B错误;
对于C:当时,,故C正确;
对于D:线性回归直线必经过点,故D错误.
故选:C.
6.(3分)(2023·河南·高三阶段练习)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月 1 2 3
繁殖数量
A.百只 B.百只 C.百只 D.百只
【解题思路】将回归模型两边取自然对数,并令,由此构建一个u与t的回归直线模型,根据回归直线必过中心点,可求出a值,利用所得回归模型进行预测..
【解答过程】由题意,两边取自然对数得,
令,则.
,,
∵回归直线必过样本点的中心,∴,
得,∴,则.
当时,.
故选:C.
7.(3分)(2022春·湖南益阳·高二期末)设两个相关变量和分别满足,,,2,…,6,若相关变量和可拟合为非线性回归方程,则当时,的估计值为( )
A.32 B.63 C.64 D.128
【解题思路】先通过换元把非线性回归方程转化为线性回归直线方程,从而可以利用公式求系数的值,然后把的值代入即可得到答案.
【解答过程】令,则 ,
,,
所以 ,,
所以,即,
所以当时, .
故选:C.
8.(3分)(2022·高二单元测试)某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
营养成分含量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )
A. B.
C. D.
【解题思路】根据题意可将函数模型化简后两边同时取对数可得,从而可计算出的平均数,根据线性回归方程经过样本中心的性质进行逐项检验即可.
【解答过程】解析:由得,两边同时取对数,得;
由表中数据可知,的平均数=.
对于A,化简变形可得,两边同时取对数可得,将代入可得,,与题中数据吻合;故选项A正确;
对于B,化简变形可得,两边同时取对数可得,,将代入可得,所以选项B错误;
对于C,,两边同时取对数可得,而表中所给数据为的相关量,所以C错误;
对于D,,两边同时取对数可得,而表中所给数据为的相关量,所以D错误.
故选:A.
二.多选题(共4小题,满分16分,每小题4分)
9.(4分)(2022秋·山东东营·高三阶段练习)已知变量与具有线性相关关系,统计得到6组数据如下表:
2 4 7 10 15 22
8.1 9.4 12 14.4 18.5 24
若关于的线性回归方程为,则( )
A.变量与之间正相关 B.
C. D.当时,的估计值为15.6
【解题思路】根据回归方程可判断选项A,由得到的6组数据可计算样本点中心,可判断B,再根据回归直线过样本点中心可判断C,进而可判断D.
【解答过程】由关于的线性回归方程为,可知变量与之间正相关,即A正确;
由表中数据可知
,故B正确;
因此样本点中心为,将其代入回归方程可得,故C不正确;
因此,关于的线性回归方程为,将代入回归方程可得,,
即当时,的估计值为16;所以D错误;
故选:AB.
10.(4分)(2023秋·江苏无锡·高三期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
【解题思路】根据线性回归方程的求法、意义可判断ABC ,再由残差的概念判断D.
【解答过程】,x新平均数,.
y新平均数,∴,∴.
新的线性回归方程,x,y具有正相关关系,A对.
新的线性回归方程:,B对.
由线性回归方程知,随着自变量x值增加,因变量y值增加速度恒定,C错;
,,,D对.
故选:ABD.
11.(4分)(2023·全国·高三专题练习)自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到海拔6千米~15千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为 ,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程可知,海拔每升高1千米,大气压强必定降低4.0kPa
C.由方程可知,样本点的残差为
D.对比两个回归模型,结合实际情况,方程的预报效果更好
【解题思路】根据散点图即可得出A项;根据回归方程的含义可判断B项;根据残差计算公式求出残差,可判断C项;根据实际大气压强不能为负,可判断D项.
【解答过程】对于A项,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故A项正确;
对于B项,回归直线得到的数据为估计值,而非精确值,故B项错误;
对于C项,当时,,又由散点图知观测值为,所以样本点的残差为,故C项正确;
对于D项,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程的预报效果更好,故D项正确.
故选:ACD.
12.(4分)(2023·重庆渝中·高三阶段练习)小明在家独自用下表分析高三前5次月考中数学的班级排名y与考试次数x的相关性时,忘记了第二次和第四次月考排名,但小明记得平均排名,于是分别用m=6和m=8得到了两条回归直线方程:,,对应的相关系数分别为、,排名y对应的方差分别为、,则下列结论正确的是( )
x 1 2 3 4 5
y 10 m 6 n 2
(附:,)
A. B. C. D.
【解题思路】根据表格中的数据和最小二乘法、相关系数的计算公式分别计算当、时的、相关系数(r)和方差(),进而比较大小即可.
【解答过程】当时,,解得,
则 ,
,,
,
,
所以,
得,
,
;
同理,当时,,,
所以,
故选:BD.
三.填空题(共4小题,满分16分,每小题4分)
13.(4分)(2022春·黑龙江齐齐哈尔·高二期末)变量X与Y相对应的5组数据和变量U与V相对应的5组数据统计如表:
X 10 11.3 11.8 12.5 13
Y 1 2 3 4 5
U 10 11.3 11.8 12.5 13
V 5 4 3 2 1
用b1表示变量Y与X之间的回归系数,b2表示变量V与U之间的回归系数,则b1与b2的大小关系是 .
【解题思路】根据回归系数几何意义得.
【解答过程】因为Y与X之间正增长,所以
因为V与U之间负增长,所以
因此,
故答案为:.
14.(4分)(2023·全国·模拟预测)某农业科研所在5块面积相同的长方形试验田中均种植了同-一种农作物,每一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系:
施肥量x/kg 20 40 50 60 80
产量y/kg 600 800 1200 1000 1400
已知y与x满足线性回归方程,则当施肥量为80kg时,残差为 10 .
【解题思路】根据回归直线方程的特点,计算样本中心值,即可求得,得回归方程后进行估计可得,当时,估计值,从而可得残差的数值.
【解答过程】由题意得,,由回归直线过样本点的中心,所以,解得,所以,
则当时,,故残差为.
故答案为:10.
15.(4分)(2022·高二课时练习)年初以来, 技术在我国已经进入高速发展的阶段, 手机的销量也逐渐上升,某手机商城统计了近个月来 手机的实际销量,如下表所示:
月份 年月 年月 年月 年月 年月
月份编号
销量/千部
若与线性相关,且求得线性回归方程为,则下列说法:
;②与正相关;③与的相关系数为负数;④月份该手机商城的 手机销量约为万部.
其中正确的是 ①② .(把正确的序号填在横线上)
【解题思路】将月份编号的平均数代入线性回归方程,则可计算出销量的平均数,利用总销量可得值;由回归方程中的的系数为正可知,与正相关;将代入,可得7月份该手机商城的 手机销量.
【解答过程】由表中数据,计算得,∴,
于是得,解得,则①正确,
由回归方程中的的系数为正可知,与正相关,且其相关系数,则②正确,③错误,
月份时,,(万部),则④错误,
故答案为:①②.
16.(4分)(2023·高二单元测试)在新冠疫情政策改变后,某社区统计了核酸检测为阳性的人数,用表示天数,表示每天核酸检测为阳性的人数,统计数据如下表所示:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据散点图判断,核酸检测为阳性的人数关于天数的回归方程适合用来表示,则其回归方程为
.
参考数据:设,,,
参考公式:对于一组数据,,….其回归直线的斜率和截距的最小二乘估计公式分别为:,.
【解题思路】由题可得,然后根据最小二乘法即得.
【解答过程】由,可得,
设,则,
因为,,
,
所以,
,
所以,
所以.
故答案为:.
四.解答题(共6小题,满分44分)
17.(6分)(2022春·山东·高二阶段练习)某大学一男生统计了本宿舍7名舍友的体重y(单位:kg)与身高x(单位:cm)的数据,见下表:
姓名 吕聪 梁力 李泽文 张天哲 王硕 武勇 商宝清
身高 161 175 169 178 173 168 180
体重 52 62 54 70 66 57 73
(1)若根据表中数据计算得到y关于x的线性回归方程为,求;
(2)为判断(1)中回归方程的拟合效果,请求出相关指数的值(保留两位小数).
参考公式及数据:,.
【解题思路】(1)利用回归直线方程过样本点的中心,根据表格,分别求出,,代入回归方程即可求解.
(2)根据表中数据,分别求出、的值,进而代入公式求解即可.
【解答过程】(1)
由题知,,
,
将代入回归方程,得.
(2)
,
因为,所以,
,
所以,
故相关指数的值约为.
18.(6分)(2023·四川南充·四川省模拟预测)南中数学教研室对高二学生的记忆力 和判断力进行统计分析, 所得数据如下表所示:
x 6 8 10 12
y 2 3 5 6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据, 用最小二乘法求出 关于的线性回归方程
(3)根据 (2) 中求出的线性回归方程, 预测记忆力为 11 的学生的判断力.
(参考公式:)
【解题思路】(1)根据表格直接画出散点图即可;
(2)根据公式分别计算出,即可得到线性回归防尘;
(3)根据(2)中的回归方程,将代入计算,即可得到结果.
【解答过程】(1)散点图如下:
(2),
,
,
,
则,
故线性回归方程为
(3)由 (2)中线性回归方程可知, 当时,,
所以预测记忆力为11的同学的判断力约为.
19.(8分)(2022春·陕西西安·高二期中)2021年2月25日,在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告“经过全党全国各族人民共同努力,在迎来中国共产党成立一百周年的重要时刻,我国脱贫攻坚战取得了全面胜利,……,完成了消除绝对贫困的艰巨任务.”从已经脱贫的家庭中随机抽取10个家庭,获得第个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得,,,.(是求和符号)
(1)求家庭的月储蓄对月收入的线性回归方程.
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附.线性回归方程中,,,其中,为样本平均值,线性回归方程也可写为.
【解题思路】(1)结合已知数据,根据公式计算即可;
(2)根据(1)中的回归方程计算的情况即可
【解答过程】(1)解:由题知,,
所以,由已知数据得,
,
所以,家庭的月储蓄对月收入的线性回归方程
(2)解:因为家庭的月储蓄对月收入的线性回归方程
所以,该居民区某家庭月收入为7千元,即时,千元,
所以,根据回归方程,可预测该家庭的月储蓄千元.
20.(8分)(2023秋·四川绵阳·高二期末)如图是某采矿厂的污水排放量(单位:吨)与矿产品年产量(单位:吨)的折线图:
(1)依据折线图计算,的相关系数,并据此判断是否可用线性回归模型拟合与的关系 (若,则线性相关程度很高,可用线性回归模型拟合)
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为20吨时的污水排放量.
相关公式:
回归方程中,,.
【解题思路】(1)代入数据,算出相关系数r,将其绝对值与比较,即可判断可用线性回归模型拟合y与x的关系.
(2)先求出回归方程,求出当时的值,即为预测值.
【解答过程】(1),,
因为,,,
所以,
所以可用线性回归模型拟合与的关系.
(2)∵,
,,
∴.
∴关于的线性回归方程为,
将代入线性回归方程可得,,
∴当年产量为20(吨)时,污水排放量为40.3(吨).
21.(8分)(2023·全国·高三专题练习)为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:
x 5 10 15 20 25 30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求回归直线方程;
(2)求出R2并说明回归模型拟合的程度;
(3)进行残差分析.
【解题思路】(1)代入回归系数公式计算回归系数,得出回归方程;
(2)根据公式计算;
(3)根据计算的的大小进行分析.
【解答过程】(1)
作出散点图如下:
,
.
.
.
,.
关于的线性回归方程是
(2)
,,,,,.
.
.
.
(3)
,非常接近1,故用回归方程模拟,间的关系的拟合效果非常好.
22.(8分)(2022春·全国·高三专题练习)某企业为确定下一年度投入某种产品的生产所需的资金,需了解每投入2千万资金后,工人人数(单位:百人)对年产能(单位:千万元)的影响,对投入的人力和年产能的数据作了初步处理,得到散点图和统计量表.
(1)根据散点图判断:与哪一个适宜作为年产能关于投入的人力的回归方程类型?并说明理由?
(2)根据(1)的判断结果及相关的计算数据,建立关于的回归方程;
(3)现该企业共有2000名生产工人,资金非常充足,为了使得年产能达到最大值,则下一年度共需投入多少资金(单位:千万元)?
附注:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,(说明:的导函数为)
【解题思路】(1)由图可知适宜作为年产能关于投入的人力的回归方程类型;
(2)由,得,再利用最小二乘法求出,从而得到关于的回归方程;
(3)利用导数求得当时,取得最大值.
【解答过程】(1)由图可知适宜作为年产能关于投入的人力的回归方程类型
若选择,则,此时当接近于0时,必小于0,
故选择作为年产能关于投入的人力的回归方程类型
(2)由,得,故与符合线性回归,.
,
,即,
关于的回归方程.
(3)当人均产能达到最大时,年产能也达到最大,
由(2)可知人均产能函数,
,
时,,时,
时,单调递增,时,单调递减,
当时,人均产能函数达到最大值,
因此,每2千万资金安排2百人进行生产,能使人均产能达到最大,
对于该企业共有2000名生产工人,且资金充足,
下一年度应该投入20千万资金进行生产,可以适当企业的产能达到最大.