中小学教育资源及组卷应用平台
期末核心考点 一元线性回归模型及其应用
一.选择题(共7小题)
1.(2025 宁德三模)由如表所示的变量x,y之间的一组数据,得x,y之间的线性回归方程为,则( )
x 6 8 10 12
y 7 t 5.5 4.5
A.点(8,t)一定在回归直线上
B.x每增加1个单位,y大约增加0.5个单位
C.t=7
D.去掉(12,4.5)这组数据后,求得的回归直线方程斜率将变大
2.(2025 葫芦岛校级一模)已知两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为yx+0.16,由它计算出成对样本数据(2,1.4)对应的残差为0.12(残差=观测值﹣预测值),则( )
A.0.28 B.0.56 C.0.34 D.0.48
3.(2025 秦淮区校级二模)给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为4
B.已知数据x1,x2, 的平均数为2,方差为3,那么数据2x1+1,2x2+1, 的平均数和方差分别为5,13
C.在回归直线方程中,相对于样本点(2,1.2)的残差为﹣0.8
D.样本相关系数r∈(﹣1,1)
4.(2025春 皇姑区校级期中)已知变量y与变量x的关系可以用模型(c1,c2为常数)拟合,设z=lny,变换后得到一组数据如下:
x 2 3 4 5 6
z 1.02 1.20 1.42 1.62 1.84
由上表可得经验回归方程为,则c1=( )
A.0.206 B.e0.206 C.0.596 D.e0.596
5.(2025 徐汇区二模)在研究线性回归模型时,若样本数据(xi,yi)(i=1,2,3,…,n)所对应的点都在直线上,则两组数据xi和yi(i=1,2,3, ,n)的线性相关系数为( )
A.﹣1 B.1 C. D.2
6.(2025春 辽宁期中)下列说法中,正确的是( )
A.回归直线至少经过一个样本点
B.可以用相关系数r刻画两个变量的相关程度强弱,r值越大两个变量的相关程度越强
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712,根据小概率值α=0.05的χ2独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05.
7.(2025春 西山区校级期中)如图,为某组数据的散点图,由最小二乘法计算得到回归直线l1的方程为1,相关系数为r1,决定系数为,若经过残差分析后去掉点P,剩余的点重新计算得到回归直线l2的方程为2x2,相关系数为r2,决定系数为,则下列结论一定正确的是( )
A.r1>r2 B.
C. D.r1>0,r2<0
二.多选题(共3小题)
(多选)8.(2025春 广东校级期中)对变量y和x的一组样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则( )
A.残差平方和越小,模型的拟合效果越好
B.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
C.若由样本数据得到经验回归直线,则其必过点
D.若y和x的样本相关系数r=﹣0.95,则y和x之间具有很强的负线性相关关系
(多选)9.(2025 遵义模拟)下列选项正确的是( )
A.若随机变量X~N(3,2),则E(X)=3
B.已知线性相关系数为r,若|r|越接近1,则两个变量的线性相关程度越高
C.回归直线方程为0.1x+1.4,则样本点(5,2)的残差为0.1
D.一组数x1,x2,…,xn(n∈N*)的平均数为a,若再插入一个数a,则这n+1个数的方差不变
(多选)10.(2025春 安徽期中)某产品的广告费用X与销售额Y的统计数据如下表:
广告费用X(万元) 2 3 4 5 6
销售额Y(万元) 19 25 34 38 44
根据上表可得回归直线方程为,下列说法正确的是( )
A.回归直线必经过样本点(4,34)
B.样本数据中,销售额的第70百分位数是36
C.6.8
D.据此模型估计广告费用为7万元时销售额为50.9万元
三.填空题(共3小题)
11.(2025春 辽宁期中)某公司从某年起7年的利润情况如表所示.
第x年 1 2 3 4 5 6 7
利润y/亿元 2.9 3.3 3.6 m 4.8 5.2 5.9
且y关于x的回归直线方程是,则m的值为 .
12.(2025春 沙河口区校级期中)数据(xi,yi)(i=1,2,3,…,10)组成一个样本,其回归直线方程为x﹣3,其中8.2,剔除一个异常点(1,7)后,得到新的回归直线必过点 .
13.(2025 辽宁模拟)已知具有线性相关的变量x,y,设其样本点为(x1,y1),(x2,y2),…,(x8,y8),经验回归方程为3x,若,,则 .
四.解答题(共2小题)
14.(2025 龙岩模拟)某项科研活动共进行了5次试验,其数据如下表所示:
特征量 第1次 第2次 第3次 第4次 第5次
x 2 5 8 9 11
y 12 10 8 8 7
(1)根据表中的数据,计算相关系数r;
(2)求特征量y关于x的线性回归方程,并预测当特征量x为12时特征量y的值.
参考公式:相关系数
,.
参考数据:,,.
15.(2025春 辽宁期中)已知s与t及x与y的成对数据如下,且t关于s的回归直线方程为0.55s+0.287.
s 0.1 0.2 0.3 0.4 0.5
t 0.36 0.39 0.43 0.50 0.58
x 1 2 3 4 5
y 4.1 4.4 4.8 5.5 6.3
(1)求y关于x的回归直线方程;
(2)由散点图发现可以用指数型函数模型y=abx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.01);
(3)又得到一组新数据x=6,y=6.7,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
e1.2789 e0.1077 1.116
1.602 25.107 3.593 1.114 1.870
其中mi=lnyi,.
参考公式:对于一组数据(u1,v1),(u2,v2), ,(un,vn).
其回归直线方程为u,其中.
期末核心考点 一元线性回归模型及其应用
参考答案与试题解析
一.选择题(共7小题)
1.(2025 宁德三模)由如表所示的变量x,y之间的一组数据,得x,y之间的线性回归方程为,则( )
x 6 8 10 12
y 7 t 5.5 4.5
A.点(8,t)一定在回归直线上
B.x每增加1个单位,y大约增加0.5个单位
C.t=7
D.去掉(12,4.5)这组数据后,求得的回归直线方程斜率将变大
【考点】经验回归方程与经验回归直线.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】C
【分析】利用回归直线方程过样本点可求得t=7,进而逐项计算判断每个选项的正误.
【解答】解:,,
因为回归直线方程一定过样本中心点,
所以,解得t=7,故C选项正确;
当﹣0.5×8+10.5=6.5≠7,所以点(8,t)不在回归直线上,故A选项错误;
x每增加1个单位,y大约减少0.5个单位,故B选项错误;
当﹣0.5×12+10.5=4.5,所以(12,4.5)在回归直线上,故去掉点(12,4.5)不影响回归直线方程,故D选项错误.
故选:C.
【点评】本题考查了回归方程的性质,属于基础题.
2.(2025 葫芦岛校级一模)已知两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为yx+0.16,由它计算出成对样本数据(2,1.4)对应的残差为0.12(残差=观测值﹣预测值),则( )
A.0.28 B.0.56 C.0.34 D.0.48
【考点】经验回归方程与经验回归直线.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】B
【分析】先根据回归直线估计得出预测值,再残差计算求解计算求参.
【解答】解:因为y关于x的经验回归方程为,样本数据(2,1.4)对应的残差为0.12,
所以预测值为,
所以,
所以.
故选:B.
【点评】本题主要考查线性回归方程的应用,属于基础题.
3.(2025 秦淮区校级二模)给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为4
B.已知数据x1,x2, 的平均数为2,方差为3,那么数据2x1+1,2x2+1, 的平均数和方差分别为5,13
C.在回归直线方程中,相对于样本点(2,1.2)的残差为﹣0.8
D.样本相关系数r∈(﹣1,1)
【考点】经验回归方程与经验回归直线;用样本估计总体的集中趋势参数;用样本估计总体的离散程度参数;样本相关系数.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】C
【分析】利用百分位数的定义判断A;根据平均数和方差的性质判断B;直接求出残差判定C;根据变量间的关系以及相关系数判断D.
【解答】解:对应A,将3,3,8,4,2,7,10,18由小到大排列为2,3,3,4,7,8,10,18,
第50百分位数即为中位数,这组数的中位数为,故A错误;
对于B,已知数据x1,x2, 的平均数为2,方差为3,
得数据2x1+1,2x2+1, 的平均数为2×2+1=5,方差为22×3=12,故B错误;
对于C,已知回归直线方程为,样本点为(2,1.2),
则残差,故C正确;
对于D,样本的相关系数应满足﹣1≤r≤1,故D错误.
故选:C.
【点评】本题考查统计及其有关定义,是基础题.
4.(2025春 皇姑区校级期中)已知变量y与变量x的关系可以用模型(c1,c2为常数)拟合,设z=lny,变换后得到一组数据如下:
x 2 3 4 5 6
z 1.02 1.20 1.42 1.62 1.84
由上表可得经验回归方程为,则c1=( )
A.0.206 B.e0.206 C.0.596 D.e0.596
【考点】经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】D
【分析】先根据线性回归方程必过样本中心点,可求,再推导出,可求c1的值.
【解答】解:由表格中数据得,,
因为经验回归方程过样本中心点(,),
所以,解得,
因此,
由两边取对数,得lny=c2x+lnc1,
又因为z=lny,所以z=c2x+lnc1,
所以c2=0.206,lnc1=0.596,
即.
故选:D.
【点评】本题主要考查了线性回归方程的性质,属于基础题.
5.(2025 徐汇区二模)在研究线性回归模型时,若样本数据(xi,yi)(i=1,2,3,…,n)所对应的点都在直线上,则两组数据xi和yi(i=1,2,3, ,n)的线性相关系数为( )
A.﹣1 B.1 C. D.2
【考点】经验回归方程与经验回归直线;样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】A
【分析】根据相关系数的性质求解.
【解答】解:因为样本数据(xi,yi)(i=1,2,3,…,n)所对应的点都在直线上,
所以相关系数|r|=1,
又因为0,所以y与x是负相关,
所以r=﹣1.
故选:A.
【点评】本题主要考查了相关系数的性质,属于基础题.
6.(2025春 辽宁期中)下列说法中,正确的是( )
A.回归直线至少经过一个样本点
B.可以用相关系数r刻画两个变量的相关程度强弱,r值越大两个变量的相关程度越强
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712,根据小概率值α=0.05的χ2独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05.
【考点】经验回归方程与经验回归直线;残差及残差图;独立性检验;样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】D
【分析】根据线性回归方程和相关系数及残差分析、独立性检验逐个判断正误.
【解答】解:对于A,线性回归方程可以不经过任何一个样本点,故A错误;
对于B,可以用相关系数r刻画两个变量的相关程度强弱,|r|值越大两个变量的相关程度越强,故B错误;
对于C,残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,故C错误;
对于D,因为χ2=4.712>3.841=x0.05,
所以可判断X与Y有关联,此推断犯错误的概率不超过0.05,故D正确.
故选:D.
【点评】本题主要考查了线性回归方程的性质,考查了相关系数的性质,以及独立性检验的性质,属于基础题.
7.(2025春 西山区校级期中)如图,为某组数据的散点图,由最小二乘法计算得到回归直线l1的方程为1,相关系数为r1,决定系数为,若经过残差分析后去掉点P,剩余的点重新计算得到回归直线l2的方程为2x2,相关系数为r2,决定系数为,则下列结论一定正确的是( )
A.r1>r2 B.
C. D.r1>0,r2<0
【考点】决定系数与模型的拟合效果.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】C
【分析】根据去掉离群点后,线性关系更强,即可求解.
【解答】解:共8个点且离群点P的横坐标较小而纵坐标相对过大,去掉离群点后回归方程的斜率更大,故C正确;
去掉离群点后相关性更强,拟合效果也更好,且还是正相关,故D错误;
故r1<r2,,故AB错误.
故选:C.
【点评】本题主要考查线性回归方程的应用,属于中档题.
二.多选题(共3小题)
(多选)8.(2025春 广东校级期中)对变量y和x的一组样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则( )
A.残差平方和越小,模型的拟合效果越好
B.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
C.若由样本数据得到经验回归直线,则其必过点
D.若y和x的样本相关系数r=﹣0.95,则y和x之间具有很强的负线性相关关系
【考点】经验回归方程与经验回归直线;样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】ACD
【分析】根据相关系数、决定系数的概念一一判断即可.
【解答】解:对于选项A,残差平方和越小,模型的拟合效果越好,故A正确;
对于选项B,用决定系数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,故B错误;
对于选项C,若由样本数据得到经验回归直线,则其必过点,故C正确;
对于选项D,若y和x的样本相关系数r=﹣0.95,所以y和x成负相关,
又|r|=0.95>0.75且r=﹣0.95接近﹣1,
所以y和x之间具有很强的负线性相关关系,故D正确.
故选:ACD.
【点评】本题主要考查了相关系数和决定系数的性质,考查了经验回归直线的性质,属于基础题.
(多选)9.(2025 遵义模拟)下列选项正确的是( )
A.若随机变量X~N(3,2),则E(X)=3
B.已知线性相关系数为r,若|r|越接近1,则两个变量的线性相关程度越高
C.回归直线方程为0.1x+1.4,则样本点(5,2)的残差为0.1
D.一组数x1,x2,…,xn(n∈N*)的平均数为a,若再插入一个数a,则这n+1个数的方差不变
【考点】经验回归方程与经验回归直线;正态分布曲线的特点及曲线所表示的意义;样本相关系数.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】ABC
【分析】根据方差,平均数,线性相关系数的性质即可求解.
【解答】解:A选项:若X~N(3,2),则μ=3=E(X),A选项正确;
B选项:若线性相关系数的绝对值|r|越接近1,则两个变量的线性相关性越强,故B正确;
C选项:令x=5,得0.1×5+1.4=1.9,则所求残差为2﹣1.9=0.1,C选项正确;
D选项:由题意可知,若再插入一个数a,则平均数变为,
即平均数不变,而原来的数据的方差为,
同理可算得新数据的方差为,
所以方差可能改变,故D错误.
故选:ABC.
【点评】本题考查了方差,平均数,线性相关系数,属于中档题.
(多选)10.(2025春 安徽期中)某产品的广告费用X与销售额Y的统计数据如下表:
广告费用X(万元) 2 3 4 5 6
销售额Y(万元) 19 25 34 38 44
根据上表可得回归直线方程为,下列说法正确的是( )
A.回归直线必经过样本点(4,34)
B.样本数据中,销售额的第70百分位数是36
C.6.8
D.据此模型估计广告费用为7万元时销售额为50.9万元
【考点】经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】CD
【分析】根据线性回归方程的性质可判断A,根据百分位数的定义可判断B,根据回归直线必经过样本中心点(,)可判断CD.
【解答】解:对于A,回归直线不一定过样本点,故A错误;
对于B,样本数据中,销售额从小到大排列为:19,25,34,38,44,
因为5×70%=3.5,
所以销售额的第70百分位数是38,故B错误;
对于C,由题意可知,4,32,
因为回归直线必经过样本中心点(,),
所以32=6.3×4,
解得6.8,故C正确;
对于D,由C可知,回归直线为Y=6.3X+6.8,
当X=7时,Y=6.3×7+6.8=50.9,
所以据此模型估计广告费用为7万元时销售额为50.9万元,故D正确.
故选:CD.
【点评】本题主要考查了线性回归方程的性质,考查了百分位数的定义,属于基础题.
三.填空题(共3小题)
11.(2025春 辽宁期中)某公司从某年起7年的利润情况如表所示.
第x年 1 2 3 4 5 6 7
利润y/亿元 2.9 3.3 3.6 m 4.8 5.2 5.9
且y关于x的回归直线方程是,则m的值为 4.4 .
【考点】经验回归方程与经验回归直线.
【专题】函数思想;综合法;概率与统计;运算求解.
【答案】见试题解答内容
【分析】根据回归直线方程过点(,)求解.
【解答】解:由题意可知,4,,
因为回归直线方程过点(,),即(4,),
所以0.5×4+2.3,
解得m=4.4.
故答案为:4.4.
【点评】本题主要考查了回归直线方程的性质,属于基础题.
12.(2025春 沙河口区校级期中)数据(xi,yi)(i=1,2,3,…,10)组成一个样本,其回归直线方程为x﹣3,其中8.2,剔除一个异常点(1,7)后,得到新的回归直线必过点 (9,5) .
【考点】经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】(9,5).
【分析】利用回归直线方程过样本中心点(,)求解.
【解答】解:因为回归直线方程x﹣3过样本中心点(,),
所以3=8.2﹣3=5.2,
所以剔除一个异常点(1,7)后,5,9,
所以得到新的回归直线必过点(9,5).
故答案为:(9,5).
【点评】本题主要考查了回归直线方程的性质,属于基础题.
13.(2025 辽宁模拟)已知具有线性相关的变量x,y,设其样本点为(x1,y1),(x2,y2),…,(x8,y8),经验回归方程为3x,若,,则 9 .
【考点】经验回归方程与经验回归直线.
【专题】方程思想;分析法;概率与统计;运算求解.
【答案】9.
【分析】由已知可求得,,代入经验回归方程即可求解.
【解答】解:,,
因为(,)在经验回归方程上,所以,所以.
故答案为:9.
【点评】本题考查经验回归方程,属于基础题.
四.解答题(共2小题)
14.(2025 龙岩模拟)某项科研活动共进行了5次试验,其数据如下表所示:
特征量 第1次 第2次 第3次 第4次 第5次
x 2 5 8 9 11
y 12 10 8 8 7
(1)根据表中的数据,计算相关系数r;
(2)求特征量y关于x的线性回归方程,并预测当特征量x为12时特征量y的值.
参考公式:相关系数
,.
参考数据:,,.
【考点】一元线性回归模型;样本相关系数.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】(1)r≈﹣0.99;
(2)y=﹣0.56x+12.92,y=6.2.
【分析】(1)根据题意,根据相关系数的计算公式即可求解;
(2)根据题意即可求解y关于x的线性回归方程,再将特征量x为12代入即可求解.
【解答】解:(1)根据题意可知,,,
,
,,
∴相关系数;
(2)由(1)知,,
∴,
∴所求的线性回归方程是y=﹣0.56x+12.92,
当特征量x为12时,可预测特征量y=﹣0.56×12+12.92=6.2.
【点评】本题考查了一元线性回归模型,属于中档题.
15.(2025春 辽宁期中)已知s与t及x与y的成对数据如下,且t关于s的回归直线方程为0.55s+0.287.
s 0.1 0.2 0.3 0.4 0.5
t 0.36 0.39 0.43 0.50 0.58
x 1 2 3 4 5
y 4.1 4.4 4.8 5.5 6.3
(1)求y关于x的回归直线方程;
(2)由散点图发现可以用指数型函数模型y=abx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.01);
(3)又得到一组新数据x=6,y=6.7,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
e1.2789 e0.1077 1.116
1.602 25.107 3.593 1.114 1.870
其中mi=lnyi,.
参考公式:对于一组数据(u1,v1),(u2,v2), ,(un,vn).
其回归直线方程为u,其中.
【考点】一元线性回归模型.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】(1)0.55x+3.37;
(2)3.59×(1.11)x;
(3)指数函数模型拟合效果更好.
【分析】(1)利用x与s,y与t之间的关系,即可得到y与x的线性回归方程;
(2)令m=lny=xlnb+lna,将非线性方程转化为线性方程,即可求解;
(3)将x=6分别代入(1)与(2)中的方程,求出观测值,再比较残差的绝对值的大小即可.
【解答】解:(1)t关于s的回归直线方程为0.55s+0.287,
由题意x=10s,y=10t+0.5,即s,t,
所以0.550.287,
所以y关于x的回归方程为0.55x+3.37;
(2)若用指数型函数模型y=abx拟合y与x的关系,
令m=lny=xlnb+lna,
3,12+22+32+42+52=55,
ln0.1077,
ln ln1.602﹣3×0.1077≈1.2789,
所以e1.2789 e0.1077x≈3.59×(1.11)x;
(3)若y关于x的回归方程为0.55x+3.37,当x=6时,0.55×6+3.37=6.67,
此时残差为6.6﹣6.67=0.03;
若3.59×(1.11)x,当x=6时,3.59×(1.11)6=3.59×1.87≈6.71,
此时残差为6.7﹣6.71=﹣0.01;
由于|0.03|>|﹣0.01|,所以指数函数模型拟合效果更好.
【点评】本题考查线性回归方程以及残差分析,属于中档题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)