8.2 第1课时 一元线性回归模型及其应用(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册

文档属性

名称 8.2 第1课时 一元线性回归模型及其应用(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册
格式 zip
文件大小 3.6MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-07-25 20:15:16

文档简介

8.2 一元线性回归模型及其应用
第1课时 一元线性回归模型及其应用(概念课逐点理清式教学)
课时目标
1.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,建立一元线性回归模型进行预测.
2.了解随机误差、残差、残差图的概念.
3.会通过残差分析一元线性回归模型的拟合效果.
逐点清(一) 一元线性回归模型
[多维度理解]
  我们称为Y关于x的       模型.其中,Y称为    或      ,x称为    或     ;a和b为模型的未知参数,a称为   参数,b称为    参数;e是Y与bx+a之间的     .
[细微点练明]
1.[多选]在线性回归模型Y=bx+a+e中,下列说法不正确的是 (  )
A.Y=bx+a+e是一次函数
B.响应变量Y是由解释变量x唯一确定的
C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
2.某地的财政收入x与支出y满足线性回归方程=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过    亿.
3.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画
(1)某公司的销售收入和广告支出;
(2)某城市写字楼的出租率和每平方米月租金;
(3)航空公司的顾客投诉次数和航班正点率;
(4)某地区的人均消费水平和人均国内生产总值(GDP);
(5)学生期末考试成绩和考前用于复习的时间;
(6)一辆汽车在某段路程中的行驶速度和行驶时间;
(7)正方形的面积与周长.
逐点清(二) 最小二乘法和经验回归方程
[多维度理解]
  我们将=x+称为Y关于x的           ,也称经验回归函数或经验回归公式,其图形称为          .这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中
微点助解
(1)经验回归直线过点(,).
(2)经验回归直线的截距和斜率都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差.
(3)经验回归方程=+x中的表示x增加1个单位时,y的平均变化量为,而表示y不随x的变化而变化的部分.
[细微点练明]
1.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
气温x/℃ 18 13 10 -1
用电量y/度 24 34 38 64
由表中数据得到经验回归方程=-2x+,则当气温为-3 ℃时,预测用电量为 (  )
A.68度 B.66度
C.28度 D.12度
2.若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为=6.5x+17.5,则表中m的值为 (  )
x 2 4 5 6 8
y 30 40 m 50 70
A.60 B.55
C.50 D.45
3.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如表所示.
年份x 2019 2020 2021 2022 2023
储蓄存款额 y/千亿元 5 6 7 8 10
为了计算方便,工作人员将上表的数据进行了处理,令t=x-2 018,z=y-5,得到下表.
t 1 2 3 4 5
z 0 1 2 3 5
(1)作z关于t的散点图,求z关于t的经验回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程.
逐点清(三) 线性回归分析
[多维度理解]
1.残差与残差分析
(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值所得到的差称为   .残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为     .
(2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域   ,则说明拟合效果越好.
微点助解
  在使用经验回归方程进行预测时,需要注意的问题:
(1)经验回归方程只适用于所研究的样本的总体.
(2)所建立的经验回归方程一般都有时效性.
(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.
(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.
2.决定系数
(1)残差平方和 (yi-)2越   ,模型的拟合效果越   .
(2) R2的计算公式为R2=1-.在R2表达式中, (yi-)2与经验回归方程无关,残差平方和 (yi-i)2与经验回归方程有关.因此R2越大,表示残差平方和   ,即模型的拟合效果   ;R2越小,表示残差平方和越大,即模型的拟合效果   .
[细微点练明]
1.[多选]对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则 (  )
A.残差平方和越大,模型的拟合效果越好
B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系
2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是 (  )
3.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 (  )
A.r=s B.s=2r
C.s=-2r+3 D.s=2r+1
4.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
若由最小二乘法计算得经验回归方程=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型拟合效果的好坏.
第1课时 一元线性回归模型及其应用
[逐点清(一)]
[多维度理解] 一元线性回归 因变量 响应变量 自变量 解释变量 截距 斜率 随机误差
[细微点练明]
1.选ABD 对于A,线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.
2.解析:由题设,=0.8x+2+e,∴当x=10时,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,∴9.5≤≤10.5,故今年支出预计不会超过10.5亿.
答案:10.5
3.解:(1)(2)(3)(4)(5)属于回归模型,(6)(7)属于函数模型.
[逐点清(二)]
[多维度理解] 经验回归方程 经验回归直线 -
[细微点练明]
1.选B 由表中数据可知==10,==40,所以经验回归直线=-2x+过点(10,40),即40=-2×10+,得=60,则经验回归方程为=-2x+60,当x=-3时,=-2×(-3)+60=66.
2.选A 由表中数据,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因为经验回归直线=6.5x+17.5过点,所以38+=6.5×5+17.5,解得m=60.
3.解:(1)作散点图,直观看z与t具有线性相关关系.
根据z关于t的表格数据,得
=×(1+2+3+4+5)=3,
=×(0+1+2+3+5)=2.2,
且tizi=45,t=55,
所以===1.2,=-=2.2-1.2×3=-1.4.
所以z关于t的经验回归方程为=1.2t-1.4.
(2)由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,得-5=1.2(x-2 018)-1.4,即=1.2x-2 418.
故y关于x的回归方程为=1.2x-2 418.
[逐点清(三)]
[多维度理解] 1.(1)残差 残差分析 (2)越窄 2.(1)小 好 (2)越小 越好 越差
[细微点练明]
1.选BD 因为残差平方和越小,模型的拟合效果越好,故A错误;在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;因为决定系数R2越接近1,说明模型的拟合效果越好,故C错误;由样本相关系数为负且接近-1,可知y和x之间具有很强的负线性相关关系,故D正确.
2.选A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
3.选C 样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2.依题意得1-2r-a=s-a-2,故s=-2r+3.
4.解: (1)由i=xi+,可以算得i=yi-i.
分别为1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,所以残差平方和为 (i)2≈8.43.
(2)因为 (yi-)2=50.18,
故R2=1-≈1-≈0.832,
所以回归模型的拟合效果较好.
1 / 4(共64张PPT)
8.2
一元线性回归模型及其应用
一元线性回归模型及其应用
(概念课——逐点理清式教学)
第1课时
课时目标
1.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,建立一元线性回归模型进行预测.
2.了解随机误差、残差、残差图的概念.
3.会通过残差分析一元线性回归模型的拟合效果.
CONTENTS
目录
1
2
3
逐点清(一) 一元线性回归模型
逐点清(二) 最小二乘法和
经验回归方程
逐点清(三) 线性回归分析
4
课时跟踪检测
逐点清(一) 一元线性回归模型
01
多维度理解
我们称为Y关于x的______________模型.其中,Y称为_________或___________,x称为________或___________;a和b为模型的未知参数,a称为______参数,b称为_______参数;e是Y与bx+a之间的___________.
一元线性回归
因变量
响应变量
自变量
解释变量
截距
斜率
随机误差
细微点练明
1.[多选]在线性回归模型Y=bx+a+e中,下列说法不正确的是 (  )
A.Y=bx+a+e是一次函数
B.响应变量Y是由解释变量x唯一确定的
C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生



解析:对于A,线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.
2.某地的财政收入x与支出y满足线性回归方程=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过_______亿.
解析:由题设,=0.8x+2+e,∴当x=10时,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,
∴9.5≤≤10.5,故今年支出预计不会超过10.5亿.
10.5
3.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画
(1)某公司的销售收入和广告支出;
(2)某城市写字楼的出租率和每平方米月租金;
(3)航空公司的顾客投诉次数和航班正点率;
(4)某地区的人均消费水平和人均国内生产总值(GDP);
(5)学生期末考试成绩和考前用于复习的时间;
(6)一辆汽车在某段路程中的行驶速度和行驶时间;
(7)正方形的面积与周长.
解:(1)(2)(3)(4)(5)属于回归模型,(6)(7)属于函数模型.
逐点清(二) 最小二乘法和
经验回归方程
02
多维度理解
我们将=x+称为Y关于x的________________,也称经验回归函数或经验回归公式,其图形称为________________.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计, 其中
经验回归方程
经验回归直线
微点助解
(1)经验回归直线过点(,).
(2)经验回归直线的截距和斜率都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差.
(3)经验回归方程=+x中的表示x增加1个单位时,y的平均变化量为,而表示y不随x的变化而变化的部分.
细微点练明
1.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
由表中数据得到经验回归方程=-2x+,则当气温为-3 ℃时,预测用电量为(  )
A.68度 B.66度 C.28度 D.12度
气温x/℃ 18 13 10 -1
用电量y/度 24 34 38 64

解析:由表中数据可知==10,==40,所以经验回归直线=-2x+过点(10,40),即40=-2×10+,得=60,则经验回归方程为=-2x+60,当x=-3时,=-2×(-3)+60=66.
2.若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为=6.5x+17.5,则表中m的值为(  )

x 2 4 5 6 8
y 30 40 m 50 70
A.60 B.55
C.50 D.45
解析:由表中数据,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)
=38+,因为经验回归直线=6.5x+17.5过点,
所以38+=6.5×5+17.5,解得m=60.
3.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如表所示.
年份x 2019 2020 2021 2022 2023
储蓄存款额 y/千亿元 5 6 7 8 10
为了计算方便,工作人员将上表的数据进行了处理,令t=x-2 018,z=y-5,得到下表.
t 1 2 3 4 5
z 0 1 2 3 5
(1)作z关于t的散点图,求z关于t的经验回归方程;
解:作散点图,直观看z与t具有线性相关关系.
根据z关于t的表格数据,
得=×(1+2+3+4+5)=3,
=×(0+1+2+3+5)=2.2,
(2)通过(1)中的方程,求出y关于x的回归方程.
解:由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,
得-5=1.2(x-2 018)-1.4,
即=1.2x-2 418.
故y关于x的回归方程为=1.2x-2 418.
逐点清(三) 线性回归分析
03
多维度理解
1.残差与残差分析
(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值所得到的差称为______.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为___________.
(2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域_____,则说明拟合效果越好.
残差
残差分析
越窄
微点助解
  在使用经验回归方程进行预测时,需要注意的问题:
(1)经验回归方程只适用于所研究的样本的总体.
(2)所建立的经验回归方程一般都有时效性.
(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.
(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.
R2越大,表示残差平方和______,即模型的拟合效果_____;R2越小,表示残差平方和越大,即模型的拟合效果______.


越小
越好
越差
1.[多选]对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则 (  )
A.残差平方和越大,模型的拟合效果越好
B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系
细微点练明


解析:因为残差平方和越小,模型的拟合效果越好,故A错误;在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;因为决定系数R2越接近1,说明模型的拟合效果越好,故C错误;由样本相关系数为负且接近-1,可知y和x之间具有很强的负线性相关关系,故D正确.
2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是 (  )

解析:用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
3.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有(  )
A.r=s B.s=2r
C.s=-2r+3 D.s=2r+1
解析:样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2.依题意得1-2r-a=s-a-2,故s=-2r+3.

4.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
若由最小二乘法计算得经验回归方程=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型拟合效果的好坏.
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
12
2
1.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是 (  )

模型 模型1 模型2 模型3 模型4
R2 0.98 0.80 0.50 0.25
A.模型1 B.模型2
C.模型3 D.模型4
解析:决定系数R2=0.98最大,拟合效果最好.
1
5
6
7
8
9
10
11
12
2
3
4
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为 (  )
A.=x+1 B.=x+2
C.=2x+1 D.=x-1
解析:易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此经验回归方程为=x+1.

1
5
6
7
8
9
10
11
12
3
4
2
3.两个线性相关变量x与y的统计数据如表所示:
其经验回归方程是=x+40,则相对应于点(11,5)的残差为(  )
A.0.1 B.0.2
C.0.3 D.0.4

x 9 9.5 10 10.5 11
y 11 10 8 6 5
1
5
6
7
8
9
10
11
12
3
4
2
解析:由于=x+40过样本中心点(10,8),所以8=10+40,则=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-=5-4.8=0.2.
1
5
6
7
8
9
10
11
12
3
4
2
4.根据变量Y和x的成对样本数据,由一元线性回归模型
得到经验回归方程=x+,对应的残差如图所示,模型误差(  )
1
5
6
7
8
9
10
11
12
3
4
2
A.满足一元线性回归模型的所有假设
B.满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型E(e)=0和D(e)=σ2的假设
解析:由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.

1
5
6
7
8
9
10
11
12
3
4
2
5.[多选]已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是(  )

x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关关系
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)


1
5
6
7
8
9
10
11
12
3
4
2
解析:由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确.
==9,=-0.7×9+10.3=4=,解得m=5,B错误.当x=11时,y的预测值为2.6,故C正确.=9,=4,故经验回归直线必过点(9,4),
则D正确.
1
5
6
7
8
9
10
11
12
3
4
2

1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
7.[多选]设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024
个样本点,直线l是由这些样本点通过最小二乘法得到的
经验回归直线,如图所示,下列结论正确的是 (  )
A.直线l过点(,)
B.直线l过点(x1 012,y1 012)
C.x和y的样本相关系数在区间[-1,0)上
D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同


1
5
6
7
8
9
10
11
12
3
4
2
解析:经验回归直线一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.
1
5
6
7
8
9
10
11
12
3
4
2
8.[多选]已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),
(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,
n∈R),则(  )
1
5
6
7
8
9
10
11
12
3
4
2
A.变量y与x正相关
B.m<3
C.n<4.5
D.经验回归直线=mx+n经过点(4,16.5)



1
5
6
7
8
9
10
11
12
3
4
2
解析:设A(2,11),B(6,22),由kAB=<3,而8个数据点的经验回归
方程中=3,∴0==16.5,∴经验回归直线过定点(4,16.5),
则16.5=4m+n,n=16.5-4m,0<16.5,即4.51
5
6
7
8
9
10
11
12
3
4
2
9.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x 1 2 3 4 5
命中率y 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为______,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为_______.
0.5
0.53
1
5
6
7
8
9
10
11
12
3
4
2
解析:===0.5,==3.由公式得=0.01,从而=-=0.5-0.01×3=0.47,所以经验回归方程为=0.47+0.01x,所以当x=6时,=0.47+0.01×6=0.53.
1
5
6
7
8
9
10
11
12
3
4
2
10.某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如表所示:
x 3 4 6 7
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为______.
5.9
1
5
6
7
8
9
10
11
12
3
4
2
解析:根据样本(4,3)处的残差为-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故经验回归方程为=0.7x+0.35,又由样本数据的平均数为=
=5,=,所以0.7×5+0.35=,解得m=5.9.
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
(2)判断变量x与y之间是正相关还是负相关;
解:由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
1
5
6
7
8
9
10
11
12
3
4
2
解:将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
1
5
6
7
8
9
10
11
12
3
4
2
12.假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:
使用年限x/年 2 3 4 5 6
维修费用y/万元 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系,试求:
(1)经验回归方程=x+;
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
(2)估计使用年限为10年时,维修费用是多少
1
5
6
7
8
9
10
11
12
3
4
2
(3)计算残差平方和;
1
5
6
7
8
9
10
11
12
3
4
2
(4)求R2并说明模型的拟合效果.课时跟踪检测(二十四) 一元线性回归模型及其应用
1.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是 (  )
模型 模型1 模型2 模型3 模型4
R2 0.98 0.80 0.50 0.25
A.模型1 B.模型2
C.模型3 D.模型4
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为 (  )
A.=x+1 B.=x+2
C.=2x+1 D.=x-1
3.两个线性相关变量x与y的统计数据如表所示:
x 9 9.5 10 10.5 11
y 11 10 8 6 5
其经验回归方程是=x+40,则相对应于点(11,5)的残差为 (  )
A.0.1 B.0.2
C.0.3 D.0.4
4.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归方程=x+,对应的残差如图所示,模型误差 (  )
A.满足一元线性回归模型的所有假设
B.满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型E(e)=0和D(e)=σ2的假设
5.[多选]已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是 (  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关关系
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
6.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知xi=400,yi=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为 (  )
A.99 B.101 C.103 D.105
7.[多选]设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是 (  )
A.直线l过点(,)
B.直线l过点(x1 012,y1 012)
C.x和y的样本相关系数在区间[-1,0)上
D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同
8.[多选]已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,n∈R),则 (  )
A.变量y与x正相关
B.m<3
C.n<4.5
D.经验回归直线=mx+n经过点(4,16.5)
9.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x 1 2 3 4 5
命中率y 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为    ,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为    .
10.某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如表所示:
x 3 4 6 7
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为    .
11.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料, 算得xi=80,yi=20,xiyi=184,x=720.
(1)求家庭的月储蓄y对月收入x的经验回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:经验回归方程=x+中,=,=-,其中,为样本平均值.
12.假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:
使用年限x/年 2 3 4 5 6
维修费用y/万元 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系,试求:
(1)经验回归方程=x+;
(2)估计使用年限为10年时,维修费用是多少
(3)计算残差平方和;
(4)求R2并说明模型的拟合效果.
参考数据:xiyi=112.3, (yi-)2=15.78.
课时跟踪检测(二十四)
1.选A 决定系数R2=0.98最大,拟合效果最好.
2.选A 易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此经验回归方程为=x+1.
3.选B 由于=x+40过样本中心点(10,8),所以8=10+40,则=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-=5-4.8=0.2.
4.选D 由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.
5.选ACD 由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确.==9,=-0.7×9+10.3=4=,解得m=5,B错误.当x=11时,y的预测值为2.6,故C正确.=9,=4,故经验回归直线必过点(9,4),则D正确.
6. 选C xi=400,故==20;yi=1 580,故==79,故点(20,79)在经验回归直线上,即79=20-1,得=4,即=4x-1,当x=26时,代入计算得到=103.
7.选AC 经验回归直线一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.
8.选ABD 设A(2,11),B(6,22),由kAB=<3,而8个数据点的经验回归方程中=3,∴09.解析:===0.5,==3.由公式得=0.01,从而=-=0.5-0.01×3=0.47,所以经验回归方程为=0.47+0.01x,所以当x=6时,=0.47+0.01×6=0.53.
答案:0.5 0.53
10.解析:根据样本(4,3)处的残差为-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故经验回归方程为=0.7x+0.35,又由样本数据的平均数为==5,=,所以0.7×5+0.35=,解得m=5.9.
答案:5.9
11.解: (1)由题意,知n=10,=xi==8,
=yi==2,
又x-102=720-10×82=80,
xiyi-10 =184-10×8×2=24,则==0.3,=-=2-0.3×8=-0.4,
故所求经验回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
12.解: (1)由统计表格,易知=4,=5,x=90.
又xiyi=112.3.
设经验回归方程为=x+,
于是有===1.23,=-=5-1.23×4=0.08,
所以经验回归方程是=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38,
估计使用年限为10年时维修费用是12.38万元.
(3)因为1=2.46+0.08=2.54,
2=3.77,3=5,4=6.23,5=7.46,
所以残差平方和 (yi-i)2=0.651.
(4)R2=1-=1-≈0.958 7,
模型的拟合效果较好.
4 / 4