9.1.2 一元线性回归模型
第1课时 经验回归方程
1.在具有线性相关关系的两个变量建立的经验回归方程=+x中,( )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
2.已知某经验回归方程为=2-3x,则当变量x增加1个单位时,变量y平均( )
A.增加3个单位 B.增加个单位
C.减少3个单位 D.减少个单位
3.(2024·镇江月考)设两个变量x和y之间具有线性相关关系,它们的样本相关系数是r,y关于x的经验回归方程斜率是,纵轴上的截距是,那么必有( )
A.与r的符号相同 B.与r的符号相同
C.与r的符号相反 D.与r的符号相反
4.对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程为=x+,且x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=9,则=( )
A.-2 B.2 C.-1 D.1
5.(多选)已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是( )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关关系
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
6.(多选)(2024·盐城月考)数据(x,y)的5组测量值(xi,yi)(i=1,2,3,4,5),已知=90,xiyi=112,xi=20,yi=25.若y对x的经验回归方程记作=x+,则( )
A.=1.2
B.=0.2
C.y与x正相关
D.x=8时,y的估计值为9
7.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为=x+1,则= .
8.为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其经验回归方程为=x+,已知xi=225,yi=1 600,=4.该班某学生的脚长为24 cm,据此估计其身高为 cm.
9.某工厂生产某产品的成本x(单位:万元)与销售额y(单位:万元)的几组对应数据如下表所示:
成本x/万元 10 20 30 40 50
销售额y/万元 40 70 110 130 150
(1)根据以往经验可知,成本x与销售额y之间具有线性相关关系,求销售额y关于成本x的经验回归方程;
(2)根据(1)中经验回归方程,预测当销售额为200万元时,成本为多少万元?(结果保留一位小数)
附:xiyi=17 800,=5 500,=.
10.根据以下样本数据得到经验回归方程为=x+.则( )
x 1 3 5 7
y 6 4.5 3.5 2.5
A.<0,<0 B.>0,>0
C.<0,>0 D.>0,<0
11.(2024·连云港月考)若某地财政收入x与支出y满足线性回归模型y=bx+a+ε(单位:亿元),其中b=0.7,a=3,|ε|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.9亿元 B.9.5亿元
C.10亿元 D.10.5亿元
12.(多选)(2024·南京质检)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到经验回归方程为=1.5x-0.6且=2,去除两个异常数据(-2,7)和(2,-7)后,得到的新的经验回归直线的斜率为3,则( )
A.相关变量x,y具有正相关关系
B.去除异常数据后,新的平均数'=2
C.去除异常数据后的经验回归方程为=3x-4.8
D.去除异常数据后,随x值增加,的值增加速度变小
13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量y(件) 90 84 83 80 75 68
(1)求经验回归方程=x+,其中=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,若该产品的成本是4元/件,则为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
14.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速x(转/秒) 16 14 12 8
每小时生产有缺点的零件数y(件) 11 9 8 5
(1)画出散点图;
(2)如果y与x有线性相关关系,请画出一条直线近似地表示这种线性关系;
(3)在实际生产中,若y关于x的经验回归方程为=x-,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?
第1课时 经验回归方程
1.C 当=0时,不具有线性相关关系,但能大于0,也能小于0.
2.C 依题意,经验回归方程为=2-3x,所以当变量x增加1个单位时,变量y平均减少3个单位.故选C.
3.A 当>0时,两变量正相关,此时r>0;当<0时,两变量负相关,此时r<0,所以必有与r的符号相同.
4.D ==,=,由于经验回归直线过样本中心点,将代入经验回归方程,解得=1.
5.ACD 由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确;==9,=-0.7×9+10.3=4=,解得m=5,则B错误;当x=11时,y的预测值为2.6,则C正确;=9,=4,故经验回归直线必经过点(9,4),则D正确.
6.ABC 由已知的数据可得=xi=4,=yi=5,====1.2,=-=5-1.2×4=0.2,所以经验回归方程为=1.2x+0.2.因为=1.2>0,所以y与x正相关.当x=8时,=1.2×8+0.2=9.8.故A、B、C选项正确,D选项错误.
7.0.8 解析:由题图知==2,==2.6,将(2,2.6)代入=x+1中,解得=0.8.
8.166 解析:由题意可知=4x+,又=22.5,=160,∴160=22.5×4+,得=70,因此=4x+70.当x=24时,=4×24+70=96+70=166 cm.
9.解:(1)=×(10+20+30+40+50)=30,
=×(40+70+110+130+150)=100,
==2.8,
=100-2.8×30=16,
所以经验回归方程为=2.8x+16.
(2)由(1)知=2.8x+16,令=2.8x+16=200,得x≈65.7(万元),即预测当销售额为200万元时,成本为65.7万元.
10.D 由表中数据可得随着x的增大,y越来越小,所以<0,又因为当x=1时,y=6,所以当x=0时,y>6,所以>0,故选D.
11.D 因为财政收入x与支出y满足线性回归模型y=bx+a+ε,其中b=0.7,a=3,所以y=0.7x+3+ε.当x=10时,得y=0.7×10+3+ε=10+ε,又|ε|≤0.5,即-0.5≤ε≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.
12.AC 对于A,因为经验回归直线的斜率为正,所以相关变量x,y具有正相关关系,A正确;对于B,因为=2,所以去除两个异常数据(-2,7)和(2,-7)后,得到新的'==,B错误;对于C,将=2代入=1.5x-0.6得=2.4,故去除两个异常数据(-2,7)和(2,-7)后,'==3.2,因为得到的新的经验回归直线的斜率为3,所以'-3'=3.2-3×=-4.8,所以去除异常数据后的经验回归方程为=3x-4.8,C正确;对于D,因为经验回归直线=3x-4.8的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由1.5增大到3,故值增加的速度变大,D错误.故选A、C.
13.解:(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5,
=×(90+84+83+80+75+68)=80,
所以=-=80+20×8.5=250,
从而经验回归方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-20(x-8.25)2+361.25,
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润.
14.解:(1)散点图如图所示:
(2)近似直线如图所示:
(3)由y≤10得x-≤10,
解得x≤14.9,
所以机器的运转速度应控制在14转/秒内.
3 / 39.1.2 一元线性回归模型
新课程标准解读 核心素养
1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件 数学抽象、数学建模、数据分析
2.针对实际问题,会用一元线性回归模型进行预测 数学建模、数学运算、数据分析
第1课时 经验回归方程
恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食物的支出所占比例将会下降.
【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
知识点一 随机误差
1.定义:具有线性相关关系的两个变量的取值x,y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ ,其中 是确定性函数, 称为随机误差.
2.产生的原因
(1)所用的 不恰当引起的误差;
(2)忽略了 ;
(3)存在 误差.
知识点二 经验回归方程
1.线性回归模型中a,b值的求法
y= 称为一元线性回归模型.
a,b的估计值为,,则
上述方法称为“最小二乘法”.
2.经验回归直线和经验回归方程
直线=+x称为经验回归直线,此直线方程称为y关于x的经验回归方程,称为 ,称为 ,称为 .
1.判断正误.(正确的画“√”,错误的画“×”)
(1)两个变量之间产生随机误差的原因仅仅是因为测量工具产生的误差.( )
(2)回归方程最能代表观测值x,y之间的线性关系,且经验回归直线过样本点的中心(,).( )
(3)求回归方程前可以不进行相关性检验.( )
(4)利用回归方程求出的值是准确值.( )
2.(多选)下列有关回归方程=x+的叙述正确的是( )
A.反映与x之间的函数关系
B.反映y与x之间的函数关系
C.表示与x之间不确定关系
D.表示最接近y与x之间真实关系的一条直线
3.某地区近十年居民的年收入x与支出y之间的关系大致符合=0.8x+0.1(单位:亿元),则预计今年该地区居民收入为15亿元时,年支出y的估计值是( )
A.8.1 B.12.1
C.16.1 D.20.1
题型一 线性回归模型的理解
【例1】 在线性回归模型y=bx+a+ε中,下列说法正确的是( )
A.y=bx+a+ε是一次函数
B.因变量y是由自变量x唯一确定的
C.因变量y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差ε的产生
D.随机误差ε是由于计算不准确造成的,可通过精确计算避免随机误差ε的产生
通性通法
在线性回归模型y=bx+a+ε中,模型中的y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与ε的和(叠加),前一部分由x所确定,后一部分是随机的.
【跟踪训练】
关于线性回归模型给出下列说法:
①表达式y=bx+a+ε刻画的是变量y与变量x之间的线性相关关系;②bx+a反映了由于x的变化而引起的y的线性变化;③误差项ε是一个期望值为0的随机变量,即E(ε)=0;④对于所有的x值,ε的方差σ2都相同.其中正确的是 (填序号).
题型二 求经验回归方程
【例2】 (链接教科书第164页例3)某班5名学生的数学和物理成绩如下表:
学生 A B C D E
数学成绩x/分 88 76 73 66 63
物理成绩y/分 78 65 71 64 61
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).
参考公式:
==,=-.
通性通法
求经验回归方程的基本步骤
(1)画出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算,,xiyi,,xiyi;
(3)代入公式求出=x+中参数,的值;
(4)写出经验回归方程.
提醒 只有在散点图大致呈线性时,求出的经验回归方程才有实际意义,否则求出的回归方程毫无意义.
【跟踪训练】
入夏以来,天气炎热,某地区用电负荷连创新高,某用户随机统计了家里某4天用电量(kW·h)与当天气温(℃)的情况,数据如表:
气温x(℃) 30 32 34 36
用电量y(kW·h) 20 26 30 36
请根据提供的数据,计算,,并求出y关于x的经验回归方程.
参考公式:=,=-.
题型三 利用经验回归方程对总体进行估计
【例3】 (链接教科书第165页例5)对具有线性相关关系的变量x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到经验回归方程=10.5x+,据此模型预测当x=20时,y的估计值为( )
x 2 4 5 6 8
y 20 40 60 70 80
A.210 B.210.5 C.211.5 D.212.5
通性通法
解题的关键是先确定两个变量y与x是线性相关关系,求出经验回归方程进行估计和预测.
【跟踪训练】
1.某地区调查了2~9岁儿童的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的经验回归方程为=8.25x+60.13,下列说法中正确的是( )
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
2.(2024·淮安月考)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:
零件个数 10 20 30 40 50 60 70 80
加工时间 62 68 75 81 89 95 102 108
设经验回归方程为=x+,若=,则点(,)在直线x-45y-20=0的( )
A.右下方 B.右上方
C.左下方 D.左上方
1.在对两个变量x,y进行线性回归分析时一般有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所搜集的数据绘制散点图.若根据实际情况能够判定变量x,y具有线性相关性,则在下列操作顺序中正确的是( )
A.①②④③ B.③②④①
C.②③①④ D.②④③①
2.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )
A.=1.5x+2 B.=-1.5x+2
C.=1.5x-2 D.=-1.5x-2
3.已知x与y之间的一组数据:
x 0 1 2 3
y m 3 5.5 7
已求得y关于x的经验回归方程为=2.2x+0.7,则m=( )
A.1 B.0.85
C.0.7 D.0.5
4.(2024·宿迁月考)某设备的使用年限x(单位:年)与所支出的维修总费用y(单位:万元)的统计数据如下表所示:
使用年限x/年 2 3 4 5 6
维修总费用y/万元 1.5 4.5 5.5 6.5 7.0
根据上表可得经验回归方程为=1.3x+.若使用年限为14年,估计维修总费用为 万元;若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用 年.
第1课时 经验回归方程
【基础知识·重落实】
知识点一
1.a+bx 2.(1)确定性函数 (2)某些因素的影响 (3)观测
知识点二
1.a+bx+ - 2.回归截距 回归系数 回归值
自我诊断
1.(1)× (2)√ (3)× (4)×
2.AD =x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,故选A、D.
3.B ∵=0.8x+0.1,∴=0.8×15+0.1=12.1(亿元).
【典型例题·精研析】
【例1】 C 对于A中,线性回归模型y=bx+a+ε中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B中,因变量y不是由自变量x唯一确定的,所以B错误;对于C中,因变量y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差ε的产生,所以C正确;对于D中,随机误差是不能避免的,只能将误差缩小,所以D错误.故选C.
跟踪训练
①②③④ 解析:根据线性回归模型的含义可知,以上说法均正确.
【例2】 解:(1)散点图如图所示.
(2)因为=×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8,
xiyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174,
所以=≈0.625,
=-≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为=22.050+0.625x.
跟踪训练
解:==33,==28,
=
=
=2.6,
∴y关于x的经验回归方程为=2.6x-57.8.
【例3】 C 由题意可知,==5,==54.∵经验回归直线经过样本中心点,∴54=10.5×5+,=1.5,经验回归方程为=10.5x+1.5,当x=20时,y的估计值为10.5×20+1.5=211.5.故选C.
跟踪训练
1.B ∵身高与年龄的回归模型为=8.25x+60.13,∴可以估计孩子在2~9岁之内,年龄每增加1岁,身高平均约增加8.25 cm,选项B正确;对于A,身高与年龄是相关关系,不是一次函数关系;对于C,这个模型可以估计孩子在2~9岁时可能的身高,而不是平均身高;对于D,可以估计孩子在2~9岁时可能的身高,这是一个预报值,不是确定的值.故选B.
2.A 由题意可得,
==45,==85,则=-=85-×45=55,故点(,)为,在直线x-45y-20=0的右下方.
随堂检测
1.D 根据实际情况能够判定变量x,y具有线性相关性的顺序为:收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图;求经验回归方程;对所求出的回归方程作出解释.故选D.
2.B 结合散点图可知,变量x,y之间是负相关,且纵截距大于0,故选B.
3.D ==1.5,==,将其代入=2.2x+0.7,可得m=0.5,故选D.
4.18 9 解析:==4,==5,则中心点为(4,5),代入经验回归方程得=5-1.3×4=-0.2,所以=1.3x-0.2.当x=14时,=1.3×14-0.2=18(万元),即估计使用14年时,维修总费用是18万元.令=1.3x-0.2>12,解得x>9.4,即据此模型预测该设备最多可使用9年.
4 / 4(共66张PPT)
9.1.2
一元线性回归模型
新课程标准解读 核心素养
1.结合具体实例,了解一元线性回归模型
的含义,了解模型参数的统计意义,了解
最小二乘原理,掌握一元线性回归模型参
数的最小二乘估计方法,会使用相关的统
计软件 数学抽象、数学建模、
数据分析
2.针对实际问题,会用一元线性回归模型
进行预测 数学建模、数学运算、
数据分析
第1课时 经验回归方程
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比
例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平
高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出
金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物
的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家
庭总支出中用来购买食物的支出所占比例将会下降.
【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个
变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
知识点一 随机误差
1. 定义:具有线性相关关系的两个变量的取值x,y,y的值不能由x
完全确定,可将x,y之间的关系表示为y=a+bx+ ,其中
是确定性函数, 称为随机误差.
a
+bx
(1)所用的 不恰当引起的误差;
(2)忽略了 ;
(3)存在 误差.
确定性函数
某些因素的影响
观测
2. 产生的原因
知识点二 经验回归方程
1. 线性回归模型中a,b值的求法
y= 称为一元线性回归模型.
a,b的估计值为 , ,则
a+bx+
上述方法称为“最小二乘法”.
2. 经验回归直线和经验回归方程
直线 = + x称为经验回归直线,此直线方程称为y关于x的经
验回归方程, 称为 , 称为 , 称
为 .
回归截距
回归系数
回归值
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)两个变量之间产生随机误差的原因仅仅是因为测量工具产生
的误差. ( × )
(2)回归方程最能代表观测值x,y之间的线性关系,且经验回归
直线过样本点的中心( , ). ( √ )
(3)求回归方程前可以不进行相关性检验. ( × )
(4)利用回归方程求出的值是准确值. ( × )
×
√
×
×
2. (多选)下列有关回归方程 = x+ 的叙述正确的是( )
B. 反映y与x之间的函数关系
D. 表示最接近y与x之间真实关系的一条直线
解析: = x+ 表示 与x之间的函数关系,而不是y与x
之间的函数关系,但它反映的关系最接近y与x之间的真实关系,
故选A、D.
3. 某地区近十年居民的年收入x与支出y之间的关系大致符合 =
0.8x+0.1(单位:亿元),则预计今年该地区居民收入为15亿元
时,年支出y的估计值是( )
A. 8.1 B. 12.1
C. 16.1 D. 20.1
解析: ∵ =0.8x+0.1,∴ =0.8×15+0.1=12.1(亿
元).
典型例题·精研析
02
课堂互动 关键能力提升
题型一 线性回归模型的理解
【例1】 在线性回归模型y=bx+a+ε中,下列说法正确的是
( )
A. y=bx+a+ε是一次函数
B. 因变量y是由自变量x唯一确定的
C. 因变量y除了受自变量x的影响外,可能还受到其他因素的影响,
这些因素会导致随机误差ε的产生
D. 随机误差ε是由于计算不准确造成的,可通过精确计算避免随机
误差ε的产生
解析: 对于A中,线性回归模型y=bx+a+ε中,方程表示的不
是确定性关系,因此不是一次函数,所以A错误;对于B中,因变量y
不是由自变量x唯一确定的,所以B错误;对于C中,因变量y除了受
自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随
机误差ε的产生,所以C正确;对于D中,随机误差是不能避免的,
只能将误差缩小,所以D错误.故选C.
通性通法
在线性回归模型y=bx+a+ε中,模型中的y也是随机变量,
其值虽然不能由变量x的值确定,但是却能表示为bx+a与ε的和
(叠加),前一部分由x所确定,后一部分是随机的.
【跟踪训练】
关于线性回归模型给出下列说法:
①表达式y=bx+a+ε刻画的是变量y与变量x之间的线性相关关
系;②bx+a反映了由于x的变化而引起的y的线性变化;③误差项
ε是一个期望值为0的随机变量,即E(ε)=0;④对于所有的x
值,ε的方差σ2都相同.其中正确的是 (填序号).
解析:根据线性回归模型的含义可知,以上说法均正确.
①②③④
题型二 求经验回归方程
【例2】 (链接教科书第164页例3)某班5名学生的数学和物理成绩
如下表:
学生 A B C D E
数学成绩
x/分 88 76 73 66 63
物理成绩
y/分 78 65 71 64 61
(1)画出散点图;
解: 散点图如图所示.
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小
数).
参考公式: = = , = - .
解: 因为 = ×(88+76+73+66+63)=73.2, =
×(78+65+71+64+61)=67.8,
xiyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174,
所以 = ≈0.625,
= - ≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为 =22.050+0.625x.
通性通法
求经验回归方程的基本步骤
(1)画出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算 , , xiyi, , xiyi;
(3)代入公式求出 = x+ 中参数 , 的值;
(4)写出经验回归方程.
提醒 只有在散点图大致呈线性时,求出的经验回归方程才有
实际意义,否则求出的回归方程毫无意义.
【跟踪训练】
入夏以来,天气炎热,某地区用电负荷连创新高,某用户随机统计
了家里某4天用电量(kW·h)与当天气温(℃)的情况,数据如表:
气温x(℃) 30 32 34 36
用电量y
(kW·h) 20 26 30 36
请根据提供的数据,计算 , ,并求出y关于x的经验回归方程.
参考公式: = , = - .
解: = =33, = =28,
=
= =2.6, = - =28-
2.6×33=-57.8,
∴y关于x的经验回归方程为 =2.6x-57.8.
题型三 利用经验回归方程对总体进行估计
【例3】 (链接教科书第165页例5)对具有线性相关关系的变量
x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到经
验回归方程 =10.5x+ ,据此模型预测当x=20时,y的估计值为
( )
x 2 4 5 6 8
y 20 40 60 70 80
A. 210 B. 210.5
C. 211.5 D. 212.5
解析: 由题意可知, = =5, = =
54.∵经验回归直线经过样本中心点,∴54=10.5×5+ , =1.5,
经验回归方程为 =10.5x+1.5,当x=20时,y的估计值为
10.5×20+1.5=211.5.故选C.
通性通法
解题的关键是先确定两个变量y与x是线性相关关系,求出经验
回归方程进行估计和预测.
【跟踪训练】
1. 某地区调查了2~9岁儿童的身高,由此建立的身高y(单位:cm)
与年龄x(单位:岁)的经验回归方程为 =8.25x+60.13,下列
说法中正确的是( )
A. 该地区一个10岁儿童的身高为142.63 cm
B. 该地区2~9岁的儿童每年身高约增加8.25 cm
C. 该地区9岁儿童的平均身高是134.38 cm
D. 利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
解析: ∵身高与年龄的回归模型为 =8.25x+60.13,∴可以
估计孩子在2~9岁之内,年龄每增加1岁,身高平均约增加8.25
cm,选项B正确;对于A,身高与年龄是相关关系,不是一次函数
关系;对于C,这个模型可以估计孩子在2~9岁时可能的身高,而
不是平均身高;对于D,可以估计孩子在2~9岁时可能的身高,这
是一个预报值,不是确定的值.故选B.
2. (2024·淮安月考)一个车间为了规定工时定额,需要确定加工零
件所花费的时间,为此进行了8次试验,收集数据如下:
零件
个数 10 20 30 40 50 60 70 80
加工
时间 62 68 75 81 89 95 102 108
设经验回归方程为 = x+ ,若 = ,则点( , )在直线x
-45y-20=0的( )
A. 右下方 B. 右上方
C. 左下方 D. 左上方
解析: 由题意可得, = =45, =
=85,则 = - =85- ×45=
55,故点( , )为 ,在直线x-45y-20=0的右下方.
1. 在对两个变量x,y进行线性回归分析时一般有下列步骤:①对所
求出的回归方程作出解释;②收集数据(xi,yi),i=1,
2,…,n;③求经验回归方程;④根据所搜集的数据绘制散点图.
若根据实际情况能够判定变量x,y具有线性相关性,则在下列操
作顺序中正确的是( )
A. ①②④③ B. ③②④①
C. ②③①④ D. ②④③①
解析: 根据实际情况能够判定变量x,y具有线性相关性的顺
序为:收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据
绘制散点图;求经验回归方程;对所求出的回归方程作出解释.故
选D.
2. 已知变量x,y之间具有线性相关关系,其散点图如图所示,则其
经验回归方程可能为( )
解析: 结合散点图可知,变量x,y之间是负相关,且纵截距
大于0,故选B.
3. 已知x与y之间的一组数据:
x 0 1 2 3
y m 3 5.5 7
已求得y关于x的经验回归方程为 =2.2x+0.7,则m=( )
A. 1 B. 0.85 C. 0.7 D. 0.5
解析: = =1.5, = = ,将其代入
=2.2x+0.7,可得m=0.5,故选D.
4. (2024·宿迁月考)某设备的使用年限x(单位:年)与所支出的维
修总费用y(单位:万元)的统计数据如下表所示:
使用年限
x/年 2 3 4 5 6
维修总费
用y/万元 1.5 4.5 5.5 6.5 7.0
根据上表可得经验回归方程为 =1.3x+ .若使用年限为14年,
估计维修总费用为 万元;若该设备维修总费用超过12万元就
报废,据此模型预测该设备最多可使用 年.
18
9
解析: = =4, = =5,则中心点为
(4,5),代入经验回归方程得 =5-1.3×4=-0.2,所以 =
1.3x-0.2.当x=14时, =1.3×14-0.2=18(万元),即估计
使用14年时,维修总费用是18万元.令 =1.3x-0.2>12,解得x
>9.4,即据此模型预测该设备最多可使用9年.
知能演练·扣课标
03
课后巩固 核心素养落地
1. 在具有线性相关关系的两个变量建立的经验回归方程 = + x
中, ( )
A. 不能小于0 B. 不能大于0
C. 不能等于0 D. 只能小于0
解析: 当 =0时,不具有线性相关关系,但 能大于0,也能
小于0.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2. 已知某经验回归方程为 =2-3x,则当变量x增加1个单位时,变
量y平均( )
A. 增加3个单位
C. 减少3个单位
解析: 依题意,经验回归方程为 =2-3x,所以当变量x增加
1个单位时,变量y平均减少3个单位.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
3. (2024·镇江月考)设两个变量x和y之间具有线性相关关系,它们
的样本相关系数是r,y关于x的经验回归方程斜率是 ,纵轴上的
截距是 ,那么必有( )
解析: 当 >0时,两变量正相关,此时r>0;当 <0时,两
变量负相关,此时r<0,所以必有 与r的符号相同.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
4. 对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i
=1,2,3,…,8),其经验回归方程为 = x+ ,且x1+x2+
x3+…+x8=6,y1+y2+y3+…+y8=9,则 =( )
A. -2 B. 2
C. -1 D. 1
解析: = = , = ,由于经验回归直线过样本中心点,
将 代入经验回归方程,解得 =1.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
5. (多选)已知变量x,y之间的经验回归方程为 =-0.7x+
10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法
正确的是( )
x 6 8 10 12
y 6 m 3 2
A. 变量x,y之间呈负相关关系
B. m=4
C. 可以预测,当x=11时,y约为2.6
D. 由表格数据知,该经验回归直线必过点(9,4)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由 =-0.7x+10.3,得 =-0.7,故x,y呈负相
关关系,则A正确; = =9, =-0.7×9+10.3=4=
,解得m=5,则B错误;当x=11时,y的预测值为2.6,
则C正确; =9, =4,故经验回归直线必经过点(9,4),则D
正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6. (多选)(2024·盐城月考)数据(x,y)的5组测量值(xi,yi)
(i=1,2,3,4,5),已知 =90, xiyi=112, xi=
20, yi=25.若y对x的经验回归方程记作 = x+ ,则( )
C. y与x正相关
D. x=8时,y的估计值为9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由已知的数据可得 = xi=4, = yi=5,
= = = =1.2, = - =
5-1.2×4=0.2,所以经验回归方程为 =1.2x+0.2.因为 =
1.2>0,所以y与x正相关.当x=8时, =1.2×8+0.2=9.8.故
A、B、C选项正确,D选项错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
7. 如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,
y与x之间的经验回归方程为 = x+1,则 = .
解析:由题图知 = =2, = =2.6,将
(2,2.6)代入 = x+1中,解得 =0.8.
0.8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
8. 为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的
关系,从该班随机抽取10名学生,根据测量数据的散点图可以看
出y与x之间有线性相关关系,设其经验回归方程为 = x+ ,
已知 xi=225, yi=1 600, =4.该班某学生的脚长为24
cm,据此估计其身高为 cm.
解析:由题意可知 =4x+ ,又 =22.5, =160,∴160=
22.5×4+ ,得 =70,因此 =4x+70.当x=24时, =4×24
+70=96+70=166 cm.
166
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9. 某工厂生产某产品的成本x(单位:万元)与销售额y(单位:万
元)的几组对应数据如下表所示:
成本x/万
元 10 20 30 40 50
销售额y/
万元 40 70 110 130 150
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)根据以往经验可知,成本x与销售额y之间具有线性相关关
系,求销售额y关于成本x的经验回归方程;
解: = ×(10+20+30+40+50)=30,
= ×(40+70+110+130+150)=100,
= =2.8,
=100-2.8×30=16,
所以经验回归方程为 =2.8x+16.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)根据(1)中经验回归方程,预测当销售额为200万元时,成
本为多少万元?(结果保留一位小数)
附: xiyi=17 800, =5 500, = .
解: 由(1)知 =2.8x+16,令 =2.8x+16=200,
得x≈65.7(万元),即预测当销售额为200万元时,成本为
65.7万元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10. 根据以下样本数据得到经验回归方程为 = x+ .则( )
x 1 3 5 7
y 6 4.5 3.5 2.5
解析: 由表中数据可得随着x的增大,y越来越小,所以 <
0,又因为当x=1时,y=6,所以当x=0时,y>6,所以 >
0,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
11. (2024·连云港月考)若某地财政收入x与支出y满足线性回归模
型y=bx+a+ε(单位:亿元),其中b=0.7,a=3,|ε|
≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过
( )
A. 9亿元 B. 9.5亿元
C. 10亿元 D. 10.5亿元
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 因为财政收入x与支出y满足线性回归模型y=bx+a
+ε,其中b=0.7,a=3,所以y=0.7x+3+ε.当x=10时,
得y=0.7×10+3+ε=10+ε,又|ε|≤0.5,即-
0.5≤ε≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过
10.5亿元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12. (多选)(2024·南京质检)已知由样本数据(xi,yi)(i=1,
2,3,…,8)组成的一个样本,得到经验回归方程为 =1.5x-
0.6且 =2,去除两个异常数据(-2,7)和(2,-7)后,得
到的新的经验回归直线的斜率为3,则( )
A. 相关变量x,y具有正相关关系
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 对于A,因为经验回归直线的斜率为正,所以相关变
量x,y具有正相关关系,A正确;对于B,因为 =2,所以去除
两个异常数据(-2,7)和(2,-7)后,得到新的 '=
= ,B错误;对于C,将 =2代入 =1.5x-0.6得 =2.4,故
去除两个异常数据(-2,7)和(2,-7)后, '= =
3.2,因为得到的新的经验回归直线的斜率为3,所以 '-3 '=
3.2-3× =-4.8,所以去除异常数据后的经验回归方程为 =
3x-4.8,C正确;对于D,因为经验回归直线 =3x-4.8的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由1.5增大到3,故 值增加的速度变大,D错误.故选A、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
13. 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先
拟定的价格进行试销,得到如下数据:
单价x
(元) 8 8.2 8.4 8.6 8.8 9
销量y
(件) 90 84 83 80 75 68
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)求经验回归方程 = x+ ,其中 =-20;
解: = ×(8+8.2+8.4+8.6+8.8+9)=8.5,
= ×(90+84+83+80+75+68)=80,
所以 = - =80+20×8.5=250,
从而经验回归方程为 =-20x+250.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关
系,若该产品的成本是4元/件,则为使工厂获得最大利润,
该产品的单价应定为多少元?(利润=销售收入-成本)
解: 设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-20(x-8.25)2+361.25,
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14. 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点的零件的多少随机器运转速度的变化而变化,
下表为抽样试验的结果:
转速x(转/秒) 16 14 12 8
每小时生产有缺点的零件数y(件) 11 9 8 5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)画出散点图;
解: 散点图如图所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)如果y与x有线性相关关系,请画出一条直线近似地表示这
种线性关系;
解: 近似直线如图所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)在实际生产中,若y关于x的经验回归方程为 = x- ,
允许每小时生产的产品中有缺点的零件最多为10件,那么机
器的运转速度应控制在什么范围内?
解: 由y≤10得 x- ≤10,
解得x≤14.9,
所以机器的运转速度应控制在14转/秒内.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
谢 谢 观 看!