9.1.2 第2课时 非线性回归模型及拟合效果的判断(课件 学案 练习)高中数学苏教版(2019)选择性必修 第二册

文档属性

名称 9.1.2 第2课时 非线性回归模型及拟合效果的判断(课件 学案 练习)高中数学苏教版(2019)选择性必修 第二册
格式 zip
文件大小 3.3MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-08-09 14:48:38

文档简介

第2课时 非线性回归模型及拟合效果的判断
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2如下表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
则回归模型拟合效果最好的是(  )
A.甲 B.乙
C.丙 D.丁
2.某样本点(xi,yi)(i=1,2,…,n)的经验回归方程为=0.5x+0.7,当x=8时,y的实际值为4.5,则当x=8时,预测值与实际值的差值为(  )
A.0.1 B.0.2
C.0.3 D.0.4
3.(2024·泰州月考)已知变量y关于变量x的经验回归方程为=bln x+0.24,其一组数据如表所示:
x e e3 e4 e6 e7
y 1 2 3 4 5
若x=e10,则y的值大约为(  )
A.4.94 B.5.74
C.6.81 D.8.04
4.如图是一组实验数据的散点图,拟合方程为y=+c(x>0),令t=,则y关于t的经验回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是(  )
A.(0.01,0.02) B.(50,100)
C.(0.02,0.04) D.(100,200)
5.(多选)某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是(  )
A.样本相关系数r变小 B.决定系数R2变大
C.残差平方和变大 D.自变量x与因变量y的相关性变强
6.(多选)(2024·苏州月考)某种商品的价格x(单位:元/kg)与日需求量y(单位:kg)之间的对应数据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得经验回归方程=x+14.4,则以下说法正确的是(  )
A.样本相关系数r>0
B.=-0.32
C.若该商品的价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为-0.4
7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=ln y,求得经验回归方程为=0.25x-2.58,则该模型的回归方程为    .
8.(2024·南通月考)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如下表所示,根据表中数据,得出y关于x的经验回归方程为=0.6x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m=    .
x 3 4 5 6
y 2 3 4 m
9.(2024·南京质检)“绿水青山就是金山银山”的理念推动了新能源汽车产业的迅速发展.以下表格和散点图反映了近几年我国某新能源汽车的年销售量情况.
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
某新能源汽车 年销售量y/万辆 1.5 5.9 17.7 32.9 55.6
(1)请根据散点图判断,y=bx+a与y=cx2+d中哪一个更适宜作为年销售量y关于年份代码x的回归方程类型.(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2025年我国该新能源汽车的年销售量.(精确到0.1)
参考数据:=22.72,(wi-)2=374,(wi-)(yi-)=851.2(其中wi=).
10.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
若由最小二乘法计算得经验回归方程=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型拟合效果的好坏.
11.某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(单位:t)与相应的生产总成本y(单位:万元)的五组对照数据.
产量x/t 1 2 3 4 5
生产总成本y/万元 3 7 8 10 12
(1)根据上表数据,若用最小二乘法进行线性模拟,试求y关于x的经验回归方程=x+.
(2)记第(1)问中所求y与x的经验回归方程=x+为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:=x2+1.其中模型②的残差图(残差=实际值-估计值)如图所示.
请完成模型①的残差表与残差图,并根据残差图,判断哪一个模型更适宜作为y关于x的回归方程,并说明理由.
(3)根据模型①中y与x的经验回归方程,预测产量为6 t时生产总成本为多少万元.
第2课时 非线性回归模型及拟合效果的判断
1.A 决定系数R2越大,表示回归模型的拟合效果越好.
2.B 当x=8时,y的预测值=4.7,4.7-4.5=0.2.故选B.
3.C 令t=ln x,则=bt+0.24.由题意得,=4.2,=3,由线性经验回归直线过样本的中心点,有b=,所以=ln x+0.24,将x=e10代入得≈6.81.故选C.
4.D 根据题意可得y=bt+c(t>0),由y关于t的经验回归直线过点(2,5),(12,25)可得:解得所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02,所以0.005<t<0.01,所以0.005<<0.01,所以100<x<200,故选D.
5.BD 根据散点图可知,去掉点D(3,10)后,y与x的线性相关性加强,且为正相关,样本相关系数r变大,则A错,D对;去掉点D(3,10)后,残差平方和变小,则R2变大,B对,C错.故选B、D.
6.BCD 对于A、B,由题表中的数据,得==20,==8,将,代入=x+14.4得=-0.32,所以A选项说法错误,B选项说法正确;对于C,将x=35代入=-0.32x+14.4,得=3.2,所以日需求量大约为3.2 kg,所以C选项说法正确;对于D,第四个样本点对应的残差为y4-=6-(-0.32×25+14.4)=-0.4,所以D选项说法正确.故选B、C、D.
7.=e0.25x-2.58 解析:由z=ln y,=0.25x-2.58,得ln =0.25x-2.58,所以=e0.25x-2.58.故该模型的回归方程为=e0.25x-2.58.
8.4.8 解析:∵样本(4,3)处的残差为-0.15,且y关于x的经验回归方程为=0.6x+,∴3-(0.6×4+)=-0.15,解得=0.75,故经验回归方程为=0.6x+0.75,∵==4.5,==,∴=0.6×4.5+0.75,解得m=4.8.
9.解:(1)根据散点图可知,y=cx2+d更适宜作为年销售量y关于年份代码x的回归方程类型.
(2)令w=x2,则=w+.
易知=11,==≈2.28,
=-≈22.72-2.28×11=-2.36,
所以=2.28w-2.36,
所以y关于x的回归方程为=2.28x2-2.36.
令x=6,得=79.72≈79.7.
故预测2025年我国该新能源汽车的年销售量为79.7万辆.
10.解:(1)由=xi+,可以算得=yi-.
分别为=0.35,=0.718,=-0.5,=-2.214,=1.624,
所以残差平方和为()2≈8.43.
(2)由表中数据得=43.5,(yi-)2=50.18,
故R2=1-≈1-≈0.832.
所以回归模型的拟合效果较好.
11.解:(1)计算=(1+2+3+4+5)=3,
=(3+7+8+10+12)=8,
=12+22+32+42+52=55,
xiyi=1×3+2×7+3×8+4×10+5×12=141,
===2.1,
=-=8-2.1×3=1.7,
因此,经验回归方程为=2.1x+1.7.
(2)模型①的残差表为
x 1 2 3 4 5
y 3 7 8 10 12
3.8 5.9 8 10.1 12.2
-0.8 1.1 0 -0.1 -0.2
画出残差图,如图所示:
结论:模型①更适宜作为y关于x的回归方程,理由1:模型①的5个样本点的残差点落在的带状区域比模型②的带状区域更窄;
理由2:模型①的5个样本点的残差点比模型②的残差点更贴近x轴.(写出一个理由即可)
(3)根据模型①中y与x的经验回归方程,计算x=6时,=2.1×6+1.7=14.3,
所以预测产量为6吨时生产总成本为14.3万元.
3 / 3第2课时 非线性回归模型及拟合效果的判断
  设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据如下表所示:
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 9 11 12 13
  作出这组数据的散点图近似描述y与x的关系,很显然,这些散点不在一条直线附近.
【问题】 你能求出这个函数模型吗?
                                                                                      
知识点一 非线性经验回归方程
1.非线性回归分析的思想
研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.
2.非线性经验回归方程
当回归方程不是形如=x+(,∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.
3.求非线性经验回归方程的一般步骤
知识点二 残差分析
1.残差:一般地,我们将    与对应的估计值    称为残差.残差是随机误差ε的估计结果.
2.残差图:以观测值为横坐标,残差为纵坐标作点,可以画出残差图.
3.残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
知识点三 对模型刻画数据效果的分析
1.残差图法:在残差图中,如果残差点比较均匀地分布在横轴的两边,则说明回归方程较好地刻画了两个变量的关系,这样的带状区域的宽度越窄,说明模型拟合精度越高.
2.残差平方和法*:残差平方和(yi-)2越小,模型的拟合效果越好.
3.决定系数R2法*:可以用R2=1-来比较两个模型的拟合效果,R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)残差平方和越接近0, 线性回归模型的拟合效果越好.(  )
(2)R2越小, 线性回归模型的拟合效果越好.(  )
(3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.(  )
2.已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第几个(  )
A.5        B.6
C.7 D.8
3.某校数学学习兴趣小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,由试验数据得到如图所示的散点图.由此散点图,可以得出最适宜作为发芽率y和温度x的回归模型的是(  )
A.y=a+bx B.y=a+bln x
C.y=a+bex D.y=a+bx2
题型一 求非线性经验回归方程
【例1】 (2024·扬州月考)某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量yi(i=1,2,…,10)的数据,得到散点图如图所示.
(1)利用散点图判断y=a+bx和y=c·xd(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);
(2)对数据作出如下处理,令ui=ln xi,vi=ln yi,得到相关统计量的值如下表:
vi ui (ui-)(vi-) (ui-)2
15 15 28.25 56.5
根据(1)的判断结果及表中数据, 求y关于x的回归方程.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=+u的斜率和截距的最小二乘估计分别为=,=-.
通性通法
非线性回归问题的处理方法
(1)指数函数型y=ebx+a:两边取对数得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b;
(2)对数函数型y=bln x+a:设x'=ln x,原方程可化为y=bx'+a,再根据线性回归模型的方法求出a,b;
(3)y=bx2+a型:设x'=x2,原方程可化为y=bx'+a,再根据线性回归模型的方法求出a,b.
【跟踪训练】
1.若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的经验回归方程,则需做变换t=(  )
A.x2 B.(x+a)2
C.(x+)2 D.以上都不对
2.(2024·镇江月考)已知变量y关于x的非线性经验回归方程为y=ebx-0.5,若对y=ebx-0.5两边取自然对数,可以发现ln y与x线性相关,现有一组数据如下表所示,x=5时,预测y值为    .
x 1 2 3 4
y e e3 e4 e6
题型二 残差与残差分析
【例2】 (2024·徐州月考)某运动员训练次数x与成绩y的数据如表:
次数x 30 33 35 37 39 44 46 50
成绩y 30 34 37 39 42 46 48 51
(1)建立成绩y关于次数x的经验回归方程(结果精确到0.001);
(2)用残差分析的方法判断用线性回归模型是否合理.
参考数据:=12 656,xiyi=13 180.
通性通法
1.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
2.残差是随机误差的估计值,=yi-.
【跟踪训练】
1.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是(  )
2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+,若样本点(r,1)与(1,s)的残差相同,则有(  )
A.r=s B.s=2r
C.s=-2r+3 D.s=2r+1
题型三 残差平方和法*与决定系数R2法*
【例3】 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
(1)求y关于x的经验回归方程;
(2)借助残差平方和与R2说明回归模型拟合效果的好坏.
(参考公式及数据:=,=-,=1 660,xiyi=620,(yi-)2=53.2)
通性通法
刻画回归效果的三种方法
(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;
(2)残差平方和法:残差平方和(yi-)2越小,模型的拟合效果越好;
(3)决定系数法:R2=1-越接近1,表明模型的拟合效果越好.
【跟踪训练】
1.一组数据(xi,yi)经过分析,提出了四种回归模型①②③④,四种模型残差平方和的值分别是1.23,0.80,0.12,1.36.则拟合效果最好的是(  )
A.模型① B.模型②
C.模型③ D.模型④
2.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了    的热茶销售杯数变化,而随机误差贡献了剩余的    ,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
1.(2024·淮安月考)某种产品的投入x(单位:万元)与收入y(单位:万元)之间的关系如下表所示:
x/万元 2 4 5 6 8
y/万元 30 40 60 50 70
若y与x的经验回归方程为=6.5x+17.5,则相应于点(4,40)的残差为(  )
A.-4.5 B.4.5
C.-3.5 D.3.5
2.用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程z=2x+a,则=(  )
A.e B.
C. D.2
第2课时 非线性回归模型及拟合效果的判断
【基础知识·重落实】
知识点二
1.观测值 之差
自我诊断
1.(1)√ (2)× (3)√
2.B 原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.
3.B 由散点图可知,数据分布成递增趋势,但是呈现上凸效果,即增加越来越缓慢.A中,y=a+bx是直线型,均匀增长,不符合要求;B中,y=a+bln x是对数型,增长越来越缓慢,符合要求;C中,y=a+bex是指数型,爆炸式增长,增长越来越快,不符合要求;D中,y=a+bx2是二次函数型,图象既有上升,又有下降,不符合要求.
【典型例题·精研析】
【例1】 解:(1)由散点图可知,选择回归方程类型y=c·xd更适合.
(2)对y=c·xd两边取对数,得ln y=ln c+dln x,即v=ln c+du.
由表中数据求得===,
===.
令ln c=m,
则=-=-×=,即c=,
所以年销售量y与年研发费用x的回归方程为=.
跟踪训练
1.C y=ax2+bx+c=a(x+)2+(a≠0),可令t=(x+)2,则y=at+为y关于t的经验回归方程.
2.e7.5 解析:对y=ebx-0.5两边取对数,得ln y=bx-0.5,令z=ln y则z=bx-0.5,列表如下:
x 1 2 3 4
y e e3 e4 e6
z 1 3 4 6
==2.5,==3.5 ,代入=b-0.5得3.5=b·2.5-0.5,故b=1.6,故z=1.6x-0.5,y=e1.6x-0.5,当x=5时,y=e1.6×5-0.5=e7.5.
【例2】 解:(1)∵=39.25,=40.875,
∴=
=≈1.041,
=-≈0.016.
∴经验回归方程为=1.041x+0.016.
(2)某运动员训练次数与成绩之间的数据及相应的残差数据为
x 30 33 35 37
y 30 34 37 39
ε=y- -1.246 -0.369 0.549 0.467
x 39 44 46 50
y 42 46 48 51
ε=y- 1.385 0.18 0.098 -1.066
残差图如图所示.
由图可知,残差比较均匀地分布在横轴的两边,说明该线性回归模型比较合理.
跟踪训练
1.A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
2.C 样本点(r,1)的残差为1-2r-,样本点(1,s)的残差为s--2,依题意得1-2r-=s--2,故s=-2r+3.
【例3】 解:(1)=×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
所以===-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是=-1.15x+28.1.
(2)列出残差表为
yi- 0 0.3 -0.4 -0.1 0.2
yi- 4.6 2.6 -0.4 -2.4 -4.4
所以(yi-)2=0.3,且(yi-)2=53.2,
R2=1-≈0.994,
所以回归模型的拟合效果很好.
跟踪训练
1.C 残差平方和越小则拟合效果越好,而模型③的残差平方和最小,所以C正确.故选C.
2.85% 15% 解析:由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.
随堂检测
1.C =4×6.5+17.5=43.5,ε=40-43.5=-3.5.
2.D 对y=aebx+1(a>0)两边同时取自然对数,得ln y=ln(aebx+1)=ln a+bx+1,令z=ln y,则z=bx+ln a+1,所以解得所以=2.故选D.
4 / 5(共70张PPT)
第2课时 
非线性回归模型及拟合效果的判断
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
  设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据
如下表所示:
第x天 1 4 9 16 25 36 49
高度
y/cm 0 4 7 9 11 12 13
  作出这组数据的散点图近似描述y与x的关系,很显然,这
些散点不在一条直线附近.
【问题】 你能求出这个函数模型吗?
                                          
 
知识点一 非线性经验回归方程
1. 非线性回归分析的思想
研究两个变量的关系时,依据样本点画出散点图,从整体上看,如
果样本点没有分布在某个带状区域内,就称这两个变量之间不具有
线性相关关系,此时不能直接利用经验回归方程来建立两个变量之
间的关系.
2. 非线性经验回归方程
当回归方程不是形如 = x+ ( , ∈R)时,称之为非线性
经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分
布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回
归模型建立两个变量间的非线性经验回归方程.
3. 求非线性经验回归方程的一般步骤
知识点二 残差分析
1. 残差:一般地,我们将 与对应的估计值 称为残
差.残差是随机误差ε的估计结果.
2. 残差图:以观测值为横坐标,残差为纵坐标作点,可以画出残
差图.
3. 残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及
判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
观测值 
之差 
知识点三 对模型刻画数据效果的分析
1. 残差图法:在残差图中,如果残差点比较均匀地分布在横轴的两
边,则说明回归方程较好地刻画了两个变量的关系,这样的带状区
域的宽度越窄,说明模型拟合精度越高.
2. 残差平方和法*:残差平方和 (yi- )2越小,模型的拟合效果
越好.
3. 决定系数R2法*:可以用R2=1- 来比较两个模型的拟
合效果,R2越大,模型的拟合效果越好,R2越小,模型的拟合效
果越差.
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)残差平方和越接近0, 线性回归模型的拟合效果越好.
( √ )
(2)R2越小, 线性回归模型的拟合效果越好. ( × )
(3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.
( √ )

×

2. 已知某成对样本数据的残差图如图,则样本点数据中可能不准确的
是从左到右第几个(  )
A. 5 B. 6
C. 7 D. 8
解析:  原始数据中的可疑数据往往是残差绝对值过大的那个数
据,即偏离平衡位置过大.
3. 某校数学学习兴趣小组为研究某作物种子的发芽率y和温度x(单
位:℃)的关系,由试验数据得到如图所示的散点图.由此散点
图,可以得出最适宜作为发芽率y和温度x的回归模型的是
(  )
A. y=a+bx B. y=a+bln x
C. y=a+bex D. y=a+bx2
解析:  由散点图可知,数据分布成递增趋势,但是呈现上凸效
果,即增加越来越缓慢.A中,y=a+bx是直线型,均匀增长,不
符合要求;B中,y=a+bln x是对数型,增长越来越缓慢,符合
要求;C中,y=a+bex是指数型,爆炸式增长,增长越来越快,
不符合要求;D中,y=a+bx2是二次函数型,图象既有上升,又
有下降,不符合要求.
典型例题·精研析
02
课堂互动 关键能力提升
题型一 求非线性经验回归方程
【例1】 (2024·扬州月考)某企业为确定下一年投入某种产品的研
发费用,需了解年研发费用x(单位:千万元)对年销售量y(单
位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量
yi(i=1,2,…,10)的数据,得到散点图如图所示.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),
其经验回归直线 = + u的斜率和截距的最小二乘估计分别
为 = , = - .
(1)利用散点图判断y=a+bx和y=c·xd(其中c,d均为大于0的
常数)哪一个更适合作为年销售量y和年研发费用x的回归方程
类型(只要给出判断即可,不必说明理由);
解: 由散点图可知,选择回归方程类型y=c·xd更适合.
(2)对数据作出如下处理,令ui=ln xi,vi=ln yi,得到相关统计量
的值如下表:
15 15 28.25 56.5
根据(1)的判断结果及表中数据, 求y关于x的回归方程.
解:对y=c·xd两边取对数,得ln y=ln c+dln x,即v=ln c+du.
由表中数据求得 = = = ,
= = = .
令ln c=m,
则 = - = - × = ,即c= ,
所以年销售量y与年研发费用x的回归方程为 = .
通性通法
非线性回归问题的处理方法
(1)指数函数型y=ebx+a:两边取对数得ln y=ln ebx+a,即ln y=bx
+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根
据线性回归模型的方法求出a,b;
(2)对数函数型y=bln x+a:设x'=ln x,原方程可化为y=bx'+
a,再根据线性回归模型的方法求出a,b;
(3)y=bx2+a型:设x'=x2,原方程可化为y=bx'+a,再根据线
性回归模型的方法求出a,b.
【跟踪训练】
1. 若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的经验回
归方程,则需做变换t=(  )
A. x2 B. (x+a)2
D. 以上都不对
解析:  y=ax2+bx+c=a(x+ )2+ (a≠0),可
令t=(x+ )2,则y=at+ 为y关于t的经验回归方程.
2. (2024·镇江月考)已知变量y关于x的非线性经验回归方程为y=
ebx-0.5,若对y=ebx-0.5两边取自然对数,可以发现ln y与x线性相
关,现有一组数据如下表所示,x=5时,预测y值为 .
x 1 2 3 4
y e e3 e4 e6
e7.5 
解析:对y=ebx-0.5两边取对数,得ln y=bx-0.5,令z=ln y则z
=bx-0.5,列表如下:
x 1 2 3 4
y e e3 e4 e6
z 1 3 4 6
= =2.5, = =3.5 ,代入 =b -0.5得3.5=
b·2.5-0.5,故b=1.6,故z=1.6x-0.5,y=e1.6x-0.5,当x=5
时,y=e1.6×5-0.5=e7.5.
题型二 残差与残差分析
【例2】 (2024·徐州月考)某运动员训练次数x与成绩y的数据
如表:
次数x 30 33 35 37 39 44 46 50
成绩y 30 34 37 39 42 46 48 51
(1)建立成绩y关于次数x的经验回归方程(结果精确到0.001);
解: ∵ =39.25, =40.875,
∴ = = ≈1.041,
= - ≈0.016.
∴经验回归方程为 =1.041x+0.016.
(2)用残差分析的方法判断用线性回归模型是否合理.
参考数据: =12 656, xiyi=13 180.
解: 某运动员训练次数与成绩之间的数据及相应的残差数据为
x 30 33 35 37 39 44 46 50
y 30 34 37 39 42 46 48 51

1.246 -
0.369 0.549 0.467 1.385 0.18 0.098 -
1.066
残差图如图所示.
由图可知,残差比较均匀地分布在横轴的两边,说明该线性回归
模型比较合理.
通性通法
1. 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合
适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方
程的预报精度越高.
2. 残差是随机误差的估计值, =yi- .
【跟踪训练】
1. 对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出
残差图,则下列模型拟合精度最高的是(  )
解析:  用残差图判断模型的拟合效果,残差点比较均匀地落在
水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越
窄,说明模型的拟合精度越高.
2. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归
方程为 =2x+ ,若样本点(r,1)与(1,s)的残差相同,
则有(  )
A. r=s B. s=2r
C. s=-2r+3 D. s=2r+1
解析: 样本点(r,1)的残差为1-2r- ,样本点(1,s)
的残差为s- -2,依题意得1-2r- =s- -2,故s=-2r
+3.
题型三 残差平方和法*与决定系数R2法*
【例3】 已知某种商品的价格x(单位:元)与需求量y(单位:
件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
(1)求y关于x的经验回归方程;
解: = ×(14+16+18+20+22)=18,
= ×(12+10+7+5+3)=7.4,
所以 = = =-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是 =-1.15x+28.1.
(2)借助残差平方和与R2说明回归模型拟合效果的好坏.
(参考公式及数据: = , = - , =1
660, xiyi=620, (yi- )2=53.2)
解: 列出残差表为
0 0.3 -0.4 -0.1 0.2
4.6 2.6 -0.4 -2.4 -4.4
所以 (yi- )2=0.3,且 (yi- )2=53.2,
R2=1- ≈0.994,所以回归模型的拟合效果很好.
通性通法
刻画回归效果的三种方法
(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用
的模型比较合适;
(2)残差平方和法:残差平方和 (yi- )2越小,模型的拟合效
果越好;
(3)决定系数法:R2=1- 越接近1,表明模型的拟合效
果越好.
【跟踪训练】
1. 一组数据(xi,yi)经过分析,提出了四种回归模型①②③④,四
种模型残差平方和 的值分别是1.23,0.80,0.12,
1.36.则拟合效果最好的是(  )
A. 模型① B. 模型②
C. 模型③ D. 模型④
解析:  残差平方和越小则拟合效果越好,而模型③的残差平方
和最小,所以C正确.故选C.
2. 在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,
则表明气温解释了 的热茶销售杯数变化,而随机误差贡献
了剩余的 ,所以气温对热茶销售杯数的效应比随机误差的
效应大得多.
解析:由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,
而随机误差贡献了剩余的15%.
85% 
15% 
1. (2024·淮安月考)某种产品的投入x(单位:万元)与收入y(单
位:万元)之间的关系如下表所示:
x/万元 2 4 5 6 8
y/万元 30 40 60 50 70
若y与x的经验回归方程为 =6.5x+17.5,则相应于点(4,40)
的残差为(  )
A. -4.5 B. 4.5
解析:   =4×6.5+17.5=43.5,ε=40-43.5=-3.5.
C. -3.5 D. 3.5
2. 用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换
后得到经验回归方程z=2x+a,则 =(  )
A. e
解析:  对y=aebx+1(a>0)两边同时取自然对数,得ln y=ln
(aebx+1)=ln a+bx+1,令z=ln y,则z=bx+ln a+1,所以
解得所以 =2.故选D.
D. 2
知能演练·扣课标
03
课后巩固 核心素养落地
1. 甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选
择了4种不同模型,计算可得它们的决定系数R2如下表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
则回归模型拟合效果最好的是(  )
A. 甲 B. 乙 C. 丙 D. 丁
解析:  决定系数R2越大,表示回归模型的拟合效果越好.
1
2
3
4
5
6
7
8
9
10
11
2. 某样本点(xi,yi)(i=1,2,…,n)的经验回归方程为 =
0.5x+0.7,当x=8时,y的实际值为4.5,则当x=8时,预测值
与实际值的差值为(  )
A. 0.1 B. 0.2
C. 0.3 D. 0.4
解析:  当x=8时,y的预测值 =4.7,4.7-4.5=0.2.故选B.
1
2
3
4
5
6
7
8
9
10
11
3. (2024·泰州月考)已知变量y关于变量x的经验回归方程为 =
bln x+0.24,其一组数据如表所示:
x e e3 e4 e6 e7
y 1 2 3 4 5
若x=e10,则y的值大约为(  )
A. 4.94 B. 5.74
C. 6.81 D. 8.04
1
2
3
4
5
6
7
8
9
10
11
解析:  令t=ln x,则 =bt+0.24.由题意得, =4.2, =
3,由线性经验回归直线过样本的中心点,有b= ,所以 = ln
x+0.24,将x=e10代入得 ≈6.81.故选C.
1
2
3
4
5
6
7
8
9
10
11
4. 如图是一组实验数据的散点图,拟合方程为y= +c(x>0),
令t= ,则y关于t的经验回归直线过点(2,5),(12,25),
则当y∈(1.01,1.02)时,x的取值范围是(  )
A. (0.01,0.02) B. (50,100)
C. (0.02,0.04) D. (100,200)
1
2
3
4
5
6
7
8
9
10
11
解析:  根据题意可得y=bt+c(t>0),由y关于t的经验回
归直线过点(2,5),(12,25)可得:解得
所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1
<1.02,所以0.005<t<0.01,所以0.005< <0.01,所以100<
x<200,故选D.
1
2
3
4
5
6
7
8
9
10
11
5. (多选)某研究小组采集了5组数据,作出如图所示的散点图.若去
掉D(3,10)后,下列说法正确的是(  )
A. 样本相关系数r变小
B. 决定系数R2变大
C. 残差平方和变大
D. 自变量x与因变量y的相关性变强
1
2
3
4
5
6
7
8
9
10
11
解析: 根据散点图可知,去掉点D(3,10)后,y与x的线
性相关性加强,且为正相关,样本相关系数r变大,则A错,D
对;去掉点D(3,10)后,残差平方和变小,则R2变大,B对,C
错.故选B、D.
1
2
3
4
5
6
7
8
9
10
11
6. (多选)(2024·苏州月考)某种商品的价格x(单位:元/kg)与
日需求量y(单位:kg)之间的对应数据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得经验回归方程 = x+14.4,则以下说法正
确的是(  )
A. 样本相关系数r>0
C. 若该商品的价格为35元/kg,则日需求量大约为3.2 kg
D. 第四个样本点对应的残差为-0.4
1
2
3
4
5
6
7
8
9
10
11
解析:  对于A、B,由题表中的数据,得 =
=20, = =8,将 , 代入 = x+14.4得 =-
0.32,所以A选项说法错误,B选项说法正确;对于C,将x=35代
入 =-0.32x+14.4,得 =3.2,所以日需求量大约为3.2 kg,
所以C选项说法正确;对于D,第四个样本点对应的残差为y4-
=6-(-0.32×25+14.4)=-0.4,所以D选项说法正确.故选
B、C、D.
1
2
3
4
5
6
7
8
9
10
11
7. 在研究两个变量的相关关系时,观察散点图发现样本点集中于某一
条指数曲线y=ebx+a的周围,令z=ln y,求得经验回归方程为 =
0.25x-2.58,则该模型的回归方程为 .
解析:由z=ln y, =0.25x-2.58,得ln =0.25x-2.58,所以
=e0.25x-2.58.故该模型的回归方程为 =e0.25x-2.58.
=e0.25x-2.58 
1
2
3
4
5
6
7
8
9
10
11
8. (2024·南通月考)某工厂为研究某种产品的产量x(吨)与所需某
种原材料y(吨)的相关性,在生产过程中收集了对应数据如下表
所示,根据表中数据,得出y关于x的经验回归方程为 =0.6x+
.据此计算出在样本(4,3)处的残差为-0.15,则表中m
= .
x 3 4 5 6
y 2 3 4 m
4.8 
1
2
3
4
5
6
7
8
9
10
11
解析:∵样本(4,3)处的残差为-0.15,且y关于x的经验回归
方程为 =0.6x+ ,∴3-(0.6×4+ )=-0.15,解得 =
0.75,故经验回归方程为 =0.6x+0.75,∵ = =4.5,
= = ,∴ =0.6×4.5+0.75,解得m=4.8.
1
2
3
4
5
6
7
8
9
10
11
9. (2024·南京质检)“绿水青山就是金山银山”的理念推动了新能
源汽车产业的迅速发展.以下表格和散点图反映了近几年我国某新
能源汽车的年销售量情况.
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
某新能源汽车 年销售量y/万辆 1.5 5.9 17.7 32.9 55.6
1
2
3
4
5
6
7
8
9
10
11
(1)请根据散点图判断,y=bx+a与y=cx2+d中哪一个更适宜
作为年销售量y关于年份代码x的回归方程类型.(给出判断
即可,不必说明理由)
解: 根据散点图可知,y=cx2+d更适宜作为年销售量
y关于年份代码x的回归方程类型.
1
2
3
4
5
6
7
8
9
10
11
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方
程,并预测2025年我国该新能源汽车的年销售量.(精确到
0.1)
参考数据: =22.72, (wi- )2=374, (wi-
)(yi- )=851.2(其中wi= ).
1
2
3
4
5
6
7
8
9
10
11
解: 令w=x2,则 = w+ .
易知 =11, = =≈2.28,
= - ≈22.72-2.28×11=-2.36,
所以 =2.28w-2.36,
所以y关于x的回归方程为 =2.28x2-2.36.
令x=6,得 =79.72≈79.7.
故预测2025年我国该新能源汽车的年销售量为79.7万辆.
1
2
3
4
5
6
7
8
9
10
11
10. 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得
5组数据如下:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
若由最小二乘法计算得经验回归方程 =0.29x+34.7.
1
2
3
4
5
6
7
8
9
10
11
(1)计算各组残差,并计算残差平方和;
解: 由 = xi+ ,可以算得 =yi- .
分别为 =0.35, =0.718, =-0.5, =-
2.214, =1.624,
所以残差平方和为 ( )2≈8.43.
1
2
3
4
5
6
7
8
9
10
11
解: 由表中数据得 =43.5, (yi- )2=50.18,
故R2=1- ≈1- ≈0.832.
所以回归模型的拟合效果较好.
(2)求R2,并说明回归模型拟合效果的好坏.
1
2
3
4
5
6
7
8
9
10
11
11. 某企业坚持以市场需求为导向,合理配置生产资源,不断改
革、探索销售模式.下表是该企业每月生产的一种核心产品的
产量x(单位:t)与相应的生产总成本y(单位:万元)的五
组对照数据.
产量x/t 1 2 3 4 5
生产总成
本y/万元 3 7 8 10 12
1
2
3
4
5
6
7
8
9
10
11
(1)根据上表数据,若用最小二乘法进行线性模拟,试求y关于
x的经验回归方程 = x+ .
解: 计算 = (1+2+3+4+5)=3,
= (3+7+8+10+12)=8,
=12+22+32+42+52=55,
xiyi=1×3+2×7+3×8+4×10+5×12=141,
1
2
3
4
5
6
7
8
9
10
11
= = =2.1,
= - =8-2.1×3=1.7,
因此,经验回归方程为 =2.1x+1.7.
1
2
3
4
5
6
7
8
9
10
11
(2)记第(1)问中所求y与x的经验回归方程 = x+ 为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②: = x2+1.其中模型②的残差图(残差=实际值-估计值)如图所示.
请完成模型①的残差表与残差图,并根据残差图,判断哪一
个模型更适宜作为y关于x的回归方程,并说明理由.
1
2
3
4
5
6
7
8
9
10
11
解: 模型①的残差表为
x 1 2 3 4 5
y 3 7 8 10 12
3.8 5.9 8 10.1 12.2
-0.8 1.1 0 -0.1 -0.2
1
2
3
4
5
6
7
8
9
10
11
画出残差图,如图所示:
结论:模型①更适宜作为y
关于x的回归方程,理由1:
模型①的5个样本点的残差
点落在的带状区域比模型②
的带状区域更窄;
理由2:模型①的5个样本点的残差点比模型②的残差点更贴近x轴.(写出一个理由即可)
1
2
3
4
5
6
7
8
9
10
11
(3)根据模型①中y与x的经验回归方程,预测产量为6 t时生产
总成本为多少万元.
解: 根据模型①中y与x的经验回归方程,计算x=6
时, =2.1×6+1.7=14.3,
所以预测产量为6吨时生产总成本为14.3万元.
1
2
3
4
5
6
7
8
9
10
11
谢 谢 观 看!