8.2 第2课时 非线性回归模型(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册

文档属性

名称 8.2 第2课时 非线性回归模型(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册
格式 zip
文件大小 11.8MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-09-11 21:26:00

文档简介

(共91张PPT)
8.2 一元线性回归模型及其应用
第2课时 非线性回归模型
探究点一 用拟合效果分析非线性回归问题
探究点二 非线性回归模型的应用
探究点一 用拟合效果分析非线性回归问题
例1(1) 在求解两个变量与 的回归模型中,分别给出了4个不同
模型,它们的决定系数 如下表,其中拟合效果最好的是( )
模型1 模型2 模型3 模型4
0.25 0.50 0.98 0.80
A.模型1 B.模型2 C.模型3 D.模型4
[解析] 决定系数越大,模型的拟合效果越好, 模型3的拟合效
果最好.故选C.

(2)变量和 的散点图如图所示,则下列说
法中正确的是______(填序号).
①②
①与 负相关;
②在该相关关系中,若用 拟合时的
③, 之间不能建立经验回归方程.
决定系数为,用拟合时的决定系数为,则 ;
[解析] 散点图中的点散布在从左上角到右下角的区域内,则这两个
变量负相关,故①正确;
由散点图知,用 拟合的效果比
用拟合的效果更好,所以
,故②正确;
, 之间能建立经验回归方程,只不过拟合效果不好,故③不正确.
故填①②.
[素养小结]
(1)两个变量与的回归模型中,决定系数 越大,拟合效果越好.
(2)根据散点图可以判断两个变量之间的相关性,根据样本点的分
布选取合适的函数模型.
探究点二 非线性回归模型的应用
例2 [2024·华南师大附中高二期中] 某地政府为提高当地农民收入,
鼓励农民种植药材.以下是某农户近5年种植药材的年收入的统计数据:
年份 2020 2021 2022 2023 2024
1 2 3 4 5
59 61 64 68 73
(1)根据表中数据,决定使用模型拟合与 之间的关
系,求此模型的经验回归方程.(结果保留一位小数)
参考数据及公式:在经验回归方程 中,
,.设 ,则
, .
解:根据农户近5年种植药材的收入情况的统计数据可得,


由 ,可得 ,则
, ,
所以此模型的经验回归方程为 .
(2)统计学中常通过计算残差的平方和来判断模型的拟合效果,在
本题中,若残差的平方和小于 ,则认为拟合效果符合要求.请判断
(1)中经验回归方程的拟合效果是否符合要求?并说明理由.
解:分别将,2,3,4,5代入 ,可得估计值为
59,,,68, ,则残差的平方和为
因为,所以经验回归方程 的拟合效果符
合要求.
变式 为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决
定增加一定数量的研发人员,经过调研,得到年收益增量
(单位:亿元)与研发人员增量 的10组数据.现用模型
, 分别进行拟合,由此得到相应的经验
回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中, .
7.5 2.25 82.50 4.50 12.14 2.88
(1)根据残差图,判断应选择哪个模型.(无需说明理由)
解:选择模型②,理由如下:
由于模型②残差点比较均匀地落
在水平的带状区域中,且带状区
域的宽度比模型①的带状宽度窄,
所以模型②的拟合精度更高,经
验回归方程的预报精度相应就会越高,所以选模型②比较合适.
(2)根据(1)中所选模型,求出关于 的经验回归方程,并用该
模型估计,要使年收益增量超过8亿元,研发人员增量至少为多少人?
(结果保留整数)
解:根据模型②,令,与 可用线性回归模型来拟合,且

由题表中数据可得 ,

则关于的经验回归方程为 ,
所以关于的经验回归方程为 .
由,解得 ,所以估计要使年收益增
量超过8亿元,研发人员增量至少为10人.
[素养小结]
解决非线性回归问题的方法及步骤
(1)确定变量:确定解释变量为,响应变量为 ;
(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函
数、对数函数、二次函数)图象作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;
(4)分析拟合效果:通过计算决定系数来判断拟合效果;
(5)写出非线性经验回归方程.
当回归方程不是形如 时,称之为非线性经验回
归方程.
当两个变量不呈现线性相关关系时,依据样本点的分布选择合适的
曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两
个变量间的非线性经验回归方程.
常见非线性经验回归方程的转换方式如下:
曲线方程 曲线(曲线的一 部分) 变换公式 变换后的线性
函数
______________________ ____________________
__________________ _____________________
曲线方程 曲线(曲线的一 部分) 变换公式 变换后的线性
函数
________________________________________________
_____________________ _________________________
续表
1.有些非线性回归分析问题并不给出经验公式,这时我们可以画出已
知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数
函数等)的图像进行比较,挑选一种跟这些散点拟合得最好的函数,
进行适当的变换,把问题化为线性回归分析问题,使之得到解决.
其一般步骤为:
例1 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传
费(单位:千元)对年销售量(单位:和年利润 (单位:千元)
的影响.对近8年的年宣传费和年销售量 数据进行初
步处理,得到如图所示的散点图及一些统计量的值.
46.6 563 6. 8 289.8 1.6 1469 108.8
表中, .
(1)根据散点图判断,
与 哪一个
更适宜作为年销售量 关于年宣传
费 的回归模型?(给出判断即可,
不必说明理由)
解:由散点图可以判断,更适宜作为年销售量 关于年
宣传费 的回归模型.
(2)根据(1)的判断结果及表中数据,建立关于 的非线性经验
回归方程.
附:对于一组数据,, , ,其经验回归直
线 的斜率和纵截距的最小二乘估计分别为
, .
解:令,则 .


所以关于的经验回归方程为,因此关于 的非
线性经验回归方程为 .
(3)已知这种产品的年利润与,的关系式为 .根据(2)
的结果回答下列问题:
(i)当 时,年销售量及年利润的预测值分别是多少?
解: 由(2)知,当 时,年销售量的预测值为
(千元),年利润的预测值为
(千元).
(ii)年宣传费为多少时,年利润的预测值最大?
解: 根据(2)的结果知,

所以当,即时, 取得最大值.
故年宣传费为46.24千元时,年利润的预测值最大.
例2 某出版社单册图书的成本费(元)与印刷册数 (千册)有关,
经统计得到数据如下:
1 2 3 5 7 10 11 20 25 30
9.02 5.27 4.06 3.03 2.59 2.28 2.21 1.89 1.80 1.75
(1)根据以上数据画出散点图(可借助统计软件),并根据散点图
判断:与 中哪一个适宜作为经验回归方程的模

解:由表格数据可得如下散点图,
显然,两者之间是某种非线性关系,故 适宜作为经验回归
方程的模型.
(2)根据(1)的判断结果,试建立单册图书的成本费 关于印刷册
数 的经验回归方程;
解:令且, ,10,则由(1)可知,关于 的经验回归方
程为,
易知 ,

, ,则
,所以

故关于 的经验回归方程为,
即关于 的经验回归方程为 .
(3)利用经验回归方程估计印刷26 000册图书的单册成本
(结果保留两位小数).
解:当时, ,故估计印刷26 000
册图书的单册成本约为1.81元.
2.比较两种模型的拟合效果
例3 [2024·重庆八中高二月考] 某公司为了解年研发资金投入量
(单位:亿元)对年销售额 (单位:亿元)的影响,对公司近12年
的年研发资金投入量和年销售额 的数据,进行了对比分析,建立
了两个模型:,,其中 , , , 均
为常数,为自然对数的底数,并得到一些统计量的值.令 ,
,经计算得如下数据:
22 66 77 2 460 5
31 250 220 3.08 14 (1)请从样本相关系数的角度,分析哪一个模型拟合程度更好?
解:因为,,所以,
设关于 的样本相关系数为 ,
则 .
附:样本相关系数 .
因为,,所以,
设关于 的样本相关系数为,
则 ,
所以 ,
由样本相关系数的相关性质可得,模型②的拟合程度更好.
(2)根据(1)的分析及表中数据,求关于 的经验回归方程.
附: 经验回归方程中, 的计算公式分别为
, .
解:由(1)可知,用模型②进行拟合,则 ,即

可得, ,
所以关于的经验回归方程为,即关于 的经验回归方
程为 .
例4 [2024·大连二十四中高二期中] 当前,人工智能技术以前所未有
的速度迅猛发展,并逐步影响我们的方方面面,人工智能被认为是
推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司
在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入
额(单位:百万元)与其年销售量 (单位:千件)的数据统计表.
1 2 3 4 5 6
0.5 1 1.5 3 6 12
0 0.4 1.1 1.8 2.5
(1)公司拟分别用和 两种方案作为年销
售量关于年投入额 的回归分析模型,请根据已知数据,确定方案
①和②的经验回归方程;,,, 计算过程保留到小数点后两位,
最后结果保留到小数点后一位)
参考公式及数据:样本数据 的经验回归直线
的斜率和截距的最小二乘估计分别为
,, ,
,,,, .
解:.
对于模型①, ,
所以, ,
所以模型①中,关于的经验回归方程为 .
对于模型②,由,得,即 ,

则, ,
所以,即模型②中,关于 的经验回归方程为
.
(2)根据下表数据,用决定系数 (只需比较出大小)比较两种模
型的拟合效果哪种更好,并选择拟合精度更高的模型,预测年投入
额为7百万元时,产品的年销售量是多少
经验回归方程
18.29 10.06
参考公式及数据:样本数据 的经验回归直线
的斜率和截距的最小二乘估计分别为
,, ,
,,,, .
解: ,
对于,;
对于 , .
因为 ,所以模型②的拟合效果好.
对于,当时, ,
所以预测年投入额为7百万元时,产品的年销售量是16.4千件.
例5 某果园种植“糖心苹果”已有十余年,为了提高利润,该果园每
年投入一定的资金,对种植、采摘、包装、宣传等环节进行改
进.如图所示是2014年至2023年该果园每年的投资金额 (单位:万
元)与年利润增量 (单位:万元)的散点图.
该果园为了预测2024年投资金额为20万元时的年利润增量,建立了
关于 的两个回归模型:
模型①:由最小二乘法可求得关于 的经验回归方程为

模型②:由图中散点的分布,可以认为散点集中在曲线
的附近,对投资金额作替换,令,则 ,且有
,,, .
(1)根据所给的统计量,求模型②中关于 的非线性经验回归方程;
解:,,, ,
,
,
又,所以模型②中关于 的非线性经验回归方程为
.
(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润
增量(结果保留两位小数);
解:当 时,模型①的年利润增量的预测值为
(万元),
模型②的年利润增量的预测值为 (万元).
参考数据:, .
(3)根据下列表格中的数据,计算两个模型的决定系数 ,并说明
哪个模型的拟合效果更好.
模型 模型① 模型②
102.28 36.19
解:,, 模型①的决定系数
小于模型②的决定系数 ,故模型②的拟合效果更好.
练习册
一、选择题
1.甲、乙、丙、丁4位同学各自对, 两变量进行回归分析,各自选
取数据得到散点图与残差平方和 如下表:
甲 乙 丙 丁
散点图 _____________________________ _____________________________ _____________________________ _____________________________
残差平方和 115 106 124 93
拟合, 两变量关系的模型效果最好的是( )
A.甲 B.乙 C.丙 D.丁
[解析] 散点图中各散点条状分布越均匀,同时残差平方和越小,则
模型的拟合效果就越好,故选D.

2.两个变量的散点图如图所示,则用以下函数模型进
行拟合比较合理的是( )
A. B.
C. D.
[解析] 由散点图可知,用函数模型 进行拟合比较合理.

3.已知经验回归方程为,则散点 的残差为
( )
A. B.0.64 C. D.2.455
[解析] 残差 .

4.用模型 去拟合一组数据时,为了求出经验回归方程,设
,将其变换后得到经验回归方程为,则, 的
值分别是( )
A., B., C., D.,
[解析] 两边同时取对数可得

因为 ,所以上式可化为,
又经验回归方程为 ,所以, ,
所以, ,故选C.

5.一组数据如下表所示:
1 2 3 4
已知变量关于的非线性经验回归方程为,则当
时, 的值为( )
A. B. C. D.

[解析] 将两边同时取对数,得 ,令
,得.
根据表格中的数据,得到, 的取值对照表如下.
1 2 3 4
1 3 4 6
由上述表格可知, ,可得
,解得,则 ,进而得到
,将代入,得 .故选C.
6.某种微生物的繁殖速度与生长环境中的营养物质浓度 相关,在
一定条件下可用模型进行拟合.在这个条件下,要使 增加2
个单位,则应该( )
A.使增加1个单位 B.使 增加2个单位
C.使增加到原来的2倍 D.使 增加到原来的10倍
[解析] 设营养物质变化前的浓度为,变化后的浓度为 ,繁殖速
度变化前为,变化后为,且,
则 的增加量,解得
,故要使 增加2个单位,应该使 增加到原来的10倍.故选D.

7.(多选题)[2024·广东华南师大附中高二月考] 使用统计手段科学
预测传染病可以保障人民群众的生命健康.下表和散点图为某段时间
内全球某传染病感染病例在第一次监测到之后数量随时间的变化,
以时间为自变量(单位:天),以监测到的病例总数为因变量 ,
建立以下两个关于 的回归模型:回归模型一:;
回归模型二: .通过计算得出,;
, ,则下列说法正确的是( )
1 5 7 12 16 20
2 9 12 29 63 101
A.使用回归模型一拟合的决定系数 大于使用回归模型二拟合的决
定系数
B.通过回归模型二得出的经验回归方程的预报效果好于通过回归模
型一得出的经验回归方程的预报效果
C.在首例病例出现后45天,估计该传染病感染人数在200左右
D.在首例病例出现后45天,估计该传染病的感染人数超过10 000


[解析] 根据散点图可知模型二的拟合效果更好,拟合效果越好决定
系数越大,所以使用回归模型一拟合的决定系数 小于使用回归
模型二拟合的决定系数 ,所以A错误,B正确;
模型二的的拟合效果好,预报更准确,由,,
得,将 代入经验回归方程,得 ,
所以C错误,D正确.故选 .
8.(多选题)如图是某地某小区2021年12月至2022年12月间,当月在
售二手房均价(单位:万元/平方米)的散点图.图中月份代码
分别对应2021年12月 年12月.
根据散点图选择和 两个模型进行拟合,经
过数据处理得到的两个非线性经验回归方程分别为
和 ,并得到以下一
些统计量的值:
0.923 0.973
则下列说法正确的是( )
A.当月在售二手房均价与月份代码 负相关
B.由 预测2023年3月该小区在售二手房均价
为 万元/平方米
C.曲线与 都经过点
D.的拟合效果比 的好


[解析] 对于A,散点从左下角到右上
角分布,所以当月在售二手房均价
与月份代码正相关,故A不正确;
对于B,令 ,得 ,所以可以预测
2023年3月该小区在售二手房均价为 万元/平方米,故B正确;
对于C,非线性经验回归曲线不一定经过点 ,故C不正确;
对于D, 越大,拟合效果越好,由,知 D正确.故选 .
二、填空题
9.[2024·东莞中学高二期中] 已知, 之间的一组数据:
1 4 9 16
1 2.98 5.01 7.01
若与满足经验回归方程 ,则此经验回归直线必过点
________.
[解析] 依题意,的平均数为, 的平均数为
,所以此经验回归直线必过点 .
10.甲、乙两位同学研究某人周岁的身高 (单位:厘米)与年
龄(单位:周岁)的关系.甲用 拟合得如图①所示的散点
图,记与的样本相关系数为,决定系数为 ;乙用
拟合得如图②所示的散点图,记与 的样本相关系数为,
决定系数为.则___,___.(填“ ”“ ”或“ ”)
[解析] 由两个散点图可知,与的线性相关程度比与 的线性相关
程度弱,且与正相关,与正相关,.
由图知 的拟合效果比的拟合效果好, .
三、解答题
11.某电池厂对新研发的一款电池使用情况进行了9次测试.每使用1小
时测量一次剩余电荷量,得到剩余电荷量 (单位:库仑)与使用时
间 (单位:小时)的数据如下:
1 2 3 4 5 6 7 8 9
2.77 2 1.92 1.36 1.12 1.09 0.74 0.68 0.53
由散点图发现关于的回归模型为,设 .
(1)计算 与之间的样本相关系数(精确到 );
参考数据:,, .
45 1.55 60
12.21 2.43 4.38
解:由,,得 ,则 与之间的样本
相关系数 .
其中, .
附:对于一组数据,, , ,样本相关系数
.
(2)求关于的经验回归方程,精确到 .
参考数据:,, .
45 1.55 60
12.21 2.43 4.38
其中, .
附:对于一组数据,, , ,经验回归直线
的斜率和截距的最小二乘估计分别为, .
解:由题可得 ,

所以 ,
故关于的经验回归方程为 .
12.某电动车公司为了抢占更多的市
场份额,计划加大广告投入.该公司
近5年的年广告费(单位:百万元)
和年销售量 (单位:百万辆)的
关系如图所示.令 ,数据经过初步处理得:
44 4.8 10 40.3 1.612 19.5 8.06
现有和两种模型作为年销售量 关于年
广告费的回归分析模型,其中,,, 均为常数.
(1)请从样本相关系数的角度,分析哪一个模型拟合程度更好?
(不能整除的样本相关系数保留2位小数)
附:①样本相关系数 .
②参考数据:,, , .
解:设模型①中关于的样本相关系数为 .
则 ,
模型②中,令,则,
设关于 的样本相关系数为,
则 ,
所以 ,
由样本相关系数的相关性质可得,模型②的拟合程度更好.
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数
据,求出关于 的经验回归方程,并预测当年广告费为6(百万元)
时,产品的年销售量是多少?(结果保留整数)
附: ① 经验回归方程中,, ;
②参考数据:,, , .
解:模型②中, ,
又由, ,
得 ,
所以,即关于的经验回归方程为 ,
当时, ,因此预测当年广告费为6(百万元)
时,产品的销售量是13(百万辆).
13.[2024·山东滨州高二期中] 某小微企业对其产品研发的年投入金
额(单位:万元)与其年销售量 (单位:万件)的数据进行统计,
整理后得到如下的数据统计表.
1 5 7 8 9
2 3 6 8 11
0.7 1.1 1.8 2.1 2.4
(1)公司拟分别用和 两种模型作为年销
售量关于年投入金额 的回归分析模型,根据上表数据,分别求出
两种模型的经验回归方程;
参考公式:对于一组数据 ,其经验回归直线
的斜率和截距的最小二乘估计分别为 ,

解:对于模型①,, ,
所以, ,
参考数据:, ,
.
所以模型①的经验回归方程为 .
对于模型②,由,两边取自然对数可得 ,即

因为 ,
所以, ,
所以关于的经验回归方程为 ,模型②的经验回
归方程为 .
(2)统计学中常通过残差的平方和比较两个模型的拟合效果,若模
型①和②的残差的平方和分别为9.9和 ,请在①和②中选择拟合效
果更好的模型,并估计当年投入金额为10万元时的年销售量
(结果保留两位小数).
解:因为 ,即②的残差平方和较小,所以模型②的拟合效
果更好.
当时, ,
故估计当年投入金额为10万元时的年销售量为11.94万件.
参考数据: .第2课时 非线性回归模型
【课中探究】
例1 (1)C (2)①② [解析] (1)决定系数R2越大,模型的拟合效果越好,∴模型3的拟合效果最好.故选C.
(2)散点图中的点散布在从左上角到右下角的区域内,则这两个变量负相关,故①正确;由散点图知,用=拟合的效果比用=x+拟合的效果更好,所以>,故②正确;x,Y之间能建立经验回归方程,只不过拟合效果不好,故③不正确.故填①②.
例2 解:(1)根据农户近5年种植药材的收入情况的统计数据可得,=×(1+2+3+4+5)=3,=×(59+61+64+68+73)=65,由t=x2,可得=×(12+22+32+42+52)=11,则==≈0.6,=-=65-0.6×11=58.4,
所以此模型的经验回归方程为=0.6x2+58.4.
(2)分别将x=1,2,3,4,5代入=0.6x2+58.4,可得估计值为59,60.8,63.8,68,73.4,则残差的平方和为(59-59)2+(61-60.8)2+(64-63.8)2+(68-68)2+(73-73.4)2=0.24.因为0.24<0.5,所以经验回归方程=0.6x2+58.4的拟合效果符合要求.
变式 解:(1)选择模型②,理由如下:
由于模型②残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型①的带状宽度窄,所以模型②的拟合精度更高,经验回归方程的预报精度相应就会越高,所以选模型②比较合适.
(2)根据模型②,令t=,y与t可用线性回归模型来拟合,且=+t,由题表中数据可得===0.64,=-=7.5-0.64×2.25=6.06,
则y关于t的经验回归方程为=0.64t+6.06,
所以y关于x的经验回归方程为=0.64+6.06.
由0.64+6.06>8,解得x>≈9.2,所以估计要使年收益增量超过8亿元,研发人员增量至少为10人.第2课时 非线性回归模型
1.D [解析] 散点图中各散点条状分布越均匀,同时残差平方和越小,则模型的拟合效果就越好,故选D.
2.B [解析] 由散点图可知,用函数模型y=a+bln x进行拟合比较合理.
3.B [解析] 残差=2.71-(1.21×log24-0.35)=2.71-2.07=0.64.
4.C [解析] y=cekx两边同时取对数可得ln y=ln(cekx)=ln c+ln ekx=kx+ln c,因为z=ln y,所以上式可化为z=kx+ln c,又经验回归方程为=0.2x+3,所以=0.2,ln =3, 所以=e3,=0.2,故选C.
5.C [解析] 将=两边同时取对数,得ln =x-0.5,令=ln ,得=x-0.5.根据表格中的数据,得到x,z的取值对照表如下.
x 1 2 3 4
z 1 3 4 6
由上述表格可知==2.5,==3.5,可得3.5=2.5-0.5,解得=1.6,则=1.6x-0.5,进而得到=e1.6x-0.5,将x=5代入,得=e7.5.故选C.
6.D [解析] 设营养物质变化前的浓度为x1,变化后的浓度为x2,繁殖速度变化前为y1,变化后为y2,且y1+2=y2,则y的增加量Δy=y2-y1=2lg x2-2lg x1=2lg =2,解得=10,故要使y增加2个单位,应该使x增加到原来的10倍.故选D.
7.BD [解析] 根据散点图可知模型二的拟合效果更好,拟合效果越好决定系数R2越大,所以使用回归模型一拟合的决定系数小于使用回归模型二拟合的决定系数,所以A错误,B正确;模型二的的拟合效果好,预报更准确,由k2≈2.5,m≈0.2,得=2.5e0.2x,将x=45代入经验回归方程,得=2.5e9≈20 258,所以C错误,D正确.故选BD.
8.BD [解析] 对于A,散点从左下角到右上角分布,所以当月在售二手房均价y与月份代码x正相关,故A不正确;对于B,令x=16,得=0.936 9+0.028 5=1.050 9,所以可以预测2023年3月该小区在售二手房均价为1.050 9万元/平方米,故B正确;对于C,非线性经验回归曲线不一定经过点(,) ,故C不正确;对于D,R2越大,拟合效果越好,由0.923<0.973,知 D正确.故选BD.
9.(6.25,4) [解析] 依题意,的平均数为=2.5,y的平均数为=4,所以此经验回归直线必过点(6.25,4).
10.< < [解析] 由两个散点图可知,y与x的线性相关程度比y与t的线性相关程度弱,且y与x正相关,y与t正相关,∴r111.解:(1)由y=ea+bx,ω=ln y,得=x+,
则ω与x之间的样本相关系数r==≈-0.99.
(2)由题可得==≈-0.20,=-=+0.20×≈1.17,
所以=-0.20x+1.17,
故y关于x的经验回归方程为=e-0.20x+1.17.
12.解:(1)设模型①中y关于x的样本相关系数为r1.
则r1==≈0.97,
模型②中,令v=ln x,则y=nv+m,设y关于v的样本相关系数为r2,则r2===1,
所以|r1|<|r2|,由样本相关系数的相关性质可得,模型②的拟合程度更好.
(2)模型②中,===5,
又由=vi=0.96,=yi=8.8,得=-5=8.8-0.96×5=4,
所以=5v+4,即y关于x的经验回归方程为=5ln x+4,当x=6时,y=5ln 6+4≈13,
因此预测当年广告费为6(百万元)时,产品的销售量是13(百万辆).
13.解:(1)对于模型①,==6,==6,
所以===1.05,=6-1.05×6=-0.3,
所以模型①的经验回归方程为=1.05x-0.3.
对于模型②,由y=enx+m,两边取自然对数可得ln y=nx+m,即z=nx+m,
因为==1.62,
所以===0.215,=1.62-0.215×6=0.33,
所以z关于x的经验回归方程为=0.215x+0.33,模型②的经验回归方程为=e0.215x+0.33.
(2)因为9.9>3.2,即②的残差平方和较小,所以模型②的拟合效果更好.
当x=10时,=e0.215×10+0.33=e2.48≈11.94,
故估计当年投入金额为10万元时的年销售量为11.94万件.第2课时 非线性回归模型
◆ 探究点一 用拟合效果分析非线性回归问题
例1 (1)在求解两个变量Y与x的回归模型中,分别给出了4个不同模型,它们的决定系数R2如下表,其中拟合效果最好的是 (  )
模型1 模型2 模型3 模型4
R2 0.25 0.50 0.98 0.80
                 
A.模型1 B.模型2
C.模型3 D.模型4
(2)变量x和Y的散点图如图所示,则下列说法中正确的是    (填序号).
①x与Y负相关;
②在该相关关系中,若用=拟合时的决定系数为,用=x+拟合时的决定系数为,则>;
③x,Y之间不能建立经验回归方程.
[素养小结]
(1)两个变量Y与x的回归模型中,决定系数R2越大,拟合效果越好.
(2)根据散点图可以判断两个变量之间的相关性,根据样本点的分布选取合适的函数模型.
◆ 探究点二 非线性回归模型的应用
例2 [2024·华南师大附中高二期中] 某地政府为提高当地农民收入,鼓励农民种植药材.以下是某农户近5年种植药材的年收入的统计数据:
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
年收入y (千元) 59 61 64 68 73
(1)根据表中数据,决定使用模型y=bx2+a拟合y与x之间的关系,求此模型的经验回归方程.(结果保留一位小数)
(2)统计学中常通过计算残差的平方和来判断模型的拟合效果,在本题中,若残差的平方和小于0.5,则认为拟合效果符合要求.请判断(1)中经验回归方程的拟合效果是否符合要求 并说明理由.
参考数据及公式:在经验回归方程=x+中,=,=-.设t=x2,则(ti-)(yi-)=217,(ti-)2=374.
变式 为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量y(单位:亿元)与研发人员增量x的10组数据.现用模型①y=bx+a,②y=c+d分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中ti=,=ti.
(xi-)2 (ti-)2 (yi-) (xi-) (yi-) (ti-)
7.5 2.25 82.50 4.50 12.14 2.88
(1)根据残差图,判断应选择哪个模型.(无需说明理由)
(2)根据(1)中所选模型,求出y关于x的经验回归方程,并用该模型估计,要使年收益增量超过8亿元,研发人员增量至少为多少人 (结果保留整数)
[素养小结]
解决非线性回归问题的方法及步骤
(1)确定变量:确定解释变量为x,响应变量为y;
(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)图象作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;
(4)分析拟合效果:通过计算决定系数来判断拟合效果;
(5)写出非线性经验回归方程.第2课时 非线性回归模型
一、选择题
1.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,各自选取数据得到散点图与残差平方和(yi-)2如下表:
甲 乙 丙 丁
散点图
残差平方和 115 106 124 93
拟合A,B两变量关系的模型效果最好的是 (  )                 
A.甲 B.乙
C.丙 D.丁
2.两个变量的散点图如图所示,则用以下函数模型进行拟合比较合理的是 (  )
A.y=a·xb
B.y=a+bln x
C.y=a·ebx
D.y=a·
3.已知经验回归方程为=1.21log2x-0.35,则散点(4,2.71)的残差为 (  )
A.-0.64 B.0.64
C.-2.455 D.2.455
4.用模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程为=0.2x+3,则,的值分别是 (  )
A.e2,0.6 B.e2,0.3
C.e3,0.2 D.e4,0.6
5.一组数据如下表所示:
x 1 2 3 4
y e e3 e4 e6
已知变量y关于x的非线性经验回归方程为=,则当x=5时,的值为 (  )
A.e5 B.e5.5
C.e7.5 D.e7
6.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用模型y=2lg x进行拟合.在这个条件下,要使y增加2个单位,则应该 (  )
A.使x增加1个单位
B.使x增加2个单位
C.使x增加到原来的2倍
D.使x增加到原来的10倍
7.(多选题)[2024·广东华南师大附中高二月考] 使用统计手段科学预测传染病可以保障人民群众的生命健康.下表和散点图为某段时间内全球某传染病感染病例在第一次监测到之后数量随时间的变化,以时间为自变量x(单位:天),以监测到的病例总数为因变量y,建立以下两个y关于x的回归模型:回归模型一:y=k1x+b1(x>0);回归模型二:y=k2emx(x>0).通过计算得出k1≈5.14,b1≈-16.3;k2≈2.5,m≈0.2,则下列说法正确的是 (  )
x 1 5 7 12 16 20
y 2 9 12 29 63 101
A.使用回归模型一拟合的决定系数大于使用回归模型二拟合的决定系数
B.通过回归模型二得出的经验回归方程的预报效果好于通过回归模型一得出的经验回归方程的预报效果
C.在首例病例出现后45天,估计该传染病感染人数在200左右
D.在首例病例出现后45天,估计该传染病的感染人数超过10 000
8.(多选题)如图是某地某小区2021年12月至2022年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.图中月份代码1~13分别对应2021年12月~2022年12月.
根据散点图选择y=a+b和y=c+dln x两个模型进行拟合,经过数据处理得到的两个非线性经验回归方程分别为=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到以下一些统计量的值:
=0.936 9+0.028 5 =0.955 4+0.030 6ln x
R2 0.923 0.973
则下列说法正确的是 (  )
A.当月在售二手房均价y与月份代码x负相关
B.由=0.936 9+0.028 5预测2023年3月该小区在售二手房均价为1.050 9万元/平方米
C.曲线=0.936 9+0.028 5与=0.955 4+0.030 6ln x都经过点(,)
D.=0.955 4+0.030 6ln x的拟合效果比=0.936 9+0.028 5的好
二、填空题
9.[2024·东莞中学高二期中] 已知x,y之间的一组数据:
x 1 4 9 16
y 1 2.98 5.01 7.01
若y与满足经验回归方程=+,则此经验回归直线必过点    .
10.甲、乙两位同学研究某人1~18周岁的身高y(单位:厘米)与年龄x(单位:周岁)的关系.甲用=x+拟合得如图①所示的散点图,记x与y的样本相关系数为r1,决定系数为;乙用=t+(t=ln x)拟合得如图②所示的散点图,记t与y的样本相关系数为r2,决定系数为.则r1    r2,    .(填“>”“<”或“=”)
三、解答题
11.某电池厂对新研发的一款电池使用情况进行了9次测试.每使用1小时测量一次剩余电荷量,得到剩余电荷量y(单位:库仑)与使用时间x(单位:小时)的数据如下:
x 1 2 3 4 5 6 7 8 9
y 2.77 2 1.92 1.36 1.12 1.09 0.74 0.68 0.53
由散点图发现y关于x的回归模型为y=ea+bx,设ω=ln y.
(1)计算ω与x之间的样本相关系数r(精确到0.01);
(2)求y关于x的经验回归方程(a,b精确到0.01).
参考数据:≈7.75,≈2.09,≈1.56.
xi (xi-)(yi-) ωi (xi-)2
45 -15.55 1.55 60
yi (xi-)(ωi-) (ωi-)2 (yi-)2
12.21 -11.98 2.43 4.38
其中,ωi=ln yi.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),样本相关系数r=,经验回归直线=+u的斜率和截距的最小二乘估计分别为=,=-.
12.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示.
令vi=ln xi(i=1,2,…,5),数据经过初步处理得:
yi vi (xi-)2 (yi-)2 (vi-)2 (xi-)2 (yi-)2 (yi-)2 (vi-)2
44 4.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=nln x+m两种模型作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从样本相关系数的角度,分析哪一个模型拟合程度更好 (不能整除的样本相关系数保留2位小数)
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的经验回归方程,并预测当年广告费为6(百万元)时,产品的年销售量是多少 (结果保留整数)
附:①样本相关系数r=,经验回归方程=+x中,=,=-;
②参考数据:=8.06,≈20.1,ln 5≈1.6,ln 6≈1.8.
13.[2024·山东滨州高二期中] 某小微企业对其产品研发的年投入金额x(单位:万元)与其年销售量y(单位:万件)的数据进行统计,整理后得到如下的数据统计表.
x 1 5 7 8 9
y 2 3 6 8 11
z=ln y 0.7 1.1 1.8 2.1 2.4
(1)公司拟分别用①y=bx+a和②y=enx+m两种模型作为年销售量y关于年投入金额x的回归分析模型,根据上表数据,分别求出两种模型的经验回归方程;
(2)统计学中常通过残差的平方和比较两个模型的拟合效果,若模型①和②的残差的平方和分别为9.9和3.2,请在①和②中选择拟合效果更好的模型,并估计当年投入金额为10万元时的年销售量(结果保留两位小数).
参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归直线=x+的斜率和截距的最小二乘估计分别为=,=-.
参考数据:(xi-)(yi-)=42,(xi-)(zi-)=8.6,(xi-)2=40,e2.48≈11.94.