8.2 一元线性回归模型及其应用-【新教材】人教A版(2019)高中数学选择性必修第三册辅导讲义(含解析)

文档属性

名称 8.2 一元线性回归模型及其应用-【新教材】人教A版(2019)高中数学选择性必修第三册辅导讲义(含解析)
格式 docx
文件大小 324.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-09-21 15:36:27

图片预览

文档简介

高中数学选择性必修第三册第八章计数原理(人教A版2019)
8.2一元线性回归模型及其应用
【基础梳理】
一、一元线性回归模型
1.一元线性回归模型
我们称
为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是 Y与bx+a之间的随机误差
2.线性回归方程与最小二乘法
回归直线方程过样本点的中心(x,y),是回归直线方程最常用的一个特征
我们将称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(lastsqures estimate),
其中
二、非线性回归模型及其应用
1.残差的概念
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
2.刻画回归效果的方式
⑴残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(3)利用R2刻画回归效果
决定系数R是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
,R2越大,即拟合效果越好,R2越小,模型拟合效果越差
【课堂探究】
例1.在生物学上,有隔代遗传的现象.已知某数学老师的体重为,他的曾祖父、祖父、父亲、儿子的体重分别为、、、.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与预报变量的回归方程为,其中,据此模型预测他的孙子的体重约为( )
A. B. C. D.
【答案】B
【分析】
由已知得出数据,,,,根据回归直线过样本中心点,可求得,计算求得,代入,即可得出结果.
【详解】
由已知,体重是隔代遗传,且呈线性相关,得出数据,,,,
所以,代入,其中,求得,
即.
时, .
故选:B
例2.由变量x与y相对应的一组数据、、、、得到的线性回归方程为,则等于( )
A.88 B.90 C.92 D.96
【答案】D
【分析】
求出,代入,可得,则可求解.
【详解】
由题中所给的点,可以求得,
代入,可得,
所以,
故选:D.
【课后练习】
1.一组数据如下表所示:
1 2 3 4
已知变量关于的回归方程为,若,则预测的值可能为( )
A. B. C. D.
【答案】C
【分析】
令,求得之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即可求得;再令,即可求得预测值.
【详解】
将式子两边取对数,得到,令,得到,
根据已知表格数据,得到的取值对照表如下:
由上述表格可知:
,,
利用回归直线过样本中心点,即可得,
求得,则,
进而得到,将代入,
解得.
故选:C.
2.为了研究某班学生的数学成绩(分)和物理成绩(分)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为.已知,,,该班某学生的物理成绩为86,据此估计其数学成绩约为( )
A.81 B.80 C.93 D.
【答案】B
【分析】
计算,,故,代入数据计算得到答案.
【详解】
,,故,即,
当时,,解得.
故选:.
【点睛】
本题考查了线性回归方程,意在考查学生的计算能力和应用能力.
3.由一组样本数据得到的回归直线方程为,那么下面说法不正确是( )
A.直线必经过点
B.直线至少经过点中的一个
C.直线的斜率为
D.直线和各点的总偏差是该坐标平面上所有直线与这些点的偏差中最小的直线
【答案】B
【分析】
根据最小二乘法和回归直线的意义可依次判断各个选项得到结果.
【详解】
对于,回归直线必过样本中心点,即必过,正确;
对于,回归直线描述样本点的变化趋势和相关关系,未必经过样本点,错误;
对于,由最小二乘法知:,正确;
对于,回归直线是所有直线中与样本点离散度最低的,由此可知回归直线的总偏差是该坐标平面上所有直线与这些点的偏差中最小的,正确.
故选:.
4.已知某产品的销售额y与广告费用x之间的关系如下表:
若求得其线性回归方程为,其中,则预计当广告费用为6万元时的销售额是()
A.42万元 B.45万元 C.48万元 D.51万元
【答案】C
【分析】
由已知求得样本点的中心的坐标,代入线性回归方程求得,则线性回归方程可求,取求得y值即可.
【详解】
,,
样本点的中心的坐标为,
代入,得.
关于x得线性回归方程为.
取,可得万元.
故选:C.
5.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:
0.04 1 4.84 10.24
1.1 2.1 2.3 3.3 4.2
若依据表中数据画出散点图,则样本点都在曲线附近波动.但由于某种原因表中一个值被污损,将方程作为回归方程,则根据回归方程和表中数据可求得被污损数据为( )
A. B.1.69 C.1.96 D.4.32
【答案】C
【分析】
令,根据线性回归中心点在回归直线上,求出,得出,即可求解.
【详解】
设缺失的数据为,则样本数据如下表所示:
0.2 1 2.2 3.2
1.1 2.1 2.3 3.3 4.2
其回归直线方程为,由表中数据可得,

由线性回归方程得,,
即,解得.
故选:C.
6.下列有关统计知识的四个命题正确的是( )
A.衡量两变量之间线性相关关系的相关系数越接近,说明两变量间线性关系越密切
B.在回归分析中,可以用卡方来刻画回归的效果,越大,模型的拟合效果越差
C.线性回归方程对应的直线至少经过其样本数据点中的一个点
D.线性回归方程中,变量每增加一个单位时,变量平均增加个单位
【答案】A
【解析】
分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.
详解:A. 衡量两变量之间线性相关关系的相关系数越接近,说明两变量间线性关系越密切,正确;
B. 在回归分析中,可以用卡方来刻画回归的效果,越大,模型的拟合效果越差,错误
对分类变量与的随机变量的观测值来说, 越大,“与有关系”可信程度越大; 故B错误;
C. 线性回归方程对应的直线至少经过其样本数据点中的一个点,错误,回归直线可能不经过其样本数据点中的任何一个点;
D. 线性回归方程中,变量每增加一个单位时,变量平均增加个单位,错误,由回归方程可知变量每增加一个单位时,变量平均增加个单位.
故选A.
7.登山族为了了解某山高与气温之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温 18 13 10
山高 24 34 38 64
由表中数据,得到线性回归方程,由此请估计出山高为处气温的度数为  
A. B. C. D.
【答案】D
【详解】
由题意可得=10,=40,所以=+2=40+2×10=60.
所以=-2x+60,当=72时,有-2x+60=72,解得x=-6,故选D.
8.已知,之间的一组数据:
2 4 6 8
1 5 3 7
则与的线性回归方程必过点( )
A.(20,16) B.(16,20) C.(4,5) D.(5,4)
【答案】D
【解析】
本题考查线性回归方程的性质.
由线性回归方程必过点,可知线性回归方程必过点(5,4)选D.