第八章 成对数据的统计分析
8.2 一元线性回归模型及其应用
8.2.1一元线性回归模型
学案
一、学习目标
1.结合具体实例,了解一元线性回归模型的含义.
2.了解元线性回归模型参数的统计意义.
3.结合具体实例,了解一元线性回归模型随机误差产生的原因.
2、 基础梳理
1.一元线性回归模型
称为Y关于x的一元线性回归模型.
其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与之间的随机误差.
三、巩固练习
1.设备的经济寿命是指设备从投入使用开始到因继续使用在经济上不合理而被更新所经历的时间,由维护费用的提高和使用价值的降低决定的.设备的经济寿命有如下计算公式:,其中为设备的经济寿命(单位:年),P为设备目前实际价值,为设备N年末的净残值,为设备的低劣化值.若有一台设备,目前实际价值为8000元,预计经济寿命为7年,设备的低劣化值为300元,则该设备7年末的净残值为( )
A.600元 B.650元 C.700元 D.750元
2.已知方程是根据女大学生的身高预报体重的经验回归方程,其中的单位分别是cm,kg,则该方程在样本处的残差是( )
A.54.55 B.3.45 C.2.45 D.111.55
3.某种产品的广告费支出x(万元)与销售额y(万元)之间有如表所示的线性相关关系,y与x的经验回归方程为,当广告支出5万元时,残差为( )
x 2 4 5 6 8
y 30 40 60 50 70
A.10 B.20 C.30 D.40
4.某种产品的广告支出x(单位:万元)与销售额y(单位:万元)之间的关系如下表:
x 2 4 5 6 8
y 30 40 60 50 70
若已知y关于x的经验回归方程为,那么当广告支出为6万元时,随机误差的效应(残差)为_________万元(残差=观测值-预测值)( )
A.17.5 B.-6.5 C.24.5 D.-56.5
5.(多选)已知由样本数据,n求得的经验回归方程为,且,现发现两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的经验回归方程为
C.去除后y的估计值增加速度变快
D.去除后样本点(2,3.75)的残差为005
6. (多选)某调查小组对某种农作物的每亩施肥量(单位:千克)与每亩增产量(单位:千克)进行调查,得到如下数据:
每亩施肥量/千克 2 3 4 5
每亩增产量/千克 26 39 49 54
根据上表得到线性回归方程,为,下列结论正确的是( )
A.
B.当每亩施肥量为6千克时,每亩增产量约为65.5千克
C.对应的偏差为3
D.对应的残差是2.3
7. (多选)下列说法中正确的有( )
A.在对分类变量X和Y进行独立性检验时,随机变量的值越大,则“X与Y有关”可信程度越小
B.在经验回归方程中,当解释变量x每增加一个单位时,响应变量y增加0.1个单位
C.两个变量的线性相关性越强,相关系数的绝对值越接近于1
D.在回归分析模型中,若决定系数越大,则残差平方和越小,模型的拟合效果越好
8.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为-0.15,则表中m的值为__________.
答案以及解析
1.答案:B
解析:由题意知年,元,元.由,得该设备7年末的净残值(元),(提示:注意对公式中各个字母含义的准确理解)
故选B.
2.答案:C
解析:由经验回归方程可得当身高为165cm时,体重的预测值,故残差为.故选C.
3.答案:A
解析:因为y与x的经验回归方程为,
所以当时,.
由表格知当广告支出5万元时,销售额为60万元,所以残差为.故选A.
4.答案:B
解析:取,得, 当广告支出为6万元时,随机误差的效应(残差)为.故选B.
5.答案:AB
解析:,经验回归方程为,重新求得的经验回归直线l的斜率为1.2,变量x与y具有正相关关系,设新的数据的所有横坐标的平均值为,纵坐标的平均值为,则,,故,
.
故新的经验回归方程为,故A, B正确;
因为斜率为1.2不变,所以去除后y的估计值增长速度不变,C错误;
把代入新的经验回归方程中,得,故D错误.故选AB.
6.答案:ABD
解析:由题意可得,将代入回归方程,得,故A正确;当时,,选项B正确;对应的偏差是,故C错误;对应的残差是,选项D正确.故选ABD.
7.答案:CD
解析:由题意得,根据的值越大,分类变量的有关联的可信度就越大,所以A是错误的;根据经验回归方程中回归系数的含义,可知在经验回归方程中,当解释变量x每增加一个单位时,响应变量y平均增加0.1个单位,B是错误的;根据相关系数的计算公式可知,相关系数的绝对值越接近1,两个变量的相关性就越强,所以C是正确的;根据回归分析的基本思想可知决定系数越大,则残差平方和越小,模型的拟合效果越好,D是正确的.故选CD.
8.答案:4.5
解析:由在样本处的残差为,可得,则,解得.
由题表可知,,产量x的平均数为,
由经验回归方程为过点,
可得.则,
解得.
2