《一元线性回归模型及其应用》链接高考
一、选择题
1.(2020·全国卷I)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图.
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.
B
C.
D.
2.(2017·山东卷)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为.已知.该班某学生的脚长为24,据此估计其身高为( )
A.160
B.163
C.166
D.170
二、解答题
3.(2020·全国卷Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别
表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得
,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数.
4.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
5.为研究物体质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:
x 5 10 15 10 25 30
y 7.25 8.12 8.95 9.90 10.90 11.8
(1)作出散点图并求线性回归方程;
(2)求出并说明回归模型拟合的程度;
(3)进行残差分析.
答案解析
一、选择题
1.答案:D
解析:由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的回归方程类型的是.
2.答案:C
解析:由已知,.
二、解答题
3.答案:见解析
解析:(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;
(2)利用公式计算即可;
(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.
答案:动物平均数为,地块数为200,该地区这种野生动物的估计值为200×60=12000.
(2)样本的相关系数为
.
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
4.答案:见解析
解析:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为(亿元).
(2)利用模型②得到的预测值更可靠.理由如下:
①从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
②从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.
5.答案:见解析
解析:(1)散点图如图所示.
,
,
.
计算得.故所求线性回归方程为.
(2)列表如下:
0.05 0.005 -0.08 -0.045 0.04 0.025
-2.24 -1.37 -0.54 0.41 1.41 23.1
所以,.
所以,
回归模型的拟合效果较好.
由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长与物体质量成线性关系.
1 / 6《一元线性回归模型及其应用》高考通关练
一、选择题
1.(2021长春外校高二月考)设有一个经验回归方程,则变量增加一个单位时,( ).
A.平均增加个单位
B.平均增加2个单位
C.平均减少个单位
D.平均减少2个单位
2.(2021武汉质检)在一次试验中,当变量的取值分别为时,变量的值依次为,则关于的回归方程为( ).
A.
B.
C.
D.
3.(2021九江一中模拟) (多选)设,是变量和的2020个样本点,直线是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是( ).
A.直线过点
B.直线过点
C.和的相关系数在区间上
D.因为2020是偶数,所以分布在直线两侧的样本点的个数一定相同
4.(2021实验中学、广雅中学、佛山一中三校联考)某同学用收集到的6组数据制作成如图所示的散点图(点旁边的数据为该点坐标),并计算得到回归直线的方程为,相关指数为;经过残差分析确定点为离群点,把它去掉后,再用剩下的5组数据计算得到回归直线的方程为,相关指数为,则下列结论中,不正确的是( ).
A.
B.
C.直线恰好过点
D.
5.(2020汉川一中高二期末)变量与相对应的一组样本数据为,
.由上述样本数据得到与的线性回归分析,表示解释变量对于响应变量变化的贡献率,则( ).
A.
B.
C.1
D.3
二、填空题
6.(2021海南中学高三模拟)和的散点图如图所示,则下列所有正确命题的序号为____________.
(1)是负相关关系;
(2)在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则;
(3)之间不能建立经验回归方程.
7.(2021中山一中高三检测)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得经验回归方程为,则该模型的回归方程为____________.
8.(2021孝感模拟)在对于变量与的10组统计数据的回归模型中,,又知残差平方和为,则的值为____________.
9.(2021泸州高中高二月考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间(单位:与当天投篮命中率之间的关系:
时间 1 2 3 4 5
命中率
小李这5天的平均投篮命中率为____________,用线性回归分析的方法预测小李该月6号打篮球的投篮命中率为____________.
三、解答题
10.(2021枣庄薛城区期中)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价元 8 9
销量件 90 84 83 80 75 68
(1)求经验回归方程,其中;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元 (利润销售收入成本)
11.(2021广东茂名模拟)假设某农作物基本苗数与有效穗数之间存在相关关系,今测得5组数据如下:
(1)以为解释变量,为响应变量,画出散点图;
(2)求与之间的回归方程,并预报当基本苗数为时的有效穗数;
(3)计算各组残差;
(4)求,并说明随机误差对有效穗数的影响占百分之几
参考答案
1.
答案:C
解析:由经验回归方程中的系数为知C项正确.
2.
答案:D
解析:对于A,当时,,远远小于5,不满足条件.对于,当时,,远远小于5,不满足条件.对于C,当时,,远远大于5,不满足条件.对于,当时,;当时,;当时,;当时,,都满足条件,故选.
3.
答案:AC
解析:经验回归方程一定过样本中心点,但不一定过某个样本点,故A正确,错误;由图可知和的相关系数在区间上,故C正确;不能因为2020是偶数就断定分布在直线两侧的样本点的个数相同,故D错误.
4.
答案:D
解析:结合题图,知与正相关,故A正确.去掉离群点,趋近于1,故,B正确.经过计算得出回归直线过点,故正确.由图可知,故错误,故选
5.
答案:C
解析:因为点均位于直线,即上,因此解释变量对于响应变量变化的贡献率
6.
答案:①②
解析:①显然正确;由散点图知,用拟合的效果比用拟合的效果要好,所以,故②正确;之间能建立经验回归方程,只不过预报精度不高,故③不正确.
7.
答案:
解析:因为,所以该模型的回归方程为
8.
答案:
解析:设总偏差平方和为,根据公式,有,
9.
答案:
解析:这5天的平均投篮命中率为
所以经验回归方程为当时,
10.
答案:见解析
解析:解:(1),从而,故.
(2)由题意知工厂获得利润,所以当时,有最大值,.即当该产品的单价定为元时,工厂获得最大利润.
11.
答案:见解析
解析:解:(1)散点图如图所示.
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用经验回归方程来建立两个变量之间的关系.设经验回归方程,由表中数据可得,
,,则,
,故与之间的回归方程为.当时,.所以由回归方程可预报当基本苗数为时,有效穗数为.
(3)各组数据的残差分别为,.
(4),即解释变量(农作物基本苗数)对有效穗数的影响约占了,所以随机误差对有效穗数的影响约占16..
1 / 8《一元线性回归模型及其应用》竞赛培优
一、填空题
1. (华东师大自主招生)2013年1月,北京经历了59年来雾霾天气最多的一个月.据气象局统计,北京市2013年从1月1日至1月30日这30天里有26天出现雾霾天气,《环境空气质量指数(AQI)技术规定(试行)》将空气质量指数分为六级,如表1:
表1
AQI 级别 状况
I 优
II 良
III 轻度污染
中度污染
重度污染
严重污染
表2是某气象观测点记录的连续4天里与当天的空气水平可见度单位:)的情况. 表2
900 700 300 100
空气水平可见度
设,其中为,根据表2的数据,那么关于的回归方程为__________.
参考答案
答案:
解析:由与的值作散点图(图略)可知,与具有线性相关关系.因为,
.所以关于的回归方程为.
1 / 2《一元线性回归模型及其应用》学考达标练
一、选择题
1.(2020临川一中期末) (多选)为了考查两个变量和之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用最小二乘法求得的经验回归直线分别为和.已知两个人在试验中发现对变量的观测数据的平均值都是,对变量的观测数据的平均值都是,那么下列说法中不正确的是( )
A.与有交点
B.与相交,但交点不一定是
C.与必定平行
D.与必定重合
2.(2021沈阳高二检测)甲、乙、丙、丁四位同学在建立变量的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数分别如下表:
同学 甲 乙 丙 丁
哪位同学建立的回归模型拟合效果最好 ( )
A.甲
B.乙
C.丙
D.丁
3.(2020吉林期末)若已知回归方程为,则与之间的相关系数的取值范围是( )
A.
B.
C.
D.
4.(2020宜都一中高二期末)已知变量与正相关,且由观测数据算得样本平均数,,则由该观测数据算得的经验回归方程可能是( )
A.
B.
C.
D.
二、填空题
5.(2020柳州一中期末)若一组观测值之间满足,且恒为0,则为_____________.
6.(2021昆明八中高二月考)若一函数模型为,将此函数模型转化为关于的回归直线方程,则需作变换_____________.
三、解答题
7.(2020洛阳一高高二期末)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得到如下实验数据:
天数天 3 4 5 6 7
繁殖个数千个 2.5 3 4 4.5 6
求关于的经验回归方程;
(2)利用(1)中的经验回归方程,预测时细菌的繁殖个数.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为
.
参考答案
1.
答案:BCD
解析:经验回归直线都过点,但它们的斜率不确定,故选.
2.
答案:A
解析:相关指数越大,表示回归模型的拟合效果越好.
3.
答案:D
解析:回归方程为变量呈负相关关系,相关系数是一个负数,.
4.
答案:A
解析:依题意知,相应的经验回归直线的斜率应为正,排除,D,且直线过点,代入,得A正确.
5.
答案:1
解析:由恒为0知,即,故
6.
答案:
解析:由知,当时,有.
7.
答案:见解析
解析:解:(1)由表中数据计算得,.
所以经验回归方程为.
(2)将代入(1)中的经验回归方程中得6.55.
故预测时,细菌的繁殖个数为6550个.
1 / 4