人教A版2019选择性必修第三册8.2 一元线性回归模型及其应用 学案(Word版含答案)

文档属性

名称 人教A版2019选择性必修第三册8.2 一元线性回归模型及其应用 学案(Word版含答案)
格式 docx
文件大小 1.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-07-31 11:16:28

图片预览

文档简介

8.2 一元线性回归模型及其应用
【知识梳理】
知识点一 一元线性回归模型
称为Y关于x的一元线性回归模型.其中Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,如果e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述.
知识点二 最小二乘法
将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中
,=-.
知识点三 残差与残差分析
1.残差
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2.残差分析
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
知识点四 对模型刻画数据效果的分析
1.残差图法
在残差图中,如果残差比较均匀地集中在以横轴为对称轴的水平带状区域内,则说明经验回归方程较好地刻画了两个变量的关系.
2.残差平方和法
残差平方和越小,模型的拟合效果越好.
3.R2法
可以用R2=1-来比较两个模型的拟合效果,R2越大,模型拟合效果越好,R2越小,模型拟合效果越差.
【题型归纳】
一、求经验回归方程
1.保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y辆与年份代码x年的数据如下表:
年份 2016 2017 2018 2019 2020
年份代码第x年 1 2 3 4 5
新能源汽车y辆 30 50 70 100 110
(1)建立y关于x的线性回归方程;
(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.
参考公式:回归方程斜率和截距的最小二乘估计公式分别为,.
2.恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭中年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了年人均消费总支出(万元)与恩格尔系数的五组数据如下表:
1 1.5 2 2.5 3
0.9 0.7 0.5 0.3 0.2
(1)请根据上表数据,用最小二乘法求出关于的线性回归方程;
(2)若某居民家庭年人均消费总支出为2.6万元,估计该居民家庭恩格尔系数.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
线性回归分析
3.2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜 刘伯明 汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下表:建立了y与x的两个回归模型:模型①:,
模型②:;
序号 1 2 3 4 5 6 7
x 2 3 4 6 8 10 13
y 15 22 27 40 48 54 60
(1)根据表格中的数据,比较模型①,②的相关指数的大小;
(2)据(2)选择拟合精度更高 更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益.
附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..
回归模型 模型① 模型②
79.31 20.2
4.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:
月份
物流成本
利润
残差
根据最小二乘法公式求得线性回归方程为.
(1)求的值,并利用已知的线性回归方程求出月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到);若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)决定系数,请说明以上两种模型哪种模型拟合效果更好?
(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为万元.请重新根据最小二乘法的思想与公式,求出新的线性回归方程.
附1(修正前的参考数据):
,,,.
附2:.
附3:,.
三、非线性回归
5.经观测,某种昆虫的产卵数y与温度x有关,现将收集到的温度和产卵数的10组观测数据作了初步处理,得到如下图的散点图及一些统计量表.
275 731.1 21.7 150 2368.36 30
表中,
(1)根据散点图判断,与哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据.试求y关于x回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
6.发展扶贫产业,找准路子是关系,重庆市石柱土家族自治县中益乡华溪村不仅找准了路,还将当地打造成了种植中药材黄精的产业示范基地.通过种植黄精,华溪村村民的收逐年递增.以下是2013年至2019年华溪村村民每户平均可支配收入的统计数据:
年份 2013 2014 2015 2016 2017 2018 2019
年份代码x 1 2 3 4 5 6 7
每户平均可支配收y(千元) 4 15 22 26 29 31 32
根据以上数据,绘制如图所示的散点图:
(1)根据散点图判断, 与哪一个更适宜作为每户平均可支配收入y(千元)关于年份代码x的回归方程模型(给出判断即可,不必说明理由),并建立y关于x的回归方程(结果保留1位小数);
(2)根据(1)建立的回归方程,试预测要到哪一年华溪村的每户平均可支配收入才能超过35(千元)?
(3)从2013年至2019年中任选两年,求事件A:“恰有一年的每户平均可支配收入超过22(千元)”的概率.
参考数据:其中
参考公式:线性回归方程中,
【双基达标】
1.线性回归分析模型中,变量X与Y的一组样本数据对应的点均在直线上,表示解释变量对于预报变量变化的贡献率,则( )
A. B. C.1 D.
2.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.99 3 4 5.1 6.12
y 1.5 4.04 7.5 12 18.01
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( )
A. B. C. D.
3.变量与相对应的一组样本数据为、、、,由上述样本数据得到与的线性回归分析,表示解释变量对于预报变量变化的贡献率,则( )
附:决定系数公式.
A. B. C. D.
4.设两个变量和之间具有线性相关关系,它们的相关系数是,关于的经验回归直线的斜率为,截距是,那么必有( )
A.与的符号相同 B.与的符号相同
C.与的符号相反 D.与的符号相反
5.某公司为了增加某商品的销售利润,调查了该商品投入的广告费用(万元)与销售利润(万元)的统计数据如下表,由表中数据,得线性回归直线,则下列结论错误的是( )
广告费用(万元) 2 3 5 6
销售利润(万元) 5 7 9 11
A. B.
C.直线过点 D.直线过点
6.某化工厂产生的废气经过过滤后排放,以模型去拟合过滤过程中废气的污染物浓度与时间之间的一组数据,为了求出线性回归方程,设,其变换后得到线性回归方程为,则当经过后,预报废气的污染物浓度为( )
A. B. C. D.
7.(多选)下列说法正确的是( )
A.设有一个回归方程,变量增加一个单位时,平均增加5个单位;
B.若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,相关指数越接近于1,说明回归的效果越好
8.(多选)将两个变量的对样本数据在平面直角坐标系中表示为散点图,根据满足一元线性回归模型及最小二乘法,求得其经验回归方程为,设为回归直线上的点,则下列说法正确的是( )
A.越小,说明模型的拟合效果越好
B.利用最小二乘法求出的线性回归直线一定经过散点图中的某些点
C.相关系数的绝对值越接近于,说明成对样本数据的线性相关程度越强
D.通过经验回归方程进行预报时,解释变量的取值不能距离样本数据的范围太远,求得的预报值不是响应变量的精确值
9.为了对,两个变量进行统计分析,现根据两种线性模型分别计算出甲模型的相关指数为,乙模型的相关指数为,则___________(填“甲”或“乙”)模型拟合的效果更好.
10.某工厂为研究某种产品的产量(吨)与所需某种原材料的质量(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
3 4 5 6
2.5 3 4
根据表中数据,得出关于的经验回归方程为.据此计算出在样本处的残差为,则表中的值为______.
11.用模型拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则___________.
12.某设备的使用年限与所支出的维修费用的统计数据如下表:
使用年限(单位:年) 2 3 4 5 6
维修费用(单位:万元)
根据上表可得回归直线方程为,据此模型预测,若使用年限为年,估计维修费约为_____万元.
13.某个服装店经营某种服装,在某周内每天获得的纯利润(元)与该周每天销售这种服装数量(件)之间的一组数据关系如下表:
3 4 5 6 7 8 9
66 69 73 81 89 90 91
已知:,,.
参考公式:经验回归方程是,其中,.
(1)求,;
(2)画出散点图;
(3)求每天的纯利润与每天销售数量之间的经验回归方程.
14.某知名中学高三年级甲班班主任近期对班上每位同学的成绩作相关分析时,得到某同学的某些成绩数据如下:
第一次考试 第二次考试 第三次考试 第四次考试
数学总分 118 119 121 122
总分年纪排名 133 127 121 119
(1)求总分年级排名关于数学总分的回归方程(必要时用分数表示);
(2)若该同学想在下次测试时考入年级前100名,预测该同学下次测试的数学成绩至少应考多少分?(取整数).
附:回归方程中,,.
15.下表是我国从2016年到2020年能源消费总量近似值y(单位:千万吨标准煤)的数据表格:
年份 2016 2017 2018 2019 2020
年份代号x 1 2 3 4 5
能源消费总量近似值y(单位:千万吨标准煤) 442 456 472 488 498
以x为解释变量,y为预报变量,若以为回归方程,则相关指数,若以为回归方程,则相关指数.
(1)判断与哪一个更适宜作为能源消费总量近似值y关于年份代号x的回归方程,并说明理由;
(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程.
参考数据:,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.
16.2021年4月20日我校高三学生参加了高考体检,为了解我校高三学生中男生的体重(单位:)与身高(单位:)是否存在较好的线性关系,体检机构搜集了7位我校男生的数据,得到如下表格:
序号 1 2 3 4 5 6 7
身高 166 173 185 183 178 180 174
体重 57 62 78 75 71 67 59
根据表中数据计算得到关于的线性回归方程为.
(1)求;
(2)已知,且当时,回归方程的拟合效果非常好;当时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.(的结果保留到小数点后两位)
参考数据:.
【高分突破】
1.下列说法正确的是( )
A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法
B.线性回归方程对应的直线至少经过其样本数据点中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,相关指数为0.95的模型比相关指数为0.78的模型拟合的效果差
2.下列四个命题:①在回归模型中,预报变量y的值不能由解释变量x唯一确定;②若变量x,y满足关系,且变量y与z正相关,则x与z也正相关;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,.
其中真命题的个数为( )
A.1个 B.2个 C.3个 D.4个
3.根据如表样本数据:
x 3 5 7 9
y 6 3 2
得到回归方程,(回归方程的斜率,截距,满足:),则下列结论:
①变量x与y是线性正相关关系,②变量x与y是线性负相关关系,③,④,其中正确的是( )A.①③ B.②③ C.①④ D.②④
4.(多选)已知由样本数据,、、、、、求得的经验回归方程为,且.现发现一个样本数据误差较大,去除该数据后重新求得的经验回归直线的纵截距依然是,则下列说法正确的是( )
A.去除前变量每增加个单位,变量一定增加个单位
B.去除后剩余样本数据中的平均数为
C.去除后的经验回归方程为
D.去除后相关系数变大
5.(多选)关于变量x,y的n个样本点及其线性回归方程.下列说法正确的有( )
A.相关系数r的绝对值|r|越接近0,表示x,y的线性相关程度越强
B.相关指数的值越接近1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若,则点一定在线性回归方程上
6.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
7.已知由一组样本数据确定的回归方程为,且,发现有两组数据(2.4,2.8)与(1.6,5.2)误差较大.去掉这两组数据后,重新求得回归直线的斜率为1,那么当时,的估计值为______.
8.为研究质量(单位:克)对弹簧长度(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:
5 10 15 20 25 30
7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求线性回归方程;
(2)求出;
(3)进行残差分析.
9.5G的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,5G经济收入在短期内逐月攀升,该创新公司在第1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如表:
时间(月份) 1 2 3 4 5 6
收入(百万元) 6.6 8.6 16.1 21.6 33.0 41.0
根据以上数据绘制散点图,如图.
(1)根据散点图判断,与(a,b,c,d均为常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中数据,求出y关于x的回归方程,并预测该公司8月份的5G经济收入;
(3)从前6个月的收入中抽取3个,记月收入超过16百万的个数为X,求X的分布列和数学期望.
参考数据:
3.50 21.15 2.85 17.50 125.35 6.73
其中设,
参考公式和数据:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,,,.
10.全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入(百万元)与收益(百万元)的数据统计如下:
科技投入 1 2 3 4 5 6 7
收益 19 20 22 31 40 50 70
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
5 140 1239 149 2134 130
其中,.
(1)请根据表中数据,建立关于的回归方程(系数精确到0.1,用的近似值算);
(2)①乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的决定系数(即相关指数),试计算,比较甲乙两人所建立的模型,谁的拟合效果更好?(精确到0.001)
②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)
附:对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘法估计分别为,,决定系数:.参考数据:.
11.如图是某市2011年至2020年当年在售二手房均价(单位:千元/平方米)的散点图(图中年份代码1~10分别对应2011年~2020年).现根据散点图选择用和两个模型对年份代码和房价的关系进行拟合,经过数据处理得到两个模型对应回归方程的相关指数和一些统计量的值,如下表:
模型
相关指数 0.8821 0.9046
6.81 1.89 82.5 44.55 6.6
表中,.
(1)请利用相关指数判断:哪个模型的拟合效果更好;并求出该模型对应的回归方程(参数估计值精确到0.01);
(2)根据(1)得到的方程预计;到哪一年,该市的当年在售二手房均价能超过10.5千元/平方米.
参考公式:对于一组数据,,…,,其回归线的斜率和截距的最小二乘估计分别为:,.参考数据:,.
12.习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,这将进一步推动新能源汽车产业的迅速发展.以下是近几年我国新能源乘用车的年销售量数据及其散点图:
年份 2013 2014 2015 2016 2017
年份代码
新能源乘用车年销量(万辆)
(1)请根据散点图判断,与中哪一个更适宜作为年销售量关于年份代码的回归方程类型 (给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程,并预测年我国新能源乘用车的销售量(精确到).
附: 1.最小二乘法估计公式:
其中
【答案详解】
【题型归纳】
1.【详解】(1),,
,因为,所以,所以
(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当时,,该地区2022年共有30万辆汽车,所以新能源汽车.
2.【详解】(1)由题意可得,



则,,故.
(2)当时,,
故估计该居民家庭恩格尔系数为0.304.
3.【详解】(1)对于模型①,
对应的,
故对应的,
故对应的相关指数,对于模型②,
同理对应的相关指数,.
(2)故模型②拟合精度更高 更可靠.
故对A型材料进行应用改造的投入为17亿元时的直接收益为.
4.【详解】(1)因为,,所以
,解得,
所以月份对应的残差值;
(2)由已知公式得,

所以线性回归模型拟合程度更好;
(3)由(1)可知,第八组数据的利润应为(万元)
此时,又,,,
所以,所以,
所以重新采集数据后,线性回归方程为.
5.【详解】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,
所以适宜作为y与x之间的回归方程模型;
(2)令,则,


∴;
∴y关于x的回归方程为.
6.【详解】
(1)根据散点图,更适宜作为每户平均可支配收入y(千元)关于年份代码x的回归方程模型;
由已知数据得:,
故,
故y关于x的回归方程为:
(2)由题知,令,整理得:,即:,
故当时,即到2021年每户平均可支配收入才能超过35(千元);
(3)由题知2013年到2019年共7年,其中一年的每户平均可支配收入超过22(千元)的有4年,故“恰有一年的每户平均可支配收入超过22(千元) ”的概率为:.
【双基达标】
1.C
【详解】因为样本数据对应的点在一条直线上,所以,故选:C.
2.D
【详解】由实验数据知,相邻的自变量之差大约为1,相邻的函数值之差大约为2.5、3.5、4.5、6,基本上是逐渐增加的,在增函数中二次曲线拟合程度最好;
另,也可比较四个函数值的大小,可以采用特殊值代入法.可取x=4,经检验易知比较适合.
故选:D
3.C
【详解】易知,点、、、都在直线上,
所以,,所以,. 故选:C.
4.A
【详解】回归直线方程,和的符号相同,所以A正确. 故选:A
5.D
【详解】作出散点图如图所示.
通过散点图可知线性回归直线是递增型,所以,
也可以观测到在轴的截距是大于零的,所以,
又,,
所以线性回归直线过这一点.
故选:D.
6.D
【详解】当时, ,所以. 故选:D.
7.CD
【详解】
A选项,因为,所以变量增加一个单位时,平均减少5个单位,故A错;
B选项,线性相关性具有正负,相关性越强,则线性相关系数的绝对值越接近于1,故B错;
C选项,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,即C正确;
D选项,在线性回归模型中,相关指数越接近于1,说明模型拟合的精度越高,即回归的效果越好,即D正确.
故选:CD.
8.CD
【详解】
A. 当所有时,,当所有时,,显然后者拟合效果好,故错误;
B.利用最小二乘法求出的线性回归直线一定经过样本中心,不一定经过散点图中的某些点,故错误;
C. 相关系数的绝对值越接近于,说明成对样本数据的线性相关程度越强,故正确;
D.样本取值会影响回归方程的运用范围,求得的预报值不是响应变量的精确值,故正确;
故选:CD
9.甲
【详解】相关指数越接近1,表明拟合效果越好,
,甲模型拟合效果更好. 故答案为:甲.
10.
【详解】因为样本处的残差为,即,
所以,
所以回归方程为:,
因为,,
因为样本中心点在回归直线上,所以,
解得:,
故答案为:.
11.
【详解】由,得,,所以.
故答案为:
12.18
【详解】,
则中心点为,代入回归直线方程可得,
当时,(万元),即估计使用14年时,维修费用是18万元.
故答案为:18.
13.【详解】
(1),.
(2)散点图如图所示.
(3)由散点图知,与具有线性相关关系,设经验回归方程为,
∵,,,,
∴,,
∴经验回归方程为.
14.【详解】(1)因为,,
所以,
所以.所以.
(2)因为,所以,解得.
因为数学成绩要取整,所以该同学下次测试的数学成绩至少应考128分,才能考入年级前100名.
15.【详解】(1)因为,所以更适宜作为y关于x的回归方程.
(2),.
,,
所以以x为解释变量,y为预报变量的回归方程为.
16.【详解】
(1)由题意可得,,,
又关于的线性回归方程为,所以
(2)由题意,
所以,
所以该线性回归方程的拟合效果是良好的.
【高分突破】
1.C
【详解】
对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A错;
对于B,线性回归方程对应的直线可能不过任何一个样本数据点,所以B错误;
对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;
对于D,回归分析中,相关指数为的模型比相关指数为的模型拟合的效果好,所以D错误.
故选:C
2.C
【详解】
下列四个命题:
①在回归模型中,预报变量y的值不能由解释变量x唯一确定;根据回归模型中的变量关系,正确.
②若变量x,y满足关系,且变量y与z正相关,则x与z也正相关;应该是负相关.故错误.
③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;即越接近于回归直线的距离越小,故正确.
④以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,.故正确.
故选:C.
3.B
【详解】
由题可知,变量x与y是线性负相关关系,求得,由样本中心过线性回归方程得,由
故正确序号为:②③
故选:B
4.BCD
【详解】
当时,,则,,
去除样本数据的新数据后,,,
设去除样本数据后重新求得的经验回归直线方程为,则,解得,故去除后的经验回归方程为,C对;
对于A选项,去除前变量每增加个单位,变量大约增加个单位,A错;
对于B选项,去除后剩余样本数据中的平均数为,B对;
对于D选项,去除了误差较大的样本数据后,线性相关性变强,
因为关于为正相关,则,所以,相关系数变大,D对.
故选:BCD.
5.BD
【详解】
根据线性相关系数的意义可知,当的绝对值越接近于0时,
两个随机变量线性相关性越弱,则A错误;
用相关指数来刻画回归效果,
越大,说明模型的拟合效果越好,则B正确;
拟合效果的好坏是由残差平方和来体现的,
残差平方和越大,拟合效果越差,则C错误;
样本中心点一定在回归直线上,则D正确.
故选:BD.
6.①③
【详解】在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
7.6
【详解】
∵由一组样本数据确定的回归方程为,且,
∴,∴样本点的中心为(2,4).
去掉(2.4,2.8)与(1.6,5.2) ,剩余数据的样本点的中心为(2 ,4).
∵重新求得的回归直线的斜率为1,
∴回归方程可设为,将(2,4)的坐标代入,得,
∴回归直线的方程为.将代入经验回归方程,得的估计值为6.
故答案为:6
8.【详解】
(1)根据所给数据,作出散点图如图所示:
由表中的数据可得,



∴,
∴,
故所求回归直线方程为.
(2)由题意及(1)中的回归方程可得下表:
0.05 0.005 -0.08 -0.045 0.04 0.025
-2.24 -1.37 -0.54 0.41 1.41 2.31
∴,,
∴.
(3)①由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;
②由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.
由以上分析可知,弹簧长度与质量具有线性关系.
9.【详解】
(1),散点图中点的分布不是一条直线,相邻两点在y轴上差距是增大的趋势,故用表示更合适.
(2)由得,设,所以,
因为,,,,
所以,,

所以,即,
则回归方程为,
预测该公司8月份的5G经济收入百万元.
(3)月收入超过16百万的个数为的可能取值为1,2,3,
则,


则的分布列为
1 2 3
所以.
10.【详解】(1)将两边取对数得:,令,则,
∵,∴根据最小二乘估计可知:,
∴,
∴回归方程为,即.
(2)①甲建立的回归模型的.
∴甲建立的回归模型拟合效果更好.
②由①知,甲建立的回归模型拟合效果更好.
设,解得:,解得:.
∴科技投入的费用至少要9.3百万元,下一年的收益才能达到1亿.
11.【详解】
(1)由相关指数:,知模型的拟合效果更好.
∵,∴,令,
可知与满足线性模型回归方程,

则,

所以回归方程为,即.
(2)将代入,可得,
将代入,可得,
所以,根据方程预计:到2022年,该市的当年在售二手房均价能超过10.5千元/平方米.
12.【详解】(1)根据散点图,更适宜作为年销售量关于年份代码的回归方程
(2)依题意,
令,,预测2018年我国新能源乘用车的销售量为79.7万辆.