人教A版(2019)选择性必修第三册 8.2一元线性回归模型及其应用
一、选择题(共13小题)
1.(2017高二下·广州期中)对两个变量Y与X进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型Ⅰ的相关系数r为0.96 B.模型Ⅱ的相关系数r为0.81
C.模型Ⅲ的相关系数r为0.53 D.模型Ⅳ的相关系数r为0.35
【答案】A
【知识点】样本相关系数r及其数字特征
【解析】【解答】解:∵相关系数的绝对值越大,越具有强大相关性,
A相关系数的绝对值约接近1,
∴A拟合程度越好.
故选A.
【分析】相关系数的绝对值越接近于1,越具有强大相关性,A相关系数的绝对值约接近1,得到结论.
2.已知、之间的数据见下表,则与之间的线性回归方程过点( )
A. B.
C. D.
【答案】D
【知识点】线性回归方程;可线性化的回归分析
【解析】【解答】因为 ,
所以 ,
所以 与 之间的线性回归方程过点 .
故答案为:D
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合线性回归方程恒过中心点的性质,进而得出正确的选项。
3.甲、乙、丙、丁四位同学各自对,两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和,如下表:
则哪位同学的试验结果体现,两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
【答案】D
【知识点】线性相关;样本相关系数r及其数字特征
【解析】【解答】 越大, 越小,线性相关性越强.
故答案为:D
【分析】利用已知条件结合表中数据,再结合相关系数与残差平方和与线性相关性的强弱关系,进而找出试验结果体现,两变量有更强的线性相关性的同学。
4.农民工月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是( )
A.
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资水平提高80元
C.劳动生产率提高1000元时,工资水平提高130元
D.当月工资为210元时,劳动生产率为2000元
【答案】B
【知识点】回归分析的初步应用
【解析】【解答】由回归直线方程 知, 每增加1, 增加80,但要注意 的单位是千元, 的单位是元.
故答案为:B
【分析】利用已知条件结合线性回归方程和代入法,进而得出劳动生产率提高1000元时,工资水平提高80元。
5.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
建立的回归模型拟合效果最差的同学是( )
A.甲 B.乙 C.丙 D.丁
【答案】C
【知识点】线性回归方程
【解析】【解答】解:在两个变量y与x的回归模型中,
它们的相关指数R2越接近于1,模拟效果越好,反之,越差,
在四个选项中丙的相关指数最小,
∴拟合效果最差的是丙,
故选:C.
【分析】在两个变量y与x的回归模型中,它们的相关指数R2越接近于0,模拟效果越差,观测所给的几个模型,看出相关系数最小的模型即可.
6.设两个变量和之间具有线性相关关系,它们的相关系数是,关于的回归直线的斜率是,纵截距是,那么必有( )
A.与的符号相同 B.与的符号相同
C.与的相反 D.与的符号相反
【答案】A
【知识点】线性回归方程;样本相关系数r及其数字特征
【解析】【解答】解:根据和r的定义公式可知A正确; 与r的符号不能确定.
故选:A.
【分析】由相关程度系数r与回归方程的定义,可以得出答案.
7.关于相关系数,下列说法错误的是( )
A.当时,表明两个变量正相关
B.当时,表明两个变量负相关
C.的绝对值大于0.75时,认为两个变量有很强的线性相关性
D.的绝对值越接近于1,表明两个变量之间几乎不存在线性相关关系
【答案】D
【知识点】样本相关系数r及其数字特征
【解析】【解答】解:根据相关系数的含义,可得当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关,
当r的绝对值大于0.75时,认为两个变量有很强的线性相关性;
当r的绝对值越接近于1时,两个变量的相关系越强,所以A、B、C正确,D错误.
故选:D.
【分析】根据相关系数的含义,逐项判定,即可求解.
8.某产品的广告费用与销售额的统计数据如下表,根据表可得回归方程中的为9.4,据此预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
【答案】B
【知识点】线性回归方程;回归分析的初步应用
【解析】【解答】从表格中,易算出 , .
因为回归直线必过点 ,即.将其代入 可得 ,解得 ,所以回归方程为 .当 时 ,所以预报广告费用为6万元时销售额为65.5万元.
故答案为:B
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合代入法和线性回归方程预报广告费用为6万元时销售额。
9.已知与之间的一组数据:
若关于的线性回归方程为,则的值为( )
A.1 B.0.85 C.0.7 D.0.5
【答案】D
【知识点】线性回归方程
【解析】【解答】由题意,得 ,
又点 在线性回归方程 上,
所以 ,
所以 ,解得 .
故答案为:D
【分析】利用平均数公式和线性回归方程恒过中心点的性质,再结合代入法得出的值,再利用平均数公式得出m的值。
10.根据如下样本数据得到的回归方程为,若,则每增加1个单位,就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加1个单位 D.减少1个单位
【答案】B
【知识点】回归分析的初步应用
【解析】【解答】由题意,得 ,
.
因为 ,且回归直线过点 ,
所以 ,
解得 ,
所以 每增加1个单位, 就减少1.4个单位.
故答案为:B
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合线性回归方程和代入法得出 每增加1个单位, 就减少1.4个单位。
11.据统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学学习时间与数学成绩进行数据收集如表:
由表中样本数据求回归直线方程,则点与直线的位置关系为是( )
A.点在直线左侧 B.点在直线右侧
C.点在直线上 D.无法确定
【答案】C
【知识点】线性回归方程
【解析】【解答】解:,
则18b+a=110,
所以点在直线上.
故选:C
【分析】计算平均数,根据回归方程过样本中心点可得.
12.实验测得四组的值是,,,,则与之间的回归直线的方程是( )
A. B. C. D.
【答案】A
【知识点】线性回归方程
【解析】【解答】解:,
则,
则回归直线方程为:
故选:A
【分析】通过数据求解参数,从而得到回归方程.
13.两个变量与的回归模型中,分别选择了4个不同的模型,它们的相关指数如下,其中拟合效果最好的模型是( )
A.模型1的相关指数为0.99 B.模型的相关指数为0.88
C.模型3的相关指数为0.50 D.模型4的相关指数为0.20
【答案】A
【知识点】样本相关系数r及其数字特征
【解析】【解答】两个变量 与 的回归模型中,它们的相关指数 越接近于1,这个模型的拟合效果越好,在所给的四个选项中,0.99是相关指数最大的值,因此拟合效果最好的是模型1.
故答案为:A
【分析】利用已知条件结合相关指数与回归模型拟合效果的好坏的关系,进而找出拟合效果最好的模型。
二、填空题(共6小题)
14.某商品在5家商场的售价(元)和销售量(件)之间的一组数据如下表所示:
由散点图可知,销售量与价格之间有较好的线性相关关系,且回归直线方程是,则 .
【答案】10
【知识点】线性回归方程
【解析】【解答】根据题意得,
,
,
因为回归直线过样本中心点 ,
所以 ,
解得 .
【分析】利用已知条件结合平均数公式和线性回归方程恒过中心点的性质,再结合平均数公式和代入法,进而得出a的值。
15.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于 .
【答案】0,1或-1
【知识点】样本相关系数r及其数字特征
【解析】【解答】设样本点为 , ,回归直线为 ;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有 ;残差平方和 ;解释变量和预报变量之间的相关系数 满足 ,所以
【分析】利用线性回归直线和散点图中的数据,再结合残差平方和以及解释变量和预报变量之间的相关系数的关系,进而得出正确的答案。
16.若某函数模型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为 ,回归平方和为 .
【答案】1780;1691
【知识点】回归分析;样本相关系数r及其数字特征
【解析】【解答】由题中条件可知,残差平方和占总偏差平方和的比例为 ,所以总偏差平方和为 ,回归平方和为 或 .
【分析】利用已知条件结合残差平方和求解方法、总偏差平方和求解方法、回归平方和求解方法,进而写出正确的答案。
17.(2015高二上·滨州期末)已知两个具有线性相关关系的变量x与y的几组数据如下表
x 3 4 5 6
y m 4
根据上表数据所得线性回归直线方程为 = x+ ,则m= .
【答案】3
【知识点】线性回归方程
【解析】【解答】解: = =4.5, = = .
∴ = ,解得m=3.
故答案为:3.
【分析】求出 代入回归方程解出m.
18.已知回归直线斜率估计值为1.23,样本点中心为,则回归方程是 .
【答案】
【知识点】线性回归方程
【解析】【解答】解:由题意可设回归方程为,
代入 样本点中心,得,
故回归方程为:
故答案为:
【分析】根据回归方程的性质,计算即可得答案.
19.回归分析
(1)回归分析是对具有⑧ 的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据,,,,我们知道,,则将⑨ 称为样本点的中心.
(3)相关系数:.
当时,表明两个变量⑩ ;
当时,表明两个变量 .
的绝对值越接近于1,表明两个变量的线性相关性 .的绝对值越接近于0,表明两个变量之间 .通常大于或等于 时,认为两个变量有很强的线性相关性.
【答案】(1)相关关系
(2)
(3)正相关;负相关;越强;几乎不存在线性相关关系;0.75
【知识点】变量相关关系;回归分析
【解析】【解答】
解:(1)由回归分析的概念易知: 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
故答案为:相关关系.
(2)由样本点的中心的概念易知: 对于一组具有线性相关关系的数据,,,,我们知道,,则将称为样本点的中心.
故答案为:.
(3)由相关系数的概念易知:
当时,表明两个变量正相关;
当时,表明两个变量负相关;
的绝对值越接近于1,表明两个变量的线性相关性越强;
的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系;
通常大于或等于0.75时,认为两个变量有很强的线性相关性.
故答案为:
第1空、正相关
第2空、负相关
第3空、越强
第4空、几乎不存在线性相关关系
第5空、0.75
【分析】由回归分析、 样本点的中心、相关系数的概念与性质逐个写出答案.
三、解答题(共7小题)
20.在试验中得到变量与的数据如下:
已知与之间具有线性相关关系,试求与之间的回归方程,并预测当时的值.
【答案】解令 ,由题目所给数据可得下表所求的数据:
计算得 , ,
所以线性回归方程为 .
将 代入,
得所求回归曲线方程为 .
所以当 时, .
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合代入法和线性回归方程预测出当时的值。
21.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
(注:,,,)
(1)求出关于的线性回归方程,并在坐标系中画出回归直线;
(2)试预测加工10个零件需要的时间.
【答案】(1)解由表中数据得
,
,
所以 ,
.
所以回归直线如图所示.
(2)解将 代入回归直线方程,得 ,故预测加工10个零件需要8.05小时.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合最小二乘法得出线性回归方程,再结合描点法画出线性回归直线。
(2)利用已知条件结合线性回归方程和代入法,进而预测加工10个零件需要的时间。
22.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
附注:
参考数据:,,,.
参考公式:相关系数.
回归方程中斜率和截距的最小二乘估计公式分别为:,.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
【答案】(1)解由折线图中数据和附注中参考数据得
, , ,
,
.
因为 与 的相关系数近似为0.99,说明 与 的线性相关程度相当高,从而可以用线性回归模型拟合 与 的关系.
(2)解由 及(1)得 .
.
所以 关于 的回归方程为 .
将2016年对应的 代入回归方程得 .
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
【知识点】线性回归方程;回归分析的初步应用;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合折线图中的数据,再结合相关系数与变量线性相关程度的高低关系,进而得出 与 的相关系数近似为0.99,说明 与 的线性相关程度相当高,从而可以用线性回归模型拟合 与 的关系 。
(2)利用已知条件结合最小二乘法得出线性回归方程,再结合代入法预测出2016年我国生活垃圾无害化处理量。
23.一种室内植物的株高(单位:)与一定范围内的温度(单位:)有关,现收集了该种植物的13组观测数据,得到如图所示的散点图:
现根据散点图利用或建立关于的回归方程,令,,得到如下数据:
且与的相关系数分别为,,其中.
附:对于样本,其回归直线的斜率和截距的最小二乘估计公式分别为,,
相关系数,
.
(1)用相关系数说明哪种模型建立关于的回归方程更合适;
(2)(ⅰ)根据(1)的结果及表中数据,求关于的回归方程;
(ⅱ)已知这种植物的利润(单位:千元)与,的关系为,当何值时,利润的预报值最大.
【答案】(1)解由相关系数公式可得
因为 ,
所以用 模型建立 与 的回归方程更合适.
(2)解(ⅰ)由题意可得 ,
,
因此, 与 的回归方程为 .
(ⅱ)由题意知 ,
由基本不等式可得 ,
所以 ,当且仅当 时等号成立,
所以当温度为 时,这种植物的利润 的预报值最大.
【知识点】基本不等式在最值问题中的应用;线性回归方程;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合相关系数的求解方法,再利用 ,所以用 模型建立 与 的回归方程更合适。
(2) (ⅰ)根据(1)的结果及表中数据结合最小二乘法得出关于的回归方程;
(ⅱ)利用这种植物的利润(单位:千元)与,的关系为,再利用(i)中y关于x的回归直线方程得出 ,再利用均值不等式求最值的方法得出当温度为 时,这种植物的利润 的预报值最大。
24.某城区为了研究落后城镇居民家庭的月人均生活费支出和月人均收入的相关关系,随机抽出了10户进行调查,其结果如下:
试预测月人均收入为1100元和月人均收入为1200元的两个家庭的月人均生活费支出.
【答案】解作出散点图(图略).由图可知,月人均生活费支出和月人均收入具有线性相关关系.
通过计算可知 , , , , , , ,
所以线性回归方程为
列出残差表为
作残差图,如图.由图可知,残差点比较均匀地分布在水平的带状区域中,说明选用的模型比较合适.
由以上分析可知,我们可以用回归方程 来预测月生活费的支出.
将 代入,得 元;
将 代入,得 元·
故预测月人均收入为1100元和月人均收入1200元的两个家庭的月人均生活费支出分别为784.64元和850.63元.
【知识点】散点图;线性回归方程;回归分析的初步应用
【解析】【分析】利用已知条件画出散点图,再结合散点图中的数据结合最小二乘法得出线性回归方程,再结合残差求解方法和线性回归方程以及代入法得出预测出月人均收入为1100元和月人均收入1200元的两个家庭的月人均生活费支出。
25.某种商品价格与该商品日需求量之间的几组对照数据如下表:
参考公式:线性回归方程,其中,.
(1)求关于的线性回归方程;
(2)利用1中的回归方程,当价格时,日需求量的预测值为多少
【答案】(1)解由所给数据计算得 ,
,
,
=
.
.
所求线性回归方程为
(2)解由1知当 时, .
故当价格 时,日需求量 的预测值为 .
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出线性回归方程。
(2) 利用已知条件结合线性回归方程和代入法,进而得出当价格时的日需求量的预测值。
26.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年利润(单位:千元)的影响,对近5年的宣传费和年利润()进行了统计,列出了下表:
员工小王和小李分别提供了不同方案.
参考公式:相关数据.
回归方程中斜率和截距的最小二乘估计公式分别为:,.参考数据:,.
(1)小王准备用线性回归模型拟合与的关系,请你帮助建立关于的线性回归方程:(系数精确到0.01).
(2)小李决定选择对数回归模型拟合与的关系,得到了回归方程,并提供了相关指数.请用相关指数说明选择哪个模型更合适,并预测年宣传费为4万元的年利润.(精确到0.01)(小王也提供了他的分析数据)
【答案】(1)解
(2)解小李提供的模型更合适,预测年宣传费为4万元的年利润为5.37万元.
【知识点】线性回归方程;回归分析的初步应用;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出y关于x的线性回归方程。
(2)利用已知条件结合相关指数求解方法和线性回归方程以及代入法,进而得出小李提供的模型更合适,并且预测出年宣传费为4万元的年利润。
1 / 1人教A版(2019)选择性必修第三册 8.2一元线性回归模型及其应用
一、选择题(共13小题)
1.(2017高二下·广州期中)对两个变量Y与X进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型Ⅰ的相关系数r为0.96 B.模型Ⅱ的相关系数r为0.81
C.模型Ⅲ的相关系数r为0.53 D.模型Ⅳ的相关系数r为0.35
2.已知、之间的数据见下表,则与之间的线性回归方程过点( )
A. B.
C. D.
3.甲、乙、丙、丁四位同学各自对,两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和,如下表:
则哪位同学的试验结果体现,两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
4.农民工月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是( )
A.
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资水平提高80元
C.劳动生产率提高1000元时,工资水平提高130元
D.当月工资为210元时,劳动生产率为2000元
5.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
建立的回归模型拟合效果最差的同学是( )
A.甲 B.乙 C.丙 D.丁
6.设两个变量和之间具有线性相关关系,它们的相关系数是,关于的回归直线的斜率是,纵截距是,那么必有( )
A.与的符号相同 B.与的符号相同
C.与的相反 D.与的符号相反
7.关于相关系数,下列说法错误的是( )
A.当时,表明两个变量正相关
B.当时,表明两个变量负相关
C.的绝对值大于0.75时,认为两个变量有很强的线性相关性
D.的绝对值越接近于1,表明两个变量之间几乎不存在线性相关关系
8.某产品的广告费用与销售额的统计数据如下表,根据表可得回归方程中的为9.4,据此预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
9.已知与之间的一组数据:
若关于的线性回归方程为,则的值为( )
A.1 B.0.85 C.0.7 D.0.5
10.根据如下样本数据得到的回归方程为,若,则每增加1个单位,就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加1个单位 D.减少1个单位
11.据统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学学习时间与数学成绩进行数据收集如表:
由表中样本数据求回归直线方程,则点与直线的位置关系为是( )
A.点在直线左侧 B.点在直线右侧
C.点在直线上 D.无法确定
12.实验测得四组的值是,,,,则与之间的回归直线的方程是( )
A. B. C. D.
13.两个变量与的回归模型中,分别选择了4个不同的模型,它们的相关指数如下,其中拟合效果最好的模型是( )
A.模型1的相关指数为0.99 B.模型的相关指数为0.88
C.模型3的相关指数为0.50 D.模型4的相关指数为0.20
二、填空题(共6小题)
14.某商品在5家商场的售价(元)和销售量(件)之间的一组数据如下表所示:
由散点图可知,销售量与价格之间有较好的线性相关关系,且回归直线方程是,则 .
15.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于 .
16.若某函数模型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为 ,回归平方和为 .
17.(2015高二上·滨州期末)已知两个具有线性相关关系的变量x与y的几组数据如下表
x 3 4 5 6
y m 4
根据上表数据所得线性回归直线方程为 = x+ ,则m= .
18.已知回归直线斜率估计值为1.23,样本点中心为,则回归方程是 .
19.回归分析
(1)回归分析是对具有⑧ 的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据,,,,我们知道,,则将⑨ 称为样本点的中心.
(3)相关系数:.
当时,表明两个变量⑩ ;
当时,表明两个变量 .
的绝对值越接近于1,表明两个变量的线性相关性 .的绝对值越接近于0,表明两个变量之间 .通常大于或等于 时,认为两个变量有很强的线性相关性.
三、解答题(共7小题)
20.在试验中得到变量与的数据如下:
已知与之间具有线性相关关系,试求与之间的回归方程,并预测当时的值.
21.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
(注:,,,)
(1)求出关于的线性回归方程,并在坐标系中画出回归直线;
(2)试预测加工10个零件需要的时间.
22.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
附注:
参考数据:,,,.
参考公式:相关系数.
回归方程中斜率和截距的最小二乘估计公式分别为:,.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
23.一种室内植物的株高(单位:)与一定范围内的温度(单位:)有关,现收集了该种植物的13组观测数据,得到如图所示的散点图:
现根据散点图利用或建立关于的回归方程,令,,得到如下数据:
且与的相关系数分别为,,其中.
附:对于样本,其回归直线的斜率和截距的最小二乘估计公式分别为,,
相关系数,
.
(1)用相关系数说明哪种模型建立关于的回归方程更合适;
(2)(ⅰ)根据(1)的结果及表中数据,求关于的回归方程;
(ⅱ)已知这种植物的利润(单位:千元)与,的关系为,当何值时,利润的预报值最大.
24.某城区为了研究落后城镇居民家庭的月人均生活费支出和月人均收入的相关关系,随机抽出了10户进行调查,其结果如下:
试预测月人均收入为1100元和月人均收入为1200元的两个家庭的月人均生活费支出.
25.某种商品价格与该商品日需求量之间的几组对照数据如下表:
参考公式:线性回归方程,其中,.
(1)求关于的线性回归方程;
(2)利用1中的回归方程,当价格时,日需求量的预测值为多少
26.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年利润(单位:千元)的影响,对近5年的宣传费和年利润()进行了统计,列出了下表:
员工小王和小李分别提供了不同方案.
参考公式:相关数据.
回归方程中斜率和截距的最小二乘估计公式分别为:,.参考数据:,.
(1)小王准备用线性回归模型拟合与的关系,请你帮助建立关于的线性回归方程:(系数精确到0.01).
(2)小李决定选择对数回归模型拟合与的关系,得到了回归方程,并提供了相关指数.请用相关指数说明选择哪个模型更合适,并预测年宣传费为4万元的年利润.(精确到0.01)(小王也提供了他的分析数据)
答案解析部分
1.【答案】A
【知识点】样本相关系数r及其数字特征
【解析】【解答】解:∵相关系数的绝对值越大,越具有强大相关性,
A相关系数的绝对值约接近1,
∴A拟合程度越好.
故选A.
【分析】相关系数的绝对值越接近于1,越具有强大相关性,A相关系数的绝对值约接近1,得到结论.
2.【答案】D
【知识点】线性回归方程;可线性化的回归分析
【解析】【解答】因为 ,
所以 ,
所以 与 之间的线性回归方程过点 .
故答案为:D
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合线性回归方程恒过中心点的性质,进而得出正确的选项。
3.【答案】D
【知识点】线性相关;样本相关系数r及其数字特征
【解析】【解答】 越大, 越小,线性相关性越强.
故答案为:D
【分析】利用已知条件结合表中数据,再结合相关系数与残差平方和与线性相关性的强弱关系,进而找出试验结果体现,两变量有更强的线性相关性的同学。
4.【答案】B
【知识点】回归分析的初步应用
【解析】【解答】由回归直线方程 知, 每增加1, 增加80,但要注意 的单位是千元, 的单位是元.
故答案为:B
【分析】利用已知条件结合线性回归方程和代入法,进而得出劳动生产率提高1000元时,工资水平提高80元。
5.【答案】C
【知识点】线性回归方程
【解析】【解答】解:在两个变量y与x的回归模型中,
它们的相关指数R2越接近于1,模拟效果越好,反之,越差,
在四个选项中丙的相关指数最小,
∴拟合效果最差的是丙,
故选:C.
【分析】在两个变量y与x的回归模型中,它们的相关指数R2越接近于0,模拟效果越差,观测所给的几个模型,看出相关系数最小的模型即可.
6.【答案】A
【知识点】线性回归方程;样本相关系数r及其数字特征
【解析】【解答】解:根据和r的定义公式可知A正确; 与r的符号不能确定.
故选:A.
【分析】由相关程度系数r与回归方程的定义,可以得出答案.
7.【答案】D
【知识点】样本相关系数r及其数字特征
【解析】【解答】解:根据相关系数的含义,可得当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关,
当r的绝对值大于0.75时,认为两个变量有很强的线性相关性;
当r的绝对值越接近于1时,两个变量的相关系越强,所以A、B、C正确,D错误.
故选:D.
【分析】根据相关系数的含义,逐项判定,即可求解.
8.【答案】B
【知识点】线性回归方程;回归分析的初步应用
【解析】【解答】从表格中,易算出 , .
因为回归直线必过点 ,即.将其代入 可得 ,解得 ,所以回归方程为 .当 时 ,所以预报广告费用为6万元时销售额为65.5万元.
故答案为:B
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合代入法和线性回归方程预报广告费用为6万元时销售额。
9.【答案】D
【知识点】线性回归方程
【解析】【解答】由题意,得 ,
又点 在线性回归方程 上,
所以 ,
所以 ,解得 .
故答案为:D
【分析】利用平均数公式和线性回归方程恒过中心点的性质,再结合代入法得出的值,再利用平均数公式得出m的值。
10.【答案】B
【知识点】回归分析的初步应用
【解析】【解答】由题意,得 ,
.
因为 ,且回归直线过点 ,
所以 ,
解得 ,
所以 每增加1个单位, 就减少1.4个单位.
故答案为:B
【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合线性回归方程和代入法得出 每增加1个单位, 就减少1.4个单位。
11.【答案】C
【知识点】线性回归方程
【解析】【解答】解:,
则18b+a=110,
所以点在直线上.
故选:C
【分析】计算平均数,根据回归方程过样本中心点可得.
12.【答案】A
【知识点】线性回归方程
【解析】【解答】解:,
则,
则回归直线方程为:
故选:A
【分析】通过数据求解参数,从而得到回归方程.
13.【答案】A
【知识点】样本相关系数r及其数字特征
【解析】【解答】两个变量 与 的回归模型中,它们的相关指数 越接近于1,这个模型的拟合效果越好,在所给的四个选项中,0.99是相关指数最大的值,因此拟合效果最好的是模型1.
故答案为:A
【分析】利用已知条件结合相关指数与回归模型拟合效果的好坏的关系,进而找出拟合效果最好的模型。
14.【答案】10
【知识点】线性回归方程
【解析】【解答】根据题意得,
,
,
因为回归直线过样本中心点 ,
所以 ,
解得 .
【分析】利用已知条件结合平均数公式和线性回归方程恒过中心点的性质,再结合平均数公式和代入法,进而得出a的值。
15.【答案】0,1或-1
【知识点】样本相关系数r及其数字特征
【解析】【解答】设样本点为 , ,回归直线为 ;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有 ;残差平方和 ;解释变量和预报变量之间的相关系数 满足 ,所以
【分析】利用线性回归直线和散点图中的数据,再结合残差平方和以及解释变量和预报变量之间的相关系数的关系,进而得出正确的答案。
16.【答案】1780;1691
【知识点】回归分析;样本相关系数r及其数字特征
【解析】【解答】由题中条件可知,残差平方和占总偏差平方和的比例为 ,所以总偏差平方和为 ,回归平方和为 或 .
【分析】利用已知条件结合残差平方和求解方法、总偏差平方和求解方法、回归平方和求解方法,进而写出正确的答案。
17.【答案】3
【知识点】线性回归方程
【解析】【解答】解: = =4.5, = = .
∴ = ,解得m=3.
故答案为:3.
【分析】求出 代入回归方程解出m.
18.【答案】
【知识点】线性回归方程
【解析】【解答】解:由题意可设回归方程为,
代入 样本点中心,得,
故回归方程为:
故答案为:
【分析】根据回归方程的性质,计算即可得答案.
19.【答案】(1)相关关系
(2)
(3)正相关;负相关;越强;几乎不存在线性相关关系;0.75
【知识点】变量相关关系;回归分析
【解析】【解答】
解:(1)由回归分析的概念易知: 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
故答案为:相关关系.
(2)由样本点的中心的概念易知: 对于一组具有线性相关关系的数据,,,,我们知道,,则将称为样本点的中心.
故答案为:.
(3)由相关系数的概念易知:
当时,表明两个变量正相关;
当时,表明两个变量负相关;
的绝对值越接近于1,表明两个变量的线性相关性越强;
的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系;
通常大于或等于0.75时,认为两个变量有很强的线性相关性.
故答案为:
第1空、正相关
第2空、负相关
第3空、越强
第4空、几乎不存在线性相关关系
第5空、0.75
【分析】由回归分析、 样本点的中心、相关系数的概念与性质逐个写出答案.
20.【答案】解令 ,由题目所给数据可得下表所求的数据:
计算得 , ,
所以线性回归方程为 .
将 代入,
得所求回归曲线方程为 .
所以当 时, .
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】利用已知条件结合最小二乘法得出线性回归方程,再结合代入法和线性回归方程预测出当时的值。
21.【答案】(1)解由表中数据得
,
,
所以 ,
.
所以回归直线如图所示.
(2)解将 代入回归直线方程,得 ,故预测加工10个零件需要8.05小时.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合最小二乘法得出线性回归方程,再结合描点法画出线性回归直线。
(2)利用已知条件结合线性回归方程和代入法,进而预测加工10个零件需要的时间。
22.【答案】(1)解由折线图中数据和附注中参考数据得
, , ,
,
.
因为 与 的相关系数近似为0.99,说明 与 的线性相关程度相当高,从而可以用线性回归模型拟合 与 的关系.
(2)解由 及(1)得 .
.
所以 关于 的回归方程为 .
将2016年对应的 代入回归方程得 .
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
【知识点】线性回归方程;回归分析的初步应用;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合折线图中的数据,再结合相关系数与变量线性相关程度的高低关系,进而得出 与 的相关系数近似为0.99,说明 与 的线性相关程度相当高,从而可以用线性回归模型拟合 与 的关系 。
(2)利用已知条件结合最小二乘法得出线性回归方程,再结合代入法预测出2016年我国生活垃圾无害化处理量。
23.【答案】(1)解由相关系数公式可得
因为 ,
所以用 模型建立 与 的回归方程更合适.
(2)解(ⅰ)由题意可得 ,
,
因此, 与 的回归方程为 .
(ⅱ)由题意知 ,
由基本不等式可得 ,
所以 ,当且仅当 时等号成立,
所以当温度为 时,这种植物的利润 的预报值最大.
【知识点】基本不等式在最值问题中的应用;线性回归方程;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合相关系数的求解方法,再利用 ,所以用 模型建立 与 的回归方程更合适。
(2) (ⅰ)根据(1)的结果及表中数据结合最小二乘法得出关于的回归方程;
(ⅱ)利用这种植物的利润(单位:千元)与,的关系为,再利用(i)中y关于x的回归直线方程得出 ,再利用均值不等式求最值的方法得出当温度为 时,这种植物的利润 的预报值最大。
24.【答案】解作出散点图(图略).由图可知,月人均生活费支出和月人均收入具有线性相关关系.
通过计算可知 , , , , , , ,
所以线性回归方程为
列出残差表为
作残差图,如图.由图可知,残差点比较均匀地分布在水平的带状区域中,说明选用的模型比较合适.
由以上分析可知,我们可以用回归方程 来预测月生活费的支出.
将 代入,得 元;
将 代入,得 元·
故预测月人均收入为1100元和月人均收入1200元的两个家庭的月人均生活费支出分别为784.64元和850.63元.
【知识点】散点图;线性回归方程;回归分析的初步应用
【解析】【分析】利用已知条件画出散点图,再结合散点图中的数据结合最小二乘法得出线性回归方程,再结合残差求解方法和线性回归方程以及代入法得出预测出月人均收入为1100元和月人均收入1200元的两个家庭的月人均生活费支出。
25.【答案】(1)解由所给数据计算得 ,
,
,
=
.
.
所求线性回归方程为
(2)解由1知当 时, .
故当价格 时,日需求量 的预测值为 .
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出线性回归方程。
(2) 利用已知条件结合线性回归方程和代入法,进而得出当价格时的日需求量的预测值。
26.【答案】(1)解
(2)解小李提供的模型更合适,预测年宣传费为4万元的年利润为5.37万元.
【知识点】线性回归方程;回归分析的初步应用;样本相关系数r及其数字特征
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出y关于x的线性回归方程。
(2)利用已知条件结合相关指数求解方法和线性回归方程以及代入法,进而得出小李提供的模型更合适,并且预测出年宣传费为4万元的年利润。
1 / 1