9.1线性回归分析 苏教版(2019)高中数学选择性必修第二册(含答案解析)

文档属性

名称 9.1线性回归分析 苏教版(2019)高中数学选择性必修第二册(含答案解析)
格式 docx
文件大小 1.2MB
资源类型 试卷
版本资源 苏教版(2019)
科目 数学
更新时间 2022-10-25 16:13:41

图片预览

文档简介

中小学教育资源及组卷应用平台
9.1线性回归分析苏教版( 2019)高中数学选择性必修第二册
第I卷(选择题)
一、单选题(本大题共8小题,共40.0分。在每小题列出的选项中,选出符合题目的一项)
下列有关一元线性回归分析的命题正确的是( )
A. 在经验回归方程中,若解释变量增加个单位,则预测值平均减少个单位
B. 经验回归直线是经过散点图中样本数据点最多的那条直线
C. 若两个变量的线性相关程度越强,则样本相关系数就越接近于
D. 若甲、乙两个模型的决定系数分别为和,则模型乙的拟合效果更好
相关变量的散点图如图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩下数据得到线性回归直线方程:,相关系数为则( )
A. B.
C. D.
如图,给出了样本容量均为的、两组样本数据的散点图,已知组样本数据的相关系数为,组数据的相关系数为,则( )
A. B. C. D. 无法判定
样本数据的所有点在散点图中都在直线上,其相关系数为,样本数据的所有点在散点图中都在直线上,其相关系数为,则与的关系是( )
A. B. C. D.
年月日,因疫情原因,市物价部门对家商场的某商品一天的线上销售量及其价格进行调查,家商场的售价元和销售量件之间的一组数据如表所示:
价格
销售
与的回归直线方程是:,相关系数,下列说法错误的是( )
A. B. 变量,线性负相关且相关性较强
C. 相应于点的残差约为 D. 当时,的估计值为
某网店经销某商品,为了解该商品的月销量单位:千件与售价单位:元件之间的关系,收集组数据进行了初步处理,得到如下数表:
根据表中的数据可得回归直线方程,以下说法正确的是( )
A. ,具有负相关关系,相关系数
B. 每增加一个单位,平均减少个单位
C. 第二个样本点对应的残差
D. 第三个样本点对应的残差
已知下列命题:回归直线恒过样本点的中心,且至少过一个样本点;
两个变量相关性越强,则相关系数就越接近于;
将一组数据的每个数据都加一个相同的常数后,方差不变;
在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少;
在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;
对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.
两个模型中残差平方和越小的模型拟合的效果越好
则正确命题的个数是( )
A. B. C. D.
已知变量关于的非线性经验回归方程为,其一组数据如下表所示:
若,则预测的值可能为( )
A. B. C. D.
二、多选题(本大题共4小题,共20.0分。在每小题有多项符合题目要求)
下列结论正确的有( )
A. 若随机变量,满足,则
B. 在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
C. 若样本数据线性相关,则用最小二乘估计得到的经验回归直线经过该组数据的中心点
D. 样本相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱
某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从年到年共年“年货节”期间的销售额单位:亿元并作出散点图,将销售额看成年份序号年作为第年的函数运用软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的为( )
注:其中,越接近于,表示回归的效果越好.
A. 销售额与年份序号呈正相关关系
B. 销售额与年份序号线性相关不显著
C. 三次函数回归曲线的拟合效果好于回归直线的拟合效果
D. 根据三次函数回归曲线可以预测年“年货节”期间的销售额约为亿元
下列说法中正确的是( )
A. 对于独立性检验,的值越大,说明两事件的相关程度越大
B. 以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和
C. 在具有线性相关关系的两个变量的统计数据所得的回归直线方程中,,则
D. 通过回归直线及回归系数,可以精确反映变量的取值和变化趋势
为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型拟合比较合适令,得到,经计算发现满足下表:
天数天
则( )
A. B. C. D.
第II卷(非选择题)
三、填空题(本大题共4小题,共20.0分)
已知复数,则在复平面上对应的点坐标为______.
已知随机变量,若,则________,_____.
已知下列命题:
在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;
两个变量相关性越强,则相关系数的绝对值就越接近于;
在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少个单位;
对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.
其中正确命题的序号是__________.
如图为我国数学家赵爽约世纪初在为周髀算经作注时验证勾股定理的示意图,现在提供种颜色给其中个小区域涂色,规定每个区域只涂一种颜色,相邻区域颜色不相同,则不同的涂色方案种数为_______.
下列说法:
线性回归方程必过;
命题“”的否定是“”
相关系数越小,表明两个变量相关性越弱;
在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________把你认为正确的结论都写在横线上
本题可参考独立性检验临界值表:
用指数模型去拟合一组数据时,为了求出回归方程,设,变换后得到线性回归直线方程,则常数的值为_________.
在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得回归直线方程,则该模型的回归方程为
四、解答题(本大题共6小题,共72.0分。解答应写出文字说明,证明过程或演算步骤)
本小题分
某公司为一所山区小学安装了价值万元的一台饮用水净化设备,每年都要为这台设备支出保养维修费用,我们称之为设备年度保养维修费下表是该公司第年为这台设备支出的年度保养维修费单位:千元的部分数据:
画出散点图如下:
通过计算得与的相关系数由散点图和相关系数的值可知,与的线性相关程度很高.
建立关于的线性回归方程;
若设备年度保养维修费不超过万元就称该设备当年状态正常,根据得到的线性回归方程,估计这台设备有多少年状态正常?
附:,.
本小题分
个工业企业某年的平均固定资产价值与总产值单位:百万元如表所示.
企业编号 年平均固定资产价值 年总产值 企业编号 年平均固定资产价值 年总产值
设年平均固定资产价值为,年总产值为,单位均为百万元试画出散点图,计算相关系数.
本小题分
科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:
年龄岁
脂肪含量
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图:

计算样本相关系数精确到,并刻画它们的相关程度.
参考数据,,,,,
参考公式:相关系数
本小题分
一个工厂在某年连续个月每月产品的总成本万元与该月产量万件之间有如下一组数据:
通过画散点图,发现可用线性回归模型拟合与的关系,请用相关系数加以说明;
建立月总成本与月产量之间的回归方程;
通过建立的关于的回归方程,估计某月产量为万件时,此时产品的总成本为多少万元?均精确到
附注:参考数据:,,
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:.
本小题分
家族中兄弟或姐妹的智商是否有相关性一直是教育工作者、社会学家、生理学家关注的一个问题,日本学者在年曾对对兄弟的智商进行测试,得出下表的结果,其中,表示“哥哥的智商分数”,表示“弟弟的智商分数”.
请画出散点图,并求与间的样本相关系数
建立关于的线性回归方程,并预测当为时的值.
本小题分
某企业为了提升行业竞争力,加大了科技研发资金投入.该企业连续年来的科技投入百万元与收益百万元的数据统计如下:
科技投入
收益
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线的周围,据此他对数据进行了一些初步处理.如下表:
其中,.
请根据表中数据,建立关于的回归方程保留一位小数;
根据所建立的回归方程,若该企业想在下一年收益达到亿元,则科技投入的费用至少要多少?其中
乙认为样本点分布在二次曲线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据,,,,其回归直线方程的斜率和截距的最小二乘估计分别为,,相关指数:.
答案和解析
1.【答案】
【解析】
【分析】
本题考查统计初步知识的应用问题,主要是线性回归直线的特征和决定系数、相关指数和模型拟合的效果,属于中档题.
根据“线性回归方程 即可判断;根据回归直线的几何意义判断;由相关系数与变量的相关性的关系,可判断;由模型的 与效果的关系,可判断.
【解答】
解:对于,回归直线方程 中,当解释变量 增加个单位时,预报变量 平均减少个单位,正确;
对于,回归直线就是散点图中经过样本数据点最多的那条直线,不正确,回归直线也可能不过任何一个点;
对于,如果两个变量的相关性越强,则相关系数就越接近于,不正确,应为相关系数的绝对值就越接近于;
对于,甲、乙两个模型的 分别约为和,则模型乙的拟合效果更好,不正确,应为模型甲的拟合效果更好.
故选A.

2.【答案】
【解析】
【分析】
本题考查了利用散点图判断两个变量的相关关系,线性回归直线方程,相关系数,是基础题.
由散点图可知,线性负相关,故,,点较偏离整体,剔除后,相关性更强,由此得出结论.
【解答】
解:由图可知变量,负相关,
所以,,
剔除点后,剩下的点的数据更具有线性相关性,更接近,
所以.
故选D.
3.【答案】
【解析】
【分析】
本题考查了散点图与相关系数的应用问题,是基础题.
根据、两组样本数据的散点图分布特征,即可得出、的大小关系.
【解答】
解:根据、两组样本数据的散点图知,
组样本数据几乎在一条直线上,且成正相关,
相关系数为应最接近,
组数据分散在一条直线附近,也成正相关,
相关系数为满足,即.
故选:.

4.【答案】
【解析】
【分析】
本题考查散点图及相关系数的概念、性质,是基础题.
根据相关系数的概念进行判断.
【解答】
解:因为样本数据的所有点在散点图中都在直线上,所以,
样本数据的所有点在散点图中都在直线上,所以,
则,
故选B.

5.【答案】
【解析】
【分析】
本题主要考查线性回归方程的性质,以及残差公式,属于中档题.
根据相关系数判断选项;利用样本中心点判断选项;将代入回归直线方程,由此判断选项;求得时的估计值,进而求得对应的残差,从而判断选项.
【解答】
解:对,价格平均,销售量.
故回归直线恒过定点,故,故A正确.
对,由表可知随增大而减少,可认为变量,线性负相关,且由相关系数可知相关性强,故B正确.
对,相应于点的残差,故C不正确.
对,当时,,故D正确.
故选C.

6.【答案】
【解析】
【分析】
本题考查回归直线方程,是基础题.
的系数为,与具有负相关关系;相关系数的范围属于;由相关关系的特点可知,把,代入回归方程所得的值,不是准确值,而是一个估计值,综合可得答案.
【解答】
解:由,的系数为,与具有负相关关系,相关系数,故A错误;
每增加一个单位,平均减少个单位,故B错误;
当时,,第二个样本点对应的残差,故C错误;
当时,,第三个样本点对应的残差,故D正确;
故选D.
7.【答案】
【解析】
【分析】
本题考查命题的真假判断,主要是线性回归直线的特点,线性相关性的强弱和模型的拟合度,考查判断能力,属于基础题.
逐一判断即可.
【解答】
解:对于,回归直线恒过样本点的中心,可以不过任一个样本点,故错误;
对于,两个变量相关性越强,则相关系数的绝对值就越接近于,故错误;
对于,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故正确;
对于,在回归直线方程中,当解释变量每增加一个单位时,
预报变量平均减少个单位,故正确;
对于,在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好,故正确;
对于,对分类变量与,它们的随机变量的观测值来说,越大,“与有关系”的把握程度越大,故错误;
对于,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故正确.其中正确个数为.
故选B.
8.【答案】
【解析】
【分析】
本题考查可线性化的回归方程,考查推理能力和计算能力,属于一般题.
将两边同时取对数,得,设,由样本中心必在回归直线上,可求出,从而即可求解.
【解答】
解:由题意,将两边同时取对数,得,
设,则
,,
由,得,解得,
所以,
所以当时,,
故选:.

9.【答案】
【解析】
【分析】
本题考查随机变量的方差的性质,残差、散点图与模型的拟合效果,最小二乘法,相关系数,属于中档题.
依据方差的性质判定;根据残差的定义,残差分布的水平带状区域的宽度越窄,预测值与实际值越接近,其模型的拟合效果越好,判定;回归直线经过该组数据的中心点,判定;线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱,判定.
【解答】
解:对于,依据方差的性质判定,若随机变量,满足,,故A错误;
对于,根据残差的定义可知,在残差的散点图中,残差分布的水平带状区域的宽度越窄,预测值与实际值越接近,其模型的拟合效果越好,故B正确
对于,用最小二乘估计得到的经验回归直线经过该组数据的中心点,故C正确;
对于,统计中用相关系数来衡量两个变量之间的线性关系的强弱线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱,故D错误.

10.【答案】
【解析】
【分析】
本题考查了散点图、相关系数及线性回归方程的应用,属于中档题.
根据散点图可得销售额与年份序号呈正相关关系,再根据决定系数的定义判断、,根据三次函数回归曲线,代入,即可预测年“年货节”期间的销售额,从而判断;
【解答】
解:由题图可知,散点从左下到右上分布,所以销售额与年份序号呈正相关关系,A正确;
接近于,销售额与年份序号线性相关显著,故B错误;
,三次函数回归曲线的拟合效果好于回归直线的拟合效果,C正确;
由三次函数知,当时,,故D错误.
故选AC.

11.【答案】
【解析】
【分析】
本题考查了回归分析、独立性检验就等知识,解题时抓住相关概念即可,为中档题.
根据,回归分析,以及独立性检验等知识,对选项进行逐一分析即可.
【解析】
解:对于,根据独立性检验的性质知,的值越大,说明两个分类变量相关程度越大,A正确;
对于,由,两边取自然对数,可得,
令,得,,
,则,B正确;
对于,回归直线方程中,
,C正确;
对于,通过回归直线及回归系数,可估计和预测变量的取值和变化趋势,D错误.
故选ABC.

12.【答案】
【解析】
【分析】
本题考查非线性回归分析,线性回归方程,考查散点图,考查学生分析解决问题的能力,属于中档题.
根据题意得到的中心点为,进而得到,即可.
【解答】
解:因为,

所以的中心点为,
代入,可得.
由,,
则,
所以,,即.
故选AB.

13.【答案】

【解析】
【分析】
本题考查复数运算以及几何意义,属于基础题先将化简计算,再写出它复平面上对应的点坐标即可.
【解答】
解:复数,则,则,所以在复平面上对应的点坐标为.
故答案为.
【分析】
本题考查二项分布的均值与方差的求解,难度一般.
【解答】
解:因为随机变量,若,则,则,因为,所以.
故答案为.
【分析】
本题考查线性回归分析以及独立性检验的应用,难度一般根据相关知识逐项分析判断即可.
【解答】
解:由线性回归分析知:在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好,正确;
两个变量相关性越强,则相关系数的绝对值就越接近于,正确;
在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少个单位,正确;
对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大,错误,越小,“与有关系”的把握程度越小.
故答案为.
【分析】
本题考查排列组合的应用,难度一般分类讨论:当号区间共用种颜色;
当共用种颜色时,分别求出其方法种数,相加即可求解.
【解答】
解:将区域标注数字序号如下图:
当号区间共用种颜色,即同色且与异色时
共有涂色方法:种
当共用种颜色时,共有涂色方法:种
则不同的涂色方案总数为:种
故答案为.
14.【答案】
【解析】
【分析】
本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.
根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.
【解答】
解:线性回归方程必过样本中心点,故正确.
命题“”的否定是“”故错误
相关系数绝对值越小,表明两个变量相关性越弱,故不正确;
在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,故正确.
故答案为.

15.【答案】
【解析】
【分析】
本题考查了线性回归方程,对数的运算性质,是中档题.
由两边取对数,可得,则,结合题意可得,求出的值.
【解答】
解:由两边取对数,可得,
由,可得.
,,.
故答案为.
16.【答案】
【解析】
【分析】
本题考查了非线性回归分析,线性回归方程的应用问题,熟练掌握对数的运算性质,是解题的关键.
根据对数的运算性质,结合题意,求出、的值即可.
【解答】
解:,
两边取对数,可得,
令,可得,

,,

故答案为.

17.【答案】解:,


线性回归方程为.
设这台设备有年状态正常,由已知得,即.
解得.
估计该设备有年状态正常.

【解析】本题考查散点图以及线性回归方程,属中档题,
根据表格信息求得,,即可得到,,即可求解,
设这台设备有年状态正常,由线性回归方程为,所以,求解即可,
18.【答案】解:散点图如图所示.

由表中数据可得
,,,
,.
根据
可得相关系数为.

【解析】本题考查散点图,计算相关系数的求解,属于中档题.
作出散点图,并根据公式求出相关系数即可.
19.【答案】解:根据上表中的样本数据及其散点图得


因为,,所以.
由样本相关系数,可以推断人体脂肪含量和年龄的相关程度很强.

【解析】本题考查利用样本的相关系数判断相关性强弱,涉及平均数,属中档题.
利用所给表格数据计算平均数即可;
利用所给参考数据计算相关系数,进而判断即可.
20.【答案】解:画出散点图:
由已知条件得,
所以,
这说明与正相关,且相关性很强.
由已知求得,

故所求回归方程为;
当时,万元,
估计某月产量为万件时产品的总成本约为万元.
【解析】本题考查了回归直线方程,相关系数,属于中档题.
先画出散点图,,这说明与正相关,且相关性很强;
由已知求得,,得出回归方程;
把代入回归方程即可得出结果.
21.【答案】解:散点图如图所示,

故与间的线性相关系数为.
由最小二乘法可得,
所以关于的线性回归方程是,
当时,.
【解析】根据表格中的数据作出散点图即可,利用相关系数的计算公式求解即可;
用最小二乘法可算得,然后得到线性回归方程,把代入回归方程计算即可得解.
本题考查线性相关系数、线性回归方程,计算量越大,考查学生的作图能力和运算能力,属于中档题.
22.【答案】解:依题意:,

再令,则.
根据最小二乘估计可知:,
得,
所以回归方程为,即.
设,解得,即.
所以科技投入的费用至少要百万元,下一年的收益才能达到亿.
甲建立的回归模型的残差为:
则,
从而.
所以甲建立的回归模型拟合效果更好.
【解析】本题考查回归分析及其应用,属于中档题.
求出,令,再令,先求出和的回归直线方程,即可求得关于的回归方程;
解即可;
列出残差表,求出,即可判断甲建立的回归模型拟合效果更好.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)