3.1回归分析的基本思想及其初步应用 同步练习(含详解)

文档属性

名称 3.1回归分析的基本思想及其初步应用 同步练习(含详解)
格式 zip
文件大小 1.7MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2020-12-11 16:45:26

图片预览

文档简介

中小学教育资源及组卷应用平台
人教新课标A版
选修2-3
3.1回归分析的基本思想及其初步应用
一、单选题
1.已知呈线性相关的变量x与y的部分数据如表所示:
x
2
4
5
6
8
y
3
4.5
m
7.5
9
若其回归直线方程是
,则m=(???

A.?5.5??????????????????????????????????????????B.?6??????????????????????????????????????????C.?6.5??????????????????????????????????????????D.?7
2.两个线性相关变量

的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是
,则相对应于点
的残差为(???

A.?0.1????????????????????????????????????????B.?0.4????????????????????????????????????????C.?0.3????????????????????????????????????????D.?0.2
3.观察下列各图形,
其中两个变量
具有相关关系的图是(???

A.?①②??????????????????????????????????????B.?①④??????????????????????????????????????C.?③④??????????????????????????????????????D.?③
4.已知一组样本数据点
,用最小二乘法求得其线性回归方程为
.若
的平均数为1,则
(???

A.?10?????????????????????????????????????????B.?11?????????????????????????????????????????C.?12?????????????????????????????????????????D.?13
5.某种产品的广告费支出与销售额之间有如下对应数据:
广告费用
(万元)
0.2
0.4
0.5
0.6
0.8
销售额
(万元)
3
4
6
5
7
销售额
(万元)与广告费用
(万元)之间有线性相关关系,回归方程为
(
为常数),现在要使销售额达到7.8万元,估计广告费用约为(???
)万元.
A.?0.75???????????????????????????????????????B.?0.9???????????????????????????????????????C.?1.5???????????????????????????????????????D.?2.5
6.为了估计加工零件所花费的时间,为此进行了4次试验,测得的数据如下表:
零件数
(个)
1
3
5
7
加工时间
(分钟)
0.5
a
2
2.5
若零件数x与加工时间y具有线性相关关系,且线性回归方程为
,则a=(???

A.?1????????????????????????????????????????B.?0.8????????????????????????????????????????C.?1.09????????????????????????????????????????D.?1.5
7.调查某市出租车使用年限
和该年支出维修费用
(万元),得到数据如下:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
则线性回归方程是(???

A.??????????
B.??????????
C.??????????
D.?
8.已知关于某设各的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下统计资料,
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
由上表可得线性回归方程
,若规定当维修费用y>12时该设各必须报废,据此模型预报该设各使用年限的最大值为(?

A.?7???????????????????????????????????????????B.?8???????????????????????????????????????????C.?9???????????????????????????????????????????D.?10
9.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
70
根据表提供的数据,求得y关于x的线性回归方程为
,由于表中有一个数据模糊看不清,请你推断出该数据的值为(???

?45?????????????????????????????????????????B.?55?????????????????????????????????????????C.?50?????????????????????????????????????????D.?60
10.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据
得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(???

A.???????????????????????B.???????????????????????C.???????????????????????D.?
11.某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况,
河流水位表(1)


第1日
第2日
第3日
第4日
第5日
第6日
第7日
水位
(米)
3.5
3.7
3.8
3.9
4.3
4.4
4.8
而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备,
水位预警分级表(2)
水位
水位分类
设防水位
警戒水位
保证水位
预警颜色
黄色
橙色
红色
现已根据上表得到水位
的回归直线方程为
,据上表估计(???

A.?第8日将要启动洪水橙色预警??????????????????????????????B.?第10日将要启动洪水红色预警
C.?第11日将要启动洪水红色预警????????????????????????????D.?第12日将要启动洪水红色预警
12.下列说法错误的是(???

A.?回归直线始终过样本点(
x1

y1
),(
x2

y2
),…,(
xn

yn

的中心(

B.?若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0
C.?在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.?在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
二、多选题
13.为了对变量

的线性相关性进行检验,由样本点



求得两个变量的样本相关系数为
,那么下面说法中错误的有(???

A.?若所有样本点都在直线
上,则
B.?若所有样本点都在直线
上,则
C.?若
越大,则变量

的线性相关性越强
D.?若
越小,则变量

的线性相关性越强
14.在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价
元和销售量
件之间的一组数据如表所示:
价格
9
9.5
10
10.5
11
销售量
11
10
8
6
5
根据公式计算得相关系数
,其线性回归直线方程是:
,
则下列说法正确的有(???
)
参考:
?有
的把握认为变量
具有线性相关关系???
?回归直线恒过定点
C.??
D.?当
时,
的估计值为12.8
三、填空题
15.下表是降耗技术改造后,生产甲产品过程中记录的产量
(吨)与相应的生产能耗
(吨标准煤)的几组对应数据,根据表中提供的数据,得到
关于
的线性回归方程为
,那么表中
的值为________.
3
4
5
6
2.5
4
4.5
16.为了了解家庭月收入
(单位:千元)与月储蓄
(单位:千元)的关系,从某居民区随机抽取10个家庭,根据测量数据的散点图可以看出

之间具有线性相关关系,其回归直线方程为
,若该居民区某家庭月收入为7千元,据此估计该家庭的月储蓄为________千元.
17.已知

之间的一组数据:
x
2
4
6
8
y
1
3
5
7


的线性回归方程为
必过点________.
18.以下几个命题中:
①线性回归直线方程
恒过样本中心

②用相关指数
可以刻画回归的效果,值越小说明模型的拟合效果越好;
③随机误差是引起预报值
和真实值
之间存在误差的原因之一,其大小取决于随机误差的方差;
④在含有一个解释变量的线性模型中,相关指数
等于相关系数
的平方.
其中真命题为
________
四、解答题
19.某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得
.
x
1
2
3
4
5
y
4
m
10
23
22
参考公式:

(1)若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程

(2)预测该星期最后一天参加该活动的人数(按四舍五入取到整数).
20.这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期
和全国累计报告确诊病例数量
(单位:万人)之间的关系如下表:
日期
1
2
3
4
5
6
7
确诊病例数量
(万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
参考数据如下表:
1.92
16.9
77.5
35.17
表中


.
参考公式:对于一组数据

,…,
其回归方程
中斜率和截距的最小二乘估计公式分别为:①
,②
.
(1)根据表中的数据,

哪一个适宜作为确诊病例数量
关于日期
的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立
关于
的回归方程;(精确到0.01)
(3)预测2月16日全国累计报告确诊病例数.
21.为了解某地区某种农产品的年产量
(单位:吨)对价格
(单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:
x
2
3
4
5
6
y
8
6
5
4
2
已知x和
具有线性相关关系.
附:回归直线的斜率和截距的最小二乘法估计公式分别为

.
(1)求


(2)求y关于x的线性回归方程

(3)若年产量为3.5吨,试预测该农产品的价格.
22.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
参考公式用最小二乘法求线性回归方程系数公式:

.
(1)画出散点图;
(2)求y关于x的线性回归方程.
(3)如果广告费支出为一千万元,预测销售额大约为多少百万元?
23.《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.
参考公式:

(1)若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;
(2)该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间
(单位:小时)与年龄
(单位:岁),并制作了对照表(如下表所示):
年龄
20
30
40
50
每周学习诗词的平均时间
3
3.5
3.5
4
由表中数据分析,

呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.
24.一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间
(分钟)和答对人数
的统计表格如下:
时间
(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
时间
与答对人数
的散点图如图:
附:




,对于一组数据

,……,
,其回归直线
的斜率和截距的最小二乘估计分别为:

.请根据表格数据回答下列问题:
(1)根据散点图判断,

,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住
的内容,至多间隔多少分钟重新记忆一遍.(参考数据:


答案解析部分
一、单选题
1.答案:
C
解:由题意可得



,解得
.
故答案为:C.
【分析】先求出

,再根据回归方程过样本中心,可求出参数
的值.
2.答案:
D
解:


则样本中心点为

因为回归直线方程为
,所以有
,解之得

所以
,当
时,

则相对应于点
的残差为
.
故答案为:D.
【分析】由已知求得样本中心点的坐标,代入回归方程中求得
的值,进而求出回归方程,取
,求得
,再由残差公式求得结果即可.
3.答案:
C
解:由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;
图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;
而图①②中这些点分布不均匀,比较分散,不具有相关关系.
故答案为:C.
【分析】根据图形中点的分布,即可判断
是否具有相关关系.
4.答案:
C
解:


由回归直线
过样本中心点,
所以

解得
.
故答案为:C
【分析】利用回归直线过样本中心点
即可求解.
5.答案:
B
解:


样本点的中心为

代入
,得
,即

线性回归方程为


,得
,则

故答案为:
B.
【分析】由已知求得样本点的中心的坐标,代入线性回归方程求得
,得到线性回归方程,取
求得
值即可.
6.答案:
B
解:依题意



代入
,得
,解得
.
故答案为:B
【分析】将样本中心点代入回归直线方程,解方程求得
的值.
7.答案:
B
解:设回归直线方程为

由表格中的数据可得


由最小二乘法公式可得


因此,回归直线方程为
.
故答案为:B.
【分析】设回归直线方程为
,求得

的值,将表格中的数据代入最小二乘法公式,求出

的值,进而可求得回归直线方程.
8.答案:
C
解:由已知表格得:


由于线性回归直线恒过样本中心点
,所以有:
,解得:

所以线性回归方程


得:
解得:

由于

所以据此模型预报该设备使用年限的最大值为9.
故答案为:C.
【分析】利用已知的数据表求出x和y的平均数,从而求出样本中心点的坐标,再利用线性回归直线恒过样本中心点
,求出的值,从而求出线性回归方程,再利用已知条件当维修费用y>12时该设各必须报废,从而用线性回归方程,从而结合x的实际意义预报出该设备使用年限的最大值.
9.答案:
C
解:由表中数据得:

因为样本中心点
在回归直线上,
所以

所以

故答案为:C
【分析】根据样本中心点在回归直线上可得答案.
10.答案:
D
解:由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率
和温度
的回归方程类型的是
.
故答案为:D.
【分析】根据散点图的分布可选择合适的函数模型.
11.答案:
D
解:因为水位
的回归直线方程为

A.第8日的水位是
,将启动黄色预警,A不符合题意;
B.第10日的水位是
,将启动橙色预警,B不符合题意;
C.第11日的水位是
,将启动橙色预警,C不符合题意;
D.第12日的水位是
,将启动红色预警,D符合题意;
故答案为:D.
【分析】根据回归方程,逐项计算预测值,再由河流水位表,即可判定出结果.
12.答案:
B
解:回归直线一定经过样本点的中心
,故
对;
若两个具有线性相关关系的变量的相关性越强,则线性相关系数
的值越接近于1或

错;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故
对;
在线性回归模型中,相关指数
越接近于1,说明回归的效果越好,故
对,
故答案为:B.
【分析】根据回归直线方程及回归分析的相关知识判断即可;
二、多选题
13.答案:
A,B,D
解:若所有样本点都在直线
上,且直线斜率为负数,则
,A、B选项均错误;

越大,则变量

的线性相关性越强,C选项正确,D选项错误.
故答案为:ABD.
【分析】根据相关系数与变量

的线性相关性之间的关系可判断出各选项的正误.
14.答案:
A,B,C,D
解:对A,因为
,
故有99%的把握认为变量
具有线性相关关系,A符合题意;
对B,价格平均
,销售量

故回归直线恒过定点
.B符合题意;
对C,因为回归直线恒过定点
,故
.C符合题意;
对D,当
时,
.D符合题意;综上,ABCD均正确.
故答案为:ABCD
【分析】对A,根据
判断即可;对BC,根据回归直线方程经过样本中心点求解即可.对D;
求出
,再代入
求解即可.
三、填空题
15.答案:
3
解:


又回归直线必过样本点的中心

所以
,所以

故答案为:3.
【分析】根据表格中所给的数据,求出这组数据的横标和纵标的平均值,表示出这组数据的样本中心点,根据样本中心点在线性回归直线上,代入得到关于m的方程,解方程即可.
16.答案:
1.7
解:由于
,代入
,于是得到

故答案为1.7.
【分析】直接代入
即得答案.
17.答案:
(5,4)
解:由题得

所以样本中心点为

所以线性回归方程
必过点(5,4),
故答案为
.
【分析】求出样本中心点即得解.
18.答案:
①③④
解:①线性回归直线方程
恒过样本中心
,所以正确.;
②用相关指数
可以刻画回归的效果,值越大说明模型的拟合效果越好,所以错误;
③随机误差是引起预报值
和真实值
之间存在误差的原因之一,
其大小取决于随机误差的方差,所以正确;
④在含有一个解释变量的线性模型中,相关指数
等于相关系数
的平方,所以正确.
故答案为:①③④.
【分析】由线性回归直线恒过样本中心可判断①,由相关指数的值的大小与拟合效果的关系可判断②,由随机误差和方差的关系可判断③,由相关指数和相关系数的关系可判断④.
四、解答题
19.答案:
(1)解:根据表中的数据,可得
,解得




又由
,故所求回归直线方程为

(2)解:将
代入
中,求得

故预测最后一天参加该活动的人数34.
【分析】(1)由
计算出参数
的值,再计算出


,根据公式计算可得;
(2)将
代入(1)的方程计算可得.
20.答案:
(1)解:根据表中的数据:
适宜作为确诊病例数量
关于日期
的回归方程类型;
(2)解:由已知数据得:





所以,
关于
的回归方程为:

(3)解:把
代入回归方程得:

所以预测2月16日全国累计报告确诊病例数为6.6万人.
【分析】(1)直接由表格中的数据可知
适宜作为确诊病例数量
关于日期
的回归方程类型;(2)由表格中的数据求得

的值,则
关于
的线性回归方程可求;(3)在(2)中求得的线性回归方程中,取
求得
值即可.
答案:
(1)解:


(2)解:因为

所以

所以线性回归方程为:

(3)解:当
时,

故农产品的价格为
千元
吨.
【分析】(1)根据表中数据计算出

;(2)利用公式计算出
的值,则线性回归方程可求;(3)利用(2)中的线性回归方程预测农产品价格.
22.答案:
(1)解:根据表格中的数据,得到点

画在坐标系中,得到散点图:
(2)解:由表格中的数据,可得





于是所求的线性回归方程是

(3)解:当
时,
(百万元),
即广告费支出为一千万元,预测销售额大约为
百万元.
【分析】(1)根据表中所给的五组数据,得到五个点的坐标,在平面直角坐标系中画出散点图.(2)先求出
的平均数,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.(3)将
代入回归直线方程求出y的值,即可得到广告费支出一千万元时的销售额的估计值.
23.答案:
(1)解:设污损的数字为
,由北方观众平均人数超过南方观众平均人数得

,即


(2)解:









时,
.
答:年龄为60岁的观众每周学习诗词的平均时间大约为4.25小时.
【分析】(1)由题,列出不等式,解得x的取值范围,即可得到本题答案;
(2)由

,求得线性回归方程,然后令
,即可得到本题答案.
24.答案:
(1)解:由图象可知,
更适宜作为线性回归类型;
(2)解:设
,根据最小二乘法得


所以

因此

(3)解:由题意知



解得,即至多19.05分钟,就需要重新复习一遍.
【分析】(1)根据图象可得答案;(2)先求得
的线性回归方程,再将对数式化为指数式可得y与t的回归方程;(3)解不等式
可得答案.
21世纪教育网
www.21cnjy.com
精品试卷·第
2

(共
2
页)
HYPERLINK
"http://21世纪教育网(www.21cnjy.com)
"
21世纪教育网(www.21cnjy.com)