人教新课标A版 选修2-3 3.1回归分析的基本思想及其初步应用
一、单选题
1.(2020高二上·建瓯月考)已知呈线性相关的变量x与y的部分数据如表所示:
x 2 4 5 6 8
y 3 4.5 m 7.5 9
若其回归直线方程是 ,则m=( )
A.5.5 B.6 C.6.5 D.7
【答案】C
【知识点】线性回归方程
【解析】【解答】由题意可得 , ,
则 ,解得 .
故答案为:C.
【分析】先求出 , ,再根据回归方程过样本中心,可求出参数 的值.
2.(2020高二下·哈尔滨期末)两个线性相关变量 与 的统计数据如表:
x 9 9.5 10 10.5 11
y 11 10 8 6 5
其回归直线方程是 ,则相对应于点 的残差为( )
A.0.1 B.0.4 C.0.3 D.0.2
【答案】D
【知识点】线性回归方程
【解析】【解答】 , ,则样本中心点为 ,
因为回归直线方程为 ,所以有 ,解之得 ,
所以 ,当 时, ,则相对应于点 的残差为 .
故答案为:D.
【分析】由已知求得样本中心点的坐标,代入回归方程中求得 的值,进而求出回归方程,取 求得 ,再由残差公式求得结果即可.
3.(2020高二下·吉林期末)观察下列各图形,
其中两个变量 具有相关关系的图是( )
A.①② B.①④ C.③④ D.③
【答案】C
【知识点】变量相关关系
【解析】【解答】由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;而图①②中这些点分布不均匀,比较分散,不具有相关关系.
故答案为:C.
【分析】根据图形中点的分布,即可判断 是否具有相关关系.
4.(2020高二下·大荔期末)已知一组样本数据点 ,用最小二乘法求得其线性回归方程为 .若 的平均数为1,则 ( )
A.10 B.11 C.12 D.13
【答案】C
【知识点】线性回归方程
【解析】【解答】 , ,
由回归直线 过样本中心点,
所以 ,
解得 .
故答案为:C
【分析】利用回归直线过样本中心点 即可求解.
5.(2020高二下·宿迁期末)某种产品的广告费支出与销售额之间有如下对应数据:
广告费用 (万元) 0.2 0.4 0.5 0.6 0.8
销售额 (万元) 3 4 6 5 7
销售额 (万元)与广告费用 (万元)之间有线性相关关系,回归方程为 ( 为常数),现在要使销售额达到7.8万元,估计广告费用约为( )万元.
A.0.75 B.0.9 C.1.5 D.2.5
【答案】B
【知识点】线性回归方程
【解析】【解答】解: ,
,
样本点的中心为 ,
代入 ,得 ,即 .
线性回归方程为 .
取 ,得 ,则 .
故答案为: B.
【分析】由已知求得样本点的中心的坐标,代入线性回归方程求得 ,得到线性回归方程,取 求得 值即可.
6.(2020高一下·启东期末)为了估计加工零件所花费的时间,为此进行了4次试验,测得的数据如下表:
零件数 (个) 1 3 5 7
加工时间 (分钟) 0.5 a 2 2.5
若零件数x与加工时间y具有线性相关关系,且线性回归方程为 ,则a=( )
A.1 B.0.8 C.1.09 D.1.5
【答案】B
【知识点】线性回归方程
【解析】【解答】依题意 , ,
将 代入 得 ,解得 .
故答案为:B
【分析】将样本中心点代入回归直线方程,解方程求得 的值.
7.(2020高三上·长春开学考)调查某市出租车使用年限 和该年支出维修费用 (万元),得到数据如下:
使用年限 2 3 4 5 6
维修费用 2.2 3.8 5.5 6.5 7.0
则线性回归方程是( )
A. B.
C. D.
【答案】B
【知识点】线性回归方程
【解析】【解答】设回归直线方程为 ,
由表格中的数据可得 , ,
由最小二乘法公式可得 ,
,
因此,回归直线方程为 .
故答案为:B.
【分析】设回归直线方程为 ,求得 、 的值,将表格中的数据代入最小二乘法公式,求出 和 的值,进而可求得回归直线方程.
8.(2020·大连模拟)已知关于某设各的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料,
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
由上表可得线性回归方程 ,若规定当维修费用y>12时该设各必须报废,据此模型预报该设各使用年限的最大值为( )
A.7 B.8 C.9 D.10
【答案】C
【知识点】线性回归方程
【解析】【解答】由已知表格得: , ,
由于线性回归直线恒过样本中心点 ,所以有: ,解得: ,
所以线性回归方程 ,
由 得: 解得: ,
由于 ,
所以据此模型预报该设备使用年限的最大值为9。
故答案为:C.
【分析】利用已知的数据表求出x和y的平均数,从而求出样本中心点的坐标,再利用线性回归直线恒过样本中心点 ,从而求出的值,从而求出线性回归方程,再利用已知条件当维修费用y>12时该设各必须报废,从而用线性回归方程,从而结合x的实际意义预报出该设备使用年限的最大值。
9.(2020高二上·江门月考)某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 50 70
根据表提供的数据,求得y关于x的线性回归方程为 ,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.45 B.55 C.50 D.60
【答案】C
【知识点】线性回归方程
【解析】【解答】由表中数据得: ,
因为样本中心点 在回归直线上,
所以 ,
所以
故答案为:C
【分析】根据样本中心点在回归直线上可得答案.
10.(2020·新课标Ⅰ·理)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【知识点】散点图;线性回归方程
【解析】【解答】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率 和温度 的回归方程类型的是 .
故答案为:D.
【分析】根据散点图的分布可选择合适的函数模型.
11.(2020高三上·安徽月考)某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.
河流水位表(1)
第 日 第1日 第2日 第3日 第4日 第5日 第6日 第7日
水位 (米) 3.5 3.7 3.8 3.9 4.3 4.4 4.8
而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.
水位预警分级表(2)
水位
水位分类 设防水位 警戒水位 保证水位
预警颜色 黄色 橙色 红色
现已根据上表得到水位 的回归直线方程为 ,据上表估计( ).
A.第8日将要启动洪水橙色预警 B.第10日将要启动洪水红色预警
C.第11日将要启动洪水红色预警 D.第12日将要启动洪水红色预警
【答案】D
【知识点】线性回归方程
【解析】【解答】因为水位 的回归直线方程为 ,
A选项,第8日的水位是 ,将启动黄色预警,A不符合题意;
B选项,第10日的水位是 ,将启动橙色预警,B不符合题意;
C选项,第11日的水位是 ,将启动橙色预警,C不符合题意;
D选项,第12日的水位是 ,将启动红色预警,D符合题意;
故答案为:D.
【分析】根据回归方程,逐项计算预测值,再由河流水位表,即可判定出结果.
12.(2020高二下·齐齐哈尔期末)下列说法错误的是( )
A.在回归分析中,回归直线始终过样本点( x1,y1 ),( x2,y2 ),…,( xn,yn ) 的中心( )
B.若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
【答案】B
【知识点】变量相关关系;回归分析
【解析】【解答】解:回归直线一定经过样本点的中心 ,故 对;
若两个具有线性相关关系的变量的相关性越强,则线性相关系数 的值越接近于1或 , 错;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故 对;
在线性回归模型中,相关指数 越接近于1,说明回归的效果越好,故 对,
故答案为:B.
【分析】根据回归直线方程及回归分析的相关知识判断即可;
二、多选题
13.(2020高二下·盐城期末)为了对变量 与 的线性相关性进行检验,由样本点 、 、 、 求得两个变量的样本相关系数为 ,那么下面说法中错误的有( )
A.若所有样本点都在直线 上,则
B.若所有样本点都在直线 上,则
C.若 越大,则变量 与 的线性相关性越强
D.若 越小,则变量 与 的线性相关性越强
【答案】A,B,D
【知识点】线性相关
【解析】【解答】若所有样本点都在直线 上,且直线斜率为负数,则 ,A、B选项均错误;
若 越大,则变量 与 的线性相关性越强,C选项正确,D选项错误.
故答案为:ABD.
【分析】根据相关系数与变量 与 的线性相关性之间的关系可判断出各选项的正误.
14.(2020高二下·东台期中)在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价 元和销售量 件之间的一组数据如表所示:
价格 9 9.5 10 10.5 11
销售量 11 10 8 6 5
根据公式计算得相关系数 ,其线性回归直线方程是: ,则下列说法正确的有( )
参考:
A.有 的把握认为变量 具有线性相关关系
B.回归直线恒过定点
C.
D.当 时, 的估计值为12.8
【答案】A,B,C,D
【知识点】线性回归方程
【解析】【解答】对A,因为 ,故有99%的把握认为变量 具有线性相关关系,A符合题意.
对B,价格平均 ,销售量 .
故回归直线恒过定点 .B符合题意.
对C,因为回归直线恒过定点 ,故 .C符合题意.
对D,当 时, .D符合题意.
综上,ABCD均正确.
故答案为:ABCD
【分析】对A,根据 判断即可;对BC,根据回归直线方程经过样本中心点求解即可.对D; 求出 ,再代入 求解即可.
三、填空题
15.(2020高二上·娄底开学考)下表是降耗技术改造后,生产甲产品过程中记录的产量 (吨)与相应的生产能耗 (吨标准煤)的几组对应数据,根据表中提供的数据,得到 关于 的线性回归方程为 ,那么表中 的值为 .
3 4 5 6
2.5 4 4.5
【答案】3
【知识点】线性回归方程
【解析】【解答】解: , ,
又回归直线必过样本点的中心 ,
所以 ,所以 .
故答案为:3.
【分析】根据表格中所给的数据,求出这组数据的横标和纵标的平均值,表示出这组数据的样本中心点,根据样本中心点在线性回归直线上,代入得到关于m的方程,解方程即可.
16.(2020高一下·海淀期中)为了了解家庭月收入 (单位:千元)与月储蓄 (单位:千元)的关系,从某居民区随机抽取10个家庭,根据测量数据的散点图可以看出 与 之间具有线性相关关系,其回归直线方程为 ,若该居民区某家庭月收入为7千元,据此估计该家庭的月储蓄为 千元.
【答案】1.7
【知识点】回归分析的初步应用
【解析】【解答】由于 ,代入 ,于是得到 ,故答案为1.7.
【分析】直接代入 即得答案.
17.(2020高一下·六安期末)已知 与 之间的一组数据:
x 2 4 6 8
y 1 3 5 7
则 与 的线性回归方程为 必过点 .
【答案】(5,4)
【知识点】线性回归方程
【解析】【解答】由题得 .
所以样本中心点为 .
所以线性回归方程 必过点(5,4).
故答案为
【分析】求出样本中心点即得解.
18.(2020高二下·吉林期中)以下几个命题中:
①线性回归直线方程 恒过样本中心 ;
②用相关指数 可以刻画回归的效果,值越小说明模型的拟合效果越好;
③随机误差是引起预报值 和真实值 之间存在误差的原因之一,其大小取决于随机误差的方差;
④在含有一个解释变量的线性模型中,相关指数 等于相关系数 的平方.
其中真命题为
【答案】①③④
【知识点】变量相关关系;线性相关;线性回归方程
【解析】【解答】①线性回归直线方程 恒过样本中心 ,所以正确.
②用相关指数 可以刻画回归的效果,值越大说明模型的拟合效果越好,所以错误.
③随机误差是引起预报值 和真实值 之间存在误差的原因之一,其大小取决于随机误差的方差;所以正确.
④在含有一个解释变量的线性模型中,相关指数 等于相关系数 的平方,所以正确.
故答案为:①③④.
【分析】由线性回归直线恒过样本中心可判断①,由相关指数的值的大小与拟合效果的关系可判断②,由随机误差和方差的关系可判断③,由相关指数和相关系数的关系可判断④.
四、解答题
19.(2020高二上·钦州期末)某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得 .
x 1 2 3 4 5
y 4 m 10 23 22
参考公式:
,
(1)若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ;
(2)预测该星期最后一天参加该活动的人数(按四舍五入取到整数).
【答案】(1)解:根据表中的数据,可得
,解得 ,
则 ,
,
又由 ,故所求回归直线方程为
(2)解:将 代入 中,求得 ,
故预测最后一天参加该活动的人数34.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)由 计算出参数 的值,再计算出 , , ,根据公式计算可得;(2)将 代入(1)的方程计算可得.
20.(2020高一下·驻马店期末)这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期 和全国累计报告确诊病例数量 (单位:万人)之间的关系如下表:
日期 1 2 3 4 5 6 7
确诊病例数量 (万人) 1.4 1.7 2.0 2.4 2.8 3.1 3.5
参考数据如下表:
1.92 16.9 77.5 35.17
表中 , , .
参考公式:对于一组数据 , ,…, 其回归方程 中斜率和截距的最小二乘估计公式分别为:① ,② .
(1)根据表中的数据, 与 哪一个适宜作为确诊病例数量 关于日期 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立 关于 的回归方程;(精确到0.01)
(3)预测2月16日全国累计报告确诊病例数.
【答案】(1)解:根据表中的数据:
适宜作为确诊病例数量 关于日期 的回归方程类型;
(2)解:由已知数据得: , ,
∴ ,
,
所以, 关于 的回归方程为: ;
(3)解:把 代入回归方程得: ,
所以预测2月16日全国累计报告确诊病例数为6.6万人.
【知识点】线性回归方程
【解析】【分析】(1)直接由表格中的数据可知 适宜作为确诊病例数量 关于日期 的回归方程类型;(2)由表格中的数据求得 与 的值,则 关于 的线性回归方程可求;(3)在(2)中求得的线性回归方程中,取 求得 值即可.
21.(2020高二上·福建月考)为了解某地区某种农产品的年产量 (单位:吨)对价格 (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:
x 2 3 4 5 6
y 8 6 5 4 2
已知x和 具有线性相关关系.
附:回归直线的斜率和截距的最小二乘法估计公式分别为 , .
(1)求 , ;
(2)求y关于x的线性回归方程 ;
(3)若年产量为3.5吨,试预测该农产品的价格.
【答案】(1)解: ,
(2)解:因为 ,所以 ,
所以线性回归方程为:
(3)解:当 时, ,
故农产品的价格为 千元 吨.
【知识点】最小二乘法;线性回归方程
【解析】【分析】(1)根据表中数据计算出 , ;(2)利用公式计算出 的值,则线性回归方程可求;(3)利用(2)中的线性回归方程预测农产品价格.
22.(2020高二下·宾县期末)某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
参考公式用最小二乘法求线性回归方程系数公式: , .
(1)画出散点图;
(2)求y关于x的线性回归方程.
(3)如果广告费支出为一千万元,预测销售额大约为多少百万元?
【答案】(1)解:根据表格中的数据,得到点 ,
画在坐标系中,得到散点图:
.
(2)解:由表格中的数据,可得 ,
,
则 ,
于是所求的线性回归方程是
(3)解:当 时, (百万元),
即广告费支出为一千万元,预测销售额大约为 百万元
【知识点】散点图;最小二乘法;线性回归方程
【解析】【分析】(1)根据表中所给的五组数据,得到五个点的坐标,在平面直角坐标系中画出散点图.(2)先求出 的平均数,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.(3)将 代入回归直线方程求出y的值,即可得到广告费支出一千万元时的销售额的估计值.
23.(2020高二上·娄底开学考)《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.
参考公式: ,
(1)若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;
(2)该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间 (单位:小时)与年龄 (单位:岁),并制作了对照表(如下表所示):
年龄 20 30 40 50
每周学习诗词的平均时间 3 3.5 3.5 4
由表中数据分析, 与 呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.
【答案】(1)解:设污损的数字为 ,由北方观众平均人数超过南方观众平均人数得
,
,即 ,
(2)解: ,
,
,
又 ,
,
,
,
,
时, .
答:年龄为60岁的观众每周学习诗词的平均时间大约为4.25小时.
【知识点】线性回归方程
【解析】【分析】(1)由题,列出不等式 ,解得x的取值范围,即可得到本题答案;(2)由 , ,求得线性回归方程,然后令 ,即可得到本题答案.
24.(2020高二下·大庆期末)一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间 (分钟)和答对人数 的统计表格如下:
时间 (分钟) 10 20 30 40 50 60 70 80 90 100
答对人数 98 70 52 36 30 20 15 11 5 5
1.99 1.85 1.72 1.56 1.48 1.30 1.18 1.04 0.7 0.7
时间 与答对人数 的散点图如图:
附: , , , , ,对于一组数据 , ,……, ,其回归直线 的斜率和截距的最小二乘估计分别为: , .请根据表格数据回答下列问题:
(1)根据散点图判断, 与 ,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住 的内容,至多间隔多少分钟重新记忆一遍.(参考数据: , )
【答案】(1)解:由图象可知, 更适宜作为线性回归类型
(2)解:设 ,根据最小二乘法得
, ,
所以 ,
因此
(3)解:由题意知 ,即 ,解得
,即至多19.05分钟,就需要重新复习一遍
【知识点】散点图;最小二乘法;线性回归方程
【解析】【分析】(1)根据图象可得答案;(2)先求得 的线性回归方程,再将对数式化为指数式可得y与t的回归方程;(3)解不等式 可得答案.
1 / 1人教新课标A版 选修2-3 3.1回归分析的基本思想及其初步应用
一、单选题
1.(2020高二上·建瓯月考)已知呈线性相关的变量x与y的部分数据如表所示:
x 2 4 5 6 8
y 3 4.5 m 7.5 9
若其回归直线方程是 ,则m=( )
A.5.5 B.6 C.6.5 D.7
2.(2020高二下·哈尔滨期末)两个线性相关变量 与 的统计数据如表:
x 9 9.5 10 10.5 11
y 11 10 8 6 5
其回归直线方程是 ,则相对应于点 的残差为( )
A.0.1 B.0.4 C.0.3 D.0.2
3.(2020高二下·吉林期末)观察下列各图形,
其中两个变量 具有相关关系的图是( )
A.①② B.①④ C.③④ D.③
4.(2020高二下·大荔期末)已知一组样本数据点 ,用最小二乘法求得其线性回归方程为 .若 的平均数为1,则 ( )
A.10 B.11 C.12 D.13
5.(2020高二下·宿迁期末)某种产品的广告费支出与销售额之间有如下对应数据:
广告费用 (万元) 0.2 0.4 0.5 0.6 0.8
销售额 (万元) 3 4 6 5 7
销售额 (万元)与广告费用 (万元)之间有线性相关关系,回归方程为 ( 为常数),现在要使销售额达到7.8万元,估计广告费用约为( )万元.
A.0.75 B.0.9 C.1.5 D.2.5
6.(2020高一下·启东期末)为了估计加工零件所花费的时间,为此进行了4次试验,测得的数据如下表:
零件数 (个) 1 3 5 7
加工时间 (分钟) 0.5 a 2 2.5
若零件数x与加工时间y具有线性相关关系,且线性回归方程为 ,则a=( )
A.1 B.0.8 C.1.09 D.1.5
7.(2020高三上·长春开学考)调查某市出租车使用年限 和该年支出维修费用 (万元),得到数据如下:
使用年限 2 3 4 5 6
维修费用 2.2 3.8 5.5 6.5 7.0
则线性回归方程是( )
A. B.
C. D.
8.(2020·大连模拟)已知关于某设各的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料,
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
由上表可得线性回归方程 ,若规定当维修费用y>12时该设各必须报废,据此模型预报该设各使用年限的最大值为( )
A.7 B.8 C.9 D.10
9.(2020高二上·江门月考)某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 50 70
根据表提供的数据,求得y关于x的线性回归方程为 ,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.45 B.55 C.50 D.60
10.(2020·新课标Ⅰ·理)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
11.(2020高三上·安徽月考)某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.
河流水位表(1)
第 日 第1日 第2日 第3日 第4日 第5日 第6日 第7日
水位 (米) 3.5 3.7 3.8 3.9 4.3 4.4 4.8
而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.
水位预警分级表(2)
水位
水位分类 设防水位 警戒水位 保证水位
预警颜色 黄色 橙色 红色
现已根据上表得到水位 的回归直线方程为 ,据上表估计( ).
A.第8日将要启动洪水橙色预警 B.第10日将要启动洪水红色预警
C.第11日将要启动洪水红色预警 D.第12日将要启动洪水红色预警
12.(2020高二下·齐齐哈尔期末)下列说法错误的是( )
A.在回归分析中,回归直线始终过样本点( x1,y1 ),( x2,y2 ),…,( xn,yn ) 的中心( )
B.若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
二、多选题
13.(2020高二下·盐城期末)为了对变量 与 的线性相关性进行检验,由样本点 、 、 、 求得两个变量的样本相关系数为 ,那么下面说法中错误的有( )
A.若所有样本点都在直线 上,则
B.若所有样本点都在直线 上,则
C.若 越大,则变量 与 的线性相关性越强
D.若 越小,则变量 与 的线性相关性越强
14.(2020高二下·东台期中)在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价 元和销售量 件之间的一组数据如表所示:
价格 9 9.5 10 10.5 11
销售量 11 10 8 6 5
根据公式计算得相关系数 ,其线性回归直线方程是: ,则下列说法正确的有( )
参考:
A.有 的把握认为变量 具有线性相关关系
B.回归直线恒过定点
C.
D.当 时, 的估计值为12.8
三、填空题
15.(2020高二上·娄底开学考)下表是降耗技术改造后,生产甲产品过程中记录的产量 (吨)与相应的生产能耗 (吨标准煤)的几组对应数据,根据表中提供的数据,得到 关于 的线性回归方程为 ,那么表中 的值为 .
3 4 5 6
2.5 4 4.5
16.(2020高一下·海淀期中)为了了解家庭月收入 (单位:千元)与月储蓄 (单位:千元)的关系,从某居民区随机抽取10个家庭,根据测量数据的散点图可以看出 与 之间具有线性相关关系,其回归直线方程为 ,若该居民区某家庭月收入为7千元,据此估计该家庭的月储蓄为 千元.
17.(2020高一下·六安期末)已知 与 之间的一组数据:
x 2 4 6 8
y 1 3 5 7
则 与 的线性回归方程为 必过点 .
18.(2020高二下·吉林期中)以下几个命题中:
①线性回归直线方程 恒过样本中心 ;
②用相关指数 可以刻画回归的效果,值越小说明模型的拟合效果越好;
③随机误差是引起预报值 和真实值 之间存在误差的原因之一,其大小取决于随机误差的方差;
④在含有一个解释变量的线性模型中,相关指数 等于相关系数 的平方.
其中真命题为
四、解答题
19.(2020高二上·钦州期末)某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得 .
x 1 2 3 4 5
y 4 m 10 23 22
参考公式:
,
(1)若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ;
(2)预测该星期最后一天参加该活动的人数(按四舍五入取到整数).
20.(2020高一下·驻马店期末)这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期 和全国累计报告确诊病例数量 (单位:万人)之间的关系如下表:
日期 1 2 3 4 5 6 7
确诊病例数量 (万人) 1.4 1.7 2.0 2.4 2.8 3.1 3.5
参考数据如下表:
1.92 16.9 77.5 35.17
表中 , , .
参考公式:对于一组数据 , ,…, 其回归方程 中斜率和截距的最小二乘估计公式分别为:① ,② .
(1)根据表中的数据, 与 哪一个适宜作为确诊病例数量 关于日期 的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立 关于 的回归方程;(精确到0.01)
(3)预测2月16日全国累计报告确诊病例数.
21.(2020高二上·福建月考)为了解某地区某种农产品的年产量 (单位:吨)对价格 (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:
x 2 3 4 5 6
y 8 6 5 4 2
已知x和 具有线性相关关系.
附:回归直线的斜率和截距的最小二乘法估计公式分别为 , .
(1)求 , ;
(2)求y关于x的线性回归方程 ;
(3)若年产量为3.5吨,试预测该农产品的价格.
22.(2020高二下·宾县期末)某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
参考公式用最小二乘法求线性回归方程系数公式: , .
(1)画出散点图;
(2)求y关于x的线性回归方程.
(3)如果广告费支出为一千万元,预测销售额大约为多少百万元?
23.(2020高二上·娄底开学考)《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.
参考公式: ,
(1)若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;
(2)该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间 (单位:小时)与年龄 (单位:岁),并制作了对照表(如下表所示):
年龄 20 30 40 50
每周学习诗词的平均时间 3 3.5 3.5 4
由表中数据分析, 与 呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.
24.(2020高二下·大庆期末)一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间 (分钟)和答对人数 的统计表格如下:
时间 (分钟) 10 20 30 40 50 60 70 80 90 100
答对人数 98 70 52 36 30 20 15 11 5 5
1.99 1.85 1.72 1.56 1.48 1.30 1.18 1.04 0.7 0.7
时间 与答对人数 的散点图如图:
附: , , , , ,对于一组数据 , ,……, ,其回归直线 的斜率和截距的最小二乘估计分别为: , .请根据表格数据回答下列问题:
(1)根据散点图判断, 与 ,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住 的内容,至多间隔多少分钟重新记忆一遍.(参考数据: , )
答案解析部分
1.【答案】C
【知识点】线性回归方程
【解析】【解答】由题意可得 , ,
则 ,解得 .
故答案为:C.
【分析】先求出 , ,再根据回归方程过样本中心,可求出参数 的值.
2.【答案】D
【知识点】线性回归方程
【解析】【解答】 , ,则样本中心点为 ,
因为回归直线方程为 ,所以有 ,解之得 ,
所以 ,当 时, ,则相对应于点 的残差为 .
故答案为:D.
【分析】由已知求得样本中心点的坐标,代入回归方程中求得 的值,进而求出回归方程,取 求得 ,再由残差公式求得结果即可.
3.【答案】C
【知识点】变量相关关系
【解析】【解答】由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;而图①②中这些点分布不均匀,比较分散,不具有相关关系.
故答案为:C.
【分析】根据图形中点的分布,即可判断 是否具有相关关系.
4.【答案】C
【知识点】线性回归方程
【解析】【解答】 , ,
由回归直线 过样本中心点,
所以 ,
解得 .
故答案为:C
【分析】利用回归直线过样本中心点 即可求解.
5.【答案】B
【知识点】线性回归方程
【解析】【解答】解: ,
,
样本点的中心为 ,
代入 ,得 ,即 .
线性回归方程为 .
取 ,得 ,则 .
故答案为: B.
【分析】由已知求得样本点的中心的坐标,代入线性回归方程求得 ,得到线性回归方程,取 求得 值即可.
6.【答案】B
【知识点】线性回归方程
【解析】【解答】依题意 , ,
将 代入 得 ,解得 .
故答案为:B
【分析】将样本中心点代入回归直线方程,解方程求得 的值.
7.【答案】B
【知识点】线性回归方程
【解析】【解答】设回归直线方程为 ,
由表格中的数据可得 , ,
由最小二乘法公式可得 ,
,
因此,回归直线方程为 .
故答案为:B.
【分析】设回归直线方程为 ,求得 、 的值,将表格中的数据代入最小二乘法公式,求出 和 的值,进而可求得回归直线方程.
8.【答案】C
【知识点】线性回归方程
【解析】【解答】由已知表格得: , ,
由于线性回归直线恒过样本中心点 ,所以有: ,解得: ,
所以线性回归方程 ,
由 得: 解得: ,
由于 ,
所以据此模型预报该设备使用年限的最大值为9。
故答案为:C.
【分析】利用已知的数据表求出x和y的平均数,从而求出样本中心点的坐标,再利用线性回归直线恒过样本中心点 ,从而求出的值,从而求出线性回归方程,再利用已知条件当维修费用y>12时该设各必须报废,从而用线性回归方程,从而结合x的实际意义预报出该设备使用年限的最大值。
9.【答案】C
【知识点】线性回归方程
【解析】【解答】由表中数据得: ,
因为样本中心点 在回归直线上,
所以 ,
所以
故答案为:C
【分析】根据样本中心点在回归直线上可得答案.
10.【答案】D
【知识点】散点图;线性回归方程
【解析】【解答】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率 和温度 的回归方程类型的是 .
故答案为:D.
【分析】根据散点图的分布可选择合适的函数模型.
11.【答案】D
【知识点】线性回归方程
【解析】【解答】因为水位 的回归直线方程为 ,
A选项,第8日的水位是 ,将启动黄色预警,A不符合题意;
B选项,第10日的水位是 ,将启动橙色预警,B不符合题意;
C选项,第11日的水位是 ,将启动橙色预警,C不符合题意;
D选项,第12日的水位是 ,将启动红色预警,D符合题意;
故答案为:D.
【分析】根据回归方程,逐项计算预测值,再由河流水位表,即可判定出结果.
12.【答案】B
【知识点】变量相关关系;回归分析
【解析】【解答】解:回归直线一定经过样本点的中心 ,故 对;
若两个具有线性相关关系的变量的相关性越强,则线性相关系数 的值越接近于1或 , 错;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故 对;
在线性回归模型中,相关指数 越接近于1,说明回归的效果越好,故 对,
故答案为:B.
【分析】根据回归直线方程及回归分析的相关知识判断即可;
13.【答案】A,B,D
【知识点】线性相关
【解析】【解答】若所有样本点都在直线 上,且直线斜率为负数,则 ,A、B选项均错误;
若 越大,则变量 与 的线性相关性越强,C选项正确,D选项错误.
故答案为:ABD.
【分析】根据相关系数与变量 与 的线性相关性之间的关系可判断出各选项的正误.
14.【答案】A,B,C,D
【知识点】线性回归方程
【解析】【解答】对A,因为 ,故有99%的把握认为变量 具有线性相关关系,A符合题意.
对B,价格平均 ,销售量 .
故回归直线恒过定点 .B符合题意.
对C,因为回归直线恒过定点 ,故 .C符合题意.
对D,当 时, .D符合题意.
综上,ABCD均正确.
故答案为:ABCD
【分析】对A,根据 判断即可;对BC,根据回归直线方程经过样本中心点求解即可.对D; 求出 ,再代入 求解即可.
15.【答案】3
【知识点】线性回归方程
【解析】【解答】解: , ,
又回归直线必过样本点的中心 ,
所以 ,所以 .
故答案为:3.
【分析】根据表格中所给的数据,求出这组数据的横标和纵标的平均值,表示出这组数据的样本中心点,根据样本中心点在线性回归直线上,代入得到关于m的方程,解方程即可.
16.【答案】1.7
【知识点】回归分析的初步应用
【解析】【解答】由于 ,代入 ,于是得到 ,故答案为1.7.
【分析】直接代入 即得答案.
17.【答案】(5,4)
【知识点】线性回归方程
【解析】【解答】由题得 .
所以样本中心点为 .
所以线性回归方程 必过点(5,4).
故答案为
【分析】求出样本中心点即得解.
18.【答案】①③④
【知识点】变量相关关系;线性相关;线性回归方程
【解析】【解答】①线性回归直线方程 恒过样本中心 ,所以正确.
②用相关指数 可以刻画回归的效果,值越大说明模型的拟合效果越好,所以错误.
③随机误差是引起预报值 和真实值 之间存在误差的原因之一,其大小取决于随机误差的方差;所以正确.
④在含有一个解释变量的线性模型中,相关指数 等于相关系数 的平方,所以正确.
故答案为:①③④.
【分析】由线性回归直线恒过样本中心可判断①,由相关指数的值的大小与拟合效果的关系可判断②,由随机误差和方差的关系可判断③,由相关指数和相关系数的关系可判断④.
19.【答案】(1)解:根据表中的数据,可得
,解得 ,
则 ,
,
又由 ,故所求回归直线方程为
(2)解:将 代入 中,求得 ,
故预测最后一天参加该活动的人数34.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)由 计算出参数 的值,再计算出 , , ,根据公式计算可得;(2)将 代入(1)的方程计算可得.
20.【答案】(1)解:根据表中的数据:
适宜作为确诊病例数量 关于日期 的回归方程类型;
(2)解:由已知数据得: , ,
∴ ,
,
所以, 关于 的回归方程为: ;
(3)解:把 代入回归方程得: ,
所以预测2月16日全国累计报告确诊病例数为6.6万人.
【知识点】线性回归方程
【解析】【分析】(1)直接由表格中的数据可知 适宜作为确诊病例数量 关于日期 的回归方程类型;(2)由表格中的数据求得 与 的值,则 关于 的线性回归方程可求;(3)在(2)中求得的线性回归方程中,取 求得 值即可.
21.【答案】(1)解: ,
(2)解:因为 ,所以 ,
所以线性回归方程为:
(3)解:当 时, ,
故农产品的价格为 千元 吨.
【知识点】最小二乘法;线性回归方程
【解析】【分析】(1)根据表中数据计算出 , ;(2)利用公式计算出 的值,则线性回归方程可求;(3)利用(2)中的线性回归方程预测农产品价格.
22.【答案】(1)解:根据表格中的数据,得到点 ,
画在坐标系中,得到散点图:
.
(2)解:由表格中的数据,可得 ,
,
则 ,
于是所求的线性回归方程是
(3)解:当 时, (百万元),
即广告费支出为一千万元,预测销售额大约为 百万元
【知识点】散点图;最小二乘法;线性回归方程
【解析】【分析】(1)根据表中所给的五组数据,得到五个点的坐标,在平面直角坐标系中画出散点图.(2)先求出 的平均数,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.(3)将 代入回归直线方程求出y的值,即可得到广告费支出一千万元时的销售额的估计值.
23.【答案】(1)解:设污损的数字为 ,由北方观众平均人数超过南方观众平均人数得
,
,即 ,
(2)解: ,
,
,
又 ,
,
,
,
,
时, .
答:年龄为60岁的观众每周学习诗词的平均时间大约为4.25小时.
【知识点】线性回归方程
【解析】【分析】(1)由题,列出不等式 ,解得x的取值范围,即可得到本题答案;(2)由 , ,求得线性回归方程,然后令 ,即可得到本题答案.
24.【答案】(1)解:由图象可知, 更适宜作为线性回归类型
(2)解:设 ,根据最小二乘法得
, ,
所以 ,
因此
(3)解:由题意知 ,即 ,解得
,即至多19.05分钟,就需要重新复习一遍
【知识点】散点图;最小二乘法;线性回归方程
【解析】【分析】(1)根据图象可得答案;(2)先求得 的线性回归方程,再将对数式化为指数式可得y与t的回归方程;(3)解不等式 可得答案.
1 / 1