人教A版(2019) 选修第三册 第八章 第二节 一元线性回归模型及其应用
一、单选题
1.对具有线性相关关系的变量,测得一组数据如下表,根据表中数据,利用最小二乘法得到回归直线方程,据此模型预测当时,y的估计值为( )
x 2 4 5 6 8
y 20 40 60 70 80
A.210 B.210.5 C.211.5 D.212.5
2.已知x与y之间的一组数据:
x 0 1 2 3
y 1 3 5 7
则y与x的线性回归方程必过( )A. B. C. D.
3.如图,5个数据,去掉后,下列说法错误的是( )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
4.用模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性方程为,则( )
A. B. C. D.
5.某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,,以下说法正确的是( )
广告支出费用 2.2 2.6 4.0 5.3 5.9
销售量 3.8 5.4 7.0 11.6 12.2
A.第三个样本点对应的残差,回归模型的拟合效果一般
B.第三个样本点对应的残差,回归模型的拟合效果较好
C.销售量的多少有96%是由广告支出费用引起的
D.销售量的多少有4%是由广告支出费用引起的
6.工人月工资(元)关于劳动生产率x(千元)的回归方程为,下列说法中正确的个数是( )
①劳动生产率为1000元时,工资为730元;
②劳动生产率提高1000元,则工资提高80元;
③劳动生产率提高1000元,则工资提高730元;
④当月工资为810元时,劳动生产率约为2000元.
A.1 B.2 C.3 D.4
7.某大型电子商务平台每年都会举行“双11”商业促销狂欢活动,现统计了该平台从2010年到2018年共9年“双11”当天的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2010年作为第1年)的函数.运用excel软件,分别选择回归直线和三次多项式回归曲线进行拟合,效果如下图,则下列说法错误的是( )
A.销售额y与年份序号x呈正相关关系
B.根据三次多项式函数可以预测2019年“双11”当天的销售额约为2684.54亿元
C.三次多项式回归曲线的拟合效果好于回归直线的拟合效果
D.销售额y与年份序号x线性相关不显著
8.下列有关线性回归分析的六个命题:
①线性回归直线必过样本数据的中心点;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③当相关性系数时,两个变量正相关;
④如果两个变量的相关性越强,则相关性系数就越接近于1;
⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
⑥甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好.
其中真命题的个数为
A.1个 B.2个 C.3个 D.4个
二、多选题
9.下列说法中正确的有( )
A.在对分类变量和进行独立性检验时,随机变量的值越大,则“与有关”可信程度越小
B.在经验回归方程中,当解释变量每增加一个单位时,响应变量增加0.1个单位
C.两个变量的线性相关性越强,相关系数的绝对值越接近于1
D.在回归分析模型中,若越大,则模型的拟合效果越好
三、解答题
10.如图甲是某商店2018年(按360天计算)的日盈利额(单位:万元)的统计图.
(1)请计算出该商店2018年日盈利额的平均值(精确到0.1,单位:万元):
(2)为了刺激消费者,该商店于2019年1月举行有奖促销活动,顾客凡购买一定金额的高品后均可参加抽奖.随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该商店对前5天抽奖活动的人数进行统计如下表:(表示第天参加抽奖活动的人数)
1 2 3 4 5
50 60 70 80 100
经过进一步统计分析,发现与具有线性相关关系.
(ⅰ)根据上表提供的数据,用最小二乘法求出关于的线性回归方程:
(ⅱ)该商店采取转盘方式进行抽奖(如图乙),其中转盘是个八等分的圆.每位顾客最多两次抽奖机会,若第一次抽到奖,则抽奖终止,若第一次未抽到奖,则再提供一次抽奖机会.抽到一等奖的奖品价值128元,抽到二等奖的奖品价值32元.若该商店此次抽奖活动持续7天,试估计该商店在此次抽奖活动结束时共送出价值为多少元的奖品(精确到0.1,单位:万元)?
(3)用(1)中的2018年日盈利额的平均值去估计当月(共31天)每天的日盈利额.若商店每天的固定支出约为1000元,促销活动日的日盈利额比平常增加20%,则该商店当月的纯利润约为多少万元?(精确到0.1,纯利润=盈利额-固定支出-抽奖总奖金数)
参考公式及数据:,,,.
11.下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组对应数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出表中数据的散点图,并求出y关于x的线性回归方程;
(2)已知该厂技术改造前产品的生产能耗为标准煤,试根据(1)中求出的线性回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了多少t标准煤.
12.已知直线l:y=k(x+2)与圆O:x2+y2=4相交于不重合的A、B两点,O是坐标原点,且三点A、B、O构成三角形.
(1)求k的取值范围;
(2)三角形ABO的面积为S,试将S表示成k的函数,并求出它的定义域;
(3)求S的最大值,并求取得最大值时k的值.
13.中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某些区块随机初步勘探了部分旧井,取得了地质资料. 进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井.以节约勘探费用.勘探初期数据资料见下表:
井号 1 2 3 4 5 6
坐标
钻探深度 2 4 5 6 8 10
出油量 40 70 110 90 160 205
(1)号旧井位置线性分布,借助前5组数据求得回归直线方程为,求,并估计的预报值;
(2)现准备勘探新井7,若通过1、3、5、7号井计算出的的值与(1)中的值差不超过10%,则使用位置最接近的已有旧井6,否则在新位置打开,请判断可否使用旧井?
(3)设井出油量与勘探深度的比值不低于20的勘探并称为优质井,那么在原有的出油量不低于的
井中任意勘察3口井,求恰有2口是优质井的概率.
14.已知x∈R,a=x2-1,b=2x+2.
(1)求a+b的取值范围;
(2)用反证法证明:a,b中至少有一个大于等于0.
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.C
【解析】
【分析】
求出样本中心,然后确定回归直线方程,即可求解预测当时,的估计值.
【详解】
由题意可知:,
.
∵回归直线方程经过样本中心,∴,,
回归直线方程为:,
当时,的估计值为:.
故选:C.
2.D
【解析】
【分析】
利用线性回归方程必过样本中心点即可判断.
【详解】
因为,,
所以y与x的线性回归方程必过.
故选:D
3.B
【解析】
【分析】
根据图中的点,计算去掉前后的相关系数、残差平方和、,即可判断各选项的正误.
【详解】
由图,,,则,,,
∴相关系数.
令回归方程,则,
∴,即回归方程为,可得为,,,,,
∴残差平方和,故,
去掉后,
,,则,,,
∴相关系数.
∴,A、D正确;
令回归方程,则,
∴,即回归方程为,可得为,,,,
∴残差平方和,故,
∴,B错误,C正确;
故选:B
4.C
【解析】
【分析】
两边同时取对数后可得,结合题意即可得解.
【详解】
,两边同时取对数得,
令,则,,.
故选:C.
【点睛】
本题考查了非线性回归方程和对数的运算性质,属于基础题.
5.C
【解析】
【分析】
利用回归模型可计算残差,结合相关指数可判断AB的正误,根据相关指数的意义可判断CD的正误.
【详解】
时,残差为,而,故拟合效果较好,故AB错误.
因为,故销售量的多少有96%是由广告支出费用引起的,故C正确,D错误.
故选:C.
6.C
【解析】
【详解】
对于①当劳动生产率为1000元时,工资为元,故①正确;对于②劳动生产率提高1000元,则工资提高80元正确;故③错误;对于④当月工资为810元时,由得,即劳动生产率约为2000元,故④正确;故选C.
7.D
【解析】
【分析】
采用注意验证法,通过散点图,根据相关系数以及图形的增长情况,简单判断即可.
【详解】
散点从左下到右上分布,所以销售额y与序号x呈正相关关系,故A正确;
令,由三次多项式函数得2684.54,
所以2019年“双11”当天的销售额约为2684.54亿元,故B正确;
用三次多项式曲线拟合的相关指数,而一次归直线拟合的相关指数,相关指数越大拟合效果越好,故C正确;
因为相关系数非常接近1,
故销售额y与年份序号x线性相关显著,故D错误,
故选:D.
【点睛】
本题考查散点图的应用以及相关系数的应用,识记概念,考查观察能力,属基础题.
8.B
【解析】
【详解】
分析:根据线性回归方程的几何体特征及残差,相关指数的概论,逐一分析四个选项的正误,可得结论.
详解:①线性回归直线必过样本数据中心点,故①正确;
②回归直线方程在散点图中可能不经过任意样本数据点,故②错误;
③当相关性系数时,则两个变量正相关,故③正确;
④如果两个变量的相关性越强,则相关性系数就越接近于1或,故④错误;
⑤残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,故⑤错误;
⑥甲、乙两个模型的分别约为0.88和0.80,则模型甲的拟合效果更好,故⑥错误,
真命题的个数为,故选B.
点睛:本题以命题的真假判断为截体,考查了相关关系,回归分析、残差、相关指数等知识点,意在考查对基本概念掌握的熟练程度,难度不大,属于基础题.
9.CD
【解析】
【分析】
根据独立检验,回归直线,线性相关系数等知识依次判断各选项即可得出结果.
【详解】
由题意得,根据的值越大,分类变量的有关联的可信度就越大,所以A是错误的;
根据线性回归方程中回归系数的含义,可知在线性回归方程中,当解释变量每增加一个单位时,响应变量平均增加0.1个单位,B是错误的;
根据相关系数的计算公式可知,相关系数的绝对值越接近1,两个变量的相关性就越强,所以C是正确的;
根据回归分析的基本思想可知越大,则模型的拟合效果越好,D是正确的.
故选:CD.
10.(1)1.3(万元);(2)(ⅰ),(ⅱ)2.3万元;(3)36.7万元
【解析】
【分析】
(1)由总天数360列方程,求出统计图中的值,然后计算日盈利额的平均值即可;(2)(ⅰ)算出,结合参考公式和数据,即可求出线性回归方程;(ⅱ)由转盘分布可知,顾客每次抽到一二三等奖的概率均为,无奖的概率为,设一位参加抽奖的顾客获得的奖品价值元,则的取值可能为128、32、0,然后分别求出其概率,列出分布列求出方程,由线性回归方程估算出第6、7两天的人数,然后加上前5天人数得到抽奖总人数,再乘以每位顾客中奖奖品价值的期望值即可;(3)由(1)中的日盈利额的平均值乘以天数31,再加上促销日额外多出的盈利额即为总盈利额,再减去固定总支出,以及(2)中得出的抽奖总奖金数即可.
【详解】
(1)由题意可知:,解得.
所以日盈利额的平均值为
(万元).
(2)(ⅰ),
,
,
所以.
(ⅱ)由转盘分布可知,顾客每次抽到一二三等奖的概率均为,无奖的概率为
设一位参加抽奖的顾客获得的奖品价值元,则的分布列为:
,,,
128 32 0
故(元)
由于关于的线性回归方程为,得时,时,则此次活动参加抽奖的总人数约为,
该商店在此次抽奖活动结束时共送出的奖品总价值为万元
(3)当月的纯利润约为(万元),故该商店当月的纯利润约为36.7万元.
【点睛】
本题考查了最小二乘法求线性回归方程,离散型随机变量的期望,用统计知识分析估算实际问题,属于中档题.
11.(1)散点图见解析,回归直线方程为.
(2)
【解析】
【分析】
(1)画出散点图,利用回归直线方程计算公式计算出回归直线方程.
(2)结合回归直线方程计算出降低的数值.
(1)
散点图如下图:
x 3 4 5 6
y 2.5 3 4 4.5
,
,
,
所以.
(2)
改造后能耗为,
故减少了.
12.(1)且;(2)S=(且); (3)S的最大值为2,取得最大值时.
【解析】
【分析】
(1)解不等式(2)先求出dOM=和|AB|,再将S表示成k的函数,并求出它的定义域.(3) 设k2+1=t(t≥1),则,再利用二次函数的图像和性质求函数的最大值和k的值.
【详解】
(1)由题意,dOM= ,
∵三点A、B、O构成三角形,
∴,
∴﹣1<k<1且k≠0.
(2)直线l:y=k(x+2),即kx﹣y+2k=0,
∴dOM=,
∴|AB|=,
∴S=dOM= = (且);
(3)设k2+1=t(t≥1),则 ,
∴,即t=时,, ,
∴S的最大值为2,取得最大值时.
【点睛】
本题主要考查直线和圆的位置关系,考查三角形面积的计算和最值的求法,意在考查学生对这些知识的掌握水平和分析推理计算能力.
13.(1);(2)使用位置最接近的已有旧井;(3).
【解析】
【分析】
(1)由回归直线必过平衡点求出回归方程,再令即可预估;(2)先求出的值,验证的值与(1)中的值差是否超过即可;
(3)口井取三口共有取法,其中恰由口是优质井的种,根据古典概型概率公式可求.
【详解】
(1)因为,回归直线必过平衡点,
则,
故回归直线方程为,
当时,,
即的预报值为.
(2)因为,,
所以,
,
即,
均不超过10%,因此使用位置最接近的已有旧井.
(3)易知原有的出油量不低于的井中,
3,5,6这3口井是优质井,2、4这2口井为非优质井,
由题意从这5口井中随机选取3口井的可能情况有:
共10种,
其中恰有2口是优质井的有6种,所以所求概率是.
14.(1)见解析;(2)见解析
【解析】
【分析】
(1)利用配方法,即可求的取值范围;
(2)假设中没有一个不小于0,即 ,所以,与 矛盾,即可得出结论.
【详解】
(1);
(2)证明:假设中没有一个不小于0,即,所以.
又,这与假设所得结论矛盾,故假设不成立,所以,a,b中至少有一个大于等于0.
【点睛】
本题考查利用配方法求取值范围以及路反证法证明有关命题,属基础题.
答案第1页,共2页
答案第1页,共2页