人教A版(2019)选择性必修三 第八章 成对数据的统计分析 章节测试题
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了4组对应数据如下表所示:
x 3 4 6 7
y 2.5 3 4 m
根据表中数据,得出x关于y的回归直线方程为.据此计算出在样本处的残差为-0.15,则表中m的值为( )
(注:称为对应样本点的残差)
A.5.9 B.5.5 C.4.5 D.3.3
2.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
计算可知,根据小概率值________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”( )
附:,.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.0.001 B.0.05 C.0.01 D.0.005
3.设两个相关变量x和y分别满足下表:
x 1 2 3 4 5
y 1 2 8 8 16
若相关变量x和y可拟合为非线性回归方程,则当时,y的估计值为 ( )
(参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;)
A.33 B.37 C.65 D.73
4.某产品的广告费用x与销售额y的统计数据如下表:
广告费用 x(万元) 4 2 3 5
销售额 y(万元) 49 26 39
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
5.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数与气温y(单位:)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的线性回归方程.则当蟋蟀每分钟鸣叫60次时,该地当时的气温预报值为( )
x(次数/分钟) 20 30 40 50 60
25 27.5 29 32.5 36
A. B. C. D.
6.某校对学生记忆力x和判断力y进行统计分析,所得数据如表:
记忆力x 2 5 6 8 9
判断力y 7 8 10 12 18
则y关于x的经验回归方程为( )
(附: ,)
A. B.
C. D.
7.某校团委对“学生喜欢体育和性别是否有关”做了一次调查,其中被调查的男、女生人数相同,男生喜欢体育的人数占男生人数的,女生喜欢体育的人数占女生人数的,若有以上的把握认为是否喜欢体育和性别有关,则调查人数中男生人数可能是( )
0.050 0.010
3.841 6.635
【附:,其中】
A.35 B.39 C.40 D.50
8.在对一组成对样本数据进行分析时,从已知数据了解到预报变量y随着解释变量x的增大而减小,且大致趋于一个确定的值.则下列拟合函数中符合条件的是( )
A. B.
C. D.
二、多项选择题
9.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:,,·····,则下列说法不正确的是( )
A.若所有样本点都在直线上,则两个变量的样本相关系数为
B.残差平方和越小的模型,拟合的效果越好
C.若越大,则变量x与y的线性相关性越强
D.若越小,则变量x与y的线性相关性越强
10.对于变量x和变量y,通过随机抽样获得10个样本数据,变量x和变量y具有较强的线性相关并利用最小二乘法获得回归方程为,且样本中心点为,则下列说法正确的是( )
A.变量x和变量y呈正相关
B.变量x和变量y的相关系数
C.
D.样本数据比的残差绝对值大
11.下列说法中正确的是( )
A.若两个变量x,y具有线性相关关系,则经验回归直线至少过一个样本点;
B.在经验回归方程中,当解释变量x每增加一个单位时,响应变量平均减少0.85个单位;
C.若某商品的销售量y(件)关于销售价格x(元/件)的经验回归方程为,则当销售价格为10元/件时,销售量一定为300件.
D.线性经验回归方程一定过样本中心.
12.月亮公转与自转的周期大约为30天,阴历是以月相变化为依据.人们根据长时间的观测,统计了月亮出来的时间(简称“月出时间”,单位:小时)与天数(为阴历日数,,且)的有关数据,如下表,并且根据表中数据,求得关于的线性回归方程为.
2 4 7 10 15 22
12 24
其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日)才升起.则( )
A.样本点的中心为
B.
C.预报月出时间为16时的那天是阴历13日
D.预报阴历27日的月出时间为阴历28日早上
三、填空题
13.近年来,“考研热”持续升温,2022年考研报考人数官方公布数据为457万,相比于2021年增长了80万之多,增长率达到21%以上.考研人数急剧攀升原因较多,其中,本科毕业生人数增多、在职人士考研比例增大,是两大主要因素.据统计,某市各大高校近几年的考研报考总人数如下表:
年份 2018 2019 2020 2021 2022
年份序号x 1 2 3 4 5
报考人数y(万人) 1. 1 1.6 2 2.5 m
根据表中数据,可求得y关于x的线性回归方程为,则m的值为________.
14.近年来,“考研热”持续升温,2022年考研报考人数官方公布数据为457万,相比于2021年增长了80万之多,增长率达到21%以上.考研人数急剧攀升原因较多,其中,本科毕业生人数增多、在职人士考研比例增大,是两大主要因素.据统计,某市各大高校近几年的考研报考总人数如下表:
年份 2018 2019 2020 2021 2022
年份序号x 1 2 3 4 5
报考人数y(万人) 1.1 1.6 2 2.5 m
根据表中数据,可求得y关于x的线性回归方程为,则m的值为_________.
15.已知变量x和y的统计数据如下表:
x 9 9.5 10 10.5 11
y 11 10 8 6 5
若由表中数据得到经验回归直线方程为,则时的残差为______.
16.某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据,得线性回归方程,当气温为-5℃时,预测用电量的度数约为______.
四、解答题
17.近年来,新能源汽车产业大规模发展,某品牌汽车投人市场以来,受到多位消费者欢迎,汽车厂家为扩大销售,对旗下两种车型电池续航进行满意度调查,制作了如下2×2列联表.
不满意 满意 合计
男 18
女 40
合计 100
已知从全部100人中随机抽取1人调查满意度为满意的概率为
0.15 0.10 0.05 0.10 0.001
2.072 2.706 3.841 6.635 10.828
附:,其中.
(1)完成上面的列联表;
(2)根据(2)中的列联表,判断是否有90%的把握认为满意度与消费者的性别有关
18.根据某种病毒的变异发展实际,某地防控措施有了重大调整.其中,老人是否接种疫苗备受关注,为了了解某地区老人是否接种了疫苗,现用简单随机抽样的方法从该地区调查了500名老人,结果如下:
性别 接种情况 男 女
未接种 20 10
已接种 230 240
(1)估计该地区老人中,已接种疫苗的比例;
(2)能否有99%的把握认为该地区的老人是否接种疫苗与性别有关?
附:(参考公式:,其中)
19.下表是某单位在2013年1~5月份用水量(单位:百吨)的一组数据:
月份x 1 2 3 4 5
用水量y 4.5 4 3 2.5 1.8
若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么用该单位前4个月的数据所得到的线性回归方程预测5月份的用水量是否可靠 并说明理由.
20.2022年9月2日第十三届全国人民代表大会常务委员会第三十六次会议通过《中华人民共和国反电信网络诈骗法》.某高校为了提高学生防电信网络诈骗的法律意识,举办了专项知识竞赛,从竞赛成绩中随机抽取了100人的成绩,成绩数据如下表:
性别 成绩
女生 8 10 16 6
男生 7 15 25 13
若学生的测试成绩大于等于80分,则“防电信诈骗意识强”,否则为“防电信诈骗意识弱”
(1)100人中男生,女生“防电信诈骗意识强”的频率分别是多少
(2)根据上表数据,完成列联表,能否有99%的把握认为“防电信诈骗意识强弱”有性别差异.
男生 女生 合计
防诈骗意识强
防诈骗意识弱
合计
附:
P() 0.050 0.010 0.005
3.841 6.635 7.879
21.为了推动智慧课堂的普及和应用,A市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如下表:
经常应用 偶尔应用或者不应用 总计
农村学校 40
城市学校 80
总计 100 160
(1)补全上面的列联表;
(2)通过计算判断能否有99.5%的把握认为智慧课堂的应用与区域有关.
附:,其中.
0.500 0.050 0005
0.445 3.841 7.879
22.某药厂为了了解某新药的销售情况,将今年2至6月份的销售额整理得到如下图表:
月份 2 3 4 5 6
销售额(万元) 19 25 35 37 42
(1)根据2至6月份的数据,求出每月的销售额y关于月份x的线性回归方程
(2)根据所求线性回归方程预测该药厂今年第三季度(7,8,9月份)这种新药的销售总额.
参考公式:,
参考答案
1.答案:A
解析:由残差为-0.15可知,当时,,即,解得,所以回归直线方程为,又,,且样本点中心在回归直线上,所以,解得,故选A.
2.答案:B
解析:完善列联表如下:
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
零假设为 “给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.
因为,
所以根据小概率值的独立性检验,推断不成立,
即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
故选:B.
3.答案:B
解析:因为非线性回归方程为:,则有,
令,即,列出相关变量x,y,v关系如下:
x 1 2 3 4 5
y 1 2 8 8 16
v 0 1 3 3 4
所以,,
,,
所以,
所以,所以,
即,即,因为,所以,
当时,.
故选:B
4.答案:B
解析:,,数据的样本中心点在线性回归直线上,
回归方程中的为9.4,
,
,
线性回归方程是,
广告费用为6万元时销售额为
5.答案:C
解析:,,
则样本中心点为,代入,可得,即,
所以,
当时,.
所以当蟋蟀每分钟鸣叫60次时,该地当时的气温预报值为.
故选:C.
6.答案:B
解析:由表中数据知,随着x的增大,y增大,
所以x与x正相关,排除AD,
又,,
由回归直线过样本中心点,代入验证知B项正确.
故选:B.
7.答案:D
解析:设男生女生人数均为x,则在列联表中,,,,,
若有以上的把握认为学生是否喜欢体育和性别有关,
可知,解得,
又x是5的整数倍,可得男生人数可取50.
故选:D.
8.答案:D
解析:当时,函数为增函数,
时,函数、、均为减函数,
且当,,,,
故选:D.
9.答案:AD
解析:当所有的样本点都在直线上时,样本点数据完全负相关,其相关系数,故A错误;
残差平方和越小的模型,越大,拟合的效果越好,故B正确;
相关系数值越大,则变量x与y的线性相关性越强,故C正确;
相关系数越小,则变量x与y的线性相关性越弱,D错误;
故选:AD.
10.答案:BC
解析:由于回归方程中x的系数为,故变量x和变量y呈负相关,且相关系数,因此A选项错误,B选项正确;
将代入回归方程,解得,故C选项正确;
样本数据的残差为,
样本数据的残差为,故,因此D选项错误.
综上,BC选项正确.
故选:BC.
11.答案:BD
解析:两个变量x、y具有线性相关关系,则经验回归直线可能不过任何一个样本点;故A错误;
对于经验回归方程,当时,当解释变量x每增加一个单位时,响应变量平均增加个单位;当时,当解释变量x每增加一个单位时,响应变量平均减少个单位;故B正确.
当销售价格为10元/件时,销售量一定为300件,但预测值与真实值未必相同,故C错误;
由最小二乘法可知,线性经验回归方程必过样本中心,故D正确.
12.答案:AD
解析:,,
故样本点的中心为,选项A正确;
将样本点的中心为代入得,故选项B错误;
∵,当求得,月出时间为阴历12日,选项C错误;
∵阴历27日时,即,代入,日出时间应该为28日早上,选项D正确;
故选AD.
13.答案:2.8
解析:,,
,
,
解得.
故答案为:2.8.
14.答案:2.8
解析:,,
,
,
解得.
故答案为:2.8.
15.答案:-0.2
解析:依题意,,
经验回归直线方程为,
则,
故
当时,时的残差为.
16.答案:70
解析:由表格,可得
,,
即为:,
又在回归方程上,
,
解得:,
.
当时,.
故答案为:70.
17.答案:(1)见解析
(2)没有90%的把握认满意度是否与消费者的性别有关
解析:(1)根据题意,满意的总人数为,
完成列联表如图:
不满意 满意 合计
男 18 30 48
女 12 40 52
合计 30 70 100
(2),
没有90%的把握认满意度是否与消费者的性别有关.
18.答案:(1)
(2)没有
解析:(1).
(2)
没有99%的把握认为该地区的老人是否接种疫苗与性别有关;
19.答案:见解析
解析:由前4个月的数据,得,,
且,所以,,
所以y关于x的线性回归方程为,
当时,得估计值,
而,
所以,所得到的回归方程是“预测可靠”的.
20.答案:(1)男生0.38,女生0.22;
(2)列联表见解析,没有99%的把握认为“防电信诈骗意识强弱”有性别差异.
解析:(1)男生“防电信诈骗意识强”的频率是,
女生“防电信诈骗意识强”的频率是;
(2)列联表如下:
男生 女生 合计
防诈骗意识强 38 22 60
防诈骗意识弱 22 18 40
合计 60 40 100
,
因此没有99%的把握认为“防电信诈骗意识强弱”有性别差异.
21.答案:(1)见解析
(2)能有99.5%的把握认为智慧课堂的应用与区域有关
解析:(1)补全的列联表如下:
经常应用 偶尔应用或者不应用 总计
农村学校 40 40 80
城市学校 60 20 80
总计 100 60 160
(2)计算,
能有99.5%的把握认为智慧课堂的应用与区域有关.
22.答案:(1)
(2)164.4万元
解析:(1)由题意得,
故每月的销售额y关于月份x的线性回归方程.
(2)因为每月的销售额y关于月份x的线性回归方程,
所以当时,
当时,
当时,.
则该药企今年第三季度这种新药的销售总额预计为万元.