第八章《成对数据的统计分析》同步单元高分突破必刷卷(基础版)
(时间:120分钟 满分:150分)
单项选择题(本大题共8小题,每小题5分,共40分)
1.对四组数据进行统计,获得以下散点图(如图),将四组数据相应的相关系数进行比较,正确的有( )
A. B.
C. D.
2.为加强高三学生的素质教育,促进学生全面发展,某校对高三学生文化课与体育课的成绩进行了调查统计,
结果如下:单位:人
文化课 体育课 合计
不及格 及格
及格
不及格
合计
在探究体育课成绩和文化课成绩是否相关时,根据以上数据可得到约为( )
A. B. C. D.
3.已知某种商品的销售额y(单位:万元)与广告费支出x(单位:万元)之间具有线性相关关系,利用下表中的数据求得经验回归方程为,根据该经验回归方程,预测当时,,则( )
x 2 3 4 5 6
y 25 37 50 56 64
A.9.3 B.9.5 C.9.7 D.9.9
4.由下表得出结论:依据的独立性检验,认为X与Y有关,则的值必须( )
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.大于等于10.828 B.大于等于3.841
C.小于6.635 D.大于等于2.706
5.某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得回归直线方程为,则以下结论错误的是( )
A.变量y与x呈负相关 B.回归直线经过点
C. D.该产品价格为35元/kg时,日需求量大约为3.4kg
6.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下列联表,并计算得到,下列小波对A地区天气的判断不正确的是( )
单位:天
日落云里走 夜晚天气
下雨 未下雨
出现 25 5
未出现 25 45
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.依据的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.依据的独立性检验,若出现“日落云里走”,则认为夜晚一定会下雨
7.某种细胞的存活率y(%)与存放温度x(℃)之间具有线性相关关系,其样本数据如下表所示:
存放温度x/℃ 20 15 10 5 0 5 10
存活率y/% 6 14 26 33 43 60 63
计算得,,,,并求得经验回归方程为,但实验人员发现表中数据的对应值60录入有误,更正为.则更正后的经验回归方程为( )
A. B. C. D.
8.某工科院校对A,B两个专业的男、女生人数进行调查统计,得到以下表格:
专业A 专业B 合计
女生 12
男生 46 84
合计 50 100
若认为工科院校中“性别”与“专业”有关,则犯错误的概率不会超过( )
A.0.005 B.0.01 C.0.025 D.0.05
多项选择题(本大题共4小题,每小题5分,共20分.全部选对的得5分,部分选对的得3分,有选错的得0分)
9.下列说法正确的是( )
A.市教委为了解附中高中生对参加某项社会实践活动的意向,拟采用分层抽样的方法从我校三个年级的学生中抽取一个容量为60的样本,已知我校高一、高二,高三年级学生之比为6∶5∶4,则应从高三年级中抽取20名学生
B.方差描述了一组数据围绕平均数波动的大小,方差越大,数据的离散程度越大,方差越小,数据的离散程度越小
C.命题“,”的否定是“,”
D.线性回归方程对应的直线至少经过其样本数据点中的一个点
10.在检验A与B是否有关的过程中,根据所得数据算得的值,则下列说法不正确的是( )
A.若,则认为A与B独立,该推断犯错误的概率不超过0.001
B.若,则认为A与B独立,该推断犯错误的概率不超过0.005
C.若,则认为A与B不独立,该推断犯错误的概率不超过0.001
D.若,则认为A与B不独立,该推断犯错误的概率不超过0.005
11.某地建立了农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:
年份 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5
年借阅量y/万册 4.9 5.1 5.5 5.7 5.8
根据上表,可得y关于x的线性回归方程为,则( )A.
B.估计近5年借阅量以0.24万册/年的速度增长
C.y与x的样本相关系数
D.2021年的借阅量一定不少于6.12万册
12.以下说法正确的是( )
A.直线与直线平行的充要条件是
B.样本相关系数r可以反映两个随机变量的线性相关程度,r的值越大表明两个变量的线性相关程度越强
C.从独立性检验可知,在犯错误的概率不超过5%的情况下,有把握认为吃地沟油与患胃肠癌有关系时,是指有少于5%的可能性使得推断吃地沟油与患胃肠癌有关系出现错误
D.已知一系列样本点的经验回归方程为,若样本点与的残差相同,则有
填空题(本大题共4小题,每小题5分,共20分)
13.某工厂的某种型号的机器的使用年限和所支出的维修费用(万元)有下表的统计资料:
2 3 4 5 6
2.2 3.8 5.5 6.5 7.0
根据上表可得回归直线方程,则=_____.
14.某机构调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元)的情况,调查显示年教育支出y与年收入x具有线性相关关系,并由调查数据得到y关于x的经验回归方程为.由经验回归方程可知,家庭年收入每增加1万元,年教育支出约增加______万元.
15.以模型去拟合一组数据时,设,将其变换后得到线性回归方程,则______.
16.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
,.
四、解答题(本大题共6小题,共70分)
17.为了解高中生作文水平与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到如下调查结果:
作文水平较高 作文水平一般 合计
课外阅读量较大 22 10 32
课外阅读量一般 8 20 28
合计 30 30 60
根据上表,有多大的把握认为课外阅读量与作文水平之间有关系?
18.芯片作为在集成电路上的载体,广泛应用在手机、军工、航天等多个领域,是能够影响一个国家现代工业的重要因素.根据市场调研与统计,某公司七年时间里在芯片技术上的研发投入x(亿元)与收益y(亿元)的数据统计如下:
(1)根据折线图的数据,求y关于x的线性回归方程(系数精确到整数部分);
(2)为鼓励科技创新,当研发技术投入不少于16亿元时,国家给予公司补贴5亿元,预测当芯片的研发投入为17亿元时公司的实际收益.
附:其回归方程的斜率和截距的最小二乘法估计分别为,.参考数据,.
19.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2的列联表;
(2)依据的独立性检验,能否认为休闲方式与性别有关?
20.十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产,在试产初期,生产一件该款芯片有三道工序,每道工序的生产互不影响,这三道工序的次品率分别为,,.
(1)①求生产一件该芯片的次品率.
②试产100件该芯片,估计次品件数的期望.
(2)某手机生产厂商将该款芯片投入到某新款手机上使用,并对部分芯片做了技术改良,推出了两种型号的手机,甲型号手机采用没有改良的芯片,乙型号手机采用改良了的芯片,现对使用这两种型号的手机用户进行回访,就他们对开机速度进行满意度调查.据统计,回访的100名用户中,使用甲型号手机的有30人,其中对开机速度满意的有15人;使用乙型号手机的有70人,其中对开机速度满意的有55人.完成下列列联表,并判断是否有99.%的把握认为该项技术改良与用户对开机速度的满意度有关.
甲型号 乙型号 合计
满意
不满意
合计
附:,.
0.050 0.010 0.005 0.001
3.841 6.635 7.879 10.828
21.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄x 2 3 4 5 6
患病人数y 22 22 17 14 10
(1)求y关于x的经验回归方程;
(2)计算变量x,y的样本相关系数r(计算结果精确到0.01),并判断是否可以认为该幼儿园去年春季患流感人数与年龄负相关程度很强.(若,则x,y相关程度很强;若,则x,y相关程度一般;若,则x,y相关程度较弱.)
参考数据:.
22.数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列每个粗线宫(3×3)内的数字均含1~9,不重复.数独爱好者小明打算报名参加第六届“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到下表的数据:
x/天 1 2 3 4 5 6 7
y/秒 990 990 450 320 300 240 210
现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒;
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若不存在平局,求小明最终赢得比赛的概率.
参考数据:,,,其中.
第八章《成对数据的统计分析》同步单元高分突破必刷卷(基础版)
全解全析
1.A
【详解】依题意,图1和图3是正相关,相关系数、大于0,图2和图4是负相关,相关系数、小于0,
图1和图2中的点相对于图3和图4更加集中,则有相关性要更强些,相关系数的绝对值要大一些,
所以.
故选:A
2.B
【详解】由题中数据,知.
故选:B.
3.C
【详解】由题表数据可得:,,
则,解得:.
故选:C.
4.B
【详解】查表可知,若依据的独立性检验,认为X与Y有关,则.
故选:B.
5.D
【详解】,
故即,故ABC都正确.
此时,令,则,
故D错误.
故选:D
6.D
【详解】A: 根据列联表可知,100天中有50天下雨,50天未下雨,因此夜晩下雨的概率约为,A正确;
B:未出现“日落云里走”,夜晩下雨的概率约为,B正确;
C:,因此依据的独立性检验,认为“日落云里走”是否出现与夜晩天气有关,C正确;
D:有关只是说可能性,不代表一定下雨,D错误.
故选:D
7.A
【详解】依题意,设更正后的经验回归方程为,更正后,,
,, ,
,所以更正后的经验回归方程为.
故选:A
8.D
【详解】根据题意,填写列联表如下:
专业A 专业B 合计
女生 12 4 16
男生 38 46 84
合计 50 50 100
则.又,所以认为工科院校中“性别”与“专业”有关,犯错误的概率不会超过0.05,
故选:D.
9.BC
【详解】A. 应从高三年级中抽取名学生,所以该选项错误;
B. 方差描述了一组数据围绕平均数波动的大小,方差越大,数据的离散程度越大,方差越小,数据的离散程度越小,所以该选项正确;
C. 命题“,”的否定是“,,所以该选项正确;
D. 线性回归方程对应的直线有可能不经过其样本数据点中的任意一个点,所以该选项错误.
故选:BC
10.ABC
【详解】当时,我们认为A与B不独立,该推断犯错误的概率不超过0.005,只有D说法正确.
故选:ABC.
11.ABC
【详解】,,代入,可得,所以A正确;因为,所以估计每年借阅量的增长量为0.24万册,所以B正确;因为,所以y与x正相关,,所以C正确;把代入得,而6.12万册是预测值,不是精确值,所以D错误.
故选:ABC.
12.AC
【详解】对于A:对于直线与直线:
若m=1,则与平行.故充分性满足;
若直线与直线平行,则,解得:m=1.故必要性满足.
所以“直线与直线平行的充要条件是”成立.故A正确;
对于B:样本相关系数r的统计学意义:|r|越大,表明两个变量的线性相关程度越强.故B错误;
对于C:由独立性检验的过程及意义可知,说法正确.故C正确;
对于D:由残差的计算可得:,解得:.故D错误.
故选:AC
13.0.08
【详解】由表格可得,
,
由于回归直线过点,故,解得,
故答案为:0.08.
14.0.15
【详解】∵回归直线的斜率为0.15,∴家庭收入每增加1万元,年教育支出约增加0.15万元.
故答案为:0.15.
15.
【详解】由,得,,所以.
故答案为:.
16.30
【详解】设男生人数为,依题意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生
女生
总计
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则,
由,解得,
由题知应为6的整数倍,
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则男生至少有30人,
故答案为:30.
17.有的把握认为课外阅读量与作文水平之间有关
【详解】,
所以有的把握认为课外阅读量与作文水平之间有关.
18.【详解】(1)由折线图中数据知,,
,
因为,
所以
所以y关于x的线性回归方程为
(2)当时,亿元,
此时公司的实际收益的预测值为亿元.
19.【详解】(1)2×2列联表如下:
单位:人
性别 休闲方式 合计
看电视 运动
女性 43 27 70
男性 21 33 54
合计 64 60 124
(2)零假设为H0:休闲方式与性别无关.
,
依据小概率值的独立性检验,我们推断H0不成立,即认为休闲方式与性别有关.
20.【详解】(1)①因为生产一件芯片为次品的对立事件为“芯片在三道工序中都为合格品”,
所以.
②生产的100件该款芯片中次品的件数,则,
所以,所以估计试产的100件该芯片中次品有15件.
(2)列联表如下:
甲型号 乙型号 合计
满意 15 55 70
不满意 15 15 30
合计 30 70 100
因为,
所以有99.5%的把握认为该项技术改良与用户对开机速度满意度有关.
21.【详解】(1)设y关于x的经验回归方程为,由题意得,.由公式求得,,
∴.
(2)
∵,∴x,y负相关.
又,∴可以认为该幼儿园去年患流感人数与年龄负相关程度很强.
22.【详解】(1)由题意得,,
令,设y关于t的经验回归方程为,
则,
∴.∴,又,
∴y关于x的回归方程为,故当时,.
∴小明经过100天训练后,每天解题的平均速度y约为140秒.
(2)设比赛再继续进行X局小明最终贏得比赛,则最后一局一定是小明获胜,
由题意知,最少再进行2局,最多再进行4局就有胜负,即,3,4,
当时,小明4:1胜,∴,
当时,小明4:2胜,∴,
当时,小明4:3胜,∴.
∴小明最终赢得比赛的概率为.