第八章成对数据的统计分析章节练习卷2-2023-2024学年高二数学-(人教A版2019选择性必必修三)
注意事项:
1.答题前填写好自己的姓名、班级、考号等信息
2.请将答案正确填写在答题卡上
第I卷(选择题)
请点击修改第I卷的文字说明
一、单选题
1.如下表提供的和是两组具有线性相关关系的数据,已知其回归方程为,等于( )
A. B. C. D.
2.为研究某咖啡店每日的热咖啡销售量和气温之间是否具有线性相关关系,统计该店2017年每周六的销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示销售量),由散点图可知与的相关关系为( )
A.正相关,相关系数的值为
B.负相关,相关系数的值为
C.负相关,相关系数的值为
D.正相关,相关负数的值为
3.通过随机询问110名不同的大学生是否爱好某项运动,得到了如下的列联表:
男 女 合计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
附表:
0.05 0.010 0.001
3.841 6.635 10.828
参照附表,能得到的正确结论是( ).
A.有以上的把握认为“爱好该项运动与性别有关”
B.有以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
4.某中学采取分层抽样的方法从高二学生中按照性别抽出名学生,其选报文科、理科的情况如下表所示,
男 女
文科
理科
则以下判断正确的是( )
参考公式及参考数据如下:
A.至少有的把握认为学生选报文理科与性别有关
B.至多有的把握认为学生选报文理科与性别有关
C.至少有的把握认为学生选报文理科与性别有关
D.至多有的把握认为学生选报文理科与性别有关
5.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的大学生是否爱好某项运动,利用列联表,由计算可得.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
参照附表,得到的正确结论是( )
A.有以上的把握认为“爱好该项运动与性别无关”
B.有以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
6.下列命题:
①若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变;
②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③设随机变量服从正态分布,若,则;
④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握越大.其中正确的命题序号是( )
A.①② B.①②③ C.①③④ D.②③④
7.2018年6月14日,世界杯足球赛在俄罗斯拉开帷幕.通过随机调查某小区100名性别不同的居民是否观看世界杯比赛,得到以下列联表:
观看世界杯 不观看世界杯 总计
男 40 20 60
女 15 25 40
总计 55 45 100
经计算的观测值.
附表:
0.05 0.025 0.010 0.005 0.001
3.841 5.024 6.635 7.879 10.828
参照附表,所得结论正确的是( )
A.有以上的把握认为“该小区居民是否观看世界杯与性别有关”
B.有以上的把握认为“该小区居民是否观看世界杯与性别无关”
C.在犯错误的概率不超过0.005的前提下,认为“该小区居民是否观看世界杯与性别有关”
D.在犯错误的概率不超过0.001的前提下,认为“该小区居民是否观看世界杯与性别无关”
8.在研究变量与之间的关系时,进行实验后得到了一组样本数据,,利用此样本数据求得的经验回归方程为,现发现数据和误差较大,剔除这两对数据后,求得的经验回归方程为,且则( )
A.8 B.12 C.16 D.20
二、多选题
9.某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分 1 2 3 4 5
用时小时) 9.5 8.8 7.8 7 6.1
由上表数据得到的错误结论是( )
参考数据:,
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
10.某手机商城统计了5个月的5G手机销量,如下表所示:
月 份 2021.7 2021.8 2021.9 2021.10 2021.11
月份编号
销量部
若与线性相关,由上表数据求得线性回归方程为,则下列说法正确的是( )
A.手机的销量逐月增加,平均每个月增加约台 B.
C.与正相关 D.预计2022年1月份该5G手机销量约为部
11.下列说法正确的是( )
A.甲袋中有5个红球,2个白球和3个黑球,乙袋中有4个红球,3个白球和3个黑球.先从甲袋中随机取出1个球放入乙袋,再从乙袋中随机取出1个球.设事件A表示由从甲袋中取出的球是红球,事件B表示从乙袋中取出的球是红球,则事件A与事件B相互独立
B.某班有50名学生,一次数学考试的成绩服从正态分布,已知,则该班学生此次数学考试的成绩在115分以上的有3人
C.已知事件A与B相互独立,当时,若,则
D.指数曲线两边同时取自然对数进行线性变换后得到的经验回归方程为,则函数的最小值为
三、填空题
12.有以下几组的统计数据:,,,,,要使剩下的数据具有较强的相关关系,应去掉的一组数据是 .
13.某单位为了了解用电量(度)与气温()之间的关系,随机统计了某4天的用电量与当天气温.由下表中数据得回归直线方程中,据此预测当气温为时,用电量的度数约为 .
气温() 14 12 8 6
用电量(度) 22 26 34 38
14.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为 .
(精确到0.01,参考公式和数据:,,,)
第II卷(非选择题)
请点击修改第II卷的文字说明
四、解答题
15.为推动实施健康中国战略,树立国家大卫生、大健康观念,手机APP也推出了多款健康运动软件,如“微信运动”,某运动品牌公司280名员工均在微信好友群中参与了“微信运动”,且公司每月进行一次评比,对该月内每日运动都达到10000步及以上的员工授予该月“运动达人”称号,其余员工均称为“参与者”.为了进一步了解员工们的运动情况,选取了员工们在3月份的运动数据进行分析,统计结果如下:
运动达人 参与者 合计
男员工 120 160
女员工 40
合计 280
(1)请补充完列联表;
(2)根据列联表判断是否有90%的把握认为获得“运动达人”称号与性别有关?
参考公式:,其中.
临界值表:
0.15 0.10 0.05 0.01
2.072 2.706 3.841 6.635
16.2022年是中国共产主义青年团成立100周年,某校组织了团史知识测试,测试成绩分为优秀与非优秀两个等级.随机抽查了高一年级 高二年级各100名学生的测试成绩,统计如下表:
高一年级成绩
优秀 非优秀
女生人数 36 14
男生人数 32 18
高二年级成绩
优秀 非优秀
女生人数 44 6
男生人数 38 12
(1)根据给出的数据,完成下面的列联表:
优秀 非优秀 合计
女生
男生
合计
(2)根据(1)中列联表,判断能否有的把握认为男 女生测试成绩的等级有差异?
附,其中.
17.为了解华人社区对接种新冠疫苗的态度,美中亚裔健康协会日前通过社交媒体,进行了小规模的社区调查,结果显示,多达的华人受访者最担心接种疫苗后会有副作用.其实任何一种疫苗都有一定的副作用,接种新型冠状病毒疫苗后也是有一定副作用的,这跟个人的体质有关系,有的人会出现副作用,而有的人不会出现副作用.在接种新冠疫苗的副作用中,有发热、疲乏、头痛等表现.为了了解接种某种疫苗后是否会出现疲乏症状的副作用,某组织随机抽取了某地200人进行调查,得到统计数据如下:
无疲乏症状 有疲乏症状 总计
未接种疫苗 100 20 120
接种疫苗
总计 160 200
(1)求列联表中的数据,,,的值,并确定能否有的把握认为有疲乏症状与接种此种疫苗有关.
(2)从接种疫苗的人中按是否有疲乏症状,采用分层抽样的方法抽出8人,再从8人中随机抽取3人做进一步调查.若初始总分为10分,抽到的3人中,每有一人有疲乏症状减1分,每有一人没有疲乏症状加2分,设得分结果总和为,求的分布列和数学期望.
0.150 0.100 0.050 0.025 0.010
2.072 2.706 3.841 5.024 6.635
18. 2020年某中学的一次数学考试,试卷满分为100分,得60分成绩为及格,为了调查正确学习习惯教育培养对本次考试前两个月复习效果的影响,特对复习中参加正确学习习惯教育培养和未参加正确学习习惯教育培养的考生进行了考试成绩的统计如下表:
分数段
参加正确学习习惯教育培养考生人数 23 47 30 21 14 31 14
未参加正确学习习惯教育培养考生人数 17 51 67 15 30 17 3
(1)根据上述表格完成列联表:
及格人数 不及格人数 总计
参加正确学习习惯教育培养
未参加正确学习习惯教育培养
总计
(2)根据列联表中的数据,通过计算分析,能否有的把握认为考生成绩及格与参加正确学习习惯教育培养有关系?
注:.
附表:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
19.近年来,随着互联网的发展,网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为了解网约车在某省的发展情况,调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数,,数据如下表所示:
城市1 城市2 城市3 城市4 城市5
A指标数x 3 5 6 7 9
B指标数y 5 6 7 8 9
(1)由表中数据可知,y与x具有较强的线性相关关系,请利用相关系数r加以说明;
(2)建立y关于x的线性回归方程,并预测当A指标数为8时,B指标数的估计值.
附:相关系数
线性回归方程y=bx+a中,,.
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.D
【分析】计算出样本中心点的坐标,代入回归直线方程可求得的值.
【详解】由表格中的数据可得,,
由于回归直线过样本的中心点,则,解得.
故选:D.
【点睛】本题考查利用回归直线过样本的中心点求参数,考查计算能力,属于基础题.
2.C
【分析】根据正负相关的概念判断.
【详解】由散点图知随着的增大而减小,因此是负相关.相关系数为负.
故选:C.
【点睛】本题考查变量的相关关系,考查正相关和负相关的区别.掌握正负相关的定义是解题基础.
3.A
【分析】根据列联表数据计算观测值,结合附表即可得到结论.
【详解】由题意知本题所给的观测值,,
所以有以上的把握认为“爱好该项运动与性别有关”,
即在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”.
故选:A.
4.C
【分析】根据所给的数据,代入求观测值的公式,得到观测值,把观测值同临界值进行比较得到结论.
【详解】计算 ,但,所以至少有的把握认为学生选报文理科与性别有关,
故选:C.
5.B
【分析】根据,再对照表格中的数据,即可判断
【详解】由于
对照表中数据得出有0.005的几率说明这两个变量之间的关系是不可信的,
即有1 0.005=99.5%的把握说明两个变量之间有关系
故选:B
6.B
【分析】由方差的定义和性质可判断①;由残差点分布区域特点可判断②;由正态分布的特点可判断③;由随机变量的观测值的大小可判断④.
【详解】解:①若将一组样本数据中的每个数据都加上同一个常数后,由方差的计算公式可得样本的方差不变,故正确;
②在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,故正确;
③设随机变量服从正态分布,若,则,,故正确;
④对分类变量与的随机变量的观测值来说,越大,判断“与有关系”的把握越大,故错误.
故选:B.
【点睛】本题考查随机变量的关系和数字特征、模型的拟合度和正态分布特点,考查判断能力和运算能力,属于基础题.
7.C
【分析】分析:根据题目的条件中已经给出这组数据的观测值,把所给的观测值同节选的观测值表进行比较,发现它大于7.879,在犯错误的概率不超过0.005的前提下,认为“该小区居民是否观看世界杯与性别有关”.
详解:由题意算得, ,参照附表,可得
在犯错误的概率不超过0.005的前提下,认为“该小区居民是否观看世界杯与性别有关”.
故选C.
点睛:本题考查独立性检验的应用,属基础题.
8.C
【分析】由回归方程的性质求出即可.
【详解】设未剔除这两对数据前的的平均数分别为,剔除这两对数据前的的平均数分别为,
因为所以,
则,
又这两对数据为,
所以,
所以,
所以
故选:C.
【点睛】关键点点睛:本题关键在于找到剔除前后的平均数.
9.ABD
【分析】利用公式求出相关系数值,根据相关系数的正负值判断与正负相关性;利用相关系数值判断相关程度强与弱.
【详解】由题意,
,
,,
且
因为相关系数.
即相关系数近似为,且相关程度强,
并且与负相关,从而可用线性回归模型拟合与的关系.
所以选项ABD错误,C正确.
故选:ABD.
10.BCD
【分析】对于A,由线性回归方程判断,对于B,由于样本中心满足回归方程,所以求出代入回方程中可求出,对于C,根据线性回归方程判断,对于D,将代入回归方程求解判断.
【详解】对于A,由于与的线性回归方程为,所以可知手机的销量逐月增加,平均每个月增加约44台,所以A错误,
对于B,因为,,
所以,解得,所以B正确,
对于C,因为与的线性回归方程中的,所以与正相关,所以C正确,
对于D,当时,,所以预计2022年1月份该5G手机销量约为部,所以D正确,
故选:BCD
11.BCD
【分析】A.根据是否等于,判断A;
B.根据正态分布的对称性,求,再求人数;
C.由条件可知,即可求解;
D.将指数曲线,两边取对数,得到回归直线方程,可得,,求得后,再根据基本不等式求最小值.
【详解】对于A,因为,,,,所以事件A与事件B不相互独立,故A错误.
对于B,因为数学考试的成绩服从正态分布,所以正态曲线关于直线对称,
因为,所以,
所以该班学生此次数学考试的成绩在115分以上的有(人),故B正确.
对于C,因为事件A与B相互独立,且,
则,即,由对立事件的概率公式得,故C正确.
对于D,将两边同时取对数,得,由于指数曲线进行线性变换后得到的经验回归方程为,则,,,即,则,当且仅当时,等号成立,故D正确.
故选:BCD.
12.
【分析】在散点图中画出五个点,结合图象即可得出结论.
【详解】在散点图中画出这五个点,如图所示:
由散点图知,除去点之外,其余的点都在一条线附近,
所以去掉这个点以后剩下的数据更具有相关关系.
故答案为:.
13.40
【分析】先求解,代入方程求得,然后可得气温为时用电量的度数.
【详解】
所以,所以当时,.
【点睛】本题主要考查回归直线方程的求解,回归直线一定经过点,根据条件求出,结合所给条件可以确定回归直线方程,然后根据所给值,可以求出预测值.
14.0.99
【分析】分别求出,,,再利用参考公式和数据计算即可.
【详解】由题意,知,
,
.
所以.
所以y与x的相关系数近似为0.99.
故答案为:0.99.
15.(1)表格见解析
(2)没有90%的把握认为获得“运动达人”称号与性别有关
【分析】(1)根据题干所给数据完善列联表;
(2)计算出卡方,即可判断;
【详解】(1)解:依题意可得列联表如下:
运动达人 参与者 合计
男员工 120 40 160
女员工 80 40 120
合计 200 80 280
(2)解:由列联表可得,
所以没有的把握认为获得“运动达人”称号与性别有关.
16.(1)列联表见解析
(2)没有的把握认为男 女生测试成绩的等级有差异
【分析】(1)根据高一二的表格人数,逐项相加分析即可;
(2)求出卡方再对比表格判断即可
【详解】(1)由表格可知,高一年级 高二年级总共优秀女生人数为,优秀男生人数为,非优秀女生人数为,非优秀男生人数为,故
优秀 非优秀 合计
女生 80 20 100
男生 70 30 100
合计 150 50 200
(2)由(1)可得,故没有的把握认为男 女生测试成绩的等级有差异
17.(1)60,20,40,80,有;(2)分布列见解析,.
【分析】(1)根据所给数据补全未知量,再代入公式,根据所得结果比对数据表,即可得解;
(2)求出得分结果总和的所有可能,然后求出对应的概率,利用期望公式直接求解即可.
【详解】(1)由题意得:,,
,,
因为.
所以有的把握认为有疲乏症状与接种此种疫苗有关.
(2)从接种疫苗的人中按是否有疲乏症状,采用分层抽样的方法抽出8人,可知8人中无疲乏症状的有6人,有疲乏症状的有2人,再从8人中随机抽取3人,当这3人中恰有2人有疲乏症状时,;当这3人中恰有1人有疲乏症状时,;当这3人中没有人有疲乏症状时,.
因为;;.
所以的分布列如下:
10 13 16
期望.
18.(1)表格见解析;(2)有.
【分析】(1)由统计表提供的数据计算可得列联表;
(2)计算可得结论.
【详解】解:(1)根据题表中数据可以得到列联表如下:
及格人数 不及格人数 总计
参加正确学习习惯教育培养 80 100 180
未参加正确学习习惯教育培养 65 135 200
总计 145 235 380
(2)的观测值.
参考附表知,,所以有的把握认为考生成绩及格与参加正确学习习惯培养有关系.
19.(1)0.99,与具有较强的线性相关关系
(2),估计值为
【分析】(1)直接利用公式计算得到,得到答案.
(2)计算得到回归方程为,代入数据计算得到答案.
【详解】(1),,
,
=,
=,
相关系数,
因为,所以与具有较强的线性相关关系,可用线性回归模型拟合与的关系.
(2)由可知,,,
所以与之间线性回归方程为,当时,.
当指标数为8时,指标数的估计值为.
答案第1页,共2页
答案第1页,共2页