中小学教育资源及组卷应用平台
8.1 成对数据的统计相关性 同步巩固练
2024-2025学年数学人教A版(2019) 选择性必修第三册
一、单选题
1.下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
2.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高
C.儿童的年龄与体重 D.物体的体积和质量
3.对于散点图下列说法正确一个是( )
A.一定可以看出变量之间的变化规律 B.一定不可以看出变量之间的变化规律
C.可以看出正相关与负相关有明显区别 D.看不出正相关与负相关有什么区别
4.有五组变量:①汽车的重量和汽车每消耗升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
5.某商场五天内某种恤衫的销售情况如下表:
第天
销售量y(件)
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
6.对于变量,有以下四个散点图,由这四个散点图可以判断变量与成负相关的是( )
A. B.
C. D.
7.对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
8.对于样本相关系数,下列说法错误的是( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数
D.样本相关系数越大,成对样本数据的线性相关程度也越强
9.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.记为变量X与Y之间的相关系数.为变量U与V之间的相关系数,则( )
A. B. C. D.
10.在一次试验中,测得的四组值分别为,则与的相关系数为( )
A. B. C.0 D.
二、填空题
11.对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为 .
12.已知某个样本点中的变量x、y线性相关,相关系数,则在以为坐标原点的坐标系下的散点图中,大多数的点都落在第 象限.
13.甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 研究的两个随机变量的线性相关程度最高.
14.已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .(计算结果精确到0.01)
6 8 10 12
6 5 3 2
15.学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数 (结果保留两位小数).
三、解答题
16.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
已知,,,,.
(1)求,;
(2)计算y与x的相关系数,并判断该设备的使用年限与所支出的维修费用的相关程度.
17.某网站统计了某网红螺蛳粉在2020年7月至11月的总销售量y(单位:万),得到以下数据:
月份x 7 8 9 10 11
销售量y 10 12 11 12 20
根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?
(参考公式:相关系数.参考数据:)
18.为调查野生动物保护地某种野生动物的数量,将保护地分成面积相近的300个地块,并设计两种抽样方案.
方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区,依据抽样数据计算得到相应的相关系数;
方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据,其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求方案二抽取的样本的相关系数r(精确到0.01),并判定哪种抽样方法更能准确地估计这种野生动物的数量.
附:若相关系数则相关性很强,的值越大相关性越强.
19.党的二十大以来,国家不断加大对科技创新的支持力度,极大鼓舞了企业持续投入研发的信心.某科技企业在国家一系列优惠政策的大力扶持下,通过不断的研发和技术革新,提升了企业收益水平.下表是对2023 年1 ~5月份该企业的利润y(单位:百万)的统计.
月份 1 月 2 月 3 月 4 月 5 月
月份编号x 1 2 3 4 5
利润y(百万) 7 12 13 19 24
(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);
(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.
附:相关系数
参考答案
题号 1 2 3 4 5 6 7 8 9 10
答案 D C C C B B B D B B
1.D
根据相关关系的定义、函数的定义即可判断
A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D
2.C
根据相关关系和函数关系的概念即可判断
A、D是函数关系;B是不相关关系;C是相关关系,
故选:C
3.C
根据散点图与两个变量的关系求解.
给出一组样本数据,总可以作出相应的散点图,
但不一定能分析出两个变量的关系,不一定存在回归直线来模拟数据,
但是通过散点图可以看出正相关与负相关有明显区别.
故选:C
本题主要考查变量间的相关关系,还考查了理解辨析的能力,属于基础题.
4.C
根据变量的相关关系的概念判断即可.
由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系.
故选:C
5.B
作出散点图,可得出结论.
根据表格中的数据作出散点图如图,
可知所有点都在一条直线附近波动,是线性相关的,且值随着值的增大而增大,即与正相关,
故选:B.
6.B
根据各图中点的分布,分析变量的相关关系即可.
A:各点分布没有明显相关性,不符;
B:各点分布在一条直线附近,且有负相关性,符合;
C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;
D:各点分布在一条直线附近,且有正相关性,不符.
故选:B
7.B
根据散点图直接判断可得出结论.
由散点图可知,变量与负相关,变量与正相关,所以,与负相关.
故选:B.
8.D
利用相关系数与成对样本数据间的相关关系逐项判断,可得出合适的选项.
对于A选项,样本相关系数可以用来判断成对样本数据相关的正负性,A对;
对于B选项,样本相关系数可以是正的,也可以是负的,B对;
对于C选项,样本相关系数,C对;
对于D选项,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,D错.
故选:D.
9.B
根据题意可得数据间的正负关系,从而进行判断即可.
由变量X与Y的对应数据可得变量X与Y之间呈正相关,因此;由变量U与V的对应数据可得变量U与V之间呈负相关,因此.故.
故选:B
10.B
经计算可知四个点都在一条单调递减的直线上,即可得相关系数.
因为过点的直线的斜率为,
所以过点的直线的方程为:即,
经检验点,都在直线,
所以与是函数关系,
又因为单调递减,所以与的相关系数为,
故选:B.
11.
根据散点图直接求解即可.
由散点图可知,
所以.
故答案为:.
12.二、四
利用相关系数公式,结合已知有大多数点与异号,即可得答案.
由,则,
所以,大多数点与异号,又为坐标原点,
故大多数的点都落在第二、四象限.
故答案为:二、四
13.乙
根据相关系数的定义判断即可.
因为,所以这四人中,乙研究的两个随机变量的线性相关程度最高,
故答案为:乙.
14.
根据相关系数公式求解即可.
根据表中数据计算可知
,
,
变量之间的相关系数,
故答案为: .
15.0.99
根据题意,由相关系数的计算公式代入计算,即可得到结果.
由题意
.
故答案为:.
16.(1),
(2),该设备的使用年限与所支出的维修费用之间具有很高的相关性
(1)根据平均数的计算公式即可求得答案;
(2)根据相关系数公式,即可求得相关系数,和1比较,可得出相关性的判断结果.
(1),.
(2),,
,
所以,
接近于1,说明该设备的使用年限与所支出的维修费用之间具有很高的相关性.
17.可用线性回归模型拟合y与x的关系.
计算相关系数得出y与x的线性相关关系强弱并得出结果.
由已知得:,,,,
∴.
因为,说明y与x的线性相关关系很强,可用线性回归模型拟合y与x的关系.
18.(1)
(2)相关系数,方案二的分层抽样方法更能准确地估计
(1)首先求出样区野生动物平均数,然后利用所求平均数乘以该地区的地块数即可求解;(2)根据所给数据以及相关系数公式即可求,然后与方案一的相关系数比较,并结合相关系数的意义即可求解.
(1)由题意可得,样区野生动物平均数为,
又因为该地区的地块数为300,
所以该地区这种野生动物的估计值为.
(2)由题中数据可得, 样本的相关系数为
.
因为方案一的相关系数为,明显小于方案二的相关系数,
所以方案二的分层抽样方法更能准确地估计.
19.(1);具有很强的线性相关性
(2)分布列见解析;
(1)根据公式求出相关系数的值,即可判断;
(2)根据题意可知可取的为,然后计算列出分布列,求出期望即可求解.
(1)由统计表数据可得:
所以
所以相关系数 ,
因此,两个变量具有很强的线性相关性.
(2)由题意知,的可能取值为
因为 ,
,
所以 的分布列为:
所以
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)