第八章(8.1)成对数据的统计相关性 随堂练习
一、单选题
1.下列说法正确的是( )
A.y=2x+1中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
2.已知四组不同数据的两变量的线性相关系数如下:数据组①的相关系数;数据组②的相关系数;数据组③的相关系数;数据组④的相关系数.则下列说法正确的是( )
A.数据组①对应的数据点都在同一直线上
B.数据组②中的两变量线性相关性最强
C.数据组③中的两变量线性相关性最强
D.数据组④中的两变量线性相关性最弱
3.下列变量之间的关系是相关关系的是( )
A.正方体的表面积与体积
B.光照时间与果树的产量
C.匀速行驶车辆的行驶距离与时间
D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩
4.对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
5.下列有关回归分析的说法中不正确的是( )
A.回归直线必过点
B.回归直线就是散点图中经过样本数据点最多的那条直线
C.当相关系数时,两个变量正相关
D.如果两个变量的线性相关性越弱,则就越接近于
6.在一组样本数据不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
A. B.0 C.1 D.
7.已知变量x和变量y的一组随机观测数据.如果关于的经验回归方程是,那么当时,残差等于( )
A. B.0 C.10 D.110
8.观察变量x与y的散点图发现可以用指数型模型拟合其关系,为了求出回归方程,设,求得z关于x的线性回归方程为,则a与k的值分别为( )
A.3,2 B.2,3 C.,2 D.,3
二、填空题
9.以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
10.已知某个样本点中的变量x、y线性相关,相关系数,则在以为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
三、解答题
11.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到0.01);(附:相关系数, )
12.中国在第届联合国大会上承诺,将采取更加有力的政策和措施,力争于年之前使二氧化碳的排放达到峰值,努力争取年之前实现碳中和简称“双碳目标”,此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化新能源汽车电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量单位:万台关于年份的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区位购车车主的性别与购车种类情况,得到的数据如下表:
性别 购买非电动汽车 购买电动汽车 总计
男性
女性
总计
在购买电动汽车的车主中按照性别进行分层抽样抽取人,再从这人中随机抽取人,求人中至少有1位男性的概率.
参考数据:;
参考公式:线性回归方程:,其中;
相关系数:,若,则可判断与线性相关较强.
参考答案:
1.D
【分析】根据相关关系的定义、函数的定义即可判断
【详解】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D
2.B
【分析】根据线性相关系数的性质逐个判断即可
【详解】对A,数据组①的相关系数,故数据组①对应的数据点无线性关系,故A错误;
对BC,数据组②的相关系数为4组中绝对值的最大值,故数据组②中的两变量线性相关性最强,故B正确,C错误;
对D,数据组①的相关系数为4组中绝对值最小,故数据组①中的两变量线性相关性最弱,故D错误
故选:B
3.B
【分析】A与C是一种函数关系,D不具备相关关系,B满足相关关系.
【详解】对于A,正方体的体积确定,则表面积随之确定,是一种确定性关系,A错误;
对于B,光照时间越长,果树的产量相对越大,是一种线性相关关系,B正确;
对于C,行驶速度与时间是一种确定的函数关系,C错误;
对于D,足球比赛成绩与乒乓球比赛成绩没有关系,不具有相关关系,D错误.
故选:B
4.B
【分析】根据散点图直接判断可得出结论.
【详解】由散点图可知,变量与负相关,变量与正相关,所以,与负相关.
故选:B.
5.B
【分析】根据线性回归直线的性质可判断选项AB;根据相关系数的性质可判断CD,进而可得正确选项.
【详解】对于A选项,回归直线必过点,A对;
对于B选项,线性回归直线在散点图中可能不经过任一样本数据点,B错;
对于C选项,当相关系数时,两个变量正相关,C对;
对于D选项,如果两个变量的线性相关性越弱,则就越接近于,D对.
故选:B.
6.A
【分析】根据样本数据的所有样本点都在一条直线上,得出这组样本数据完全相关,再根据直线的斜率得出是正相关还是负相关即可.
【详解】这组样本数据的所有样本点都在直线上,
这组样本数据完全相关,
即说明这组数据的样本完全负相关,其相关系数是
故选:A.
7.C
【分析】将代入回归方程得到预测值,再根据残差公式计算可得;
【详解】解:因为关于的经验回归方程是,
所以时,此时残差为;
故选:C
8.D
【分析】根据题意得到求解.
【详解】解:因为,且z关于x的线性回归方程为,
所以,则,
故选:D
9.②
【分析】根据相关关系的知识确定正确答案.
【详解】①无相关关系;②负相关;③④正相关.
故答案为:②
10.二、四
【分析】利用相关系数公式,结合已知有大多数点与异号,即可得答案.
【详解】由,则,
所以,大多数点与异号,又为坐标原点,
故大多数的点都落在第二、四象限.
故答案为:二、四
11.(1)12000
(2)
【分析】(1)由已知数据求得20个样区野生动物数量的平均数,乘以200得答案;
(2)由已知直接利用相关系数公式求解.
【详解】(1)由已知得样本平均数,从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本的相关系数
12.(1)0.94,y与x线性相关较强
(2)
【分析】(1)利用相关系数的求解公式,并转化为和方差之间的关系,代入计算即可;
(2)根据抽样比及古典概型概率公式结合组合知识即得.
【详解】(1)相关系数为
,
故与线性相关较强;
(2)由题可知抽样比,男性车主选取2人,女性车主选取5人,这7人中随机抽取3人,
则3人中至少有1位男性的概率为.