《第一节 成对数据的统计相关性》同步练习
一、基础巩固
知识点1 变量的相关关系
1.[2022四川成都蓉城高中教育联盟高二下期中]下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系
B.学生的成绩与身高
C.儿童的年龄与体重
D.物体的体积与质量
2.(多选)下列散点图中,变量x,y具有线性相关关系的是( )
3.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率/% 12.6 10.4 18.5 3.0 8.1 16.3
A.利润率与人均销售额呈正相关关系
B.利润率与人均销售额呈负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
4.[2022西北农林科技大学附属中学高二下期中]如表中给出的5组数据(xi,yi)(i=1,2,…,5),从中选出4组使其线性相关程度最强,且保留第1组(-5,-3),那么应去掉第 组.
i 1 2 3 4 5
xi -5 -4 -3 -2 4
yi -3 -2 4 -1 6
知识点2 样本相关系数
5.(多选)[2022山东临沂高二下期末]对于样本相关系数,下列说法正确的是( )
A.样本相关系数可以用来判断成对样本数据相关关系的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数r∈[-1,1]
D.若变量x,y正相关,则变量x,y的线性相关程度较强
6.(多选)[2022广东潮州高二下期末]对四组数据进行统计,获得如图所示的散点图,则( )
A.r1C.r3>0 D.r4>0
7.(多选)为了对变量x与y的线性相关程度进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,则下面说法中错误的是( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关程度越强
D.若|r|越小,则变量x与y的线性相关程度越强
8.[2022广西四市高三质检]为落实动态清零政策下的常态化防疫,某学校开展了每周的核酸检测工作.学校开展核酸检测的第一周,周一至周五核酸检测用时记录如下:
第x天 1 2 3 4 5
用时y/h 1.2 1.2 1.1 1.0 1.0
(1)计算变量x与y的样本相关系数r(精确到0.01),并说明两变量线性相关程度的强弱;
(2)根据(1)中的计算结果,判定变量x与y是正相关,还是负相关,并给出可能的原因.
参考数据:≈3.16.
9.[2022山东滨州阳信县高二下期中]互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分.某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
日期 1日 2日 3日 4日 5日
外卖甲日接单量x/百单 5 2 9 8 11
外卖乙日接单量y/百单 2 3 10 5 15
(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;
(2)据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关程度的强弱进行判断.(若|r|>0.75,则可认为y与x有较强的线性相关关系)
参考数据:(xi-)(yi-)=66,
≈77.
二、能力提升
1.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
2.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数).
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01).
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
3.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
4.甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关
附:χ2=,
P(χ2≥x0) 0.100 0.050 0.010
x0 2.706 3.841 6.635
参考答案
一、基础巩固
1.C A,D是函数关系;B是不相关关系;C是相关关系.
2.AB 由变量线性相关的定义,知A,B中的散点落在一条直线附近,故其变量x,y具有线性相关关系;C,D中的散点没有落在一条直线附近,故其变量x,y不具有线性相关关系,故选AB.
3.A 画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额呈正相关关系.
4.3 根据表格数据,画出散点图如图.显然(-3,4)偏离程度最高,故应去掉第3组.
5.ABC 由样本相关系数的定义知A,B,C说法正确.对于D,当|r|越接近1时,变量x,y的线性相关程度越强,故D说法错误.故选ABC.
6.AC 由题图可知x1和y1,x4和y4都呈负相关关系,且x1和y1的相关程度比x4和y4的更强,所以r1<0,r4<0且r10,r3>0且r37.ABD 若所有样本点都在直线y=-2x+1上,则x与y是函数关系,且直线斜率为负数,所以r=-1,故A,B说法均错误;若|r|越大,则变量x与y的线性相关程度越强,故C说法正确,D说法错误.故选ABD.
8.(1)(1+2+3+4+5)=3,(1.2+1.2+1.1+1+1)=1.1,
所以(xi-)(yi-)=-2×0.1+(-1)×0.1+0+1×(-0.1)+2×(-0.1)=-0.6,
(xi-)2=4+1+0+1+4=10,(yi-)2=0.01+0.01+0+0.01+0.01=0.04,
所以变量x与y的样本相关系数r=≈-0.95,
所以两变量的线性相关程度较强.
(2)由r<0可知变量x与y负相关.
可能的原因:随着核酸检测工作的开展,学校相关管理协调工作效率提高,因此用时缩短.(原因不唯一,合理即可.)
9.(1)由题可知,=7. =7.
外卖甲的日接单量的方差==10,
外卖乙的日接单量的方差==23.6,
因为,,即外卖甲的平均日接单量与外卖乙的平均日接单量相同,但外卖甲的日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.
(2)样本相关系数r= ≈≈0.857>0.75,
所以可认为y与x有较强的线性相关关系.
二、能力提升
3.D 散点图中点的分布形状与对数函数的图象类似,故选D.
1.(1)由已知得样本平均数yi=60,
从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r=≈.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
2.(1)估计该林区这种树木平均一棵的根部横截面积=0.06,
估计该林区这种树木平均一棵的材积量=0.39.
(2)(xi-)(yi-)=xiyi-10=0.013 4,
-10()2=0.002,
-10()2=0.094 8,
所以≈0.01×1.377=0.013 77,
所以样本相关系数r=≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以,
所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.
4.(1)由题表可得A公司甲、乙两城之间的长途客车准点的概率为,
B公司甲、乙两城之间的长途客车准点的概率为.
(2)χ2=≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.