8.1 成对数据的相关关系
教材课后习题
1.在以下4幅散点图中,推断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系?
2.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率/% 81.8 76.8 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5
顾客投诉/次 21 58 85 68 74 93 72 122 18 125
顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?
3.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号 1 2 3 4 5 6 7 8 9 10
1 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.8 3.0
3.08 3.76 4.31 5.02 5.51 6.25 6.74 7.40 8.54 9.24
两个变量的样本相关系数是否为1?请你解释其中的原因.
4.某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象,该地区有5个村庄,其中3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅较少,婴儿的出生率也较低,有人认为婴儿出生率和天鹅数之间存在相关关系,并得出一个结论:天鹅能够带来孩子.你同意这个结论吗?为什么?
定点变式训练
5.对于x,y两变量,有四组样本数据,分别算出它们的线性相关系数r(如下),则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
6.下列变量属于相关关系的是( )
A.利息与利率 B.居民收入与储蓄存款
C.电视机产量与苹果产量 D.某种商品的销售额与销售价格
7.由变量x,y观测数据,得散点图①;由变量u,v观测数据,得散点图②.根据这两个散点图可以判断( )
A.变量x与y正相关,变量u与v正相关
B.变量x与y正相关,变量u与v负相关
C.变量x与y负相关,变量u与v正相关
D.变量x与y负相关,变量u与v负相关
8.下列两个变量具有正相关关系的是( )
A.正方形面积与边长
B.吸烟与健康
C.数学成绩与物理成绩
D.汽车的质量与汽车每消耗汽油所行驶的平均路程
9.对四组数据进行统计后,获得了如下图所示的散点图,对于其相关系数的比较,下列说法正确的是( )
A. B.
C. D.
10.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减小,通常把它使用价值逐年减小的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如
下表所示:
使用年限x(单位:年) 2 4 5 6 8
失效费y(单位:万元) 3 4 5 6 7
由上表数据可知,y与x的相关系数为__________.
(附:,)
答案以及解析
1.答案:见解析
解析:图(1)中,y和x之间不存在相关关系;
图(2)中,y和x存在相关关系,呈现出线性相关关系,并且为正相关;
图(3)中,y和x存在相关关系,呈现出线性相关关系,并且为负相关;
图(4)中,y和x存在相关关系,呈现出非线性相关关系.
2.答案:顾客投诉次数与航班正点率之间呈现出线性相关关系,相关程度较强,且为负相关,顾客投诉次数与航班正点率的变化趋势相反
解析:设航班正点率为x,顾客投诉次数为y.
由数据可得,,
,,,
.
由此可以推断,顾客投诉次数与航班正点率之间呈现出线性相关关系,相关程度较强,且为负相关,顾客投诉次数与航班正点率的变化趋势相反.
3.答案:样本相关系数不一定为1,原因见解析
解析:两个变量的样本相关系数不一定为1.理由:在理想状态下,由于弹簧伸长的长度与所受外力成正比,即弹簧伸长的长度与所受外力满足线性函数关系,相关系数应该为1,但由于测量过程中,受弹簧材料、粗细等因素影响,抽取的样本具有随机性,故通过测量数据求得的样本相关系数不一定为1.
4.答案:“天鹅能够带来孩子”的结论不可靠,理由见解析
解析:从我们现在掌握的知识来看,没有发现能够说明“天鹅能够带来孩子”的依据,完全可能存在既能吸引天鹅又能使婴儿出生率高的第3个因素(如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.
要证实此结论是否可靠,可以通过试验来验证.相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的婴儿出生率是否相同.
说明:在探索研究的过程中,如果能够从两个变量的观察数据之间发现某种相关关系是极为有意义的,由此可以进一步研究二者之间是否存在因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导我们重视对统计结果的命理推测,并从中发现可以进一步研究的问题.
5.答案:D
解析:由相关系数越接近1,变量间的线性相关性越强知:各选项中的线性相关性最强.
6.答案:B
解析:如果当一个变量的取值一定时,另一个变量的取值带有一定的随机性,我们称这样的两个变量是相关关系,也就是说两个变量之间即不存在函数关系,又不是完全没有关系,选项A中的两个变量具有函数关系;选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;选项C中的电视机产量与苹果产量没有关系;选项D中某种商品的销售额与销售价格是函数关系.故选B.
7.答案:C
解析:变量x与y中,y随x增大而减小,为负相关;u与r中,u随v的增大而增大,为正相关.故选C.
8.答案:C
解析:正方形的面积与边长是函数关系,故A选项错误;
吸烟越多,越不健康,所以吸烟与健康具有负相关关系,故B选项错误;
汽车越重,每消耗汽油所行驶的平均路程越短,所以汽车的质量与汽车每消耗汽油所行驶的平均路程具有负相关关系,故D选项错误;
一般来说,数学成绩越好,那么物理成绩越好,所以数学成绩与物理成绩具有正相关关系,故C选项正确.
9.答案:C
解析:由题意可知,第一、四组数据正相关,第二、三组负相关,当相关系数的绝对值越大,数据的线性相关性越强,且第一组数据的线性相关性较第四组强,则,第二组数据的线性相关性较第三组强,则且,则.因此,.故选C.
10.答案:0.99
解析:由题表知,,,,,,所以,故答案为0.99.