第八章 成对数据的统计分析
8.1 成对数据的统计相关性
8.1.2 样本相关系数
学案
一、学习目标
1.结合实例,了解样本相关系数的定义.
2.会通过相关系数比较变量的相关性.
2、 基础梳理
1.样本相关系数:对于变量x和变量y,设经过随机抽样获得的成对样本数据为,,…,,其中和的均值分别为和,则有,称r为变量x和变量y的样本相关系数.
2.样本相关系数与正、负相关的关系:样本相关系数r的正负性和绝对值的大小可以反映成对样本数据的变化特征:当时,称成对样本数据正相关;当时,称成对样本数据负相关.
3.样本相关系数与线性相关程度的关系:样本相关系数r的取值范围为. 当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.
三、巩固练习
1.对于样本相关系数r,下列说法中正确的是( )
A.r越大,线性相关程度越强
B.越小,线性相关程度越强
C.越大,线性相关程度越弱
D.,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱
2.如图1,2分别表示样本容量均为7的A、B两组成对数据的散点图,已知A组成对数据的样本相关系数为,B组成对数据的样本相关系数为,则与的大小关系为( )
A. B. C. D.无法判断
3.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). 为变量Y与X之间的样本相关系数,为变量U与V之间的样本相关系数,则( )
A. B. C. D.
4.某同学将收集到的六组数据制成如图所示的散点图,并通过计算得到其经验回归直线的方程为,其样本相关系数为,决定系数为.经过残差分析确定点F为“离群点”(对应残差过大的点),把它去掉后,再利用剩下的五组数据计算得到其经验回归直线的方程为,其样本相关系数为,决定系数为.以下结论中不正确的是( )
A. B. C. D.
5.对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定
B.线性相关系数可以是正的也可以是负的
C.在回归分析中,如果,说明与之间完全线性相关
D.样本相关系数可以是任意实数
6.(多选)下列说法中正确的有( )
A.在对分类变量X和Y进行独立性检验时,随机变量的值越大,则“X与Y有关”可信程度越小
B.在经验回归方程中,当解释变量x每增加一个单位时,响应变量y增加0.1个单位
C.两个变量的线性相关性越强,相关系数的绝对值越接近于1
D.在回归分析模型中,若决定系数越大,则残差平方和越小,模型的拟合效果越好
7. (多选)下面各图中,散点图与相关系数r符合的有( )
A. B.
C. D.
8. (多选)下列说法中正确的是( )
A.对于独立性检验,的值越大,说明两事件的相关程度越大
B.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3
C.在具有线性相关关系的两个变量的统计数据所得的回归直线方程中,,则
D.通过回归直线及回归系数,可以精确反映变量的取值和变化趋势
答案以及解析
1.答案:D
解析:对于选项A,越大,线性相关程度越强,A错误;
对于选项B,越小,线性相关程度越弱,B错误;
对于选项C,越大,线性相关程度越强,C错误;
对于选项D,,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱,D正确.
故选D.
2.答案:C
解析:由题图1可知,散点几乎在一条直线上,且成正相关,,由题图2可知,散点分散在一条直线附近,也成正相关, .A组成对数据的线性相关程度比B组强些,,故选C.
3.答案:B
解析:由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量Y与X之间成正相关,因此;
由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可得变量U与V之间成负相关,因此.故.
4.答案:B
解析:由题图可知两变量正线性相关,故,且,故,故A中结论正确,B中结论不正确.经计算可得,在去除点F前,,去除点F后,.又经验回归直线必经过点(3.5,2.5),所以,故C中结论正确.经验回归直线必经过点(3,2),所以,所以,故D中结论正确.故选B.
5.答案:D
解析:对于A,在回归分析中,变量间的关系非函数关系,所以因变量不能由自变量唯一确定,A中说法正确;对于B,,正相关,,负相关,B中说法正确;对于C,在回归分析中,如果,说明与之间完全线性相关,C中说法正确;对于D,相关系数的范围是,D中说法错误.故选D.
6.答案:CD
解析:由题意得,根据的值越大,分类变量的有关联的可信度就越大,所以A是错误的;根据经验回归方程中回归系数的含义,可知在经验回归方程中,当解释变量x每增加一个单位时,响应变量y平均增加0.1个单位,B是错误的;根据相关系数的计算公式可知,相关系数的绝对值越接近1,两个变量的相关性就越强,所以C是正确的;根据回归分析的基本思想可知决定系数越大,则残差平方和越小,模型的拟合效果越好,D是正确的.故选CD.
7.答案:ACD
解析:对于A,散点图上所有点都在一条斜率小于0的直线上,所以相关系数,A正确;对于B,散点图上所有点都在一条斜率大于0的直线上,所以相关系数,B错误;对于C,散点图上所有点从左到右是向下的带状分布,所以相关系数,C正确;对于D,散点图中,x,y之间的相关关系非常不明显,所以相关系数,D正确.故选ACD.
8.答案:ABC
解析:对于A,根据独立性检验的性质知,的值越大,说明两个事件的相关程度越大,故A正确;
对于B,由,两边取自然对数,可得,
,则,因为,所以则故B正确;
对于C,由于回归直线过点,故C正确;
对于D,通过回归直线及回归系数,可预测变量的取值和变化趋势,故D错误.故选ABC.
2