8.1成对数据的相关关系
1.相关系数r的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为false,对数据作进一步的“标准化处理”处理,用false,false分别除false和falsefalse(falsefalse和false分别为false和false的均值),得false,false,falsefalse,为简单起见把上述“标准化”处理后的成对数据分别记为false,false,falsefalse则变量x和变量y的样本相关系数r的计算公式如下:
false
false
2.相关系数r的性质
(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为false
当false越接近1时,成对样本数据的线性相关程度越强;
当false越接近0时,成对样本数据的线性相关程度越弱.
3.样本相关系数与标准化数据向量夹角的关系
false(其中false=(false),false=(false),false,false为向量false和向量false的夹角)
例1.在天文学上恒星的亮度一般用星等来表示,直接测量到的天体亮度被称为视星等false,而把天体置于10秒差距的距离处所得到的视星等称为绝对星等false,它能反映天体的发光本领.如果我们观测到了恒星的光谱,可以知道一些类型恒星的绝对星等,就可以利用光谱视差法来获得这些恒星的距离.下表是某校天文爱好者社团在网上收集到一些恒星的相关数据,那么最适合作为星等差false关于距离false(光年)的回归方程类型的是( )
星名
天狼星
南河三
织女星
大角星
五车二
水委一
老人星
参宿四
距离false
8.6
11.46
25
36.71
42.8
139.44
309.15
497.95
false
false
false
false
0.26
0.59
3.15
4.88
5.92
A.false B.false C.false D.false
【答案】B
【详解】
根据表格数据,在直角坐标系中从左至右依次标注表格数据代表的点,拟合曲线如下图示,
图象左侧无限靠近y轴,不与y轴相交,故其拟合曲线比较接近false的图象,
故选:B.
例2.研究与试验发展(R&D)是科技活动的核心指标,是衡量一个国家和地区科技发展水平的主要指标,同时也是反映企业自主创新能力的指标.我国一直以来都在大力促进科技创新,R&D经费支出增速保持世界领先.如图是我国近五年(2016-2020年)R&D经费支出统计图,则下列说法中错误的是( )
A.近五年,R&D经费支出与年份呈现正相关关系
B.近五年,R&D经费支出的中位数为19678
C.2020年R&D经费支出相对于2016年增长超过50%
D.2020年,R&D经费支出增长速度最快
【答案】D
【详解】
对于A选项,近五年,R&D经费支出与年份呈现正相关关系,A选项正确;
对于B选项,近五年,R&D经费支出的中位数为false,B选项正确;
对于C选项,false,即2020年R&D经费支出相对于2016年增长超过50%,C选项正确;
对于D选项,false年,false,false年,false,
false年,false,false年,false,D选项错误.
故选:D.