高中数学人教A版(2019)选择性必修第三册8.1.2样本相关系数
学案
一、学习目标
1.
结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的成对数据两分量向量夹角的关系;
2.
结合实例,会通过相关系数比较多组成对数据的相关性.
二、基础梳理
1.
r为变量x和变量y的样本相关系数,_________________.
2.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:
当时,称成对样本数据_______相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
当时,称成对样本数据_______相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
3.
样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当越接近1时,成对样本数据的线性相关程度越_______;
当越接近0时,成对样本数据的线性相关程度越_______.
三、巩固练习
1.对于样本相关系数r,下列说法中正确的是(
)
A.r越大,线性相关程度越强
B.越小,线性相关程度越强
C.越大,线性相关程度越弱
D.,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱
2.如图1,2分别表示样本容量均为7的A、B两组成对数据的散点图,已知A组成对数据的样本相关系数为,B组成对数据的样本相关系数为,则与的大小关系为(
)
A.
B.
C.
D.无法判断
3.已知两个变量与其线性相关系数r,下列说法正确的是(
)
①若,则x增大时,y也相应增大;
②若,则x增大时,y也相应增大;
③若或,则x与y的关系完全相关(有函数关系),在散点图上各个散点均在一条直线上.
A.①②
B.②③
C.①③
D.①②③
4.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是(
)
A.
B.
C.
D.
5.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).为变量Y与X之间的样本相关系数,为变量U与V之间的样本相关系数,则(
)
A.
B.
C.
D.
6.若对甲、乙、丙3组不同的成对数据作线性相关性检验,得到这3组成对数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的组是________(填“甲”“乙”或“丙”)
7.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
1日
2日
3日
4日
5日
外卖甲日接单(百单)
5
2
9
8
11
外卖乙日接单(百单)
2
3
10
5
15
(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况;
(2)据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若,则可认为y与x有较强的线性相关关系,
r的值精确到0.001)
8.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理后得到折线图如图:
由图可以看出,这种酶的活性指标值y与温度x具有较强的线性相关性,请用样本相关系数r加以说明.
附:.
样本相关系数
9.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如表:
x
1
2
3
4
y
12
28
42
56
在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.
附注:参考数据:.
参考公式:相关系数.
参考答案
基础梳理
正;负
强;弱
巩固练习
1.答案:D
解析:对于选项A,越大,线性相关程度越强,A错误;
对于选项B,越小,线性相关程度越弱,B错误;
对于选项C,越大,线性相关程度越强,C错误;
对于选项D,,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱,D正确.
故选D.
2.答案:C
解析:由题图1可知,散点几乎在一条直线上,且成正相关,,由题图2可知,散点分散在一条直线附近,也成正相关,.A组成对数据的线性相关程度比B组强些,,故选C.
3.答案:C
解析:若两个变量正相关,则因变量随着自变量的增大(减小)而增大(减小),此时相关系数;若两个变量负相关,则因变量随自变量的增大(减小)而减小(增大),此时相关系数;若,则两个变量完全相关.
4.答案:D
解析:由相关系数的定义以及散点图的含义,可知.
5.答案:B
解析:由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量Y与X之间成正相关,因此;
由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可得变量U与V之间成负相关,因此.故.
6.答案:丙
解析:样本相关系数越接近1,成对数据的线性相关程度就越强,结合题中所给的3组成对数据的样本相关系数知,-0.90的绝对值最接近1,所以丙组成对数据的线性相关程度最强.
7.答案:(1)由题可知,,
外卖甲的日接单量的方差,
外卖乙的日接单量的方差,
因为,,即外卖甲的平均日接单量与外卖乙的平均日接单量相同,但外卖甲的日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.
(2)因为易得,
,所以代入计算可得,样本相关系数,所以可认为y与x有较强的线性相关关系.
8.答案:由题可知,,
,
则,因为非常接近1,
所以酶的活性指标值y与温度x具有较强的线性相关性.
9.答案:作出散点图如图:
由散点图可知,各点大致分布在一条直线附近,由此推断x与y线性相关.
由题中所给表格及参考数据得:
,
,
,
.
∵y与x的相关系数近似为0.9997,可以推断该公司的年销量y与第x年呈正线性相关,且线性相关程度很强.