北师大版(2019)高中数学 选择性必修第一册 7.2 成对数据的线性相关性(课件+学案)(共60张PPT)

文档属性

名称 北师大版(2019)高中数学 选择性必修第一册 7.2 成对数据的线性相关性(课件+学案)(共60张PPT)
格式 zip
文件大小 1.8MB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2021-07-17 20:26:26

文档简介

(共60张PPT)
§2 成对数据的线性相关性
第七章 统计案例
1.了解样本相关系数的统计含义.
2.会计算样本相关系数,并能根据相关系数的大小判断变量
之间相关程度的强弱.
学习目标
导语
散点图可以说明变量间有无线性关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对成对样本数据的相关程度进行定量分析呢?
随堂演练
课时对点练
一、相关系数
二、线性相关性强弱的判断
内容索引
一、相关系数
知识梳理
1.设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),
那么r=
,称r为随机变量X和Y的样本(线性)
相关系数.
2.为运算方便,还可利用下面的公式:r=
.
注意点:(1)相关系数是研究变量之间线性相关程度的量.(2)r的取值范围为[-1,1].
例1 关于两个变量X和Y的7组成对数据如表所示:
(1)画出散点图,并判断Y与X是否具有线性关系?
解 画散点图(图略),观察散点图,可以看出样本点都集中在一条直线附近,由此判断Y与X线性相关.
X
21
23
25
27
29
32
35
Y
7
11
21
24
66
115
325
(2)求变量X和Y的相关系数.
X
21
23
25
27
29
32
35
Y
7
11
21
24
66
115
325
=18
542.
反思感悟 (1)散点图可以直观地判断两变量是否具有线性关系.
(2)相关系数的计算运算量较大,注意运算的准确性.
跟踪训练1 一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高X与右手长度Y进行测量得到如下数据(单位:cm):
(1)画出散点图,判断Y与X是否具有线性关系?
身高X
168
170
171
172
174
176
178
178
180
181
右手长度Y
19.0
20.0
21.0
21.5
21.0
22.0
24.0
23.0
22.5
23.0
解 散点图如图所示.
可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.
(2)如果具有线性关系,求出相关系数的大小(结果保留两位小数).
二、线性相关性强弱的判断
知识梳理
样本(线性)相关系数r可以反映两个随机变量之间的线性相关程度:r的____反映了相关关系的正负性;|r|的
反映了两个变量相关的程度,具体如下:
(1)r的正负性
当r>0时,称成对数据

当r<0时,称成对数据
.
(2)r的绝对值
当|r|越接近于1时,成对数据的线性相关程度越强.|r|越接近于0,成对数据线性相关程度越弱.
符号
大小
正相关
负相关
注意点:(1)往往忽视样本相关系数r的取值范围.
(2)应用公式计算r的值,有时需要借助计算器.
例2 为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L)、空腹血糖CLU指标值(单位:mmol/L)如表所示.
用变量Y与X,Z与X的样本相关系数分别说明TC指标值与BMI值、CLU指标值与BMI值的线性相关程度.
人员编号
1
2
3
4
5
6
7
8
BMI值X
25
27
30
32
33
35
40
42
TC指标值Y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
CLU指标值Z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
参考公式:
可以看出TC指标值与BMI值、CLU指标值与BMI值都是高度正相关.
反思感悟 |r|的大小反映成对样本数据之间线性相关程度的强弱,但当|r|=1时,表明成对样本数据都落在一条直线上;当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
跟踪训练2 对于线性相关系数r,叙述正确的是
A.|r|∈(0,+∞),|r|越大相关程度越大,反之相关程度越小
B.r∈(-∞,+∞),r越大相关程度越大,反之相关程度越小
C.|r|≤1,且|r|越接近1相关程度越大
D.以上说法都不对
解析 用样本相关系数r可以衡量两个变量之间的线性相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强.

1.知识清单:
(1)样本相关系数的计算.
(2)(线性)相关关系程度的判定.
2.方法归纳:数形结合,公式法.
3.常见误区:样本相关系数的大小与变量间线性相关程度的对应关系混淆.
课堂小结
随堂演练
1.对两个变量X,Y的几组成对数据统计如表,则这两个相关变量的关系是
A.负相关
B.正相关
C.先正后负相关
D.先负后正相关
1
2
3
4

解析 根据两个变量x,y的几组成对数据统计表知,Y随X的减小而增大,
所以这两个相关变量负相关.
X
10
9
8
7
6
5
Y
2
3
3.5
4
4.8
5
2.变量X,Y的散点图如图所示,那么X,Y之间的
样本相关系数r最接近的值为
A.1
B.-0.5
C.0
D.0.5
1
2
3
4

解析 根据变量X,Y的散点图,得X,Y之间的线性相关关系非常不明显,所以样本相关系数r最接近的值应为0.
3.(多选)对于回归分析,下列说法正确的是
A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自
变量唯一确定
B.样本(线性)相关系数可以是正的或负的
C.回归分析中,如果r=-1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)



解析 ∵样本相关系数|r|≤1,
∴D错误.
其余均正确.
1
2
3
4
4.变量X与Y相对应的成对数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的成对数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与
U之间的线性相关系数,则r1,r2,0的大小关系为________.
1
2
3
4
r2<0解析 对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,
即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,
即r2<0,故r2<0课时对点练
解析 在题图①中,所有点都在一条直线的附近,且直线的斜率为负值,所以变量X与Y负相关;同理,变量U与V正相关,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断
A.变量X与Y正相关,U与V正相关
B.变量X与Y正相关,U与V负相关
C.变量X与Y负相关,U与V正相关
D.变量X与Y负相关,U与V负相关

基础巩固
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2.关于两个变量X,Y与其线性相关系数r,有下列说法:
①若r>0,则X,Y的值总体上变化趋势相同;
②若|r|越趋近于1,则X与Y的线性相关程度越强;
③若r=1,则X与Y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
其中正确的有
A.①②
B.②③
C.①③
D.①②③

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 根据样本相关系数的定义,变量之间的相关关系可利用样本相关系数r进行判断:
当r为正数时,表示变量X,Y正相关;
当r为负数时,表示变量X,Y负相关;
|r|越接近于1,相关程度越强;
|r|越接近于0,相关程度越弱.故可知①②③正确.
3.下列说法中错误的是
A.变量间的线性相关系数r的取值范围为[-1,1]
B.变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度
越低
C.变量间的相关系数越小,变量间的线性相关程度越小
D.相关系数r与回归系数始终同号

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 根据题意,依次分析,对于A,样本相关系数r满足|r|≤1,即样本相关系数r的取值范围为[-1,1],A正确;
对于B,根据相关系数的性质知|r|≤1,且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小,则B正确;
对于C,当r接近-1时,变量间的相关程度比r接近0时的大,故C错误.
对于D,相关系数r为正,表示正相关,回归直线上升,回归系数为正;r为负,表示负相关,回归直线下降,回归系数为负,即相关系数r与回归系数始终同号,则D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
4.在成对数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-
x+1上,则这组样本数据的样本相关系数为
A.-1
B.1
C.-
D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

解析 因为这组成对数据的所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-
x+1上,所以这组成对数据完全线性相关,其样本相关系数是-1.
5.有以下几组(X,Y)的成对数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下的数据具有较强的相关关系,应去掉的一组数据是
A.(3,10)
B.(10,12)
C.(1,2)
D.(2,4)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

解析 由点(1,2),(2,4),(4,5),(3,10),(10,12)在坐标系中画出散点图(图略),结果除去(3,10)之外,其余的点都在一条直线附近,
∴去掉(3,10)这个点之后剩下的数据具有较强的相关关系,故选A.
6.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r如下表:
则哪位同学的试验结果体现A,B两变量有更强的线性相关性
A.甲
B.乙
C.丙
D.丁
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

解析 |r|越接近1,相关性越强,故选D.
?




r
0.82
0.78
0.69
0.85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7.已知某个样本点中的变量X,Y线性相关,相关系数r>0,平移坐标系,则在以
为坐标原点的坐标系下的散点图,大多数的点都落在第________象限.
一、三
解析 因为r>0,所以大多数的点都落在第一、三象限.
8.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如表(单位:百万元):
根据上表资料计算的样本相关系数约为________.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
0.991
8
固定资产价值
3
3
5
6
6
7
8
9
9
10
工业增加值
15
17
25
28
30
36
37
42
40
45
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9.5个学生的数学和物理成绩如表:
试用散点图和样本相关系数r判断它们是否有线性相关关系,若有,是正相关还是负相关?
  学生
学科
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
解 散点图法:涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.
由散点图可见,两者之间具有线性相关关系且是正相关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(样本相关系数r法)列表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
i
xi
yi
xiyi
1
80
70
6
400
4
900
5
600
2
75
66
5
625
4
356
4
950
3
70
68
4
900
4
624
4
760
4
65
64
4
225
4
096
4
160
5
60
62
3
600
3
844
3
720

350
330
24
750
21
820
23
190
∴两变量具有线性相关关系且正相关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.
画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.
气温X/℃
26
18
13
10
4
-1
杯数Y/杯
20
24
34
38
50
64
解 画出散点图如图所示.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
可得r≈-0.98.
由于|r|的值较大,所以X与Y具有很强的线性相关关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
11.下面的散点图与样本相关系数r一定不符合的是
A.①②③
B.①②④
C.①③④
D.②③④
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

综合运用
解析 ①中,由散点图可得,两相关变量呈负相关,故①错误;
②中,由散点图可得,两相关变量呈正相关,且样本相关系数可能是
r=0.75;
③中,若样本相关系数r=-1,则所有的点应该分布在一条直线上,散点图显然不符合,故③错误;
④中,若样本相关系数r=1,则所有的点应该分布在一条直线上,散点图显然不符合,故④错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
12.下列两个变量相关程度最高的是
A.商品销售额和商品销售量的样本相关系数是0.9
B.商品销售额和商业利润率的样本相关系数是0.84
C.平均流通费用率和商业利润率的样本相关系数是-0.94
D.商品销售价格和商品销售量的样本相关系数是-0.91

解析 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱,-0.94的绝对值最大,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.为考察两个变量X,Y的相关性,搜集数据如表,则两个变量的线性相关程度
A.很强
B.很弱
C.无相关
D.不确定
x
5
10
15
20
25
y
103
105
110
111
114

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
故相关程度很强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.(多选)如图所示是某市2020年4月至2021年3月每月最低气温与最高气温的折线统计图,已知每月最低气温与
最高气温的样本相关系数r=0.83,
则下列结论正确的是(若|r|>0.75,
则线性相关程度较强)
A.每月最低气温与最高气温有较强
的线性相关性,且二者为正线性
相关
B.月温差(月最高气温-月最低气温)的最大值出现在10月
C.9~12月的月温差相对于5~8月,波动性更大
D.每月最高气温与最低气温的平均值在所统计的前6个月里逐月增加

拓广探究


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 每月最低气温与最高气温的样本相关系数r=0.83,可知每月最低气温与最高气温有较强的线性
相关性,且二者为正线性相关.
由所给的折线图可以看出月温
差(月最高气温-月最低气温)
的最大值出现在10月.9~12月
的月温差相对于5~8月,波动
性更大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐月增加,在第6个月开始减少,所以A,B,C正确,D错误.
令U=
,U,Y之间是否具有线性相关关系,若有,求出Y对U的线性回归方程.
16.某种书每册的成本费Y(元)与印刷册数X(万册)有关,经统计得到数据如下:
X
1
2
3
5
10
20
30
50
100
200
Y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
≈0.999
8.
U
1
0.5
0.33
0.2
0.1
0.05
0.033
0.02
0.01
0.005
Y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由于r的值非常接近于1,这表明两个变量的线性相关关系很强,从而求Y与U的线性回归方程有意义.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
所以Y关于U的线性回归方程为Y=1.12+8.98U.§2 成对数据的线性相关性
学习目标 1.了解样本相关系数的统计含义.2.会计算样本相关系数,并能根据相关系数的大小判断变量之间相关程度的强弱.
导语
散点图可以说明变量间有无线性关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对成对样本数据的相关程度进行定量分析呢?
一、相关系数
知识梳理
1.设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),那么r=,称r为随机变量X和Y的样本(线性)相关系数.
2.为运算方便,还可利用下面的公式:r=
.
注意点:(1)相关系数是研究变量之间线性相关程度的量.(2)r的取值范围为[-1,1].
例1 关于两个变量X和Y的7组成对数据如表所示:
X
21
23
25
27
29
32
35
Y
7
11
21
24
66
115
325
(1)画出散点图,并判断Y与X是否具有线性关系?
(2)求变量X和Y的相关系数.
解 (1)画散点图(图略),观察散点图,可以看出样本点都集中在一条直线附近,由此判断Y与X线性相关.
(2)=(21+23+25+27+29+32+35)≈27.4,
=(7+11+21+24+66+115+325)≈81.3,
=212+232+252+272+292+322+352=5
414.
iyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18
542.
=72+112+212+242+662+1152+3252=124
393,
所以r=

≈≈0.837
5.
反思感悟 (1)散点图可以直观地判断两变量是否具有线性关系.
(2)相关系数的计算运算量较大,注意运算的准确性.
跟踪训练1 一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高X与右手长度Y进行测量得到如下数据(单位:cm):
身高X
168
170
171
172
174
176
178
178
180
181
右手长度Y
19.0
20.0
21.0
21.5
21.0
22.0
24.0
23.0
22.5
23.0
(1)画出散点图,判断Y与X是否具有线性关系?
(2)如果具有线性关系,求出相关系数的大小(结果保留两位小数).
解 (1)散点图如图所示.
可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.
(2)根据以上数据可由计算器计算得=174.8,=21.7,=305
730,=4
729.5,
iyi=37
986.
r=

=≈0.89.
二、线性相关性强弱的判断
知识梳理
样本(线性)相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映了相关关系的正负性;|r|的大小反映了两个变量相关的程度,具体如下:
(1)r的正负性
当r>0时,称成对数据正相关;
当r<0时,称成对数据负相关.
(2)r的绝对值
当|r|越接近于1时,成对数据的线性相关程度越强.|r|越接近于0,成对数据线性相关程度越弱.
注意点:(1)往往忽视样本相关系数r的取值范围.
(2)应用公式计算r的值,有时需要借助计算器.
例2 为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L)、空腹血糖CLU指标值(单位:mmol/L)如表所示.
人员编号
1
2
3
4
5
6
7
8
BMI值X
25
27
30
32
33
35
40
42
TC指标值Y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
CLU指标值Z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量Y与X,Z与X的样本相关系数分别说明TC指标值与BMI值、CLU指标值与BMI值的线性相关程度.
参考公式:
相关系数r=
.
参考数据:=33,=6,=8,(xi-)2=244,
(yi-)2≈3.6,(zi-)2=5.4,
(xi-)(yi-)=28.3,
(xi-)(zi-)=35.4,≈15.6,≈1.9,≈2.3.
解 变量Y与X的相关系数r≈≈0.95,
变量Z与X的相关系数r′≈≈0.99,
可以看出TC指标值与BMI值、CLU指标值与BMI值都是高度正相关.
反思感悟 |r|的大小反映成对样本数据之间线性相关程度的强弱,但当|r|=1时,表明成对样本数据都落在一条直线上;当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
跟踪训练2 对于线性相关系数r,叙述正确的是(  )
A.|r|∈(0,+∞),|r|越大相关程度越大,反之相关程度越小
B.r∈(-∞,+∞),r越大相关程度越大,反之相关程度越小
C.|r|≤1,且|r|越接近1相关程度越大
D.以上说法都不对
答案 C
解析 用样本相关系数r可以衡量两个变量之间的线性相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强.
1.知识清单:
(1)样本相关系数的计算.
(2)(线性)相关关系程度的判定.
2.方法归纳:数形结合,公式法.
3.常见误区:样本相关系数的大小与变量间线性相关程度的对应关系混淆.
1.对两个变量X,Y的几组成对数据统计如表,则这两个相关变量的关系是(  )
X
10
9
8
7
6
5
Y
2
3
3.5
4
4.8
5
A.负相关
B.正相关
C.先正后负相关
D.先负后正相关
答案 A
解析 根据两个变量x,y的几组成对数据统计表知,Y随X的减小而增大,所以这两个相关变量负相关.
2.变量X,Y的散点图如图所示,那么X,Y之间的样本相关系数r最接近的值为(  )
A.1
B.-0.5
C.0
D.0.5
答案 C
解析 根据变量X,Y的散点图,得X,Y之间的线性相关关系非常不明显,所以样本相关系数r最接近的值应为0.
3.(多选)对于回归分析,下列说法正确的是(  )
A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.样本(线性)相关系数可以是正的或负的
C.回归分析中,如果r=-1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
答案 ABC
解析 ∵样本相关系数|r|≤1,∴D错误.其余均正确.
4.变量X与Y相对应的成对数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的成对数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与
U之间的线性相关系数,则r1,r2,0的大小关系为________.
答案 r2<0解析 对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,
即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,
即r2<0,故r2<0课时对点练
1.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断(  )
A.变量X与Y正相关,U与V正相关
B.变量X与Y正相关,U与V负相关
C.变量X与Y负相关,U与V正相关
D.变量X与Y负相关,U与V负相关
答案 C
解析 在题图①中,所有点都在一条直线的附近,且直线的斜率为负值,所以变量X与Y负相关;同理,变量U与V正相关,故选C.
2.关于两个变量X,Y与其线性相关系数r,有下列说法:
①若r>0,则X,Y的值总体上变化趋势相同;
②若|r|越趋近于1,则X与Y的线性相关程度越强;
③若r=1,则X与Y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
其中正确的有(  )
A.①②
B.②③
C.①③
D.①②③
答案 D
解析 根据样本相关系数的定义,变量之间的相关关系可利用样本相关系数r进行判断:
当r为正数时,表示变量X,Y正相关;
当r为负数时,表示变量X,Y负相关;
|r|越接近于1,相关程度越强;
|r|越接近于0,相关程度越弱.故可知①②③正确.
3.下列说法中错误的是(  )
A.变量间的线性相关系数r的取值范围为[-1,1]
B.变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低
C.变量间的相关系数越小,变量间的线性相关程度越小
D.相关系数r与回归系数始终同号
答案 C
解析 根据题意,依次分析,对于A,样本相关系数r满足|r|≤1,即样本相关系数r的取值范围为[-1,1],A正确;
对于B,根据相关系数的性质知|r|≤1,且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小,则B正确;
对于C,当r接近-1时,变量间的相关程度比r接近0时的大,故C错误.
对于D,相关系数r为正,表示正相关,回归直线上升,回归系数为正;r为负,表示负相关,回归直线下降,回归系数为负,即相关系数r与回归系数始终同号,则D正确.
4.在成对数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为(  )
A.-1
B.1
C.-
D.
答案 A
解析 因为这组成对数据的所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,所以这组成对数据完全线性相关,其样本相关系数是-1.
5.有以下几组(X,Y)的成对数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下的数据具有较强的相关关系,应去掉的一组数据是(  )
A.(3,10)
B.(10,12)
C.(1,2)
D.(2,4)
答案 A
解析 由点(1,2),(2,4),(4,5),(3,10),(10,12)在坐标系中画出散点图(图略),结果除去(3,10)之外,其余的点都在一条直线附近,∴去掉(3,10)这个点之后剩下的数据具有较强的相关关系,故选A.
6.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r如下表:




r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性(  )
A.甲
B.乙
C.丙
D.丁
答案 D
解析 |r|越接近1,相关性越强,故选D.
7.已知某个样本点中的变量X,Y线性相关,相关系数r>0,平移坐标系,则在以(,)为坐标原点的坐标系下的散点图,大多数的点都落在第________象限.
答案 一、三
解析 因为r>0,所以大多数的点都落在第一、三象限.
8.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如表(单位:百万元):
固定资产价值
3
3
5
6
6
7
8
9
9
10
工业增加值
15
17
25
28
30
36
37
42
40
45
根据上表资料计算的样本相关系数约为________.
答案 0.991
8
解析 ==6.6,
==31.5.
∴r=≈0.991
8.
9.5个学生的数学和物理成绩如表:
  学生
学科
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
试用散点图和样本相关系数r判断它们是否有线性相关关系,若有,是正相关还是负相关?
解 散点图法:涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.
由散点图可见,两者之间具有线性相关关系且是正相关.
(样本相关系数r法)列表:
i
xi
yi
x
y
xiyi
1
80
70
6
400
4
900
5
600
2
75
66
5
625
4
356
4
950
3
70
68
4
900
4
624
4
760
4
65
64
4
225
4
096
4
160
5
60
62
3
600
3
844
3
720

350
330
24
750
21
820
23
190
∴r=
==0.9>0.
∴两变量具有线性相关关系且正相关.
10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.
气温X/℃
26
18
13
10
4
-1
杯数Y/杯
20
24
34
38
50
64
画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.
解 画出散点图如图所示.
=(26+18+13+10+4-1)≈11.7,
=(20+24+34+38+50+64)≈38.3,
iyi=26×20+18×24+13×34+10×38+4×50-1×64=1
910,
=262+182+132+102+42+(-1)2=1
286,
=202+242+342+382+502+642=10
172,
由r=,可得r≈-0.98.
由于|r|的值较大,所以X与Y具有很强的线性相关关系.
11.下面的散点图与样本相关系数r一定不符合的是(  )
A.①②③
B.①②④
C.①③④
D.②③④
答案 C
解析 ①中,由散点图可得,两相关变量呈负相关,故①错误;②中,由散点图可得,两相关变量呈正相关,且样本相关系数可能是r=0.75;③中,若样本相关系数r=-1,则所有的点应该分布在一条直线上,散点图显然不符合,故③错误;④中,若样本相关系数r=1,则所有的点应该分布在一条直线上,散点图显然不符合,故④错误.
12.下列两个变量相关程度最高的是(  )
A.商品销售额和商品销售量的样本相关系数是0.9
B.商品销售额和商业利润率的样本相关系数是0.84
C.平均流通费用率和商业利润率的样本相关系数是-0.94
D.商品销售价格和商品销售量的样本相关系数是-0.91
答案 C
解析 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱,-0.94的绝对值最大,故选C.
13.为考察两个变量X,Y的相关性,搜集数据如表,则两个变量的线性相关程度(  )
x
5
10
15
20
25
y
103
105
110
111
114
A.很强
B.很弱
C.无相关
D.不确定
答案 A
解析 i=75,i=543,
=1
375,iyi=8
285,
=59
051,=15,=108.6,
r=
=≈0.982
6,
故相关程度很强.
14.若已知(yi-)2是(xi-)2的4倍,(xi-)·(yi-)是(xi-)2的1.5倍,则样本相关系数r的值为________.
答案 
解析 由r=,得r=.
15.(多选)如图所示是某市2020年4月至2021年3月每月最低气温与最高气温的折线统计图,已知每月最低气温与最高气温的样本相关系数r=0.83,则下列结论正确的是(若|r|>0.75,则线性相关程度较强)(  )
A.每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关
B.月温差(月最高气温-月最低气温)的最大值出现在10月
C.9~12月的月温差相对于5~8月,波动性更大
D.每月最高气温与最低气温的平均值在所统计的前6个月里逐月增加
答案 ABC
解析 每月最低气温与最高气温的样本相关系数r=0.83,可知每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关.由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月.9~12月的月温差相对于5~8月,波动性更大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐月增加,在第6个月开始减少,所以A,B,C正确,D错误.
16.某种书每册的成本费Y(元)与印刷册数X(万册)有关,经统计得到数据如下:
X
1
2
3
5
10
20
30
50
100
200
Y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
令U=,U,Y之间是否具有线性相关关系,若有,求出Y对U的线性回归方程.
(参考数据:=1.413
014,=171.803,iyi=15.208
78)
解 设U=,则Y与U的数据关系如下表所示:
U
1
0.5
0.33
0.2
0.1
0.05
0.033
0.02
0.01
0.005
Y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
由上表可以得到=×(1+0.5+…+0.005)=0.224
8,
=×(10.15+5.52+…+1.15)=3.14,
则r=
≈0.999
8.
由于r的值非常接近于1,这表明两个变量的线性相关关系很强,从而求Y与U的线性回归方程有意义.
又=≈8.98,
则=-=3.14-8.98×0.224
8≈1.12,
所以Y关于U的线性回归方程为Y=1.12+8.98U.
同课章节目录