人教A版(2019)高中数学 选择性必修第三册 8.1.2 样本相关系数课件+学案含练习

文档属性

名称 人教A版(2019)高中数学 选择性必修第三册 8.1.2 样本相关系数课件+学案含练习
格式 zip
文件大小 2.8MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2020-12-18 10:44:08

文档简介

(共32张PPT)
8.1.2 样本相关系数
课标要求
素养要求
1.结合实例,会通过相关系数比较多组成对数据的相关性.
2.了解样本相关系数与标准化数据向量夹角的关系.
通过学习样本相关系数,提升数学抽象及数据分析素养.
新知探究
散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?
问题 若样本系数r=0.97,则成对样本数据的相关程度如何?
提示 r=0.97,表明成对样本数据正线性相关程度很强.
1.
相关系数r的计算
注意:相关系数是研究变量之间线性相关程度的量
2.相关系数r的性质
(1)当r>0时,称成对样本数据____相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为______________.
当|r|越接近1时,成对样本数据的线性相关程度越____;
当|r|越接近0时,成对样本数据的线性相关程度越____.

[-1,1]


3.样本相关系数与标准化数据向量夹角的关系
拓展深化
[微判断]
1.回归分析中,若r=±1说明x,y之间具有完全的线性关系.
  (  )
2.若r=0,则说明成对样本数据间是函数关系.
  (  )
提示 若r=0,则说明成对样本数据间没有线性相关关系.
3.样本相关系数r的范围是r∈(-∞,+∞).
  (  )
提示 样本相关系数的范围是[-1,1].
×

×
解析 因r>0表明两个变量正相关,故A错误;又因
r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,
r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D正确.
答案 D
2.(多选题)下面的各图中,散点图与相关系数r符合的是
(  )
解析 因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD.
答案 ACD
[微思考]
当r=1或-1时,两个变量的相关性如何?
提示 当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.
题型一 线性相关性的检验
【例1】 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
≈0.750
6.
由此可看出这10名学生的两次数学成绩具有线性相关关系.
规律方法 利用相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器.
【训练1】 假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
所以x与y之间具有很强的线性相关关系.
题型二 判断线性相关的强弱
【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛浓度x
18
20
22
24
26
28
30
缩醛化度(y)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
解 列表如下
i
xi
y
xiyi
1
18
26.86
324
721.459
6
483.48
2
20
28.35
400
803.722
5
567
3
22
28.75
484
826.562
5
632.5
4
24
28.87
576
833.476
9
692.88
5
26
29.75
676
885.062
5
773.5
6
28
30.00
784
900
840
7
30
30.36
900
921.729
6
910.80

168
202.94
4
144
5892.013
6
4
900.16
≈0.96.
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
规律方法 当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.
【训练2】 以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.
房屋大小x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
18.4
29.2
22
(1)画出数据的散点图;
(2)求相关系数r,并作出评价.
解 (1)图略.
(2)列表如下:
i
xi
yi
xiyi
1
115
24.8
13
225
615.04
2
852
2
110
21.6
12
100
466.56
2
376
3
80
18.4
6
400
338.56
1
472
4
135
29.2
18
225
852.64
3
942
5
105
22
11
025
484
2
310

545
116
60
975
2
756.8
12
952
一、素养落地
1.通过本节课的学习,进一步提升数学抽象及数据分析素养.
2.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数来判断.
3.|r|越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强.
二、素养训练
1.两个变量之间的相关程度越低,则其线性相关系数的数值(  )
A.越小
B.越接近1
C.越接近0
D.越接近-1
解析 由相关系数的性质知选C.
答案 C
2.给定y与x的一组样本数据,求得相关系数r=-0.690,则(  )
A.y与x线性不相关
B.y与x正线性相关
C.y与x负线性相关
D.以上都不对
解析 因为r=-0.690<0,所以y与x负线性相关.
答案 C
3.(多选题)下列说法正确的是(  )
A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.线性相关系数可以是正的或负的
C.如果r=±1,说明x与y之间完全线性相关
D.线性相关系数r∈(-1,1)
解析 ∵相关系数|r|≤1,
∴D错误.
答案 ABC
4.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
已知记忆力x和判断力y是线性相关的,求相关系数r.
解 列表如下
i
xi
yi
xiyi
1
6
2
36
4
12
2
8
3
64
9
24
3
10
5
100
25
50
4
12
6
144
36
72

36
16
344
74
1588.1.2 样本相关系数
课标要求
素养要求
1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.
通过学习样本相关系数,提升数学抽象及数据分析素养.
新知探究
 散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?
问题 若样本系数r=0.97,则成对样本数据的相关程度如何?
提示 r=0.97,表明成对样本数据正线性相关程度很强.
1.相关系数r的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),对数据作进一步的“标准化处理”处理,用sx=,sy=分别除xi-和yi-
(i=1,2,…,n,和分别为x1,x2,…,xn和y1,y2,…,yn的均值),得,,…,,为简单起见,把上述“标准化”处理后的成对数据分别记为(x1′,y1′),(x2′,y2′),…,(xn′,yn′),则变量x和变量y的样本相关系数r的计算公式如下:
r=(x1′y1′+x2′y2′+…+xn′yn′)
=.
2.相关系数r的性质
(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.样本相关系数与标准化数据向量夹角的关系
r=x′·y′=|x′||y′|cos
θ=cos
θ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=,θ为向量x′和向量y′的夹角).
拓展深化
[微判断]
1.回归分析中,若r=±1说明x,y之间具有完全的线性关系.(√)
2.若r=0,则说明成对样本数据间是函数关系.(×)
提示 若r=0,则说明成对样本数据间没有线性相关关系.
3.样本相关系数r的范围是r∈(-∞,+∞).(×)
提示 样本相关系数的范围是[-1,1].
[微训练]
1.下面对相关系数r描述正确的是(  )
A.r>0表明两个变量负相关
B.r>1表明两个变量正相关
C.r只能大于零
D.越接近于0,两个变量相关关系越弱
解析 因r>0表明两个变量正相关,故A错误;又因
r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强,
r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故D正确.
答案 D
2.(多选题)下面的各图中,散点图与相关系数r符合的是
(  )
解析 因为相关系数r的绝对值越接近1,线性相关程度越高,且r>0时正相关,r<0时负相关,故观察各选项,易知B不符合,A,C,D均符合.故选ACD.
答案 ACD
[微思考]
当r=1或-1时,两个变量的相关性如何?
提示 当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.
题型一 线性相关性的检验
【例1】 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有线性相关关系?
解 =(120+108+…+99+108)=107.8,
=(84+64+…+57+71)=68,
x=1202+1082+…+992+1082=116
584,
y=842+642+…+572+712=47
384,
xiyi=120×84+108×64+…+99×57+108×71
=73
796.
所以相关系数为r=
≈0.750
6.
由此可看出这10名学生的两次数学成绩具有线性相关关系.
规律方法 利用相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,需要借助计算器.
【训练1】 假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
已知x=90,y=140.78,xiyi=112.3.
(1)求,;
(2)对x,y进行线性相关性检验.
解 (1)==4.
==5.
(2)
xiyi-5=112.3-5×4×5=12.3,
x-52=90-5×42=10,
y-52=140.78-125=15.78,
所以r=≈0.979.
所以x与y之间具有很强的线性相关关系.
题型二 判断线性相关的强弱
【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛浓度x
18
20
22
24
26
28
30
缩醛化度(y)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
求样本相关系数r并判断它们的相关程度.
解 列表如下
i
xi
yi
x
y
xiyi
1
18
26.86
324
721.459
6
483.48
2
20
28.35
400
803.722
5
567
3
22
28.75
484
826.562
5
632.5
4
24
28.87
576
833.476
9
692.88
5
26
29.75
676
885.062
5
773.5
6
28
30.00
784
900
840
7
30
30.36
900
921.729
6
910.80

168
202.94
4
144
5892.013
6
4
900.16
==24,=,
r=eq
\f(\o(∑,\s\up10(7),\s\do10(i=1))xiyi-7\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\o(∑,\s\up10(7),\s\do10(i=1))x-7\o(x,\s\up6(-))2)\r(\o(∑,\s\up10(7),\s\do10(i=1))y-7\o(y,\s\up6(-))2))

≈0.96.
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
规律方法 当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.
【训练2】 以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.
房屋大小x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
18.4
29.2
22
(1)画出数据的散点图;
(2)求相关系数r,并作出评价.
解 (1)图略.
(2)列表如下:
i
xi
yi
x
y
xiyi
1
115
24.8
13
225
615.04
2
852
2
110
21.6
12
100
466.56
2
376
3
80
18.4
6
400
338.56
1
472
4
135
29.2
18
225
852.64
3
942
5
105
22
11
025
484
2
310

545
116
60
975
2
756.8
12
952
==109,==23.2,
r=eq
\f(\o(∑,\s\up10(5),\s\do10(i=1))xiyi-5\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\o(∑,\s\up10(5),\s\do10(i=1))x-5\o(x,\s\up6(-))2)\r(\o(∑,\s\up10(5),\s\do10(i=1))y-5\o(y,\s\up6(-))2))

=≈0.96,
由此可知,新房屋的销售价格和房屋的大小之间有很强的正线性相关关系.
一、素养落地
1.通过本节课的学习,进一步提升数学抽象及数据分析素养.
2.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就可利用线性相关系数来判断.
3.|r|越接近1,它们的散点图越接近一条直线,两个变量之间的相关关系越强.
二、素养训练
1.两个变量之间的相关程度越低,则其线性相关系数的数值(  )
A.越小
B.越接近1
C.越接近0
D.越接近-1
解析 由相关系数的性质知选C.
答案 C
2.给定y与x的一组样本数据,求得相关系数r=-0.690,则(  )
A.y与x线性不相关
B.y与x正线性相关
C.y与x负线性相关
D.以上都不对
解析 因为r=-0.690<0,所以y与x负线性相关.
答案 C
3.(多选题)下列说法正确的是(  )
A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.线性相关系数可以是正的或负的
C.如果r=±1,说明x与y之间完全线性相关
D.线性相关系数r∈(-1,1)
解析 ∵相关系数|r|≤1,
∴D错误.
答案 ABC
4.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
已知记忆力x和判断力y是线性相关的,求相关系数r.
解 列表如下
i
xi
yi
x
y
xiyi
1
6
2
36
4
12
2
8
3
64
9
24
3
10
5
100
25
50
4
12
6
144
36
72

36
16
344
74
158
==9,==4,
∴r=eq
\f(\o(∑,\s\up10(4),\s\do10(i=1))xiyi-4\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\o(∑,\s\up10(4),\s\do10(i=1))x-4\o(x,\s\up6(-))2)\r(\o(∑,\s\up10(4),\s\do10(i=1))y-4\o(y,\s\up6(-))2))=≈0.99.
基础达标
一、选择题
1.已知某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着
(  )
A.高度相关
B.中度相关
C.弱度相关
D.极弱相关
解析 由|-0.97|比较接近1知选A.
答案 A
2.关于两个变量x,y与其线性相关系数r,有下列说法:
①若r>0,则x增大时,y也相应增大;
②若|r|越趋近于1,则x与y的线性相关程度越强;
③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
其中正确的有(  )
A.①②
B.②③
C.①③
D.①②③
解析 根据相关系数的定义,变量之间的相关关系可利用相关系数r进行判断:
当r为正数时,表示变量x,y正相关;
当r为负数时,表示两个变量x,y负相关;
|r|越接近于1,相关程度越强;
|r|越接近于0,相关程度越弱.故可知①②③正确.
答案 D
3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并分别求得相关系数r如表:




r
0.82
0.78
0.69
0.85
则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是(  )
A.甲
B.乙
C.丙
D.丁
解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性最强,故选D.
答案 D
4.对于相关系数r,下列结论正确的个数为(  )
①r∈[-1,-0.75]时,两变量负相关很强
②r∈[0.75,1]时,两变量正相关很强
③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般
④r=0.1时,两变量相关性很弱
A.1
B.2
C.3
D.4
解析 由相关系数的性质可知4个结论都正确.
答案 D
5.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:
①n=7,r=0.953
3;②n=15,r=0.301
2;
③n=17,r=0.499
1;④n=13,r=0.995
0.
则变量y和x线性相关程度最高的两组是(  )
A.①②
B.①④
C.②④
D.③④
解析 相关系数r的绝对值越接近于1,变量x,y的线性相关程度越高.
答案 B
二、填空题
6.已知某个样本点中的变量x,y线性相关,相关系数r>0,平移坐标系,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第__________象限.
解析 因为r>0,
所以大多数的点都落在第一、三象限.
答案 一、三
7.若已知
(yi-)2是
(xi-)2的4倍,
(xi-)(yi-)是
(xi-)2的1.5倍,则相关系数r的值为__________.
解析 由r=,得r=.
答案 
8.部门所属的10个工业企业生产性固定资产价值x与工业增加值y资料如下表(单位:百万元):
固定资产价值
3
3
5
6
6
7
8
9
9
10
工业增加值 
15
17
25
28
30
36
37
42
40
45
根据上表资料计算的相关系数为__________.
解析 ==6.6.
==31.5.
∴r=≈0.991
8.
答案 0.991
8
三、解答题
9.5个学生的数学和物理成绩如表:
学生学科  
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
试用散点图和相关系数r判断它们是否有线性相关关系,若有,是正相关还是负相关?
解 散点图法:涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩的变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.
由散点图可见,两者之间具有线性相关关系且是正相关.
(相关系数r法)列表:
i
xi
yi
x
y
xiyi
1
80
70
6
400
4
900
5
600
2
75
66
5
625
4
356
4
950
3
70
68
4
900
4
624
4
760
4
65
64
4
225
4
096
4
160
5
60
62
3
600
3
844
3
720

350
330
24
750
21
820
23
190
∴r=eq
\f(\o(∑,\s\up10(5),\s\do10(i=1))xiyi-5\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up10(5),\s\do10(i=1))x-5\o(x,\s\up6(-))2))\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up10(5),\s\do10(i=1))y-5\o(y,\s\up6(-))2))))==0.9>0.
∴两变量具有相关关系且正相关.
10.某火锅店为了了解营业额y(百元)与气温x(℃)之间的关系,随机统计并制作了某6天当天营业额与当天气温的对比表.
气温/℃
26
18
13
10
4
-1
营业额/百元
20
24
34
38
50
64
画出散点图并判断营业额与气温之间是否具有线性相关关系.
解 画出散点图如图所示.
=(26+18+13+10+4-1)≈11.7,
=(20+24+34+38+50+64)≈38.3,
xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1
910,
x=262+182+132+102+42+(-1)2=1
286,
y=202+242+342+382+502+642=10
172,
由r=eq
\f(\o(∑,\s\up10(6),\s\do10(i=1))xiyi-6\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\o(∑,\s\up10(6),\s\do10(i=1))x-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up10(6),\s\do10(i=1))y-6\o(y,\s\up6(-))2)),可得r≈-0.98.
由于|r|的值较接近1,所以x与y具有很强的线性相关关系.
能力提升
11.为考察两个变量x,y的相关性,搜集数据如下表,则两个变量的线性相关程度(  )
x
5
10
15
20
25
y
103
105
110
111
114
A.很强
B.很弱
C.无相关
D.不确定
解析 xi=75,y=543,x=1
375,xiyi=8
285,y=59
051,=15,=108.6,
r=eq
\f(\o(∑,\s\up10(5),\s\do10(i=1))xiyi-5\a\vs4\al(\o(x,\s\up6(-))
)\a\vs4\al(\o(y,\s\up6(-))
),\r(\o(∑,\s\up10(5),\s\do10(i=1))x-5\o(x,\s\up6(-))2)\r(\o(∑,\s\up10(5),\s\do10(i=1))y-5\o(y,\s\up6(-))2))

≈0.982
6,故相关程度很强.
答案 A
12.下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2012~2018.
由折线图看出,y与t有线性相关关系,请用相关系数加以说明.
附注:
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:相关系数r=.
解 由折线图中数据和附注中参考数据得
=4,
(ti-)2=28,=0.55.
(ti-)(yi-)=tiyi-yi
=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,所以y与t的线性相关程度相当高.
创新猜想
13.(多选题)对于线性相关系数r,以下说法错误的是(  )
A.r只能是正值,不能为负值
B.≤1,且越接近于1,相关程度越大;相反则越小
C.≤1,且越接近于1,相关程度越小;相反则越大
D.r<0时表示两个变量无相关
解析 由相关系数的性质知B正确,其余均错误.
答案 ACD