(共39张PPT)
人教A版(2019)
选择性必修第三册
8.1
成对数据的统计相关性
新知导入
1、将汽油均匀的速度倒入桶里,注入的时间t与注入的油量y的函数关系是:
时间t
1
2
3
4
5
油量
2
4
6
8
10
2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v与时间t的函数图像大致是怎样的?
3、小麦的产量y与施肥量x的关系如下:
施肥量x
20
30
40
50
60
产量y
440
460
470
480
510
能判断它们有函数关系吗?
y=2x
v=150/t
新知导入
在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示。
表中每一个序号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据。
编号
1
2
3
4
5
6
7
年龄/岁
23
27
39
41
45
49
50
脂肪含量/%
9.5
17.8
21.2
25.9
27.5
26.3
28.2
编号
8
9
10
11
12
13
14
年龄/岁
53
54
56
57
58
60
61
脂肪含量/%
29.6
30.2
31.4
30.8
33.5
35.2
34.6
新知导入
分析:为了更加直观地描述脂肪含量与年龄之间的关系,用横轴表示年龄,纵轴表示脂肪含量,则表中的每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图。我们把这样的统计图叫做散点图。
思考:根据以上数据,可以判断人体的脂肪含量与年龄之间存在怎样的关系?
观察图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
新知讲解
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当—个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关。
例如:
(1)商品销售收入与广告支出经费之间的关系
(2)粮食产量与施肥量之间的关系
(3)人体内脂肪含量与年龄之间的关系
正相关
正相关
正相关
变量相关关系的分类:
新知讲解
散点图中的点散布在从左下角到右上角的区域
思考:两个变量正相关、负相关时,成对样本数据的散点图有什么特点?
散点图中的点散布在从左上角到右下角的区域
新知导入
散点图是描述成对数据之间关系的一种直观方法.
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在
一条直线附近,我们就称这两个变量线性相关.
线性相关:
变量相关关系的分类:
新知讲解
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称
这两个变量非线性相关或曲线相关.
非线性相关:
新知讲解
问题:如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析?
根据散点图特征,初步构造统计量。
年龄/岁
脂肪含量/%
平移
新知讲解
一般地,如果变量x和变量y正相关,
那么均值平移后的大多数点将分布
在第一、三象限,对应的成对数据
同号居多;
如果变量x和变量y负相关,那么关于均值
平移后的大多数点将分布在第二、四象限,
对应的成对数据异号居多.
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
新知讲解
利用散点(x,yi)(i=1,2,...,n)的横纵坐标是否同号,可以构造一个量
一般情形下,表明成对样本数据正相关;
表明成对样本数据负相关.
新知讲解
思考:你认为
的大小一定能度量出成对样本数据的相关程度吗?
因为的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小。
例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位
由米改为厘米,则相应的将增大为原来的100倍,但单位的改变不会改变体重
与身高之间的相关程度。
新知讲解
为了消除单位的影响,进一步做“标准化”处理,
分别除-(i=1,2,┈,n),得
标准化处理后的成对数据分别记为,
新知讲解
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关.
我们称r为变量x和变量y的样本相关系数。
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
新知讲解
思考:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
我们先考察一下r的取值范围:
观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,
我们将向量的维数推广到n维,n维向量a,b的数量积仍然定义为
a·b=|a||b|cos
θ,
其中θ为向量a,b的夹角.类似于平面或空间向量的坐标表示,对于向量
a=(a1,
a2,...,an)
和b=(b1,
b2,...,bn
)
,我们有
a·b=a1b1+a2b3+anbn
新知讲解
设标准化处理后的成对样本数据:
其第一分量为
其第二分量为
因为
,所以样本相关系数
新知讲解
思考:当|r|=1时,成对样本数据之间具有怎样的关系?
当|r|=1时,
,向量与共线.
即存在实数,使得
表明成对样本数据(xi,
yi)都落在直线
新知讲解
上,成对样本数据的两个分量之间满足一种线性关系.
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值的大小可以反映成对数据之间的线性相关的程度:
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱。
新知讲解
新知讲解
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
线性相关程度的判断:
例题讲解
例1:根据脂肪含量和年龄的样本数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度。
编号
1
2
3
4
5
6
7
年龄/岁
23
27
39
41
45
49
50
脂肪含量/%
9.5
17.8
21.2
25.9
27.5
26.3
28.2
编号
8
9
10
11
12
13
14
年龄/岁
53
54
56
57
58
60
61
脂肪含量/%
29.6
30.2
31.4
30.8
33.5
35.2
34.6
例题讲解
解:
画出散点图如右。
由散点图,可以看出样本点都集中在一条直线附近,由此可以判断脂肪含量和年龄线性相关。
例题讲解
根据样本相关系数的定义:
利用计算工具计算得≈48.07,≈27.26
带入上式得
r≈0.97
由样本相关系数r≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
例题讲解
例2:有人收集了某城市居民年收入(即所有居民在一年内收入的总和)与A产品销售额的10年数据,如图所示
第n年
1
2
3
4
5
6
7
8
9
10
居民年收入/亿元
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
A商品销售额/万元
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相关程度和变化趋势的异同。
例题讲解
解:
画出成对样本数据的散点图
从散点图来看,A商品的销售额与居民年收入的样本数据呈现出线性相关关系。
由样本数据计算得样本相关系数r≈0.95.
由此推断,A商品销售额与居民年收入正线性相关,且相关性很强。
例题讲解
例3
在某校高一年级中随机抽取25名男生,测得他们的身高,体重,臀展等数据,如表所示。
编号
身高/cm
体重/kg
臂展/cm
1
173
55
169
2
179
71
170
3
175
52
172
4
179
62
177
5
182
82
174
6
173
63
166
7
180
55
174
8
170
81
169
9
169
54
166
10
177
54
176
11
177
59
170
12
178
67
174
13
174
56
170
编号
身高/cm
体重/kg
臂展/cm
14
166
66
161
15
176
61
166
16
176
49
165
17
175
60
173
18
169
48
162
19
184
86
189
20
169
58
164
21
182
54
170
22
171
58
164
23
177
61
173
24
173
58
165
25
173
51
169
例题讲解
解:根据样本数据分别画出体重与身高,臀展与身高的散点图。
两个散点图都呈现线性相关的特征。
通过计算得到体重与身高,臀展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关。其中臀展与身高的相关程度更高。
体重与身高,臀展与身高分别具有怎样的相关性?
课堂练习
1、下列图形中两个变量具有相关关系的是(
)
y
o
x
A.
y
o
x
B.
y
o
x
y
o
x
C
C.
D.
课堂练习
2、观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应
的是( )
A.①②③
B.②③①
C.②①③
D.①③②
D
课堂练习
3.对四组变量x,y进行线性相关实验,已知n是观测值指数,r是相关系数,且已知:
(1)n=7,r=0.9533
(2)n=15,r=0.3102
(3)n=17,r=0.4991
(4)n=3,r=0.9950
则变量y与x具有线性相关关系的是(
)
A.
(1)和(2)
B.
(1)和(4)
C.(2)和(4)
D.
(3)和(4)
B
课堂练习
4.下列两个变量之间的关系不具有线性关系的是
(
)
A.小麦产量与施肥值
B.球的体积与表面积
C.蛋鸭产蛋个数与饲养天数
D.甘蔗的含糖量与生长期的日照天数
B
拓展提升
5.
在一组样本数据(x1,y1),(x2,y2)…(xn,yn)(n≥2,x1,x2,...,xn互不相等)的散点图中,若所有样本点(xi,yi),(i=1,2,3,…)都在直线y=1/2-1上,则这组样本数据的相关系数为(
)
A.
-1
B.
0
C.
1/2
D.
1
D
链接高考
6.(2009年
宁夏理)对变量x,y有观测数(xi,yi)(i=1,2,3,4,5,……),得散点图1,对变量u,v有观测数据(ui,vi),(i=1,2,3,4,5,……),得散点图2,由这两个散点图可以判断(
)
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v正相关
C
链接高考
7.
(2012
全国)在一组样本数据(x1,y1),(x2,y2),...,(xn,yn)
(n≥2,x1,x2,...,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,3,,,n)都在直线y=1/2+1上,则这组数据的样本相关系数为(
)
A.
-1
B.
0
C.
1/2
D.1
D
课堂总结
1.变量的相关关系
2.样本相关系数
板书设计
一.新知导入
二.新知讲解
变量的相关关系与样本相关系数
三.例题讲解
四.课堂练习
五.拓展提高
六.链接高考
七.课堂总结
八.作业布置
作业布置
课本P103~P104
习题8.1
第1~4题
https://www.21cnjy.com/help/help_extract.php中小学教育资源及组卷应用平台
8.1成对数据的相关性教学设计
课题
成对数据的相关性
单元
第八单元
学科
数学
年级
高二
教材分析
本节内容主要是成对数据的相关性,由常见的函数问题导入,探究成对数据间的关系,学习变量间的相关关系与样本的相关系数,并使用其解决一些实际问题.
教学目标与核心素养
数学抽象:利用生活中的实际问题,为了寻求成对数据间的关系,引入相关系数;
逻辑推理:通过导入及课堂探究逐步培养学生的逻辑思维能力;
数学建模:掌握成对数据的相关关系,计算样本的相关系数;
数学运算:能够正确判断相关关系,计算相关系数;
5、数学分析:通过经历提出问题—推导过程—得出结论—例题讲解—练习巩固的过程,让学生认识到数学知识的逻辑性和严密性.
重点
掌握相关关系的判断,计算相关系数.
难点
利用样本的相关关系,解决一些实际问题.
教学过程
教学环节
教师活动
学生活动
设计意图
导入新课
新知导入:
情景一:1、将汽油均匀的速度倒入桶里,注入的时间t与注入的油量y的函数关系是:
y=2x
2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v与时间t的函数图像大致是怎样的?
v=150/t
小麦的产量y与施肥量x的关系如下:
情景二:
在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示。
表中每一个序号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据。
思考:根据以上数据,可以判断人体的脂肪含量与年龄之间存在怎样的关系?
分析:为了更加直观的描述脂肪含量与年龄之间的关系,用横轴表示年龄,纵轴表示脂肪含量,则表中的每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图。我们把这样的统计图叫做散点图。
观察图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
学生思考问题,引出本节新课内容。
设置问题情境,激发学生学习兴趣,并引出本节新课。
讲授新课
新知讲解:
变量相关关系的分类:
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当—个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关。
例如:
(1)商品销售收入与广告支出经费之间的关系(正相关)
(2)粮食产量与施肥量之间的关系(正相关)
(3)人体内脂肪含量与年龄之间的关系(正相关)
思考:两个变量正相关、负相关时,成对样本数据的散点图有什么特点?
散点图中的点散布在从左下角到右上角的区域
散点图中的点散布在从左上角到右下角的区域
变量相关关系的分类:
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关。
如果两个变量具有相关性,但不是线性相关,那我们就称这两个变量非线性相关或曲线相关。
问题:如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析?
根据散点图特征,初步构造统计量。
一般地,如果变量x和变量y正相关,那么均值平移后的大多数点将分布在第一、三象限,对应的成对数据同号居多;
如果变量x和变量y负相关,那么关于均值平移后的大多数点将分布在第二、四象限,对应的成对数据异号居多.
利用散点(xi-?x,yi-?y)(i=1,2,...,n)的横纵坐标是否同号,可以构造一个量
一般情形下,Lxy>0表明成对样本数据正相关;
Lxy<0表明成对样本数据负相关.
思考:你认为
Lxy
的大小一定能度量出成对样本数据的相关程度吗?
因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小。
我们称r为变量x和变量y的样本相关系数。
样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对数据的变化特征∶?
当r>0
时,称成对数据正相关。
当r<0
时,称成对数据负相关。
思考:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
我们先考察一下r的取值范围:
观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,我们将向量的维数推广到n维,n维向量a,b的数量积仍然定义为
a·b=|a||b|cosθ,
其中θ为向量a,b的夹角.类似于平面或空间向量的坐标表示,对于向量
a=(a1,
a2,...,an)
和b=(b1,
b2,...,bn
)
,
我们有
a·b=a1b1+a2b3+anbn
设标准化处理后的成对样本数据:
其第一分量为
其第二分量为
因为,所以样本相关系数
由-1≤cosθ≤1,可知
思考:当|r|=1时,成对样本数据之间具有怎样的关系?
成对样本数据的两个分量之间满足一种线性关系.
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值的大小可以反映成对数据之间的线性相关的程度:
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱。
线性相关程度的判断:
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
例题讲解:
例1:根据脂肪含量和年龄的样本数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度。
解:
画出散点图如右。
由散点图,可以看出样本点都集中在一条直线附近,由此可以判断脂肪含量和年龄线性相关。
根据样本相关系数的定义:
利用计算工具计算得?x≈48.07,?y≈27.26
带入上式得r≈0.97
由样本相关系数r≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
例2:有人收集了某城市居民年收入(即所有居民在一年内收入的总和)与A产品销售额的10年数据,如图所示
画出散点图,判断成样本数据是否线性相关,并通过样本相关系数,判断居民年收入与A商品销售额的相关程度和变化趋势的异同。
解:
画出成对样本数据的散点图
从散点图来看,A商品的销售额与居民年收入的样本数据呈现出线性相关关系。
由样本数据计算得样本相关系数r≈0.95
由此推断,A商品销售额与居民年收入正线性相关,且相关性很强。
例3
在某校高一年级中随机抽取25名男生,测得他们的身高,体重,臀展等数据,如表所示。
体重与身高,臀展与身高分别具有怎样的相关性?
解:根据样本数据分别画出体重与身高,臀展与身高的散点图。两个散点图都呈现线性相关的特征。
通过计算得到体重与身高,臀展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关。其中臀展与身高的相关程度更高。
课堂练习:
1、下列图形中两个变量具有相关关系的是(
C
)
2、观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应的是( D )
A.①②③
B.②③①
C.②①③
D.①③②
3.对四组变量x,y进行线性相关实验,已知n是观测值指数,r是相关系数,且已知:
(1)n=7,r=0.9533
(2)n=15,r=0.3102
(3)n=17,r=0.4991
(4)n=3,r=0.9950
则变量y与x具有线性相关关系的是(
B
)
A
.(1)和(2)
B.
(1)和(4)
C.(2)和(4)
D
.(3)和(4)
4.下列两个变量之间的关系不具有线性关系的是
(
B
)
A.小麦产量与施肥值
B.球的体积与表面积
C.蛋鸭产蛋个数与饲养天数
D.甘蔗的含糖量与生长期的日照天数
拓展提高:
5.
在一组样本数据(x1,y1),(x2,y2)…(xn,yn)(n≥2,x1,x2,...,xn互不相等)的散点图中,若所有样本点(xi,yi),(i=1,2,3,…)都在直线y=1/2-1上,则这组样本数据的相关系数为(
D
)
A.
-1
B.
0
C.
1/2
D.
1
链接高考:
6.(2009年
宁夏理)对变量x,y有观测数据(xi,yi)(i=1,2,3,4,5,……),得散点图1,对变量u,v有观测数据(ui,vi),(i=1,2,3,4,5,……),得散点图2,由这两个散点图可以判断(
C
)
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v正相关
7.
(2012
全国)在一组样本数据(x1,y1),(x2,y2),...,(xn,yn)(n≥2,x1,x2,...,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,3,,,n)都在直线y=1/2+1上,则这组数据的样本相关系数为(
D
)
A.
-1
B.
0
C.
1/2
D.1
学生根据情境问题,探究变量的相关关系与样本的相关系数
利用例题引导学生掌握并灵活运用变量的相关关系与样本的相关系数
解决实际相关问题
通过课堂练习,检验学生对本节课知识点的掌握程度,同时加深学生对本节课知识点的掌握及运用
利用情境问题,探究变量的相关关系与样本的相关系数,培养学生探索的精神.
加深学生对基础知识的掌握,并能够灵活运用基础知识解决具体问题
通过练习,巩固基础知识,发散学生思维,培养学生思维的严谨性和对数学的探索精神。
课堂小结
变量的相关关系
样本相关系数
学生回顾本节课知识点,教师补充。
让学生掌握本节课知识点,并能够灵活运用。
板书
§8.1
成对数据的相关性
一、新知导入
三、例题讲解
二、新知讲解
四、课堂练习
1.变量的相关关系
2.样本相关系数
五、拓展提高
六、课堂总结
七、作业布置
21世纪教育网
www.21cnjy.com
精品试卷·第
2
页
(共
2
页)
21世纪教育网(www.21cnjy.com)