8.1.1-2变量的相关关系与样本的相关系数 课件(共30张PPT)

文档属性

名称 8.1.1-2变量的相关关系与样本的相关系数 课件(共30张PPT)
格式 pptx
文件大小 4.5MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-04-01 04:18:35

图片预览

文档简介

8.1.1变量的相关关系
学习目标
0
1.结合实例,体会两个变量间的相关关系.
2.掌握相关关系的判断,能根据散点图对线性相关关系进行判断.
情景导入
1
俗话说“庄稼一枝花,全靠肥当家”,这说明施肥的多少对粮食的产量影响很大,那么粮食的产量还受其他因素的影响吗?施肥量和粮食的产量是确定的函数关系吗?两个变量间的关系除了可能是函数关系外,还可能是其他关系吗?为了搞清这些问题,我们需要学习本节内容.
问题 上述情境中施肥量与粮食产量之间到底具有怎样的关系?
提示 上述两变量间确实存在关系,但又不具备确定性,即当自变量取值一定时,因变量取值带有随机性的两个变量的关系,就称为变量间的相关关系.
新知探究
2
探究点1 变量之间的相关关系
1.两变量之间的关系
(1)函数关系:
当自变量取值一定时,因变量取值由它唯一确定,如正方形面积与边长的关系, 路程与速度之间的关系等
(2)相关关系:
当自变量取值一定时,因变量的取值带有一定的随机性,如
“吸烟有害健康”,
“名师出高徒”,
“虎父无犬子”,
“瑞雪兆丰年”,
“城门失火殃及池鱼”等
新知探究
2
2、相关关系的概念
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
注:①相关关系是一种不确定性关系;
②相关关系是相对于函数关系而言的.
现实生活中存在的许多相关关系的问题.例如:
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄;
(4) 光照时间与果树的产量
相关关系与函数关系的异同点:
相同点:均是指两个变量的关系.
新知探究
2
不同点:
1.函数关系是一种确定的关系;而相关关系是一种非确定关系.
2.相关关系中两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响.
3.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
在研究两个变量间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
新知探究
2
探究点2 变量的正相关与负相关
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
人体的脂肪百分比和年龄
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?
新知探究
2
1.散点图
为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,以x轴表示年龄,y轴表示脂肪含量,通过作图可以对两个变量之间的关系有一个直观的印象.
20
40
30
50
10
30
20
40
脂肪含量
60
0
10
年龄
把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,
新知探究
2
2.变量相关关系的分类
(1)正相关和负相关
正相关:指的是两个变量有相同的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变大,点的位置散布在从左下角到右上角的区域;
负相关:指的是两个变量有相反的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变小,点的位置散布在从左上角到右下角的区域内.









正相关









负相关
(2)两个变量正相关和负相关散点图的特点
新知探究
2
(3)线性相关和非线性相关
①线性相关
散点图是描述成对数据之间关系的一种直观方法.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关
o
x
y










②非线性相关
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
o
x
y










随堂练习
3
1:某公司的利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下表对应数据:
(1)画出散点图;
(2)判断y与x是否具有线性相关关系。
{5940675A-B579-460E-94D1-54222C63F5DA}x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
解:(1)散点图如右图所示:
(2)由图可知,所有数据点接近直线排列,因此,认为y与x有线性相关关系,且为正相关。
随堂练习
3
2. 根据下面的散点图,推断图中的两个变量是否存在相关关系.



随堂练习
3
3.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系? 如果是,那么这种相关关系有什么特点?
地区
A
B
C
D
E
F
G
H
I
J
K
海拔高度/m
1250
1158
1067
457
701
731
610
670
1493
762
549
鸟的种类/种
36
30
37
11
11
13
17
13
29
4
15
解:画鸟的种类数与海拔高度的散点图,如图所示.
5
10
海拔高度/m
20
1600
1400
1200
600
0
200
400
800
1000
15
40
35
30
25
鸟的种类/种
?
?
?
?
?
?
?
?
?
?
?
从散点图中散点的分布看,鸟的种类数与海拔高度正相关,鸟的种类数在海拔高度1000m以上的明显多于在海拔高度1000m以下的. 但从局部看,不管是在海拔高度1000m以上,还是在海拔高度1000m以下,鸟的种类数和海拔高度正相关都不明显.
8.1.2样本相关系数
学习目标
0
1.结合实例,了解样本相关系数的统计含义.
2.了解样本相关系数与标准化数据向量夹角的关系.
3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性.
4.会求出样本相关系数r,并能利用样本相关系数r判断两个随机变量间线性相关
程度的大小
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
问题引入
1
新知探究
2
对于变量????和变量????,设经过随机抽样得到的成对数据为(????1,????1),(????2,????2),?
,(????????,????????),
?
?
?
绘制散点图为
平移
这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号,显然,这样的规律是由人体脂肪含量与年龄正相关所决定的
新知探究
2
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
如果变量x和变量y正相关,那么均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多;
如果变量x和变量y负相关,那么关于均值平移后的大多数点将分布在第二、四象限,对应的成对数据异号居多.
探究3:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后星现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
根据散点图特征,初步构造统计量.
利用散点 的横纵坐标是否同号,可以构造一个量
新知探究
2
一般情形下,Lxy>0表明成对样本数据正相关; Lxy <0表明成对样本数据负相关.
问题1: Lxy的大小一定能度量出成对样本数据的相关程度吗?
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度.
我们发现, Lxy的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小.
为了消除单位的影响,进一步做“标准化”处理
?
新知探究
2
?
?
?
新知探究
2
样本相关系数
我们称r为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,
它的正负和绝对值的大小可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。
当r<0时,称成对样本数据负相关;当其中一个数据的值变小时,另一个数据的值通常会变大:当其中一个数据的值变大时,另一个数据的值通常会变小。
新知探究
2
判断正误.(请在括号中打“√”或“×”)
(1)样本相关系数r的符号反映了相关关系的正负性. (  )
(2)对于简单随机样本而言,样本相关系数r是确定的. (  )
(3)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好. (  )
(4)r=0表明成对样本数据间就不存在相关性. (  )
[解析]r=0只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
[解析]对于简单随机样本而言,样本具有随机性,因此样本相关系数r也具有随机性.

×

×
典型例题
3
例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
参考数据:
典型例题
3
解:先画出散点图,如右图所示观察散点图,
可以看出样本点都集中在一条直线附近,
由此推断脂肪含量和年龄线性相关.
?
由样本相关系数????≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.
散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度.
新知探究
2
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
?
????1′,????1′,????2′,????2′,...,????????′,????????′
?
标准化处理后的成对样本数据:
设其第一分量为
????′=(????1′,????2′,...,????????′)
?
设其第二分量为
????′=(????1′,????2′,...,????????′)
?
当|r|=1时 ,向量 与 共线.
????′
?
????′
?
新知探究
2
样本相关系数r的取值范围
样本相关系数r的取值范围为[-1,1]
当|r|=1时,成对样本数据之间具有怎样的关系?
即存在实数 ,使得
????
?
????′=????????′
?
成对样本数据(xi,yi)都落在直线 上
成对样本数据的两个分量之间满足一种线性关系
新知探究
2
样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
典型例题
3
例2. 有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
第n年
1
2
3
4
5
6
7
8
9
10
居民年收入/亿元
32.2
31.1
32.9
35.8
37.1
38
39
43
44.6
46
A商品销售额/万元
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
解:
从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性?
解:
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.
典型例题
3
课堂小结
4
样本相关系数r
(1)当r >0时,称成对样本数据正相关;当r <0时,称成对样本数据负相关.
(2)r 的取值范围为[-1,1]
(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.