8.1.2 样本相关系数-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册课件(22张PPT)

文档属性

名称 8.1.2 样本相关系数-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册课件(22张PPT)
格式 pptx
文件大小 698.9KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-04-30 22:35:49

图片预览

文档简介

8.1.2 样本相关系数
引入
通过散点图可以推断两个变量之间是否存在相关关系、是正相关还是负相关、是线性相关是非线性相关,但这些推断是定性的推断.
从定量的角度刻画成对样本数据的线性相关程度,进而推断两个变量的线性相关程度。
样本相关数r
1、结合实例,了解样本相关系数的统计含义;
2、了解样本相关系数与“标准化”处理后的成对数据两分量向量夹角的关系。
3、结合实例,会通过相关系数比较多组成对数据的相关性。
问题1:如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析?
根据散点图特征,初步构造统计量。
年龄/岁
脂肪含量/%
中心化
一般地,如果变量x和变量y正相关,那么关于均值平移后的大多数点将分布在第一、三象限,对应的成对数据同号居多;如果变量x和变量y负相关,那么关于均值平移后的大多数点将分布在第二、四象限,对应的成对数据异号居多。
成对样本数据(x1,y1),(x2,y2),...,(xn,yn);????=????????+????????+...+????????????;????=????????+????????+...+????????????.
?
将数据以(????,????)为零点进行平移,得到平移后的数据为
?
利用散点(x?????????,yi?????)(i=1,2,...,n)的横纵坐标是否同号,可以构造一个量
?
一般情形下, 表明成对样本数据正相关;
    表明成对样本数据负相关.
问题2:你认为 的大小一定能度量出成对样本数据的相关程度吗?
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。
我们发现, 的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小。
为了消除单位的影响,进一步做“标准化”处理
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关.
我们称r为变量x和变量y的样本相关系数。
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
问题3:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
标准化处理后的成对样本数据:
设其第一分量为
设其第二分量为
问题3:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
追问1:当|r|=1时,成对样本数据之间具有怎样的关系?
所以 当|r|=1时 ,向量 与 共线。
即存在实数 ,使得
成对样本数据(xi,yi)都落在直线 上 。
成对样本数据的两个分量之间满足一种线性关系.
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
注意:
散点图
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
判断线性相关程度:散点图+r
对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(  )
 A.r2 C.r4A
练习1:
例1:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?
{5940675A-B579-460E-94D1-54222C63F5DA}年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
{5940675A-B579-460E-94D1-54222C63F5DA}年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
参考数据:
解:先画出散点图,如下图所示:
观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关。
例1:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?
年龄/岁
脂肪含量/%
例1:根据下表中脂肪含量和年龄的样本数据,画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断年龄和脂肪的相关程度和变化趋势的异同?
由样本相关系数 ,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同。
小结
散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度。

例2:随机抽取7家超市,得到其广告支出与销售额数据如下:
{5940675A-B579-460E-94D1-54222C63F5DA}超市
A
B
C
D
E
F
G
广告支出/万元
1
2
4
6
10
14
20
销售额/万元
19
32
44
40
52
53
54
请推断超市的销售额和广告支出之间的相关关系的类型、相关程度和变化趋势的特征。
解:从散点图分布来看,销售额与广告支出正相关。
例2:随机抽取7家超市,得到其广告支出与销售额数据如下:
{5940675A-B579-460E-94D1-54222C63F5DA}超市
A
B
C
D
E
F
G
广告支出/万元
1
2
4
6
10
14
20
销售额/万元
19
32
44
40
52
53
54
请推断超市的销售额和广告支出之间的相关关系的类型、相关程度和变化趋势的特征。
所以超市的销售额和广告支出正相关、相关程度较强、销售额和广告支出变化趋势相同,但随着广告支出超过10万元后,销售额增加幅度变缓。
课堂小结
1、样本相关系数r
(1)当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关.
(2)r 的取值范围为[-1,1]
(3)当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.