(共18张PPT)
8.1.2样本相关系数
教学目标:
1、会通过散点图判断对样本数据的相关性
2、结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的对数据两分两向量夹角的关系
教学重难点:
重点:样本相关系数
重点:了解样本相关系数的统计含义,并比较数据相关性的强弱
知识回顾
1.变量间的相关关系是什么?
2.散点图是什么?
3.变量相关关系的分类是什么?
正相关
线性相关
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
成对样本数据可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图。
非线性相关
负相关
问题引入
散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?
问题引入
利用上述方法处理表中的数据, 得到下图.
我们发现,这时的散点大多数分布在第一象限、第三象限, 大多数散点的横、纵坐标同号. 显然, 这样的规律是由人体脂肪含量与年龄正相关所决定的.
一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如下图所示;
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如下图所示.
问题引入
问题引入
思考:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
思考:你认为Lxy的大小一定能度量出成对样本数据的相关程度吗?
Lxy的大小与数据的度量有关,故不宜直接用它度量成对样本数据相关程度的大小.
例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,则相应的Lxy将变为原来的100倍,但单位的改变并不会导致体重与身高之间相关程度的改变.
问题引入
为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.
分别除和,
得,,,.
.(1)
我们称为变量x和变量y的样本相关系数.
把上述“标准化”处理后的成对数据分别记为,,,,仿照的构造,可以得到
样本相关系数
对于变量x,y,利用成对样本数据(x1,y1),(x2,y2),…,(xn,yn)构造
则称r为变量x和变量y的样本相关系数.
(1)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
(2)取值范围为[-1,1]:
当|r|越接近1时,线性相关程度越强,当|r|越接近0时,线性相关程度越弱.当|r|=1时,表明成对样本数据都落在一条直线上;当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
知识应用
例1.根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
由样本相关系数 ≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.
解:先画出散点图, 可以看出样本点都集中在一条直线附近,
由此推断脂肪含量和年龄线性相关.
归纳总结:
例2. 有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额 的10年数据,如表所示.
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强。
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.
课堂总结
PART.04
1.样本相关系数;
2.样本相关系数的应用。
李思
作业布置
课本103页 练习题 3、4