8.1.2样本的相关系数(28张ppt)

文档属性

名称 8.1.2样本的相关系数(28张ppt)
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-03-13 15:52:32

图片预览

文档简介

(共28张PPT)
第八章
成对数据的统计分析
8.1.2样本的相关系数
一、温故知新
1.变量的相关关系
2.散点图
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图叫做散点图
3.变量相关关系的分类
正相关和负相关
线性相关和非线性相关
4.两个变量之间相关关系的确定
(1).经验作出推断
(2).通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断
一、温故知新
二、自主探究
1思考.如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析
平移
绘制散点图为
如果变量x和变量y负相关,那么关于均值平移后的大多数点 将分布在第二、四象限,对应的成对数据异号居多.
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
一般地,如果变量x和变量y正相关,那么 均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多;
根据散点图特征,初步构造统计量.
利用散点 的横纵坐标是否同号,
可以构造一个量
一般情况下, 表明成对样本数据正相关;
>0
表明成对样本数据负相关;
<0
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度.
思考:你认为 的大小一定能度量出成对样本数据的相关程度吗
我们发现, 的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小.
为了消除单位的影响,进一步做“标准化”处理
当r >0时,称成对样本数据正相关;
当r <0时,称成对样本数据负相关.
我们称 r 为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
2.样本相关系数
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢
标准化处理后的成对样本数据:
设其第一分量为
设其第二分量为
样本相关系数r的取值范围
样本相关系数r的取值范围为[-1,1]
当|r|=1时,成对样本数据之间具有怎样的关系?
所以 当|r|=1时 ,向量 与 共线。
即存在实数 ,使得
成对样本数据(xi,yi)都落在直线 上
成对样本数据的两个分量之间满足一种线性关系
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:
①r 的符号反映相关关系的正负性,
②|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
判断线性相关程度: 散点图+r
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
三、巩固提升
例1.
根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
参考数据:
解:先画出散点图,如右图所示
观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.
由样本相关系数 ,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.
散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度.
解:
例2.有人收集了某城市居民收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如下表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
居民年收入/亿元
50
45
40
35
20
30
25
30
35
40
45
50
·
·
·
·
·
·
·
55
A商品销售额/万元
·
·
·
例2.有人收集了某城市居民收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如下表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
例3.
在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性
解:画出散点图
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.
对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(  )
A.r2B.r4C.r4D.r2A
变式训练1
根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
依据数据的散点图可以看出,y与x之间有较强的线性相关关系.请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高):
0
2
4
6
8
3
4
5
X(千克)
y(百千克)
5
·
·
·
·
·
附:样本相关系数公式
变式训练2
∵r>0.75,∴可用线性回归模型拟合y与x的关系.
样本相关系数r
(1)当r >0时,称成对样本数据正相关;当r <0时,称成对样本数据负相关.
(2)r 的取值范围为[-1,1]
(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
四、课堂小结
作业: 课本P103 习题8.1 1,2题