8.1 成对数据的统计相关性 课件(共42张PPT)-数学人教A版(2019)选择性必修第三册

文档属性

名称 8.1 成对数据的统计相关性 课件(共42张PPT)-数学人教A版(2019)选择性必修第三册
格式 pptx
文件大小 5.6MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2024-03-18 21:14:25

图片预览

文档简介

(共42张PPT)
8.1 成对数据的统计相关性
8.1.1 变量的相关关系
探究新知
问题1:正方形的面积y与正方形的边长x之间的函数关系是一个确定的关系吗
y = x2
确定性关系
1.两个变量之间的关系
我们知道,一个人的体重与他的身高有关系.一般而言, 个子高的人往往体重值较大,个子矮的人往往体重值较小.
但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.
问题2:一个人的体重与他的身高是一个确定性的关系
新课讲解
2.变量的相关关系:
相关关系是一种不确定性关系
相关关系是相对于函数关系而言的
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
新课讲解
3.现实生活中存在着大量的相关关系.
如: (1).子女的身高y与父亲身高x之间的关系;
(2).商品的销售收入y与广告支出x之间的关系;
(3).空气污染指数y与汽车保有量x之间的关系;
(4).粮食亩产量y与施肥量x之间的关系;
巩固训练
1. 下列变量之间的关系是相关关系的是( )
A.正方体的表面积与体积
B.光照时间与果树的产量
C.匀速行驶车辆的行驶距离与时间
D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩
B
新课讲解
关系 项目 函数关系 相关关系
相同点
都是两个变量间的关系
不同点
是一种确定关系
是一种非确定关系
是一种因果关系
不一定是因果关系,也可能是伴随关系
相关关系与函数关系的异同点?
新课讲解
因此,在研究两个变量之间的相关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
对两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断。“经验之中有规律”,经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足.例如经验比较主观、经验不具有普适性等.
两个变量之间相关关系的确定
课堂探究
在对人体脂肪含量和年龄的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表,表中每个编号下的年龄和脂肪含量数据都是对同一个个体的观测结果,它们构成了成对数据.
编号 1 2 3 4 5 6 7
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
编号 8 9 10 11 12 13 14
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
根据上述数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?
新课讲解
编号 1 2 3 4 5 6 7
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
编号 8 9 10 11 12 13 14
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
散点图
以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们我们把这样的统计图叫做散点图.
新课讲解
由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
新课讲解
当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.
如果从整体上看, 当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.
变量相关关系的分类
(1)正相关和负相关
新课讲解
散点图中的点散布在从左下角到右上角的区域
散点图中的点散布在从左上角到右下角的区域
(2).两个变量正相关和负相关散点图的特点
正相关
负相关
变量相关关系的分类
新课讲解
散点图是描述成对数据之间关系的一种直观方法. 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关
①线性相关
(3)线性相关和非线性相关
变量相关关系的分类
新课讲解
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
②非线性相关
(3)线性相关和非线性相关
变量相关关系的分类
典型例题
x 10 15 17 20 25 28 32
y 1 1.3 1.8 2 2.6 2.7 3.3
解:(1)散点图如右图所示:
(2)由图可知,所有数据点接近直线排列,因此,认为y与x有线性相关关系,且为正相关.
例1.
某公司的利润y(单位:千万元)与销售总额x(单位位:千万元)之间有如下表对应数据:
(1)画出散点图;
(2)判断y与x是否具有线性相关关系
X
30
25
20
15
10
0
5
35
Y
0.5
1
1.5
2
2.5
3
3.5
·
·
·
·
·
·
·
课堂小结
1.变量的相关关系
2.散点图
3.变量相关关系的分类
正相关和负相关
线性相关和非线性相关
本节课你有哪些收获?请做一下总结!
小结
8.1 成对数据的统计相关性
8.1.2 样本相关系数
新课讲解
学习目标
1. 结合实例,了解两个随机变量间的样本相关系数的含义,了解样本相关系数与“标准化”处理后的成对数据两分量向量夹角的关系;
2.会利用公式求出相关系数r,并能利用相关系数r判断两个随机变量间线性相关程度的大小.
3.核心素养: 直观想象、数据分析、逻辑推理、数学运算.
复习回顾
1.变量的相关关系
2.散点图
3.变量相关关系的分类
正相关和负相关
线性相关和非线性相关
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做散点图
4.两个变量之间相关关系的确定
(1)经验作出推断
(2)通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断
探究新知
平移
绘制散点图为
1.如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析
新课讲解
如果变量x和变量y负相关,那么关于均值平移后的大多数点 将分布在第二、四象限,对应的成对数据异号居多.
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
一般地,如果变量x和变量y正相关,那么 均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多;
新课讲解
根据散点图特征,初步构造统计量.
利用散点 的横纵坐标是否同号,可以构造一个量
一般情况下, 表明成对样本数据正相关;
>0
表明成对样本数据负相关;
<0
新课讲解
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度.
你认为 的大小一定能度量出成对样本数据的相关程度吗
我们发现, 的大小与数据的度量单位有关,所以
不能直接用它度量成对样本数据相关程度的大小.
新课讲解
为了消除单位的影响,进一步做“标准化”处理
新课讲解
当r >0时,称成对样本数据正相关;
当r <0时,称成对样本数据负相关.
我们称 r 为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
样本相关系数
新课讲解
标准化处理后的成对样本数据:
设第一分量为
第二分量为
样本相关系数 r 的大小与成对样本数据的相关程度有什么内在联系呢
新课讲解
样本相关系数r的取值范围
样本相关系数r的取值范围为[-1,1]
新课讲解
当|r|=1时,成对样本数据之间具有怎样的关系?
所以 当|r|=1时 ,向量 与 共线。
即存在实数 ,使得
成对样本数据(xi,yi)都落在直线 上
成对样本数据的两个分量之间满足一种线性关系
新课讲解
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数 r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
新课讲解
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数 r 可以反映两个随机变量之间的线性相关程度:
r 的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
判断线性相关程度: 散点图+r
典型例题
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
例1.
根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
参考数据:
新课讲解
例1.
根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
解:先画出散点图,如下图所示
观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.
由样本相关系数 ,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.
新课讲解
散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度.
新课讲解
解:
例2.有人收集了某城市居民收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如下表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
居民年收入/亿元
50
45
40
35
20
30
25
30
35
40
45
50
·
·
·
·
·
·
·
55
A商品销售额/万元
·
·
·
新课讲解
例2.有人收集了某城市居民收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如下表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
新课讲解
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性
解:
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.
其中,臂展与身高的相关程度更高.
巩固训练
1.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(   )
A.r2C.r4A
巩固训练
2.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
依据数据的散点图可以看出,y与x之间有较强的线性相关关系.请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高):
0
2
4
6
8
3
4
5
X(千克)
y(百千克)
5
·
·
·
·
·
附:样本相关系数公式
巩固训练
∵r>0.75,∴可用线性回归模型拟合y与x的关系.
课堂小结
样本相关系数r
(1)当r >0时,称成对样本数据正相关;当r <0时,称成对样本数据负相关.
(2)r 的取值范围为[-1,1]
(3)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
本节课你有哪些收获?请做一下总结!
小结