数学人教A版(2019)选择性必修第三册8.1 成对数据的统计相关性(共51张ppt)

文档属性

名称 数学人教A版(2019)选择性必修第三册8.1 成对数据的统计相关性(共51张ppt)
格式 zip
文件大小 17.4MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-03-09 20:47:34

图片预览

文档简介

(共51张PPT)
8.1成对数据的统计相关性
第8章 成对数据的统计分析
人教A版(2019) 选择性必修第三册
1、将汽油均匀的速度倒入桶里,注入的时间t与注入的油量y的函数关系是:
时间t 1 2 3 4 5
油量 2 4 6 8 10
2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v与时间t的函数图像大致是怎样的?
3、小麦的产量y与施肥量x的关系如下:
施肥量x 20 30 40 50 60
产量y 440 460 470 480 510
能判断它们有函数关系吗?
y=2x
v=150/t
问题引入
在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示。 表中每一个序号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据。
编号 1 2 3 4 5 6 7
年龄/岁 23 27 39 41 45 49 50
脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2
编号 8 9 10 11 12 13 14
年龄/岁 53 54 56 57 58 60 61
脂肪含量/% 29.6 30.2 31.4 30.8 33.5 35.2 34.6
探究新知
分析:为了更加直观地描述脂肪含量与年龄之间的关系,用横轴表示年龄,纵轴表示脂肪含量,则表中的每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图所示的统计图。我们把这样的统计图叫做散点图。
思考:根据以上数据,可以判断人体的脂肪含量与年龄之间存在怎样的关系?
探究新知
观察图,可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
探究新知
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当—个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关。
例如:
(1)商品销售收入与广告支出经费之间的关系
(2)粮食产量与施肥量之间的关系
(3)人体内脂肪含量与年龄之间的关系
正相关
正相关
正相关
变量相关关系的分类:
探究新知
散点图中的点散布在从左下角到右上角的区域
思考:两个变量正相关、负相关时,成对样本数据的散点图有什么特点?
散点图中的点散布在从左上角到右下角的区域
探究新知
散点图是描述成对数据之间关系的一种直观方法.
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在
一条直线附近,我们就称这两个变量线性相关.
线性相关:
变量相关关系的分类:
探究新知
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称
这两个变量非线性相关或曲线相关.
非线性相关:
探究新知
问题:如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析?
根据散点图特征,初步构造统计量。
年龄/岁
脂肪含量/%
平移
探究新知
一般地,如果变量x和变量y正相关,
那么均值平移后的大多数点将分布
在第一、三象限,对应的成对数据
同号居多;
如果变量x和变量y负相关,那么关于均值
平移后的大多数点将分布在第二、四象限,
对应的成对数据异号居多.
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
探究新知
利用散点(x,yi)(i=1,2,...,n)的横纵坐标是否同号,可以构造一个量
一般情形下,表明成对样本数据正相关;
    表明成对样本数据负相关.
探究新知
思考:你认为 的大小一定能度量出成对样本数据的相关程度吗?
因为的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小。
例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位
由米改为厘米,则相应的将增大为原来的100倍,但单位的改变不会改变体重
与身高之间的相关程度。
探究新知
为了消除单位的影响,进一步做“标准化”处理,
分别除-(i=1,2,┈,n),得
标准化处理后的成对数据分别记为,
探究新知
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关.
我们称r为变量x和变量y的样本相关系数。
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
探究新知
思考:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
我们先考察一下r的取值范围:
观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,
我们将向量的维数推广到n维,n维向量a,b的数量积仍然定义为
a·b=|a||b|cos θ,
其中θ为向量a,b的夹角.类似于平面或空间向量的坐标表示,对于向量
a=(a1, a2,...,an) 和b=(b1, b2,...,bn ) ,我们有
a·b=a1b1+a2b3+anbn
探究新知
设标准化处理后的成对样本数据:
其第一分量为
其第二分量为
因为 ,所以样本相关系数
探究新知
思考:当|r|=1时,成对样本数据之间具有怎样的关系?
当|r|=1时, ,向量与共线.
即存在实数,使得
表明成对样本数据(xi, yi)都落在直线
上,成对样本数据的两个分量之间满足一种线性关系.
探究新知
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值的大小可以反映成对数据之间的线性相关的程度:
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱。
探究新知
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
线性相关程度的判断:
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
探究新知
1.(多选)下列关于样本相关系数r的说法中正确的是(  )
A.样本相关系数r越大两个变量间相关程度越强
B.样本相关系数r的取值范围为[-1,1]
C.样本相关系数r>0时两个变量正相关,r<0时两个变量负相关
D.样本相关系数r=1时,样本点在同一直线上



课堂练习
解析:对于样本相关系数r,有以下结论:①当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.②r的绝对值越接近于1,表明两个变量的线性相关程度越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
对于A,当r<0时此结论不成立,所以A不正确;
对于B,由样本相关系数的性质可得-1≤r≤1,所以B正确;
对于C,由样本相关系数的性质可知正确;
对于D,由样本相关系数的性质可知正确.
课堂练习
2.我们常说“吸烟有害健康”,则吸烟与健康之间的关系是(  )
A.正相关         B.负相关
C.无相关 D.不确定
解析:烟吸得越多,则健康程度越差.

课堂练习
3.在一次试验中,测得(x,y)的4组值分别为(1,2),(2,0),(4,-4),
(-1,6),则y与x的样本相关系数为(  )
A.1 B.-2
C.0 D.-1

课堂练习
4.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看:
课堂练习
(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;
(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.
课堂练习
解析:(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;(2)由高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级的排名情况的散点图可知,两个图中,同一个人的总成绩是不会变的.第二个图看,丙是从右往左数第5个点,即丙的总成绩在班里倒数第5.在左边的图中,找到倒数第5个点,它表示的就是丙,发现这个点的位置比右边图中丙的位置高,所以语文名次更“大”,即数学的成绩更靠前.
答案:(1)乙 (2)数学
课堂练习