(共29张PPT)
成对数据的统计分析
第八章
8.1.1 变量的相关关系 8.1.2 样本相关系数
8.1 成对数据的统计相关性
课程内容标准 学科素养凝练
1.结合具体实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系. 2.结合实例,会通过相关系数比较多组成对样本数据的相关性. 在学习样本相关系数等概念的过程中,提升数学抽象、数据分析、数学建模的核心素养.
课前 预习案
1.两个变量有关系,但又没有确切到由其中的一个去精确地决定另一个的程度,这种关系称为___________.
2.散点图
将成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
一、相关关系
相关关系
3.正相关、负相关
如果从整体上看,当一个变量的值_______时,另一个变量的相应值也呈现_______的趋势,我们就称这两个变量正相关;如果当一个变量的值_______时,另一个变量的相应值呈现_______的趋势,则称这两个变量负相关.
增加
增加
增加
减少
1.线性相关
一般地,如果两个变量的取值呈现_________或_________,而且散点落在___________附近,我们就称这两个变量线性相关.
2.非线性相关(或曲线相关)
一般地,如果两个变量具有_________,但_______线性相关,那么我们就称这两个变量非线性相关或曲线相关.
二、线性相关与非线性相关(或曲线相关)
正相关
负相关
一条直线
相关性
不是
三、样本相关系数
2.样本相关系数的意义
样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:当r>0时,称成对样本数据_________;当r<0时,称成对样本数据_________.
3.相关系数r具有的性质
(1)样本相关系数r的取值样本范围为_____________,即___________;
(2)当|r|越接近1时,成对样本数据的线性相关程度_______;
(3)当|r|越接近0时,成对样本数据的线性相关程度_______.
正相关
负相关
[-1,1]
|r|≤1
越强
越弱
4.两个随机变量的相关性与样本相关系数r之间的关系
两个随机变量的相关性可以通过成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的_______________:r的符号反映了相关关系的_________;|r|的大小反映了两个变量线性相关的_______,即散点集中于一条直线的程度.一般地,样本容量_______,用样本相关系数估计两个变量的相关系数的效果_______.
线性相关程度
正负性
程度
越大
越好
1.判断下列说法是否正确,正确的在它后面的括号里打“√”,错误的打“×”.
(1)相关关系和函数关系都具有确定性. ( )
(2)粮食产量和当年的降雨量是一种函数关系. ( )
(3)圆的面积与其半径是函数关系. ( )
答案 (1)× (2)× (3)√
2.下面哪些变量是相关关系 ( )
A.出租车费与行驶的里程 B.房屋面积与房屋价格
C.身高与体重 D.铁块的体积与质量
答案 C
解析 A,B,D中的两个变量都是函数关系.
3.对于相关系数r,下列说法正确的是 ( )
A.|r|越大,相关程度越低
B.|r|越小,相关程度越高
C.|r|越大,相关程度越低,|r|越小,相关程度越高
D.|r|≤1,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低
答案 D
4.据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系____________(填“是”或“否”).
答案 否
解析 散点图中的点不存在一定的规律性,故这两个变量不具有线性相关关系.
相关关系与函数关系的异同
(1)相同点:两者均是指两个变量的关系.
(2)不同点:①函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系,如一块农田的水稻产量与施肥量之间的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
课堂 探究案
探究一 相关关系与函数关系的判断
(多选题)下列变量之间的关系是相关关系的是 ( )
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩田施肥量和粮食亩产量
答案 BCD
解析 在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量在一定范围内越多,粮食亩产量越高,所以B、C、D是相关关系.
[方法总结] 判定两个变量是否具有相关关系的方法
(1)根据两个变量的实际意义进行判断.
(2)利用有关的数学知识进行判断,注意与具有函数关系的变量的区别.
[训练1] (多选题)下列关系具有相关关系的是 ( )
A.炼钢时钢水的含碳量与冶炼时间的关系
B.曲线上的点与该点的坐标之间的关系
C.柑橘的产量与气温之间的关系
D.森林中的同一种树木,其横断面直径与高度之间的关系
答案 ACD
解析 对A,炼钢的过程就是一个降低含碳量进行氧化还原的过程,除了与冶炼时间有关外,还受冶炼温度等其他因素的影响,具有相关关系;对B,曲线上的点与该点的坐标之间的关系是一一对应的,即是一种确定性关系,不具有相关关系;对C,柑橘的产量除了受气温影响以外,还受施肥量以及水分等因素的影响,具有相关关系;对D,森林中的同一种树木,其横断面直径随高度的增加而增加,但是还受光照等因素的影响,具有相关关系.
以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
(1)画出数据对应的散点图;
(2)判断房屋的销售价格和房屋面积之间是否具有相关关系,如果有相关关系,是正相关还是负相关?
探究二 利用散点图判断变量间的相关关系
房屋面积x/m2 115 110 80 135 105
销售价格y/万元 49.6 43.2 38.8 58.4 44
解 (1)数据对应的散点图如图所示.
(2)通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,并且是正相关.
[方法总结] 两个随机变量x和y相关关系的确定方法
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.
解 (1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.且是正相关关系.
关于两个变量x和y的7组数据如下表所示:
探究三 样本相关系数及应用
[方法总结] 利用相关系数判断成对数据的相关性强弱的步骤
(1)由公式先计算出r的值.
(2)当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.
[训练3] 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.
解 列表如下: