4.1成对数据的统计相关性 学案(含答案) 高二数学湘教版(2019)选择性必修2

文档属性

名称 4.1成对数据的统计相关性 学案(含答案) 高二数学湘教版(2019)选择性必修2
格式 docx
文件大小 525.9KB
资源类型 教案
版本资源 湘教版(2019)
科目 数学
更新时间 2025-06-30 10:58:43

图片预览

文档简介

4.1 成对数据的统计相关性
学习目标
(1)通过实例,了解两个变量之间的关系,能用散点图表示它们的关系.(2)会作散点图,并利用散点图认识变量间的相关关系.(3)通过实例,了解相关系数的概念,理解相关系数的性质,并能用相关系数来研究两个变量的关系.(4)通过实例,了解多个变量之间的关系,能将多个变量分解成几个不同的两组数据分别进行相关性分析.(5)通过实例,了解向量夹角的概念,用向量夹角来研究两个变量的相关关系.
课前预习
要点一 相关关系
1.散点图:由坐标系及散点形成的数据图.
2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.
3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0 时,我们称r==为{xi},{yi}的相关系数.
5.相关系数的性质:
(1)rxy值范围是[-1,1].当0(2) |rxy|越接近于1时,变量x,y的线性相关程度越高 ,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.
(3)|rxy|越接近于0时,变量x,y的线性相关程度________.
(4)rxy具有对称性,即rxy=ryx.
(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
要点二 相关系数与向量夹角
把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.
.
当夹角在[0,)内时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.
当夹角在(,π]内时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.
当夹角为时,余弦值为0,说明两组数据不相关.
基 础 自 测
1.判断正误(正确的画“√”,错误的画“×”)
(1)若两个变量正相关,则样本相关系数大于0小于1.(  )
(2)相关系数越大,两个变量的相关性就越强.(  )
(3)若相关系数r=0,则两变量x,y之间没有关系.(  )
2.下列两个量之间的关系是相关关系的是(  )
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
3.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间(  )
A.具有很弱的线性相关关系
B.具有较强的线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
4.如图所示的两个变量具有相关关系的是________(填序号).
 题型探究·课堂解透——强化创新性
题型3 线性相关关系
例1 某零售店近5个月的销售额和利润额资料如下表所示:
(1)根据上表数据作出散点图;
(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?
方法归纳
两个变量是否线性相关的判断方法
巩固训练1 某个男孩的年龄与身高的统计数据如下表所示.
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
题型2 相关系数
例2 互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)
参考数据:
方法归纳
相关系数可以反映两个变量之间的线性相关程度,即散点集中于一条直线的程度,其符号反映了相关关系的正负性.用相关系数能够较准确的判断相关的程度.
巩固训练2 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:
根据上表中的样本数据,计算样本相关系数(精确到0.01),并推断它们的相关关系及相关程度.
题型3 多组成对数据的相关性
例3 某电器销售公司的管理人员认为,月销售收入是广告费用的函数.下面是该公司近8个月的月销售收入与广告费用数据,试分析其月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
题型4 相关系数与向量夹角
例4 用向量夹角分析例3中月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
4.1 成对数据的统计相关性
课前预习
[教材要点]
要点一
2.直线
5.(1)正相关 负相关 (3)越低 
[基础自测]
1.(1)√ (2)× (3)×
2.解析:A、D是函数关系;B是不相关关系;C是相关关系,故选C.
答案:C
3.解析:变量y与x之间的样本相关系数r=-0.983 2,|r|=0.983 2,接近1,样本相关系数的绝对值越大,相关性越强,
∴变量y与x之间有较强的线性相关关系,故选B.
答案:B
4.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.
答案:②③
题型探究·课堂解透
例1 解析:(1)散点图如图所示:
(2)由散点图可知,所有散点接近一条直线排列,
所以利润额与销售额是线性相关关系,
由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.
巩固训练1 解析:(1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
例2 解析:由题意知,==7,
==7,
样本相关系数r==≈0.857>0.8.
故可认为y与x有较强的线性相关关系.
巩固训练2 解析:=(26+56+39+49+61+53+27+58+41+60)=47,
=(14.5+31.4+21.2+26.3+34.6+29.6+17.8+33.5+25.9+35.2)=27,
r=

=,
因为≈6.56,≈54.18,
所以r=≈0.98,
由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.
例3 解析:由题意可得= 2=[(96-93.75)2+(90-93.75)2+…+(94-93.75)2]≈3.188,
=2=[(5-3.187 5)2+(2-3.187 5)2+…+(3-3.187 5)2]≈0.809,
= 2=[(1.5-2.475)2+(2-2.475)2+…+(2.5-2.475)2]≈0.727,
sxy==(96×5+90×2+…+94×3)-93.75×3.187 5≈1.297,
sxz==(96×1.5+90×2+…+94×2.5)-93.75×2.475≈-0.031,
所以rxy==≈0.808,
rxz==≈-0.020.
上述结果表明月销售收入与电视广告费用之间正相关程度高,月销售收入与报纸广告费用之间呈负相关关系.
例4 解析:由于≈93.75,≈3.187 5,≈2.475,将例3表中的三组数据分别减去.
记x=(x1-,x2-,…,x8-),y=(y1-,y2-,…,y8-),z=(z1-,z2-,…,z8-).
则可得
x=(2.25,-3.75,1.25,-1.75,1.25,0.25,0.25,0.25),
y=(1.812 5,-1.187 5,0.812 5,-0.687 5,-0.187 5,0.312 5,-0.687 5,-0.187 5),
z=(-0.975,-0.475,-0.975,0.025,0.825,-0.175,1.725,0.025),
于是有cos 〈x,y〉

≈0.808,
cos 〈x,z〉

≈-0.021.
由此可以看出,月销售收入与电视广告费用的余弦值较大,说明这两组数据正相关程度高;月销售收入与报纸广告费用的余弦值为负数,说明这两组数据呈负相关关系,且负相关程度较低.
同课章节目录