8.1 成对数据的统计相关性 学案(2份打包)(含答案) 2024-2025学年高二数学人教A版(2019)选择性必修3

文档属性

名称 8.1 成对数据的统计相关性 学案(2份打包)(含答案) 2024-2025学年高二数学人教A版(2019)选择性必修3
格式 zip
文件大小 258.2KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-03-13 21:47:04

文档简介

8.1 成对数据的统计相关性
课时2 样本相关系数
【学习目标】 1.了解样本相关系数公式的推导过程.(逻辑推理、直观想象) 2.掌握样本相关系数公式,并会运用.(数学运算) 3.了解样本相关系数公式与向量夹角公式之间的关系,掌握样本相关系数的范围.(逻辑推理、数学运算)
【自主预习】
1.样本相关系数公式是什么
2.当r>0时,y与x具有什么样的相关关系 当r<0时,y与x具有什么样的相关关系
3.r越小,说明两个变量之间的线性相关性越弱,正确吗
4.当|r|=1时,成对样本数据构成的点具有什么特点
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)样本相关系数r越大,两变量的相关性越强. ( )
(2)样本相关系数r越小,两变量的相关性越弱. ( )
(3)线性相关强弱的判断方法有散点图法和样本相关系数法. ( )
2.样本相关系数r的取值范围是( ).               
A.(0,1) B.[0,1]
C.(-1,1) D.[-1,1]
3.两个变量x,y的样本相关系数r1=0.785 9,两个变量u,v的样本相关系数r2=-0.956 8,则下列判断正确的是( ).
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
4.已知甲、乙、丙3组数据的线性相关系数分别为0.81,-0.98,0.63,其中 (填“甲”“乙”或“丙”)组数据的线性相关性最强.
【合作探究】
 样本相关系数
如图所示,回答下列问题:
问题1:由上图可判断出图①中,x,y是负相关,图②中,u,v是正相关,那么能否判断出图②的相关性比图①强
问题2:怎样定量刻画两个变量的线性相关程度
样本相关系数
(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,
其中r=.
(2)相关系数是研究变量之间线性相关程度的量.
足球运动是世界上普及率最高的运动之一,某国大力发展校园足球.为了了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
年份x 2018 2019 2020 2021 2022
足球特色学校y/百个 0.30 0.60 1.00 1.40 1.70
根据上表数据,计算y与x的样本相关系数r,并判断y与x是正相关关系还是负相关关系.
参考公式和数据:r=,(xi-)2=10,(yi-)2=1.3,≈3.605 6.
【方法总结】计算样本相关系数的一般步骤:(1)先计算平均数,;(2)再计算(xi-)(yi-),·;(3)最后代入样本相关系数公式计算,注意计算要准确.
共享汽车是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有权,类似于在租车行业里的短时间的租车.它手续简便,打个租车电话或在网上就可以预约订车.某市为了了解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他们根据体验效果进行评分.设消费者的年龄为x,对共享汽车的体验评分为y.若根据统计数据,计算得(xi-)(yi-)=1 350,且年龄x的方差为=9,评分y的方差为=25,求y与x的样本相关系数r,并据此判断对共享汽车使用体验的评分与年龄的线性相关性强弱(当|r|≥0.75时,认为线性相关性强,否则认为线性相关性弱).
附:样本相关系数r=.
 相关系数的性质
问题1:样本相关系数r的正负能反映出成对变量的什么关系
问题2:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系
问题3:当|r|=1时,成对样本数据之间具有怎样的关系呢
相关系数r的性质
(1)样本相关系数r的取值范围为[-1,1];
(2)若r>0,成对样本数据正相关;
(3)若r<0,成对样本数据负相关;
(4)|r|越接近1,成对样本数据的线性相关程度越强;
(5)|r|越接近0,成对样本数据的线性相关程度越弱.
假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
参考数据及公式:=90,=140.78,xiyi=112.3,≈12.6.
样本相关系数r=.
(1)求,;
(2)对x,y进行线性相关性检验.
【方法总结】利用样本相关系数从数值上判断变量间的线性相关程度,这种方法是定量的方法.与散点图相比较,样本相关系数要精确得多,需要注意的是样本相关系数r的绝对值小,只是说明变量线性相关程度低,但不一定不相关,可能非线性相关.
近年来,随着互联网的发展,各种网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在某省的发展情况,该省某调查机构从本省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:
城市1 城市2 城市3 城市4 城市5
A指标数x 2 4 5 6 8
B指标数y 3 4 4 4 5
经计算得=2,=,
试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.
附:样本相关系数公式r=.
参考数据:≈0.55,≈0.95.
【随堂检测】
1.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( ).
A.不具有线性相关关系
B.具有线性相关关系
C.线性相关关系还需要进一步确定
D.相关关系很弱
2.给出下列命题:
①样本相关系数r∈R;
②当样本相关系数r>0时,两个变量正相关;
③两个变量的相关性越强,样本相关系数r就越接近于1.
其中真命题的个数为( ).               
A.0 B.1 C.2 D.3
3.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关性分析.方案一:根据图中所有数据,得到相关系数r1;方案二:剔除点(10,21),根据剩下的数据得到相关系数r2.则( ).
A.0C.-14.关于两个变量x和y的7组数据如表所示:
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
求变量y与x的样本相关系数,并判断变量y与x之间是正相关还是负相关.
参考答案
课时2 样本相关系数
自主预习·悟新知
预学忆思
1.r=
=.
2.当r>0时,y与x具有正相关关系;当r<0时,y与x具有负相关关系.
3.不正确,因为r接近-1时相关性也很强.
4.成对样本数据构成的点都在一条直线上.
自学检测
1.(1)× (2)× (3)√
2.D 【解析】因为样本相关系数r=cos θ,其中θ为两个n维向量的夹角,所以-1≤r≤1,故选D.
3.C 【解析】由样本相关系数r1=0.785 9>0知x与y正相关,由样本相关系数r2=-0.956 8<0知u,v负相关.又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.故选C.
4.乙 【解析】两个变量的相关系数的绝对值越接近于1,它的线性相关性越强.-0.98是这三个相关系数中绝对值最大的,即乙组数据的线性相关性最强.
合作探究·提素养
探究1 情境设置
问题1:不能.
问题2:可以用样本相关系数公式计算.
新知运用
例1 【解析】由题意得=2 020,=1,
所以r==≈≈0.998>0,
故y与x是正相关关系.
巩固训练 【解析】因为==9,
所以=900.
因为==25,所以=2 500.
又因为(xi-)(yi-)=1 350,
所以样本相关系数r===0.9.
因为0.9>0.75,所以可以判断对共享汽车使用体验的评分与年龄的线性相关性很强.
探究2 情境设置
问题1:当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
问题2:观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,我们将向量的维数推广到n维,n维向量a,b的数量积仍然定义为a·b=|a||b|cos θ,其中θ为向量a,b的夹角.类似于平面或空间向量的坐标表示,对于向量a=(a1,a2,…,an)和b=(b1,b2,…,bn),我们有a·b=a1b1+a2b2+…+anbn.
设“标准化”处理后的成对数据(x'1,y'1),(x'2,y'2),…,(x'n,y'n)的第一分量构成n维向量x'=(x'1,x'2,…,x'n),第二分量构成n维向量y'=(y'1,y'2,…,y'n),
则有r=x'·y'=|x'||y'|cos θ.
因为|x'|=|y'|=,所以样本相关系数r=cos θ,其中θ为向量x'和向量y'的夹角.
由-1≤cos θ≤1,可知-1≤r≤1.
问题3:成对样本数据之间满足一种线性关系.
新知运用
例2 【解析】(1)依题意可得==4,==5.
(2)又xiyi-5=112.3-5×4×5=12.3,-5=90-5×42=10,-5=140.78-5×52=15.78,
所以r===≈≈0.976.
所以可以认为x与y之间具有很强的正线性相关关系.
巩固训练 【解析】==5,==4,
(xi-)(yi-)=6,
故r===≈0.95.
因为r≈0.95,所以可以推断y与x正线性相关,且具有较强的线性相关关系.
随堂检测·精评价
1.B 【解析】∵变量y与x之间的样本相关系数r=-0.983 2,且|r|=0.983 2,接近于1,
∴变量y与x之间有较强的线性相关关系.故选B.
2.B 【解析】①r∈[-1,1],故①错误;②当样本相关系数r>0时,两个变量正相关,故②正确;③两个变量的相关性越强,样本相关系数r就越接近于1或-1,故③错误.故真命题的个数为1.
3.D 【解析】由散点图得y与x负相关,所以r1<0,r2<0.因为剔除点(10,21)后,剩下的数据更具有线性相关性,所以|r2|更接近1,所以-14.【解析】=×(21+23+25+27+29+32+35)≈27.4,
=×(7+11+21+24+66+115+325)≈81.3,
=212+232+252+272+292+322+352=5 414,
xiyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,
=72+112+212+242+662+1152+3252=124 393,
∴r=

≈≈0.837 5.
∵r>0,∴变量y与x之间是正相关.8.1 成对数据的统计相关性
课时1 变量的相关关系
【学习目标】 1.了解变量间的相关关系,会画散点图.(数学抽象) 2.会根据散点图判断数据是否具有相关关系.(直观想象)
【自主预习】
1.什么是相关关系
2.相关关系是函数关系吗
3.相关关系按变量间的增减性如何分类
4.按变量间是否有线性特征如何分类
5.如何根据散点图判断线性相关
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)函数关系是一种确定关系,而相关关系是一种不确定关系. ( )
(2)当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量正相关. ( )
(3)根据散点图可以直观地分析出两个变量是否具有相关性.( )
(4)若变量x,y满足函数关系,则这两个变量线性相关. ( )
2.下列两个变量中,具有相关关系的是( ).
A.正方体的体积与棱长
B.匀速行驶的汽车的行驶路程与时间
C.人的身高与体重
D.人的体重与视力
3.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 .
4.根据两个变量x,y之间的成对样本数据画出的散点图如图所示,这两个变量 线性相关关系.(填“有”或“没有”)
【合作探究】
 变量的相关关系
小明根据自己的调查,得到下列结论和数据:
(1)吸烟可导致肺癌.
(2)小区对面的小卖部6天卖出热茶的杯数与当天气温的对比表如下:
气温/℃ 25 18 12 10 4 0
杯数 18 30 37 35 50 54
  (3)正方形的面积S=x2(x是边长).
问题1:吸烟一定会导致肺癌吗 吸烟与患肺癌有关吗
问题2:小卖部卖出的热茶的杯数与当天气温有关吗 两者之间是如何变化的
问题3:正方形的面积S与边长x是什么关系
1.函数关系:如果变量y是变量x的函数,那么由x就可以唯一确定y.
2.两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
下列关系中,属于相关关系的是 .(填序号)
①角度和它的正弦值之间的关系;
②做自由落体运动的物体的质量与落地时间的关系;
③降雪量与交通事故的发生率之间的关系.
【方法总结】在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
下列关系中,属于相关关系的是 .(填序号)
①圆的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③乘坐出租车的车费与行驶的里程之间的关系.
 散点图与正负相关、线性相关
下表是在某地搜集到的房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:
x/m2 115 110 80 135 105
y/万元 44.8 41.6 38.4 49.2 42
问题1:以x为横坐标,y为纵坐标在平面直角坐标系中作出表示以上数据的点.
问题2:这些点是大致落在一条直线附近吗
问题3:房屋的销售价格与房屋的面积有关系吗
问题4:怎样描述房屋的销售价格与房屋的面积之间的变化关系
1.散点图是描述成对样本数据之间关系的一种直观方法.
2.从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
3.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
4.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
某个男孩的年龄与身高的统计数据如下表所示:
年龄x/岁 1 2 3 4 5 6
身高y/cm 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
【方法总结】通过散点图观察它们的分布是否存在一定的规律,可以直观地判断两个变量是否具有相关关系.
5个学生的数学和物理成绩如下表:
学生 A B C D E
数学成绩 80 75 70 65 60
物理成绩 70 66 68 64 62
(1)画出散点图;
(2)从散点图中判断数学成绩与物理成绩之间存在什么样的关系.
【随堂检测】
1.下列选项图中,两个变量具有相关关系的是( ).
2.下列说法不正确的是( ).
A.当变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系
B.在平面直角坐标系中,将成对的样本数据用点表示出来,由这些点组成的统计图叫作散点图
C.若x,y具有相关性,则一定是线性相关
D.具有相关关系的两变量可以是曲线相关
3.在以下四幅散点图中,图 中的y和x之间存在相关关系.(将正确答案的序号填在横线上)
4.某种产品的广告支出费x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
(1)画出散点图;
(2)从散点图中判断销售额与广告支出费之间存在什么样的关系.
参考答案
8.1 成对数据的统计相关性
课时1 变量的相关关系
自主预习·悟新知
预学忆思
1.两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.不是.函数关系是唯一确定的关系.
3.按变量间的增减性分为正相关和负相关.
4.按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).
5.如果这些散点大致落在一条直线附近,就说明变量间具有线性相关关系.
自学检测
1.(1)√ (2)× (3)√ (4)×
2.C 【解析】A选项中,正方体的体积与棱长是函数关系,不是相关关系;B选项中,匀速行驶的汽车的行驶路程与时间是函数关系,不是相关关系;C选项中,人的身高是影响体重的因素,但不是唯一因素,所以人的身高与体重是相关关系;D选项中,人的体重与视力无任何关系.
3.正相关
4.没有 【解析】图中的点分布杂乱,两个变量不具有线性相关关系.
合作探究·提素养
探究1 情境设置
问题1:吸烟不一定导致肺癌,但它们有一定的关系.
问题2:两者之间有关系.一般来说,随着气温的降低,卖出的热茶杯数增加.
问题3:S与x之间是函数关系,是一种确定关系.
新知运用
例1 ③ 【解析】①不是相关关系,角度和它的正弦值之间具有函数关系;②不是相关关系,做自由落体运动的物体的质量与落地时间无关,不具有相关关系;③是相关关系,一般来说,降雪量越大,交通事故的发生率越高,具有相关关系.
巩固训练 ② 【解析】①中,圆的半径与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系.
探究2 情境设置
问题1:如图所示.
问题2:是.
问题3:有关系.
问题4:从大体上来看,面积越大,销售价格越高,但它们不是正比例函数关系.
新知运用
例2 【解析】(1)散点图如图所示.
(2)由图可知,所有数据点接近一条直线排列,因此认为y与x具有线性相关关系.
巩固训练 【解析】(1)散点图如图所示.
(2)从图中可以发现数学成绩与物理成绩之间具有相关关系,并且当数学成绩由小变大时,物理成绩也大多由小变大,图中的数据大致分布在某条直线的附近,即数学成绩与物理成绩正线性相关.
随堂检测·精评价
1.B 【解析】A,C是函数关系,D中的点的分布毫无规律,看不出横轴、纵轴表示的两个变量之间有什么相关性.
2.C 【解析】只有当点整体上分布在一条直线附近且x,y的取值呈现正相关或负相关时,x,y才能称之为线性相关.
3.(2)(3)(4) 【解析】图(2)(3)中的点成带状分布在某一直线附近,图(4)中的点分布在某一曲线附近,故图(2)(3)(4)中的y和x之间存在相关关系.
4.【解析】(1)以x对应的数据为横坐标,y对应的数据为纵坐标,所作的散点图如图所示.
(2)从图中可以发现广告支出费与销售额之间具有相关关系,并且当广告支出费由小变大时,销售额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y正线性相关.