第01讲 8.1 成对数据的统计相关性
(8.1.1变量的相关关系+8.1.2样本相关系数)
课程标准 学习目标
①理解两个变量的相关关系的概念。 ②能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图。 ③会根据相关系数判断两个变量的相关程度。 通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度
知识点1:变量的相关关系
变量与变量之间的关系常见的有两类:一类是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;另一类是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性.
(1)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)函数关系与相关关系的异同点
函数关系 相关关系
相同点 两者均是指两个变量之间的关系
不同点 是一种确定性关系 是一种非确定性的关系
是两个变量之间的关系 ①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型 是一种更为一般的情况
知识点2:散点图的概念
(1)一般地,如果收集到了变量和变量的对数据(简称为成对样本数据),如下表所示
序号 1 2 3 4
变量
变量
则在直角坐标系中描出点,就可以得到这对数据的散点图
(2)正相关与负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
【即学即练1】(2022上·新疆和田·高二校考期末)对于变量,有以下四个散点图,由这四个散点图可以判断变量与成负相关的是( )
A. B.
C. D.
【答案】B
【详解】A:各点分布没有明显相关性,不符;
B:各点分布在一条直线附近,且有负相关性,符合;
C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;
D:各点分布在一条直线附近,且有正相关性,不符.
故选:B
(3)线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关理解.
知识点3:相关关系的强弱
(1)样本相关系数
现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.
【即学即练2】(2024上·天津·高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
【答案】 正 0.99
【详解】由表中数据得随的增大而增大,
所以该老师每天一次最多答对题数y与天数x之间是正相关,
.
故答案为:正;.
(2)相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(2023上·云南曲靖·高三曲靖一中校考阶段练习)为了比较甲、乙、丙、丁四组数据的线性相关性强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为,,0.36,0.93,则这四组数据中线性相关性最强的是 组数据.
【答案】甲
【详解】根据题意,因为线性相关系数的绝对值越大,线性相关性越强,
由甲、乙、丙、丁四组数据的线性相关系数分别为,,0.36,0.93,
所以甲组数据的线性相关性最强.
故答案为:甲.
题型01相关关系与函数关系的概念及辨析
【典例1】(2024·全国·高三专题练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【典例2】(2023·高二课时练习)下列关系中,属于相关关系的是( ).
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车车费与行驶的里程之间的关系
D.降雪量与交通事故的发生率之间的关系
【典例3】(2023·高二课时练习)下列两个变量之间的关系是函数关系的是 .
①角度和它的余弦值;②正方形的边长和面积
③正n边形的边数和内角和;④人的年龄和身高
【变式1】(2023·江苏·高二专题练习)下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高
C.儿童的年龄与体重 D.物体的体积和质量
【变式2】(多选)(2023下·高二课时练习)下列两个变量之间的关系不是函数关系的是( )
A.角度和它的余弦值
B.眼睛的近视程度与看手机的时间
C.正边形的边数和内角和的度数
D.人的年龄和身高
【变式3】(2024·全国·高三专题练习)给出成对值的数据如下:
1 2 4 8
3 5 9 17
则根据数据可以判断和的关系是 .(填“确定关系”“相关关系”或“没有关系”)
题型02 判断两个变量的相关关系
【典例1】(2024下·全国·高二随堂练习)下列两个变量中能够具有相关关系的是( )
A.人所站的高度与视野 B.人眼的近视程度与身高
C.正方体的体积与棱长 D.某同学的学籍号与考试成绩
【典例2】(2024下·全国·高二随堂练习)下面是随机抽取的9名15岁男生的身高、体重列表:
编号 1 2 3 4 5 6 7 8 9
身高/cm 165 157 155 175 168 157 178 160 163
体重/kg 52 44 45 55 54 47 62 50 53
判断所给的两个变量之间是否存在相关关系.
【变式1】(2023下·四川乐山·高二期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
【变式2】(2023下·陕西西安·高二校联考阶段练习)在下列各量之间,存在相关关系的是
①正方体的体积与棱长之间的关系; ②一块农田的水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系; ④家庭的支出与收入之间的关系;
⑤某户家庭用电量与电价之间的关系.
A.②③ B.③④ C.④⑤ D.②③④
题型03判断正负相关
【典例1】(2024·全国·高三专题练习)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
【典例2】(2023·全国·高二专题练习)某商场五天内某种恤衫的销售情况如下表:
第天
销售量y(件)
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【变式1】(2023·全国·高三专题练习)下列关于y与x的回归直线方程中,变量成正相关关系的是( )
A. B.
C. D.
【变式2】(2023·高二课时练习)在下列各散点图中,两个变量具有正相关关系的是( )
A. B.
C. D.
题型04样本相关系数大小对变量相关性的影响
【典例1】(2023·全国·高二随堂练习)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
【典例2】(2024·全国·高三专题练习)变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则与的大小关系是 .
【变式1】(多选)(2024·全国·高三专题练习)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的关系,正确的有( )
A. B. C. D.
【变式2】(2024上·全国·高三期末)以下4幅散点图所对应的样本相关系数的大小关系为 .
题型05相关系数的计算
【典例1】(2024上·陕西汉中·高三统考期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.
【典例2】(2024下·全国·高二随堂练习)某专营店统计了最近天到该店购物的人数和时间第天之间的数据,列表如下:
(1)由表中给出的数据,判断是否可用线性回归模型拟合人数与时间之间的关系?(若,则认为线性相关程度高,可用线性回归模型拟合;否则,不可用线性回归模型拟合.计算时精确到)
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
【典例3】(2024·全国·高三专题练习)某食品加工厂新研制出一种袋装食品(规格:/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
每袋出厂价格
月销售量
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到);
(3)若样本相关系数,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
【变式1】(2024上·天津·高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
【变式2】(2024下·全国·高二随堂练习)人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市 1 2 3 4 5 6 7 8 9 10 总和
老龄化率 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8
空置率 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
【变式3】(2024下·全国·高二随堂练习)如图是我国2014年至2020年年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
参考数据:=9.32,=40.17,=0.55,≈2.646.
参考公式:相关系数
A夯实基础 B能力提升
A夯实基础
1.(2024·全国·高三专题练习)已知变量和满足关系,变量与正相关. 下列结论中正确的是( )
A.与负相关,与负相关
B.与正相关,与正相关
C.与正相关,与负相关
D.与负相关,与正相关
2.(2024·全国·高三专题练习)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关
3.(2024·全国·高三专题练习)下列关系中,是相关关系的为( )
①学生的学习态度与学习成绩;②身高与体重;③铁块的大小与质量;④出租车的车费与行驶路程.
A.①② B.①③ C.②③ D.②④
4.(2024下·全国·高二随堂练习)下图中的两个变量,具有相关关系的是( )
A. B.
C. D.
5.(2024上·江西吉安·高一江西省新干中学期末)对于样本相关系数,下列说法错误的是( )
A.可以用来判断成对样本数据相关的正负性
B.可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线性相关程度也越高
D.取值范围是
6.(2024上·全国·高三期末)如图(1)(2)分别表示样本容量均为7的A,B两组成对数据的散点图,已知A组成对数据的样本相关系数为,B组成对数据的样本相关系数为,则与的大小关系为( )
A. B.
C. D.无法判断
7.(2024下·全国·高二随堂练习)为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x 5 10 15 20 25
y 103 105 110 111 114
A.很强 B.很弱
C.无相关 D.不确定
8.(2023下·高二单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
二、多选题
9.(2023·全国·高二专题练习)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
10.(2023下·辽宁·高二辽宁实验中学校考阶段练习)下列关于相关系数r的叙述中,正确的是( )
A.
B.当y与x正相关时,
C.时,两个变量之间的回归直线方程没有价值
D.当成对数据构成的点都在回归直线上时,则
三、填空题
11.(2024下·全国·高二随堂练习)给出下列关系:
①人的年龄与他(她)身高的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与他(她)的学号之间的关系.
其中有相关关系的是 .
12.(2023下·上海奉贤·高二上海市奉贤中学校考期中)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .(计算结果精确到0.01)
6 8 10 12
6 5 3 2
B能力提升
13.(2023下·高二课时练习)某网站统计了某网红螺蛳粉在2020年7月至11月的总销售量y(单位:万),得到以下数据:
月份x 7 8 9 10 11
销售量y 10 12 11 12 20
根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?
(参考公式:相关系数.参考数据:)
14.(2023下·高二课时练习)某商店经营一批进价为每件4元的商品,在市场调查时发现,此商品的销售单价x(单位:元)与日销售量y(单位:件)之间有如下关系:
x 5 6 7 8
y 10 8 7 3
试计算x,y之间的相关系数.
参考数据:,,
15.(2023下·高二课时练习)关于两个变量和的组数据如下表所示:
求变量与的相关系数,并判断变量与之间是正相关还是负相关.
21世纪教育网(www.21cnjy.com)
第01讲 8.1 成对数据的统计相关性
(8.1.1变量的相关关系+8.1.2样本相关系数)
课程标准 学习目标
①理解两个变量的相关关系的概念。 ②能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图。 ③会根据相关系数判断两个变量的相关程度。 通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度
知识点1:变量的相关关系
变量与变量之间的关系常见的有两类:一类是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;另一类是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性.
(1)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)函数关系与相关关系的异同点
函数关系 相关关系
相同点 两者均是指两个变量之间的关系
不同点 是一种确定性关系 是一种非确定性的关系
是两个变量之间的关系 ①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型 是一种更为一般的情况
知识点2:散点图的概念
(1)一般地,如果收集到了变量和变量的对数据(简称为成对样本数据),如下表所示
序号 1 2 3 4
变量
变量
则在直角坐标系中描出点,就可以得到这对数据的散点图
(2)正相关与负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
【即学即练1】(2022上·新疆和田·高二校考期末)对于变量,有以下四个散点图,由这四个散点图可以判断变量与成负相关的是( )
A. B.
C. D.
【答案】B
【详解】A:各点分布没有明显相关性,不符;
B:各点分布在一条直线附近,且有负相关性,符合;
C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;
D:各点分布在一条直线附近,且有正相关性,不符.
故选:B
(3)线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关理解.
知识点3:相关关系的强弱
(1)样本相关系数
现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.
【即学即练2】(2024上·天津·高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
【答案】 正 0.99
【详解】由表中数据得随的增大而增大,
所以该老师每天一次最多答对题数y与天数x之间是正相关,
.
故答案为:正;.
(2)相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(2023上·云南曲靖·高三曲靖一中校考阶段练习)为了比较甲、乙、丙、丁四组数据的线性相关性强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为,,0.36,0.93,则这四组数据中线性相关性最强的是 组数据.
【答案】甲
【详解】根据题意,因为线性相关系数的绝对值越大,线性相关性越强,
由甲、乙、丙、丁四组数据的线性相关系数分别为,,0.36,0.93,
所以甲组数据的线性相关性最强.
故答案为:甲.
题型01相关关系与函数关系的概念及辨析
【典例1】(2024·全国·高三专题练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【答案】D
【详解】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D
【典例2】(2023·高二课时练习)下列关系中,属于相关关系的是( ).
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车车费与行驶的里程之间的关系
D.降雪量与交通事故的发生率之间的关系
【答案】BD
【详解】A中,正方形的边长与面积之间的关系是函数关系;
B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
C中,出租车车费与行驶的里程之间的关系为确定的函数关系;
D中,降雪量与交通事故的发生率之间具有相关关系.
故选:BD.
【典例3】(2023·高二课时练习)下列两个变量之间的关系是函数关系的是 .
①角度和它的余弦值;②正方形的边长和面积
③正n边形的边数和内角和;④人的年龄和身高
【答案】①②③
【详解】①②③中的两个变量之间是一种确定性的关系,都是函数关系,它们的函数关系式分别为f(θ)=cosθ,g(a)=a2,h(n)=(n-2)×180°,
④中人的年龄和身高这两个变量不是确定性的关系,它们不是函数关系,对于年龄相同的人来说,有很多不同的身高值.
故答案为:①②③
【变式1】(2023·江苏·高二专题练习)下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高
C.儿童的年龄与体重 D.物体的体积和质量
【答案】C
【详解】A、D是函数关系;B是不相关关系;C是相关关系,
故选:C
【变式2】(多选)(2023下·高二课时练习)下列两个变量之间的关系不是函数关系的是( )
A.角度和它的余弦值
B.眼睛的近视程度与看手机的时间
C.正边形的边数和内角和的度数
D.人的年龄和身高
【答案】BD
【详解】对于A,角度和它的余弦值满足函数关系,A是函数关系;
对于B,眼睛的近视程度与看手机的事件是客观存在的相互依存的不确定性关系,B不是函数关系;
对于C,正边形的边数和内角和的度数满足函数关系,C是函数关系;
对于D,人的年龄和身高是客观存在的相互依存的不确定性关系,D不是函数关系.
故选:BD.
【变式3】(2024·全国·高三专题练习)给出成对值的数据如下:
1 2 4 8
3 5 9 17
则根据数据可以判断和的关系是 .(填“确定关系”“相关关系”或“没有关系”)
【答案】确定关系
【详解】由题表中数据可以得到x,y之间是一种函数关系,函数解析式为,
所以x,y之间是一种确定的关系,即函数关系.
故答案为:确定关系.
题型02 判断两个变量的相关关系
【典例1】(2024下·全国·高二随堂练习)下列两个变量中能够具有相关关系的是( )
A.人所站的高度与视野 B.人眼的近视程度与身高
C.正方体的体积与棱长 D.某同学的学籍号与考试成绩
【答案】A
【详解】A.人所站的高度越高则视野越开阔,具有正相关关系,故正确;
B.人眼的近视程度与身高不具有相关关系,故错误;
C.正方体的体积与棱长是一种确定关系,故错误;
D.某同学的学籍号与考试成绩不具有相关关系,故错误;
故选:A
【典例2】(2024下·全国·高二随堂练习)下面是随机抽取的9名15岁男生的身高、体重列表:
编号 1 2 3 4 5 6 7 8 9
身高/cm 165 157 155 175 168 157 178 160 163
体重/kg 52 44 45 55 54 47 62 50 53
判断所给的两个变量之间是否存在相关关系.
【答案】存在相关关系
【详解】方法一:根据经验可知,人的身高和体重之间存在相关关系.观察表格中的数据可知,人的体重随着身高的增高而增长,因此人的身高和体重之间存在相关关系.
方法二:以x轴表示身高,以y轴表示体重,得到相应的散点图如图所示.
【变式1】(2023下·四川乐山·高二期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
【答案】B
【详解】A选项,水稻产量与施肥之间没有明确的等量关系,是相关关系,故A错误;
B选项,正方形的面积与边长之间有着明确的等量关系,不是相关关系,故B正确;
C选项,商品销售收入与其广告费支出之间没有明确的等量关系,故C错误;
D选项,人体内的脂肪含量与年龄之间没有明确的等量关系,故D错误.
故选:B
【变式2】(2023下·陕西西安·高二校联考阶段练习)在下列各量之间,存在相关关系的是
①正方体的体积与棱长之间的关系; ②一块农田的水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系; ④家庭的支出与收入之间的关系;
⑤某户家庭用电量与电价之间的关系.
A.②③ B.③④ C.④⑤ D.②③④
【答案】D
【详解】试题分析:相关关系是一种非确定的关系,而①和⑤均是两个有确定关系的量.
我们会发现,随着身高的增高,体重基本上呈增长的趋势.所以体重与身高之间存在相关关系,并且是正相关.
题型03判断正负相关
【典例1】(2024·全国·高三专题练习)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
【答案】B
【详解】由散点图可知,变量与负相关,变量与正相关,所以,与负相关.
故选:B.
【典例2】(2023·全国·高二专题练习)某商场五天内某种恤衫的销售情况如下表:
第天
销售量y(件)
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【详解】根据表格中的数据作出散点图如图,
可知所有点都在一条直线附近波动,是线性相关的,且值随着值的增大而增大,即与正相关,
故选:B.
【变式1】(2023·全国·高三专题练习)下列关于y与x的回归直线方程中,变量成正相关关系的是( )
A. B.
C. D.
【答案】B
【详解】对于A中,由方程,可得,所以变量成负相关关系;
对于B中,由方程,可得,所以变量成正相关关系;
对于C中,由方程,可得,所以变量成负相关关系;
对于D中,由方程,可得,所以变量成负相关关系;
故选:B.
【变式2】(2023·高二课时练习)在下列各散点图中,两个变量具有正相关关系的是( )
A. B.
C. D.
【答案】B
【详解】对于A,散点的变化具有波动性,非正相关关系,A错误;
对于B,当变大时,的变化趋势也是逐渐增大,可知两个变量具有正相关关系,B正确;
对于C,当变大时,的变化趋势是逐渐减小,可知两个变量具有负相关关系,C错误;
对于D,两个变量的变化无规律,二者没有相关性,D错误.
故选:B.
题型04样本相关系数大小对变量相关性的影响
【典例1】(2023·全国·高二随堂练习)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
【答案】B
【详解】由给出的四组数据的散点图可以看出,
左侧两图是正相关,样本相关系数大于0,则,,
右侧两图是负相关,样本相关系数小于0,则,,
下方两图的点相对更加集中,所以相关性较强,所以接近于1,接近于-1,
上方两图的点相对分散一些,所以相关性较弱,所以和比较接近0,
由此可得.
故选:B.
【典例2】(2024·全国·高三专题练习)变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则与的大小关系是 .
【答案】
【详解】由数据可知与正相关,与负相关,
所以,则.
故答案为:
【变式1】(多选)(2024·全国·高三专题练习)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的关系,正确的有( )
A. B. C. D.
【答案】AC
【详解】由图形特征可知都是负相关,都是负数,比的相关系数更强,所以,,都是正相关,比的相关系数更强,所以,
所以AC正确.
故选:AC
【变式2】(2024上·全国·高三期末)以下4幅散点图所对应的样本相关系数的大小关系为 .
【答案】
【详解】根据散点图可知,图①③成正相关,图②④成负相关,所以,
又图①②的散点图近似在一条直线上,所以图①②两变量的线性相关程度比较高,图③④的散点图比较分散,
故图③④两变量的线性相关程度比较低,即与比较大,与比较小,
所以.
故答案为:
题型05相关系数的计算
【典例1】(2024上·陕西汉中·高三统考期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.
【答案】(1)平均每个零件的横截面积为,一个零件的耗材量
(2)
(3)
【详解】(1)样本中10个这种零件的横截面积的平均值,
样本中10个这种零件的耗材量的平均值,
由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为,
平均一个零件的耗材量为.
(2)
,
这种零件的横截面积和耗材量的样本相关系数为.
(3)设这种零件的总耗材量的估计值为,
又已知这种零件的耗材量和其横截面积近似成正比,
,解得,
故这种零件的总耗材量的估计值为.
【典例2】(2024下·全国·高二随堂练习)某专营店统计了最近天到该店购物的人数和时间第天之间的数据,列表如下:
(1)由表中给出的数据,判断是否可用线性回归模型拟合人数与时间之间的关系?(若,则认为线性相关程度高,可用线性回归模型拟合;否则,不可用线性回归模型拟合.计算时精确到)
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
【答案】(1)可以,理由见解析
(2)方案二更优惠,理由见解析
【详解】(1)解:,,
所以,,
,,
所以,,
所以,与的线性相关性很强,故可用线性回归模型拟合人数与时间之间的关系.
(2)解:设方案一的实际付款金额为元,方案二的实际付款金额为元,
由题意可知,(元),
的可能取值有、、、,
,,
,,
所以,,
所以,方案二更优惠.
【典例3】(2024·全国·高三专题练习)某食品加工厂新研制出一种袋装食品(规格:/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
每袋出厂价格
月销售量
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到);
(3)若样本相关系数,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
【答案】(1)平均每袋出厂价格为(元),平均月销售量为(万袋),平均月销售收入为(万元)
(2)
(3)该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性
【详解】(1)该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格为:
(元),
平均月销售量为(万袋),
平均月销售收入为(万元).
(2)由已知,每袋出厂价格与月销售量的样本相关系数为:
.
(3)由于每袋出厂价格与月销售量的样本相关系数,所以该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性.
【变式1】(2024上·天津·高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
【答案】 正 0.99
【详解】由表中数据得随的增大而增大,
所以该老师每天一次最多答对题数y与天数x之间是正相关,
.
故答案为:正;.
【变式2】(2024下·全国·高二随堂练习)人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市 1 2 3 4 5 6 7 8 9 10 总和
老龄化率 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8
空置率 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
【答案】(1)估计该地区城市为超级老龄化城市的频率为
(2)该地区城市的老龄化率和空置率的相关系数约为0.63
【详解】(1)由表中数据可知,调查的10个城市中,老龄化率不低于的有4个,
故估计该地区城市为超级老龄化城市的频率为.
(2),
则
.
故该地区城市的老龄化率和空置率的相关系数约为0.63.
【变式3】(2024下·全国·高二随堂练习)如图是我国2014年至2020年年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
参考数据:=9.32,=40.17,=0.55,≈2.646.
参考公式:相关系数
【答案】答案见解析
【详解】由折线图中数据和附注中参考数据得=4,,,,.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
A夯实基础 B能力提升
A夯实基础
1.(2024·全国·高三专题练习)已知变量和满足关系,变量与正相关. 下列结论中正确的是( )
A.与负相关,与负相关
B.与正相关,与正相关
C.与正相关,与负相关
D.与负相关,与正相关
【答案】A
【详解】因为变量和满足关系,一次项系数为,所以与负相关;
变量与正相关,设,所以,得到,
一次项系数小于零,所以与负相关.
故选:A.
2.(2024·全国·高三专题练习)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关
【答案】C
【详解】由于身高比较高的人,其体重可能大,也可能小,则选项AB不正确;
由散点图知,身高和体重有明显的相关性,且身高增加时,体重也呈现增加的趋势,
所以身高与体重呈正相关,C正确,D错误.
故选:C
3.(2024·全国·高三专题练习)下列关系中,是相关关系的为( )
①学生的学习态度与学习成绩;②身高与体重;③铁块的大小与质量;④出租车的车费与行驶路程.
A.①② B.①③ C.②③ D.②④
【答案】A
【详解】学生的学习态度与学习成绩是相关关系;
身高与体重是相关关系;
铁块的大小与质量是函数关系;
出租车的车费与行驶路程是函数关系.
故选:A
4.(2024下·全国·高二随堂练习)下图中的两个变量,具有相关关系的是( )
A. B.
C. D.
【答案】B
【详解】相关关系是一种非确定性关系.
对于A、C:两个变量具有函数关系,是一种确定性关系,故A、C错误;
对于D:图中的散点分布没有什么规律,故两个变量之间不具有相关关系,故D错误;
对于B:图中的散点分布在从左下角区域到右上角区域,两个变量具有相关关系,故B正确;
故选:B.
5.(2024上·江西吉安·高一江西省新干中学期末)对于样本相关系数,下列说法错误的是( )
A.可以用来判断成对样本数据相关的正负性
B.可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线性相关程度也越高
D.取值范围是
【答案】C
【详解】对于相关系数的定义:
当相关性越强,相关系数就越接近于;
当相关系数的绝对值越小,相关性越弱;
当系数为正数时,为正相关,系数为负数时,为负相关.
故选:C.
6.(2024上·全国·高三期末)如图(1)(2)分别表示样本容量均为7的A,B两组成对数据的散点图,已知A组成对数据的样本相关系数为,B组成对数据的样本相关系数为,则与的大小关系为( )
A. B.
C. D.无法判断
【答案】C
【详解】由题图(1)可知,散点几乎分布在一条直线上,且成正相关,∴,
由题图(2)可知,散点分散在一条直线附近,也成正相关,∴,
图(1)中的散点分布更紧密,因此A组成对数据的线性相关程度比B组强一些,
∴,
故选:C.
7.(2024下·全国·高二随堂练习)为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x 5 10 15 20 25
y 103 105 110 111 114
A.很强 B.很弱
C.无相关 D.不确定
【答案】A
【详解】根据表格中的数据,可得,,,,
,,,
则,
可得两个变量与的相关程度很强.
故选:A.
8.(2023下·高二单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
【答案】D
【详解】因为,,所以,
,
故选:D.
二、多选题
9.(2023·全国·高二专题练习)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
【答案】AC
【详解】对于选项A,光照时间与大棚内蔬菜的产量中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故A正确;
对于选项B,某正方形的边长与此正方形的面积这两个变量之间是确定的函数关系,不能用直线拟合,故B错误;
对于选项C,举重运动员所能举起的最大重量与他的体重中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故C正确;
对于选项D,某人的身高与视力这两个变量之间无任何关系,不能用直线拟合,故D错误.
故选:AC.
10.(2023下·辽宁·高二辽宁实验中学校考阶段练习)下列关于相关系数r的叙述中,正确的是( )
A.
B.当y与x正相关时,
C.时,两个变量之间的回归直线方程没有价值
D.当成对数据构成的点都在回归直线上时,则
【答案】ABC
【详解】对于A中,根据相关系数的概念,可得,即,所以A正确;
对于B中,当,可得变量与正相关,所以B正确;
对于C中,当时,两个变量之前的相关性非常弱,所以两个变量之间的回归直线方程没有价值,所以C正确;
对于D中,当成对数据构成的点都在回归直线上时,可得,所以D错误.
故选:ABC.
三、填空题
11.(2024下·全国·高二随堂练习)给出下列关系:
①人的年龄与他(她)身高的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与他(她)的学号之间的关系.
其中有相关关系的是 .
【答案】①③④
【详解】利用相关关系的概念判断.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系;⑤学生与其学号也是确定的对应关系.
故答案为①③④
12.(2023下·上海奉贤·高二上海市奉贤中学校考期中)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .(计算结果精确到0.01)
6 8 10 12
6 5 3 2
【答案】
【详解】根据表中数据计算可知
,
,
变量之间的相关系数,
故答案为: .
B能力提升
13.(2023下·高二课时练习)某网站统计了某网红螺蛳粉在2020年7月至11月的总销售量y(单位:万),得到以下数据:
月份x 7 8 9 10 11
销售量y 10 12 11 12 20
根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?
(参考公式:相关系数.参考数据:)
【答案】可用线性回归模型拟合y与x的关系.
【详解】由已知得:,,,,
∴.
因为,说明y与x的线性相关关系很强,可用线性回归模型拟合y与x的关系.
14.(2023下·高二课时练习)某商店经营一批进价为每件4元的商品,在市场调查时发现,此商品的销售单价x(单位:元)与日销售量y(单位:件)之间有如下关系:
x 5 6 7 8
y 10 8 7 3
试计算x,y之间的相关系数.
参考数据:,,
【答案】
【详解】因为,,,
所以相关系数.
15.(2023下·高二课时练习)关于两个变量和的组数据如下表所示:
求变量与的相关系数,并判断变量与之间是正相关还是负相关.
【答案】,正相关关系.
【详解】,
,
,
,
,
;
,变量与之间是正相关关系.
21世纪教育网(www.21cnjy.com)