第八章 8.1
A 组·素养自测
一、选择题
1.(多选题)下列关系中,属于相关关系的是( BD )
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
[解析] 在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.
2.(2021·重庆高一期中)已知x,y是两个变量,下列四个散点图中,x,y呈正相关趋势的是( A )
[解析] x,y呈正相关趋势时,散点图应该是从左下到右上趋势,由图可知选项A中的散点图是从左下到右上趋
势,描述了y随着x的增大而增大的变化趋势,故选A.
3.已知两个变量x,y与其线性相关系数r,下列说法正确的是( C )
①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全相关(有函数关系).
A.①② B.②③
C.①③ D.①②③
[解析] 若两个变量正相关,则因变量随着自变量的增大(减小)而增大(减小),此时相关系数r>0;若两个变量负相关,则因变量随自变量的增大(减小)而减小(增大),此时相关系数r<0;若|r|=1,则两个变量完全相关.故选C.
4.(2021·陕西西安高一期中)在下列各图中,相关关系最强的是( A )
[解析] 对于A,图中各点成带状分布,这组变量具有较强的线性相关关系;对于B,C,D图中所示的散点图中,样本点成片状分布,两个变量的线性相关关系相对较弱,或不具有相关关系,故选A.
5.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是( C )
A.利润率与人均销售额成正比例函数关系
B.利润率与人均销售额成反比例函数关系
C.利润率与人均销售额成正相关关系
D.利润率与人均销售额成负相关关系
[解析] 根据题意,画出利润率与人均销售额的散点图,如图所示:
由散点图知,利润率与人均销售额成正相关关系.
二、填空题
6.下列两个变量之间具有相关关系的是__②④__.(填序号)
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
[解析] 对于①,正方形的边长a和面积S是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h和右手一拃长x是正相关关系;对于③,真空中的自由落体运动其下落的距离h和下落的时间t是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h和他的体重x是正相关关系.
7.下列说法中正确的是__①②__(填序号).
①变量间的线性相关系数r的取值范围为[-1,1];②变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低;
③变量间的相关系数越小,变量间的相关程度越小.
[解析] 根据题意,依次分析.对于①,相关系数r满足|r|≤1,即相关系数r的取值范围为[-1,1],①正确;
对于②,根据相关系数的性质知|r|≤1,且|r|越接近1,相关程度越大;
|r|越接近0,相关程度越小,则②正确;
对于③,当r接近-1时,变量间的相关程度比r接近0时的大,故③错误.
8.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为__-1__.
[解析] 因为这组样本数据的所有样本点(xi,yi)(i=1,2,…n)都在直线y=-x+1上,所以这组样本数据完全相关,其相关系数是-1.
三、解答题
9.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应关系:
x 2 4 6 8
Y 30 40 50 70
x与Y之间是否具有线性相关关系?若有,判断相关性的强弱.
[解析] 画出散点图如图所示,由图可知x,Y有线性关系.
=5,=47.5,=120,=9 900,iyi=1 080,
r=
=≈0.982 7.
故x与Y之间具有很强的正相关关系.
10.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L)、空腹血糖CLU指标值(单位:mmol/L)如表所示.
人员编号 1 2 3 4 5 6 7 8
BMI值x 25 27 30 32 33 35 40 42
TC指标值y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1
CLU指标值z 6.7 7.2 7.3 8.0 8.1 8.6 9.0 9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、CLU指标值与BMI值的相关程度.
参考公式:相关系数r=
参考数据:=33,=6,=8,(xi-)2=244,(yi-)2≈3.6,(zi-)2=5.4,(xi-)(yi-)=28.3,(xi-)(zi-)=35.4,≈15.6,≈1.9,≈2.3.
[解析] 变量y与x的相关系数r≈≈0.95,
变量z与x的相关系数r′≈≈0.99,可以看出TC指标值与BMI值、CLU指标值与BMI值都是高度正相关.
B 组·素养提升
一、选择题
1.(多选题)以下各对变量成正相关的是( CD )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的重量和行驶每千米的耗电量
[解析] 对于A,学生的学籍号与学生的数学成绩没有相关关系;对于B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C,一般情况下,气温与冷饮销售量成正相关关系;对于D,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.
2.(多选题)下列说法正确的是( ABC )
A.若样本x1,x2,x3,…,x10的平均数为5,标准差为1,则样本2x1+1,2x2+1,2x3+1,…,2x10+1的平均数为11,标准差为2
B.身高和体重具有相关关系
C.现有高一学生30名,高二学生40名,高三学生30名,若按分层抽样的方法从中抽取20名学生,则需抽取高三学生6名
D.两个变量间的线性相关程度越强,相关系数的值就越大
[解析] 对于A,若样本x1,x2,x3,…,x10的平均数为5,标准差为1,则样本2x1+1,2x2+1,2x3+1,…,2x10+1的平均数为2×5+1=11,标准差为2×1=2,故A正确;对于B,身高和体重具有相关关系,故B正确;对于C,高三学生人数占总人数的比例为=,所以抽取的20名学生中高三学生有20×=6(名),故C正确;对于D,两个变量间的线性相关程度越强,应是相关系数的绝对值越大,故D错误.故选ABC.
3.(2021·江苏省盐城中学高三月考)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据计算得到的相关系数为r1;方案二:剔除点(10,21)后,根据剩下的数据计算得到的相关系数为r2.则( D )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
[解析] 由散点图得两个变量负相关,所以r1<0,r2<0.因为剔除点(10,21)后,剩下的样本点线性相关程度更强,所以|r2|更接近1,所以-1<r2<r1<0.
4.(2021·黑龙江哈尔滨高二月考)研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法正确的是( D )
A.r1=r2 B.0<r2<r1
C.0<r1<r2 D.r1<0<r2
[解析] 由题意可知,开始吸烟年龄递增时,得肺癌的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的危险度呈负相关,所以r1<0,同理可知,得肺癌的危险度与每天吸烟支数呈正相关,所以r2>0.因此可得r1<0<r2.故选D.
二、填空题
5.如图所示的五组数据(x,y)中,去掉__(4,10)__后,剩下的四组数据相关性增强.
[解析] 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强.
6.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则r1,r2,0的大小关系为__r2<0<r1__.
[解析] 对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<0<r1.
7.(2021·河南郑州高一期末)现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中__乙__(填甲、乙、丙中的一个)组成对样本数据的线性相关程度最强.
[解析] 因为成对样本数据的样本相关系数的绝对值越接近1,相关程度越强,又甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,乙组的样本相关系数的绝对值最接近1,所以乙组成对样本数据的线性相关程度最强.
三、解答题
8.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如表所示:
x(0.01%) 104 180 190 177 147 134 150 191 204 121
y(min) 100 200 210 185 155 135 170 205 235 125
判断含碳量与冶炼时间的相关关系的强弱.
[解析] 由已知数据列成下表.
i 1 2 3 4 5 6 7 8 9 10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10 400 36 000 39 900 32 745 22 785 18 090 25 500 39 155 47 940 15 125
=159.8,=172,=265 448,=312 350,iyi=287 640
于是r=≈0.990 6.y与x具有很强的线性相关关系.
9.(2021·山东临沂高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间对应数据的散点图如图所示.
依据散点图可以看出,y与x间具有较强的线性相关关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高).
附:样本相关系数公式
r=
=,
参考数据:≈0.55,≈0.95.
[解析] 由已知数据可得==5,==4.
所以(xi-)(yi-)=(-3)×(-1)+(-1)×0+0×0+1×0+3×1=6,==2,
==,
所以样本相关系数r===≈0.95.因为|r|>0.75,所以y与x具有较强的线性相关关系.(共45张PPT)
第八章 成对数据的统计分析
8.1 成对数据的统计相关性
必备知识 探新知
关键能力 攻重难
课堂检测 固双基
素养目标 定方向
素养作业 提技能
素养目标 定方向
课程标准 学法解读
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与多组成对数据的关系. 2.结合实例,会通过相关系数比较多组成对数据的相关性. 1.了解变量间的相关关系.
2.能根据散点图,判断两个变量是否具有相关关系.
3.了解相关系数的概念及公式,会判断相关性的强弱.
必备知识 探新知
变量的相关关系
(1)两个变量的关系
知识点1
分类 函数关系 相关关系
特征 两变量有________的关系 两个变量有关系,但又没有确切到可由其中一个去______________另一个的程度
确定
精确地决定
(2)散点图:将样本中的每一个序号下的成对数据用______________中的点表示出来得到的统计图.
直角坐标系
(3)正相关与负相关
(4)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在____________附近,则称这两个变量线性相关.
正相关 负相关
当一个变量的值增加时,另一个变量的相应值也呈现______________ 当一个变量的值增加时,另一个变量的相应值呈现______________
增加的趋势
减少的趋势
一条直线
思考:正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?
提示:不对,正相关与负相关是针对线性相关关系而言的.
知识点2
线性相关性的强弱
(2)相关系数的性质
1 _________时,成对数据正相关;_________时,成对数据负相关,-1≤r≤1.
2 |r|越小,两个变量之间的线性相关程度越______,|r|越大,两个变量之间的线性相关程度越______.
3 |r|=1时,成对数据构成的点都在__________________上.
r>0
r<0
弱
强
一条确定的直线
关键能力 攻重难
题型探究
题型一 相关关系的判断
(2021·陕西省西安中学高二期中)下列选项中,两变量间具有相关关系的是 ( )
A.正方体的体积与棱长
B.匀速行驶的汽车的行驶距离与时间
C.人的身高与视力
D.某人每日吸烟量与其身体健康情况
典例 1
D
[分析] 当两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度时,此时两个变量便具有相关关系.
[解析] 对于A,正方体的体积与棱长是函数关系,不满足题意;对于B,匀速行驶的汽车的行驶距离与时间是函数关系,不满足题意;对于C,人的身高与视力没有明显的关系,不满足题意;对于D,某人每日吸烟量与其身体健康情况有相关关系,满足题意.
[规律方法] 对相关关系的理解
(1)相关关系与函数关系是两种不同的变量关系,函数关系是一种确定性关系,可以用一个变量确切地表示另一个变量;相关关系是一种非确定性关系,两个变量虽然有关系,但又没有确切到可由其中一个去精确地决定另一个的程度.(2)根据变量变化趋势可将相关关系分为正相关和负相关;根据变量分布特征可将相关关系分为线性相关和非线性相关(曲线相关).
【对点训练】 (2021·山东潍坊一中高二月考)下列五组变量:
①匀速行驶的汽车行驶的路程和行驶的时间;②学生的平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.
其中两个变量正相关的是 ( )
A.①③ B.②④
C.②⑤ D.④⑤
[解析] ①④中两个变量是确定的函数关系,③中两个变量负相关,只有②⑤中两个变量正相关.
C
题型二 由散点图判断相关关系
两对变量A和B,C和D的对应数据分别如表1和表2所示,据此画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们具有什么样的相关关系.
表1
表2
典例 2
A 26 18 13 10 4 -1
B 20 24 34 38 50 64
C 0 5 10 15 20 25 30 35
D 541.67 608.66 672.09 704.99 806.71 902.59 945.42 1 006.75
[解析] 散点图分别如图(1)和图(2)所示.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量都具有相关关系.
图(1)中,当A的值由小变大时,B的值却是由大变小,故A和B呈负相关;
图(2)中,当C的值由小变大时,D的值也是由小变大,故C和D呈正相关.
[规律方法] 判断两个变量具有相关关系的方法
(1)根据直观感觉或生活经验等判断;(2)根据成对数据的变化趋势判断;(3)根据散点图判断:若散点图中各点分布在一条直线或曲线附近,则变量具有相关关系.
由散点图判断两个变量正、负相关的方法
如果散点图中的点落在从左下角到右上角的区域,两个变量正相关;如果散点图中的点落在从左上角到右下角的区域,两个变量负相关.
由散点图判断线性相关程度强弱的方法
在散点图中,散点在某条直线附近越集中,两个变量的线性相关程度越强;散点在某条直线附近越分散,两个变量的线性相关程度越弱.
【对点训练】 (1)对变量x,y由观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v由观测数据(ui,vi)(i=1,2,…,10),得散点图②.
由这两个散点图可以判断 ( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
C
(2)(2021·陕西西安高一期中)下列散点图中,两个变量线性相关程度最强的是 ( )
A
[解析] 对于A选项,散点图中的点成带状分布,且集中分布在一条直线附近,所以两个变量具有较强的线性相关关系;对于B,C,D选项,散点图中的点成片状分布,两个变量的线性相关程度较弱或不具有线性相关关系.故选A.
题型三 样本相关系数
(2021·陕西省西安中学高二期中)对于样本相关系数r来说,下列说法正确的是 ( )
A.|r|≤1,|r|越接近0,相关程度越强;|r|越接近1,相关程度越弱
B.|r|≥1,|r|越接近1,相关程度越强;|r|越大,相关程度越弱
C.|r|≤1,|r|越接近1,相关程度越强;|r|越接近0,相关程度越弱
D.|r|≥1,|r|越接近1,相关程度越强;|r|越大,相关程度越强
典例 3
C
[解析] 用样本相关系数r可以衡量两个变量之间线性相关程度的强弱,|r|≤1,|r|越接近1,表示两个变量之间的线性相关程度越强;|r|越接近0,表示两个变量之间的线性相关程度越弱.故选C.
(2021·福建南平高二检测)为了对2019年某校月考成绩进行分析,在60分以上的全体同学中随机抽取8位,他们的数学、物理成绩对应如下表:
典例 4
学生编号 1 2 3 4 5 6 7 8
数学成绩x 68 72 78 81 85 88 91 93
物理成绩y 70 66 81 83 79 80 92 89
[规律方法] 在统计中常用样本相关系数r来衡量两个变量间线性相关程度的强弱.r的范围为[-1,1],r为正时,两个变量正相关;r为负时,两个变量负相关;|r|越接近1,两个变量间线性相关程度越大;r越接近0,两个变量间线性相关程度越小.
【对点训练】 关于两个变量x和y的7组数据如表所示:
试判断y与x是否线性相关,并刻画它们的相关程度.
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
易错警示
典例 5
D
课堂检测 固双基
1.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是 ( )
A.-0.95 B.-0.13
C.0.15 D.0.96
[解析] 相关系数r<0时,成对数据负相关,且|r|越大,两个变量之间的线性相关程度越强.
A
2.下列图中,散点图与相关系数r不符合的是 ( )
[解析] A、B选项中散点全部集中在一条直线上,且分别呈负、正相关,故相关系数r的值应分别为-1,1;C选项变量呈负相关,故-1<r<0,D选项变量没有相关性,相关系数近似看为0.
B
3.对于给定的两个变量的统计数据,下列说法正确的是 ( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
[解析] 给出一组样本数据,总可以作出相应的散点图,故C正确,但不一定能分析出两个变量的关系,故A不正确,更不一定符合线性相关,故B不正确,两个变量的统计数据不一定有函数关系,故D不正确.
C
4.对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是 ( )
A.负相关 B.正相关
C.先正后负相关 D.先负后正相关
[解析] 根据两个变量x,y的几组观测数据统计表知,y随x的增大而减小,所以这两个相关变量负相关.
A
x 10 9 8 7 6 5
y 2 3 3.5 4 4.8 5
5.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为 ( )
A.1
B.-0.5
C.0
D.0.5
[解析] 根据变量x,y的散点图,得x,y之间的样本相关关系非常不明显,所以相关系数r最接近的值应为0.
C
素养作业 提技能