8.1 成对数据的统计相关性(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册

文档属性

名称 8.1 成对数据的统计相关性(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册
格式 zip
文件大小 9.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-09-11 21:25:29

文档简介

第八章 成对数据的统计分析
8.1 成对数据的统计相关性
【课前预习】
知识点一
1.有关系 精确地 2.样本数据
3.增加 减小 4.一条直线
诊断分析
(1)× (2)× (3)√ (4)√ (5)√ [解析] (2)只能说明这两个变量不是线性相关,但并不一定能说明有没有相关性,若散点落在一条折线附近,则称这两个变量非线性相关或曲线相关.
知识点二
1.正 负 2.[-1,1] 越强 越弱
诊断分析
(1)√ (2)× (3)√ (4)× [解析] (2)对于简单随机样本而言,样本具有随机性,因此样本相关系数r也具有随机性.
(4)r=0只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
【课中探究】
例1 D [解析] 当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;球的体积与该球的半径之间是函数关系,故B错误;农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;一个学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.故选D.
变式 ACD [解析] 正方体的体积与棱长之间的关系是函数关系,故A正确;人的身高与视力之间不具有相关关系,故B错误;汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;学生的体重与学习成绩之间不具有相关关系,故D正确.故选ACD.
例2 解:(1)数据对应的散点图如图所示:
(2)由(1)中散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,且是正相关.
变式 (1)A (2)B [解析] (1)图a中各点分布在从左下角到右上角的区域内,两个变量正相关;图b中各点分布在从左上角到右下角的区域内,两个变量负相关;图c中各点的分布不呈带状,两个变量不相关.故选A.
(2)由题意知,年利润的中位数是=17.作出散点图,如图,由散点图知x与y正线性相关.故选B.
例3 C [解析] 由散点图知,第1个图中两个变量正相关,故r1>0;第2,3个图中两个变量负相关,且图2中两变量的相关程度更强,故r2r3>r2.故选C.
变式 B [解析] 对于A,因为|r1|=0.96接近于1,所以说明变量x,y之间的线性相关程度很强,故A中说法正确;对于B,若r1=0.7,r2=-0.99,满足r1>r2,但是|r1|<|r2|,此时说明变量x,y之间的线性相关程度比变量m,n之间的线性相关程度弱,故B中说法错误;对于C,若r1=0.95,则说明变量x,y正线性相关,故C中说法正确;对于D,若r1=0,则说明变量x,y之间没有线性相关关系,故D中说法正确.故选B.
例4 解:(1)散点图如图所示.
(2)y与x之间的样本相关系数r=
≈=≈0.952>0.75,所以y与x的线性相关程度较强.
变式 解:由表中数据,计算得=×(2+4+5+6+8)=5,=×(20+30+50+50+70)=44,=22+42+52+62+82=145,=202+302+502+502+702=11 200,xiyi=2×20+4×30+5×50+6×50+8×70=1270,则r=≈0.975>0.75,
∴y与x线性相关,且线性相关程度较强.
拓展 解:(1)由已知数据得样本相关系数r=
≈≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.
(2)由于=9.97,s≈0.212,故(-3s,+3s)可近似为(9.334,10.606),由样本数据可以看出抽取的第13个医疗物资的尺寸在(9.334,10.606)之外,因此需对当天的生产过程进行检查.第八章 成对数据的统计分析
8.1 成对数据的统计相关性
1.B [解析] 对于①,人的年龄与他的骨密度是一种不确定的相关关系;对于②,一个学生与他的学号之间的关系是一种确定的对应关系,不是相关关系;对于③,森林中的同一种树木,其断面直径与高度之间的关系是一种不确定的相关关系;对于④,曲线y=x2上的点与该点的坐标之间的关系是一一对应关系,不是相关关系.综上,其中有相关关系的是①③.故选B.
2.C [解析] A,B是确定的函数关系图象.由C,D的散点图,可知两个变量具有线性相关关系的是C.故选C.
3.B [解析] 两个变量之间的样本相关系数r的绝对值越接近于1,表示两个变量的线性相关程度越强.故选B.
4.B [解析] 根据表格数据,得到散点图如图所示,由散点图可知,数据(3,7)偏离程度最高,故应该去掉数据(3,7).故选B.
5.A [解析] 画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额正相关.故选A.
6.C [解析] 由题意可知,变量x,y的散点图中,y随x的增大而增大,所以变量x与y正相关;分别观察两个散点图,图①比图②中的点更加集中,线性相关程度更强,所以|r1|>|r2|.故选C.
7.A [解析] 画出散点图,由散点图可知两个变量线性相关程度较强.由题知xi=75,yi=543,=1375,xiyi=8285,=59 051,=15,=108.6,则r==≈0.98,故两个变量的线性相关程度较强.
8.ACD [解析] 根据样本相关系数的含义,可得当r>0时,X和Y正相关;当r=0时,X和Y没有线性相关关系.故A正确,C正确.当r<0时,随着r的值减小,|r|越接近1,X和Y的线性相关程度越强,故B错误.当|r|越接近1时,成对样本数据的线性相关程度越强,当r=-0.99时,X和Y具有较强的线性相关程度,故D正确.故选ACD.
9.ABD [解析] 散点图从左向右看呈上升趋势,则小明的数学成绩总的趋势是在逐步提高,故A正确;小明在这连续9次测试中的最高分大于130分,最低分小于90分,两者的差超过40分,故B正确;散点落在某条直线附近,故小明的数学成绩与测试序号线性相关,且为正相关,故C错误,D正确.故选ABD.
10.②④ [解析] 对于①,正方形的边长a和面积S的关系是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h和右手一拃长x正相关;对于③,真空中做自由落体运动的物体下落的距离h和下落的时间t的关系是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h和体重x正相关.故答案为②④.
11.H [解析] 因为样本相关系数的绝对值越大,成对样本数据的线性相关程度越强,且|-0.95|>|0.92|>|0.36|>|-0.32|,所以H组数据的线性相关程度最强.
12.0.97 [解析] 样本中10棵这种树木的根部横截面积的平均数==0.06,样本中10棵这种树木的材积量的平均数==0.39,则样本相关系数r====
≈≈0.97.
13.解:(1)根据题意,其散点图如图.
(2)由散点图可知,温度与热茶杯数近似呈现线性关系,且温度越高,卖出的热茶杯数越少.
14.解:由题意可得,==3,==26,
所以r===≈0.99,
因为r≈0.99,|r|∈[0.75,1],所以y与x正线性相关,且线性相关程度较强.第八章 成对数据的统计分析
8.1 成对数据的统计相关性
【学习目标】
  1.通过收集现实问题中两个有关联变量的数据,作出散点图,并利用散点图直观认识变量间的相关关系.
  2.会求出样本相关系数r,并能利用样本相关系数r判断两个随机变量间线性相关程度的大小.
◆ 知识点一 变量的相关关系
1.相关关系:两个变量    ,但又没有确切到可由其中的一个去    决定另一个的程度,这种关系称为相关关系.
2.散点图:样本中每个编号下的成对      都可用直角坐标系中的点表示出来,由这些点组成的统计图叫作散点图.
3.正相关、负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现    的趋势,就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现    的趋势,则称这两个变量负相关.
4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在    附近,就称这两个变量线性相关.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)两个变量具有相关关系就是指具有函数关系. (  )
(2)若散点不是落在一条直线附近,则说明两个变量没有相关性. (  )
(3)当散点落在一条折线附近时,这两个变量也具有相关性. (  )
(4)散点图中的点散布在从左下角到右上角的区域所呈现的是正相关. (  )
(5)散点图中的点散布在从左上角到右下角的区域所呈现的是负相关. (  )
◆ 知识点二 样本相关系数
1.定义:对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和,r==,则称r为变量x和变量y的样本相关系数,其中,当r>0时,称成对样本数据    相关,当r<0时,称成对样本数据    相关.
2.样本相关系数与成对样本数据线性相关性强弱的关系:
样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度.
r∈    ,当|r|越接近1时,成对样本数据的线性相关程度    ;当|r|越接近0时,成对样本数据的线性相关程度    .
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)样本相关系数r的符号反映了相关关系的正负性. (  )
(2)对于简单随机样本而言,样本相关系数r是确定的. (  )
(3)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好. (  )
(4)r=0表明成对样本数据间不存在相关性.(  )
◆ 探究点一 相关关系的概念                 
例1 下列说法正确的是 (  )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性关系
变式 (多选题)下列说法正确的是 (  )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.学生的体重与学习成绩之间不具有相关关系
[素养小结]
函数关系是一种确定的关系,而相关关系是一种不确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
◆ 探究点二 散点图与变量的相关关系
例2 以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
房屋面积x(m2) 115 110 80 135 105
销售价格y(万元) 24.8 21.6 19.4 29.2 22
(1)画出数据对应的散点图.
(2)房屋的销售价格和房屋面积之间是否具有相关关系 如果有相关关系,是正相关还是负相关
变式 (1)[2024·张家口高二期中] 观察下列散点图,其中两个变量的相关关系判断正确的是 (  )
A.a为正相关,b为负相关,c为不相关
B.a为负相关,b为不相关, c为正相关
C.a为负相关,b为正相关,c为不相关
D.a为正相关,b为不相关,c为负相关
(2)某公司2018~2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
年份 2018 2019 2020 2021 2022 2023
利润x 12.2 14.6 16 18 20.4 22.3
支出y 0.62 0.74 0.81 0.89 1 1.11
根据统计资料,下列说法正确的是 (  )
A.年利润的中位数是16,x与y正线性相关
B.年利润的中位数是17,x与y正线性相关
C.年利润的中位数是17,x与y负线性相关
D.年利润的中位数是18,x与y负线性相关
[素养小结]
(1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的,还可能不相关.
(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
◆ 探究点三 样本相关系数
例3 [2024·上海复旦大学附中高二期中] 对两个变量的三组数据进行统计,得到以下散点图,关于两个变量样本相关系数的比较,正确的是 (  )
A.r1>r2>r3 B.r2>r3>r1
C.r1>r3>r2 D.r3>r2>r1
变式 变量x,y的样本相关系数为r1,变量m,n的样本相关系数为r2,下列说法错误的是 (  )
A.若|r1|=0.96,则说明变量x,y之间线性相关程度很强
B.若r1>r2,则说明变量x,y之间的线性相关程度比变量m,n之间的线性相关程度强
C.若r1=0.95,则说明变量x,y正线性相关
D.若r1=0,则说明变量x,y之间没有线性相关关系
[素养小结]
利用样本相关系数r判断成对样本数据之间线性相关程度的步骤:
(1)利用公式计算样本相关系数r;
(2)用样本相关系数r的绝对值的大小判断成对样本数据相关的程度.
◆ 探究点四 样本相关系数的实际应用
例4 某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(单位:℃,如图甲),以及每天每100颗种子中的发芽数情况(单位:颗,如图乙).
(1)请在图丙中画出发芽数y与温差x的散点图;
(2)计算发芽数y与温差x之间的样本相关系数(保留三位小数),并推断它们的线性相关程度.
参考数据:xi=75,yi=162,xiyi=2051,≈4.2,≈6.5.
附:当|r|≥0.75时,线性相关程度较强.
变式 暑期社会实践中,小娴所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y(元)的情况,得到的数据如下表:
x 2 4 5 6 8
y 20 30 50 50 70
利用样本相关系数r判断y与x是否线性相关,并推断它们的线性相关程度(若|r|≥0.75,则认为y与x的线性相关程度较强;若0<|r|<0.75,则认为y与x的线性相关程度较弱).
[素养小结]
判断变量的线性相关程度通常有两种方式:一是散点图;二是样本相关系数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量线性相关程度的强弱.
拓展 为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取1个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸(单位:cm):
抽取序号i 1 2 3 4 5 6 7 8
医疗物资尺寸x 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取序号i 9 10 11 12 13 14 15 16
医疗物资尺寸x 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,≈18.439,=1591.136 6,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个医疗物资的尺寸(单位:cm),i=1,2,3,…,16.
(1)求医疗物资尺寸与抽取序号的样本相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检医疗物资中,如果出现了尺寸在(-3s,+3s)之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查 第八章 成对数据的统计分析
8.1 成对数据的统计相关性
一、选择题
1.有下列关系:                 
①人的年龄与他的骨密度之间的关系;
②一个学生与他的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线y=x2上的点与该点的坐标之间的关系.
其中有相关关系的是 (  )
A.②④ B.①③
C.②③④ D.①②③④
2.图中的两个变量具有线性相关关系的是 (  )
A B C D
3.下列选项中两个变量的线性相关程度最强的是 (  )
A.某商店的职工人数与商品销售额之间的样本相关系数为0.87
B.流通费用率与商业利润之间的样本相关系数为-0.94
C.商品销售额与商业利润之间的样本相关系数为0.51
D.商品销售额与流通费用率之间的样本相关系数为-0.81
4.[2024·浙江五校联盟高二期中] 如下表给出5组数据(x,y),为选出4组数据使其线性相关程度最强,且保留第1组数据(5,3),则应去掉数据 (  )
i 1 2 3 4 5
xi 5 4 3 2 -4
yi 3 2 7 1 -6
A.(4,2) B.(3,7)
C.(2,1) D.(-4,-6)
5.某商家今年上半年各月的人均销售额与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额(千元) 6 5 8 3 4 7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是 (  )
A.利润率与人均销售额正相关
B.利润率与人均销售额负相关
C.利润率与人均销售额呈现正比例函数关系
D.利润率与人均销售额呈现反比例函数关系
6.[2024·四川成都高二期中] 对变量x,y有观测数据(xi,yi)(i∈N*),得散点图①;对变量u,v有观测数据(ui,vi)(i∈N*),得散点图②.r1表示变量x,y之间的样本相关系数,r2表示变量u,v之间的样本相关系数,则下列说法正确的是 (  )
A.变量x与y正相关,且|r1|<|r2|
B.变量x与y负相关,且|r1|>|r2|
C.变量x与y正相关,且|r1|>|r2|
D.变量x与y负相关,且|r1|<|r2|
7.两个变量满足的关系如下表.
x 5 10 15 20 25
y 103 105 110 111 114
则两个变量的线性相关程度 (  )
A.较强 B.较弱
C.不相关 D.不确定
8.(多选题)[2024·江西景德镇高二期中] 变量X和Y的样本相关系数为r,则下列说法正确的是 (  )
A.当r>0时,X和Y正相关
B.随着r的值减小,X和Y的线性相关程度也减弱
C.当r=0时,X和Y没有线性相关关系
D.当r=-0.99时,X和Y具有较强的线性相关程度
9.(多选题)对小明在连续9次高考模拟数学测试中的成绩(单位:分)进行统计得到如图所示的散点图.他的同桌小刚根据散点图对他的数学成绩的分析中,正确的有 (  )
A.小明的数学成绩总的趋势是在逐步提高
B.小明在这连续9次测试中的最高分与最低分的差超过40分
C.小明的数学成绩与测试序号线性相关,且为负相关
D.小明的数学成绩与测试序号线性相关,且为正相关
二、填空题
10.下列两个变量之间具有相关关系的是    .
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中做自由落体运动的物体下落的距离h和下落的时间t;
④一个人的身高h和体重x.
11.[2024·河南名校高二月考] 为了比较E,F,G,H四组数据的线性相关程度强弱,某同学分别计算了E,F,G,H四组数据的样本相关系数,求得数值依次为0.92,-0.32,0.36,-0.95,则这四组数据中线性相关程度最强的是    .
12.[2024·陕西师范大学附中高二月考] 某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横 截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4,则该林区这种树木的根部横截面积与材积量的样本相关系数为    .(精确到0.01)
附:样本相关系数r=,≈1.377.
三、解答题
13.如表是某小卖部6天卖出热茶的杯数与当天温度的对比表:
温度/℃ 25 18 12 10 4 0
热茶杯数 18 30 37 35 50 54
(1)根据表中的数据画出散点图.
(2)你能从散点图中发现温度与热茶杯数近似呈现什么关系吗
14.近年来,新能源产业蓬勃发展,据统计,某市一家新能源企业近5个月的产值(亿元)如表:
月份 5月 6月 7月 8月 9月
月份代码x 1 2 3 4 5
产值y(亿元) 16 20 27 30 37
根据上表数据,推断两个变量是否线性相关,并用样本相关系数说明y与x的线性相关程度(若0.75≤|r|≤1,则认为y与x的线性相关程度较强;若|r|<0.75,则认为y与x的线性相关程度较弱).
参考数据:xiyi=442,=55,=3654,≈52.3.(共75张PPT)
8.1 成对数据的统计相关性
探究点一 相关关系的概念
探究点二 散点图与变量的相关关系
探究点三 样本相关系数
探究点四 样本相关系数的实际应用
【学习目标】
1.通过收集现实问题中两个有关联变量的数据,作出散点图,并利
用散点图直观认识变量间的相关关系.
2.会求出样本相关系数,并能利用样本相关系数 判断两个随机
变量间线性相关程度的大小.
知识点一 变量的相关关系
1.相关关系:两个变量________,但又没有确切到可由其中的一个去
________决定另一个的程度,这种关系称为相关关系.
2.散点图:样本中每个编号下的成对 __________都可用直角坐标系
中的点表示出来,由这些点组成的统计图叫作散点图.
有关系
精确地
样本数据
3.正相关、负相关:如果从整体上看,当一个变量的值增加时,另一
个变量的相应值也呈现______的趋势,就称这两个变量正相关;当
一个变量的值增加时,另一个变量的相应值呈现______的趋势,则
称这两个变量负相关.
增加
减小
4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而
且散点落在__________附近,就称这两个变量线性相关.
一条直线
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)两个变量具有相关关系就是指具有函数关系.( )
×
(2)若散点不是落在一条直线附近,则说明两个变量没有相关性.
( )
×
[解析] 只能说明这两个变量不是线性相关,但并不一定能说明有没
有相关性,
若散点落在一条折线附近,则称这两个变量非线性相关或曲线相关.
(3)当散点落在一条折线附近时,这两个变量也具有相关性.( )

(4)散点图中的点散布在从左下角到右上角的区域所呈现的是正相
关.( )

(5)散点图中的点散布在从左上角到右下角的区域所呈现的是负相
关.( )

知识点二 样本相关系数
1.定义:对于变量和变量 ,设经过随机抽样获得的成对样本数据为
,, ,,其中,, ,和,, , 的均值分
别为和,,则称 为
变量和变量的样本相关系数,其中,当 时,称成对样本数据
____相关,当 时,称成对样本数据____相关.


2.样本相关系数与成对样本数据线性相关性强弱的关系:
样本相关系数 的绝对值大小可以反映成对样本数据之间线性相关的
程度.
_______,当 越接近1时,成对样本数据的线性相关程度
_______;当 越接近0时,成对样本数据的线性相关程度______.
越强
越弱
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)样本相关系数 的符号反映了相关关系的正负性.( )

(2)对于简单随机样本而言,样本相关系数 是确定的.( )
×
[解析] 对于简单随机样本而言,样本具有随机性,因此样本相关系数
也具有随机性.
(3)一般地,样本容量越大,用样本相关系数估计两个变量的相关系
数的效果越好.( )

(4) 表明成对样本数据间不存在相关性.( )
×
[解析] 只表明成对样本数据间没有线性相关关系,但不排除它
们之间有其他相关关系.
探究点一 相关关系的概念
例1 下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性关系

[解析] 当两个变量之间具有确定的关系时,两个变量之间是函数关
系,而不是相关关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,
故C错误;
一个学生的数学成绩与物理成绩之间的关系是相关关系,是非确定
性关系,故D正确.故选D.
变式 (多选题)下列说法正确的是( )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.学生的体重与学习成绩之间不具有相关关系
[解析] 正方体的体积与棱长之间的关系是函数关系,故A正确;
人的身高与视力之间不具有相关关系,故B错误;
汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;
学生的体重与学习成绩之间不具有相关关系,故D正确.故选 .



[素养小结]
函数关系是一种确定的关系,而相关关系是一种不确定的关系.函数关
系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
探究点二 散点图与变量的相关关系
例2 以下是在某地搜集到的不同楼盘房屋的销售价格 (单位:万元)
和房屋面积(单位: 的数据:
115 110 80 135 105
24.8 21.6 19.4 29.2 22
(1)画出数据对应的散点图.
解:数据对应的散点图如图所示:
(2)房屋的销售价格和房屋面积之间是否具有相关关系?如果有相
关关系,是正相关还是负相关?
解:由(1)中散点图可以判断,房屋的销售价格和房屋面积之间具
有相关关系,且是正相关.
变式(1) [2024·张家口高二期中]观察下列散点图,其中两个变量的
相关关系判断正确的是( )
A.为正相关,为负相关, 为不相关
B.为负相关,为不相关, 为正相关
C.为负相关,为正相关, 为不相关
D.为正相关,为不相关, 为负相关

[解析] 图a中各点分布在从左下角到右上角的区域内,两个变量正相
关;
图b中各点分布在从左上角到右下角的区域内,两个变量负相关;
图c中各点的分布不呈带状,两个变量不相关.故选A.
(2)某公司年的年利润 (单位:百万元)与年广告支
出 (单位:百万元)的统计资料如表所示:
年份 2018 2019 2020 2021 2022 2023
12.2 14.6 16 18 20.4 22.3
0.62 0.74 0.81 0.89 1 1.11
根据统计资料,下列说法正确的是( )
A.年利润的中位数是16,与 正线性相关
B.年利润的中位数是17,与 正线性相关
C.年利润的中位数是17,与 负线性相关
D.年利润的中位数是18,与 负线性相关

[解析] 由题意知,年利润的中位数是 .作出散点图,如图,由
散点图知与 正线性相关.故选B.
[素养小结]
(1)判断两个变量和 间具有哪种相关关系,最简便的方法是绘制
散点图.变量之间可能是线性的,也可能是非线性的,还可能不相关.
(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,
或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
探究点三 样本相关系数
例3 [2024·上海复旦大学附中高二期中]对两个变量的三组数据进行
统计,得到以下散点图,关于两个变量样本相关系数的比较,正确
的是( )
A. B. C. D.

[解析] 由散点图知,第1个图中两个变量正相关,故 ;
第2,3个图中两个变量负相关,且图2中两变量的相关程度更强,故
.
综上, .故选C.
变式 变量,的样本相关系数为,变量, 的样本相关系数为
,下列说法错误的是( )
A.若,则说明变量, 之间线性相关程度很强
B.若,则说明变量,之间的线性相关程度比变量, 之间
的线性相关程度强
C.若,则说明变量, 正线性相关
D.若,则说明变量, 之间没有线性相关关系

[解析] 对于A,因为接近于1,所以说明变量, 之间的
线性相关程度很强,故A中说法正确;
对于B,若, ,满足,但是,此时说
明变量, 之间的线性相关程度比变量, 之间的线性相关程度弱,
故B中说法错误;
对于C,若,则说明变量, 正线性相关,故C中说法正确;
对于D,若,则说明变量, 之间没有线性相关关系,故D中
说法正确.故选B.
[素养小结]
利用样本相关系数 判断成对样本数据之间线性相关程度的步骤:
(1)利用公式计算样本相关系数 ;
(2)用样本相关系数 的绝对值的大小判断成对样本数据相关的程度.
探究点四 样本相关系数的实际应用
例4 某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与
某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他
们分别记录了12月1日至12月6日每天昼夜最高、最低的温度
(单位: ,如图甲),以及每天每100颗种子中的发芽数情况
(单位:颗,如图乙).
(1)请在图丙中画出发芽数与温差 的散点图;
解:散点图如图所示.
(2)计算发芽数与温差 之间的样本相关系数(保留三位小数),
并推断它们的线性相关程度.
参考数据:,, ,
, .
附:当 时,线性相关程度较强.
解:与 之间的样本相关系数
,所
以与 的线性相关程度较强.
变式 暑期社会实践中,小娴所在的小组调查了某地家庭人口数 与
每天对生活必需品的消费 (元)的情况,得到的数据如下表:
2 4 5 6 8
20 30 50 50 70
利用样本相关系数判断与 是否线性相关,并推断它们的线性相关
程度(若,则认为与 的线性相关程度较强;若
,则认为与 的线性相关程度较弱).
解:由表中数据,计算得 ,




则 ,
与 线性相关,且线性相关程度较强.
[素养小结]
判断变量的线性相关程度通常有两种方式:一是散点图;二是样本
相关系数 .前者只能粗略的说明变量间具有相关性,而后者从定量的
角度分析变量线性相关程度的强弱.
拓展 为了监控某种医疗物资的一条生产线的生产过程,检验员每隔
从该生产线上随机抽取1个医疗物资,并测量其尺寸
(单位: .下面是检验员在一天内依次抽取的16个医疗物资的尺寸
(单位:
1 2 3 4 5 6 7 8
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
9 10 11 12 13 14 15 16
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得 ,

, ,
,其中为抽取的第 个医疗物资的尺寸
(单位:,,2,3, ,16.
(1)求医疗物资尺寸与抽取序号的样本相关系数 ,并回答是否可
以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变
大或变小(若 ,则可以认为医疗物资尺寸不随生产过程的
进行而系统地变大或变小).
解:由已知数据得样本相关系数
.
由于 ,因此可以认为这一天生产的医疗物资尺寸不随生产
过程的进行而系统地变大或变小.
(2)一天内抽检医疗物资中,如果出现了尺寸在 之
外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了
异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,
是否需对当天的生产过程进行检查?
解:由于,,
故 可近似为 ,
由样本数据可以看出抽取的第13个医疗物资的尺寸在
之外,因此需对当天的生产过程进行检查.
1.相关关系与函数关系的区别和联系
函数关系 相关关系
相同点 两者均是指两个变量之间的关系 不同点 是一种确定性关系 是一种非确定性关系
是一种因果关系 不一定是因果关系,也可能是伴
随关系
是一种理想的相关关 系模型 是一种更为一般的情况
2.样本相关系数
当时,表明两个变量正相关;当 时,表明两个变量负相关.
的绝对值越接近于1,表明两个变量的线性相关程度越强; 的绝对值
越接近于0,表明两个变量的线性相关程度越弱.通常 时,认为
两个变量有很强的线性相关性.
1.根据散点图判断样本相关系数的大小
散点分布在左下角至右上角,说明两个变量正相关;散点分布在左
上角至右下角,说明两个变量负相关.散点越集中在一条直线附近,
样本相关系数越接近于1(或 .
2.数形结合思想在相关关系中的应用
数形结合是将抽象的数学语言与直观的图形结合起来思考,也就是将
抽象思维与形象思维有机地结合起来解决问题的一种方法,它能使抽
象问题具体化,复杂问题简单化.本节的数形结合思想的应用是利用散
点图判断相关关系.
例 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一
些年龄和脂肪含量的简单随机样本数据,如表:
26 27 39 41 49 53 56 58 60 61
14.5 17.8 21.2 25.9 26.3 29.6 31.4 33.5 35.2 34.6
(1)根据表中的样本数据作出散点图;
解:根据题表中的数据得到如图所示的散点图.
(2)计算样本相关系数(结果精确到 ,并判断它们的相关程度.
附:样本相关系数, ,
,,, .
解:由题可知,


相本相关系数 ,
由 ,可以推断人体脂肪含量和年龄的相关程度很强.
练习册
一、选择题
1.有下列关系:
①人的年龄与他的骨密度之间的关系;
②一个学生与他的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线 上的点与该点的坐标之间的关系.
其中有相关关系的是( )
A.②④ B.①③ C.②③④ D.①②③④

[解析] 对于①,人的年龄与他的骨密度是一种不确定的相关关系;
对于②,一个学生与他的学号之间的关系是一种确定的对应关系,
不是相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间的关系是
一种不确定的相关关系;
对于④,曲线 上的点与该点的坐标之间的关系是一一对应
关系,不是相关关系.综上,其中有相关关系的是①③.故选B.
2.图中的两个变量具有线性相关关系的是( )
A. B. C. D.
[解析] A,B是确定的函数关系图象.
由C,D的散点图,可知两个变量具有线性相关关系的是C.故选C.

3.下列选项中两个变量的线性相关程度最强的是( )
A.某商店的职工人数与商品销售额之间的样本相关系数为0.87
B.流通费用率与商业利润之间的样本相关系数为
C.商品销售额与商业利润之间的样本相关系数为0.51
D.商品销售额与流通费用率之间的样本相关系数为
[解析] 两个变量之间的样本相关系数 的绝对值越接近于1,表示两
个变量的线性相关程度越强.故选B.

4.[2024·浙江五校联盟高二期中]如下表给出5组数据 ,为选出4
组数据使其线性相关程度最强,且保留第1组数据 ,则应去掉数
据( )
1 2 3 4 5
5 4 3 2
3 2 7 1
A. B. C. D.

[解析] 根据表格数据,得到散点图如图所示,由散点图可知,数据
偏离程度最高,故应该去掉数据 .故选B.
5.某商家今年上半年各月的人均销售额与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额(千元) 6 5 8 3 4 7
12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额正相关
B.利润率与人均销售额负相关
C.利润率与人均销售额呈现正比例函数关系
D.利润率与人均销售额呈现反比例函数关系

[解析] 画出利润率与人均销售额的散点图,如图.由图可知利润率与
人均销售额正相关.故选A.
6.[2024·四川成都高二期中]对变量,有观测数据 ,得
散点图①;对变量,有观测数据,得散点图②. 表
示变量,之间的样本相关系数,表示变量, 之间的样本相关系数,
则下列说法正确的是( )
A.变量与正相关,且 B.变量与负相关,且
C.变量与正相关,且 D.变量与负相关,且

[解析] 由题意可知,变量,的散点图中,随 的增大而增大,所以
变量与 正相关;
分别观察两个散点图,图①比图②中的点更加集中,线性相关程度
更强,所以 .故选C.
7.两个变量满足的关系如下表.
5 10 15 20 25
103 105 110 111 114
则两个变量的线性相关程度( )
A.较强 B.较弱 C.不相关 D.不确定

[解析] 画出散点图,由散点图可知两个变量线性相关程度较强.
由题知,,, ,
,, ,
则 ,
故两个变量的线性相关程度较强.
8.(多选题)[2024·江西景德镇高二期中] 变量和 的样本相关系数
为 ,则下列说法正确的是( )
A.当时,和 正相关
B.随着的值减小,和 的线性相关程度也减弱
C.当时,和 没有线性相关关系
D.当时,和 具有较强的线性相关程度



[解析] 根据样本相关系数的含义,可得当时,和 正相关;
当时,和没有线性相关关系.故A正确,C正确.
当 时,随着的值减小,越接近1,和 的线性相关程度越强,
故B错误.
当越接近1时,成对样本数据的线性相关程度越强,当
时,和具有较强的线性相关程度,故D正确.故选 .
9.(多选题)对小明在连续9次高考模拟数学测
试中的成绩(单位:分)进行统计得到如图所
示的散点图.他的同桌小刚根据散点图对他的数
学成绩的分析中,正确的有( )
A.小明的数学成绩总的趋势是在逐步提高
B.小明在这连续9次测试中的最高分与最低分的差超过40分
C.小明的数学成绩与测试序号线性相关,且为负相关
D.小明的数学成绩与测试序号线性相关,且为正相关



[解析] 散点图从左向右看呈上升
趋势,则小明的数学成绩总的趋势
是在逐步提高,故A正确;
小明在这连续9次测试中的最高分大于130分,最低分小于90分,两
者的差超过40分,故B正确;
散点落在某条直线附近,故小明的数学成绩与测试序号线性相关,
且为正相关,故C错误,D正确.故选 .
二、填空题
10.下列两个变量之间具有相关关系的是______.
①正方形的边长和面积 ;
②一个人的身高和右手一拃长 ;
③真空中做自由落体运动的物体下落的距离和下落的时间 ;
④一个人的身高和体重 .
②④
[解析] 对于①,正方形的边长和面积 的关系是函数关系,不是相
关关系;
对于②,一般情况下,一个人的身高和右手一拃长 正相关;
对于③,真空中做自由落体运动的物体下落的距离 和下落的时
间 的关系是函数关系,不是相关关系;
对于④,一般情况下,一个人的身高和体重 正相关.故答案为②④.
11.[2024·河南名校高二月考] 为了比较,,, 四组数据的线性
相关程度强弱,某同学分别计算了,,, 四组数据的样本相关
系数,求得数值依次为,,, ,则这四组数据
中线性相关程度最强的是___.
[解析] 因为样本相关系数的绝对值越大,成对样本数据的线性相关
程度越强,且,所以 组数据
的线性相关程度最强.
12.[2024·陕西师范大学附中高二月考] 某地经过多年的环境治理,
已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,
随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )
和材积量(单位: ),得到如下数据:
1 2 3 4 5 6 7 8 9 10 总和
0.0 4 0.0 6 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
0.2 5 0.4 0 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得,, ,则该林区
这种树木的根部横截面积与材积量的样本相关系数为_____.
(精确到 )
附:样本相关系数, .
0.97
[解析] 样本中10棵这种树木的根部横截面积的平均数 ,
样本中10棵这种树木的材积量的平均数 ,
则样本相关系数 .
三、解答题
13.如表是某小卖部6天卖出热茶的杯数与当天温度的对比表:
25 18 12 10 4 0
热茶杯数 18 30 37 35 50 54
(1)根据表中的数据画出散点图.
解:根据题意,其散点图如图.
(2)你能从散点图中发现温度与热茶杯数近似呈现什么关系吗?
解:由散点图可知,温度与热茶杯数近似呈现线性关系,且温度越
高,卖出的热茶杯数越少.
14.近年来,新能源产业蓬勃发展,据统计,某市一家新能源企业近5
个月的产值(亿元)如表:
月份 5月 6月 7月 8月 9月
1 2 3 4 5
16 20 27 30 37
根据上表数据,推断两个变量是否线性相关,并用样本相关系数说
明与的线性相关程度(若,则认为与 的线性相关
程度较强;若,则认为与 的线性相关程度较弱).
参考数据:,,, .
解:由题意可得, ,
,
所以 ,
因为,,所以与 正线性相关,且线性相关程度
较强.