9.1.1 变量的相关性(课件 学案 练习)高中数学苏教版(2019)选择性必修第二册

文档属性

名称 9.1.1 变量的相关性(课件 学案 练习)高中数学苏教版(2019)选择性必修第二册
格式 zip
文件大小 12.2MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-09-19 15:21:14

文档简介

(共95张PPT)
9.1 线性回归分析
9.1.1 变量的相关性
探究点一 相关关系的理解
探究点二 散点图与变量的相关关系
探究点三 样本相关系数的计算
探究点四 样本相关系数的实际应用




课前预习
课中探究
备课素材
练习册
答案核查【导】
答案核查【练】
【学习目标】
1.结合实例,体会两个变量间的相关关系.
2.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标
准化数据向量夹角的关系.
3.结合实例,会通过相关系数比较多组成对数据的相关性.
知识点一 变量的相关关系
1.相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关
系称为__________.
相关关系
2.散点图:样本中每个编号下的成对样本数据都可用平面直角坐标系
中的点表示出来,由这些点组成的统计图叫作散点图.
3.散点图与相关性
(1)线性相关关系
观察散点图,若所有的点散布在__________附近,则说明这些点的
横坐标与纵坐标之间具有相关关系,我们将具有这种特性的相关关
系称为线性相关关系.
一条直线
3.散点图与相关性
(2)正相关与负相关
如果具有相关关系的两个变量的散点图呈从______向______方向发
展的趋势,我们称这两个变量之间正相关.同理,如果具有相关关系
的两个变量的散点图呈从______逐渐向______方向发展的趋势,则
称这两个变量之间负相关.
左下
右上
左上
右下
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)两个变量具有相关关系就是指这两个变量具有函数关系.( )
×
(2)若散点不是落在一条直线附近,则说明两个变量没有相关性.
( )
×
[解析] 只能说明这两个变量之间不是线性相关关系,但并不一定说
明没有相关关系,若散点落在一条曲线附近,则称这两个变量具有
非线性相关关系.
(3)当散点落在一条曲线附近时,这两个变量也具有相关关系.( )

(4)散点图中的点散布在从左下角到右上角的区域所呈现的是正相
关.( )

(5)散点图中的点散布在从左上角到右下角的区域所呈现的是负相
关.( )

知识点二 样本相关系数
(1)样本相关系数 的计算公式
.
(2)样本相关系数 具有的性质
①___ ___1;
②时与呈____相关关系,时与 呈____相关关系;


③越接近1,与相关的程度就______,越接近0,与 相关的
程度就______.
通常情况下,当时,认为线性相关关系显著;当 时,
认为几乎没有线性相关关系.
越强
越弱
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)样本相关系数 的符号反映了相关关系的正负.( )

(2)一般地,样本容量越大,用样本相关系数估计两个变量的线性
相关关系的效果越好.( )

(3) 表明成对样本数据间不存在相关关系.( )
×
[解析] 只表明成对样本数据间没有线性相关关系,但不排除它
们之间有其他相关关系.
探究点一 相关关系的理解
例1 下列给出的两个变量之间具有相关关系的是( )
A.人所站的高度与视野 B.人眼的近视程度与身高
C.正方体的体积与棱长 D.某同学的学籍号与考试成绩
[解析] 对于A,一般情况下,人所站的高度越高则视野越开阔,两
个变量之间具有正相关关系,故A正确;
对于B,人眼的近视程度与身高不具有相关关关系,故B错误;
对于C,正方体的体积与棱长之间具有函数关系,不具有相关关系,故C错误;
对于D,某同学的学籍号与考试成绩之间不具有相关关系,故D错误.
故选A.

变式(1)(多选题)[2025·江苏南通二中高二月考]下列两个变
量之间的关系为相关关系的是( )
A.光照时间与大棚内蔬菜的产量
B.某正方形的边长与此正方形的面积
C.每亩地的施肥量与粮食亩产量
D.人的身高与体重
[解析] 选项B中两个变量之间的关系是确定的函数关系,而不是相
关关系;
选项A,C,D中两个变量之间的关系都是相关关系.
故选 .



(2)(多选题)[2025·江苏常州高二期中]下列两个变量之间具
有相关关系的是( )
A.产品的成本与生产数量
B.球的表面积与体积
C.家庭的支出与收入
D.在一定的年龄范围内,人的年龄与体重



[解析] 对于A,产品的成本与生产数量之间具有相关关系,故A正确;
对于B,球的表面积与体积之间具有函数关系,而不具有相关关系,
故B错误;
对于C,家庭的支出与收入之间具有相关关系,故C正确;
对于D,在一定的年龄范围内,人的年龄与体重之间具有相关关系,
故D正确.
故选 .
[素养小结]
函数关系是一种确定的关系,满足相关关系的两个变量之间不具有
函数关系所要求的确定性,它们之间的关系具有随机性.函数关系是
一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
探究点二 散点图与变量的相关关系
例2(1)[2025·北京朝阳区高二期末]对变量, 由观测数据得散
点图①,对变量, 由观测数据得散点图②.由这两个散点图可以判
断( )
A.变量与负相关,与正相关 B.变量与负相关,与 负相关
C.变量与正相关,与正相关 D.变量与正相关,与 负相关

[解析] 由散点图可知,变量与负相关,变量与 正相关,所以变
量与 负相关.故选B.
(2)在关于人体脂肪含量(百分比)与年龄 关系的研究中,得到
如表所示的一组数据:
年龄 23 27 39 41 45 50
脂肪含量 9.5 17.8 21.2 25.9 27.5 28.2
画出散点图,并判断与 是否具有线性相关关系
解:作出散点图,如图所示,由图可看出与 具有线性相关关系.
变式 [2025·江苏徐州高二期末]下列图中,能表示出相应两个变
量之间具有线性相关关系的是( )
A. B. C. D.

[解析] 对于A,由题图可知,两个变量之间是确定的函数关系,不
是相关关系,故A不正确;
对于B,题图中的散点分布在某条直线的附近,两个变量之间具有线
性相关关系,故B正确;
对于C,题图中的散点没有向某条直线的附近集中,两个变量之间不
具有线性相关关系,故C不正确;
对于D,题图中的散点分布在一条曲线附近,两个变量之间不具有线
性相关关系,故D不正确.
故选B.
[素养小结]
(1)判断两个变量之间具有哪种相关关系,最简便的方法是绘
制散点图.变量之间可能是线性相关关系,也可能是非线性相关关系,
还可能不具有相关关系.
(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,也
要避免点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
探究点三 样本相关系数的计算
角度1 样本相关系数的性质
例3 由变量,,变量,,变量, 对应的样本数据得到的散点
图如图所示,三对变量的样本相关系数依次为,, ,则( )
A. B. C. D.

[解析] 由题中散点图知,变量,正相关,故;
变量, 负相关,变量,负相关,且变量,的线性相关程度强于
变量, 的线性相关程度,故.
综上, .故选C.
变式 变量,的样本相关系数为,变量,的样本相关系数为 ,则下
列说法错误的是( )
A.若,则说明变量, 之间的线性相关程度很强
B.若,则说明变量,之间的线性相关程度比变量, 之间的线
性相关程度强
C.若,则说明变量, 正线性相关
D.若,则说明变量, 之间没有线性相关关系

[解析] 对于A,因为,接近于1,所以变量, 之间的线性相
关程度很强,故A中说法正确;
对于B,若, ,满足,但是,此时说明变
量, 之间的线性相关程度比变量,之间的线性相关程度弱,
故B中说法错误;
对于C,因为 ,所以变量,正线性相关,故C中说法正确;
对于D,因为 ,所以变量, 之间没有线性相关关系,故D中说法正确.
故选B.
角度2 样本相关系数的计算
例4 [2025·江苏通州高二期中]某种机械设备随着使用年限的增加,
它的使用功能逐渐减少,使用价值逐年减少,通常把它使用价值逐年
减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限
(单位:年)与失效费 (单位:万元)的一组统计数据如下表所示:
使用年限 (单位:年) 1 2 3 4 5 6 7
失效费 (单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
则与 的样本相关系数为_____.
0.99
(精确到,参考公式和数据: ,
,, )
[解析] 由题意知 ,
, ,
所以 ,
所以与 的样本相关系数约为0.99.
变式 [2025·江苏扬州高二期末]现调查某地区某种野生动物的数
量,将该地区分成面积相近的200个地块,从这些地块中用简单随机
抽样的方法抽取20个作为样本,调查得到样本数据
,其中,分别表示第 个样本的植物覆盖面
积(单位:公顷)和这种野生动物的数量,构造向量
, ,
其中,,并计算得 ,
,,,,我们知道 对
数据的样本相关系数, ,则上述数据
的样本相关系数 __.
[解析] 由,,可得, ,所以
,,其中,于是 ,
.
[素养小结]
利用样本相关系数判断变量之间线性相关程度的步骤:
(1)利用公式计算样本相关系数
(2)用样本相关系数的绝对值的大小判断变量相关的程度.
探究点四 样本相关系数的实际应用
例5 某农科所对冬季昼夜温差(最高温度与最低温度的差)与某反季
节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记
录了12月1日至12月6日每天昼夜最高、最低的温度(单位: ,如图
甲),以及每天每100颗种子中的发芽数情况(单位:颗,如图乙).
(1)请在图丙中画出发芽数与温差 的散点图;
解:散点图如图所示.
(2)计算发芽数与温差 之间的样本相关系数(保留三位小数),
并推断它们的线性相关程度.
参考数据:,, ,
, .
附:当 时,线性相关程度较强.
解:与之间的样本相关系数
,所以与 的线性相关程度较强.
变式 [2025·江苏宿迁高二期末]某网站统计了某网红产品在2024
年7月至11月的总销售量 (单位:万份),得到以下数据:
月份 7 8 9 10 11
销售量 10 12 11 12 20
根据表中所给数据,计算样本相关系数,并判断与 的线性相关关
系是否显著?
判断依据:当时,认为线性相关关系显著;当 时,
认为几乎没有线性相关关系.
参考公式:样本相关系数 .参考数据:
.
解:由已知得,, ,
, ,
所以 .
因为,所以与 的线性相关关系显著.
[素养小结]
判断变量的线性相关程度通常有两种方式:一是利用散点图;二是
利用样本相关系数.前者只能从直观上粗略的说明变量间相关程度的
强弱,而后者可以从定量的角度分析变量线性相关程度的强弱.
拓展 [2025·江苏常州模拟]直播带货是一种直播和电商相结合的
销售方式,目前已被广大消费者接受.某公司逐月加大直播带货的投
入,直播带货金额稳步提升,以下是该公司2024年前5个月直播带货
金额(单位:万元)的统计表.
月份 1月 2月 3月 4月 5月
月份编号 1 2 3 4 5
直播带货金额 7 12 13 19 24
(1)根据统计表,
①求该公司直播带货金额的平均值 ;
解:由统计表中数据可得 .
(1)根据统计表,
②求该公司直播带货金额与月份编号 的样本相关系数
(精确到 ),并判断它们是否具有显著的线性相关关系.
(当时,认为与的线性相关关系显著;当 时,认
为与 几乎没有线性相关关系)
解:因为, ,

所以样本相关系数,所以变量与 具有
显著的线性相关关系.
(2)该公司现有一个直播间销售甲、乙两种产品.为对产品质量进行
监控,质检人员先用简单随机抽样的方法从甲种产品与乙种产品中
分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的
质检,记进一步质检时抽到甲产品的件数为,求 的分布列与数学
期望.
附:样本相关系数 ,参考数据:,
, , .
解: 由题意知, 的可能取值为0,1,2,3,
因为, ,
, ,
所以 的分布列为
0 1 2 3
所以 .
1.相关关系与函数关系的异同点
函数关系 相关关系
相同点 两者均是两个变量之间的关系
不同点 是一种确定的关系,如匀 速直线运动中时间 与路程 的关系 是一种非确定的关系,如一块
农田的小麦产量与施肥量之间
的关系
是一种因果关系 不一定是因果关系,也可能是
伴随关系
是一种理想的关系模型 是一种更为一般的情况
2.散点图的作用
(1)散点图具有直观、简明的特点,能体现样本数据的密切程
度,可以根据散点图判断变量间是否具有相关关系.
(2)通过散点图不但可以从点的位置判断观测值的大小、变动
范围与趋势,还可以通过观察剔除异常数据,以提高估计相关统计
量的准确性.
3.样本相关系数 的计算公式还可以写成下列形式
,其中, .
1.根据散点图判断样本相关系数的大小
散点分布在左下角至右上角,说明两个变量正相关;散点分布在左
上角至右下角,说明两个变量负相关.散点越集中在一条直线附近,
样本相关系数越接近于1(或 ).
2.数形结合思想在相关关系中的应用
数形结合是将抽象的数学语言与直观的图形结合起来思考,也就是
将抽象思维与形象思维有机地结合起来,进而解决问题的一种思想
方法,它能使抽象问题具体化,复杂问题简单化.本节数形结合思想
的具体应用是利用散点图判断相关关系.
例 科研人员在对人体脂肪含量(单位:百分比)和年龄
(单位:岁)之间关系的研究中,获得了一组样本数据,如表:
年龄 26 27 39 41 49 53 56 58 60 61
脂肪含量 14.5 17.8 21.2 25.9 26.3 29.6 31.4 33.5 35.2 34.6
(1)根据表中的样本数据作出散点图;
解:根据题中的数据得到如图所示的散点图.
例 科研人员在对人体脂肪含量(单位:百分比)和年龄
(单位:岁)之间关系的研究中,获得了一组样本数据,如表:
年龄 26 27 39 41 49 53 56 58 60 61
脂肪含量 14.5 17.8 21.2 25.9 26.3 29.6 31.4 33.5 35.2 34.6
(2)计算样本相关系数(结果精确到 ),并判断它们的线性相
关关系是否显著.
附:样本相关系数, ,
,,, .
解:由题可知,


所以相本相关系数

由 ,可以推断人体脂肪含量和年龄的线性相关关系显著.
练习册
1.[2025·江苏无锡高二期末]下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系

[解析] 对于A,圆的面积与半径之间的关系是确定的关系,是函数
关系,所以A错误;
对于B,粮食产量与施肥量之间的关系不是函数关系,是相关关系,
所以B错误;
对于C,一定范围内,学生的成绩与学习时间成正相关关系,所以C正确;
对于D,人的体重与视力没有相关关系,所以D错误.
故选C.
2.[2025·江苏连云港高二期中]在下列所示的四个图中,两个变量
具有线性相关关系的是( )
A. B. C. D.

[解析] 选项A中,两个变量与 之间具有函数关系,不是相关关系,
不符合题意;
选项B中,两个变量与 构成的点分布在一条直线附近,所以两个变
量之间是线性相关关系,符合题意;
选项C中,两个变量与 构成的点分布在一条曲线附近,所以两个变
量之间不是线性相关关系,不符合题意;
选项D中,两个变量与 构成的点相对分散,不在某条直线或曲线附近,
所以两个变量之间不是线性相关关系,不符合题意.
故选B.
3.根据身高和体重的数据作出的散
点图如图所示,则下列说法正确
的是( )
A.身高越高,体重越重
B.身高越高,体重越轻
C.身高与体重正相关
D.身高与体重负相关

[解析] 身高比较高的人,其体重可能较大,
也可能较小,故A,B不正确;
由散点图知,身高和体重有明显的相关关系,
且身高增加时,体重也呈现增加的趋势,所
以身高与体重正相关,故C正确,D错误.
故选C.
4.[2024·江苏南通期末]调查某种群花萼长度和花瓣长度,所得数
据绘制的散点图如图所示,其中样本相关系数 ,则下列
说法正确的是( )
A.花瓣长度和花萼长度没有相关关系
B.花瓣长度和花萼长度负相关
C.花瓣长度和花萼长度正相关
D.若从样本中抽取一部分,则这部分的样本相关系数一定是

[解析] 根据题图中散点的集中程度可知,花瓣长度和花萼长度有相
关关系,A选项错误;
因为散点呈从左下方向右上方发展的趋势,所以花瓣长度和花萼长
度正相关,B选项错误,C选项正确;
是全部数据的样本相关系数,取出来一部分数据,这些
数据的相关性可能变强,可能变弱,则取出的数据的样本相关系数
不一定是 ,D选项错误,
故选C.
5.[2025·江苏泰州高二期末]某唱片公司欲知唱片费用 (单位:十
万元)与唱片销售量 (单位:千张)之间的关系,从其所发行的唱
片中随机抽选了10张,得到如下的统计量: ,
,,,,则与
的样本相关系数 的绝对值为( )
A.0.6 B.0.5 C.0.4 D.0.3

[解析] 因为,,所以, ,则
.
故选D.
6.设变量和变量的样本相关系数为,变量和变量 的样本相关
系数为,且, ,则( )
A.和之间呈正线性相关关系,且和的线性相关程度强于和
的线性相关程度
B.和之间呈负线性相关关系,且和的线性相关程度强于和
的线性相关程度
C.和之间呈负线性相关关系,且和的线性相关程度弱于和
的线性相关程度
D.和之间呈正线性相关关系,且和的线性相关程度弱于和
的线性相关程度

[解析] ,,和 之间呈正线性相
关关系,和之间呈负线性相关关系,又,和 的线性
相关程度弱于和 的线性相关程度.故选C.
7.[2025·江苏盐城高二期中]对于任意给定的两个变量的一组样本
数据,下列说法正确的是____.(填序号)
①都可以分析出两个变量的关系;
②都可以用一条直线近似地表示两者的关系;
③都可以作出散点图;
④都可以用确定的表达式表示两者的关系.

[解析] 任意给出一组样本数据,都可以作出相应的散点图,但不一
定能分析出两个变量的关系,故①错误,③正确;
更不一定能用一条直线近似地表示两者的关系,②不正确.
两个变量的样本数据不一定有函数关系,不一定可以用确定的表达
式表示两者的关系,故④不正确.
故填③.
8.[2025·辽宁朝阳月考]为了比较甲、乙、丙、丁四组数据线性相
关程度的强弱,某同学分别计算了甲、乙、丙、丁四组数据的样本
相关系数,所得数值依次为,,, ,则这四组
数据中线性相关程度最强的是____组数据.

[解析] 样本相关系数的绝对值 越接近1,数据的线性相关程度越
强,因为 ,所以这四组数据中
线性相关程度最强的是甲组数据.
9.(13分)[2025·江苏启东中学高二期中]2023年是全面贯彻落实
党的二十大精神的开局之年,也是实施“十四五”规划承上启下的关
键之年,经济增长呈现稳中有进的可喜现象.某省为促进刺梨产业的
高质量发展,项目组统计了全省2019年至2023年刺梨产业综合产值
(单位:亿元),有关数据如下:
年份 2019 2020 2021 2022 2023
年份代码 1 2 3 4 5
综合产值 1.5 2 3.5 8 15
用表示年份代码,表示综合产值,请通过样本相关系数,推断 与
之间的线性相关关系是否显著?
附:当 时,认为线性相关关系显著.
参考数据: .
解:, ,



所以

故与 之间的线性相关关系显著.
10.[2025·江苏淮安期末]对甲、乙两组数据进行统计,获得如图所
示的散点图(左图对应甲组数据,右图对应乙组数据),下列结论
错误的是( )
A.甲、乙两组数据都呈线性相关关系
B.乙组数据的线性相关程度比甲组数据的线性相关程度强
C.乙组数据的样本相关系数比甲组数据的样本相关系数大
D.乙组数据的样本相关系数的绝对值更接近1

[解析] 由题中散点图可以看出,甲、乙两组数据都呈线性相关关系,
所以A中结论正确;
乙组数据对应散点图中的点相对更加集中在一条直线附近,所以乙组
数据的线性相关程度比甲组数据的线性相关程度强,样本相关系数的
绝对值更接拉1,所以B,D中结论正确;
甲组数据呈正相关,其样本相关系数大于0,乙组数据呈负相关,其样
本相关系数小于0,所以C中结论错误.
故选C.
11.对变量,有观测数据 ,得如图①所示的
散点图;对变量,有观测数据 ,得如图②
所示的散点图.表示变量,之间的样本相关系数,表示变量 ,
之间的样本相关系数,则( )
A. B.
C. D.

[解析] 从题图可以看出随的增大而减小,随 的增大而减小,则
与呈负相关,与呈负相关,所以, ,故C,D不正确;
另外对比题中两图,容易看出与的线性相关程度更强,则 更接近
,所以 ,故A正确,B错误.
故选A.
12.(多选题)[2025·江西景德镇期中]随机变量和 的样本相关
系数为 ,则下列说法正确的是( )
A.当时,和 具有正线性相关关系
B.随着值减小,和 的相关性也减小
C.当时,和 不具有相关关系
D.当时,和 具有较强的线性相关关系


[解析] 根据样本相关系数的定义可得,当时,和 具有正线
性相关关系;当时,和 不具有线性相关关系,可能有其他相
关关系,故A正确,C错误.
当时,随着值减小, 越来越接近1,和的线性相关程度越
来越强,故B错误.
当时,和 具有较强的线性相关关系,故D正确.
故选 .
13.[2024·上海奉贤高二期中]已知变量, 之间的一组相关数据如
表所示,
6 8 10 12
6 5 3 2
则变量,之间的样本相关系数 _______.(计算结果精确到0.001)
[解析] 根据表中数据计算可知 ,
,

,
,则
变量, 之间的样本相关系数
.
14.(15分)[2022·全国乙卷]某地经过多年的环境治理,已将荒山
改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了
10棵这种树木,测量每棵树的根部横截面积单位:和材积量
单位: ,得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 10 总

根部横截面积 0.0 4 0.0 6 0.0 4 0.0 8 0.0 8 0.0 5 0.0 5 0.0 7 0.0 7 0.0 6 0.6
材积量 0.2 5 0.4 0 0.2 2 0.5 4 0.5 1 0.3 4 0.3 6 0.4 6 0.4 2 0.4 0 3.9
并计算得,, .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材
积量.
解:设选取的10棵这种树木平均一棵的根部横截面积为 ,平均
一棵的材积量为 ,
则, ,
故估计该林区这种树木平均一棵的根部横截面积为 ,平均一
棵的材积量为 .
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数
精确到 .
解: ,


则样本相关系数 .
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这
种树木的根部横截面积总和为 .已知树木的材积量与其根部横
截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的
估计值.
附:相关系数, .
解:设该林区所有这种树木的根部横截面积总和为 ,总材积量
为 ,
则,故 ,
令,则 ,
故该林区这种树木的总材积量的估计值为 .
15.[2025·江苏泰州高二期末]对四组数据进行统计,获得以下散点
图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.

[解析] 由散点图可知变量与,变量与 正相关,且图①中的点
比图③中的点分布更为集中,所以.
变量与,变量 与负相关,且图②中的点比图④中的点分布更为
集中,所以, ,且,故.
综上可得 ,故选B.
16.(15分)[2024·江苏南京期中]为了监控某种零件的一条生产线
的生产过程,检验员每隔30分钟从该生产线上随机抽取一个零件,
并测量其尺寸(单位: ).下面是检验员在一天内依次抽取的16个
零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得 ,
,,
,其中 为抽取的第个零件的尺寸,,2, ,16.
(1)求的样本相关系数 ,并回答是否可以认
为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小
(若 ,则可以认为这一天生产的零件尺寸不随生产过程的
进行而系统地变大或变小).
解: .
显然 ,所以可以认为这一天生产的零件尺寸不随生产过程
的进行而系统地变大或变小.
(2)一天内抽检的零件中,如果出现了尺寸在 之外
的零件,就认为这条生产线在这一天的生产过程中可能出现了异常
情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
解: , ,所以合格零件尺寸的范围是
,显然第13号零件的尺寸不在此范围之内,所以需要
对当天的生产过程进行检查.
(2)一天内抽检的零件中,如果出现了尺寸在 之外
的零件,就认为这条生产线在这一天的生产过程中可能出现了异常
情况,需对当天的生产过程进行检查.
(ⅱ)在 之外的数据称为离群值,试剔除离群值,估
计这条生产线当天生产的零件尺寸的平均数与标准差.(精确到0.01)
附:样本 的样本相关系数
, .
解: 剔除离群值后,剩下的数据平均数为


则剔除离群值后样本的方差为

所以剔除离群值后样本的标准差约为 .
快速核答案(导学案)
课前预习 知识点一 1.相关关系 3.(1)一条直线 (2)左下 右上 左上 右下
【诊断分析】 (1)× (2)× (3)√ (4)√ (5)√
知识点二 (2)① ②正 负 ③越强 越弱
【诊断分析】 (1)√ (2)√ (3)×
课中探究 例1 A 变式 (1)ACD (2)ACD
例2 (1)B (2)略 变式 B
例3 C 变式 B 例4 0.99 变式
例5 (1)略(2)的线性相关程度较强.
变式
的线性相关关系显著
拓展(1)①,变量具有显著的线性相关关系.
(2)的分布列略,
快速核答案(练习册)
1.C 2.B 3.C 4.C 5.D 6.C 7.③ 8.甲
9. 之间的线性相关关系显著
10.C 11.A 12.AD 13.
14.(1)估计该林区这种树木平均一棵的根部横截面积为,平均一棵的
材积量为(2)
(3)该林区这种树木的总材积量的估计值为
15.B
16.(1),可以认为这一天生产的零件尺寸不随生产过程的进行而系
统地变大或变小
(2)(ⅰ)需要对当天的生产过程进行检查
(ⅱ)平均数为,标准差约为第9章 统 计
9.1 线性回归分析
9.1.1 变量的相关性
【课前预习】
知识点一
1.相关关系
3.(1)一条直线 (2)左下 右上 左上 右下
诊断分析
(1)× (2)× (3)√ (4)√ (5)√ [解析] (2)只能说明这两个变量之间不是线性相关关系,但并不一定说明没有相关关系,若散点落在一条曲线附近,则称这两个变量具有非线性相关关系.
知识点二
(2)①≤ ≤ ②正 负 ③越强 越弱
诊断分析
(1)√ (2)√ (3)× [解析] (3)r=0只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
【课中探究】
探究点一
例1 A [解析] 对于A,一般情况下,人所站的高度越高则视野越开阔,两个变量之间具有正相关关系,故A正确;对于B,人眼的近视程度与身高不具有相关关关系,故B错误;对于C,正方体的体积与棱长之间具有函数关系,不具有相关关系,故C错误;对于D,某同学的学籍号与考试成绩之间不具有相关关系,故D错误.故选A.
变式 (1)ACD (2)ACD [解析] (1)选项B中两个变量之间的关系是确定的函数关系,而不是相关关系;选项A,C,D中两个变量之间的关系都是相关关系.故选ACD.
(2)对于A,产品的成本与生产数量之间具有相关关系,故A正确;对于B,球的表面积与体积之间具有函数关系,而不具有相关关系,故B错误;对于C,家庭的支出与收入之间具有相关关系,故C正确;对于D,在一定的年龄范围内,人的年龄与体重之间具有相关关系,故D正确.故选ACD.
探究点二
例2 (1)B [解析] 由散点图可知,变量x与y负相关,变量y与z正相关,所以变量x与z负相关.故选B.
(2)解:作出散点图,如图所示,由图可看出x与y具有线性相关关系.
变式 B [解析] 对于A,由题图可知,两个变量之间是确定的函数关系,不是相关关系,故A不正确;对于B,题图中的散点分布在某条直线的附近,两个变量之间具有线性相关关系,故B正确;对于C,题图中的散点没有向某条直线的附近集中,两个变量之间不具有线性相关关系,故C不正确;对于D,题图中的散点分布在一条曲线附近,两个变量之间不具有线性相关关系,故D不正确.故选B.
探究点三
例3 C [解析] 由题中散点图知,变量x,y正相关,故r1>0;变量u,v负相关,变量p,q负相关,且变量u,v的线性相关程度强于变量p,q的线性相关程度,故r2r3>r2.故选C.
变式 B [解析] 对于A,因为|r1|=0.96,接近于1,所以变量x,y之间的线性相关程度很强,故A中说法正确;对于B,若r1=0.7,r2=-0.99,满足r1>r2,但是|r1|<|r2|,此时说明变量x,y之间的线性相关程度比变量m,n之间的线性相关程度弱,故B中说法错误;对于C,因为r1=0.95>0,所以变量x,y正线性相关,故C中说法正确;对于D,因为r1=0,所以变量x,y之间没有线性相关关系,故D中说法正确.故选B.
例4 0.99 [解析] 由题意知=×(1+2+3+4+5+6+7)=4,=×(2.90+3.30+3.60+4.40+4.80+5.20+5.90)=4.30,
变式 .
探究点四
例5 解:(1)散点图如图所示.
所以y与x的线性相关程度较强.
变式 解:
因为|r|≈0.791>0.5,所以y与x的线性相关关系显著.
拓展 解:(1)①由统计表中数据可得==15.
(2)由题意知,X的可能取值为0,1,2,3,
因为P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=.第9章 统 计
9.1 线性回归分析
9.1.1 变量的相关性
1.C [解析] 对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系不是函数关系,是相关关系,所以B错误;对于C,一定范围内,学生的成绩与学习时间成正相关关系,所以C正确;对于D,人的体重与视力没有相关关系,所以D错误.故选C.
2.B [解析] 选项A中,两个变量x与y之间具有函数关系,不是相关关系,不符合题意;选项B中,两个变量x与y构成的点分布在一条直线附近,所以两个变量之间是线性相关关系,符合题意;选项C中,两个变量x与y构成的点分布在一条曲线附近,所以两个变量之间不是线性相关关系,不符合题意;选项D中,两个变量x与y构成的点相对分散,不在某条直线或曲线附近,所以两个变量之间不是线性相关关系,不符合题意.故选B.
3.C [解析] 身高比较高的人,其体重可能较大,也可能较小,故A,B不正确;由散点图知,身高和体重有明显的相关关系,且身高增加时,体重也呈现增加的趋势,所以身高与体重正相关,故C正确,D错误.故选C.
4.C [解析] 根据题图中散点的集中程度可知,花瓣长度和花萼长度有相关关系,A选项错误;因为散点呈从左下方向右上方发展的趋势,所以花瓣长度和花萼长度正相关,B选项错误,C选项正确;r=0.824 5是全部数据的样本相关系数,取出来一部分数据,这些数据的相关性可能变强,可能变弱,则取出的数据的样本相关系数不一定是0.824 5,D选项错误,故选C.
5.D [解析] .故选D.
6.C [解析] ∵r1=0.734>0,r2=-0.983<0,∴X和Y之间呈正线性相关关系,U和V之间呈负线性相关关系,又|r2|>|r1|,∴X和Y的线性相关程度弱于U和V的线性相关程度.故选C.
7.③ [解析] 任意给出一组样本数据,都可以作出相应的散点图,但不一定能分析出两个变量的关系,故①错误,③正确;更不一定能用一条直线近似地表示两者的关系,②不正确.两个变量的样本数据不一定有函数关系,不一定可以用确定的表达式表示两者的关系,故④不正确.故填③.
8.甲 [解析] 样本相关系数r的绝对值|r|越接近1,数据的线性相关程度越强,因为|-0.98|>|0.93|>|0.36|>|-0.27|,所以这四组数据中线性相关程度最强的是甲组数据.
9.解:==3,==6,
=
=≈≈0.92>0.5,
故y与x之间的线性相关关系显著.
10.C [解析] 由题中散点图可以看出,甲、乙两组数据都呈线性相关关系,所以A中结论正确;乙组数据对应散点图中的点相对更加集中在一条直线附近,所以乙组数据的线性相关程度比甲组数据的线性相关程度强,样本相关系数的绝对值更接拉1,所以B,D中结论正确;甲组数据呈正相关,其样本相关系数大于0,乙组数据呈负相关,其样本相关系数小于0,所以C中结论错误.故选C.
11.A [解析] 从题图可以看出y随x的增大而减小,u随v的增大而减小,则y与x呈负相关,u与v呈负相关,所以r1<0,r2<0,故C,D不正确;另外对比题中两图,容易看出y与x的线性相关程度更强,则r1更接近-1,所以-112.AD [解析] 根据样本相关系数的定义可得,当r>0时,X和Y具有正线性相关关系;当r=0时,X和Y不具有线性相关关系,可能有其他相关关系,故A正确,C错误.当r<0时,随着r值减小,|r|越来越接近1,X和Y的线性相关程度越来越强,故B错误.当r=-0.99时,X和Y具有较强的线性相关关系,故D正确.故选AD.
13.-0.99 [解析] 根据表中数据计算可知=×(6+8+10+12)=9,=×(6+5+3+2)=4,
14.解:(1)设选取的10棵这种树木平均一棵的根部横截面积为 m2,平均一棵的材积量为 m3,
则==0.06,==0.39,
故估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2)
(3)设该林区所有这种树木的根部横截面积总和为X m2,总材积量为Y m3,
则=,故Y=X=X,
令X=186,则Y=×186=1209,
故该林区这种树木的总材积量的估计值为1209 m3.
15.B [解析] 由散点图可知变量x1与y1,变量x3与y3正相关,且图①中的点比图③中的点分布更为集中,所以r1>r3>0.变量x2与y2,变量x4与y4负相关,且图②中的点比图④中的点分布更为集中,所以r2,r4<0,且|r2|>|r4|,故r216.解:(1)第9章 统 计
9.1 线性回归分析
9.1.1 变量的相关性
【学习目标】
  1.结合实例,体会两个变量间的相关关系.
  2.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
  3.结合实例,会通过相关系数比较多组成对数据的相关性.
◆ 知识点一 变量的相关关系
1.相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为      .
2.散点图:样本中每个编号下的成对样本数据都可用平面直角坐标系中的点表示出来,由这些点组成的统计图叫作散点图.
3.散点图与相关性
(1)线性相关关系
观察散点图,若所有的点散布在    附近,则说明这些点的横坐标与纵坐标之间具有相关关系,我们将具有这种特性的相关关系称为线性相关关系.
(2)正相关与负相关
如果具有相关关系的两个变量的散点图呈从   向    方向发展的趋势,我们称这两个变量之间正相关.同理,如果具有相关关系的两个变量的散点图呈从    逐渐向    方向发展的趋势,则称这两个变量之间负相关.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)两个变量具有相关关系就是指这两个变量具有函数关系. (  )
(2)若散点不是落在一条直线附近,则说明两个变量没有相关性. (  )
(3)当散点落在一条曲线附近时,这两个变量也具有相关关系. (  )
(4)散点图中的点散布在从左下角到右上角的区域所呈现的是正相关. (  )
(5)散点图中的点散布在从左上角到右下角的区域所呈现的是负相关. (  )
◆ 知识点二 样本相关系数
(1)样本相关系数r的计算公式
r===.
(2)样本相关系数r具有的性质
①-1    r    1;
②r>0时y与x呈    相关关系,r<0时y与x呈    相关关系;
③|r|越接近1,y与x相关的程度就    ,|r|越接近0,y与x相关的程度就    .
通常情况下,当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关系.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)样本相关系数r的符号反映了相关关系的正负. (  )
(2)一般地,样本容量越大,用样本相关系数估计两个变量的线性相关关系的效果越好. (  )
(3)r=0表明成对样本数据间不存在相关关系. (  )
◆ 探究点一 相关关系的理解
例1 下列给出的两个变量之间具有相关关系的是 (  )
A.人所站的高度与视野
B.人眼的近视程度与身高
C.正方体的体积与棱长
D.某同学的学籍号与考试成绩
变式 (1)(多选题)[2025·江苏南通二中高二月考] 下列两个变量之间的关系为相关关系的是 (  )
A.光照时间与大棚内蔬菜的产量
B.某正方形的边长与此正方形的面积
C.每亩地的施肥量与粮食亩产量
D.人的身高与体重
(2)(多选题)[2025·江苏常州高二期中] 下列两个变量之间具有相关关系的是 (  )
A.产品的成本与生产数量
B.球的表面积与体积
C.家庭的支出与收入
D.在一定的年龄范围内,人的年龄与体重
[素养小结]
函数关系是一种确定的关系,满足相关关系的两个变量之间不具有函数关系所要求的确定性,它们之间的关系具有随机性.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
◆ 探究点二 散点图与变量的相关关系
例2 (1)[2025·北京朝阳区高二期末] 对变量x,y由观测数据得散点图①,对变量y,z由观测数据得散点图②.由这两个散点图可以判断 (  )
A.变量x与y负相关,x与z正相关
B.变量x与y负相关,x与z负相关
C.变量x与y正相关,x与z正相关
D.变量x与y正相关,x与z负相关
(2)在关于人体脂肪含量y(百分比)与年龄x关系的研究中,得到如表所示的一组数据:
年龄x 23 27 39 41 45 50
脂肪含量y 9.5 17.8 21.2 25.9 27.5 28.2
画出散点图,并判断x与y是否具有线性相关关系
变式 [2025·江苏徐州高二期末] 下列图中,能表示出相应两个变量之间具有线性相关关系的是 (  )
A B C D
[素养小结]
(1)判断两个变量x和y之间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性相关关系,也可能是非线性相关关系,还可能不具有相关关系.
(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,也要避免点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
◆ 探究点三 样本相关系数的计算
角度1 样本相关系数的性质
例3 由变量x,y,变量u,v,变量p,q对应的样本数据得到的散点图如图所示,三对变量的样本相关系数依次为r1,r2,r3,则 (  )
                 
A.r1>r2>r3 B.r2>r3>r1
C.r1>r3>r2 D.r3>r2>r1
变式 变量x,y的样本相关系数为r1,变量m,n的样本相关系数为r2,则下列说法错误的是 (  )
A.若|r1|=0.96,则说明变量x,y之间的线性相关程度很强
B.若r1>r2,则说明变量x,y之间的线性相关程度比变量m,n之间的线性相关程度强
C.若r1=0.95,则说明变量x,y正线性相关
D.若r1=0,则说明变量x,y之间没有线性相关关系
角度2 样本相关系数的计算
例4 [2025·江苏通州高二期中] 某种机械设备随着使用年限的增加,它的使用功能逐渐减少,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的一组统计数据如下表所示:
使用年限x (单位:年) 1 2 3 4 5 6 7
失效费y (单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
则y与x的样本相关系数为    .
(精确到0.01,参考公式和数据:r=,(xi-)(yi-)=14.00,(yi-)2=7.08,≈14.10)
变式 [2025·江苏扬州高二期末] 现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样本,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi,yi分别表示第i个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量a=(x1-,x2-,…,x20-),b=(y1-,y2-,…,y20-),其中=,=,并计算得xi=60,yi=1200,xiyi=4400,|a|=9,|b|=100,我们知道n对数据的样本相关系数r=cos,则上述数据(xi,yi)(i=1,2,…,20)的样本相关系数r=     .
[素养小结]
利用样本相关系数r判断变量之间线性相关程度的步骤:
(1)利用公式计算样本相关系数r;
(2)用样本相关系数r的绝对值的大小判断变量相关的程度.
◆ 探究点四 样本相关系数的实际应用
例5 某农科所对冬季昼夜温差(最高温度与最低温度的差)与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(单位:℃,如图甲),以及每天每100颗种子中的发芽数情况(单位:颗,如图乙).
(1)请在图丙中画出发芽数y与温差x的散点图;
(2)计算发芽数y与温差x之间的样本相关系数(保留三位小数),并推断它们的线性相关程度.
参考数据:xi=75,yi=162,xiyi=2051,≈4.2,≈6.5.
附:当|r|>0.5时,线性相关程度较强.
变式 [2025·江苏宿迁高二期末] 某网站统计了某网红产品在2024年7月至11月的总销售量y(单位:万份),得到以下数据:
月份x 7 8 9 10 11
销售量y 10 12 11 12 20
根据表中所给数据,计算样本相关系数r,并判断y与x的线性相关关系是否显著
判断依据:当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关系.
参考公式:样本相关系数r=.参考数据:≈3.162.
[素养小结]
判断变量的线性相关程度通常有两种方式:一是利用散点图;二是利用样本相关系数r.前者只能从直观上粗略的说明变量间相关程度的强弱,而后者可以从定量的角度分析变量线性相关程度的强弱.
拓展 [2025·江苏常州模拟] 直播带货是一种直播和电商相结合的销售方式,目前已被广大消费者接受.某公司逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2024年前5个月直播带货金额(单位:万元)的统计表.
月份 1月 2月 3月 4月 5月
月份编号x 1 2 3 4 5
直播带货金额y 7 12 13 19 24
(1)根据统计表,
①求该公司直播带货金额的平均值;
②求该公司直播带货金额y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有显著的线性相关关系.(当|r|>0.5时,认为y与x的线性相关关系显著;当|r|<0.3时,认为y与x几乎没有线性相关关系)
(2)该公司现有一个直播间销售甲、乙两种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲种产品与乙种产品中分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记进一步质检时抽到甲产品的件数为X,求X的分布列与数学期望.
附:样本相关系数r=,参考数据:≈41.7,(xi-)(yi-)=41,=,=.第9章 统 计
9.1 线性回归分析
9.1.1 变量的相关性
1.[2025·江苏无锡高二期末] 下列说法正确的是 (  )                 
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
2.[2025·江苏连云港高二期中] 在下列所示的四个图中,两个变量具有线性相关关系的是 (  )
A B C D
3.根据身高和体重的数据作出的散点图如图所示,则下列说法正确的是 (  )
A.身高越高,体重越重
B.身高越高,体重越轻
C.身高与体重正相关
D.身高与体重负相关
4.[2024·江苏南通期末] 调查某种群花萼长度和花瓣长度,所得数据绘制的散点图如图所示,其中样本相关系数r=0.824 5,则下列说法正确的是 (  )
A.花瓣长度和花萼长度没有相关关系
B.花瓣长度和花萼长度负相关
C.花瓣长度和花萼长度正相关
D.若从样本中抽取一部分,则这部分的样本相关系数一定是0.824 5
5.[2025·江苏泰州高二期末] 某唱片公司欲知唱片费用x(单位:十万元)与唱片销售量y(单位:千张)之间的关系,从其所发行的唱片中随机抽选了10张,得到如下的统计量:xi=28,=303.4,yi=75,=598.5,xiyi=237,则y与x的样本相关系数r的绝对值为 (  )
A.0.6 B.0.5
C.0.4 D.0.3
6.设变量X和变量Y的样本相关系数为r1,变量U和变量V的样本相关系数为r2,且r1=0.734,r2=-0.983,则 (  )
A.X和Y之间呈正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
7.[2025·江苏盐城高二期中] 对于任意给定的两个变量的一组样本数据,下列说法正确的是    .(填序号)
①都可以分析出两个变量的关系;
②都可以用一条直线近似地表示两者的关系;
③都可以作出散点图;
④都可以用确定的表达式表示两者的关系.
8.[2025·辽宁朝阳月考] 为了比较甲、乙、丙、丁四组数据线性相关程度的强弱,某同学分别计算了甲、乙、丙、丁四组数据的样本相关系数,所得数值依次为-0.98,-0.27,0.36,0.93,则这四组数据中线性相关程度最强的是    组数据.
9.(13分)[2025·江苏启东中学高二期中] 2023年是全面贯彻落实党的二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,经济增长呈现稳中有进的可喜现象.某省为促进刺梨产业的高质量发展,项目组统计了全省2019年至2023年刺梨产业综合产值(单位:亿元),有关数据如下:
年份 2019 2020 2021 2022 2023
年份代码 1 2 3 4 5
综合产值 1.5 2 3.5 8 15
用x表示年份代码,y表示综合产值,请通过样本相关系数,推断y与x之间的线性相关关系是否显著
附:当|r|>0.5时,认为线性相关关系显著.
参考数据:≈7.14.
10.[2025·江苏淮安期末] 对甲、乙两组数据进行统计,获得如图所示的散点图(左图对应甲组数据,右图对应乙组数据),下列结论错误的是(  )
A.甲、乙两组数据都呈线性相关关系
B.乙组数据的线性相关程度比甲组数据的线性相关程度强
C.乙组数据的样本相关系数比甲组数据的样本相关系数大
D.乙组数据的样本相关系数的绝对值更接近1
11.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得如图①所示的散点图;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得如图②所示的散点图.r1表示变量x,y之间的样本相关系数,r2表示变量u,v之间的样本相关系数,则 (  )
A.-1C.012.(多选题)[2025·江西景德镇期中] 随机变量X和Y的样本相关系数为r,则下列说法正确的是 (  )
A.当r>0时,X和Y具有正线性相关关系
B.随着r值减小,X和Y的相关性也减小
C.当r=0时,X和Y不具有相关关系
D.当r=-0.99时,X和Y具有较强的线性相关关系
13.[2024·上海奉贤高二期中] 已知变量x,y之间的一组相关数据如表所示,
x 6 8 10 12
y 6 5 3 2
则变量x,y之间的样本相关系数r=   .(计算结果精确到0.01)
14.(15分)[2022·全国乙卷] 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
15.[2025·江苏泰州高二期末] 对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是 (  )
A.r2C.r416.(15分)[2024·江苏南京期中] 为了监控某种零件的一条生产线的生产过程,检验员每隔30分钟从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,≈18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的样本相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检的零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.
(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查
(ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的平均数与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的样本相关系数r=,≈0.09.