2023-2024学年高二数学8.1成对数据的统计相关性 (原卷版+解析版)(人教A版2019选修3)

文档属性

名称 2023-2024学年高二数学8.1成对数据的统计相关性 (原卷版+解析版)(人教A版2019选修3)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-04-16 16:23:40

文档简介

2023-2024学年高二数学8.1成对数据的统计相关性(人教A版2019选修3)
·模块一 变量的相关关系
·模块二 样本相关系数
·模块三 课后作业
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关
系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个
变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线
性相关.
【考点1 相关关系与函数关系的概念及辨析】
【例1.1】(22-23高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【解答过程】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
【例1.2】(23-24高一下·吉林延边·阶段练习)下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的正切值 B.人的右手一柞长和身高
C.正方体的棱长和表面积 D.真空中自由落体运动物体的下落距离和下落时间
【解题思路】由函数的定义可知,两个变量有确定的关系,由此进行判断.
【解答过程】选项,由于角度和正切值有确定的关系;选项,人的右手一柞长和身高不具有统一的关系;选项,正方体的棱长和表面积有关系;选项,真空中自由落体运动物体的下落距离和下落时间有确定的关系.
故选:B.
【变式1.1】(23-24高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
【解题思路】根据相关关系是一种不确定关系,函数关系是一种确定关系,可判断A;根据球的体积与半径之间的关系,可判断该关系为函数关系,可判断B;根据农作物的产量与施化肥量之间的关系可得该关系为一种相关关系,可判断C;根据学生的数学成绩与物理成绩之间是一种相关关系可判断D.
【解答过程】解:当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;
学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.
故选:D.
【变式1.2】(22-23高二下·河南郑州·期末)某同学根据一组x,y的样本数据,求出线性回归方程和相关系数r,下列说法正确的是(  )
A.y与x是函数关系 B.与x是函数关系
C.r只能大于0 D.|r|越接近1,两个变量相关关系越弱
【解题思路】根据线性回归方程的定义进行求解即可
【解答过程】解:由两变量x,y具有线性相关关系,可知y与x不是函数关系,故A错误;
求出线性回归方程x,其中与x是函数关系,故B正确;
相关系数可能大于0,也可能小于0,故C错误;
|r|越接近1,两个变量相关关系越强,故D错误.
故选B.
【考点2 判断两个变量是否有相关关系】
【例2.1】(22-23高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
【解题思路】由相关关系概念可得答案.
【解答过程】A选项,水稻产量与施肥之间没有明确的等量关系,是相关关系,故A错误;
B选项,正方形的面积与边长之间有着明确的等量关系,不是相关关系,故B正确;
C选项,商品销售收入与其广告费支出之间没有明确的等量关系,故C错误;
D选项,人体内的脂肪含量与年龄之间没有明确的等量关系,故D错误.
故选:B.
【例2.2】(22-23高二下·辽宁鞍山·期中)甲、乙、丙、丁四位同学各自对两变量的线性相关性做试验,并用回归分析方法分别求得相关系数如下表:
甲 乙 丙 丁
-0.78
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
【解题思路】根据相关系数的绝对值越接近1,则两个变量的线性相关性越强,就可判断出答案.
【解答过程】 ,且相关系数的绝对值越接近1,则两个变量的线性相关性越强,能体现出A,B两变量有更强的线性相关性的是丁.
故选:D.
【变式2.1】(22-23高二下·陕西西安·期中)下列两变量中有相关关系的是( ).
A.正方体的体积与边长 B.匀速行驶车辆的行驶距离与时间
C.人的身高与视力 D.某人每日吸烟量与其身体健康情况
【解题思路】根据相关关系是两个变量之间有明显的关系,但不是确定的函数关系,即可判断.
【解答过程】对于A,正方体的体积与边长是函数关系,不满足条件;
对于B,匀速行驶车辆的行驶距离与时间是函数关系,不满足条件;
对于C,人的身高与视力没有明显的关系,不满足条件;
对于D,某人每日吸烟量与其身体健康情况是负相关关系,满足题意;
故选:D.
【变式2.2】(23-24高一·全国·课时练习)从统计学的角度看,下列关于变量间的关系说法正确的是( )
A.人体的脂肪含量与年龄之间没有相关关系
B.汽车的重量和汽车每消耗汽油所行驶的平均路程负相关
C.吸烟量与健康水平正相关
D.气温与热饮销售好不好正相关
【解题思路】根据正相关、负相关的定义依次判断即可
【解答过程】从统计学的角度看:
在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,A错误;
汽车的重量和汽车每消耗汽油所行驶的平均路程是负相关关系,B正确;
吸烟量与健康水平是负相关关系,C错误;
气温与热饮销售好不好是负相关关系,D错误.
故选:B.
【考点3 判断正、负相关】
【例3.1】(22-23高一下·湖南邵阳·期中)某公司年的年利润(单位:百万元)与年广告支出(单位:百万元)的统计资料如表所示:
年份 2006 2007 2008 2009 2010 2011
利润 12.2 14.6 16 18 20.4 22.3
支出 0.62 0.74 0.81 0.89 1 1.11
根据统计资料,则利润中位数( )
A.是16,与有正线性相关关系
B.是17,与有正线性相关关系
C.是17,与有负线性相关关系
D.是18,与有负线性相关关系
【解题思路】根据数据分析可直接得出结论.
【解答过程】由题意,利润中位数是,而且随着利润的增加,支出也在增加,故与有正线性相关关系.
故选:B.
【例3.2】(23-24高二上·贵州贵阳·期末)如下四个散点图中,正相关的是( )
A. B.
C. D.
【解题思路】根据散点图中点的分布情况,判断是否具有相关性和正负相关关系.
【解答过程】对于A,散点图中的点从左向右是上升的,且在一条直线附近,是正相关;
对于B,散点图中的点从左向右是下降的,且在一条直线附近,是负相关;
对于C、D,散点图中的点不成带状分布,没有明显的相关关系;
故选:A.
【变式3.1】(23-24高一·全国·单元测试)某公司在2016年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:
月份 1月 2月 3月 4月 5月 6月
收入x 12.3 14.5 15.0 17.0 19.8 20.6
支出y 5.63 5.75 5.82 5.89 6.11 6.18
根据统计资料,则(  )
A.月收入的中位数是15,x与y有正线性相关关系
B.月收入的中位数是17,x与y有负线性相关关系
C.月收入的中位数是16,x与y有正线性相关关系
D.月收入的中位数是16,x与y有负线性相关关系
【解题思路】根据数据分析计算,可直接得出结论.
【解答过程】月收入的中位数是=16,收入增加,支出增加,故x与y有正线性相关关系,
故选C.
【变式3.2】(2024·四川资阳·一模)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
【解题思路】根据散点图对相关性、中位数进行分析,从而确定正确选项.
【解答过程】从散点图可以看出,年龄增大,脂肪含量也随之增加,故为正相关.
中间的两个点即第5、6两个点脂肪含量均低于20%,故脂肪含量的中位数小于20%.
故选:B.
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用
相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中,,,和,,,的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小.
【考点4 样本相关系数的意义及辨析】
【例4.1】(22-23高二·全国·随堂练习)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )

A. B.
C. D.
【解题思路】根据散点图分析出样本的相关关系即可.
【解答过程】由给出的四组数据的散点图可以看出,
左侧两图是正相关,样本相关系数大于0,则,,
右侧两图是负相关,样本相关系数小于0,则,,
下方两图的点相对更加集中,所以相关性较强,所以接近于1,接近于-1,
上方两图的点相对分散一些,所以相关性较弱,所以和比较接近0,
由此可得.
故选:B.
【例4.2】(22-23高二下·山东青岛·阶段练习)对于样本相关系数r,下列说法正确的是( )
A.样本相关系数
B.样本相关系数r越小,成对样本数据的线性相关程度越弱
C.当时,成对样本数据没有任何相关关系
D.当时,成对样本数据正相关且两个分量之间满足一种线性关系
【解题思路】根据相关系数的性质逐一判断即可.
【解答过程】因为相关系数,所以选项A不正确;
因为样本相关系数r绝对值越小,成对样本数据的线性相关程度越弱,
所以选项B不正确;
因为当时,成对样本数据之间没有线性相关关系,可以有其他相关关系,所以本选项不正确;
因为当时,成对样本数据正相关且两个分量之间满足一种线性关系,
所以选项D正确,
故选:D.
【变式4.1】(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【解题思路】根据相关系数的概念逐一判断.
【解答过程】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;
对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,
但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.
故选:D.
【变式4.2】(23-24高三上·天津蓟州·开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
【解题思路】根据相关系数的概念与性质分析判断.
【解答过程】因为线性相关系数,所以,正相关,
因为线性相关系数,所以,负相关,
又因为,所以变量,的线性相关性比,的线性相关性强,
故A、B、D错误,C正确.
故选:C.
【考点5 相关系数的计算】
【例5.1】(23-24高三上·陕西汉中·期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得,.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01).
附:相关系数;.
【解题思路】(1)根据表格中的数据,结合平均数的计算公式,即可求解;
(2)由表格中的参考数据和相关系数的公式,准确计算,即可求解.
【解答过程】(1)解:样本中10个这种零件的横截面积的平均值,
样本中10个这种零件的耗材量的平均值,
由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为,平均一个零件的耗材量为.
(2)解:由表格中的参考数据和相关系数的公式,可得

所以这种零件的横截面积和耗材量的样本相关系数.
【例5.2】(2023高三上·全国·专题练习)如图是我国2014年至2020年年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
参考数据:=9.32,=40.17,=0.55,≈2.646.
参考公式:相关系数
【解题思路】
根据相关系数计算即可.
【解答过程】
由折线图中数据和附注中参考数据得=4,,,,.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
【变式5.1】(23-24高三上·陕西·期中)人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市 1 2 3 4 5 6 7 8 9 10 总和
老龄化率 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8
空置率 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
【解题思路】
(1)由已知数据确定老龄化率不低于的城市个数后用频率估计概率;
(2)根据所给公式计算相关系数可得.
【解答过程】(1)由表中数据可知,调查的10个城市中,老龄化率不低于的有4个,
故估计该地区城市为超级老龄化城市的频率为.
(2),

.
故该地区城市的老龄化率和空置率的相关系数约为0.63.
【变式5.2】(22-23高三下·陕西安康·阶段练习)某食品加工厂新研制出一种袋装食品(规格:/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
每袋出厂价格
月销售量
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到);
(3)若样本相关系数,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
【解题思路】
(1)由表格中数据和参考数据进行计算即可;
(2)将样本相关系数公式转化为,利用表中数据和参考数据进行计算即可;
(3)将(2)中样本相关系数的绝对值与进行比较即可.
【解答过程】(1)该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格为:
(元),
平均月销售量为(万袋),
平均月销售收入为(万元).
(2)由已知,每袋出厂价格与月销售量的样本相关系数为:
.
(3)由于每袋出厂价格与月销售量的样本相关系数,所以该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性.
【考点6 相关系数与其他知识综合】
【例6.1】(2023·江苏南通·二模)我国风云系列卫星可以监测气象和国土资源情况.某地区水文研究人员为了了解汛期人工测雨量(单位:dm)与遥测雨量(单位:dm)的关系,统计得到该地区10组雨量数据如下:
样本号 1 2 3 4 5 6 7 8 9 10
人工测雨量 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23
遥测雨量 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49
0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26
并计算得,,,,,.
(1)求该地区汛期遥测雨量y与人工测雨量x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系;
(2)规定:数组满足为“I类误差”;满足为“II类误差”;满足为“III类误差”.为进一步研究,该地区水文研究人员从“I类误差”、“II类误差”中随机抽取3组数据与“III类误差”数据进行对比,记抽到“I类误差”的数据的组数为X,求X的概率分布与数学期望.
附:相关系数,.
【解题思路】(1)根据参考公式和数据,代入求相关系数,即可判断相关性强或弱;
(2)根据条件可知X的所有可能取值为0,1,2,3,再根据超几何分别求分布列和数学期望.
【解答过程】(1)因为,
代入已知数据,
得.
(2)依题意,“I类误差”有5组,“II类误差”有3组,“III类误差”有2组.
若从“I类误差”和“II类误差”数据中抽取3组,
抽到“I类误差”的组数X的所有可能取值为0,1,2,3.
则,,
,.
所以X的概率分布为
0 1 2 3
所以的数学期望.
另解:因为,所以.
【例6.2】(23-24高三上·广东广州·阶段练习)某专营店统计了最近天到该店购物的人数和时间第天之间的数据,列表如下:
(1)由表中给出的数据,判断是否可用线性回归模型拟合人数与时间之间的关系?(若,则认为线性相关程度高,可用线性回归模型拟合;否则,不可用线性回归模型拟合.计算时精确到)
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
【解题思路】
(1)计算出、的值,将表格中的数据代入相关系数公式,求出的值,即可得出结论;
(2)设方案一的实际付款金额为元,方案二的实际付款金额为元,计算出、的值,比较大小后可得出结论.
【解答过程】(1)解:,,
所以,,
,,
所以,,
所以,与的线性相关性很强,故可用线性回归模型拟合人数与时间之间的关系.
(2)解:设方案一的实际付款金额为元,方案二的实际付款金额为元,
由题意可知,(元),
的可能取值有、、、,
,,
,,
所以,,
所以,方案二更优惠.
【变式6.1】(22-23高三下·河南郑州·阶段练习)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年) 1 2 3 4 5 6 7 8
年薪(万) 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年) 9 10 11 12 13 14 15 16
年薪(万) 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中表示工龄为i年的年薪,.
(1)求年薪与工龄i()的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,, .
【解题思路】(1)计算出相关系数,进而与0.25比较后得到结论;
(2)计算出的范围,得到第13号员工不在此范围之内,计算出剔除离群值后,剩下的数据平均值和样本方差,进而计算出剔除离群值后样本标准差.
【解答过程】(1)计算相关系数,
因为,所以可认为年薪与工龄不具有线性相关关系.
(2)因为,,
所以在之内的范围是,
显然第13号员工不在此范围之内,所以需要对余下的员工进行计算,
剔除离群值后,剩下的数据平均值为,
因为,所以,
所以剔除离群值后样本方差为,
故剔除离群值后样本标准差为.
【变式6.2】(2023·安徽马鞍山·三模)强基计划主要选拔培养有志于服务国家重大战略需求且综合素质或基础学科拔尖的学生,聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域,由有关高校结合自身办学特色,合理安排招生.强基计划的校考由试点高校自主命题,校考过程中通过笔试才能进入面试环节.
(1)某研究机构为了更好地服务于高三学生,随机抽取了某校5名高三学生,对其记忆力测试指标和分析判断力测试指标进行统计分析,得到下表数据:
7 9 10 11 13
3 4 5 6 7
请用线性相关系数判断该组数据中与之间的关系是否可用线性回归模型进行拟合;(精确到)
(2)现有甲、乙两所高校的笔试环节都设有三门考试科目,某考生参加每门科目考试是否通过相互独立.若该考生报考甲高校,每门笔试科目通过的概率均为;该考生报考乙高校,每门笔试科目通过的概率依次为,其中.若该考生只能报考甲、乙两所高校中的一所,以笔试中通过的科目数的数学期望为依据作出决策,得知该考生更有希望通过乙大学的笔试,求的取值范围.
参考数据:,,;
参考公式:线性相关系数:.一般地,时,认为两个变量之间存在较强的线性相关关系.
【解题思路】
(1)根据相关系数公式直接计算即可;
(2)利用二项分布期望公式可得甲高校考试通过科目数的期望,分别求出通过乙高校的考试科目数各种可能值的概率,然后由期望公式计算,最后根据期望之间的关系求解即可.
【解答过程】(1)由题意,可得:,,

,,
所以,
所以与之间的线性相关性较强,可用线性回归模型进行拟合.
(2)通过甲高校的考试科目数,则,
设通过乙高校的考试科目数为,则的可能取值为,则:




则,
由题意知,,即,解得,
又因为,综上,的取值范围为.
1.(23-24高二下·广东清远·阶段练习)在下列各量之间,存在相关关系的是( )
①正方体的体积与棱长之间的关系; ②一块农田的水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系; ④家庭的支出与收入之间的关系;
⑤某户家庭用电量与电价之间的关系.
A.②③ B.③④ C.④⑤ D.②③④
【解题思路】根据相关关系的定义,逐项判断即可.
【解答过程】相关关系是一种非确定的关系,而①和⑤均是两个有确定关系的量.
则存在相关关系的是②③④,
故选D.
2.(22-23高二下·陕西西安·期末)变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A. B.
C. D.
【解题思路】根据变量对应数据可确定与之间正相关,与之间负相关,由此可得相关系数的大小关系.
【解答过程】由变量与相对应的一组数据为,,,,,可得变量与之间正相关,

由变量与相对应的一组数据为,,,,,可知变量与之间负相关,

综上所述:与的大小关系是.
故选:C.
3.(23-24高二上·全国·课后作业)对两个变量的四组数据进行统计,获得如图所示的散点图,关于两个变量相关系数的比较,正确的是( )

A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
【解题思路】
根据散点图的分布与相关系数的关系判断即可.
【解答过程】
由相关系数及散点图反映了线性相关关系的知识,可知r2<r4<0<r3<r1.
故选:A.
4.(23-24高二下·河南南阳·阶段练习)在一组样本数据不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
A. B.0 C.1 D.
【解题思路】根据样本数据的所有样本点都在一条直线上,得出这组样本数据完全相关,再根据直线的斜率得出是正相关还是负相关即可.
【解答过程】这组样本数据的所有样本点都在直线上,
这组样本数据完全相关,
即说明这组数据的样本完全负相关,其相关系数是
故选:A.
5.(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
【解题思路】利用散点图,结合相关系数的知识可得答案.
【解答过程】由题意可知,变量的散点图中,随的增大而增大,所以变量与呈现正相关;
再分别观察两个散点图,图比图点更加集中,相关性更好,所以线性相关系数.
故选:C.
6.(23-24高二上·江西赣州·阶段练习)如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项( )
A.2020年下半年,同城和异地快递量最高均出现在11月
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上
【解题思路】根据统计图表中的数据计算可得答案.
【解答过程】对于A,由图可看出,同城和异地快递量最高都在11月份,故A正确;
对于B,因为,9月异地快递增长率明显高于10月异地快递增长率,故B正确;
对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;
对于D,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不到同城快递量的6倍,故D不正确.
故选:D.
7.(2024·全国·模拟预测)北极冰融是近年来最引人注目的气候变化现象之一白色冰面融化变成颜色相对较暗的海冰,被称为“北极变暗”现象,21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.如图为北极年平均海冰面积()与年平均 浓度图.则下列说法正确的是( )
A.北极年海冰面积逐年减少
B.北极年海冰面积减少速度不断加快
C.北极年海冰面积与年平均二氧化碳浓度大体成负相关
D.北极年海冰面积与年平均二氧化碳浓度大体成正相关
【解题思路】由题意整合统计图的信息,结合正相关、负相关的概念逐项判断即可得解.
【解答过程】对于A、B,由统计图可知北极年海冰面积既有增加又有减少,故A、B错误;
对于C、D,由统计图可知随着年平均二氧化碳浓度增加,北极年海冰面积总体呈下降趋势,所以北极年海冰面积与年平均二氧化碳浓度大体成负相关,故C正确,D错误.
故选:C.
8.(22-23高二下·江苏·单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
【解题思路】运用相关系数公式进行求解即可.
【解答过程】因为,,所以,

故选:D.
9.(2023·四川遂宁·三模)下图是遂宁市2022年4月至2023年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数,则下列结论正确的是( )

A.月温差(月最高气温﹣月最低气温)的最大值出现在8月
B.每月最低气温与最高气温有较强的线性相关性,且二者为线性负相关
C.每月最高气温与最低气温的平均值在4-8月逐月增加
D.9﹣12月的月温差相对于5﹣8月,波动性更小
【解题思路】根据图表,温差最大值出现在10月,A错误,二者为线性正相关,B错误,计算得到C正确D错误,得到答案.
【解答过程】对选项A:月温差(月最高气温﹣月最低气温)的最大值出现在10月,错误;
对选项B:每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,错误;
对选项C:每月最高气温与最低气温的平均值在4-8月分别为,逐月增加,正确;
对选项D:9﹣12月的月温差为;5﹣8月的月温差为,9﹣12月的月温差的波动性更大,错误;
故选:C.
10.(2024·湖南·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分 1 2 3 4 5
用时小时) 9.5 8.8 7.8 7 6.1
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
【解题思路】求出相关系数,根据相关系数的大小确定答案即可.
【解答过程】因为相关系数.
即相关系数近似为与负相关,且相关程度相当高,从而可用线性回归模型拟合与的关系.
所以选项ABD错误,C正确.
故选:C.
11.(2024高二·全国·专题练习)已知变量与相对应的一组数据为;变量与相对应的一组数据为.设表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,判断与的符号.
【解题思路】根据正相关以及负相关的含义判断与的符号.
【解答过程】在回归与相关分析中,因变量值随自变量值的增大(减小)而增大(减小),在这种情况下,因变量和自变量的相关系数为正值,即正相关. 变量与相对应的一组数据值随值的增大而增大,因此与之间正相关.符号为正.
在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大),在这种情况下,因变量和自变量的相关系数为负值,即负相关. 变量与相对应的一组数据值随值的增大而减小,因此与之间负相关.的符号为负.
12.(2024高二·全国·专题练习)根据变量,的观测数据可得散点图(1);根据变量,的观测数据可得散点图(2).由这两个散点图判断与,与之间的相关关系类型(即指出是正相关还是负相关).
【解题思路】根据正相关以及负相关的含义作判断.
【解答过程】在回归与相关分析中,因变量值随自变量值的增大(减小)而增大(减小),在这种情况下,因变量和自变量的相关系数为正值,即正相关. 散点图(1)值随值的增大而增大,因此与之间正相关.
在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大),在这种情况下,因变量和自变量的相关系数为负值,即负相关. 散点图(2)值随值的增大而减小,因此与之间负相关.
13.(2023·辽宁葫芦岛·二模)某科研所为了研究土豆膨大素对土豆产量的影响,在某大型土豆种植基地随机抽取了10亩土质相同的地块,以每亩为单位分别统计了在土豆快速生长期使用的膨大素剂量xi(单位:g),以及相应的产量yi(单位:t),数据如下表:
膨大素用量xi 8 12 8 16 16 10 10 14 14 12
亩产量yi 2.5 4 2.2 5.4 5.1 3.4 3.6 4.6 4.2 4
并计算得,,.
(1)估计该试验田平均每亩使用膨大素的剂量与平均每亩的土豆产量;
(2)求该试验田平均每亩使用膨大素的剂量与土豆产量的样本相关系数(精确到0.01);
(3)现统计了该大型土豆种植基地所有地块(每块1亩)的膨大素使用剂量,并计算得总使用剂量为1080g. 已知土豆的产量与其使用膨大素的剂量近似成正比.利用以上数据估计该基地土豆的产量.
附: 相关系数r=,.
【解题思路】(1)根据给定的数表,求出作答.
(2)利用给定的数据,结合相关系数公式计算作答.
(3)利用(1)的结论,列式计算作答.
【解答过程】(1)依题意,,

所以该试验田平均每亩使用膨大素的剂量12g,平均每亩的土豆产量为3.9t.
(2)依题意,所求样本相关系数
.
(3)由已知及(1),得该基地的土豆产量的估计值为吨.
14.(2023·全国·模拟预测)新冠病毒奥密克戎毒株开始流行后,为了控制新冠肺炎疫情,杭州某高中开展了每周核酸检测工作.周一至周五,每天中午13:30开始,安排位师生进行核酸检测,教职工每天都要检测,用五天时间实现全员覆盖.
(1)该校教职工有人,高二学生有人,高三学生有人.
①用分层抽样的方法,求高一学生每天的检测人数.
②高一年级共个班,该年级每天进行核酸检测的学生有两种安排方案.方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理?给出理由.
(2)学校开展核酸检测的第一周,周一至周五核酸检测用时记录如下表.
第天
用时
①计算变量和的相关系数(精确到),并说明两变量的线性相关程度;
②根据①中的计算结果,判定变量和是正相关还是负相关,并给出可能的原因.
参考数据和公式:,相关系数.
【解题思路】
(1)①利用分层抽样的概念直接计算,②根据随机抽样的特性直接判断;
(2)根据相关系数的公式可得,进而可以判断相关性的强弱及相关性.
【解答过程】(1)①高一学生每天的检测人数为人,
②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强,潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作;
(2)①,


,,
故,
,两变量线性相关性很强,
②由可知变量和负相关.
可能的原因:随着核酸检测工作的开展,学校相关管理协调工作效率提高,因此用时缩短.
15.(2023·河南·模拟预测)党的二十大以来,国家不断加大对科技创新的支持力度,极大鼓舞了企业持续投入研发的信心.某科技企业在国家一系列优惠政策的大力扶持下,通过不断的研发和技术革新,提升了企业收益水平.下表是对2023 年1 ~5月份该企业的利润y(单位:百万)的统计.
月份 1 月 2 月 3 月 4 月 5 月
月份编号x 1 2 3 4 5
利润y(百万) 7 12 13 19 24
(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);
(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.
附:相关系数
【解题思路】
(1)根据公式求出相关系数的值,即可判断;
(2)根据题意可知可取的为,然后计算列出分布列,求出期望即可求解.
【解答过程】(1)由统计表数据可得:
所以

所以相关系数 ,
因此,两个变量具有很强的线性相关性.
(2)由题意知,的可能取值为
因为 ,

所以 的分布列为:
所以2023-2024学年高二数学8.1成对数据的统计相关性(人教A版2019选修3)
·模块一 变量的相关关系
·模块二 样本相关系数
·模块三 课后作业
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关
系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个
变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线
性相关.
【考点1 相关关系与函数关系的概念及辨析】
【例1.1】(22-23高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【例1.2】(23-24高一下·吉林延边·阶段练习)下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的正切值 B.人的右手一柞长和身高
C.正方体的棱长和表面积 D.真空中自由落体运动物体的下落距离和下落时间
【变式1.1】(23-24高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
【变式1.2】(22-23高二下·河南郑州·期末)某同学根据一组x,y的样本数据,求出线性回归方程和相关系数r,下列说法正确的是(  )
A.y与x是函数关系 B.与x是函数关系
C.r只能大于0 D.|r|越接近1,两个变量相关关系越弱
【考点2 判断两个变量是否有相关关系】
【例2.1】(22-23高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
【例2.2】(22-23高二下·辽宁鞍山·期中)甲、乙、丙、丁四位同学各自对两变量的线性相关性做试验,并用回归分析方法分别求得相关系数如下表:
甲 乙 丙 丁
-0.78
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
【变式2.1】(22-23高二下·陕西西安·期中)下列两变量中有相关关系的是( ).
A.正方体的体积与边长 B.匀速行驶车辆的行驶距离与时间
C.人的身高与视力 D.某人每日吸烟量与其身体健康情况
【变式2.2】(23-24高一·全国·课时练习)从统计学的角度看,下列关于变量间的关系说法正确的是( )
A.人体的脂肪含量与年龄之间没有相关关系
B.汽车的重量和汽车每消耗汽油所行驶的平均路程负相关
C.吸烟量与健康水平正相关
D.气温与热饮销售好不好正相关
【考点3 判断正、负相关】
【例3.1】(22-23高一下·湖南邵阳·期中)某公司年的年利润(单位:百万元)与年广告支出(单位:百万元)的统计资料如表所示:
年份 2006 2007 2008 2009 2010 2011
利润 12.2 14.6 16 18 20.4 22.3
支出 0.62 0.74 0.81 0.89 1 1.11
根据统计资料,则利润中位数( )
A.是16,与有正线性相关关系
B.是17,与有正线性相关关系
C.是17,与有负线性相关关系
D.是18,与有负线性相关关系
【例3.2】(23-24高二上·贵州贵阳·期末)如下四个散点图中,正相关的是( )
A. B.
C. D.
【变式3.1】(23-24高一·全国·单元测试)某公司在2016年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:
月份 1月 2月 3月 4月 5月 6月
收入x 12.3 14.5 15.0 17.0 19.8 20.6
支出y 5.63 5.75 5.82 5.89 6.11 6.18
根据统计资料,则(  )
A.月收入的中位数是15,x与y有正线性相关关系
B.月收入的中位数是17,x与y有负线性相关关系
C.月收入的中位数是16,x与y有正线性相关关系
D.月收入的中位数是16,x与y有负线性相关关系
【变式3.2】(2024·四川资阳·一模)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用
相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中,,,和,,,的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小.
【考点4 样本相关系数的意义及辨析】
【例4.1】(22-23高二·全国·随堂练习)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )

A. B.
C. D.
【例4.2】(22-23高二下·山东青岛·阶段练习)对于样本相关系数r,下列说法正确的是( )
A.样本相关系数
B.样本相关系数r越小,成对样本数据的线性相关程度越弱
C.当时,成对样本数据没有任何相关关系
D.当时,成对样本数据正相关且两个分量之间满足一种线性关系
【变式4.1】(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【变式4.2】(23-24高三上·天津蓟州·开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
【考点5 相关系数的计算】
【例5.1】(23-24高三上·陕西汉中·期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得,.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01).
附:相关系数;.
【例5.2】(2023高三上·全国·专题练习)如图是我国2014年至2020年年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
参考数据:=9.32,=40.17,=0.55,≈2.646.
参考公式:相关系数
【变式5.1】(23-24高三上·陕西·期中)人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市 1 2 3 4 5 6 7 8 9 10 总和
老龄化率 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8
空置率 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
【变式5.2】(22-23高三下·陕西安康·阶段练习)某食品加工厂新研制出一种袋装食品(规格:/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
每袋出厂价格
月销售量
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到);
(3)若样本相关系数,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
【考点6 相关系数与其他知识综合】
【例6.1】(2023·江苏南通·二模)我国风云系列卫星可以监测气象和国土资源情况.某地区水文研究人员为了了解汛期人工测雨量(单位:dm)与遥测雨量(单位:dm)的关系,统计得到该地区10组雨量数据如下:
样本号 1 2 3 4 5 6 7 8 9 10
人工测雨量 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23
遥测雨量 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49
0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26
并计算得,,,,,.
(1)求该地区汛期遥测雨量y与人工测雨量x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系;
(2)规定:数组满足为“I类误差”;满足为“II类误差”;满足为“III类误差”.为进一步研究,该地区水文研究人员从“I类误差”、“II类误差”中随机抽取3组数据与“III类误差”数据进行对比,记抽到“I类误差”的数据的组数为X,求X的概率分布与数学期望.
附:相关系数,.
【例6.2】(23-24高三上·广东广州·阶段练习)某专营店统计了最近天到该店购物的人数和时间第天之间的数据,列表如下:
(1)由表中给出的数据,判断是否可用线性回归模型拟合人数与时间之间的关系?(若,则认为线性相关程度高,可用线性回归模型拟合;否则,不可用线性回归模型拟合.计算时精确到)
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
【变式6.1】(22-23高三下·河南郑州·阶段练习)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年) 1 2 3 4 5 6 7 8
年薪(万) 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年) 9 10 11 12 13 14 15 16
年薪(万) 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中表示工龄为i年的年薪,.
(1)求年薪与工龄i()的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,, .
【变式6.2】(2023·安徽马鞍山·三模)强基计划主要选拔培养有志于服务国家重大战略需求且综合素质或基础学科拔尖的学生,聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域,由有关高校结合自身办学特色,合理安排招生.强基计划的校考由试点高校自主命题,校考过程中通过笔试才能进入面试环节.
(1)某研究机构为了更好地服务于高三学生,随机抽取了某校5名高三学生,对其记忆力测试指标和分析判断力测试指标进行统计分析,得到下表数据:
7 9 10 11 13
3 4 5 6 7
请用线性相关系数判断该组数据中与之间的关系是否可用线性回归模型进行拟合;(精确到)
(2)现有甲、乙两所高校的笔试环节都设有三门考试科目,某考生参加每门科目考试是否通过相互独立.若该考生报考甲高校,每门笔试科目通过的概率均为;该考生报考乙高校,每门笔试科目通过的概率依次为,其中.若该考生只能报考甲、乙两所高校中的一所,以笔试中通过的科目数的数学期望为依据作出决策,得知该考生更有希望通过乙大学的笔试,求的取值范围.
参考数据:,,;
参考公式:线性相关系数:.一般地,时,认为两个变量之间存在较强的线性相关关系.
1.(23-24高二下·广东清远·阶段练习)在下列各量之间,存在相关关系的是( )
①正方体的体积与棱长之间的关系; ②一块农田的水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系; ④家庭的支出与收入之间的关系;
⑤某户家庭用电量与电价之间的关系.
A.②③ B.③④ C.④⑤ D.②③④
2.(22-23高二下·陕西西安·期末)变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A. B.
C. D.
3.(23-24高二上·全国·课后作业)对两个变量的四组数据进行统计,获得如图所示的散点图,关于两个变量相关系数的比较,正确的是( )

A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
4.(23-24高二下·河南南阳·阶段练习)在一组样本数据不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
A. B.0 C.1 D.
5.(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
6.(23-24高二上·江西赣州·阶段练习)如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项( )
A.2020年下半年,同城和异地快递量最高均出现在11月
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上
7.(2024·全国·模拟预测)北极冰融是近年来最引人注目的气候变化现象之一白色冰面融化变成颜色相对较暗的海冰,被称为“北极变暗”现象,21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.如图为北极年平均海冰面积()与年平均 浓度图.则下列说法正确的是( )
A.北极年海冰面积逐年减少
B.北极年海冰面积减少速度不断加快
C.北极年海冰面积与年平均二氧化碳浓度大体成负相关
D.北极年海冰面积与年平均二氧化碳浓度大体成正相关
8.(22-23高二下·江苏·单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
9.(2023·四川遂宁·三模)下图是遂宁市2022年4月至2023年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数,则下列结论正确的是( )

A.月温差(月最高气温﹣月最低气温)的最大值出现在8月
B.每月最低气温与最高气温有较强的线性相关性,且二者为线性负相关
C.每月最高气温与最低气温的平均值在4-8月逐月增加
D.9﹣12月的月温差相对于5﹣8月,波动性更小
10.(2024·湖南·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分 1 2 3 4 5
用时小时) 9.5 8.8 7.8 7 6.1
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
11.(2024高二·全国·专题练习)已知变量与相对应的一组数据为;变量与相对应的一组数据为.设表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,判断与的符号.
12.(2024高二·全国·专题练习)根据变量,的观测数据可得散点图(1);根据变量,的观测数据可得散点图(2).由这两个散点图判断与,与之间的相关关系类型(即指出是正相关还是负相关).
13.(2023·辽宁葫芦岛·二模)某科研所为了研究土豆膨大素对土豆产量的影响,在某大型土豆种植基地随机抽取了10亩土质相同的地块,以每亩为单位分别统计了在土豆快速生长期使用的膨大素剂量xi(单位:g),以及相应的产量yi(单位:t),数据如下表:
膨大素用量xi 8 12 8 16 16 10 10 14 14 12
亩产量yi 2.5 4 2.2 5.4 5.1 3.4 3.6 4.6 4.2 4
并计算得,,.
(1)估计该试验田平均每亩使用膨大素的剂量与平均每亩的土豆产量;
(2)求该试验田平均每亩使用膨大素的剂量与土豆产量的样本相关系数(精确到0.01);
(3)现统计了该大型土豆种植基地所有地块(每块1亩)的膨大素使用剂量,并计算得总使用剂量为1080g. 已知土豆的产量与其使用膨大素的剂量近似成正比.利用以上数据估计该基地土豆的产量.
附: 相关系数r=,.
14.(2023·全国·模拟预测)新冠病毒奥密克戎毒株开始流行后,为了控制新冠肺炎疫情,杭州某高中开展了每周核酸检测工作.周一至周五,每天中午13:30开始,安排位师生进行核酸检测,教职工每天都要检测,用五天时间实现全员覆盖.
(1)该校教职工有人,高二学生有人,高三学生有人.
①用分层抽样的方法,求高一学生每天的检测人数.
②高一年级共个班,该年级每天进行核酸检测的学生有两种安排方案.方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理?给出理由.
(2)学校开展核酸检测的第一周,周一至周五核酸检测用时记录如下表.
第天
用时
①计算变量和的相关系数(精确到),并说明两变量的线性相关程度;
②根据①中的计算结果,判定变量和是正相关还是负相关,并给出可能的原因.
参考数据和公式:,相关系数.
15.(2023·河南·模拟预测)党的二十大以来,国家不断加大对科技创新的支持力度,极大鼓舞了企业持续投入研发的信心.某科技企业在国家一系列优惠政策的大力扶持下,通过不断的研发和技术革新,提升了企业收益水平.下表是对2023 年1 ~5月份该企业的利润y(单位:百万)的统计.
月份 1 月 2 月 3 月 4 月 5 月
月份编号x 1 2 3 4 5
利润y(百万) 7 12 13 19 24
(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);
(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.
附:相关系数