中小学教育资源及组卷应用平台
预习衔接.夯实基础 成对数据的线性相关性
一.选择题(共4小题)
1.(2024秋 辽宁期中)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x、y、z,若x、y的样本相关系数为,y、z的样本相关系数为,则x、z的样本相关系数的最大值为( )
附:相关系数r
A. B. C. D.1
2.(2024春 长治期中)根据变量x,y的观测数据(xi,yi)(i=1,2,…,15),绘制成散点图1;根据变量u,v的观测数据(ui,vi)(i=1,2,…,15),绘制成散点图2.若用线性回归进行分析,设r1表示变量x,y的样本相关系数,r2表示变量u,v的样本相关系数,则( )
A.﹣1<r1<r2<0 B.﹣1<r2<r1<0
C.0<r1<r2<1 D.0<r2<r1<1
3.(2024春 济宁期末)已知两个变量x和y之间存在线性相关关系,某兴趣小组收集了一组样本数据,并利用最小二乘法求得的回归方程是y=0.28x+0.16,其相关系数是r1,由于某种原因,其中一个数据丢失,将其记为m,具体数据如下表所示:
x 1 2 3 4 5
y 0.5 0.6 m 1.4 1.5
若去掉数据(3,m)后,剩下的数据也成线性相关关系,其相关系数是r2,则( )
A.r1=r2
B.r1>r2
C.r1<r2
D.r1,r2的大小关系无法确定
4.(2024春 四川期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号 1 2 3 4 5 6
x/cm 1 1.2 1.4 1.6 1.8 2.0
F/N 3.08 3.76 4.31 5.02 5.51 6.25
据此给出以下结论:
①这两变量不相关;
②这两个变量负相关;
③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
二.多选题(共3小题)
(多选)5.(2024春 临沂期末)下列说法正确的是( )
A.将一组数据的每一个数据减去同一个数后,新数据的方差与原数据方差相同
B.线性相关系数r越大,两个变量的线性相关性越强
C.设随机变量X~N(2,σ2),P(0<X<4)=0.4,则P(X<0)=0.3
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
(多选)6.(2024春 松原期末)下列结论不正确的是( )
A.两个变量x,y的线性相关系数r决定两变量相关程度的强弱,且相关系数|r|越小,相关性越强
B.若两个变量x,y的线性相关系数r=0,则x与y之间不具有线性相关性
C.在一组样本数据(xi,yi)(i=1,2,3,…)中,先别除部分异常数据,再根据最小二乘法求得线性回归方程为y=bx+a,这样相关系数r变大
D.在一组样本数据的散点图中,若所有样本点(xi,yi)(i=1,2,3,…)都在直线y=0.8x+1上,则这组样本数据的样本相关系数为0.8
(多选)7.(2024春 四川期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是[﹣1,1]
B.r的取值范围是[0,1]
C.|r|越接近1,表示两变量的线性相关程度越强
D.|r|越接近0,表示两变量的线性相关程度越强
三.填空题(共4小题)
8.(2024秋 浦东新区校级期中)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r= .
9.(2024 江西模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则这组成对样本数据的样本相关系数r= .
10.(2024春 钟山区校级期末)为了比较E、F、G、H四组数据的线性相关性强弱,某同学分别计算了E、F、G、H四组数据的线性相关系数,求得数值依次为0.92,﹣0.32,0.36,﹣0.95,则这四组数据中线性相关性最强的是 组数据.
11.(2024春 卢龙县期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为r1=0.66,r2=﹣0.97,r3=0.92,r4=0.89,则这四人中, 研究的两个随机变量的线性相关程度最高.
四.解答题(共4小题)
12.(2024春 仓山区校级期末)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).如表是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在
之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)请利用已经学过的方差公式:来证明方差第二公式.
(iii)在之外的数据称为离群值,试剔除离群值,并利用(ii)中公式估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数,.
13.(2024秋 郑州期末)黄河是中华民族的母亲河、生命河,也是一条桀骜难驯的忧患之河.小浪底水利枢纽工程位于河南省济源市、洛阳市孟津区边界,是黄河治理开发的关键控制性工程.它控制着黄河92%的流域面积、91%的径流量和近100%的泥沙,以防洪、防淩、减淤为主,兼顾供水、灌溉、发电,不仅是中华民族治黄史上的丰碑,也是世界水利工程史上最具标志性的杰作之一,其大坝为预测渗压值和控制库水位,工程师在水库选取一支编号为HN1渗压计,随机收集10个该渗压计管内水位和水库水位监测数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
水库水位xi/m 75.69 75.74 75.77 75.78 75.81 75.85 75.67 75.87 75.9 75.93 758.01
HN1渗压计管内水位y1/m 72.88 72.90 72.92 72.92 72.93 72.94 72.94 72.95 72.96 72.98 729.32
并计算得,53190.77,55283.20,72.9322=5319.076624,75.8012=5745.791601,.
(Ⅰ)求该水库HN1号渗压计管内水位与水库水位的样本相关系数(精确到0.01);
(Ⅱ)某天雨后工程师测量了水库水位,并得到水库的水位为76m.利用以上数据给出此时HN1号渗压计管内水位的估计值.
附:相关系数,,.
14.(2024秋 宁波期末)航班正点率是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间较为一致的航班数量与全部航班数量的比率.人们常用航班正点率来衡量一个航空公司的运行效率和服务质量.现随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,得到数据如表:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率xi/% 82 77 77 76 74 73 71 70 91 69
顾客投诉次数yi/次 21 58 79 68 74 93 72 122 18 125
整理数据得:,,,,,.
(1)(i)证明:样本相关系数;
(ii)根据以上数据计算样本相关系数(结果保留2位小数),并由此推断顾客投诉次数与航班正点率之间的线性相关程度(若0.8≤|r|≤1,则认为线性相关程度很强;若0.3≤|r|<0.8,则认为线性相关程度一般;若|r|<0.3,则认为线性相关程度很弱).
(2)用一元线性回归模型对上表中的样本数据进行拟合,得到顾客投诉次数关于航班正点率的经验回归方程为.现有一家航空公司拟通过加强内部管理来减少由于公司自身原因引起的航班延误次数,并希望一年内收到的顾客投诉不超过73次,试估计该公司的航班正点率应达到多少?
参考公式:样本相关系数.
15.(2022春 营口期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:mm2)和耗材量(单位:mm3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积xi 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量yi 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得0.0286,1.6166,0.2131.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为182mm2,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.
附:参考公式和数据:相关系数.r;1.221.
预习衔接.夯实基础 成对数据的线性相关性
参考答案与试题解析
一.选择题(共4小题)
1.(2024秋 辽宁期中)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x、y、z,若x、y的样本相关系数为,y、z的样本相关系数为,则x、z的样本相关系数的最大值为( )
附:相关系数r
A. B. C. D.1
【考点】样本相关系数.
【专题】计算题;整体思想;综合法;概率与统计;运算求解.
【答案】B
【分析】利用相关系数公式,可看成两个n维向量的夹角公式,从而把相关系系数问题转化为向量夹角问题,即可得解.
【解答】解:设,
则有,
由相关系数公式可知:,
设与夹角为与夹角为β,
由x,y的样本相关系数为,所以,
由这两个夹角均为锐角且β>α,所以与夹角的可能性是β﹣α,α+β,
则与夹角余弦值的最大值为cos(β﹣α),此时x与z样本相关系数最大,
即.
故选:B.
【点评】本题考查了相关系数公式,属于中档题.
2.(2024春 长治期中)根据变量x,y的观测数据(xi,yi)(i=1,2,…,15),绘制成散点图1;根据变量u,v的观测数据(ui,vi)(i=1,2,…,15),绘制成散点图2.若用线性回归进行分析,设r1表示变量x,y的样本相关系数,r2表示变量u,v的样本相关系数,则( )
A.﹣1<r1<r2<0 B.﹣1<r2<r1<0
C.0<r1<r2<1 D.0<r2<r1<1
【考点】样本相关系数;经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】A
【分析】利用散点图,结合相关系数的性质求解.
【解答】解:由图象可以看出y随x的增大而减小,v随u的增大而减小,
所以y与x负相关,v与u负相关,
即r1<0,r2<0,故C错误,D错误,
另外对比两图,容易看出y与x的相关性更强,故r1更接近于﹣1,
所以﹣1<r1<r2<0,故A正确.
故选:A.
【点评】本题主要考查了散点图的应用,考查了相关系数的性质,属于基础题.
3.(2024春 济宁期末)已知两个变量x和y之间存在线性相关关系,某兴趣小组收集了一组样本数据,并利用最小二乘法求得的回归方程是y=0.28x+0.16,其相关系数是r1,由于某种原因,其中一个数据丢失,将其记为m,具体数据如下表所示:
x 1 2 3 4 5
y 0.5 0.6 m 1.4 1.5
若去掉数据(3,m)后,剩下的数据也成线性相关关系,其相关系数是r2,则( )
A.r1=r2
B.r1>r2
C.r1<r2
D.r1,r2的大小关系无法确定
【考点】样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】A
【分析】利用回归方程y=0.28x+0.16过点(,),求出m的值,再分别计算r1,r2比较即可.
【解答】解:由表可知,3,
因为回归方程y=0.28x+0.16过点(,),
所以0.28×3+0.16=1,
所以m=5×1﹣0.5﹣0.6﹣1.4﹣1.5=1,
则去掉(3,1)之前,r1,
因为(3,1)为样本中心点.所以去掉(3,1)后,,不变,
则r2,
所以r1=r2.
故选:A.
【点评】本题主要考查了相关系数的计算,属于基础题.
4.(2024春 四川期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号 1 2 3 4 5 6
x/cm 1 1.2 1.4 1.6 1.8 2.0
F/N 3.08 3.76 4.31 5.02 5.51 6.25
据此给出以下结论:
①这两变量不相关;
②这两个变量负相关;
③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【考点】变量间的相关关系.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】C
【分析】根据散点图判断.
【解答】解:画出弹簧伸长长度x和相应所受外力F的散点图:
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C.
【点评】本题主要考查了散点图的应用,考查了变量间的相关关系,属于基础题.
二.多选题(共3小题)
(多选)5.(2024春 临沂期末)下列说法正确的是( )
A.将一组数据的每一个数据减去同一个数后,新数据的方差与原数据方差相同
B.线性相关系数r越大,两个变量的线性相关性越强
C.设随机变量X~N(2,σ2),P(0<X<4)=0.4,则P(X<0)=0.3
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
【考点】样本相关系数;正态分布;散点图;方差.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】ACD
【分析】结合方差的性质,相关系数,残差的定义,正态分布对称性,即可求解.
【解答】解:将一组数据的每一个数据减去同一个数后,数据的波动性不变,
由方差的定义可知,新数据的方差与原数据方差相同,故A正确;
线性相关系数|r|越大,两个变量的线性相关性越强,故B错误;
随机变量X~N(2,σ2),P(0<X<4)=0.4,
则P(X<0)=P(X<2)﹣P(0<X<2),故C正确;
在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,故D正确.
故选:ACD.
【点评】本题主要考查方差的性质,相关系数,残差的定义,正态分布对称性,属于基础题.
(多选)6.(2024春 松原期末)下列结论不正确的是( )
A.两个变量x,y的线性相关系数r决定两变量相关程度的强弱,且相关系数|r|越小,相关性越强
B.若两个变量x,y的线性相关系数r=0,则x与y之间不具有线性相关性
C.在一组样本数据(xi,yi)(i=1,2,3,…)中,先别除部分异常数据,再根据最小二乘法求得线性回归方程为y=bx+a,这样相关系数r变大
D.在一组样本数据的散点图中,若所有样本点(xi,yi)(i=1,2,3,…)都在直线y=0.8x+1上,则这组样本数据的样本相关系数为0.8
【考点】成对数据的统计相关性.
【专题】转化思想;综合法;概率与统计;逻辑思维.
【答案】ACD
【分析】根据相关系数的概念,即可分别求解.
【解答】解:对A选项,∵|r|越大,x与y之间的线性相关性越强,∴A选项错误;
对B选项,若r=0,则样本数据不具有线性相关性,∴B选项正确;
对C选项,去掉异常数据,则相关性变强,|r|变大,∴C选项错误;
对D选项,若所有样本点(xi,yi)(i=1,2,3, )都在直线y=0.8x+1上,
则这组样本数据完全相关,所以这组样本数据的样本相关系数为1,∴D选项错误.
故选:ACD.
【点评】本题考查相关系数的概念,属基础题.
(多选)7.(2024春 四川期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是[﹣1,1]
B.r的取值范围是[0,1]
C.|r|越接近1,表示两变量的线性相关程度越强
D.|r|越接近0,表示两变量的线性相关程度越强
【考点】样本相关系数.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】AC
【分析】利用相关系数的取值范围判断AB;利用相关系数的意义判断CD.
【解答】解:对于AB,样本相关系数r的取值范围是[﹣1,1],A正确,B错误;
对于CD,|r|越大,越接近于1,两变量的线性相关程度越强,
|r|越小,越接近于0,两变量的线性相关程度越弱,C正确,D错误.
故选:AC.
【点评】本题考查相关系数相关知识,属于基础题.
三.填空题(共4小题)
8.(2024秋 浦东新区校级期中)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r= ﹣1 .
【考点】样本相关系数;经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】﹣1.
【分析】根据线性相关系数的定义直接得解.
【解答】解:由题意可知,已知样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,
由相关系数的定义可知,|r|=1,
又因为,
所以变量x,y之间是负相关,即r<0,
所以r=﹣1.
故答案为:﹣1.
【点评】本题主要考查了相关系数的性质,属于基础题.
9.(2024 江西模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则这组成对样本数据的样本相关系数r= ﹣1 .
【考点】样本相关系数.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】﹣1.
【分析】根据给定条件,利用相关系数的定义求解作答.
【解答】解:因为所有样本点(xi,yi)(i=1,2,…,n)都在直线上,
显然直线的斜率,
所以样本数据成负相关,相关系数为﹣1.
故答案为:﹣1.
【点评】本题主要考查相关系数的定义,属于基础题.
10.(2024春 钟山区校级期末)为了比较E、F、G、H四组数据的线性相关性强弱,某同学分别计算了E、F、G、H四组数据的线性相关系数,求得数值依次为0.92,﹣0.32,0.36,﹣0.95,则这四组数据中线性相关性最强的是 H 组数据.
【考点】变量间的相关关系;样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】H.
【分析】借助相关系数的性质计算即可得.
【解答】解:因为线性相关系数的绝对值越大,线性相关性越强,
且|﹣0.95|>|0.92|>|0.36|>|﹣0.32|,
所以H组数据的线性相关性最强.
故答案为:H.
【点评】本题主要考查了线性相关系数的性质,属于基础题.
11.(2024春 卢龙县期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为r1=0.66,r2=﹣0.97,r3=0.92,r4=0.89,则这四人中, 乙 研究的两个随机变量的线性相关程度最高.
【考点】样本相关系数;变量间的相关关系.
【专题】综合题;整体思想;综合法;概率与统计;逻辑思维.
【答案】乙.
【分析】根据相关系数的定义判断即可.
【解答】解:因为|r2|=0.97>|r3|>|r4|>|r1|,所以这四人中,乙研究的两个随机变量的线性相关程度最高.
故答案为:乙.
【点评】本题主要考查相关系数和相关关系,属于中档题.
四.解答题(共4小题)
12.(2024春 仓山区校级期末)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).如表是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在
之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)请利用已经学过的方差公式:来证明方差第二公式.
(iii)在之外的数据称为离群值,试剔除离群值,并利用(ii)中公式估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数,.
【考点】样本相关系数;离散型随机变量的均值(数学期望).
【专题】对应思想;综合法;概率与统计;运算求解.
【答案】(1)r≈﹣0.18,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)(i)需要对当天的生产过程进行检查;
(ii)证明过程见解析;
(iii)平均值为10.02,标准差约为0.09.
【分析】(1)代入数据计算,比较|r|与0.25的大小作出结论;
(2)(i)计算合格零件尺寸范围,得出结论;
(ii)利用方差公式证明即可;
(iii)代入公式计算即可.
【解答】解:(1)r0.18.
∵|r|<0.25,
∴可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)(i)9.97,s=0.212,
∴合格零件尺寸范围是(9.334,10.606),
显然第13号零件尺寸不在此范围之内,
∴需要对当天的生产过程进行检查;
(ii)证明:[2](2)2;
(iii)剔除离群值后,剩下的数据平均值为10.02,
由s22可得,16×0.2122+16×9.972=1591.134,
∴1591.134﹣9.222,
∴剔除离群值后样本方差为(1591.134﹣9.222)﹣10.022≈0.008,
∴剔除离群值后样本标准差约为0.09.
【点评】本题考查了相关系数的计算,样本均值与标准差的计算,属于中档题.
13.(2024秋 郑州期末)黄河是中华民族的母亲河、生命河,也是一条桀骜难驯的忧患之河.小浪底水利枢纽工程位于河南省济源市、洛阳市孟津区边界,是黄河治理开发的关键控制性工程.它控制着黄河92%的流域面积、91%的径流量和近100%的泥沙,以防洪、防淩、减淤为主,兼顾供水、灌溉、发电,不仅是中华民族治黄史上的丰碑,也是世界水利工程史上最具标志性的杰作之一,其大坝为预测渗压值和控制库水位,工程师在水库选取一支编号为HN1渗压计,随机收集10个该渗压计管内水位和水库水位监测数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
水库水位xi/m 75.69 75.74 75.77 75.78 75.81 75.85 75.67 75.87 75.9 75.93 758.01
HN1渗压计管内水位y1/m 72.88 72.90 72.92 72.92 72.93 72.94 72.94 72.95 72.96 72.98 729.32
并计算得,53190.77,55283.20,72.9322=5319.076624,75.8012=5745.791601,.
(Ⅰ)求该水库HN1号渗压计管内水位与水库水位的样本相关系数(精确到0.01);
(Ⅱ)某天雨后工程师测量了水库水位,并得到水库的水位为76m.利用以上数据给出此时HN1号渗压计管内水位的估计值.
附:相关系数,,.
【考点】样本相关系数.
【专题】计算题;整体思想;综合法;概率与统计;运算求解.
【答案】(Ⅰ)0.95;
(Ⅱ)72.98m.
【分析】(Ⅰ)根据相关系数公式计算即可;
(Ⅱ)根据最小二乘法计算可得回归方程,再代入76m可得预测数据.
【解答】解:(Ⅰ)由表格易得:水库的平均水位,
HN1号渗压计管内平均水位,
又,
同理可得:,
,
∴
;
(Ⅱ)∵,
,
∴HN1号渗压计管内水位关于水库水位的经验回归方程为,
当x=76时,预测值y=0.23×76+55.5=72.98,
即水库的水位为76m时,HN1号渗压计管内水位的估计值为72.98m.
【点评】本题考查了相关系数和回归方程的计算,属于中档题.
14.(2024秋 宁波期末)航班正点率是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间较为一致的航班数量与全部航班数量的比率.人们常用航班正点率来衡量一个航空公司的运行效率和服务质量.现随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,得到数据如表:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率xi/% 82 77 77 76 74 73 71 70 91 69
顾客投诉次数yi/次 21 58 79 68 74 93 72 122 18 125
整理数据得:,,,,,.
(1)(i)证明:样本相关系数;
(ii)根据以上数据计算样本相关系数(结果保留2位小数),并由此推断顾客投诉次数与航班正点率之间的线性相关程度(若0.8≤|r|≤1,则认为线性相关程度很强;若0.3≤|r|<0.8,则认为线性相关程度一般;若|r|<0.3,则认为线性相关程度很弱).
(2)用一元线性回归模型对上表中的样本数据进行拟合,得到顾客投诉次数关于航班正点率的经验回归方程为.现有一家航空公司拟通过加强内部管理来减少由于公司自身原因引起的航班延误次数,并希望一年内收到的顾客投诉不超过73次,试估计该公司的航班正点率应达到多少?
参考公式:样本相关系数.
【考点】样本相关系数;经验回归方程与经验回归直线.
【专题】计算题;转化思想;综合法;概率与统计;运算求解.
【答案】(1)(i)证明见解析;(ii)﹣0.89;顾客投诉次数与航班正点率之间的线性相关程度很强;
(2)76%.
【分析】(1)(i)将展开,结合平均数意义化简可得,然后分别用替代,用分别替代可证;
(ii)根据所给数据代入公式计算,然后可作出判断;
(2)利用样本中心点求,然后根据回归方程解不等式可得.
【解答】解:(1)(i)证明:
,
在上式中分别用替代,得,
同理,也有,
故样本相关系数.
(ii)可知,.
∴,
,
,
∴
,
故顾客投诉次数与航班正点率之间的线性相关程度很强.
(2),
令5x+453≤73,得x≥76,即该公司的航班正点率应达到76%.
【点评】本题主要考查相关系数,线性回归方程,考查运算求解能力,属于中档题.
15.(2022春 营口期末)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:mm2)和耗材量(单位:mm3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积xi 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量yi 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得0.0286,1.6166,0.2131.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为182mm2,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.
附:参考公式和数据:相关系数.r;1.221.
【考点】样本相关系数;离散型随机变量的均值(数学期望).
【专题】对应思想;数学模型法;概率与统计;运算求解.
【答案】(1)0.39mm3;(2)0.84;(3)1365mm3.
【分析】(1)由已知直接利用平均数公式求解;(2)直接利用相关系数公式求解;(3)利用这种零件的耗材量和其横截面积近似成正比列式求解.
【解答】解:(1)样本中10个这种零件的横截面积的平均值,
样本中10个这种零件的耗材量的平均值,
由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为0.052mm2,
平均一个零件的耗材量为0.39mm3;
(2)r
0.84;
(3)设这种零件的总耗材量的估计值为tmm3,
又已知这种零件的耗材量和其横截面积近似成正比,
∴,解得t=1365mm3,
故这种零件的总耗材量的估计值为1365mm3.
【点评】本题考查平均数与相关系数的求法,考查运算求解能力,是基础题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)