专题8.2 成对数据的统计相关性(重难点题型检测)
【人教A版2019】
考试时间:60分钟;满分:100分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共22题,单选8题,多选4题,填空4题,解答6题,满分100分,限时60分钟,本卷题型针对性较高,覆盖面广,选题有深度,可衡量学生掌握本节内容的具体情况!
一.选择题(共8小题,满分24分,每小题3分)
1.(3分)(2022·高二课时练习)对两变量间的关系,下列论述正确的是( )
A.任何两个变量都具有相关关系
B.正方形的面积与该正方形的边长具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
2.(3分)(2022·高二课时练习)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
3.(3分)(2022春·吉林长春·高二期中)在建立两个变量与的回归模型中,分别选择了4个不同的模型,它们的相关指数如下,其中拟合最好的模型是( )
A.模型1的相关指数为 B.模型2的相关指数为
C.模型3的相关指数为 D.模型4的相关指数为
4.(3分)(2022·高二课时练习)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
5.(3分)(2023·全国·高三专题练习)下列命题中正确的为( )
A.相关系数r越大,两个变量的线性相关性越强 B.相关系数r越小,两个变量的线性相关性越弱
C.残差平方和越小的模型,拟合的效果越好 D.用相关指数来刻画回归效果,越小,说明模型的拟合效果越好
6.(3分)(2022春·陕西咸阳·高二阶段练习)若已知是的两倍,是的1.2倍,则相关系数r的值为( )
A. B. C.0.92 D.0.65
7.(3分)(2023·全国·高三专题练习)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )
A. B.
C. D.
8.(3分)(2022春·内蒙古赤峰·高二阶段练习)给出下列结论:在回归分析中
(1)可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
(2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)可用相关系数的值判断模型的拟合效果,越大,模型的拟合效果越好;
(4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
以上结论中,不正确的是( )
A.(1)(3) B.(2)(3) C.(1)(4) D.(3)(4)
二.多选题(共4小题,满分16分,每小题4分)
9.(4分)(2022·高二课时练习)(多选)在下列各量之间,存在相关关系的是( ).
A.正方体的体积与棱长之间的关系
B.一块农田的水稻产量与施肥量之间的关系
C.人的身高与年龄之间的关系
D.某户家庭用电量与电价之间的关系
10.(4分)(2023·山西·统考一模)某同学用搜集到的六组数据绘制了如下散点图,在这六个点中去掉点后重新进行回归分析,则下列说法正确的是( )
A.决定系数变小 B.相关系数的绝对值越趋于1
C.残差平方和变小 D.解释变量与预报变量相关性变弱
11.(4分)(2022秋·江苏南通·高三阶段练习)对两个变量与进行线性相关性和回归效果分析,得到一组样本数据:,则下列说法不正确的是( )
A.若所有样本点都在直线上,则两个变量的样本相关系数为
B.残差平方和越小的模型,拟合的效果越好
C.若越大,则变量与的线性相关性越强
D.若越小,则变量与的线性相关性越强
12.(4分)(2022·高二课时练习)某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是( )
A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好
B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文
C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强
D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲
三.填空题(共4小题,满分16分,每小题4分)
13.(4分)(2022·高二课时练习)有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②学生与他(她)的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线上的点与该点的坐标之间的关系.
其中有相关关系的是 .(填上你认为正确的所有序号)
14.(4分)(2023·高二课时练习)对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为 .
15.(4分)(2022·高二单元测试)变量与相对应的一组数据为:,,,,; 变量与相对应的一组数据为,,,,,表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,是则与的大小关系是 .
16.(4分)(2022·高二课时练习)某中学统计了2011~2021这11年本校学生参加高考数学均分、英语均分、总分均分,得到如表所示的表格:
年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
数学x(分) 75 77 79 74 80 81 77 83 80 82 81
英语m(分) 95 98 100 101 102 103 101 98 107 106 100
总分y(分) 473 481 479 485 490 487 478 492 488 493 489
从表中可知,数学和英语这两科中与总分相关性较高的是 .
四.解答题(共6小题,满分44分)
17.(6分)(2022春·陕西咸阳·高一阶段练习)判断下列两个变量之间是否具有相关关系:
(1)月平均气温与家庭月用电量;
(2)一天中的最高气温与最低气温;
(3)某企业生产的一种商品的销量与其广告费用;
(4)谷物的价格与牛肉的价格;
(5)在公式中的L与W.
18.(6分)(2022·高二课时练习)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:
使用年限(单位:年) 2 4 5 6 8
失效费(单位:万元) 3 4 5 6 7
根据上表数据,计算与的相关系数,并说明与的线性相关性的强弱.
(已知若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱)附:.
19.(8分)(2022·高二课时练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如下表:
(年龄/岁) 26 27 39 41 49 53 56 58 60 61
(脂肪含量/%) 14.5 17.8 21.2 25.9 26.3 29.6 31.4 33.5 35.2 34.6
根据上表的数据得到下图的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到0.01),并描述它们的相关程度.
附:参考数据:,,,,.
参考公式:相关系数.
20.(8分)(2022·黑龙江哈尔滨·校考三模)“海水稻”就是耐盐碱水稻,是一种介于野生稻和栽培稻之间的普遍生长在海边滩涂地区,具有耐盐碱的水稻,它比其它普通的水稻均有更强的生存竞争能力,具有抗涝,抗病虫害,抗倒伏等特点,还具有预防和治疗多种疾病的功效,防癌效果尤为显著.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度(‰)对亩产量(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量与海水浓度之间的相关关系,用最小二乘法计算得与之间的线性回归方程为.
海水浓度(‰) 3 4 5 6 7
亩产量(吨) 0.62 0.58 0.49 0.4 0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种的亩产量.
(2)①完成上述残差表:
②统计学中,常用相关指数来刻画回归效果,越大,模型拟合效果越好,并用它来说明预报变量与解释变量的相关性.你能否利用以上表格中的数据,利用统计学的相关知识,说明浇灌海水浓度对亩产量的贡献率?(计算中数据精确到)
(附:残差公式,相关指数)
21.(8分)(2023·河南·校联考模拟预测)某学校组织学生观看了“天宫课堂”第二课的直播后,极大地激发了学生学习科学知识的兴趣,提高了学生学习的积极性,特别是对实验操作的研究与探究.现有某化学兴趣小组的同学在老师的指导下,开展了某项化学实验操作,为了解实验效度与实验中原料的消耗量(单位:)的关系,该校实验员随机选取了10个小组的实验数据如下表.
小组编号 1 2 3 4 5 6 7 8 9 10 总计
实验效度 6
原料的消耗量 15
并计算得.
(1)求这10个小组的实验效度与实验中原料的消耗量的平均值;
(2)求这10个小组的实验效度与实验中原料的消耗量的相关系数(精确到);
(3)经该校实验员统计,以往一个学年各种实验中需用到原料的实验有200次左右.假设在一定的范围内,每次实验中原料的消耗量与实验效度近似成正比,其比例系数可近似为样本中相应的平均值的比值.根据要求,实验效度平均值需达到.请根据上述数据信息,估计该校本学年原料的消耗量.
附:相关系数
22.(8分)(2022·全国·高三专题练习)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,, ,数据如下表所示;
城市编号i 1 2 3 4 5
A指标 4 6 2 8 5
B指标 4 4 3 5 4
C指标 3 6 2 5 4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.专题8.2 成对数据的统计相关性(重难点题型检测)
参考答案与试题解析
一.选择题(共8小题,满分24分,每小题3分)
1.(3分)(2022·高二课时练习)对两变量间的关系,下列论述正确的是( )
A.任何两个变量都具有相关关系
B.正方形的面积与该正方形的边长具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
【解题思路】由两个变量之间相关关系与函数关系之间的定义及区别即可求解.
【解答过程】解:对A:当两个变量之间具有确定关系时,两个变量之间是函数关系,而不是相关关系,所以A错误;
对B:正方形的面积与该正方形的边长之间是函数关系,所以B错误;
对C:农作物的产量与施化肥量之间是相关关系,是非确定性的关系,所以C错误;
对D:学生的数学成绩与物理成绩之间是相关关系,是非确定性的关系,所以D正确;
故选:D.
2.(3分)(2022·高二课时练习)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【解答过程】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
3.(3分)(2022春·吉林长春·高二期中)在建立两个变量与的回归模型中,分别选择了4个不同的模型,它们的相关指数如下,其中拟合最好的模型是( )
A.模型1的相关指数为 B.模型2的相关指数为
C.模型3的相关指数为 D.模型4的相关指数为
【解题思路】根据相关指数的意义即可求解.
【解答过程】两个变量与的回归模型中,它们的相关指数,越接近于1,这个模型的拟合效果越好,
在所给的四个选项中是相关指数最大的值,最接近于1,所以拟合效果最好的模型是模型1.
故选:A.
4.(3分)(2022·高二课时练习)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
【解题思路】根据线性相关系数|r|越接近1,表示两个变量之间的相关性越强,线性相关系数r的正负表示两个变量之间呈正相关关系或负相关关系.
【解答过程】因为线性相关系数r1=0.837,r2=﹣0.957,
所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,
X与Y之间的相关性弱于U与V之间的相关性.
故选:C.
5.(3分)(2023·全国·高三专题练习)下列命题中正确的为( )
A.相关系数r越大,两个变量的线性相关性越强 B.相关系数r越小,两个变量的线性相关性越弱
C.残差平方和越小的模型,拟合的效果越好 D.用相关指数来刻画回归效果,越小,说明模型的拟合效果越好
【解题思路】根据“残差”的意义、线性相关系数和相关指数的意义,即可作出正确的判断.
【解答过程】相关系数的绝对值越接近于1,两个变量的线性相关性越强,所以A,B错误;残差平方和越小的模型,拟合的效果就越好,所以C正确;用相关指数来刻画回归效果,越大(接近1),说明模型的拟合效果就越好,所以D错误,
故选:C.
6.(3分)(2022春·陕西咸阳·高二阶段练习)若已知是的两倍,是的1.2倍,则相关系数r的值为( )
A. B. C.0.92 D.0.65
【解题思路】根据相关系数公式计算可得;
【解答过程】解:,
故选:B.
7.(3分)(2023·全国·高三专题练习)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )
A. B.
C. D.
【解题思路】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及负相关的意义作判断即可.
【解答过程】由散点图可知这两个变量为负相关,所以.
因为剔除点后,剩下点的数据更具有线性相关性,更接近1,
所以 .
故选:D.
8.(3分)(2022春·内蒙古赤峰·高二阶段练习)给出下列结论:在回归分析中
(1)可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
(2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)可用相关系数的值判断模型的拟合效果,越大,模型的拟合效果越好;
(4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
以上结论中,不正确的是( )
A.(1)(3) B.(2)(3) C.(1)(4) D.(3)(4)
【解题思路】由越大,模型的拟合效果越好,越大,模型的拟合效果越好,相关系数越大,模型的拟合效果越好,带状区域的宽度越窄,说明模型的拟合精度越高,作出判断即可.
【解答过程】用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好,故(1)正确;
用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确;
可用相关系数的值判断模型的拟合效果,越大,模型的拟合效果越好,故(3)不正确;
用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确;
故选:B.
二.多选题(共4小题,满分16分,每小题4分)
9.(4分)(2022·高二课时练习)(多选)在下列各量之间,存在相关关系的是( ).
A.正方体的体积与棱长之间的关系
B.一块农田的水稻产量与施肥量之间的关系
C.人的身高与年龄之间的关系
D.某户家庭用电量与电价之间的关系
【解题思路】根据相关关系的定义直接判断即可.
【解答过程】A和D中均是确定性关系,是函数关系;
相关关系是一种非确定的关系,一块农田的水稻产量与施肥量有关,是相关关系,故B正确;人的身高与年龄有关,是相关关系,故C正确
故选:BC.
10.(4分)(2023·山西·统考一模)某同学用搜集到的六组数据绘制了如下散点图,在这六个点中去掉点后重新进行回归分析,则下列说法正确的是( )
A.决定系数变小 B.相关系数的绝对值越趋于1
C.残差平方和变小 D.解释变量与预报变量相关性变弱
【解题思路】从图中分析得到去掉点后,回归效果更好,再由决定系数,相关系数,残差平方和和相关性的概念和性质作出判断.
【解答过程】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
决定系数越接近于1,所拟合的回归方程越优,故去掉点后,变大,越趋于1,A错误;
相关系数越趋于1,拟合的回归方程越优,故去掉点后,故相关系数的绝对值越趋于1,B正确;
残差平方和变小拟合效果越好,故C正确;
解释变量与预报变量相关性增强,D错误.
故选:BC.
11.(4分)(2022秋·江苏南通·高三阶段练习)对两个变量与进行线性相关性和回归效果分析,得到一组样本数据:,则下列说法不正确的是( )
A.若所有样本点都在直线上,则两个变量的样本相关系数为
B.残差平方和越小的模型,拟合的效果越好
C.若越大,则变量与的线性相关性越强
D.若越小,则变量与的线性相关性越强
【解题思路】根据相关系数的定义及其意义,对选项逐一判断即可得到结果.
【解答过程】当所有的样本点都在直线上时,样本点数据完全负相关,其相关系数,故A错误;
残差平方和越小的模型,越大,拟合的效果越好,故B正确;
相关系数值越大,则变量与的线性相关性越强,故C正确;
相关系数越小,则变量与的线性相关性越弱,D错误;
故选:AD.
12.(4分)(2022·高二课时练习)某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是( )
A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好
B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文
C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强
D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲
【解题思路】结合图形可分析出答案.
【解答过程】由图可得,该班六科总成绩排名前6的同学数学成绩比语文成绩排名更好,故A错误;
由右图可得丙同学的总成绩排在班上倒数第三名,其语文成绩排在250到300名之间,
从左图可得其数学成绩排在400名左右,故B正确;
数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强,因为右图的点的分布较左图更分散,故C正确;
由左图可得甲的总成绩排在班上第7名,年级名次100多一点,
对应到右图可得,其语文成绩排在年级近100名,故甲的语文成绩名次比其六科总成绩名次靠前,
由左图可得甲的总成绩排在班上第27名,年级名次接近250名,
对应到右图可得,其语文成绩排在年级250名之后,故乙的语文成绩名次比其六科总成绩名次靠后,故D正确;
故选:BCD.
三.填空题(共4小题,满分16分,每小题4分)
13.(4分)(2022·高二课时练习)有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②学生与他(她)的学号之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④曲线上的点与该点的坐标之间的关系.
其中有相关关系的是 ①③ .(填上你认为正确的所有序号)
【解题思路】根据相关关系的定义,逐一判断即可.
【解答过程】对于①,人的年龄与他(她)拥有的财富是一种不确定的相关关系;对于②,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系;对于③,森林中的同一种树木,其断面直径与高度之间的关系是一种不确定的关系,属于相关关系;对于④,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系.综上,其中有相关关系的是①③.
故答案为:①③.
14.(4分)(2023·高二课时练习)对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为 .
【解题思路】根据散点图直接求解即可.
【解答过程】由散点图可知,
所以.
故答案为:.
15.(4分)(2022·高二单元测试)变量与相对应的一组数据为:,,,,; 变量与相对应的一组数据为,,,,,表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,是则与的大小关系是 .
【解题思路】根据题意给的数据可知变量与之间的正相关、变量与之间的正相关,进而可得、,从而得出结果.
【解答过程】由变量与相对应的一组数据为:,,,,.
可得:变量与之间的正相关,因此.
而由变量与相对应的一组数据为,,,,,可知:变量与之间的正相关,.
因此与的大小关系是.
故答案为:.
16.(4分)(2022·高二课时练习)某中学统计了2011~2021这11年本校学生参加高考数学均分、英语均分、总分均分,得到如表所示的表格:
年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
数学x(分) 75 77 79 74 80 81 77 83 80 82 81
英语m(分) 95 98 100 101 102 103 101 98 107 106 100
总分y(分) 473 481 479 485 490 487 478 492 488 493 489
从表中可知,数学和英语这两科中与总分相关性较高的是 数学 .
【解题思路】根据相关系数公式计算可得.
【解答过程】设数学学科和英语学科的相关系数分别为,,,,,
;
;
,
∴,∴.
;
,
∴,∴.
∵,∴从相关系数角度来考虑,数学学科与总分的相关性较高,
故答案为:数学.
四.解答题(共6小题,满分44分)
17.(6分)(2022春·陕西咸阳·高一阶段练习)判断下列两个变量之间是否具有相关关系:
(1)月平均气温与家庭月用电量;
(2)一天中的最高气温与最低气温;
(3)某企业生产的一种商品的销量与其广告费用;
(4)谷物的价格与牛肉的价格;
(5)在公式中的L与W.
【解题思路】根据相关关系的定义逐一判断即可.
【解答过程】(1)
月平均气温的高低不受家庭月用电量的影响,两个变量之间不具有相关关系;
(2)
一天中的最高气温不受最低气温的影响,两个变量之间不具有相关关系;
(3)
企业生产的一种商品的销量除了受其广告费用影响,还受其它因素影响,比如商品的质量等,因此这两个变量之间具有相关关系;
(4)
谷物的价格不受牛肉的价格影响,两个变量之间不具有相关关系;
(5)
在公式中,给定L一个值,W有唯一确定的值与之对应,是函数关系,不具有相关关系.
18.(6分)(2022·高二课时练习)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:
使用年限(单位:年) 2 4 5 6 8
失效费(单位:万元) 3 4 5 6 7
根据上表数据,计算与的相关系数,并说明与的线性相关性的强弱.
(已知若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱)附:.
【解题思路】先求得与的相关系数,再去判断与的线性相关性的强弱.
【解答过程】由题表知,,,
,
,,
所以,
因为,所以认为与的线性相关性很强.
19.(8分)(2022·高二课时练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如下表:
(年龄/岁) 26 27 39 41 49 53 56 58 60 61
(脂肪含量/%) 14.5 17.8 21.2 25.9 26.3 29.6 31.4 33.5 35.2 34.6
根据上表的数据得到下图的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到0.01),并描述它们的相关程度.
附:参考数据:,,,,.
参考公式:相关系数.
【解题思路】先求得样本相关系数,再去判断它们的相关程度.
【解答过程】根据题表中的样本数据知,,
则样本相关系数
.
由样本相关系数,可以推断人体脂肪含量和年龄的相关程度很强.
20.(8分)(2022·黑龙江哈尔滨·校考三模)“海水稻”就是耐盐碱水稻,是一种介于野生稻和栽培稻之间的普遍生长在海边滩涂地区,具有耐盐碱的水稻,它比其它普通的水稻均有更强的生存竞争能力,具有抗涝,抗病虫害,抗倒伏等特点,还具有预防和治疗多种疾病的功效,防癌效果尤为显著.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度(‰)对亩产量(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量与海水浓度之间的相关关系,用最小二乘法计算得与之间的线性回归方程为.
海水浓度(‰) 3 4 5 6 7
亩产量(吨) 0.62 0.58 0.49 0.4 0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种的亩产量.
(2)①完成上述残差表:
②统计学中,常用相关指数来刻画回归效果,越大,模型拟合效果越好,并用它来说明预报变量与解释变量的相关性.你能否利用以上表格中的数据,利用统计学的相关知识,说明浇灌海水浓度对亩产量的贡献率?(计算中数据精确到)
(附:残差公式,相关指数)
【解题思路】(1)根据题意,算出,将样本中心点代入线性回归方程为,求出,从而可估计当浇灌海水浓度为8‰时,该品种的亩产量.
(2)根据线性回归方程和残差公式,即可求出个海水浓度时对应的残差,即可完成残差表;根据相关指数的公式,求出,根据的意义,即可得出浇灌海水浓度对亩产量的贡献率.
【解答过程】(1)根据题意,可得,
,
而与之间的线性回归方程为,
则,解得:,
当时,,
所以当海水浓度为8‰时,该品种的亩产量为0.24吨.
(2)①由(1)知,
根据残差公式,得残差表如下:
海水浓度(‰) 3 4 5 6 7
亩产量(吨) 0.62 0.58 0.49 0.4 0.31
残差 -0.02 0.02 0.01 0 -0.01
②根据题意,可得:
,
所以浇灌海水浓度对亩产量的贡献率是.
21.(8分)(2023·河南·校联考模拟预测)某学校组织学生观看了“天宫课堂”第二课的直播后,极大地激发了学生学习科学知识的兴趣,提高了学生学习的积极性,特别是对实验操作的研究与探究.现有某化学兴趣小组的同学在老师的指导下,开展了某项化学实验操作,为了解实验效度与实验中原料的消耗量(单位:)的关系,该校实验员随机选取了10个小组的实验数据如下表.
小组编号 1 2 3 4 5 6 7 8 9 10 总计
实验效度 6
原料的消耗量 15
并计算得.
(1)求这10个小组的实验效度与实验中原料的消耗量的平均值;
(2)求这10个小组的实验效度与实验中原料的消耗量的相关系数(精确到);
(3)经该校实验员统计,以往一个学年各种实验中需用到原料的实验有200次左右.假设在一定的范围内,每次实验中原料的消耗量与实验效度近似成正比,其比例系数可近似为样本中相应的平均值的比值.根据要求,实验效度平均值需达到.请根据上述数据信息,估计该校本学年原料的消耗量.
附:相关系数
【解题思路】(1)根据数值计算即可;(2)先化简公式:,,然后再代入相关数据计算可得结果;(3)由比例关系直接计算即可.
【解答过程】(1)由题意得这10个小组的实验效度的平均值为,
这10个小组实验中原料的消耗量的平均值为.
(2)相关系数
.
(3)设该校本学年原料的消耗量为,
则由题可知,
所以估计该校本学年原料的消耗量为.
22.(8分)(2022·全国·高三专题练习)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,, ,数据如下表所示;
城市编号i 1 2 3 4 5
A指标 4 6 2 8 5
B指标 4 4 3 5 4
C指标 3 6 2 5 4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
【解题思路】(1)应用相关系数公式求,并比较大小,即可得结论;
(2)将各数据集中数据减去对应平均数得到数据集对应的向量,应用向量夹角的坐标表示求向量夹角余弦值,根据其符号和绝对值大小,确定结论.
【解答过程】(1)
由已知,,,,
所以,
,
所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.
(2)
由(1)知:,,,
将题表中x,y,z的相关数据分别减去,,,
记,
,
,
则,,,
于是,
,
所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.