8.1成对数据的统计相关性 同步练习(含解析)2023——2024学年高中数学人教A版(2019)选择性必修第三册

文档属性

名称 8.1成对数据的统计相关性 同步练习(含解析)2023——2024学年高中数学人教A版(2019)选择性必修第三册
格式 docx
文件大小 1.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-05-19 14:50:47

图片预览

文档简介

8.1 成对数据的统计相关性 同步练习
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.已知变量与的回归直线方程为,变量与负相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与负相关,与正相关 D.与正相关,与负相关
2.关于的一组样本数据,,,,…,的散点图中,所有样本点均在直线上,则这组样本数据的样本相关系数r为( )
A. B. C.1 D.2
3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型Ⅰ:相关系数r为 B.模型Ⅱ:相关系数r为0.81
C.模型Ⅲ:相关系数r为 D.模型Ⅳ:相关系数r为0.53
4.某统计部门对四组数据进行统计分析后获得如图所示的散点图,关于相关系数的比较,其中正确的是( )
A. B.
C. D.
5.对四组数据进行统计,获得以下散点图,则其相关系数值最大的是( )
A.r1 B.r2 C.r3 D.r4
6.调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,则下列说法正确的是(  )
A.若从样本中抽取一部分,则这部分的相关系数一定是
B.花瓣长度和花萼长度没有相关性
C.花瓣长度和花萼长度呈现负相关
D.花瓣长度和花萼长度呈现正相关
7.开始吸烟年龄与得肺癌的相对危险度相对应的一组数据为,;每天吸烟的支数与其得肺癌的相对危险度相对应的一组数据为,.用表示变量与之间的线性相关系数,用表示变量与之间的线性相关系数,则下列说法正确的是( )
A. B. C. D.
8.通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
二、多选题
9.随机变量X和Y的相关系数为r,则下列说法正确的是( )
A.当时,X和Y具有正线性相关性 B.随着r值减小,X和Y的相关性也减小
C.当时,X和Y不具有相关性 D.当时,X和Y具有较强的线性相关性
10.设是变量和的个样本点,由这些样本点通过最小二乘法得到线性回归直线方程,下列结论正确的是( )
A.与正相关的充要条件是 B.直线过点
C.与之间的相关系数为 D.当增大一个单位时,增大个单位
11.下列命题正确的是( )
A.已知,若,则
B.若散点图的散点均落在一条斜率非0的直线上,则决定系数
C.数据的均值为4,标准差为1,则这组数据中没有大于5的数
D.数据的75百分位数为47
12.某市7天国庆节假期期间的楼房日认购量(单位:套)与日成交量(单位:套)的折线图如下图所示,小明同学根据折线图对这7天的日认购量与日成交量作出如下判断,则下列结论正确的是( )
A.日认购量与日期正相关
B.日成交量的中位数是26
C.日成交量超过日平均成交量的有2天
D.10月7日日认购量的增量大于10月7日日成交量的增量
三、填空题
13.甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 研究的两个随机变量的线性相关程度最高.
14.某试验小组收集了部分父亲和儿子的身高数据,通过测量与回归方程计算得到如下五组儿子身高的观测值与估计值,则该组统计数据的决定系数 .
儿子身高观测值/ 161.3 167.7 170.0 173.5 177.5
儿子身高估计值/ 161.3 167.7 170.0 173.5 177.5
15.对具有线性相关关系的变量有一组观测数据(),其经验回归方程为,且,,则相应于点的残差为 .
16.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得线性回归方程为,则该模型的非线性回归方程为 .
四、解答题
17.近年来,国内掀起了全民新中式热潮,新中式穿搭,新中式茶饮,新中式快餐,新中式烘焙等,以下为某纺织厂生产“新中式”面料近5个月的利润y(万元)的统计表.
月份 2023.11 2023.12 2024.01 2024.02 2024.03
月份编号x 1 2 3 4 5
利润y(万元) 27 23 20 17 13
(1)根据统计表,试求y与x之间的相关系数r(精确到0.001),并利用r说明y与x是否具有较强的线性相关关系;(若,则认为两个变量具有较强的线性相关性);
(2)该纺织厂现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了4件、2件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为X,试求X的分布列与期望.
附:参考数据:
相关系数.
18.2023年,我国新能源汽车产销量占全球比重超过60%,中国成为世界第一大汽车出口国.某汽车城统计新能源汽车从某天开始连续的营业天数与销售总量(单位:辆),采集了一组共20对数据,并计算得到回归方程,且这组数据中,连续的营业天数的方差,销售总量的方差.
(1)求样本相关系数,并刻画与的相关程度;
(2)在这组数据中,若连续的营业天数满足,试推算销售总量的平均数.
附:经验回归方程,其中,.
样本相关系数,.
19.2023年全国竞走大奖赛(第1站)暨世锦赛及亚运会选拔赛3月4日在安徽黄山开赛.重庆队的贺相红以2小时22分55秒的成绩打破男子35公里竞走亚洲纪录.某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据:
步频(单位:) 0.28 0.29 0.30 0.31 0.32
步长(单位:) 90 95 99 103 117
(1)根据表中数据,得到步频和步长近似为线性相关关系,求出关于的回归直线方程,并利用回归方程预测,当步长为时,步频约是多少?
(2)记,其中为观测值,为预测值,为对应的残差,求(1)中步长的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立,请证明;若不成立,请说明理由.
参考数据:,.
参考公式:,.
20.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为360 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
(3)求该林区这种树木的根部横截面积与材积量的样本相关系数.(精确到0.01)
参考公式和数据:相关系数,≈1.377.
21.近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.某车企通过市场调研并进行粗略模拟,得到研发投入(亿元)与经济收益(亿元)的数据,统计如下:
研发投入亿元 1 2 3 4 5
经济收益亿元 2.5 4 6.5 9 10.5
(1)计算的相关系数,并判断是否可以认为研发投入与经济收益具有较高的线性相关程度:(若,则线性相关程度一般,若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测研发投入10亿元时的经济收益.
参考数据:
附:相关系数,线性回归方程的斜率,截距.
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.D
【分析】根据已知条件,结合回归方程可判断与正相关,再由变量与负相关,即可判断与负相关.
【详解】根据回归方程可知变量与正相关,又变量与负相关,
由正相关、负相关的定义可知,与负相关.
故选:D
2.B
【分析】根据相关系数的性质,结合题意,即可判断和选择.
【详解】因为所有样本点均在直线上,故,又,故.
故选:B.
3.A
【分析】根据相关系数与拟合效果的关系即可求解.
【详解】相关系数越大,拟合效果越好.
故选:A.
4.C
【分析】根据题中给出的散点图,先判断是正相关还是负相关,然后根据散点图的集中程度分析相关系数的大小.
【详解】由图可知:所对应的图中的散点呈现正相关 ,而且对应的相关性比对应的相关性要强,故;
所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,
故选:C.
5.A
【分析】根据相关系数的定义的值越接近于1关联性越强,结合图象即可求解.
【详解】根据相关系数的定义知,越接近于1关联性越强,
结合图象知,第一、三两幅图为正相关,且第一幅图的相关性较强,所以,
又因为第二、四幅图变量之间为负相关,且第二幅图的相关性较强,所以,
故选:A.
6.D
【分析】根据散点图的特点可分析出相关性的问题,从而判断B,C,D选项,根据相关系数的定义可以判断A选项.
【详解】由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.824 5,故A错误;
根据散点的集中程度可知,花瓣长度和花萼长度有相关性,故B错误;
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,故C错误,D正确.
故选:D
7.D
【分析】借助线性相关系数的定义判断即可得.
【详解】由与相对应的数据可得,随的增大而减小,呈负相关,故,
由与相对应的数据可得,随的增大而增大,呈正相关,故,
故.
故选:D.
8.D
【分析】根据相关系数的概念逐一判断.
【详解】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;
对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,
但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.
故选:D.
9.AD
【分析】根据相关系数的定义及性质逐项判断即可.
【详解】根据相关系数的含义,可得当时,X和Y具有正线性相关性;
当时,成对样本数据间没有线性相关关系;故选项A正确,C错误;
当时,随着r值减小,越接近1,X和Y的线性相关程度越强,故B错误;
当越接近1时,成对样本数据的线性相关程度越强知,
当时,X和Y具有较强的线性相关性,故D正确.
故选:AD
10.ABD
【分析】根据回归直线方程的意义一一判断即可.
【详解】依题意与正相关的充要条件是,故A正确;
根据回归直线的性质可知直线必过点,故B正确;
因为与之间的相关系数,
而,故C错误;
因为,所以当增大一个单位时,增大个单位,故D正确.
故选:ABD
11.ABD
【分析】对于A:利用正态分布的对称性判断;对于B:根据相关的概念判断;对于C:举反例说明;对于D:直接求75百分位数.
【详解】对于A:已知,若,
则,A正确;
对于B:若散点图的散点均落在一条斜率非0的直线上,则变量与变量之间满足线性函数关系,则决定系数,B正确;
对于C:不妨设,
则,解得,
此时,
故找到一组数,数据中有大于5的数,C错误;
对于D:,故这组数据的75百分位数为47,D正确.
故选:ABD.
12.BD
【分析】根据正相关的定义结合图象即可判断A;根据中位数的定义结合图象即可判断B;根据图中数据进行计算即可求得平均数,即可判断C;根据图中数据进行计算即可判断D.
【详解】由题图可以看出,数据点并不是从左下至右上分布,所以错;
将成交量数据按大小顺序排列,中位数为26,所以对;
日平均成交量为,
超过42.7的只有一天,所以错;
10月7日认购量的增量为,
成交量的增量为,所以对,
故选:BD.
13.乙
【分析】根据相关系数的定义判断即可.
【详解】因为,所以这四人中,乙研究的两个随机变量的线性相关程度最高,
故答案为:乙.
14.1
【分析】根据决定系数的意义及表格中的数据即可求解.
【详解】因为决定系数,其值越接近1,说明模型拟合效果越好,误差越小,从表中数据可知没有误差,所以.
15./
【分析】利用样本中心在其经验回归方程为上,求出,再计算当时的残差即可.
【详解】经验回归直线过样本点的中心,,,
经验回归方程为.当时,,残差为.
故答案为:.
16.
【分析】由回归直线方程可得:,解出,问题得解.
【详解】由回归直线方程,得:,
整理得:,
所以该模型的回归方程为.
故答案为: .
17.(1);具有较强的线性相关关系
(2)分布列见解析;
【分析】(1)由相关系数的公式结合题中的数据计算即可;
(2)由题意可得的可能取值有,再由古典概率计算其对应的概率,列出分布列,求出期望即可.
【详解】(1),,

又,
所以可以判断与具有较强的线性相关关系.
(2)的可能取值有,
因为,,,
其分布列为:
1 2 3
期望.
18.(1),正相关且相关程度很强
(2)
【分析】(1)根据相关系数与的公式推导出,代入数据计算可得;
(2)由方差公式及求出,再根据回归直线方程必过样本中心点计算可得.
【详解】(1)因为,

可以推断连续的营业天数与销售总量这两个变量正线性相关,且相关程度很强.
(2)

(负值已舍去),
而,从而.
19.(1), 0.27秒,;
(2)成立,证明见解析.
【分析】(1)根据已知条件求得回归方程的系数,即可得回归方程,将代入回归方程,即可得到答案;
(2)结合题中数据进行计算,可求得步长的残差和,从而可得结论,结合回归方程系数的计算公式即可证明.。
【详解】(1),,
,,
所以回归直线方程为,
将代入得,解得,所以当步长为时,步频约是0.27秒.
(2)根据(1)得到,;
,;
,;
,;
,,
所以,即步长残差和为0.
对任意具有线性相关关系的两个变量都成立,证明如下:

20.(1),
(2)
(3)
【分析】(1) 计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2) 依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值;
(3) 代入题给相关系数公式计算即可求得样本的相关系数值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值,
样本中10棵这种树木的材积量的平均值,
据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为.
(2)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,可得,解得,
则该林区这种树木的总材积量估计为.
(3)由,
即该林区这种树木的根部横截面积与材积量的样本相关系数为.
21.(1),
(2),约为亿元
【分析】(1)根据所给数据求出,,,即可求出,从而求出相关系数,即可判断;
(2)由(1)及题干所给数据求出、,即可求出回归直线方程,再代入计算可得.
【详解】(1)依题意,,

所以,
所以,
因为,所以可以认为研发投入与经济收益具有较高的线性相关程度;
(2)由(1)可得,
所以,
所以关于的线性回归方程为,
当时,所以当研发投入亿元时的经济收益约为亿元.
答案第1页,共2页
答案第1页,共2页