【高考押题预测】2025年高考数学核心考点考前冲刺 样本相关系数(多选题)(含解析)

文档属性

名称 【高考押题预测】2025年高考数学核心考点考前冲刺 样本相关系数(多选题)(含解析)
格式 docx
文件大小 99.8KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-06-02 21:19:45

图片预览

文档简介

中小学教育资源及组卷应用平台
样本相关系数(多选题)
一.多选题(共20小题)
(多选)1.下列说法正确的是(  )
A.将一组数据的每一个数据减去同一个数后,新数据的方差与原数据方差相同
B.线性相关系数r越大,两个变量的线性相关性越强
C.设随机变量X~N(2,σ2),P(0<X<4)=0.4,则P(X<0)=0.3
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
(多选)2.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法不正确的是(  )
A.若所有样本点都在直线y=﹣x+1上,则两个变量的样本相关系数为r=1
B.残差平方和越小的模型,拟合的效果越好
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
(多选)3.为研究女儿身高y与母亲身高x的关系,现经过随机抽样获得成对样本数据(x1,y1),(x2,y2), ,(xn,yn),下列说法正确的是(  )
A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好
B.样本相关系数|r|越大,变量x,y线性相关程度越强
C.决定系数R2越小,残差平方和越大,模型的拟合效果越好
D.决定系数R2越大,残差平方和越小,模型的拟合效果越好
(多选)4.对于样本相关系数,下列说法正确的是(  )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数r∈[﹣1,1]
(多选)5.下列说法正确的是(  )
A.回归分析中,线性相关系数r的取值范围为(﹣1,1)
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.回归分析中,决定系数R2越大,说明残差平方和越小,拟合效果越好
D.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0
(多选)6.考虑两个变量X和Y的样本数据集,其样本相关系数rxy通过以下公式给出:
其中,xi和yi分别是X和Y的第i个样本值,x和y分别是X和Y的样本均值.下列关于样本相关系数公式各部分的陈述正确的是(  )
A.分母中的和是X和Y的标准差
B.分子部分用于衡量两个变量之间变化趋势的一致性,即分子为正值时表示变量之间正相关,分子为负值时表示变量之间负相关
C.样本相关系数的值越接近于0,表示X和Y之间的线性关系越强
D.通过对分子部分进行标准化处理,样本相关系数能够消除变量的度量单位的影响,使得不同数据集之间的相关性能够进行直接比较
(多选)7.下列有关样本相关系数r,叙述正确的是(  )
A.r的取值范围是[﹣1,1]
B.r的取值范围是[0,1]
C.|r|越接近1,表示两变量的线性相关程度越强
D.|r|越接近0,表示两变量的线性相关程度越强
(多选)8.两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2), (xn,yn),下列说法正确的是(  )
A.相关系数|r|越接近1,变量x,y相关性越强
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.相关指数R2越小,残差平方和越大,即模型的拟合效果越差
D.若x表示女大学生的身高,y表示体重则R2≈0.64表示女大学生的身高解释了64%的体重变化
(多选)9.下列说法正确的是(  )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量x与y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断x与y有关联,此推断犯错误的概率不大于0.05
(多选)10.两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2), ,(xn,yn),则下列说法正确的是(  )
A.若相关系数r<0,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数R2越大,残差平方和越小,模型的拟合效果越好
D.决定系数R2越小,残差平方和越小,模型的拟合效果越好
(多选)11.随机变量X和Y的相关系数为r,则下列说法正确的是(  )
A.当r>0时,X和Y具有正线性相关性
B.随着r值减小,X和Y的相关性也减小
C.当r=0时,X和Y不具有相关性
D.当r=﹣0.99时,X和Y具有较强的线性相关性
(多选)12.关于成对数据统计分析的下列结论中,正确的是(  )
A.若两个变量x与y的相关系数r<0,则这两个变量负相关
B.若两个变量x与y的相关系数r越大,则这两个变量的线性相关程度越强
C.若两个变量x与y的相关系数r=0,则这两个变量不具有相关关系
D.对于两个变量x与y的经验回归方程,若决定系数R2越大,则经验回归方程的拟合效果越好
(多选)13.下列说法正确的是(  )
A.若样本相关系数r=0,说明两个变量没有相关关系
B.若样本相关系数r越大,则两个变量的线性相关性越强
C.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
D.对分类变量X与Y,若它们的χ2越大,则推断X与Y有关联时犯错误的概率越小
(多选)14.如图所示,5个(x,y)数据,去掉B(3,8)后,下列说法正确的是(  )
A.相关系数r变大
B.残差平方和变大
C.决定系数R2变小
D.解释变量x与响应变量y的相关性变强
(多选)15.已知变量x和变量y的一组成对样本数据(xi,yi)(i=1,2,…,n)的散点落在一条直线附近,,,相关系数为r,线性回归方程为,则(  )
参考公式:
A.当r越大时,成对样本数据的线性相关程度越强
B.当r>0时,0
C.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的相关系数r′满足r′=r
D.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的线性回归方程满足
(多选)16.下列命题中正确的是(  )
A.已知随机变量X服从正态分布N(2,σ2),若P(X<0)=0.2,则P(X<4)=0.8
B.将总体划分为两层,通过分层抽样,得到样本数为m,n的两层样本,其样本平均数和样本方差分别为,和,,若,则总体方差
C.若A、B两组成对数据的样本相关系数分别为rA=0.92,rB=﹣0.96,则A组数据比B组数据的相关性强
D.已知P(A)>0,P(B)>0,若P(A|B)=P(A),则
(多选)17.以下几种说法正确的是(  )
A.对于相关系数r,|r|越接近1,相关程度越大,|r|越接近0,相关程度越小
B.若随机变量ξ,η满足η=2ξ+1,则D(η)=2D(ξ)+1
C.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712.依据α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关且犯错误的概率不超过0.05
D.某人在n次射击中,击中目标的次数为X,射击中靶的概率为p,若E(X)=30,D(X)=20,则
(多选)18.某同学用搜集到的六组数据(xi,yi)(i=1,2,…,6)绘制了如下散点图,在这六个点中去掉B点后重新进行回归分析,则下列说法正确的是(  )
A.决定系数R2变小
B.相关系数r的绝对值变大
C.残差平方和变小
D.解释变量x与预报变量y相关性变弱
(多选)19.下列说法正确的是(  )
A.两个变量的相关系数r越大,它们的相关程度越强
B.数据5,7,8,11,13,15,17的第80百分位数为15
C.将4个人分到三个不同的岗位工作,每个岗位至少1人,有72种不同的方法
D.若随机事件A,B满足,则P(B)=0.45
(多选)20.下列命题正确的是(  )
A.若M,N两组成对数据的样本相关系数分别rM=0.8、rN=﹣0.9,则N组数据比M组数据的线性相关性更强
B.现有10个互不相等的样本数据,去掉其中最大和最小的数据后,剩下的8个数据的25%分位数大于原样本数据的25%分位数
C.由样本数据点(x1,y1),(x2,y2),…,(xn,yn)求得的回归直线至少经过其中一个样本数据点
D.若随机变量X﹣B(5,0.4),随机变量Y=2X+1,则D(Y)=4.8
样本相关系数(多选题)
参考答案与试题解析
一.多选题(共20小题)
(多选)1.下列说法正确的是(  )
A.将一组数据的每一个数据减去同一个数后,新数据的方差与原数据方差相同
B.线性相关系数r越大,两个变量的线性相关性越强
C.设随机变量X~N(2,σ2),P(0<X<4)=0.4,则P(X<0)=0.3
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
【分析】结合方差的性质,相关系数,残差的定义,正态分布对称性,即可求解.
【解答】解:将一组数据的每一个数据减去同一个数后,数据的波动性不变,
由方差的定义可知,新数据的方差与原数据方差相同,故A正确;
线性相关系数|r|越大,两个变量的线性相关性越强,故B错误;
随机变量X~N(2,σ2),P(0<X<4)=0.4,
则P(X<0)=P(X<2)﹣P(0<X<2),故C正确;
在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,故D正确.
故选:ACD.
【点评】本题主要考查方差的性质,相关系数,残差的定义,正态分布对称性,属于基础题.
(多选)2.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法不正确的是(  )
A.若所有样本点都在直线y=﹣x+1上,则两个变量的样本相关系数为r=1
B.残差平方和越小的模型,拟合的效果越好
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
【分析】根据相关系数r的定义及其意义,对选项逐一判断即可得到结果.
【解答】解:当所有的样本点都在直线y=﹣x+1上时,样本点数据完全负相关,其相关系数r=﹣1,故A错误;
残差平方和越小的模型,R2越大,拟合的效果越好,故B正确;
相关系数|r|值越大,则变量x与y的线性相关性越强,故C正确;
相关系数|r|越小,则变量x与y的线性相关性越弱,D错误;
故选:AD.
【点评】本题主要考查相关系数的定义,属于基础题.
(多选)3.为研究女儿身高y与母亲身高x的关系,现经过随机抽样获得成对样本数据(x1,y1),(x2,y2), ,(xn,yn),下列说法正确的是(  )
A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好
B.样本相关系数|r|越大,变量x,y线性相关程度越强
C.决定系数R2越小,残差平方和越大,模型的拟合效果越好
D.决定系数R2越大,残差平方和越小,模型的拟合效果越好
【分析】据变量间的相关关系中,决定系数R2或相关系数|r|的意义进行判断即可.
【解答】解:对于A:回归直线方程拟合效果的好坏是由决定系数R2来判断的,故A错误;
对于B:因为|r|≤1,且相关系数|r|越接近1,变量x,y线性相关程度越强,故B正确;
对于C:决定系数R2越小,残差平方和越大,模型的拟合效果越差,故C错误;
对于D:决定系数R2越大,残差平方和越小,模型的拟合效果越好,故D正确.
故选:BD.
【点评】本题主要考查相关系数的定义,属于基础题.
(多选)4.对于样本相关系数,下列说法正确的是(  )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数r∈[﹣1,1]
【分析】利用相关系数与成对样本数据间的相关关系逐项判断,可得出合适的选项.
【解答】解:对于A,样本相关系数可以用来判断成对样本数据相关的正负性,故选项A正确;
对于B,样本相关系数可以是正的,也可以是负的,故选项B正确;
对于C,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,故选项C错误;
对于D,样本相关系数r∈[﹣1,1],故D正确.
故选:ABD.
【点评】本题主要考查了相关系数的性质,属于基础题.
(多选)5.下列说法正确的是(  )
A.回归分析中,线性相关系数r的取值范围为(﹣1,1)
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.回归分析中,决定系数R2越大,说明残差平方和越小,拟合效果越好
D.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0
【分析】利用回归分析的相关定义和性质对各个选项逐一分析判断即可得到结果.
【解答】解:选项A,回归分析中,线性相关系数r的取值范围为[﹣1,1],故选项A错误;
选项B,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,
表明数据越集中,模型的拟合效果越好,故选项B正确;
选项C,因为决定系数R2越大,表示残差平方和越小,数据就越集中,
即模型的拟合效果越好,故选项C正确;
选项D,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故D错误.
故选:BC.
【点评】本题主要考查了相关系数的性质,属于基础题.
(多选)6.考虑两个变量X和Y的样本数据集,其样本相关系数rxy通过以下公式给出:
其中,xi和yi分别是X和Y的第i个样本值,x和y分别是X和Y的样本均值.下列关于样本相关系数公式各部分的陈述正确的是(  )
A.分母中的和是X和Y的标准差
B.分子部分用于衡量两个变量之间变化趋势的一致性,即分子为正值时表示变量之间正相关,分子为负值时表示变量之间负相关
C.样本相关系数的值越接近于0,表示X和Y之间的线性关系越强
D.通过对分子部分进行标准化处理,样本相关系数能够消除变量的度量单位的影响,使得不同数据集之间的相关性能够进行直接比较
【分析】根据标准差的定义可判断A,根据相关系数的定义和性质可判断BCD.
【解答】解:对于A,表示X的标准差,同理Y也一样,故A错;
对于B,由相关系数的定义可知B正确,故B对;
对于C,相关系数的值越接近于0,表示X与Y之间的线性关系越弱,故C错;
对于D,根据相关系数的演化过程可知D正确.
故选:BD.
【点评】本题考查标准差的定义、相关系数的定义和性质,属于基础题.
(多选)7.下列有关样本相关系数r,叙述正确的是(  )
A.r的取值范围是[﹣1,1]
B.r的取值范围是[0,1]
C.|r|越接近1,表示两变量的线性相关程度越强
D.|r|越接近0,表示两变量的线性相关程度越强
【分析】利用相关系数的取值范围判断AB;利用相关系数的意义判断CD.
【解答】解:对于AB,样本相关系数r的取值范围是[﹣1,1],A正确,B错误;
对于CD,|r|越大,越接近于1,两变量的线性相关程度越强,
|r|越小,越接近于0,两变量的线性相关程度越弱,C正确,D错误.
故选:AC.
【点评】本题考查相关系数相关知识,属于基础题.
(多选)8.两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2), (xn,yn),下列说法正确的是(  )
A.相关系数|r|越接近1,变量x,y相关性越强
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.相关指数R2越小,残差平方和越大,即模型的拟合效果越差
D.若x表示女大学生的身高,y表示体重则R2≈0.64表示女大学生的身高解释了64%的体重变化
【分析】利用相关系数r与相关指数R2的意义分析判断即可.
【解答】解:对于A,相关系数|r|越接近1,相关性越强,故A正确;
对于B,回归直线方程拟合效果的强弱由决定系数R2或相关系数|r|判定,故B错误;
对于C,决定系数R2越小,残差平方和越大,效果越差,故C正确;
对于D,根据R2的实际意义可得,R2≈0.64表示女大学生的身高解释了64%的体重变化,故D正确.
故选:ACD.
【点评】本题主要考查相关系数,相关指数的定义,属于基础题.
(多选)9.下列说法正确的是(  )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量x与y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断x与y有关联,此推断犯错误的概率不大于0.05
【分析】根据分层抽样的定义可判断A,根据百分位数的定义可判断B,根据相关系数的性质可判断C,根据独立性检验的思想可判断D.
【解答】解:对于A,抽样比为,所以该校高一年级男生人数300人,所以该校高一年级女生人数500﹣300=200人,故A正确;
对于B,因为8×75%=6,
所以第75百分位数为10,故B正确;
对于C,线性回归方程中,若线性相关系数r的绝对值越大,则两个变量的线性相关性越强,故C错误;
对于D,因为χ2=3.937>3.841,
所以可判断x与y有关联,此推断犯错误的概率不大于0.05,故D正确.
故选:ABD.
【点评】本题主要考查了分层抽样和百分位数的定义,考查了相关系数的性质,以及独立性检验的应用,属于基础题.
(多选)10.两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2), ,(xn,yn),则下列说法正确的是(  )
A.若相关系数r<0,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数R2越大,残差平方和越小,模型的拟合效果越好
D.决定系数R2越小,残差平方和越小,模型的拟合效果越好
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【解答】解:对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数|r|越接近1,变量相关性越强,故B错误;
对于C:决定系数R2越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
【点评】本题主要考查了相关系数和决定系数的性质,属于基础题.
(多选)11.随机变量X和Y的相关系数为r,则下列说法正确的是(  )
A.当r>0时,X和Y具有正线性相关性
B.随着r值减小,X和Y的相关性也减小
C.当r=0时,X和Y不具有相关性
D.当r=﹣0.99时,X和Y具有较强的线性相关性
【分析】根据相关系数的定义及性质逐项判断即可.
【解答】解:根据相关系数的含义,可得当r>0时,X和Y具有正线性相关性;
当r=0时,成对样本数据间没有线性相关关系;故选项A正确,C错误;
当r<0时,随着r值减小,|r|越接近1,X和Y的线性相关程度越强,故B错误;
当|r|越接近1时,成对样本数据的线性相关程度越强知,
当r=﹣0.99时,X和Y具有较强的线性相关性,故D正确.
故选:AD.
【点评】本题主要考查了相关系数的性质,属于基础题.
(多选)12.关于成对数据统计分析的下列结论中,正确的是(  )
A.若两个变量x与y的相关系数r<0,则这两个变量负相关
B.若两个变量x与y的相关系数r越大,则这两个变量的线性相关程度越强
C.若两个变量x与y的相关系数r=0,则这两个变量不具有相关关系
D.对于两个变量x与y的经验回归方程,若决定系数R2越大,则经验回归方程的拟合效果越好
【分析】根据相关系数r和决定系数R2的性质判断.
【解答】解:对于A,若两个变量x与y的相关系数r<0,则这两个变量负相关,故A正确;
对于B,若两个变量x与y的相关系数r的绝对值越大,则这两个变量的线性相关程度越强,故B错误;
对于C,若两个变量x与y的相关系数r=0,只表明两个变量没有线性相关关系,不能排除它们之间有其他相关关系,故C错误;
对于D,对于两个变量x与y的经验回归方程,若决定系数R2越大,则经验回归方程的拟合效果越好,故D正确.
故选:AD.
【点评】本题主要考查了相关系数r和决定系数R2的性质,属于基础题.
(多选)13.下列说法正确的是(  )
A.若样本相关系数r=0,说明两个变量没有相关关系
B.若样本相关系数r越大,则两个变量的线性相关性越强
C.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
D.对分类变量X与Y,若它们的χ2越大,则推断X与Y有关联时犯错误的概率越小
【分析】根据题意,结合相关系数的概念,以及独立性检验的概念,逐项判定,即可求解.
【解答】解:根据相关系数的定义,当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关,其中|r|<1,且当|r|越接近1时,相关程度越大;当|r|越接近0时,相关程度越小,
对于A中,若样本相关系数r=0,说明两个变量没有线性相关关系,不能说明没有非线性相关,
所以A不正确;
对于B中,若样本相关系数|r|越大,则两个变量的线性相关性越强,所以B不正确;
对于C中,在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,
所以C正确;
对于D中,对分类变量X与Y,若它们的χ2越大,变量X与Y的关联关系越大,
即则推断X与Y有关联时犯错误的概率越小,所以D正确.
故选:CD.
【点评】本题主要考查了相关系数的性质,考查了独立性检验的性质,属于基础题.
(多选)14.如图所示,5个(x,y)数据,去掉B(3,8)后,下列说法正确的是(  )
A.相关系数r变大
B.残差平方和变大
C.决定系数R2变小
D.解释变量x与响应变量y的相关性变强
【分析】由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,由此判断即可.
【解答】解:由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,
所以相关系数r的值变大,决定系数R2的值变大,残差平方和变小.
故选:AD.
【点评】本题主要考查了散点图的应用,考查了变量间的相关系数,属于基础题.
(多选)15.已知变量x和变量y的一组成对样本数据(xi,yi)(i=1,2,…,n)的散点落在一条直线附近,,,相关系数为r,线性回归方程为,则(  )
参考公式:
A.当r越大时,成对样本数据的线性相关程度越强
B.当r>0时,0
C.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的相关系数r′满足r′=r
D.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的线性回归方程满足
【分析】根据相关系数的特征可判断AB,再根据相关系数和线性回归方程斜率的计算公式可判断CD.
【解答】解:对于A,当r的绝对值越接近于1时,成对样本数据的线性相关程度越强,故A错误;
对于B,当r>0时,成对样本数据正相关,相关系数与符号相同,则,故B正确;
对于C,当,时,将这组数据添加后,,不变,故相关系数r的表达式中的分子和分母均不变,故C正确;
对于D,当,时,将这组数据添加后,,不变,则线性回归方程中斜率的分子和分母均不变,故,故D正确.
故选:BCD.
【点评】本题考查相关系数的特征以及相关系数和线性回归方程斜率的计算公式,属于中档题.
(多选)16.下列命题中正确的是(  )
A.已知随机变量X服从正态分布N(2,σ2),若P(X<0)=0.2,则P(X<4)=0.8
B.将总体划分为两层,通过分层抽样,得到样本数为m,n的两层样本,其样本平均数和样本方差分别为,和,,若,则总体方差
C.若A、B两组成对数据的样本相关系数分别为rA=0.92,rB=﹣0.96,则A组数据比B组数据的相关性强
D.已知P(A)>0,P(B)>0,若P(A|B)=P(A),则
【分析】根据正态分布的性质判断A的真假;根据方差的计算公式判断B的真假;根据相关系数的意义判断C的真假;根据条件概率的计算公式判断事件A、B的关系,确定D的真假.
【解答】解:对于选项A:因为X N(2,σ2),且P(X<0)=0.2,
所以P(X>4)=P(X<0)=0.2,所以P(X<4)=0.8,故选项A正确;
对于选项B:设两层的数据分别为:z1,z2,z3, ,zm和y1,y2,y3, ,yn,
则,,
设总体平均数为,则,
因为,所以,
因为,,
所以,故选项B正确;
对于选项C:由样本相关系数的的意义可知,B组数据比A组数据的相关性强,故选项C错误;
对于选项D:由P(A|B)=P(A) P(AB)=P(A)P(B),
所以事件A,B独立,
所以,故D正确.
故选:ABD.
【点评】本题主要考查了正态分布曲线的对称性,考查了分层随机抽样的方差公式,以及独立事件的概率乘法公式,属于中档题.
(多选)17.以下几种说法正确的是(  )
A.对于相关系数r,|r|越接近1,相关程度越大,|r|越接近0,相关程度越小
B.若随机变量ξ,η满足η=2ξ+1,则D(η)=2D(ξ)+1
C.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712.依据α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关且犯错误的概率不超过0.05
D.某人在n次射击中,击中目标的次数为X,射击中靶的概率为p,若E(X)=30,D(X)=20,则
【分析】根据相关系数的性质可判断A,根据方差的性质可判断B,根据独立性检验的性质可判断C,根据二项分布的期望公式和方差公式可判断D.
【解答】解:对于A,对于相关系数r,|r|越接近1,相关程度越大,|r|越接近0,相关程度越小,故A正确;
对于B,若随机变量ξ,η满足η=2ξ+1,则D(η)=D(2ξ+1)=22D(ξ)=4D(ξ),故B错误;
对于C,因为χ2=4.712>3.841,
所以依据α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关且犯错误的概率不超过0.05,故C正确;
对于D,因为某人在n次射击中,击中目标的次数为X,射击中靶的概率为p,
所以X~B(n,p),
因为E(X)=30,D(X)=20,
所以,解得,故D错误.
故选:AC.
【点评】本题主要考查了相关系数和方差的性质,考查了独立性检验的应用,以及二项分布的期望和方差公式,属于中档题.
(多选)18.某同学用搜集到的六组数据(xi,yi)(i=1,2,…,6)绘制了如下散点图,在这六个点中去掉B点后重新进行回归分析,则下列说法正确的是(  )
A.决定系数R2变小
B.相关系数r的绝对值变大
C.残差平方和变小
D.解释变量x与预报变量y相关性变弱
【分析】从图中分析得到去掉B点后,回归效果更好,再由决定系数,相关系数,残差平方和和相关性的概念和性质作出判断.
【解答】解:从图中可以看出B点较其他点,偏离直线远,故去掉B点后,回归效果更好,
对于A,决定系数R2越接近于1,所拟合的回归方程越优,故去掉B点后,R2变大,越趋于1,故A错误;
对于B,相关系数|r|越趋于1,拟合的回归方程越优,故去掉B点后,故相关系数r的绝对值越趋于1,B正确;
对于C,残差平方和变小拟合效果越好,故C正确;
对于D,解释变量x与预报变量y相关性增强,D错误.
故选:BC.
【点评】本题主要考查了相关系数相关知识,属于中档题.
(多选)19.下列说法正确的是(  )
A.两个变量的相关系数r越大,它们的相关程度越强
B.数据5,7,8,11,13,15,17的第80百分位数为15
C.将4个人分到三个不同的岗位工作,每个岗位至少1人,有72种不同的方法
D.若随机事件A,B满足,则P(B)=0.45
【分析】根据相关系数的性质可判断A,根据百分位数的定义可判断B,根据“捆绑法”可判断C,根据全概率公式可判断D.
【解答】解:对于A:相关系数r的绝对值越接近1,线性相关程度越强,故A错误;
对于B:由于7×80%=5.6,
所以数据5,7,8,11,13,15,17的第80百分位数为15,故B正确;
对于C:先捆绑再排列,先从4个人中抽取2人一组,故有,故C错误;
对于D:由全概率公式可得:
,故D正确.
故选:BD.
【点评】本题主要考查了相关系数的性质,考查了百分位数的定义,以及全概率公式的应用,属于中档题.
(多选)20.下列命题正确的是(  )
A.若M,N两组成对数据的样本相关系数分别rM=0.8、rN=﹣0.9,则N组数据比M组数据的线性相关性更强
B.现有10个互不相等的样本数据,去掉其中最大和最小的数据后,剩下的8个数据的25%分位数大于原样本数据的25%分位数
C.由样本数据点(x1,y1),(x2,y2),…,(xn,yn)求得的回归直线至少经过其中一个样本数据点
D.若随机变量X﹣B(5,0.4),随机变量Y=2X+1,则D(Y)=4.8
【分析】对于A,结合相关系数的定义,即可求解;对于B,结合百分位数的定义,即可求解;对于C,结合线性回归方程的性质,即可求解;对于D,结合二项分布的方差公式,即可求解.
【解答】解:对于A,|rN|>|rM|,
则N组数据比M组数据的线性相关性更强,故A正确;
对于B,原数据为10个,25%×10=2.5,
原样本数据的25%分位数为原数据的第三个数,
新数据为8个,25%×8=2,
剩下的8个数据的25%分位数为这8个数据的第二、第三位数的平均数,即原样本数据的第三、第四位数的平均数,
故剩下的8个数据的25%分位数大于原样本数据的25%分位数,故B正确;
对于C,样本数据点(x1,y1),(x2,y2),…,(xn,yn)求得的回归直线必过样本中心,但不一定经过样本点,故C错误;
对于D,随机变量X﹣B(5,0.4),
则D(X)=5×0.4×(1﹣0.4)=1.2,
Y=2X+1,则D(Y)=D(2X+1)=4D(X)=4×1.2=4.8,故D正确.
故选:ABD.
【点评】本题主要考查统计的知识,属于中档题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)
同课章节目录