8.1 成对数据的统计相关性(专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(Word版含解析)

文档属性

名称 8.1 成对数据的统计相关性(专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(Word版含解析)
格式 docx
文件大小 687.3KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-08-08 20:02:00

图片预览

文档简介

2020—2021学年高二数学下学期
8.1成对数据的统计相关性
专项训练
一、单选题(共12题;共60分)
1.以下四个命题中:
①函数关系是一种确定性关系;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;
③独立性检验中的统计假设就是假设相关事件false、false相互独立;
④某项测量结果false服从正态分布false,且false,则false.
以上命题中,真命题的个数为( )
A.1个 B.2个 C.3个 D.4个
2.下列说法正确的是( )
A.若残差平方和越小,则相关指数false越小
B.将一组数据中每一个数据都加上或减去同一常数,方差不变
C.若false的观测值越大,则判断两个分类变量有关系的把握程度越小
D.若所有样本点均落在回归直线上,则相关系数false
3.下列说法:①false越小,X与Y有关联的可信度越小;②若两个随机变量的线性相关性越强,则相关系数r的值越接近于1;③“若false,则false类比推出,“若false,则false;④命题“有些有理数是无限循环小数,整数是有理数,所以整数是无限循环小数”是假命题,推理错误的原因是使用了“三段论”,推理形式错误.其中说法正确的有个
A.0 B.1 C.2 D.3
4.根据最小二乘法由一组样本点false(其中false),求得的回归方程是false,则下列说法正确的是
A.至少有一个样本点落在回归直线false上
B.若所有样本点都在回归直线false上,则变量同的相关系数为1
C.对所有的解释变量false(false),false的值一定与false有误差
D.若回归直线false的斜率false,则变量x与y正相关
5.有一散点图如图所示,在5个false数据中去掉false(3,10)后,下列说法正确的是( )
A.残差平方和变小 B.方差变大
C.相关指数false变小 D.解释变量false与预报变量false的相关性变弱
6.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为false,计算其相关系数为false,相关指数为false.经过分析确定点false为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为false,相关系数为false,相关指数为false.以下结论中,不正确的是
A.false B.false
C.false D.false
7.某次测量发现一组数据false具有较强的相关性,并计算得false,其中数据false因书写不清楚,只记得false是false上的一个值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为( )
A.false B.false C.false D.false
8.有一散点图如图所示,在5个false数据中去掉false后,下列说法正确的是
A.残差平方和变小 B.相关系数false变小
C.相关指数false变小 D.解释变量false与预报变量false的相关性变弱
9.下面给出四种说法:
①设false、false、false分别表示数据false、false、false、false、false、false、false、false、false、false的平均数、中位数、众数,则false;
②在线性回归模型中,相关指数false表示解释变量对于预报变量变化的贡献率,false越接近于false,表示回归的效果越好;
③绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;
④设随机变量false服从正态分布false,则false.
其中不正确的是( ).
A.① B.② C.③ D.④
10.下列说法中正确的个数是
①相关系数false用来衡量两个变量之间线性关系的强弱,false越接近于1,相关性越弱;
②回归直线false过样本点中心false;
③相关指数false用来刻画回归的效果,false越小,说明模型的拟合效果越不好.
A.0 B.1 C.2 D.3
11.已知下列命题:
①回归直线false恒过样本点的中心false,且至少过一个样本点;
②两个变量相关性越强,则相关系数r就越接近于1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程false 中,当解释变量x增加一个单位时,预报变量false平均减少0.5;
⑤在线性回归模型中,相关指数false表示解释变量false对于预报变量false的贡献率,false越接近于1,表示回归效果越好;
⑥对分类变量false与false,它们的随机变量false的观测值false来说, false越小,“false与false有关系”的把握程度越大.
⑦两个模型中残差平方和越小的模型拟合的效果越好.
则正确命题的个数是( )
A.3 B.4 C.5 D.6
12.下列说法中正确的是
①相关系数false用来衡量两个变量之间线性关系的强弱, false越接近于false,相关性越弱;
②回归直线false一定经过样本点的中心false;
③随机误差false满足false,其方差false的大小用来衡量预报的精确度;
④相关指数false用来刻画回归的效果, false越小,说明模型的拟合效果越好.
A.①② B.③④ C.①④ D.②③
二、填空题(共4题;共20分)
13.下列说法正确的是:
①在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差;
②回归分析模型中,残差平方和越小,说明模型的拟合效果越好;
③在回归直线方程false中,当解释变量每增加1个单位时,预报变量false平均增加0.1个单位
④若false,false,则false;
⑤已知正方体false,false为底面false内一动点,false到平面false的距离与到直线false的距离相等,则false点的轨迹是抛物线的一部分.
正确的序号是:______.
14.false和false的散点图如图所示,则下列说法中所有正确命题的序号为______.
①false,false是负相关关系;
②false,false之间不能建立线性回归方程;
③在该相关关系中,若用false拟合时的相关指数为false,用false拟合时的相关指数为false,则false.
15.给出下列命题:
①已知false,false是正数,且false,则false;
②命题“false,使得false”的否定是真命题;
③将false化成二进位制数是false;
④某同学研究变量false,false之间的相关关系,并求得回归直线方程,他得出一个结论:false与false 负相关且false,
其中正确的命题的序号是__________(把你认为正确的序号都填上).
16.给出下列命题:
①线性相关系数false越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②由变量false和false的数据得到其回归直线方程false,则false一定经过点false;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
⑤在回归直线方程false中,当解释变量false每增加一个单位时,预报变量false平均增加0.1个单位,
其中真命题的序号是_________.
三、解答题(共4题;共20分)
17.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量false与尺寸false之间近似满足关系式false(false、false为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间false内时为优等品.现随机抽取false件合格产品,测得数据如下:
尺寸false
38
48
58
68
78
88
质量false
16.8
18.8
20.7
22.4
24
25.5
质量与尺寸的比false
0.442
0.392
0.357
0.329
0.308
0.290
(1)现从抽取的false件合格产品中再任选false件,记false为取到优等品的件数,试求随机变量false的期望;
(2)根据测得数据作了初步处理,得相关统计量的值如表:
false
false
false
false
false
false
false
false
(i)根据所给统计量,求false关于false的回归方程;
(ii)已知优等品的收益false(单位:千元)与false、false的关系为false,则当优等品的尺寸false为何值时,收益false的预报值最大?
附:对于样本false,其回归直线false的斜率和截距的最小二乘估计公式分别为:false,false,false.
18.某地一公司的市场研究人员为了解公司生产的某产品的使用情况,从两个方面进行了调查统计,一是产品的质量参数x,二是产品的使用时间t(单位:千小时),经统计分析,质量参数x服从正态分布false,使用时间t与质量参数x之间有如下关系:
质量参数x
0.65
0.70
0.75
0.80
0.85
0.90
0.95
使用时间t
2.60
2.81
3.05
3.10
3.25
3.35
3.54
(1)该地监管部门对该公司的该产品进行检查,要求质量参数在0.785以上的产品为合格产品.现抽取20件该产品进行校验,求合格产品的件数的数学期望;
(2)该公司研究人员根据最小二乘法求得线性回归方程为false,请用相关系数说明使用时间t与质量参数x之间的关系是否可用线性回归模型拟合.
附:参考数据:false.若false,则false
参考公式:相关系数false;
回归直线方程为false,其中false.
19.某机构为了解某大学中男生的体重单位:false)与身高x(单位:false)是否存在较好的线性关系,该机构搜集了7位该校男生的数据,得到如下表格:
序号
1
2
3
4
5
6
7
身高(false)
161
175
169
178
173
168
180
体重(false)
52
62
54
70
66
57
73
根据表中数据计算得到false关于false的线性同归方程为false
(1)求false
(2)已知false且当false时,回归方程的拟合效果非常好;当false时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.参考数据:false
20.某电器企业统计了近false年的年利润额false(千万元)与投入的年广告费用false(十万元)的相关数据,散点图如图,对数据作出如下处理:令false,false,得到相关数据如表所示:
false
false
false
false
false
false
false
false
(1)从①false;②false;③false三个函数中选择一个作为年广告费用false和年利润额false的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出false与false的回归方程;
(3)预计要使年利润额突破false亿,下一年应至少投入多少广告费用?(结果保留到万元)
参考数据:false,false.
参考公式:回归方程false中斜率和截距的最小二乘估计公式分别为false,false.
参考答案
1.D
【详解】
①函数关系是一种确定性关系,所以①是正确的;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,
所以②是正确的;
③独立性检验中的统计假设就是假设相关事件false、false相互独立,所以③是正确的;
④某项测量结果false服从正态分布false,由正态分布定义可知它的图像是关于false对称,
因为false,则false,
所以false,所以④是正确的;
故选:D
2.B
【详解】
对于false,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,相关指数false越大,故false错误;
对于false,将一组数据的每一个数据都加上或减去同一常数后,由方差的性质可得方差不变,故false正确;
对于false,对分类变量false与false,它们的随机变量false的观测值越大,“false与false有关系”的把握程度越大,故false错误;
对于false,若所有样本点均落在回归直线上,则相关系数false,故false错误.
故选:B.
3.C
【详解】
①中因为false越大,X与Y有关联的可信度越大,所以false越小,X与Y有关联的可信度越小,正确;
②中因为若两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,故错误;
③中因为虚数不能比较大小,可知false错误;
④中因为大前提的形式:“有些有理数是无限循环小数”,不是全称命题,故推理形式错误判断正确.
故选:C
4.D
【详解】
回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;
所有样本点都在回归直线false上,则变量间的相关系数为false,故B错误;
若所有的样本点都在回归直线false上,则false的值与false相等,故C错误;
相关系数r与false符号相同,若回归直线false的斜率false,则false,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.
故选D.
5.A
【详解】
由散点图可知,去掉false后,false与false的线性相关性加强,且为正相关,
所以false变大,false变大,残差平方和变小,
故选A.
6.B
【详解】
由图可知两变量呈现正相关,故false,且false,故false,
故false正确,false不正确.
又回归直线false必经过样本中心点false,所以false,false正确.
回归直线false必经过样本中心点false,所以false,
所以false,也可直接根据图象判断false(比较两直线的倾斜程度),故false正确.故选B.
7.C
【详解】
依题意可知,估计值为false,残差为false,依题意得false,解得false,根据几何概型概率计算公式可得所求概率为false,故选C.
8.A
【详解】
∵从散点图可分析得出:
只有false点偏离直线远,去掉false点,变量false与变量false的线性相关性变强,
∴相关系数变大,相关指数变大,残差的平方和变小,故选A.
9.C
【详解】
解:①将数据按从小到大的顺序排列为:
false、false、false、false、false、false、false、false、false、false,
中位数:false;
false;
这组数据的平均数是false.
因为此组数据中出现次数最多的数是false,
所以false是此组数据的众数;
则false;
②false越接近于false,表示回归的效果越好,正确;
③根据频率分布直方图的意义,因为小矩形的面积之和等于false,频率之和也为false,
所以有各小长方形的面积等于相应各组的频率;故③错;
④∵随机变量false服从正态分布false,
∴正态曲线的对称轴是false,
∴false.故④正确.
故选false.
10.C
【详解】
①线性相关关系false是衡量两个变量之间线性关系强弱的量,false越接近于1,这两个变量线性相关关系越强,false越接近于0,线性相关关系越弱,故①错误;
②回归直线false过样本点中心false,故②正确;
③用相关指数false来刻画回归的效果,false越大,说明模型的拟合效果越好;false越小,说明模型的拟合效果越不好,故③正确.
综上,说法中正确的个数是2.故选C.
11.B
【详解】
对于①,回归直线false恒过样本点的中心(false),可以不过任一个样本点,故①错误;
对于②,两个变量相关性越强,则相关系数r的绝对值就越接近于1,故②错误;
对于③,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故③正确;
对于④,在回归直线方程false2﹣0.5x中,当解释变量x每增加一个单位时,
预报变量false平均减少0.5个单位,故④正确;
对于⑤,在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,
R2越接近于1,表示回归效果越好,故⑤正确;
对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,
“X与Y有关系”的把握程度越大,故⑥错误;
对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.
其中正确个数为4.
故选B.
12.D
【详解】
①相关系数false用来衡量两个变量之间线性关系的强弱,false越接近于false,相关性越强,故错误
②回归直线false一定经过样本点的中心false,故正确
③随机误差false满足false,其方差false的大小用来衡量预报的精确度,故正确
④相关指数false用来刻画回归的效果,false越大,说明模型的拟合效果越好,故错误
综上,说法正确的是②③
故选false
13.②③④⑤
【详解】
对于①中,在做回归分析时,由残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,所以①不正确;
对于②中,回归分析模型中,残差平方和越小,说明模型的拟合效果越好是正确的,所以②是正确的;
对于③中,在回归直线方程false中,当解释变量每增加1个单位时,预报变量false平均增加0.1个单位,所以③是正确的.
对于④中,若false,false,
可得false,false,
解得false,所以false,所以④是正确的;
⑤在正方体false,则false是点false到直线false的距离,过false作false垂直于直线false,则false到平面false的距离为false,
因为false到平面false的距离到直线false的距离,所以false,
根据抛物线的定义,可得点false的轨迹是抛物线的一部分,所以⑤是正确的.
故答案为:②③④⑤.
14.①③
【详解】
在散点图中,点散布在从左上角到右下角的区域,因此false,false是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用false拟合比用false拟合效果要好,则false,故③正确.
故答案为:①③.
15.②③④
【详解】
①中作差法可知:false
∵a,b是正数,
∴false,可知①错;
②中命题的否定为:“false,使得false”,
即“false,使得false”显然为真命题,故②正确;
③中则,∵false,故③正确;
④中,∵y与x负相关,
∴所求回归直线方程中false前面的系数为负数,符合常理,故④正确.
故答案为:②③④.
16.②④⑤
【详解】
①线性相关系数false越大,两个变量的线性相关性越强,故①不正确;
②由变量false和false的数据得到其回归直线方程,其点false为样本中心点,一定在回归直线方程上,故②正确;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样不是分层抽样,而是系统抽样,故③错误;
④由方差的公式false,将一组数据中的每个数据都加上或减去同一个常数后,其平均数也相应的增加或减少同一个常数,故方差不变,故④正确;
⑤在回归直线方程false中,当解释变量false每增加一个单位时,预报变量false平均增加0.1个单位,故⑤正确.
故答案为:②④⑤.
17.(1)false;(2)(i)false;(ii)当优等品的尺寸false为false时,收益false的预报值最大.
【详解】
(1)由表可知,抽取的false件合格产品中有false件优等品,
所以,false的所有可能取值为false、false、false、false,
false,false,false,
false,
所以,随机变量false的期望为false;
(2)(i)false,false,
false,false,
false,false,
false,
false,false,所以,false,
故false关于false的回归方程为false;
(ii)由(i)知,false,
false,
当false,即false时,false取得最大值,
故当优等品的尺寸false为false时,收益false的预报值最大.
18.(1)false;(2)答案见解析.
【详解】
解:(1)一件产品的质量参数在0.785以上的概率false,
设抽取20件该产品中为合格产品的件数为false,则false,
则false.
(2)false,
同理,false,
false,false,
false
false
false
所以使用时间false与质量参数false之间具有较强的线性相关关系,可用线性回归模型拟合.
19.(1)false;(2)该线性回归方程的拟合效果是良好,理由见解析.
【详解】
解析:(1)∵falsefalse
将(172,62)代入回归方程得:
∴false
(2)false
y关于x的线性同归方程为false
∴false
false
∴false
故该线性回归方程的拟合效果是良好.
20.(1)选择回归类型false更好;(2)false;(3)下一年应至少投入false万元广告费用.
【详解】
解:(1)由散点图知,年广告费用false和年利润额false的回归类型并不是直线型的,而是曲线型的,且false与false呈正相关.
所以选择回归类型false更好;
(2)对false两边取自然对数,得false,
false,false,则false,
由表中数据得,false,
所以false,所以false,
所以年广告费用false和年利润额false的回归方程为false;
(3)由(2),知false,令false,得false,得false,
所以false, 所以false(十万元).
故下一年应至少投入false万元广告费用.