第八章 成对数据的统计分析(含解析)—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(A卷)

文档属性

名称 第八章 成对数据的统计分析(含解析)—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(A卷)
格式 docx
文件大小 1.0MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-03-15 11:16:19

图片预览

文档简介

第八章 成对数据的统计分析—2023-2024学年高二数学人教A版(2019)选择性必修第三册单元双测卷(A卷)
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )
A.100个心脏病患者中至少有99人打鼾
B.1个人患心脏病,则这个人有99%的概率打鼾
C.100个心脏病患者中一定有打鼾的人
D.100个心脏病患者中可能一个打鼾的人都没有
2.新能源汽车的核心部件是动力电池,电池成本占了新能源整车成本很大的比例,从2022年年初开始,生产电池的某种有色金属的价格一路水涨船高.下表是2022年前5个月我国某电池企业采购的该有色金属价格(单位:千元)与月份X的统计数据.
X 1 2 3 4 5
Y 1.7 3.0 m 6.0 7.4
若Y与X的线性回归方程为,则m的值为( )
A.3.8 B.4.0 C.4.2 D.4.4
3.某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数r变小 B.决定系数变小
C.残差平方和变大 D.解释变量x与预报变量y的相关性变强
4.一种高产新品种水稻单株穗粒数y和土壤锌含量x有关,现整理并收集了6组试验数据,y(单位:粒)与土壤锌含量x(单位:)得到样本数据,令,并将绘制成如图所示的散点图.若用方程对y与x的关系进行拟合,则( )
A., B., C., D.,
5.下列说法正确的是( )
A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法
B.线性回归方程对应的直线至少经过其样本数据点,,中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,决定系数为0.95的模型比决定系数为0.78的模型拟合的效果差
6.某学校一同学研究温差x(单位:)与本校当天新增感冒人数y(单位:人)的关系,该同学记录了5天的数据:
x 5 6 8 9 12
y 16 20 25 28 36
由上表中数据求得温差x与新增感冒人数y满足经验回归方程,则下列结论不正确的是( )
A.x与y有正相关关系 B.经验回归直线经过点
C. D.时,残差为0.2
7.下列说法错误的是( )
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
C.在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大
D.线性回归方程对应的直线,至少经过其样本数据点,,…,中的一个点
8.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有( )
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
A.12人 B.11人 C.10人 D.18人
二、多项选择题
9.下列说法正确的是( )
A.,当不变时,越小,该正态分布对应的正态密度曲线越扁平
B.运用最小二乘法得到的线性回归直线一定经过点
C.相关系数r越大,y与x相关的程度就越强
D.利用进行独立性检验时,的值越大,说明有更大的把握认为两事件有关系
10.已知变量x,y之间的经验回归方程为,且变量x,y的数据如下表所示:
5 6 8 12 14
10 8 6 5 1
则下列说法正确的是( )
A.变量x,y之间负相关 B.
C.当时,可估计y的值为11 D.当时,残差为
11.下列说法中正确的是( )
本题可参考独立性检验临界值表:
0.100 0.050 0.025 0.010 0.001
k 2.706 3.841 5.024 6.635 10.828
A.在线性回归模型中,越接近于1,表示回归效果越好
B.在回归直线方程中,当变量x每减少一个单位时,变量增加0.6个单位
C.在一个列联表中,由计算得.则认为这两个变量有关系犯错误的概率不超过0.01
D.已知随机变量X服从正态分布,且,则
12.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关关系 B.可以预测,当时,
C. D.该回归直线必过点
三、填空题
13.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为,已知,,.若该班某学生的脚长为24厘米,估计其身高为__________厘米.
14.已知具有相关关系的两个变量x,y的一组观测数据如下表所示,若据此利用最小二乘估计得到回归方程,则_______.
x 3 4 5 6
y 2.5 m 4 4.5
15.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减小,通常把它使用价值逐年减小的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如
下表所示:
使用年限x(单位:年) 2 4 5 6 8
失效费y(单位:万元) 3 4 5 6 7
由上表数据可知,y与x的相关系数为__________.
(附:,)
16.某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男、女市民各50名,每名市民对大会给出满意或不满意的评价,得到下面列联表:
满意 不满意
男市民
女市民
当,时,若没有的把握认为男、女市民对大会的评价有差异,则m的最小值为__________.
附:,其中.
0.10 0.05 0.005
2.706 3.841 7.879
四、解答题
17.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次 空气质量等级
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
人次 人次
空气质量好
空气质量不好
附:.
0.050 0.010 0.001
3.841 6.635 10.828
18.研究表明,温度的突然变化会引起机体产生呼吸道上皮组织的生理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲研究昼夜温差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连续六天的温差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊的人数,得到资料如下:
日期 第一天 第二天 第三天 第四天 第五天 第六天
昼夜温差x() 4 7 8 9 14 12
新增就诊人数y(位)
参考数据:,.
已知两个变量x与y之间的样本相关系数,请用最小二乘法求出y关于x的线性回归方程,据此估计昼夜温差为时,该校新增患感冒的学生数(结果保留整数).
参考公式:
19.新能源渗透率是指在一定时期内,新能源汽车销量占汽车总销量的比重.2023年,随着技术进步,新能源车的渗透率继续扩大.将2023年1月视为第一个月,得到2023年1-10月,我国新能源汽车渗透率如下表:
月份代码x 1 2 3 4 5 6 7 8 9 10
渗透率 29 32 34 32 33 34 36 36 36 38
(1)假设自2023年1月起的第x个月的新能源渗透率为,试求y关于x的回归直线方程,并由此预测2024年1月的新能源渗透率:
(2)为了鼓励大家购买新能源汽车,国家在2024年继续执行新能源车购置税优惠政策:在2024年6月1日前购买的新能源车无需支付购置税,而燃油车需按照车价10%支付购置税.某4S店为促进销售,于2024年1月推出为购买燃油车的客户代付购置税的优惠活动.已知该店共有5位销售员,基本工资均为5000元,销售员每销售一辆新能源车和燃油车的提成分别为客户实际支付车价的1%和0.5%.当月该店共销售了原始价格平均为20万元的28辆车.假设以(1)中预测的新能源渗透率作为当月客户购买新能源车的概率,求4S店1月份发放给所有销售员工资总和的期望.(工资基本工资提成,客户实际支付车价客户实付总额应付购置税)
附:一组数据,,…的线性回归直线方程的系数公式为:,;参考数据:.
20.2022年日本17岁男性的平均身高为,同样的数据1994年是,近30年日本的平均身高不仅没有增长,反而降低了.反观中国近30年,男性平均身高增长了约.某课题组从中国随机抽取了400名成年男性,记录他们的身高,将数据分成八组:,,···,;同时从日本随机抽取了200名成年男性,记录他们的身高,将数据分成五组:,,···,整理得到如下频率分布直方图:
(1)由频率分布直方图估计样本中日本成年男性身高的分位数;
(2)为了了解身高与蛋白质摄入量之间是否有关联,课题组调查样本中的600人得到如下列联表:
身高 蛋白质摄入量 合计
丰富 不丰富
低于 108
不低于 100
合计 600
结合频率分布直方图补充上面的列联表,并依据小概率值的独立性检验,推断成年男性身高与蛋白质摄入量之间是否有关联?
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
参考答案
1.答案:D
解析:这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.
2.答案:D
解析:由题意得,,,
则,解得.
故选:D.
3.答案:D
解析:从图中可以看出较其他点,偏离直线远,故去掉后,回归效果更好,
对于A,相关系数越接近于1,模型的拟合效果越好,若去掉后,相关系数r变大,故A错误;
对于B,决定系数越接近于1,模型的拟合效果越好,若去掉后,决定系数变大,故B错误;
对于C,残差平方和越小,模型的拟合效果越好,若去掉后,残差平方和变小,故C错误;
对于D,若去掉后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.
故选:D.
4.答案:C
解析:因为,,令,则z与x的回归方程为,
根据散点图可知z与x正相关,因此,又回归直线的纵截距小于0,即,得,
所以,.
故诜:C
5.答案:C
解析:对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A错;对于B,线性回归方程对应的直线可能不过任何一个样本数据点,所以B错误;对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;对于D,回归分析中,决定系数为0.95的模型比决定系数为0.78的模型拟合的效果好,所以D错误.故选C.
6.答案:C
解析:由表格可知,x越大,y越大,所以x与y有正相关关系,故A正确;
,,
样本点中心为,经验回归直线经过点,故B正确;
将样本点中心代入直线方程,得,所以,故C错误;
,当时,,,故D正确.
故选:C
7.答案:D
解析:对于选项A,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足方差的性质,故A正确;
对于B选项,在残差图中,残差点分布的带状区域的宽度越狭窄,说明数据越逼近回归直线,其拟合精确度越高,故B选项正确;
在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大,本说法正确,故C正确;
对于选项D,回归直线过样本数据,,…,的中心点,并不一定过样本数据中的某一个点,故D错误.
故选:D.
8.答案:A
解析:设男生人数为x,依题意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生 x
女生
总计 x
若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则,由,解得,,为整数,若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人.故选A.
9.答案:BD
解析:对于A,根据正态曲线的几何特征,可知当不变时,即越小,该正态分布对应的正态密度曲线越瘦高,故A错误;
对于B,运用最小二乘法得到的线性回归直线-定经过样本中心,故B正确;
对于C,线性相关系数r绝对值越接近1,表明2个随机变量相关性越强,故C错误;
对于D,因为随机变量的观测值越大,说明两个变量有关系的可能性越大,即犯错误的概率越小,故D正确.
故选:BD.
10.答案:AC
解析:对于A选项,由,可得变量x,y之间负相关,故A选项正确;
对于B选项,,,
将,代入经验回归方程,有,可得,故B选项错误;
对于C选项,由上知,当时,,故C选项正确;
对于D选项,当时,,残差为,故D选项错误.
故选:AC.
11.答案:ABC
解析:对于选项A,在线性回归模型中,越接近于1,表示回归效果越好,故A正确;
对于选项B,因为回归直线方程的斜率为,所以当变量每减少一个单位时,变量增加0.6个单位,故B正确;
对于选项C,在一个列联表中,由计算可知,则认为这两个变量有关系犯错误的概率不超过0.01,故C正确;
对于选项D,由已知得,
解得 ,故D错误;
故选:ABC.
12.答案:ABD
解析:对于A,由线性回归方程为可知,所以变量x,y之间呈负相关关系,故选项A正确;对于B,当时,,故选项B正确;对于C,,,因为回归直线过样本中心点,所以,解得,故选项C不正确;对于D,由C可知,所以,所以该回归直线必过样本中心点,故选项D正确.故选ABD.
13.答案:166
解析:易得,.
,,将代入,得,解得,.
当时,.
14.答案:3
解析:,所以样本中心点为:.
因为回归方程, 样本中心点在回归方程上,
所以,解得:.
故答案为:3.
15.答案:0.99
解析:由题表知,,,,,,所以,故答案为0.99.
16.答案:21
解析:,令,即,所以,即,又因为,,所以m的最小值为21.
17.答案:(1)见解析
(2)350
(3)有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关
解析:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为.
(3)根据所给数据,可得列联表:
人次 人次 合计
空气质量好 33 37 70
空气质量不好 22 8 30
合计 55 45 100
根据列联表得.
由于,故有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
18.答案:,33人.
解析:由题意可得,所以可得;
;
又,可得;
所以,
又,,
解得,所以可得;
因此,
即可得y关于x的线性回归方程为,
当时,,
所以可以估计,昼夜温差为时,该校新增患感冒的学生数为33人.
19.答案:(1),;
(2)62520元.
解析:(1)依题意,,,
,
于是,
,则回归直线方程为,
代入得,所以预测2024年1月新能源渗透率为.
(2)设4S店1月份发放给销售员工资总和为Y,
由(1)知,客户购买新能源车的概率为,燃油车概率为,
设28辆车中新能源车为X辆,则燃油车为辆,
则,,
依题意,该店销售员的总提成为:
,
因此,
,
所以4S店1月份发放给所有销售员工资总和的期望为62520元.
20.答案:(1)
(2)成年男性身高与蛋白质摄入量之间有关联
解析:(1)由频率分布直方图可知,解得.
因为,
所以分位数位于,设为m,
则有,解得.
故日本成年男性身高的分位数为.
(2)由频率分布直方图知,样本中身高低于的中国成年男性人数是208(人),
样本中身高低于的日本成年男性人数是(人),
故样本中身高低于的共有348人,可得下表:
身高 蛋白质摄入量 合计
丰富 不丰富
低于 108 240 348
不低于 152 100 252
合计 260 340 600
零假设:成年男性身高与蛋白质摄入量之间无关联,则由列联表数据可得:
,
依据的独立性检验,我们推断不成立,即认为成年男性身高与蛋白质摄入量之间有关联.