第八章 成对数据的统计分析(B卷能力提升)——高二数学人教A版(2019)选择性必修第三册单元测试AB卷(含解析)

文档属性

名称 第八章 成对数据的统计分析(B卷能力提升)——高二数学人教A版(2019)选择性必修第三册单元测试AB卷(含解析)
格式 doc
文件大小 1.2MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2025-04-03 08:43:12

图片预览

文档简介

中小学教育资源及组卷应用平台
第八章 成对数据的统计解题思路(B卷能力提升)——高二数学人教A版(2019)选择性必修第三册单元测试AB卷
本试卷满分150分,考试时间120分钟。
注意事项:
1.答题前,务必将自己的姓名、班级、考号填写在答题卡规定的位置上。
答选择题时,必须使用2B 铅笔将答题卡上对应题目的答案标号涂黑,如需改动,用橡皮擦
2.擦干净后,再选涂其它答案标号。
3.答非选择题时,必须使用0.5毫米黑色签字笔,将答案书写在答题卡规定的位置上。
4.所有题目必须在答题卡上作答,在试题卷上答题无效。
一、单项选择题:本大题共 8 小题,每小题 5 分,共 40 分. 在每小题给出的四个选项中,只有一个选项是正确的.请把正确的选项填涂在答题卡相应的位置上.
1.根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为( )参考值:
0.1 0.05 0.01
2.706 3.841 6.635
A.x与y不独立
B.x与y不独立,这个结论犯错误的概率不超过0.05
C.x与y独立
D.x与y独立,这个结论犯错误的概率不超过0.05
2.为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.100 0.050 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
A.0.1% B.1% C.99% D.99.9%
3.我们研究成对数据的相关关系,其中,,.在集合中取一个元素作为a的值,使得这组成对数据的相关程度最强,则( )
A.8 B.11 C.12 D.13
4.第19届亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月销量,如下表所示:
时间x 1 2 3 4 5
销售量y/万只 5 4.5 4 3.5 2.5
若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,变量y与x负相关
B.当时,残差为0.2
C.可以预测当时销量约为2.1万只
D.线性回归方程中
5.已知一种服装的销售量单位:百件与第x周的一组相关数据统计如表所示,若两变量x,y的经验回归方程为,则( )
x 1 2 3 4 5
y 6 6 a 3 1
A.2 B.3 C.4 D.5
6.某学习小组对一组数据进行回归解题思路,甲同学首先求出回归直线方程,样本点的中心为.乙同学对甲的计算过程进行检查,发现甲将数据误输成,将这两个数据修正后得到回归直线方程,则实数( )
A. B. C. D.
7.已知变量x与y的回归直线方程为,变量y与z负相关,则( )
A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关
8.已知x,y取表中的数值,若x,y具有线性相关关系,线性回归方程为,则( )
x 0 1 3 4
y a 4.3 4.8 6.7
A.2.2 B.2.4 C.2.5 D.2.6
二、多项选择题:本大题共 3 小题,每小题 6 分,共 18 分. 在每小题给出的四个选项中,有多项符合题目要求. 全部选对得 6 分,选对但不全的得部分分,有选错的得0分.
9.使用统计手段科学预测传染病可以保障人民群众的生命健康.下表和散点图为某段时间内全球某传染病感染病例在第一次监测到之后数量随时间的变化,以时间为自变量x(单位为天),以监测到的病例总数为因变量y,选择以下两个回归模型拟合y随x的变化:回归模型一:;回归模型二:,通过计算得出,;,,则下列说法正确的是( )
x 1 5 7 12 16 20
y 2 9 12 29 63 101
A.使用回归模型一拟合的决定系数大于使用回归模型二的决定系数
B.通过模型二得出的经验回归方程的预报效果好于通过模型一得出的经验回归方程
C.在首例病例出现后45天,该传染病感染人数很有可能在200人左右
D.在首例病例出现后45天,该传染病的感染人数很有可能超过10000人
10.下列命题中正确的是( )
A.若样本数据,,,的样本方差为3,则数据,,,的方差为7
B.经验回归方程为时,变量x和y负相关
C.对于随机事件A与B,,,若,则事件A与B相互独立
D.若,则取最大值时
11.下列各组的两个变量中呈正相关关系的是( )
A.学生的身高与学生的化学成绩
B.汽车行驶的里程与它的耗油量C.人的年龄与年收入
D.水果的重量与它的总价
三、填空题:本大题共 3 小题,每小题 5 分,共 15 分.
12.某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户 不是社交电商用户 合计
男性
女性
合计
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则n的最小值为________.
13.某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户 不是社交电商用户 合计
男性 8n 12n 20n
女性 12n 8n 20n
合计 20n 20n 40n
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则n的最小值为________.
14.用模型拟合一组数据组,其中.设,变换后的线性回归方程为,则__________.
四、解答题:本题共 5 小题,共 77 分. 解答应写出文字说明、证明过程或演算步骤.
15.学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的“自主学习”,包括预习,复习,归纳整理等等,现在人们普遍认为课后花的时间越多越好,某研究机构抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成绩(设为y)做出了以下统计数据,请根据表格回答问题:
x 60 70 80 90 100 110 120 130
y 92 109 114 120 119 121 121 122
(1)请根据所给数据绘制散点图,并且从以下三个函数从①;②:③三个函数中选择一个作为学习时间x和平均y的回归类型,判断哪个类型更加符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出y与x的回归方程;
(3)请根据此回归方程,阐述你对学习时长和成绩之间关系的看法.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,,
16.某医学研究团队经过研究初步得出检测某种疾病的患病与否和某项医学指标有关,利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性(患病),小于或等于c的人判定为阴性(未患病).此检测标准的漏诊率是将患病者判定为阴性的概率;误诊率是将未患病者判定为阳性的概率.
(1)随机抽取男女各500人进行检验,采用临界值进行判定时,误判共10人(漏诊与误诊之和),其中2男8女,写出列联表,依据小概率值的独立性检验,能否认为误判与性别有关?
(2)经过大量调查,得到如下的患病者和未患病者该指标的频率分布表:
指标
患病者频率 0.01 0.06 0.17 0.18 0.2 0.2 0.18
指标
未患病者频率 0.19 0.2 0.2 0.18 0.17 0.05 0.01
假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.若漏诊率和误诊率同时控制在以内(小于等于),求临界值c的范围;
(3)在(2)条件下,求出误判率(漏诊率与误诊率之和)最小时的临界值及对应的误诊率和漏诊率.
附:.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
17.在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动
(1)根据以上数据完成以下列联表;
休闲方式性别 看电视 运动 合计


合计
(2)能否有把握认为性别与休闲方式有关系?附:,其中
0.15 0.1 0.05 0.025 0.01 0.001
2.072 2.706 3.841 5.024 6.635 10.828
18.某研究性学习小组为研究两个变量x和y之间的关系,测量了对应的五组数据如下表:
x 2 3 4 5 6
y 4 7 12 13 14
(1)求y关于x的经验回归方程;
(2)请估计时,对应的y值.
附:在经验回归方程中,,,其中,为样本平均值.
19.跑步是一种方便的体育锻炼方法,坚持跑步可以增强体质,提高免疫力。某数学兴趣小组成员从某校大学生中随机抽取100人,调查他们是否喜欢跑步,得到的数据如表所示。
性别 跑步 合计
喜欢 不喜欢
男 40 20 60
女 15 25 40
合计 55 45 100
(1)依据的独立性检验,能否认为该校大学生是否喜欢跑步与性别有关?
(2)该数学兴趣小组成员为进一步调查该校大学生喜欢跑步的原因,采用分层抽样的方法从样本中喜欢跑步的大学生中随机抽取11人,再从这11人中随机抽取4人进行调查,记最后抽取的4人中,女大学生的人数为X,求X的分布列与数学期望。
参考公式:,其中.
参考数据;
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828
参考答案
1.答案:C
解析:零假设为:x与y独立,
由,依据的独立性检验,可得成立,
故可以认为x与y独立.
故选:C.
2.答案:B
解析:因为,结合表格可知,所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B.
3.答案:B
解析:由可知前9个点在直线上.
,
要使相关性最强,应更接近10,四个选项中11最接近10.
故选:B.
4.答案:B
解析:对于选项A,从数据看,y随x的增大而减小,所以变量y与x负相关,
故正确,A不符合题意;
对于选项B,由表中数据知,,
所以样本中心点为,将样本中心点代入中得,
所以线性回归方程为,
所以,残差,故错误,B符合题意;
对于选项C,当时销量约为(万只),故正确,C不符合题意;
对于选项D,由B选项可知,故正确,D不符合题意.
故选:B.
5.答案:C
解析:由统计图表中的数据,可得,
,即样本中心为,
因为两变量x,y的经验回归方程为,
则,解得
故选:C.
6.答案:A
解析:由题意可得,即修正前的样本中心点为,
假设甲输入的为,
则,则,
且,则,
则改为正确数据后,则,,
所以修正后的样本中心点为,
将点代入回归直线方程可得,解得.
故选:A.
7.答案:D
解析:根据回归方程可知变量x与y正相关,又变量y与z负相关,
由正相关、负相关的定义可知,x与z负相关
故选:D
8.答案:A
解析:由题意可知:,

所以样本中心为,
代入回归方程有:,
解得.
故选:A.
9.答案:BD
解析:根据散点图可知模型二的拟合效果更好,拟合效果越好决定系数越大,
所以使用回归模型一拟合的决定系数小于使用回归模型二的决定系数,
所以A错误,B正确;
因为模型二的的拟合效果好,预报更准确,根据已知:,
,,所以,将代入经验回归方程,
有,所以C错误,D正确.
故选:BD
10.答案:BC
解析:对于A,数据,,…,的方差为,所以A错误;
对于B,回归方程的直线斜率为负数,所以变量x与y呈负的线性相关关系,所以B正确;
对于C,由,得,所以事件A与事件B独立,所以C正确;
对于D,由,即,
解得或,所以D错误.
故选:BC.
11.答案:BD
解析:学生的身高与学生的化学成绩没有必然联系,故A错误;
汽车行驶的里程与它的耗油量,呈正相关关系,故B正确;
人的年龄与年收入没有必然联系,故C错误;
水果的重量与它的总价,呈正相关关系,故D正确
故选:BD
12.答案:3
解析:,
所以根据的独立性检验认为是不是社交电商用户与性别有关,则n的最小值为3.
故答案为:3.
13.答案:3
解析:,
所以根据的独立性检验认为是不是社交电商用户与性别有关,则n的最小值为3.
故答案为:3.
14.答案:6
解析:因为线性回归方程为恒过,
因为所以,
即,



故答案为:6.
15.答案:(1)散点图见解析,最合适
(2)
(3)答案见解析
解析:(1)散点图如图所示:
由图象可知最合适.
(2)对两边取以e为底的对数可得,
设,,则,
,
,,
故即,
.
(3)此回归方程为关于时间的增函数,说明随着学习时间的增加,学习成绩是提高的,但是函数的增速先快后慢,说明如果原来成绩较低,通过增加学习时间可以有效提高成绩,但是当成绩提高到120分左右时,想要通过延长学习时间来提高学习成绩就比较困难了,需要想别的办法.
16.答案:(1)列联表见解析;无关
(2)
(3);误诊率为,漏诊率为
解析:(1)依题意,列出列联表为:
误判人数 未误判人数 总计
男性人数 2 498 500
女性人数 8 492 500
总计 10 990 1000
由上表,,
故可以认为,依据小概率值的独立性检验,没有充分的证据证明零假设不成立,即认为误判与性别无关;
(2)因漏诊率小于等于,由频率分布表可知,临界值c应在内,
依题意,有;
又因误诊率小于等于,由频率分布表可知,临界值c应在内,
依题意,有.
综上,临界值c的范围为;
(3)由(2)已得,设误判率为,
当时,,
当时,,
所以当时,误判率最小,
相应的误诊率为,漏诊率为:.
17.答案:(1)答案见解析
(2)没有把握认为性别与休闲方式有关系
解析:(1)根据题意可得补全的联如下:
休闲方式性别 看电视 运动 合计
女 40 30 70
男 20 30 50
合计 60 60 120
(2)由(1)中列联表可得:,
没有把握认为性别与休闲方式有关系
18.答案:(1);
(2)
解析:(1),,

,所以回归方程为.
(2)时,.
19.答案:(1)能
(2)分布列见解析,
解析:(1)零假设为:该校大学生是否喜欢跑步与性别无关,
根据列联表中的数据,计算得到,
根据的独立性检验,我们推断不成立,
即认为该校大学生是否喜欢跑步与性别有关,此推断犯错误的概率不大于0.005.
(2)由题意可知抽取的男大学生有人,女大学生有人,
则随机变量X的所有可能取值为,
可得,,
,,
所以X的分布列为
X 0 1 2 3
P
所以期望为.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)