-1123950339725此卷只装订不密封
班级 姓名 准考证号 考场号 座位号
此卷只装订不密封
班级 姓名 准考证号 考场号 座位号
2020-2021学年度高中数学单元双基精品试卷
选修1-2第一章统计案例 (B)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题:本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下列关于回归分析的说法中错误的是( )
A.回归直线一定过样本中心
B.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适
C.甲、乙两个模型的分别约为和,则模型乙的拟合效果更好
D.两个模型中残差平方和越小的模型拟合的效果越好
2.在一组样本数据为,,,(,,,,,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的相关系数为( )
A. B. C.1 D.
3.某机构为了解某地区中学生在校月消费情况,随机抽取了名中学生进行调查,将月消费金额不低于元的学生成为“高消费群”,调查结果如表所示:参照公式,得到的正确结论是( )
高消费群
非高消费群
合计
男
15
35
50
女
10
40
50
合计
25
75
100
参考公式:,其中.
A.有以上的把握认为“高消费群”与性别有关
B.没有以上的把握认为“高消费群”与性别有关
C.在犯错误的概率不超过的前提下,认为“高消费群”与性别无关
D.在犯错误的概率不超过的前提下,认为“高消费群”与性别有关
4.对两个变量、进行线性相关检验,得线性相关系数,对两个变量、进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
5.现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男?女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
6.下面的散点图与相关系数一定不符合的是( )
A.①②③ B.①②④ C.①③④ D.②③④
7.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程是,则( )
月份
1
2
3
4
用水量
45
4
3
25
A. B. C. D.
8.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量(分钟),这个区间上的人数为(人),易见两变量,线性相关,那么一定在其线性回归直线上的点为( )
A. B. C. D.
9.有一散点图如图所示,在5个数据中去掉后,下列说法正确的是( )
A.残差平方和变小
B.方差变大
C.相关指数变小
D.解释变量与预报变量的相关性变弱
10.假设有两个变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
11.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价与月份代码呈正相关关系
B.根据可以预测年月在售二手房均价约为万元/平方米
C.曲线与的图形经过点
D.回归曲线的拟合效果好于的拟合效果
12.已知变量关于变量的回归方程为,其一组数据如下表所示:
1
2
3
4
若,则( )
A.5 B.6 C.7 D.8
二、填空题:本大题共4小题,每小题5分.
13.给出下列命题:
①线性相关系数越大,两个变量的线性相关越强;反之,线性相关性越弱;
②由变量和的数据得到其回归直线方程:,则一定经过;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位.
其中真命题的序号是___________.
14.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为,数据列表是:
则其中的数据__________.
15.关于变量的一组样本数据,,……,(,不全相等)的散点图中,若所有样本点()恰好都在直线上,则根据这组样本数据推断的变量的相关系数为_____________.
16.某品牌手机销售商今年1,2,3月份的销售量分别是1万部,12万部,13万部,为估计以后每个月的销售量,以这三个月的销售为依据,用一个函数模拟该品牌手机的销售量y(单位:万部)与月份x之间的关系,现从二次函数或函数中选用一个效果好的函数行模拟,如果4月份的销售量为万件,则5月份的销售量为__________万件.
三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)如图是我国2014年至2020年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1﹣7分别对应年份2014﹣2020.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到),预测2022年我国生活垃圾无害化处理量.
附注:
参考数据:,,,.
参考公式:相关系数,
回归方程中斜率和截距的最小二乘估计公式分别为,.
18.(12分)某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了100名学生的体检表,并得到如图1的频率分布直方图.
(1)若直方图中后四组的频数成等差数列,计算高三全体学生视力在以下的人数,并估计这100名学生视力的中位数(精确到);
(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对高三全体学生成绩名次在前50名和后50名的学生进行了调查,得到如表1中数据,根据表1及临界值表2中的数据,能否在犯错的概率不超过的前提下认为视力与学习成绩有关系?
附:临界值表2
(参考公式:,其中
19.(12分)国家逐步推行全新的高考制度.未来新高考不再分文、理科,采用模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层随机抽样的方法从中抽取名学生进行调查.
(1)已知抽取的名学生中女生有45人,求的值;
(2)学校计划在高一上学期开设选修中的物理和地理两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到的名学生进行问卷调查(假设每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的列联表.请将列联表补充完整,并判断是否有的把握认为选择科目与性别有关,说明理由;
(3)在抽取的选择地理的学生中用分层抽样的方法再抽取6名学生,然后从这6名学生中抽取2名学生了解学生对地理的选课意向情况,求这2名学生中至少有1名男生的概率.
选择物理
选择地理
总计
男生
45
女生
20
总计
参考数据及公式:
,其中.
20.(12分)年月日既是中华人民共和国第个国庆日,又是农历中秋节,双节同庆,很多人通过短视频或微信、微博表达了对祖国的祝福.某调查机构为了解通过短视频或微信、微博表达对祖国祝福的人们是否存在年龄差异,通过不同途径调查了数千个通过短视频或微信、微博表达对祖国祝福的人,并从参与者中随机选出人,经统计这人中通过微信或微博表达对祖国祝福的有人.将这人按年龄分组:第组,第组,第组,第组,第组,得到的频率分布直方图如图所示:
(1)求的值并估计这人的平均年龄;
(2)把年龄在第,,组的居民称为青少年组,年龄在第,组的居民称为中老年组,选出的人中通过短视频表达对祖国祝福的中老年人有人,问是否有的把握认为是否通过微信或微博表达对祖国的祝福与年龄有关?
附:
.
21.(12分)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量,的数据如下:
东部城市A
东部城市B
东部城市C
西部城市D
西部城市E
40
50
60
20
30
110
180
210
30
70
(1)已知销售量和销售量大致满足线性相关关系,求出关于的线性回归方程;
(2)根据上述数据计算是否有99%的把握认为东、西部的地区差异与甲、乙两种产品的销售量相关.
参考公式:,;
,其中.
临界值表:
015
001
005
0025
0010
0005
0001
2072
2076
3841
5024
6635
7879
10828
22.(12分)年月日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:
月份累计
月
月
月
月
月
月
月
月
月
月
月份累计代码
营业收入利润率
(1)根据表中有关数据请在下图中补充完整与的折线图,判断与,哪一个更适宜作为关于的回归方程类型,并说明理由;
(2)根据(1)的判断结果及表中数据,建立关于的回归方程(系数精确到);
(3)根据(2)得出的回归方程,预测月月累计营业收入利润率的值为多少?
参考公式:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.
参考数据:
表中,,.
统计案例(B)答 案
一、选择题:本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.【答案】C
【解析】对于A选项,回归直线一定过样本中心,A选项正确;
对于B选项,残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,B选项正确;
对于C选项,甲、乙两个模型的分别约为和,则模型甲的拟合效果更好,C选项错误;
对于D选项,两个模型中残差平方和越小的模型拟合的效果越好,D选项正确,
故选C.
2.【答案】D
【解析】根据回归直线方程是,
可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,
且所有样本点都在直线上,则有|r|=1,
∴相关系数,故选D.
3.【答案】B
【解析】根据列联表:
高消费群
非高消费群
合计
男
15
35
50
女
10
40
50
合计
25
75
100
利用公式,
可得,
所以没有的把握认为“高消费群”与性别有关,故选B.
4.【答案】C
【解析】由线性相关系数,知与正相关;
由线性相关系数,知与负相关,
又,所以,变量与的线性相关性比与的线性相关性强,故选C.
5.【答案】D
【解析】由条形图知女生数量多于男生数量,故A正确;
有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;
女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误,
故选D.
6.【答案】C
【解析】①中,由散点图可得,两相关变量呈负相关,故①错;
②中,由散点图可得,两相关变量呈正相关,且相关系数可能是;
③中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故③错;
④中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故④错,
故选C.
7.【答案】B
【解析】由题意知:,,
将代入线性回归方程,
即,解得.
故选B.
8.【答案】C
【解析】由频率分布直方图可知,第一个区间中点坐标,,;
第二个区间中点坐标,,;
第三个区间中点坐标,,;
第四个区间中点坐标,,,
则,,
则一定在其线性回归直线上的点为,故选C.
9.【答案】A
【解析】由散点图可知,去掉后,与的线性相关性加强,且为正相关,
所以变大,变大,残差平方和变小,故选A.
10.【答案】B
【解析】根据观测值求解的公式可以知道,
当ad与bc差距越大,两个变量有关的可能性就越大,
检验四个选项中所给的ad与bc的差距:
;
;
;
,
显然B中最大,故答案为B.
11.【答案】C
【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正相关关系,故A正确;
对于B,令,由,
所以可以预测年月在售二手房均价约为万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过,故C错误;
对于D,越大,拟合效果越好,故D正确,
故选C.
12.【答案】B
【解析】由,得,令,则,
由题意,,,
因为满足,
所以,解得,
所以,
所以,令,解得.
故选B.
二、填空题:本大题共4小题,每小题5分.
13.【答案】②④⑤
【解析】线性相关系数为,当越接近1时,两个变量的线性相关越强;当越接近0时,两个变量的线性相关越弱,①错;
由变量和的数据得到其回归直线方程:,则一定经过,②正确;
每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,③错;
相关指数用来刻画回归的效果,其计算公式是,在含有一个解释变量的线性模型中,恰好等于相关系数的平方.
显然,取值越大,意味着残差平方和越小,也就是模型的拟合效果越好,④正确;
在回归直线方程表示解释变量每增加一个单位时,预报变量增加个单位,⑤正确,
故填②④⑤.
14.【答案】163
【解析】由,
根据回归直线经过样本中心,即,得,
由,得,
故答案为.
15.【答案】
【解析】所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为,故填.
16.【答案】
【解析】由题意可得,当选用函数时,
,解得,
,;
当选用函数时,,解得,
,,
更接近于,选用函数拟合效果较好,
,月份的销售量为,故答案为.
三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.【答案】(1)详见解析;(2),亿吨.
【解析】(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:
因为,,,,
所以
,
∵,故y与t之间存在较强的正相关关系.
(2)由(1),结合题中数据可得,,
,
∴y关于t的回归方程,
2022年对应的t值为9,故,
预测2022年我国生活垃圾无害化处理量为亿吨.
18.【答案】(1)820,;(2)不能在犯错的概率不超过的前提下认为视力与学习成绩有关系.
【解析】(1)设各组的频率为,
由图可知,第一组有3人,第二组7人,第三组27人,
因为后四组的频数成等差数列,所以后四组频数依次为,,,,
则后四组频率依次为,,,,
视力在以下的频率为人,
故全年级视力在以下的人数约为人.
设100名学生视力的中位数为,
则有,.
(2),
因此在犯错误的概率不超过的前提下认为视力与学习成绩没有关系.
19.【答案】(1);(2)列联表见解析,有的把握认为选择科目与性别有关;理由见解析;(3).
【解析】(1)由题意得,解得.
(2)列联表如下:
选择物理
选择地理
总计
男生
45
10
55
女生
25
20
45
总计
70
30
100
,
所以有的把握认为选择科目与性别有关.
(3)从30名选择地理的学生中用分层随机抽样的方法抽取6名学生,
则这6名学生中有2名男生,4名女生,
设男生编号为1、2,女生编号为、、、,从6名学生中抽取2名学生,
所有可能的结果为,
共15种可能的结果,
至少有一名男生的结果为,共9种可能的结果,
所以2名学生中至少有1名男生的概率.
20.【答案】(1),;(2)是有的把握认为.
【解析】(1)由,得.
这人的平均年龄为
.
(2)前组人数为,
由题意得列联表:
通过短视频表达祝福
通过微信或微博表达祝福
合计
青少年
中老年
合计
,
所以是有的把握认为通过微信或微博表达对祖国的祝福与年龄有关.
21.【答案】(1);(2)列联表见解析,有99%的把握认为东、西部的地区差异与甲、乙两种产品的销售量相关.
【解析】(1),,
,
,
得到线性回归方程为.
(2)作出列联表如下:
东部城市
西部城市
总计
甲
150
50
200
乙
500
100
600
总计
650
150
800
计算得,
所以有99%的把握认为东、西部的地区差异与甲、乙两种产品的销售量相关.
22.【答案】(1)折线图见解析,更适宜,理由见解析;(2);(3).
【解析】(1)补充完整的折线图如下,可知选用更适宜.
理由:根据折线图知折线的形状更接近的图象.
(2)令,先建立关于的线性回归方程.
,
,
关于的线性归方程为,
关于的回归方程为.
(3)由(2)可知,当时,,
因此,预测月月累计营业收入利润率的值为.