2021学年度高中数学选修2-3第三章统计案例双基精品试卷 统计案例(A)(含答案)

文档属性

名称 2021学年度高中数学选修2-3第三章统计案例双基精品试卷 统计案例(A)(含答案)
格式 docx
文件大小 3.8MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2021-03-23 11:56:17

图片预览

文档简介

-1123950339725此卷只装订不密封
班级 姓名 准考证号 考场号 座位号
此卷只装订不密封
班级 姓名 准考证号 考场号 座位号
2021学年度高中数学选修2-3第三章统计案例双基精品试卷
统计案例(A)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题:本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.散点图在回归分析过程中的作用是( )
A.查找个体数 B.比较个体数据大小关系
C.探究个体分类 D.粗略判断变量是否具有相关关系
2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析 C.独立性检验 D.概率
3.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
4.下面是一个2×2列联表,则表中,的值分别为( )
合计
21
73
2
25
27
合计
46
100
A.94,96 B.52,50 C.52,54 D.54,52
5.利用独立性检验来考查两个分类变量和是否有关系时,通过查阅下表来确定“和有关系”的可信度.如果,那么就有把握认为“和有关系”的百分比为( )
A. B. C. D.
6.如表是降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出关于的线性回归方程为,则表中的值为( )

A. B. C. D.
7.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )

A.线性相关关系较强,b的值为125 B.线性相关关系较强,b的值为083
C.线性相关关系较强,b的值为 D.线性相关关系太弱,无研究价值
8.某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为,相关系数为r.现给出以下3个结论:

①;
②直线l恰好过点D;
③.
其中正确结论是( )
A.①② B.①③ C.②③ D.①②③
9.某同学根据一组x,y的样本数据,求出线性回归方程和相关系数r,下列说法正确的是( )
A.y与x是函数关系
B.与x是函数关系
C.r只能大于0
D.越接近1,两个变量相关关系越弱
10.如图所示,5组数据中去掉后,下列说法错误的是( )

A.残差平方和变大
B.相关系数变大
C.相关指数变大
D.解释变量x与预报变量y的相关性变强
11.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;
③线性回归直线必过;
④曲线上的点与该点的坐标之间具有相关关系;
⑤在一个2×2列联表中,由计算得.则其两个变量间有关系的可能性是.
其中错误的个数是( )
A.1 B.2 C.3 D.4
12.有下列数据:
x
1
2
3
y
3
599
1201
下列四个函数中,模拟效果最好的为( )
A. B. C. D.

二、填空题:本大题共4小题,每小题5分.
13.某数学老师身高,他爷爷、父亲和儿子的身高分别是,和.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________.
14.为了解某班同学喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:

则在犯错误的概率不超过________前提下认为喜爱打篮球与性别有关(用百分数表示).
附:
P()
010
005
0025
0010
0005
0001
2706
3841
5024
6635
7879
10828
15.以下四个命题,其中正确的序号是__________.
①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;
②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;
③在线性回归方程中,当解释变量每增加一个单位时,预报变量平均增加02个单位;
④分类变量与,它们的随机变量的观测值为,当越小,“与有关系”的把握程度越大.
16.某品牌手机销售商今年1,2,3月份的销售量分别是1万部,12万部,13万部,为估计以后每个月的销售量,以这三个月的销售为依据,用一个函数模拟该品牌手机的销售量y(单位:万部)与月份x之间的关系,现从二次函数 或函数中选用一个效果好的函数行模拟,如果4月份的销售量为137万件,则5月份的销售量为__________万件.

三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查样本中有40名女生.下图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“嫦娥五号”的部分).
关注
没关注
合计


合计

(1)完成上面的2×2列联表,并计算回答是否有95%的把握认为“对‘嫦娥五号’关注程度与性别有关”?
(2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量X,求X的分布列及数学期望.
附:
,其中.
















18.(12分)宁夏西海固地区,在1972年被联合国粮食开发署确定为最不适宜人类生存的地区之一.为改善这一地区人民生活的贫困状态,上世纪90年代,党中央和自治区政府决定开始吊庄移民,将西海固地区的人口成批地迁移到更加适合生活的地区.为了帮助移民人口尽快脱贫,党中央作出推进东西部对口协作的战略部署,其中确定福建对口帮扶宁夏,在福建人民的帮助下,原西海固人民实现了快速脱贫,下表是对2016年以来近5年某移民村庄100位移民的年人均收入的统计:
年份
2016
2017
2018
2019
2020
年份代码
1
2
3
4
5
人均年收入(千元)
13
28
57
89
138
现要建立关于的回归方程,有两个不同回归模型可以选择,模型一;模型二,即使画出关于的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型一的方程为.
(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结果保留到小数点后一位);
(2)用计算残差平方和的方法比较哪个模型拟合效果更好,已经计算出模型一的残差平方和为.
附:参考数据:,其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计公式分别为,.
















19.(12分)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,其中表示年龄,表示脂肪含量,并计算得到,,,,,.
(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(的计算结果保留两位小数);
(2)科学健身能降低人体脂肪含量,下表是甲,乙两款健身器材的使用年限(整年)统计表:
使用年限
款式




合计
甲款
乙款
某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?
参考公式:相关系数;
对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为,.













20.(12分)机动车行经人行横道时,应当减速慢行:遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让行人”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
95
80
(1)请利用所给数据求违章人数与月份之间的回归直线方程;
(2)预测该路口9月份的不“礼让行人”违章驾驶员人数;
(3)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:
不礼让行人
礼让行人
驾龄不超过1年
24
16
驾龄1年以上
16
14
能否据此判断有975%的把握认为“礼让行人行为与驾龄有关?
参考公式:,.
(其中)















21.(12分)某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:
组别
年龄
A组统计结果
B组统计结果
经常使用单车
偶尔使用单车
经常使用单车
偶尔使用单车
27人
13人
40人
20人
23人
17人
35人
25人
20人
20人
35人
25人
参考公式:,其中.
参考数据:
(1)先用分层抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.
①求这60人中“年龄达到35岁且偶尔使用单车”的人数;
②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望;
(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?
经常使用单车
偶尔使用单车
合计
未达到25岁
达到25岁
合计
















22.(12分)某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,,得到相关数据如表所示:

(1)从①;②;③,三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出与的回归方程;
(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?(结果保留到万元)
参考数据:,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.






统计案例(A)答 案
一、选择题:本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.【答案】D
【解析】由于散点图在回归分析过程中的作用是粗略判断变量是否线性相关,
则D正确,故选D.
2.【答案】C
【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
3.【答案】A
【解析】若两个变量x和y之间具有正相关的线性关系,则,;
若两个变量x和y之间具有负相关的线性关系,则,,
所以与的符号相同,故选A.
4.【答案】C
【解析】由,得,由,得,故选C.
5.【答案】D
【解析】因为,而在观测值表中对应于的是,
,所以有的把握认为“和有关系”,故选D.
6.【答案】A
【解析】根据所给的表格可以求得,,
所以这组数据的样本中心点在线性回归直线上,
所以,所以,故选A.
7.【答案】B
【解析】散点图里变量的对应点分布在一条直线附近,且比较密集,
故可判断语文成绩和英语成绩之间具有较强的线性相关关系,
且直线斜率小于1,故选B.
8.【答案】A
【解析】对于①,结合图像知,从左到右各点是上升排列的,是正相关,,故①正确;
对于②,,,
,,
则直线过点,故②正确;
对于③,,
,故③错误,
综上所述:正确的有①②,故选A.
9.【答案】B
【解析】由两变量x,y具有线性相关关系,可知y与x不是函数关系,故A错误;
求出线性回归方程,其中与x是函数关系,故B正确;
相关系数可能大于0,也可能小于0,故C错误;
越接近1,两个变量相关关系越强,故D错误,
故选B.
10.【答案】A
【解析】由散点图知,去掉后,与的线性相关加强,且为正相关,
所以变大,变大,残差平方和变小,故选A.
11.【答案】C
【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;
对于②,一个回归方程,变量增加一个单位时,平均减小5个单位,故不正确;
对于③,线性回归直线必过样本中心点,故正确;
对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;
对于⑤,有一个2×2列联表中,由计算得,则其两个变量间有关系的可能性是,故不正确,
故选C.
12.【答案】A
【解析】当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,可知A模拟效果最好.故选A.

二、填空题:本大题共4小题,每小题5分.
13.【答案】185
【解析】设父亲身高为x cm,儿子身高为y cm,则
x
173
170
176
y
170
176
182
,,,

∴,
当时,.
14.【答案】05%
【解析】,
所以在犯错误的概率不超过05%的前提下认为喜爱打篮球与性别有关.
15.【答案】②③
【解析】①为系统抽样,①不正确;
④分类变量与,它们的随机变量的观测值为,当越小,“与有关系”的把握程度越小,④不正确;
根据相关系数的性质可知②正确;
由回归方程的性质可知③正确,
故答案为②③.
16.【答案】1375
【解析】由题意可得,当选用函数时,,解得,

当选用函数时,,解得,,
更接近于,选用函数拟合效果较好,
,月份的销售量为,故答案为.

三、解答题:本大题共6个大题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.【答案】(1)表格见解析,有95%的把握认为;(2)分布列见解析,.
【解析】(1)
关注
没关注
合计

30
30
60

12
28
40
合计
42
58
100

所以有95%的把握认为“对‘嫦娥五号’关注与性别有关”.
(2)因为随机选一高三女生,对此事关注的概率,
又因为,所以随机变量X的分布列为:
X
0
1
2
3
P
显然,.
18.【答案】(1);(2)模型二的拟合效果更好.
【解析】(1)令,则模型二可化为关于的线性回归问题,
则,,
则由参考数据可得,

则模型二的方程为.
(2)由模型二的回归方程可得,,
,,,

故模型二的拟合效果更好.
19.【答案】(1)答案见解析,;(2)该机构购买甲款健身器材更划算.
【解析】(1),,,
,,

因为与的相关系数接近,
所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合,
由题可得,

所以.
(2)以频率估计概率,设甲款健身器使用年限为(单位:年),

设乙款健身器使用年限为(单位:年),

因为,所以该机构购买甲款健身器材更划算.
20.【答案】(1);(2)46人;(3)没有975%的把握.
【解析】(1)由表中数据知,,,
所以,
所以,
故所求回归直线方程为.
(2)由(1)知,令,则人.
(3)提出假设:“礼让行人”行为与驾龄无关,
由表中数据得,
根据统计知,没有975%的把握认为“礼让行人行为与驾龄有关.
21.【答案】(1)①人;②分布列见解析,数学期望;(2)列联表见解析,在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”.
【解析】(1)①从300人中抽取60人,其中“年龄达到35岁”的有人,
再将这20人用分层抽样法按"是否经常使用单车"进行名额划分,
其中“年龄达到35岁且偶尔使用单车”的人数为人.
②A组这4人中得到礼品的人数X的可能取值为0,1,2,3,
相应概率为:,,
,.
故其分布列为
0
1
2
3
∴数学期望.
(2)时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表:
经常使用单车
偶尔使用单车
合计
未达到25岁
67
33
100
达到25岁
113
87
200
合计
180
120
300

∴.
所以在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”.
22.【答案】(1)选择回归类型更好;(2);(3)下一年应至少投入万元广告费用.
【解析】(1)由散点图知,年广告费用和年利润额的回归类型并不是直线型的,而是曲线型的,且与呈正相关,
所以选择回归类型更好.
(2)对两边取自然对数,得,
,,则,
由表中数据得,
所以,所以,
所以年广告费用和年利润额的回归方程为.
(3)由(2),知,令,得,得,
所以,所以(十万元).
故下一年应至少投入万元广告费用.