专题5 统计案例(基础篇,含解析)-2020-2021学年高二数学下学期专题复习卷(江苏专用)(Word含解析)

文档属性

名称 专题5 统计案例(基础篇,含解析)-2020-2021学年高二数学下学期专题复习卷(江苏专用)(Word含解析)
格式 zip
文件大小 789.8KB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2021-05-25 14:55:16

文档简介

2020-2021学年高二数学下学期统计案例章末检测卷(基础篇)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.已知两变量和的一组观测值如下表所示:如果两变量线性相关,且线性回归方程为,则(

2
3
4
5
4
6
A.
B.
C.
D.
2.若由一个列联表中的数据计算得,那么有(
)把握认为两个变量有关系.
A.
B.
C.
D.
3.已知变量x,y的关系可以用模型拟合,设,其变换后得到一组数据下:
16
17
18
19
50
34
41
31
由上表可得线性回归方程,则c=(  )
A.
B.
C.109
D.
4.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为(

附:参考公式和临界值表
0.050
0.010
0.001
3.841
6.635
10.828
A.90%
B.95%
C.99%
D.99.9%
5.校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是(

A.
B.
C.
D.
6.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有的男生喜欢网络课程,有的女生不喜欢网络课程,且有的把握但没有的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(

参考公式及数据:,其中.
A.130
B.190
C.240
D.250
7.2020年12月30日,国家药品监督管理局附条件批准国药集团中国生物北京生物制品研究所有限责任公司的新型冠状病毒灭活疫苗(细胞)注册申请.该疫苗是首家获批的国产新冠病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病().年月日,北京市人民政府新闻办公室召开疫情防控第场例行新闻发布会,表示不在岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄内和该年龄段外的人进行了临床试验,得到如下列联表:
能接种
不能接种
总计
岁内
岁外
总计
附:,其中;
参照附表,得到的正确结论是(

A.在犯错误的概率不超过的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”
C.有以上的把握认为“能接种与年龄段无关”
D.有以上的把握认为“能接种与年龄段有关”
8.由一组样本数据,,,,得到回归直线方程,那么下面说法不正确的是(

A.直线至少经过,,,中的一个点
B.直线必经过
C.直线的斜率为
D.直线的纵截距为
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表


合计
爱好拳击
35
22
57
不爱好拳击
15
28
43
合计
50
50
100
经计算得K2.之后又对被研究者的身高进行了统计,得到男?女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是(

P(K2≥k)
0.50
0.05
0.010
0.005
0.001
k
0.455
3.841
6.635
7.897
10.828
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
10.对两个变量,进行回归分析,得到组样本数据,,,,则下列说法正确的是(

A.由样本数据得到的回归直线方程必经过样本中心点
B.相关指数越大,残差的平方和越小,其模型的拟合效果越好
C.若线性回归方程为,当解释变量每增加个单位时,预报变量平均增加个单位
D.相关系数越接近,变量,相关性越强
11.以下结论正确的是(

A.根据列联表中的数据计算得出,而,则有99%的把握认为两个分类变量有关系
B.的值越大,两个事件的相关性就越大
C.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
D.在回归直线中,变量时,变量的值一定是15
12.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是(

A.当月在售二手房均价与月份代码呈负相关关系
B.由预测年月在售二手房均价约为万元/平方米
C.曲线与都经过点
D.模型回归曲线的拟合效果比模型的好
三、填空题:本题共4小题,每小题5分,共20分.
13.期中考试结束后,某教师随机抽取了本班五位同学的数学成绩进行统计,五位同学平均每天学习数学的时间(分钟)和数学成绩(分)之间的一组数据如下表所示:
时间
30
40
70
90
120
成绩
31
49
87
95
通过分析,发现数学成绩对学习数学的时间具有线性相关关系,其回归方程,则表格中的值是__________.
14.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知(

年轻人
非年轻人
总计
经常用流行用
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
参考公式:独立性检验统计量,其中.
下面的临界值表供参考:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
15.为促进就业,提升经济活力,2020年我国多个城市开始松绑“地摊经济”,市自大力发展“地摊经济”以来,夜市也火了起来,下表是市2020年月份代码与夜市的地摊摊位数(单位:万个)的统计数据:
月份
4月
5月
6月
7月
8月
月份代码
1
2
3
4
5
摊位数(万个)
290
330
440
480
若与线性相关,且求得其线性回归方程为,则表中的值为_________
16.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被新冠病毒感染
未被新冠病毒感染
总计
注射疫苗
10
50
未注射疫苗
30
总计
a
100
计算可知,在犯错误的概率最多不超过__________的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
参考公式及数据:,其中.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,(反比例函数模型可用转化为线性回归模型;指数函数模型可转化为和x的线性回归模型)现已求得用指数函数模型拟合的回归方程为,与x的相关系数;
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本.
参考数据:,,,,,,(其中,
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,相关系数
18.已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:
综合评价成绩(单位:分)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
5
10
15
10
5
5
赞成人数
4
8
12
4
3
1
(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?
综合评价成绩小于80分的人数
综合评价成绩不小于80分的人数
合计
赞成
不赞成
合计
(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.
参考公式:,其中.
参考数据:
P
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
19.经验表明,在室温下,开水冷至到(温水)饮用对身体更有益.某研究人员每隔测量一次开水温度(如下表),经过后的温度为.现给出以下2个函数模型:
①;②,
其中a为温度衰减比例,计算公式为.
开水温度变化
时间
0
1
2
3
4
5
水温
85
79
75
71
68
65
(1)请选择一个恰当的函数模型描述之间的关系,并求出k;
(2)求a值(a保留0.01);
(3)在室温下,开水至少大约放置多长时间(单位:,保留整数)才能冷至到对身体有益温度?(参考数据:,)
20.在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:
(1)估算该市电动自行车骑乘人员的平均年龄;
(2)根据所给的数据,完成下面的列联表:
是否佩戴头盔年龄


(3)根据(2)中的列联表,判断是否有把握认为遵守佩戴安全头盔与年龄有关?
附:,
0.050
0.010
0.001
3.841
6.635
10.828
21.
2020年春节前后,一场突如其来的新冠肺炎疫情在武汉出现并很快地传染开来(已有证据表明2019年10月、11月国外已经存在新冠肺炎病毒),人传人,传播快,传播广,病亡率高,对人类生命形成巨大危害.在中华人民共和国,在中共中央、国务院强有力的组织领导下,全国人民万众一心抗击、防控新冠肺炎,疫情早在3月底已经得到了非常好的控制(累计病亡人数3869人).然而,国外因国家体制、思想观念与中国的不同,防控不力,新冠肺炎疫情越来越严重.据美国约翰斯·霍普金斯大学每日下午6时公布的统计数据,选取5月6日至5月10日的美国的新冠肺炎病亡人数如下表(其中t表示时间变量,日期“5月6日”、“5月7日”对应于“t=6"、“t=7",依次下去),由下表求得累计病亡人数与时间的相关系数r=0.98.
(1)在5月6日~10日,美国新冠肺炎病亡人数与时间(日期)是否呈现线性相关性?
(2)选择对累计病亡人数四舍五入后个位、十位均为0的近似数,求每日累计病亡人数y随时间t变化的线性回归方程;
(3)请估计美国5月11日新冠肺炎病亡累计人数,请初步预测病亡人数达到9万的日期.
附:回归方程中斜率和截距最小二乘估计公式分别为
22.2021年,福建、河北、辽宁、江苏、湖北、湖南、广东、重庆8省市将迎来“”新高考模式.“3”指的是:语文、数学、英语,统一高考;“1”指的是:物理和历史,考生从中选一科;“2”指的是:化学、生物、地理和政治,考生从四种中选两种.为了迎接新高考,某中学调查了高一年级1500名学生的选科倾向,随机抽取了100人统计选考科目人数如下表:
选考物理
选考历史
共计
男生
40
50
女生
共计
30
(Ⅰ)补全列联表;
(Ⅱ)将此样本的频率视为总体的概率,随机调查了本校的3名学生.设这3人中选考历史的人数为,求的分布列及数学期望;
(Ⅲ)根据表中数据判断是否有的把握认为“选考物理与性别有关”?请说明理由.
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
参考公式:,其中.
【答案】(Ⅰ)答案见解析;(Ⅱ)分布列见解析,;(Ⅲ)有,理由见解析.
【解析】(Ⅰ)根据题意补全列联表,如下:
选考物理
选考历史
共计
男生
40
10
50
女生
30
20
50
共计
70
30
100
(Ⅱ)的所有可能取值为0,1,2,3,随机变量服从二项分布,
由题意,学生选考历史的概率为,
且,




的分布列为
0
1
2
3

(Ⅲ)由表中数据,计算的观测值,
参照附表知,有的把握认为“选考物理与性别有关”.2020-2021学年高二数学下学期统计案例章末检测卷(基础篇)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.已知两变量和的一组观测值如下表所示:如果两变量线性相关,且线性回归方程为,则(

2
3
4
5
4
6
A.
B.
C.
D.
【答案】D
【解析】把代入中,得,故选:D.
2.若由一个列联表中的数据计算得,那么有(
)把握认为两个变量有关系.
A.
B.
C.
D.
【答案】A
【解析】因为由列联表中的数据计算得,且4.013>3.841,
所以有95%的把握认为这两个变量有关系.故选:A
3.已知变量x,y的关系可以用模型拟合,设,其变换后得到一组数据下:
16
17
18
19
50
34
41
31
由上表可得线性回归方程,则c=(  )
A.
B.
C.109
D.
【答案】D
【解析】由表格数据知:.
由,得,则.
∴,
由,得,
∴,即.
故选:D.
4.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为(

附:参考公式和临界值表
0.050
0.010
0.001
3.841
6.635
10.828
A.90%
B.95%
C.99%
D.99.9%
【答案】C
【解析】由题意,得
所以有的把握认为其亲属的饮食习惯与年龄有关故选:C.
5.校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是(

A.
B.
C.
D.
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发芽率和温度的回归方程类型的是,故选:D.
6.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有的男生喜欢网络课程,有的女生不喜欢网络课程,且有的把握但没有的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(

参考公式及数据:,其中.
A.130
B.190
C.240
D.250
【答案】B
【解析】依题意,设男、女生的人数各为,建立列联表如下所示:
喜欢网络课程
不喜欢网络课程
总计
男生
女生
总计
故,由题可知,
所以,只有B符合题意.
故选:B.
7.2020年12月30日,国家药品监督管理局附条件批准国药集团中国生物北京生物制品研究所有限责任公司的新型冠状病毒灭活疫苗(细胞)注册申请.该疫苗是首家获批的国产新冠病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病().年月日,北京市人民政府新闻办公室召开疫情防控第场例行新闻发布会,表示不在岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄内和该年龄段外的人进行了临床试验,得到如下列联表:
能接种
不能接种
总计
岁内
岁外
总计
附:,其中;
参照附表,得到的正确结论是(

A.在犯错误的概率不超过的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”
C.有以上的把握认为“能接种与年龄段无关”
D.有以上的把握认为“能接种与年龄段有关”
【答案】D
【解析】由列联表可得

所以在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”
即有以上的把握认为“能接种与年龄段有关
故选:D
8.由一组样本数据,,,,得到回归直线方程,那么下面说法不正确的是(

A.直线至少经过,,,中的一个点
B.直线必经过
C.直线的斜率为
D.直线的纵截距为
【答案】A
【解析】线性回归直线不一定经过样本数据中的一个点,这是最能体现这组数据的变化趋势的直线,但并不一定在直线上,故A不正确;
线性回归直线一定经过样本中心点,故B正确;
根据最小二乘法知C正确;
根据线性回归直线的意义知D正确,故选:A.
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表


合计
爱好拳击
35
22
57
不爱好拳击
15
28
43
合计
50
50
100
经计算得K2.之后又对被研究者的身高进行了统计,得到男?女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是(

P(K2≥k)
0.50
0.05
0.010
0.005
0.001
k
0.455
3.841
6.635
7.897
10.828
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
【答案】AD
【解】对于A,∵K2≈6.895>6.635,∴在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”,正确;
对于B,题干中使用样本估计总体,若单独选一个100人的男生样本,可以没有一个人爱好打拳击,故B错,
对于C,男生身高服从正态分布N(175,16),,标准差,C错;
对于D,女生身高服从正态分布N(164,9),,标准差,D正确;
故选:AD.
10.对两个变量,进行回归分析,得到组样本数据,,,,则下列说法正确的是(

A.由样本数据得到的回归直线方程必经过样本中心点
B.相关指数越大,残差的平方和越小,其模型的拟合效果越好
C.若线性回归方程为,当解释变量每增加个单位时,预报变量平均增加个单位
D.相关系数越接近,变量,相关性越强
【答案】ABC
【解析】由定义知回归直线方程必经过样本中心点,故A正确;
由相关指数的定义知,越大模型拟合效果越好,由残差的平方和定义知,残差的平方和越小模型的拟合效果越好,故B正确;
C选项是回归直线方程的应用,故C正确;
相关系数的范围为,由定义知越接近,变量,相关性越强,故D错误.
故选:ABC
11.以下结论正确的是(

A.根据列联表中的数据计算得出,而,则有99%的把握认为两个分类变量有关系
B.的值越大,两个事件的相关性就越大
C.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
D.在回归直线中,变量时,变量的值一定是15
【答案】ABC
【解析】对于A,,故有99%的把握认为两个分类变量有关系,即A正确:对于B,越大,“与有关系”可信程度越大,相关性就越大,即B正确;
对于C,在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即C正确;
对于D,当回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故D错误.
故选:ABC.
12.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是(

A.当月在售二手房均价与月份代码呈负相关关系
B.由预测年月在售二手房均价约为万元/平方米
C.曲线与都经过点
D.模型回归曲线的拟合效果比模型的好
【答案】BD
【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;
对于B,令,由,
所以可以预测2021年2月在售二手房均价约为1.05091.0509万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过
,故C错误;
对于D,越大,拟合效果越好,由,故D正确.
故选:BD
三、填空题:本题共4小题,每小题5分,共20分.
13.期中考试结束后,某教师随机抽取了本班五位同学的数学成绩进行统计,五位同学平均每天学习数学的时间(分钟)和数学成绩(分)之间的一组数据如下表所示:
时间
30
40
70
90
120
成绩
31
49
87
95
通过分析,发现数学成绩对学习数学的时间具有线性相关关系,其回归方程,则表格中的值是__________.
【答案】63
【解析】由图表可得,所以,
则,即.故答案为:63
14.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知(

年轻人
非年轻人
总计
经常用流行用
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
参考公式:独立性检验统计量,其中.
下面的临界值表供参考:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
【答案】95%
【解析】,
根据临界值知有95%的把握认为经常用流行语与年轻人有关系,
故答案为:95%
15.为促进就业,提升经济活力,2020年我国多个城市开始松绑“地摊经济”,市自大力发展“地摊经济”以来,夜市也火了起来,下表是市2020年月份代码与夜市的地摊摊位数(单位:万个)的统计数据:
月份
4月
5月
6月
7月
8月
月份代码
1
2
3
4
5
摊位数(万个)
290
330
440
480
若与线性相关,且求得其线性回归方程为,则表中的值为_________
【答案】360
【解析】由题意,根据表格中的数据,可得,
代入,可得,
又由,解得.故答案为:360.
16.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被新冠病毒感染
未被新冠病毒感染
总计
注射疫苗
10
50
未注射疫苗
30
总计
a
100
计算可知,在犯错误的概率最多不超过__________的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
参考公式及数据:,其中.
【答案】30
【解析】完善列联表如下:
被新冠病毒感染
未被新冠病毒感染
总计
注射疫苗
10
40
50
未注射疫苗
20
30
50
总计
30
70
100
所以,
因为,
又,
所以在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.
故答案为:30;
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,(反比例函数模型可用转化为线性回归模型;指数函数模型可转化为和x的线性回归模型)现已求得用指数函数模型拟合的回归方程为,与x的相关系数;
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本.
参考数据:,,,,,,(其中,
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,相关系数
【答案】(1);(2)用反比例函数模型拟合效果更好,估计为21元.
【解析】(1)令,则可转化为,
因为,所以,
则,所以
所以y关于x的回归方程为;
(2)y与的相关系数为

因为,所以用反比例函数模型拟合效果更好,
把代入回归方程:,(元).
所以当产量为10千件时,每件产品的非原料成本估计为21元.
18.已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:
综合评价成绩(单位:分)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
5
10
15
10
5
5
赞成人数
4
8
12
4
3
1
(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?
综合评价成绩小于80分的人数
综合评价成绩不小于80分的人数
合计
赞成
不赞成
合计
(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.
参考公式:,其中.
参考数据:
P
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
【答案】(1)表格见解析,不能;(2).
【解析】(1)
综合评价成绩小于80分的人数
综合评价成绩不小于80分的人数
合计
赞成
28
4
32
不赞成
12
6
18
合计
40
10
50
做个皮尔逊卡方检验的话,有
故此不能推翻零假设,不能认定成绩和态度有关.
(2)这样分层抽样,会在里面抽6个,里面抽4个,
设为没有人在[60,70)内的事件,则概率即为
.
19.经验表明,在室温下,开水冷至到(温水)饮用对身体更有益.某研究人员每隔测量一次开水温度(如下表),经过后的温度为.现给出以下2个函数模型:
①;②,
其中a为温度衰减比例,计算公式为.
开水温度变化
时间
0
1
2
3
4
5
水温
85
79
75
71
68
65
(1)请选择一个恰当的函数模型描述之间的关系,并求出k;
(2)求a值(a保留0.01);
(3)在室温下,开水至少大约放置多长时间(单位:,保留整数)才能冷至到对身体有益温度?(参考数据:,)
【答案】(1)应该选择②,k的值为60;(2);(3).
【解析】(1)若选择①,把代入得矛盾;若选择②,把代入,得.
所以选择②,其中k的值为60.
(2)
(3)由(1)(2)知,x、y之间的关系为,
因为开水冷至到
(温水)饮用对身体更有益,
所以,有,即,
又,得,
所以在室温下,开水至少大约放置才能冷至到对身体有益温度.
20.在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:
(1)估算该市电动自行车骑乘人员的平均年龄;
(2)根据所给的数据,完成下面的列联表:
是否佩戴头盔年龄


(3)根据(2)中的列联表,判断是否有把握认为遵守佩戴安全头盔与年龄有关?
附:,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)39;(2)列联表见解析;(3)没有把握.
【解析】(1)该市电动自行车骑行人员平均年龄为
.
(2)
是否佩戴头盔年龄


540
60
340
60
(3).
故而没有的把握认为遵守佩戴安全头盔与年龄有关.
21.
2020年春节前后,一场突如其来的新冠肺炎疫情在武汉出现并很快地传染开来(已有证据表明2019年10月、11月国外已经存在新冠肺炎病毒),人传人,传播快,传播广,病亡率高,对人类生命形成巨大危害.在中华人民共和国,在中共中央、国务院强有力的组织领导下,全国人民万众一心抗击、防控新冠肺炎,疫情早在3月底已经得到了非常好的控制(累计病亡人数3869人).然而,国外因国家体制、思想观念与中国的不同,防控不力,新冠肺炎疫情越来越严重.据美国约翰斯·霍普金斯大学每日下午6时公布的统计数据,选取5月6日至5月10日的美国的新冠肺炎病亡人数如下表(其中t表示时间变量,日期“5月6日”、“5月7日”对应于“t=6"、“t=7",依次下去),由下表求得累计病亡人数与时间的相关系数r=0.98.
(1)在5月6日~10日,美国新冠肺炎病亡人数与时间(日期)是否呈现线性相关性?
(2)选择对累计病亡人数四舍五入后个位、十位均为0的近似数,求每日累计病亡人数y随时间t变化的线性回归方程;
(3)请估计美国5月11日新冠肺炎病亡累计人数,请初步预测病亡人数达到9万的日期.
附:回归方程中斜率和截距最小二乘估计公式分别为
【答案】(1)是;(2);(3)82160人,5月16日
【解析】(1)每日累计病亡人数与时间的相关系数,
所以每日病亡累计人数与时间呈现强线性相关性,
(2)5天5个时间的均值.
5天5个病亡累计人数的均值.
计算5个时间与其均值的差,计算5个累计病亡人数与其均值的差,制作下表:


5月6日
5月7日
5月8日
5月9日
5月10日
均值
时间
6
7
8
9
10
新冠肺炎累计病亡人数
72300
75500
76900
78500
80000
?2
?1
0
1
2
?4340
?1140
260
1860
3360
用公式进行计算:


所以每日累计病亡人数随时间变化的线性回归方程是.
(3)日期5月11日对应时间,,
所以,估计5月11日累计病亡人数是82160.
令,解得,
病亡人数要达到或超过9万,即,对应于5月16日,
因此预测5月16日美国新冠肺炎病亡人数超过9万人.
22.2021年,福建、河北、辽宁、江苏、湖北、湖南、广东、重庆8省市将迎来“”新高考模式.“3”指的是:语文、数学、英语,统一高考;“1”指的是:物理和历史,考生从中选一科;“2”指的是:化学、生物、地理和政治,考生从四种中选两种.为了迎接新高考,某中学调查了高一年级1500名学生的选科倾向,随机抽取了100人统计选考科目人数如下表:
选考物理
选考历史
共计
男生
40
50
女生
共计
30
(Ⅰ)补全列联表;
(Ⅱ)将此样本的频率视为总体的概率,随机调查了本校的3名学生.设这3人中选考历史的人数为,求的分布列及数学期望;
(Ⅲ)根据表中数据判断是否有的把握认为“选考物理与性别有关”?请说明理由.
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
参考公式:,其中.
【答案】(Ⅰ)答案见解析;(Ⅱ)分布列见解析,;(Ⅲ)有,理由见解析.
【解析】(Ⅰ)根据题意补全列联表,如下:
选考物理
选考历史
共计
男生
40
10
50
女生
30
20
50
共计
70
30
100
(Ⅱ)的所有可能取值为0,1,2,3,随机变量服从二项分布,
由题意,学生选考历史的概率为,
且,




的分布列为
0
1
2
3

(Ⅲ)由表中数据,计算的观测值,
参照附表知,有的把握认为“选考物理与性别有关”.