第三章 统计案例 章末检测(含详解)

文档属性

名称 第三章 统计案例 章末检测(含详解)
格式 zip
文件大小 1.7MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2020-12-11 16:54:56

图片预览

文档简介

中小学教育资源及组卷应用平台
人教新课标A版
选修2-3
第三章统计案例
一、单选题(本大题共12小题,每小题3分,共36分)
1.已知呈线性相关的变量x与y的部分数据如表所示:
x
2
4
5
6
8
y
3
4.5
m
7.5
9
若其回归直线方程是
,则m=(???

A.?5.5??????????????????????????????????????????B.?6??????????????????????????????????????????C.?6.5??????????????????????????????????????????D.?7
2.两个线性相关变量

的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是
,则相对应于点
的残差为(???

A.?0.1????????????????????????????????????????B.?0.4????????????????????????????????????????C.?0.3????????????????????????????????????????D.?0.2
3.下列说法中不正确的是(???

A.?独立性检验是检验两个分类变量是否有关的一种统计方法
B.?独立性检验得到的结论一定是正确的
C.?独立性检验的样本不同,其结论可能不同
D.?独立性检验的基本思想是带有概率性质的反证法
4.已知一组样本数据点
,用最小二乘法求得其线性回归方程为
.若
的平均数为1,则
(???

A.?10?????????????????????????????????????????B.?11?????????????????????????????????????????C.?12?????????????????????????????????????????D.?13
5.为研究某地区中学生的性别与阅读量的关系,运用
列联表进行独立性检验,经计算
,则所得的结论是:有______把握认为“该地区中学生的性别与阅读量有关系”(
??)
附表:
0.10
0.025
0.01
0.001
2.706
5.024
6.635
10.828
A.?0.1%????????????????????????????????????B.?1%????????????????????????????????????C.?99%????????????????????????????????????D.?99.9%
6.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
70
根据表提供的数据,求得y关于x的线性回归方程为
,由于表中有一个数据模糊看不清,请你推断出该数据的值为(???

A.?45?????????????????????????????????????????B.?55?????????????????????????????????????????C.?50?????????????????????????????????????????D.?60
7.某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.
河流水位表(1)


第1日
第2日
第3日
第4日
第5日
第6日
第7日
水位
(米)
3.5
3.7
3.8
3.9
4.3
4.4
4.8
而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.
水位预警分级表(2)
水位
水位分类
设防水位
警戒水位
保证水位
预警颜色
黄色
橙色
红色
现已根据上表得到水位
的回归直线方程为
,据上表估计(???
).
A.?第8日将要启动洪水橙色预警??????????????????????????????B.?第10日将要启动洪水红色预警
C.?第11日将要启动洪水红色预警????????????????????????????D.?第12日将要启动洪水红色预警
8.Logistic模型是常用数学模型之一,可应用于流行病学领城.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数I(t)(t的单位:天)的Logistic模型:
,其中K为最大确诊病例数.当I(
)=0.95K时,标志着已初步遏制疫情,则
约为(???
)(ln19≈3)
A.?60?????????????????????????????????????????B.?63?????????????????????????????????????????C.?66?????????????????????????????????????????D.?69
9.调查某市出租车使用年限
和该年支出维修费用
(万元),得到数据如下:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
则线性回归方程是(???

??????????
B.??????????
C.??????????
D.?
10.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据
得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(???

A.???????????????????????B.???????????????????????C.???????????????????????D.?
11.下列说法错误的是(???

A.?回归直线始终过样本点(
x1

y1
),(
x2

y2
),…,(
xn

yn

的中心(

B.?若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0
C.?在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.?在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
12.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,
得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计105
已知在全部105人中随机抽取1人,成绩优秀的概率为
,则下列说法正确的是(???

参考公式:
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
A.?列联表中c的值为30,b的值为35
B.?列联表中c的值为15,b的值为50
C.?根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.?根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
二、多选题(本大题共2小题,每小题3分,共6分)
13.为了对变量

的线性相关性进行检验,由样本点



求得两个变量的样本相关系数为
,那么下面说法中错误的有(???

A.?若所有样本点都在直线
上,则
B.?若所有样本点都在直线
上,则
C.?若
越大,则变量

的线性相关性越强
D.?若
越小,则变量

的线性相关性越强
14.在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价
元和销售量
件之间的一组数据如表所示:
价格
9
9.5
10
10.5
11
销售量
11
10
8
6
5
根据公式计算得相关系数
,其线性回归直线方程是:
,
则下列说法正确的有(???
)
参考:
?有
的把握认为变量
具有线性相关关系????
?回归直线恒过定点
C.??
?当
时,
的估计值为12.8
三、填空题(本大题共4小题,每小题3分,共12分)
15.具有线性相关关系的变量

,满足一组数据如下表所示:


的回归直线
,则
的值是________.
0
1
2
3
-1
1
8
16.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过该血清的人与另外500名未使用该血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”.已知利用2×2列联表得K2≈3.918,查临界值表知P(K2≥3.841)≈0.05.下列结论正确的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
17.①回归分析中,相关指数
的值越大,说明残差平方和越大;
②对于相关系数

越接近1,相关程度越大,
越接近0,相关程度越小;
③有一组样本数据
得到的回归直线方程为

那么直线
必经过点


是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;
以上几种说法正确的序号是________.
18.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取
只小鼠进行试验,得到如下联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参照附表,在犯错误的概率最多不超过________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.
四、解答题(本大题共6小题,共66分)
19.(本小题10分)
江苏省新高考方案要求考生在物理、历史科目中选择一科,我市在对某校高一年级学生的选科意愿调查中,共调查了100名学生,其中男、女生各50人,男生中选历史15人,女生中选物理10人.
附:
.
0.010
0.005
0.001
6.635
7.879
10.828
(1)请根据以上数据建立一个
列联表;
(2)判断性别与选科是否相关.
20.(本小题10分)
某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得
.
x
1
2
3
4
5
y
4
m
10
23
22
参考公式:

(1)若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程

(2)预测该星期最后一天参加该活动的人数(按四舍五入取到整数).
21.(本小题10分)
这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期
和全国累计报告确诊病例数量
(单位:万人)之间的关系如下表:
日期
1
2
3
4
5
6
7
确诊病例数量
(万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
参考数据如下表:
1.92
16.9
77.5
35.17
表中


.
参考公式:对于一组数据

,…,
其回归方程
中斜率和截距的最小二乘估计公式分别为:①
,②
.
(1)根据表中的数据,

哪一个适宜作为确诊病例数量
关于日期
的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立
关于
的回归方程;(精确到0.01)
(3)预测2月16日全国累计报告确诊病例数.
22.(本小题12分)
《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.
参考公式:

(1)若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;
(2)该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间
(单位:小时)与年龄
(单位:岁),并制作了对照表(如下表所示):
年龄
20
30
40
50
每周学习诗词的平均时间
3
3.5
3.5
4
由表中数据分析,

呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.
(本小题12分)
某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
参考公式用最小二乘法求线性回归方程系数公式:

.
(1)画出散点图;
(2)求y关于x的线性回归方程.
(3)如果广告费支出为一千万元,预测销售额大约为多少百万元?
24.(本小题12分)
一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间
(分钟)和答对人数
的统计表格如下:
时间
(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
时间
与答对人数
的散点图如图:
附:




,对于一组数据

,……,
,其回归直线
的斜率和截距的最小二乘估计分别为:

.请根据表格数据回答下列问题:
(1)根据散点图判断,

,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住
的内容,至多间隔多少分钟重新记忆一遍.(参考数据:


答案解析部分
一、单选题
1.答案:
C
解:由题意可得



,解得
.
故答案为:C.
【分析】先求出

,再根据回归方程过样本中心,可求出参数
的值.
2.答案:
D
解:

,则样本中心点为

因为回归直线方程为
,所以有
,解之得

所以
,当
时,
,则相对应于点
的残差为
.
故答案为:D.
【分析】由已知求得样本中心点的坐标,代入回归方程中求得
的值,进而求出回归方程,取
求得
,再由残差公式求得结果即可.
3.答案:
B
解:独立性检验独立性检验是检验两个分类变量是否相关的一种统计方法,
只是在一定的可信度下进行判断,不一定正确,
会因为样本不同导致结论可能不同,带有反证法思想.
故答案为:B
【分析】独立性检验是检验两个分类变量是否相关的一种统计方法,带有反证法思想,样本不同,结论可能不同,而且结果不一定正确.
4.答案:
C
解:


由回归直线
过样本中心点,
所以

解得
.
故答案为:C
【分析】利用回归直线过样本中心点
即可求解.
5.答案:
C
解:解:因为

所以有99%的把握认为“该地区中学生的性别与阅读量有关系”,
故答案为:C
【分析】由
值与表中的临界值进行比较可得答案.
6.答案:
C
解:由表中数据得:

因为样本中心点
在回归直线上,
所以

所以
故答案为:C
【分析】根据样本中心点在回归直线上可得答案.
7.答案:
D
解:因为水位
的回归直线方程为

A.第8日的水位是
,将启动黄色预警,A不符合题意;
B.第10日的水位是
,将启动橙色预警,B不符合题意;
C.第11日的水位是
,将启动橙色预警,C不符合题意;
D.第12日的水位是
,将启动红色预警,D符合题意;
故答案为:D.
【分析】根据回归方程,逐项计算预测值,再由河流水位表,即可判定出结果.
8.答案:
C
解:
,所以
,则

所以,
,解得
.
故答案为:C.
【分析】将
代入函数
结合
求得
即可得解.
9.答案:
B
解:设回归直线方程为

由表格中的数据可得


由最小二乘法公式可得


因此,回归直线方程为
.
故答案为:B.
【分析】设回归直线方程为
,求得

的值,将表格中的数据代入最小二乘法公式,求出

的值,进而可求得回归直线方程.
10.答案:
D
解:由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率
和温度
的回归方程类型的是
.
故答案为:D.
【分析】根据散点图的分布可选择合适的函数模型.
11.答案:
B
解:回归直线一定经过样本点的中心
,故
对;
若两个具有线性相关关系的变量的相关性越强,则线性相关系数
的值越接近于1或

错;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故
对;
在线性回归模型中,相关指数
越接近于1,说明回归的效果越好,故
对,
故答案为:B.
【分析】根据回归直线方程及回归分析的相关知识判断即可;
12.答案:
C
解:由题意知,成绩优秀的学生数是
,成绩非优秀的学生数是

所以c=20,b=45,A,B不符合题意;根据列联表中的数据,
得到

≈6.109>3.841,
因此有95%的把握认为“成绩与班级有关系”,C符合题意.
故答案为:C.
【分析】根据题意可求出成绩优秀的学生数是
,所以成绩非优秀的学生数是
,即可求出
的值,判断出
的真假,再根据列联表求出K2

即可由独立性检验的基本思想判断出
的真假.
二、多选题
13.答案:
A,B,D
解:若所有样本点都在直线
上,且直线斜率为负数,则
,A、B选项均错误;

越大,则变量

的线性相关性越强,C选项正确,D选项错误.
故答案为:ABD.
【分析】根据相关系数与变量

的线性相关性之间的关系可判断出各选项的正误.
14.答案:
A,B,C,D
解:对A,因为
,
故有99%的把握认为变量
具有线性相关关系,A符合题意.;
对B,价格平均
,销售量

故回归直线恒过定点
.B符合题意.
对C,因为回归直线恒过定点
,故
.C符合题意;
对D,当
时,
.D符合题意.
综上,ABCD均正确.
故答案为:ABCD
【分析】对A,根据
判断即可;对BC,根据回归直线方程经过样本中心点求解即可.对D;
求出
,再代入
求解即可.
三、填空题
15.答案:
4
解:由已知

,由回归方程的性质得
,解得
.
【分析】利用平均数公式求出

,再利用回归直线必过点,从而结合代入法将点的坐标代入回归直线方程中,从而求出m的值。
16.答案:

解:因为K2≈3.918≥3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”,故①正确;②显然错误;因为我们检验的是假设是否成立,和该血清预防感冒的有效率是没有关系的,故③④错误。
【分析】利用已知条件结合独立性检验的方法,从而得出正确结论的序号。
17.答案:
②③④
解:解:在回归分析中,相关指数越大,残差平方和越小,回归效果就越好,①错误;
在回归分析中,相关指数的绝对值越接近于1,相关程度就越大,②正确
回归直线
必经过样本中心点
,③正确;
是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合,④正确.
故答案为:②③④.
【分析】根据回归直线方程与独立性检验的实际意义作出判断.
18.答案:
5%
解:由题意可得,
,参照附表,可得得出在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为5%。
【分析】利用已知条件结合独立性检验的方法,从而在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”。
四、解答题
19.答案:
(1)解:
由题意可得
列联表如下表所示:
选物理
选历史
合计
男生
35
15
50
女生
10
40
50
合计
45
55
100
(2)解:
根据列联表中的数据,
可以求得
,,
所以我们有99.9%的把握认为,学生选科与性别有关.
【分析】(1)根据题中数据可得出
列联表;
(2)计算出
的观测值,结合临界值表可得出结论.
20.答案:
(1)解:根据表中的数据,可得
,解得



又由
,故所求回归直线方程为

(2)解:将
代入
中,求得

故预测最后一天参加该活动的人数34.
【分析】(1)由
计算出参数
的值,再计算出


,根据公式计算可得;
(2)将
代入(1)的方程计算可得.
21.答案:
(1)解:根据表中的数据:
适宜作为确诊病例数量
关于日期
的回归方程类型;
(2)解:由已知数据得:





所以,
关于
的回归方程为:

(3)解:把
代入回归方程得:

所以预测2月16日全国累计报告确诊病例数为6.6万人.
【分析】(1)直接由表格中的数据可知
适宜作为确诊病例数量
关于日期
的回归方程类型;(2)由表格中的数据求得

的值,则
关于
的线性回归方程可求;(3)在(2)中求得的线性回归方程中,取
求得
值即可.
22.答案:
(1)解:设污损的数字为
,由北方观众平均人数超过南方观众平均人数得

,即


(2)解:






,,
,时,
.
答:年龄为60岁的观众每周学习诗词的平均时间大约为4.25小时.
【分析】(1)由题,列出不等式,解得x的取值范围,即可得到本题答案;
(2)由

,求得线性回归方程,令
,即可得到本题答案.
23.答案:
(1)解:根据表格中的数据,得到点

画在坐标系中,得到散点图:
.
(2)解:由表格中的数据,可得




于是所求的线性回归方程是

(3)解:当
时,
(百万元),
即广告费支出为一千万元,预测销售额大约为
百万元.
【分析】(1)根据表中所给的五组数据,得到五个点的坐标,在平面直角坐标系中画出散点图.(2)先求出
的平均数,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.(3)将
代入回归直线方程求出y的值,即可得到广告费支出一千万元时的销售额的估计值.
24.答案:
(1)解:由图象可知,
更适宜作为线性回归类型
(2)解:设
,根据最小二乘法得


所以

因此

(3)解:由题意知



解得
,即至多19.05分钟,就需要重新复习一遍.
【分析】(1)根据图象可得答案;(2)先求得
的线性回归方程,再将对数式化为指数式可得y与t的回归方程;(3)解不等式
可得答案.
21世纪教育网
www.21cnjy.com
精品试卷·第
2

(共
2
页)
HYPERLINK
"http://21世纪教育网(www.21cnjy.com)
"
21世纪教育网(www.21cnjy.com)