2019-2020学年选修2-3第三章训练卷
统计案例(一)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若的观测值为,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误;
D.以上三种说法都不正确.
2.对相关系数,下列说法正确的是( )
A.越大,线性相关程度越大
B.越小,线性相关程度越大
C.越大,线性相关程度越小,越接近0,线性相关程度越大
D.且越接近1,线性相关程度越大,越接近0,线性相关程度越小
3.下列说法错误的是( )
A.回归直线过样本点的中心
B.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小
C.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
D.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位
4.为了解某次考试中语文成绩是否优秀与性别的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
经过计算,,根据这一数据分析,下列说法正确的是( )
下面的临界值表供参考:
A.有的把握认为语文成绩是否优秀与性别有关系
B.有的把握认为语文成绩是否优秀与性别有关系
C.有的把握认为语文成绩是否优秀与性别有关系
D.没有理由认为语文成绩是否优秀与性别有关系
5.一般地,在两个分类变量的独立性检验过程中有如下表格:
已知两个分类变量和,如果在犯错误的概率不超过的前提下认为和有关系,则随机变量的观测值可以位于的区间是( )
A. B.
C. D.
6.为了判定两个分类变量和是否有关系,应用独立性检验法算得的观测值为5,又已知,,则下列说法正确的是( )
A.有以上的把握认为“和有关系”
B.有99%以上的把握认为“和没有关系”
C.有95%以上的把握认为“和有关系”
D.有95%以上的把握认为“和没有关系”
7.下表是鞋子的长度与对应码数的关系
长度()
24
24.5
25
25.5
26
26.5
码数
38
39
40
41
42
43
如果人的身高与脚板长呈线性相关且回归直线方程为.若某人的身高为173,据此模型,估计其穿的鞋子的码数为( )
A.40 B.41 C.42 D.43
8.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为,以下结论中不正确的为( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
9.某研究中心为研究运动与性别的关系得到2×2列联表如表:
参考公式:,其中.
则随机变量K2的观测值约为( )
A. B. C. D.
10.“关注夕阳、爱老敬老”—某马拉松协会从年开始每年向敬老院捐赠物资和现金.下表记录了第年(年是第一年)与捐赠的现金(万元)的对应数据,由此表中的数据得到了关于的线性回归方程,则预测年捐赠的现金大约是( )
3
4
5
6
3
4
A.万元 B.万元 C.万元 D.万元
11.某市对公共场合禁烟进行网上调查,在参与调查的2500名男性市民中有1000名持支持态度,2500名女性市民中有2000人持支持态度,在运用数据说明市民对在公共场合禁烟是否支持与性别有关系时,用什么方法最有说明力( )
A.平均数与方差 B.回归直线方程 C.独立性检验 D.概率
12.在一项调查中有两个变量和,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为关于的回归方程的函数类型是( )
A. B.
C. D.()
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)
男
女
正常
73
117
色弱
7
3
你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?
14.以下四个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|越大,模拟的拟合效果越好;②在一组样本数据,,,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;③对分类变量x与y的随机变量来说,越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为__________.
15.为了判断高中三年级学生是否选择文科与性别的关系,现随机抽取50名学生,得到如下列联表:
理科
文科
男
13
10
女
7
20
已知,.
根据表中数据,得到的观测值,则有_____以上把握认为选择文科与性别有关系.
16.给出下列四个结论:
(1)相关系数的取值范围是;
(2)用相关系数来刻画回归效果,的值越大,说明模型的拟合效果越差;
(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;
(4)一个篮球运动员投篮一次得3分的概率为,得2分的概率为,不得分的概率为,且,已知他投篮一次得分的数学期望为2,则的最小值为.
其中正确结论的序号为______________.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(10分)某校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:
喜欢统计课程
不喜欢统计课程
男生
20
5
女生
10
20
(1)判断是否有99.5%的把握认为喜欢“应用统计”课程与性别有关?
(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生作进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.
临界值参考:
0.10
0.05
0.25
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中)
18.(12分)某健身馆在2019年7、8两月推出优惠项目吸引了一批客户.为预估2020年7、8两月客户投入的健身消费金额,健身馆随机抽样统计了2019年7、8两月100名客户的消费金额,分组如下:,,,,(单位:元),得到如图所示的频率分布直方图:
(1)请用抽样的数据预估2020年7、8两月健身客户人均消费的金额(同一组中的数据用该组区间的中点值作代表);
(2)若把2019年7、8两月健身消费金额不低于800元的客户,称为“健身达人”,经数据处理,现在列联表中得到一定的相关数据,请补全空格处的数据,并根据列联表判断是否有的把握认为“健身达人”与性别有关?
健身达人
非健身达人
总计
男
10
女
30
总计
(3)为吸引顾客,在健身项目之外,该健身馆特别推出健身配套营养品的销售,现有两种促销方案.
方案一:每满800元可立减100元;
方案二:金额超过800元可抽奖三次,每次中奖的概率为,且每次抽奖互不影响,中奖1次打9折,中奖2次打8折,中奖3次打7折.
若某人打算购买1000元的营养品,请从实际付款金额的数学期望的角度分析应该选择哪种优惠方案.
附:
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
19.(12分)东莞的轻轨给市民出行带来了很大的方便,越来越多的市民选择乘坐轻轨出行,很多市民都会开汽车到离家最近的轻轨站,将车停放在轻轨站停车场,然后进站乘轻轨出行,这给轻轨站停车场带来很大的压力.某轻轨站停车场为了解决这个问题,决定对机动车停车施行收费制度,收费标准如下:4小时内(含4小时)每辆每次收费5元;超过4小时不超过6小时,每增加一小时收费增加3元;超过6小时不超过8小时,每增加一小时收费增加4元,超过8小时至24小时内(含24小时)收费30元;超过24小时,按前述标准重新计费.上述标准不足一小时的按一小时计费.为了调查该停车场一天的收费情况,现统计1000辆车的停留时间(假设每辆车一天内在该停车场仅停车一次),得到下面的频数分布表:
以车辆在停车场停留时间位于各区间的频率代替车辆在停车场停留时间位于各区间的概率.
(1)现在用分层抽样的方法从上面1000辆车中抽取了100辆车进行进一步深入调研,记录并统计了停车时长与司机性别的列联表:
完成上述列联表,并判断能否有90%的把握认为“停车是否超过6小时”与性别有关?
(2)①表示某辆车一天之内(含一天)在该停车场停车一次所交费用,求的概率分布列及期望;
②现随机抽取该停车场内停放的3辆车,表示3辆车中停车费用大于的车辆数,求的概率.
参考公式:,其中.
20.(12分)司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命.为了研究司机开车时使用手机的情况,交警部门调查了名机动车司机,得到以下统计:在名男性司机中,开车时使用手机的有人,开车时不使用手机的有人;在名女性司机中,开车时使用手机的有人,开车时不使用手机的有人.
(1)完成下面的列联表,并判断是否有的把握认为开车时使用手机与司机的性别有关;
(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为,若每次抽检的结果都相互独立,求的分布列和数学期望.
参考公式与数据:
参考数据:
参考公式,其中.
21.(12分)近来天气变化无常,陡然升温、降温幅度大于的天气现象出现增多.陡然降温幅度大于容易引起幼儿伤风感冒疾病.为了解伤风感冒疾病是否与性别有关,在某妇幼保健院随机对人院的名幼儿进行调查,得到了如下的列联表,若在全部名幼儿中随机抽取人,抽到患伤风感冒疾病的幼儿的概率为,
(1)请将下面的列联表补充完整;
(2)能否在犯错误的概率不超过的情况下认为患伤风感冒疾病与性别有关?说明你的理由;
(3)已知在患伤风感冒疾病的名女性幼儿中,有名又患黄痘病.现在从患伤风感冒疾病的名女性中,选出名进行其他方面的排查,记选出患黄痘病的女性人数为,求的分布列以及数学期望.下面的临界值表供参考:
参考公式:,其中.
22.(12分)某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元)
人数
10
15
20
15
20
10
(1)根据以上数据完成列联表,并判断是否有的把握认为购买金额是否少于60元与性别有关;
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为(每次抽奖互不影响,且的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数(元)的分布列并求其数学期望.
附:参考公式和数据:,.
附表:
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
2019-2020学年选修2-3第三章训练卷
统计案例(一)答 案
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.【答案】C
要正确认识观测值的意义,观测值同临界值进行比较得到一个概率,这个概率是推断出错误的概率,
若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误,故选C.
2.【答案】D
两个变量之间的相关系数,的绝对值越接近于1,
表面两个变量的线性相关性越强,
的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故选D.
3.【答案】B
A.回归直线过样本点的中心,故A正确;
B.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”可信程度越大,故B不正确;
C.两个随机变量相关性越强,则相关系数的绝对值越接近1,故C正确;
D.在线性回归方程=0.2x+0.8中,当x每增加1个单位时,预报量平均增加0.2个单位,故D正确,
故选B.
4.【答案】C
由题意可得,的观测值,
所以有的把握认为语文成绩是否优秀与性别有关系,故选C.
5.【答案】D
在犯错误的概率不超过的前提下认为和有关系,
则随机变量的观测值可以位于的区间是,故选D.
6.【答案】C
因为,根据临界值表知,,故有以上的把握认为“和有关系”.
故本题正确答案为C.
7.【答案】C
令代入直线方程,解得,
所以脚板长为,查表得穿的鞋子的码数应为42,故选C.
8.【答案】D
A,身高极差大约为25,臂展极差大于等于30,故正确;
B,很明显根据散点图像以及回归直线得到,身高矮臂展就会短一些,身高高一些,臂展就长一些,故正确;
C,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但是不是准确值,故正确;
D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故说法不正确.
故答案为D.
9.【答案】B
由题可得.故选B.
10.【答案】C
由已知得,,,
所以样本点的中心点的坐标为,代入,
得,即,所以,
取,得,
预测2019年捐赠的现金大约是万元.
11.【答案】C
独立性检验研究的是两个分类变量之间的相关关系,
所以市民对在公共场合禁烟是否支持与性别有关系时,用独立性检验最有说明力.
12.【答案】B
散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.【答案】0.05
由题意得列联表为
男
女
合计
正常
73
117
190
色弱
7
3
10
合计
80
120
200
由列联表中的数据可得,
所以在犯错误的概率不超过0.05的前提下可认为“是否色弱与性别有关”.
故答案为0.05.
14.【答案】1
①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|越大,
模拟的拟合效果越好,①正确;
②相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,②错误;
③对分类变量x与y的随机变量来说,越大,判断“x与y有关系”的把握程度越大.③错误.
故正确命题个数为1,故答案为1.
15.【答案】95%
且,
有以上的把握认为选择文科与性别有关系,本题正确结果.
16.【答案】(3)(4)
(1)相关系数的取值范围是,故(1)错误;
(2)用相关指数来刻画回归效果,的值越大,说明模型的拟合效果越好,
故(2)错误;
(3)含零个白球的概率为,含一个白球的概率为,含二个白球的概率为,含三个白球的概率为,含四个白球的概率为,
白球个数的期望为:,
故(3)正确;
(4)∵,a,b,c∈(0,1),
∴
=,(当且仅当a=2b,即a=,b=时取“=”),故(4)正确.
其中正确结论的序号为(3)(4).
故答案为(3)(4).
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.【答案】(1)有的把握认为喜欢统计专业与性别有关;(2).
(1)由公式,
所以有的把握认为喜欢统计专业与性别有关.
(2)设所抽样本中有个男生,则,得人,
所以样本中有个男生,个女生,分别记作,,,,,,
从中任选人的基本事件有,,,,,,,,,,,,,,,共个,
其中恰有名男生和名女生的事件有,,,,,,,,共个,
所以恰有名男生和名女生的概率为.
18.【答案】(1)620元;(2)列联表见解析,有的把握认为“健身达人”与性别有关系;(3)选择方案二更划算.
(1)因为(元),
所以,预估2020年7、8两月份人均健身消费为620元.
(2)列联表如下:
健身达人
非健身达人
总计
男
10
40
50
女
20
30
50
总计
30
70
100
因为,
因此有的把握认为“健身达人”与性别有关系.
(3)若选择方案一:则需付款900元;
若选择方案二:设付款元,则可能取值为700,800,900,1000.
;;
;,
所以(元),
因为,所以选择方案二更划算.
19.【答案】(1)列联表见解析,没有超过90%的把握认为“停车是否超过6小时”与性别有关;(2)①分布列见解析,;②.
(1)由题,不超过6小时的频率为,
则100辆车中有40辆不超过6小时,60辆超过6小时,
则列联表如下:
男
女
合计
不超过6小时
10
30
40
6小时以上
20
40
60
合计
30
70
100
根据上表数据代入公式可得,
所以没有超过90%的把握认为“停车是否超过6小时”与性别有关.
(2)①由题意知:的可取值为5,8,11,15,19,30,
则,,,,
,,
所以的分布列为:
5
8
11
15
19
30
∴.
②由题意得,所以,
所以
.
20.【答案】(1)列联表见解析,有;(2)分布列见解析,.
(1)由已知数据可得列联表如下:
开车时使用手机
开车时不使用手机
合计
男性司机人数
女性司机人数
合计
,
有的把握认为开车时使用手机与司机的性别有关.
(2)随机抽检辆,司机为男性且开车时使用手机的概率,
有题意可知:可取值是,且,
;;
;,
则的分布列为:
数学期望.
21.【答案】(1)见解析;(2)不能在犯错误的概率不超过的情况下认为患伤风感冒疾病与性别有关;(3)分布列见解析,.
(1)列联表补充如下;
患伤风感冒疾病
不患伤风感冒疾病
合计
男
女
合计
(2)计算的观测值为,
所以不能在犯错误的概率不超过的情况下认为患伤风感冒疾病与性别有关.
(3)根据题意,的值可能为.
则,,,
故的分布列如下:
故的数学期望.
22.【答案】(1)见解析,有的把握认为购买金额是否少于60元与性别有关;(2)分布列见解析,数学期望75.
(1)列联表如下:
不少于60元
少于60元
合计
男
12
40
52
女
18
20
38
合计
30
60
90
,
因此有的把握认为购买金额是否少于60元与性别有关.
(2)可能取值为65,70,75,80,且.
,,
,,
所以的分布列为
65
70
75
80
.
2019-2020学年选修2-3第三章训练卷
统计案例(二)
注意事项:
1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。
2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。
3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。写在试题卷、草稿纸和答题卡上的非答题区域均无效。
4.考试结束后,请将本试题卷和答题卡一并上交。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法正确的是( )
A.命题“若,则”的否命题为“若,则”
B.命题“,”的否定是“,”
C.样本的相关系数,越接近于1,线性相关程度越小
D.命题“若,则”的逆否命题为真命题
2.在研究吸烟与患肺癌的关系中,通过收集数据,整理、分析数据得出“吸烟与患肺癌有关”的结论,并有的把握认为这个结论是成立的,下列说法中正确的是( )
A.吸烟人患肺癌的概率为
B.认为“吸烟与患肺癌有关”犯错误的概率不超过
C.吸烟的人一定会患肺癌
D.个吸烟的人大约有个人患有肺癌
3.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男生女生各500名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽取32人,则抽取的男生人数为( )
A.16 B.32 C.24 D.8
4.下面是列联表
则表中、处的值为( )
A.、 B.、 C.、 D.、
5.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为,以下结论中不正确的为( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
6.手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了严重的影响,某校高一几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下的表,则下列说法正确的是( )
(附:列联表公式:,
其中)
A.在犯错误的概率不超过0.001的前提下认为使用手机与学习成绩有关
B.在犯错误的概率不超过0.001的前提下认为使用手机与学习成绩无关
C.有的把握认为使用手机对学习成绩无影响
D.无的把握认为使用手机对学习成绩有影响
7.如图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )
A. B.
C. D.
8.已知线性回归方程相应于点的残差为,则的值为( )
A.1 B.2 C. D.
9.相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩下数据得到线性回归直线方程,相关系数为.则( )
A. B.
C. D.
10.某次测量发现一组数据具有较强的相关性,并计算得,其中数据因书写不清楚,只记得是上的一个值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为( )
A. B. C. D.
11.下列说法正确的是( )
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样.
②某地气象局预报:5月9日本地降水概率为,结果这天没下雨,这表明天气预报并不科学.
③在回归分析模型中,残差平方和越小,说明模型的拟合效果越好.
④在回归直线方程中,当解释变量每增加1个单位时,预报变量增加0.1个单位.
A.①② B.③④ C.①③ D.②④
12.在一项调查中有两个变量和,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为关于的回归方程的函数类型是( )
A. B.
C. D.()
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟订的价格进行试销,得到如下数据.
由表中数据求得线性回归方程,则元时预测销量为_______件.
14.博鳌亚洲论坛2018年年会于4月8日至11日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在右面“性别与会俄语”的列联表中,__________.
15.关于变量的一组样本数据,,…,(,不全相等)的散点图中,若所有样本点()恰好都在直线上,则根据这组样本数据推断的变量的相关系数为__________.
16.已知如下四个命题:
①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;
②在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加个单位;
③两个变量相关性越强,则相关系数的绝对值就越接近于;
④对分类变量与,对它们的随机变量的观测值来说,越小,则“与有关系”的把握程度越大.
其中正确命题的序号是__________.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(10分)某商场为提高服务质量,随机调查了名男顾客和名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有的把握认为男、女顾客对该商场服务的评价有差异?
附:.
18.(12分)某地区在“精准扶贫”工作中切实贯彻习近平总书记提出的“因地制宜”的指导思想,扶贫工作小组经过多方调研,综合该地区的气候、地质、地理位置等特点,决定向当地农户推行某类景观树苗种植.工作小组根据市场前景重点考察了A,B两种景观树苗,为对比两种树苗的成活率,工作小组进行了引种试验,分别引种树苗A,B各50株,试验发现有80%的树苗成活,未成活的树苗A,B株数之比为1:3.
(1)完成2×2列联表,并据此判断是否有99%的把握认为树苗A,B的成活率有差异?
(2)已知树苗A经引种成活后再经过1年的生长即可作为景观树A在市场上出售,但每株售价y(单位:百元)受其树干的直径x(单位:cm)影响,扶贫工作小组对一批已出售的景观树A的相关数据进行统计,得到结果如下表:
根据上述数据,判断是否可用线性回归模型拟合y与x的关系?并用相关系数r加以说明.
(一般认为,为高度线性相关)
参考公式及数据:相关系数,,.
19.(12分)某公司为了解某产品的获利情况,将今年1至7月份的销售收入(单位:万元)与纯利润(单位:万元)的数据进行整理后,得到如下表格:
该公司先从这7组数据中选取5组数据求纯利润关于销售收入的线性回归方程,再用剩下的2组数据进行检验.假设选取的是2月至6月的数据.
(1)求纯利润关于销售收入的线性回归方程(精确到0.01);
(2)若由线性回归方程得到的估计数据与检验数据的误差均不超过0.1万元,则认为得到的线性回归方程是理想的.试问该公司所得线性回归方程是否理想?
参考公式:,,,;
参考数据:.
20.(12分)2019年9月24日国家统计局在庆祝中华人民共和国成立70周年活动新闻中心举办新闻发布会指出,1952年~2018年,我国GDP查679.1亿元跃升至90.03万亿元,实际增长174倍;人均GDP从119元提高到6.46万元,实际增长70倍.全国各族人民,砥砺奋进,顽强拼搏,实现了经济社会的跨越式发展.如图是全国2010年至2018年GDP总量(万亿元)的折线图.
注:年份代码1~9分别对应年份2010~2018.
(1)由折线图看出,可用线性回归模型拟合与年份代码的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01),预测2019年全国GDP的总量.
附注:参考数据:,,,.
参考公式:相关系数;
回归方程中斜率和截距的最小二乘法估计公式分别为,
21.(12分)长沙某公司对其主推产品在过去5个月的月广告投入xi(百万元)和相应的销售额yi(百万元)进行了统计,其中i=1,2,3,4,5,对所得数据进行整理,绘制散点图并计算出一些统计量如下:
,,,,,
,,其中,i=1,2,3,4,5.
(1)根据散点图判断,与哪一个适宜作为月销售额关于月广告投入xi的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及题中所给数据,建立y关于x的回归方程,并据此估计月广告投入220万元时的月销售额.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
22.(12分)司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命.为了研究司机开车时使用手机的情况,交警部门调查了名机动车司机,得到以下统计:在名男性司机中,开车时使用手机的有人,开车时不使用手机的有人;在名女性司机中,开车时使用手机的有人,开车时不使用手机的有人.
(1)完成下面的列联表,并判断是否有的把握认为开车时使用手机与司机的性别有关;
(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为,若每次抽检的结果都相互独立,求的分布列和数学期望.
参考数据:
参考公式,其中.
2019-2020学年选修2-3第三章训练卷
统计案例(二)答 案
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.【答案】D
对于A,命题“若,则”的否命题为“若,则”,
故A错误;
对于B,命题“,”的否定是“,”,
故B错误;
对于C,样本的相关系数,越接近于1,线性相关程度越大,故C错误;
对于D,命题“若,则”为真命题,故逆否命题也为真命题,
故D正确,
故选D.
2.【答案】B
∵“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过的前提下认为这个结论是成立的,
表示有的把握认为这个结论成立,与多少个人患肺癌没有关系,只有B选项正确.
3.【答案】C
由等高条形图可知:喜欢数学的女生和男生的比为1:3,
所以抽取的男生数为24人,故选C.
4.【答案】B
由表格中的数据可得,解得,故选B.
5.【答案】D
A,身高极差大约为25,臂展极差大于等于30,故正确;
B,很明显根据散点图像以及回归直线得到,身高矮臂展就会短一些,身高高一些,臂展就长一些,故正确;
C,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但是不是准确值,故正确;
D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故说法不正确,
故答案为D.
6.【答案】A
由列联表,得,
所以在犯错误的概率不超过0.001的前提下认为使用手机与学习成绩有关.
故选A.
7.【答案】A
根据题意,适合用线性回归拟合其中两个变量的散点图必须散点分布比较集中,且大体接近某一条直线,分析选项可得A选项的散点图杂乱无章,最不符合条件,
故选A.
8.【答案】B
因为相对于点的残差为,所以,
所以,解得,故选B.
9.【答案】D
由散点图得负相关,所以,,
因为剔除点后,剩下点数据更具有线性相关性,更接近,
所以,
故选D.
10.【答案】C
依题意可知,估计值为,残差为,
依题意得,解得,
根据几何概型概率计算公式可得所求概率为,故选C.
11.【答案】B
①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故①不正确;
②降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故②不正确;
③在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,故③正确;
④在回归直线方程中,回归系数为0.1,当解释变量x每增加一个单位时,预报变量增加0.1个单位,故④正确.
故选B.
12.【答案】B
散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.
二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)
13.【答案】66
由题得:
,,
,,
故答案为66.
14.【答案】28
由题得,解之得,,.所以.
故答案为28.
15.【答案】
所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为.
16.【答案】②③
①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好,所以①错误;
②在回归直线方程中,当解释变量x每增加一个单位时,预报变量平均增加0.8个单位,②正确;
③两个变量相关性越强,则相关系数的绝对值就越接近于1,③正确;
④对分类变量X与Y,对它们的随机变量的观测值k来说,k越小,则“X与Y有关系”的把握程度越小,所以④错误,
故正确命题的序号是②③.
三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.【答案】(1)男顾客:,女顾客:;(2)有的把握认为,详见解析.
(1)男顾客的满意概率为;女顾客的满意概率为.
(2),,
有的把握认为男、女顾客对该商场服务的评价有差异.
18.【答案】(1)列联表见解析,没有99%的把握认为二者有差异;(2)可以,详见解析.
试验发现有80%的树苗成活,故不成活20株,未成活的树苗A,B株数之比为1:3.
树苗未成活有5株,成活45株,树苗未成活有15株,成活35株,
(1)列联表如下:
,
故没有99%的把握认为二者有差异.
(2),.
.
故可以用线性回归模型拟合.
19.【答案】(1);(2)理想的,详见解析.
(1),
,
,
.
故纯利润关于销售收入的线性回归方程是.
(2)当时,,;
当时,,.
故该公司所得线性回归方程是理想的.
20.【答案】(1)见解析;(2),93.42万亿元.
(1)由折线图中的数据和附注中参考数据得,,
,
所以,
因为与的相关系数近似为0.997,说明与的线性相关程度相当高,
从而可以用线性回归模型拟合与的关系.
(2)由已知及(1)得,
,
所以,关于的回归方程为.
将2019年对应的代码代入回归方程,
得.
所以预测2019年全国GDP总量约为93.42万亿元.
21.【答案】(1)作为回归方程;(2),(万元).
(1)根据散点图选择作为回归方程.
(2)令,则,
,
故回归方程为,
当月广告投入为万元时,月销售额为(万元).
22.【答案】(1)列联表见解析,有的把握认为;(2)分布列见解析,.
(1)由已知数据可得列联表如下:
,
有的把握认为开车时使用手机与司机的性别有关.
(2)随机抽检辆,司机为男性且开车时使用手机的概率,
有题意可知:可取值是,且,
;;
;,
则的分布列为:
数学期望.