2020—2021学年高二数学下学期
8.3列联表与独立性检验
专项训练
一、单选题(共12题;共60分)
1.在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(false),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为( )
附false,
false
0.050
0.010
0.001
false
3.841
6.635
10.828
A.400 B.300 C.200 D.100
2.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( )
患心脏病情况
秃发情况
患心脏病
无心脏病
秃发
20
300
不秃发
5
450
A.0.1 B.0.05
C.0.01 D.0.99
3.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表
(参考公式:false,其中false.)
附表:
false
0.15
0.10
0.05
0.025
0.010
0.005
0.001
false
2.072
2.706
3.841
5.024
6.635
7.879
10.828
则下列选项正确的是
A.有false的把握认为使用智能手机对学习有影响
B.有false的把握认为使用智能手机对学习无影响
C.有false的把握认为使用智能手机对学习有影响
D.有false的把握认为使用智能手机对学习无影响
4.某村庄对改村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
false
7
false
年轻人
6
false
false
合计
false
false
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是
A.false B.false C.false D.false
5.下列命题:①在线性回归模型中,相关指数false表示解释变量false对于预报变量false的贡献率,false越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程false中,当解释变量false每增加一个单位时,预报变量false平均减少0.5个单位;④对分类变量false与false,它们的随机变量false的观测值false来说,false越小,“false与false有关系”的把握程度越大.其中正确命题的个数是
A.1个 B.2个 C.3个 D.4个
6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是
A.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若false的观测值为false,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
D.以上三种说法均不正确
7.第false届冬季奥林匹克运动会将于false年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市false人进行调查统计,得到如下false列联表.
男
女
合计
关注冰雪运动
false
false
false
不关注冰雪运动
false
false
false
合计
false
false
false
根据列联表可知( )
参考公式:false,其中false.
附表:
false
false
false
false
false
false
false
false
false
false
A.该市女性居民中大约有false的人关注冰雪运动
B.该市男性届民中大约有false的人关注冰雪运动
C.有false的把握认为该市居民是否关注冰雪运动与性别有关
D.有false的把握认为该市居民是否关注冰雪运动与性别有关
8.某医疗研究所为了检验新开发的流感疫苗对流感的预防作用,根据1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作出如下的false的列联表,并提出假设false“这种疫苗不能起到预防流感的作用”’则下列说法正确是( )
患流感
未患流感
合计
注射疫苗
200
800
1000
未注射疫苗
260
740
1000
合计
460
1540
2000
附:false.
false
0.100
0.050
0.025
0.010
false
2.706
3.841
5.024
6.635
A.这种疫苗能起到预防流感的有效率为99%;
B.若某人未使用该疫苗,则他在半年中有超过99%的可能性得流感;
C.有1%的把握认为“这种疫苗能起到预防流感的作用”;
D.有99%的把握认为“这种疫苗能起到预防流感的作用”.
9.为了调查胃病是否与生活规律有关,某同学在当地随机调查了500名30岁以上的人,并根据调查结果计算出了随机变量false的观测值false,则认为30岁以上的人患胃病与生活无规律有关时,出错的概率不会超过( )
附表:
false
0.40
0.25
0.10
0.05
0.025
0.010
0.005
0.001
false
0.708
1.323
2.706
3.841
5.024
6.635
7.879
10.828
A.0.001 B.0.005 C.0.010 D.0.025
10.false年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区false年false月至false年false月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码false分别对应false年false月false年false月)
根据散点图选择false和false两个模型进行拟合,经过数据处理得到的两个回归方程分别为false和false,并得到以下一些统计量的值:
false
false
false
false
false
注:false是样本数据中false的平均数,false是样本数据中false的平均数,则下列说法不一定成立的是( )
A.当月在售二手房均价false与月份代码false呈正相关关系
B.根据false可以预测false年false月在售二手房均价约为false万元/平方米
C.曲线false与false的图形经过点false
D.false回归曲线的拟合效果好于false的拟合效果
11.在研究吸烟是否对患肺癌有影响的案例中,通过对列联表的数据进行处理,计算得到随机变量false的观测值false.在犯错误的概率不超过0.001的前提下,下面说法正确的是( )
下面临界值表供参考
false
0.025
0.010
0.005
0.001
false
5.024
6.635
7.879
10.828
A.由于随机变量false的观测值false,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不超过0.001
B.由于随机变量false的观测值false,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不低于0.001
C.由于随机变量false的观测值false,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不超过0.001
D.由于随机变量false的观测值false,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不低于0.001
12.若由一个false列联表中的数据计算得false,那么有( )把握认为两个变量有关系.
A.false B.false C.false D.false
二、填空题(共4题;共20分)
13.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:
同意限定区域停车
不同意限定区域停车
合计
男
20
5
25
女
10
15
25
合计
30
20
50
则认为“是否同意限定区域停产与家长的性别有关”的把握约为__________.
附:false,其中false.
false
0.050
0.005
0.001
false
3.841
7.879
10.828
14.若两个分类变量X与Y的列联表为:
y1
y2
x1
10
15
x2
40
16
则“X与Y之间有关系”这个结论出错的可能性为________.
15.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过______.
附:false
false
0.05
0.025
0.010
0.001
false
3.841
5.024
6.635
10.828
16.下列说法中,正确的有______.
①回归直线false恒过点false,且至少过一个样本点;
②根据false列列联表中的数据计算得出false,而false,则有false的把握认为两个分类变量有关系,即有false的可能性使得“两个分类变量有关系”的推断出现错误;
③false是用来判断两个分类变量是否相关的随机变量,当false的值很小时可以推断两类变量不相关;
④某项测量结果false服从正态分布false,则false,则false.
三、解答题(共4题;共20分)
17.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(false岁~false岁)和“非年轻人”(false岁及以下或者false岁及以上)两类,将一周内使用的次数为false次或false次以上的称为“经常使用直播销售用户”,使用次数为false次或不足false次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有false是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为false的样本,请你根据图表中的数据,完成false列联表,并根据列联表判断是否有false的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人
非年轻人
合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将false万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利false,可能亏损false,也可能不赔不赚,且这三种情况发生的概率分别为false;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利false,可能亏损false,也可能不赔不赚,且这三种情况发生的概率分别为false.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
false
false
false
false
false
false
false
false
false
false
false
false
其中,false.
18.某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为false,女性人数为false,男性患Ⅰ型病的人数占男性病人的false,女性患Ⅰ型病的人数占女性病人的false.
(1)完成false联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?
Ⅰ型病
Ⅱ型病
合计
男
女
合计
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费false元.甲团队研发的药物每次接种后产生抗体的概率为false,根据以往试验统计,甲团队平均花费为false;乙团队研发的药物每次接种后产生抗体的概率为false,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若false,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?
附:false.
false
0.10
0.05
0.01
0.005
0.001
false
2.706
3.841
6.635
7.879
10.828
19.在党的第十九次全国代表大会上,习近平总书记指出:“房子是用来住的,不是用来炒的”.为了使房价回归到收入可支撑的水平,让全体人民住有所居,近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令.某市一小区为了进一步了解已购房民众对市政府出台楼市限购令的认同情况,随机抽取了本小区 50 户住户进行调查,各户人平均月收入(单位:千元,)的户数频率分布直方图如下图:
其中,赞成限购的户数如下表:
人平均月收入
false
false
false
false
false
false
赞成户数
4
9
12
6
3
1
(1)求人平均月收入在false的户数,若从他们中随机抽取两户,求所抽取的两户都赞成楼市限购令的概率;
(2)求所抽取的 50户的人平均月收入的平均数;
(3)若将小区人平均月收入不低于7千元的住户称为“高收入户”,人平均月收入低于7千元的住户称为“非高收入户”.根据已知条件完成如图所给的false列联表,并说明能否在犯错误的概率不超过 0.01 的前提下认为“收入的高低”与“赞成楼市限购令”有关.
非高收入户
高收入户
总计
赞成
不赞成
总计
附:临界值表
false
0.15
0.10
0.05
0.025
0.010
0.005
0.001
false
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:false.
20.“中国科学十大进展”遴选活动由科学技术部高技术研究发展中心牵头举办,旨在激励广大科技工作者的科学热情和奉献精神,开展基础研究科学普及,促进公众理解?关心和支持基础研究,在全社会营造良好的科学氛围.2021年2月,科技部高技术研究发展中心(基础研究管理中心)发布了2020年度中国科学十大进展.某校为调查本校中学生对2020年度中国科学十大进展的了解与关注情况,从该校高中年级在校生中,按高一?高二年级,高三年级分成两个年级段,随机抽取了200名学生进行调查,其中高一?高二年级共调查了120人,高三年级调查了80人,以说出10项科学进展的名称个数为标准,统计情况如下.假设以能至少说出四项科学进展的名称为成绩优秀.
说出科学进展名称个数
0
1
2
3
4
5个及以上
频数(高一?高二年级)
5
25
30
25
5
5
频数(高三年级)
0
10
15
25
20
10
(1)根据频数分布表完成false列联表,并回答是否有95%的把握认为成绩优秀与否与年级分段有关?
成绩不优秀
成绩优秀
合计
高一?高二年级
高三年级
(2)按分层抽样的方法,在被调查且成绩优秀的学生中抽取6名同学,再在这6名同学中随机抽取4名同学组成“2020科技展”宣讲队,求至少有2名高三年级的同学入选宣讲队的概率.
附:false,其中false.
false
false
false
false
false
false
false
false
false
false
参考答案
1.B
【详解】
由题可知,男女各false人,列联表如下:
喜欢
不喜欢
总计
男
30m
20m
50m
女
20m
30m
50m
总计
50m
50m
100m
false,
false有99.9%把握认为性别与是否喜欢该学科有关,
false,解得false,
false,
false,
false.
故选:B
2.C
【详解】
列出false联表如下图所示:
患心脏病情况
秃发情况
患心脏病
无心脏病
小计
秃发
20
300
320
不秃发
5
450
455
小计
25
750
775
falsefalse,故判断错误的概率不超过false,故选false.
3.A
【详解】
分析:根据列联表中数据利用公式求得false ,与邻界值比较,即可得到结论.
详解:根据卡方公式求得false,
false,
false该研究小组有false的把握认为中学生使用智能手机对学生有影响,故选A.
4.D
【详解】
分析:先根据列联表列方程组,解得a,b,c,d,e,f,再判断真假.
详解:因为false,
所以false
选D.
5.C
【详解】
对于①,在回归分析模型中,相关指数false表示解释变量false对于预报变量false的贡献率,false越接近于1,表示回归效果越好,正确,因为相关指数false越大,则残差平方和越小,模型的拟合效果越好,①正确.
对于②两个变量相关性越强,则相关系数的绝对值就越接近于1;
对于③在回归直线方程false中,当解释变量false每增加一个单位时,预报变量false平均减少0.5个单位;正确;
对于④对分类变量false与false,它们的随机变量false的观测值false来说,false越小,“false与false有关系”的把握程度越大.错误,因为在对分类变量false与false进行独立性检验时,随机变量false的观测值false越大,则“false与false相关”可信程度越大,故④错误;
故选C
6.A
【详解】
要正确认识观测值的意义,观测值同临界值进行比较得到一个概率,这个概率是推断出错误的概率,若从统计量中求出有false的把握认为吸烟与患肺病有关系,是指有false的可能性使得推断出现错误
故选false
7.C
【详解】
由false列联表中的数据可得false,
因此,有false的把握认为该市居民是否关注冰雪运动与性别有关.
故选:C.
8.D
【详解】
false,
由临界值表可知,有99%的把握认为“这种疫苗能起到预防流感的作用”,
故选:D
9.D
【详解】
∵相关指数false的观测值false,
∴在犯错误的概率不超过false的情况下,判断false岁以上的人患胃病与生活无规律有关.
故选:D.
10.C
【详解】
对于A,散点从左下到右上分布,所以当月在售二手房均价false与月份代码false呈正相关关系,故A正确;
对于B,令false,由false,
所以可以预测false年false月在售二手房均价约为false万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过false,故C错误;
对于D,false越大,拟合效果越好,故D正确.
故选:C.
11.A
【详解】
由题意知,通过对列联表的数据进行处理,计算得到随机变量false的观测值false,
其中false,
所以在犯错误的概率不超过0.001的前提下,认为“吸烟与患肺癌有关系”.
故选:A.
12.A
【详解】
∵一个2*2列联表中的数据计算得false,且4.013>3.841,
∴有95%的把握说这两个变量有关系.
故选:A
13.99.5%.
【解析】
分析:利用公式求得K2,与临界值比较,即可得到结论.
详解:因为K2=false ≈8.333
又 P(k2≥7.789)=0.005=0.5%.
故答案为99.5%.
所以,我们有99.5%的把握恩威是否同意限定区域停车与家长的性别有关.
14.1%
【解析】
由题意可得K2的观测值
k=false≈7.227,
∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%
15.0.025
【详解】
集中培训
分散培训
合计
一次考过
45
30
75
一次未考过
10
20
30
合计
55
50
105
false,
故答案为:0.025.
16.②④
【详解】
①回归直线false恒过点false,不一定过样本点,故错误.
②独立性检验是选取一个假设false 条件下的小概率事件,故正确.
③当false的值很小时推断两类变量相关的把握小,但不能说无关,故错误.
④因为false服从正态分布false,且false,所以false与false关于false对称,故正确.
故答案为:②④
17.(1)false列联表见解析,有false的把握认为经常使用网络直播销售与年龄有关;(2)选方案一,理由见解析.
【详解】
(1)由图1知,“年轻人”占比为false,即有false(人),“非年轻人”有false(人)
由图2知,“经常使用直播销售用户”占比为false,即有false(人),“不常使用直播销售用户” 有false(人).
“经常使用直播销售用户的年轻人”有中有false(人),“经常使用直播销售用户的非年轻人”有false(人)
false补全的列联表如下:
年轻人
非年轻人
合计
经常使用直播销售用户
false
false
false
不常使用直播销售用户
false
false
false
合计
false
false
false
于是false.
false,
即有false的把握认为经常使用网络直播销售与年龄有关.
(2)若按方案一,设获利false万元,则false可取的值为行false,false的分布列为:
false
false
false
false
false
false
false
false
false(万元),
falsefalse
若按方案二,设获利false万元,则false可取的值为false,false的分布列为:
false
false
false
false
false
false
false
false
false(万元),
falsefalse
false,
由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.
18.(1)列联表见解析,12人;(2)答案见解析.
【详解】
(1)false列联表如下:
Ⅰ型病
Ⅱ型病
合计
男
false
false
false
女
false
false
false
合计
false
false
false
要使在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,
则,false,
解得false,
因为false,false,所以false的最小整数值为12,
所以男性患者至少有12人;
(2)设甲研发团队试验总花费为false,false,
设乙研发团队试验总花费为false元,则false的可能取值为false,false,
所以false,
false,
所以falsefalse,
因为false,所以false
falsefalsefalse,
①当false时,false,因为false,所以false,所以false,
乙团队试验的平均花费较少,所以选择乙团队进行研发;
②当false时,false,因为false,所以false,所以false,
甲团队试验的平均花费较少,所以选择甲团队进行研发;
③当false时,false,所以false,甲团队试验的平均花费和乙团队试验的平均花费相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.
19.(1)false;(2)6.4千元;(3)答案见解析.
【详解】
试题分析:(1)根据题意可得住户共有8户,赞成楼市限购令的有4户,然后简单计算可得结果;(2)根据均值公式计算即可;(3)根据卡方公式计算即可得出结论.
试题解析:
(1)由直方图知:月收入在的住户共有8户,赞成楼市限购令的有4户,从中随机抽取两户,设为赞成楼市限购令的用户数.
(2)false千元
(3)依题意,列联表如下
非高收入户
高收入户
总计
赞成
25
10
35
赞成
5
10
15
总计
30
20
50
false
所以不能在犯错误的概率不超过的前提下认为“收入的高低”与“赞成楼市限购令”有关.
20.(1)列联表答案见解析,没有95%的把握认为成绩优秀与否与年级分段有关;(2)false.
【详解】
(1)由题意,false列联表如下:
成绩不优秀
成绩优秀
合计
高一?高二年级
90
30
120
高三年级
50
30
80
合计
140
60
200
false,
所以没有95%的把握认为成绩优秀与否与年级分段有关;
(2)被调查且成绩优秀的学生有60名,分层抽样抽取6名同学,
则从高一?高二年级抽取了3名同学,记为:false,false,false,
从高三年级抽取了3名同学,记为false,false,false,在6名同学中随机选4名,不同的情况有15种:
(以下均只列出两名没入选的情况)false,false,false,false,false,false,false,false,false,false,false,false,false,false,false,
其中至少有2名高三年级的同学入选的情况的对立事件是只有1名高三年级的同学入选,
不同的情况有3种:false,false,false,
所以至少有2名高三年级的同学入选宣讲队的概率为false.