8.3.1 分类变量与列联表(同步训练)
1.可以粗略地判断两个分类变量是否有关系的是( )
A.散点图 B.等高堆积条形图 C.假设检验的思想 D.以上都不对
2.在2×2列联表中,下列两个比值相差越大,两个分类变量之间的关系越强的是( )
A.与 B.与 C.与 D.与
3.(多选)为了解户籍、性别对生育三胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人.绘制不同群体中倾向选择生育三胎与倾向选择不生育三胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育三胎的对应比例,则下列叙述中正确的是( )
A.是否倾向选择生育三胎与户籍有关 B.是否倾向选择生育三胎与性别无关
C.倾向选择生育三胎的人员中,男性人数与女性人数相同
D.倾向选择不生育三胎的人员中,农村户籍人数少于城镇户籍人数
4.用等高堆积条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )
5.(多选)分类变量X和Y的列联表如下:
X X 合计
Y=y1 Y=y2
X=x1 a b a+b
X=x2 c d c+d
合计 a+c b+d a+b+c+d
则下列说法不正确的是( )
ad-bc越小,说明X与Y关系越弱 B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强 D.(ad-bc)2越接近于0,说明X与Y关系越强
6.分类变量X和Y的列联表如下:
X Y 合计
Y=y1 Y=y2
X=x1 200 800 1 000
X=x2 180 a 180+a
合计 380 800+a 1 180+a
最后发现,两个分类变量没有任何关系,则a的值可能是( )
A.200 B.720 C.100 D.180
7.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
X Y 合计
Y=y1 Y=y2
X=x1 a b a+b
X=x2 c d c+d
合计 a+c b+d a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( )
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4
8.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是____________________________________
9.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
年龄 节目 合计
文艺节目 新闻节目
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).
10.下图是调查某学校高一、高二年级学生参加社团活动的等高堆积条形图,阴影部分的高表示参加社团的频率.已知该校高一、高二年级学生人数均为600人(所有学生都参加了调查),现从参加社团的同学中按分层随机抽样的方式抽取45人,则抽取的高二学生人数为________
11.为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.
头发类型 头晕状况 合计
经常头晕 很少头晕
长发 35 ① 121
短发 37 143 ②
合计 72 ③ ④
则空格中的数据应分别为:①________;②________;③________;④________.
12.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别 尿棕色素 合计
阳性数 阴性数
铅中毒病人 29 7 36
对照组 9 28 37
合计 38 35 73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
13.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
14.某学校对学生课外活动内容进行调查,结果整理成下表:
性别 课外活动 合计
体育 文娱
男生 21 23 44
女生 6 29 35
合计 27 52 79
利用图形判断学生课外活动的类别与性别是否有关系?
15.某校在高一部分学生中调查男女同学对某项体育运动的喜欢情况,其二维堆积条形图如图(阴影部分代表喜欢,白色代表不喜欢).
(1)写出2×2列联表;
(2)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.
参考答案:
1.B
解析:用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.
2.A 解析:与相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.
3.ABD
解析:由不同群体中倾向选择生育三胎与倾向选择不生育三胎的人数比例图知,在A中,∵城镇户籍倾向选择生育三胎的比例为40%,农村户籍倾向选择生育三胎的比例为80%,∴是否倾向选择生育三胎与户籍有关,故A正确;在B中,∵男性倾向选择生育三胎的比例为60%,女性倾向选择生育三胎的比例为60%,∴是否倾向选择生育三胎与性别无关,故B正确;在C中,∵男性倾向选择生育三胎的比例为60%,人数为60×60%=36,女性倾向选择生育三胎的比例为60%,人数为40×60%=24,∴倾向选择生育三胎的人员中,男性人数比女性人数多,故C错误;在D中,∵倾向选择不生育三胎的人员中,农村户籍人数为50×(1-80%)=10,城镇户籍人数为50×(1-40%)=30,∴倾向选择不生育三胎的人员中,农村户籍人数少于城镇户籍人数,故D正确.
4.D 解析:由等高条形图易知,D选项两个分类变量关系最强.
5.ABD 解析:|ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.
6.B
解析:由于X和Y没有任何关系,根据列联表可知和基本相等,检验可知,B满足条件
7.D
解析:比较.选项A中,=;选项B中,=;选项C中,=;选项D中,=.故选D.
8.答案:男正教授人数,副教授人数;女正教授人数,副教授人数.
9.答案:是
解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
10.答案:27
解析:根据等高堆积条形图可知,参加社团的高一和高二年级学生的人数比为2∶3,由分层随机抽样的性质可得,抽取的高二学生人数为45×=27.
11.答案:86 180 229 301
解析:最右侧的合计是对应的行上的两个数据的和,由此可求出①和②;而最下面的合计是相应的列上两个数据的和,由①和②的结果可求得③④.
12.解:等高堆积条形图如图所示:
其中两个白色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
13.解:由题目所给的数据得2×2列联表:
穿防护 服类型 职业性皮肤炎 合计
阳性例数 阴性例数
穿新防护服 5 70 75
穿旧防护服 10 18 28
合计 15 88 103
相应的等高堆积条形图如图所示.
图中两个深色的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
14.解:其等高堆积条形图如图所示.
由图可以直观地看出喜欢体育还是喜欢文娱在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系.
解:(1)观察二维堆积条形图可得,
经调查的男生总共45人,其中喜欢这项运动的有15人,不喜欢的有30人;
经调查的女生总共45人,其中喜欢这项运动的有5人,不喜欢的有40人.
由此写出列联表如下:
性别 某项运动 合计
喜欢 不喜欢
男 15 30 45
女 5 40 45
合计 20 70 90
(2)所求概率为p==,即恰是一男一女的概率为.