8.3.1 分类变量与列联表
基础达标
选择题
1.下列不是分类变量的是( )
A.近视 B.成绩
C.血压 D.饮酒
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
80分及80分以上 80分以下 合计
试验班 32 18 50
对照班 24 m 50
合计 56 44 n
3.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1 y2
x1 10 18
x2 m 26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
4.与表格相比,能更直观地反映出相关数据总体状况的是( )
A.列联表 B.散点图
C.残差图 D.等高堆积条形图
5.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.
6.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).
7.某村庄对该村内名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检 每年未体检 合计
老年人
年轻人
合计
已知抽取的老年人、年轻人各名,则对列联表数据的分析错误的是( )
A. B.
C. D.
8.(多空题)下面是一个2×2列联表:
y1 y2 合计
x1 a 21 73
x2 2 25 27
合计 b 46 100
则表中a=________,b=__________.
9.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
10.可以粗略地判断两个分类变量是否有关系的是( )
A.散点图 B.等高堆积条形图
C.残差图 D.以上都不对
11.(多选题)分类变量X和Y的列联表如下:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
则下列说法不正确的是( )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
12.已知两分类变量的列联表如下:
A 合计
B 200 800 1 000
180 a 180+a
合计 380 800+a 1 180+a
最后发现,这两个分类变量没有任何关系,则a的值可能是( )
A.200 B.720
C.100 D.180
13.(多选题)如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的百分比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的百分比为40%
二、判断题
14.分类变量中的变量与函数中的变量是同一概念.( )
15.列联表中的数据是两个分类变量的频数.( )
16.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.( )
17. 是否吸烟、是否患肺癌是分类变量。( )
三、填空题
18.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是__________________________________________________________.
19.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列给出的________最具说服力(填序号).
①回归直线方程;②平均数与方差;③等高堆积条形图.
20.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目 新闻节目 合计
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__________(填“是”或“否”).
三、解答题
21.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别 阳性数 阴性数 合计
铅中毒病人 29 7 36
对照组 9 28 37
合计 38 35 73
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
22.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
能力提升
23.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )
A.与 B.与
C.与 D.与
24.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
子女吸烟 子女不吸烟 合计
父母吸烟 237 678 915
父母不吸烟 83 522 605
合计 320 1 200 1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
创新猜想
25.(多选题)已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的 ( )
A.ad≈bc
B.≈
C.≈
D.≈
26.(多空题)下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 合计
男婴 45 A B
女婴 E 35 C
合计 98 D 180
那么,A=__________,B=__________,C=__________,D=__________,E=__________.
27.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
28.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
29.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
30.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
患病 未患病 合计
服用药 10 45 55
未服用药 20 30 50
合计 30 75 105
试用等高条形图分析服用药和患病之间是否有关系.
参考答案
1.B
解析:近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
2.26 100
解析:由题意得 解得
3.C
解析: 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
4.D
5.答案
喜欢吃甜食 不喜欢吃甜食 合计
男 117 413 530
女 492 178 670
合计 609 591 1 200
6.有
解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
7.D
8. 52 54
解析 由题意得解得
9.D
解析 观察等高条形图发现和相差越大,就判断两个分类变量之间关系越强.
10.B
解析 用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.
11. ABD
解析 |ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.
B
解析 由于A和B没有任何关系,根据列联表可知和基本相等,检验可知,B满足条件,故选B.
CD
解析 由题图知女生中喜欢理科的百分比为20%,男生不喜欢理科的百分比为40%,男生比女生喜欢理科的可能性大些,故A,B不正确,C,D正确.
14.×
15.√
16.√
17.√
18.答案 男正教授人数,男副教授人数;女正教授人数,女副教授人数
19.答案 ③
解析 由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,应用等高堆积条形图最具说服力.
20.答案 是
解析 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
21.解 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
22.解 由题目所给的数据得2×2列联表:
阳性例数 阴性例数 合计
穿新防护服 5 70 75
穿旧防护服 10 18 28
合计 15 88 103
相应的等高条形图如图所示.
图中两个深色条的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
23.解析 由题意,==,因为|ad-bc|的值越大,两个分类变量有关系的可能性就越大,故选A.
答案 A
24.解 等高条形图如图所示:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
25.解析 因为分类变量X,Y没有关系,所以≈,化简得ad≈bc,所以A,B正确,C,D显然不正确.
答案 AB
26.解析 由列联表知识得解得
答案 47 92 88 82 53
27.解 2×2列联表如下:
年龄在六十岁以上 年龄在六十岁以下 合计
饮食以蔬菜为主 43 21 64
饮食以肉类为主 27 33 60
合计 70 54 124
将表中数据代入公式得
==0.671 875.==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
28.解 作列联表如下:
性格内向 性格外向 合计
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
29.解 根据题目给出的数据作出如下的列联表:
色盲 不色盲 合计
男 38 442 480
女 6 514 520
合计 44 956 1 000
根据列联表作出相应的等高堆积条形图:
从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的。
30.解 根据列联表所给的数据可得出服用药患病的频率为≈0.18,未服用药患病的频率为=0.4,两者的差距是|0.18-0.4|=0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病有关系.8.3.1 分类变量与列联表
基础达标
选择题
1.下列不是分类变量的是( )
A.近视 B.成绩
C.血压 D.饮酒
解析 近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案 B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
80分及80分以上 80分以下 合计
试验班 32 18 50
对照班 24 m 50
合计 56 44 n
解析 由题意得
解得
答案 26 100
3.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1 y2
x1 10 18
x2 m 26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
解析 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
答案 C
4.与表格相比,能更直观地反映出相关数据总体状况的是( )
A.列联表 B.散点图
C.残差图 D.等高堆积条形图
答案 D
5.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.
答案
喜欢吃甜食 不喜欢吃甜食 合计
男 117 413 530
女 492 178 670
合计 609 591 1 200
6.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).
解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
答案 有
7.某村庄对该村内名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检 每年未体检 合计
老年人
年轻人
合计
已知抽取的老年人、年轻人各名,则对列联表数据的分析错误的是( )
A. B.
C. D.
解析:D
8.(多空题)下面是一个2×2列联表:
y1 y2 合计
x1 a 21 73
x2 2 25 27
合计 b 46 100
则表中a=________,b=__________.
解析 由题意得解得
答案 52 54
9.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
解析 观察等高条形图发现和相差越大,就判断两个分类变量之间关系越强.
答案 D
10.可以粗略地判断两个分类变量是否有关系的是( )
A.散点图 B.等高堆积条形图
C.残差图 D.以上都不对
解析 用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.
答案 B
11.(多选题)分类变量X和Y的列联表如下:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
则下列说法不正确的是( )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
解析 |ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.
答案 ABD
12.已知两分类变量的列联表如下:
A 合计
B 200 800 1 000
180 a 180+a
合计 380 800+a 1 180+a
最后发现,这两个分类变量没有任何关系,则a的值可能是( )
A.200 B.720
C.100 D.180
解析 由于A和B没有任何关系,根据列联表可知和基本相等,检验可知,B满足条件,故选B.
答案 B
13.(多选题)如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的百分比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的百分比为40%
解析 由题图知女生中喜欢理科的百分比为20%,男生不喜欢理科的百分比为40%,男生比女生喜欢理科的可能性大些,故A,B不正确,C,D正确.
答案 CD
二、判断题
14.分类变量中的变量与函数中的变量是同一概念.(×)
15.列联表中的数据是两个分类变量的频数.(√)
16.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.(√)
17. 是否吸烟、是否患肺癌是分类变量。(√)
三、填空题
18.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是__________________________________________________________.
答案 男正教授人数,男副教授人数;女正教授人数,女副教授人数
19.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列给出的________最具说服力(填序号).
①回归直线方程;②平均数与方差;③等高堆积条形图.
解析 由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,应用等高堆积条形图最具说服力.
答案 ③
20.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目 新闻节目 合计
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__________(填“是”或“否”).
解析 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
答案 是
三、解答题
21.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别 阳性数 阴性数 合计
铅中毒病人 29 7 36
对照组 9 28 37
合计 38 35 73
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
22.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
解 由题目所给的数据得2×2列联表:
阳性例数 阴性例数 合计
穿新防护服 5 70 75
穿旧防护服 10 18 28
合计 15 88 103
相应的等高条形图如图所示.
图中两个深色条的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
能力提升
23.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )
A.与 B.与
C.与 D.与
解析 由题意,==,因为|ad-bc|的值越大,两个分类变量有关系的可能性就越大,故选A.
答案 A
24.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
子女吸烟 子女不吸烟 合计
父母吸烟 237 678 915
父母不吸烟 83 522 605
合计 320 1 200 1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
解 等高条形图如图所示:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
创新猜想
25.(多选题)已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的 ( )
A.ad≈bc
B.≈
C.≈
D.≈
解析 因为分类变量X,Y没有关系,所以≈,化简得ad≈bc,所以A,B正确,C,D显然不正确.
答案 AB
26.(多空题)下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 合计
男婴 45 A B
女婴 E 35 C
合计 98 D 180
那么,A=__________,B=__________,C=__________,D=__________,E=__________.
解析 由列联表知识得解得
答案 47 92 88 82 53
27.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
解 2×2列联表如下:
年龄在六十岁以上 年龄在六十岁以下 合计
饮食以蔬菜为主 43 21 64
饮食以肉类为主 27 33 60
合计 70 54 124
将表中数据代入公式得
==0.671 875.==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
28.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
解 作列联表如下:
性格内向 性格外向 合计
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
29.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
解 根据题目给出的数据作出如下的列联表:
色盲 不色盲 合计
男 38 442 480
女 6 514 520
合计 44 956 1 000
根据列联表作出相应的等高堆积条形图:
从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的。
30.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
患病 未患病 合计
服用药 10 45 55
未服用药 20 30 50
合计 30 75 105
试用等高条形图分析服用药和患病之间是否有关系.
解 根据列联表所给的数据可得出服用药患病的频率为≈0.18,未服用药患病的频率为=0.4,两者的差距是|0.18-0.4|=0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病有关系.