人教A版(2019)高中数学 选择性必修第三册 8.3.1 分类变量与列联表课件+学案含练习

文档属性

名称 人教A版(2019)高中数学 选择性必修第三册 8.3.1 分类变量与列联表课件+学案含练习
格式 zip
文件大小 2.8MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2020-12-18 10:41:56

文档简介

8.3 列联表与独立性检验
8.3.1 分类变量与列联表
课标要求
素养要求
1.通过实例,理解2×2列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法.
通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.
新知探究
饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.
问题 人的身体健康状况与饮用水的质量之间有关系吗?
提示 我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.
1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
拓展深化
[微判断]
1.分类变量中的变量与函数中的变量是同一概念.(×)
提示 分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.
2.列联表中的数据是两个分类变量的频数.(√)
3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.(√)
[微训练]
1.下列不是分类变量的是(  )
A.近视
B.成绩
C.血压
D.饮酒
解析 
近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案 B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
80分及80分以上
80分以下
合计
试验班
32
18
50
对照班
24
m
50
合计
56
44
n
解析 由题意得
解得
答案 26 100
[微思考]
1.是否吸烟、是否患肺癌是什么变量?
提示 分类变量.
2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示 不是.
题型一 用2×2列联表分析两分类变量间的关系
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
解 2×2列联表如下:
年龄在六十岁以上
年龄在六十岁以下
合计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
合计
70
54
124
将表中数据代入公式得
==0.671
875.==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
规律方法 (1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与
的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
【训练1】 假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
x1
10
18
x2
m
26
则当m取下面何值时,X与Y的关系最弱(  )
A.8
B.9
C.14
D.19
解析 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
答案 C
题型二 用等高堆积条形图分析两分类变量间的关系
【例2】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
解 作列联表如下:
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1
020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
规律方法 利用等高堆积条形图判断两个分类变量是否相关的步骤:
【训练2】 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
解 根据题目给出的数据作出如下的列联表:
色盲
不色盲
合计

38
442
480

6
514
520
合计
44
956
1
000
根据列联表作出相应的等高堆积条形图:
从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.
一、素养落地
1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.
2.列联表与等高堆积条形图
列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.
二、素养训练
1.与表格相比,能更直观地反映出相关数据总体状况的是(  )
A.列联表
B.散点图
C.残差图
D.等高堆积条形图
答案 D
2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.
答案 
喜欢吃甜食
不喜欢吃甜食
合计

117
413
530

492
178
670
合计
609
591
1
200
3.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).
解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
答案 有
4.(多空题)下面是一个2×2列联表:
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a=________,b=__________.
解析 由题意得解得
答案 52 54
5.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
患病
未患病
合计
服用药
10
45
55
未服用药
20
30
50
合计
30
75
105
试用等高条形图分析服用药和患病之间是否有关系.
解 根据列联表所给的数据可得出服用药患病的频率为≈0.18,未服用药患病的频率为=0.4,两者的差距是|0.18-0.4|=0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病有关系.
基础达标
一、选择题
1.观察下列各图,其中两个分类变量x,y之间关系最强的是(  )
解析 观察等高条形图发现和相差越大,就判断两个分类变量之间关系越强.
答案 D
2.可以粗略地判断两个分类变量是否有关系的是(  )
A.散点图
B.等高堆积条形图
C.残差图
D.以上都不对
解析 用等高堆积条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.
答案 B
3.(多选题)分类变量X和Y的列联表如下:
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
则下列说法不正确的是(  )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
解析 |ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.
答案 ABD
4.已知两分类变量的列联表如下:
A
合计
B
200
800
1
000
180
a
180+a
合计
380
800+a
1
180+a
最后发现,这两个分类变量没有任何关系,则a的值可能是(  )
A.200
B.720
C.100
D.180
解析 由于A和B没有任何关系,根据列联表可知和基本相等,检验可知,B满足条件,故选B.
答案 B
5.(多选题)如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出(  )
A.性别与喜欢理科无关
B.女生中喜欢理科的百分比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的百分比为40%
解析 由题图知女生中喜欢理科的百分比为20%,男生不喜欢理科的百分比为40%,男生比女生喜欢理科的可能性大些,故A,B不正确,C,D正确.
答案 CD
二、填空题
6.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是__________________________________________________________.
答案 男正教授人数,男副教授人数;女正教授人数,女副教授人数
7.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3
648名男性公民与3
432名女性公民中,持反对意见的男性有1
843人、女性有1
672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列给出的________最具说服力(填序号).
①回归直线方程;②平均数与方差;③等高堆积条形图.
解析 由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,应用等高堆积条形图最具说服力.
答案 ③
8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
合计
20至40岁
40
18
58
大于40岁
15
27
42
合计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:__________(填“是”或“否”).
解析 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
答案 是
三、解答题
9.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
合计
铅中毒病人
29
7
36
对照组
9
28
37
合计
38
35
73
试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
10.当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用图形判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
解 由题目所给的数据得2×2列联表:
阳性例数
阴性例数
合计
穿新防护服
5
70
75
穿旧防护服
10
18
28
合计
15
88
103
相应的等高条形图如图所示.
图中两个深色条的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
能力提升
11.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为(  )
A.与
B.与
C.与
D.与
解析 由题意,==,因为|ad-bc|的值越大,两个分类变量有关系的可能性就越大,故选A.
答案 A
12.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
子女吸烟
子女不吸烟
合计
父母吸烟
237
678
915
父母不吸烟
83
522
605
合计
320
1
200
1
520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
解 等高条形图如图所示:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
创新猜想
13.(多选题)已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的
(  )
A.ad≈bc
B.≈
C.≈
D.≈
解析 因为分类变量X,Y没有关系,所以≈,化简得ad≈bc,所以A,B正确,C,D显然不正确.
答案 AB
14.(多空题)下表是关于男婴与女婴出生时间调查的列联表:
晚上
白天
合计
男婴
45
A
B
女婴
E
35
C
合计
98
D
180
那么,A=__________,B=__________,C=__________,D=__________,E=__________.
解析 由列联表知识得解得
答案 47 92 88 82 53(共29张PPT)
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
?
课标要求
素养要求
1.通过实例,理解2×2列联表的统计意义.
2.理解判断两个分类变量是否有关系的常用方法.
通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.
新知探究
饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.
问题 人的身体健康状况与饮用水的质量之间有关系吗?
提示 我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.
1.
分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用______表示.
分类变量
实数
2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉__________.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
分类频数
?
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.
频率
频率稳定于概率
拓展深化
[微判断]
1.分类变量中的变量与函数中的变量是同一概念.
(
)
提示 分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.
2.列联表中的数据是两个分类变量的频数.
(
)
3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.
(
)
×


[微训练]
1.下列不是分类变量的是(  )
A.近视
B.成绩
C.血压
D.饮酒
解析 
近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案 B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
?
80分及80分以上
80分以下
合计
试验班
32
18
50
对照班
24
m
50
合计
56
44
n
答案 26 100
[微思考]
1.是否吸烟、是否患肺癌是什么变量?
提示 分类变量.
2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示 不是.
解 2×2列联表如下:
?
年龄在六十岁以上
年龄在六十岁以下
合计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
合计
70
54
124
将表中数据代入公式得
【训练1】 假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
?
y1
y2
x1
10
18
x2
m
26
则当m取下面何值时,X与Y的关系最弱(  )
A.8
B.9
C.14
D.19
解析 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
答案 C
题型二 用等高堆积条形图分析两分类变量间的关系
【例2】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
?
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1
020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
规律方法 利用等高堆积条形图判断两个分类变量是否相关的步骤:
【训练2】 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
解 根据题目给出的数据作出如下的列联表:
?
色盲
不色盲
合计

38
442
480

6
514
520
合计
44
956
1
000
根据列联表作出相应的等高堆积条形图:
从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.
一、素养落地
1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.
2.列联表与等高堆积条形图
列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.
二、素养训练
1.与表格相比,能更直观地反映出相关数据总体状况的是(  )
A.列联表
B.散点图
C.残差图
D.等高堆积条形图
答案 D
2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.
答案 
?
喜欢吃甜食
不喜欢吃甜食
合计

117
413
530

492
178
670
合计
609
591
1
200
3.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).
解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.
答案 有
4.(多空题)下面是一个2×2列联表:
?
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a=________,b=__________.
答案 52 54
5.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
?
患病
未患病
合计
服用药
10
45
55
未服用药
20
30
50
合计
30
75
105