(共12张PPT)
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
【学习目标】
1.理解分类变量与列联表的含义.
2.能用列联表、等高堆积条形图探讨两个分类变量的关联性,提高数据分析的数学素养.
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调查数据, 你能从中分析吸烟对患肺癌的影响程度吗
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
我们研究只含有两个结果的变量 (X 、Y)X=0,1 Y=0,1
如: 是否吸烟, 是否信仰宗教, 性别等.
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量.
如上表这样, 列出两个分类变量的频数表, 称为列联表.特别地,两个变量都只有两个结果,这样的列联表叫【2×2列联表】
什么叫“分类变量”“列联表”
问题2. 阅读课本你P124-P125 理解两个概率值(条件概率、频率近似概率)
明白【列联表】是有实用价值的.
请同学们练习巩固“列联表”再继续往下学习
B
问题3. 阅读课本你P126 例1上面那段话, 提出了什么问题?
问题4. 阅读课本 P126 -P127 例1 学会画【等高堆积条形图】
问题5. 阅读课本 P127 思考及最后一段
1.下列关于等高条形图的叙述正确的是( )
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
随堂巩固: 等高条形图的理解
解析
在等高条形图中仅能粗略地判断两个分类变量的关系,故A错,C对.在等高条形图中仅能够找出频率,无法找出频数,故B错.
C
2.如图是调查某地区男女中学生是否喜欢理科的等高条形图,从图中可以看出该地区的中学生( )
A.性别与是否喜欢理科无关
B.女生中喜欢理科的比例为80%
C.男生比女生喜欢理科的可能性大
D.男生中喜欢理科的比例为80%
随堂巩固:等高条形图的理解
解析
从图中可以看出,男生喜欢理科的比例为60%,而女生喜欢理科的比例仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,男生比女生喜欢理科的可能性更大一些.故选C.
C
随堂巩固:等高条形图的理解
解析
D
3.[河南八市2019高二第三次质量检测]观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是 ( )
方法一:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间的关系最强,故选D.
方法二:在频率等高条形图中, 与 相差很大时,我们认为两个分类变量有关系,即等高条形图中x1,x2所占比例相差越大,则两个分类变量关系越强,故选D.
问题6. 做一做:课本P127练习4
线上学习 展翅翱翔