8.3 列联表与独立性检验Word无答案

文档属性

名称 8.3 列联表与独立性检验Word无答案
格式 zip
文件大小 116.1KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-03-27 15:00:59

文档简介

课题:8.3
列联表与独立性检验
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下的结果
表1:吸烟与患肺癌列联表(单位:人),那么吸烟是否对患肺癌是否有影响?
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸 烟
2099
49
2148
总 计
9874
91
9965
(一)与列联表相关的概念
1、分类变量:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量
2、列联表:像表1这样列出的两个分类变量的数据统计表,称为2×2列联表
(二)独立性检验的基本思想
(1)假设(零假设或原假设):分类变量X和Y独立,即吸烟与患肺癌没有关系
不患肺癌
患肺癌
总计
不吸烟
a
b
a+b
吸 烟
c
d
c+d
总 计
a+c
b+d
a+b+c+d
(2)列联表,将数字用字母来代替
若“吸烟与患肺癌没有关系”,则在吸烟这种患肺癌的比例应该与不吸烟者中相应的比例差不多,即,即,
因此越小,说明吸烟与患肺癌之间的关系越弱;越大,说明吸烟与患肺癌之间的关系越强。
构造一个随机变量,其中为样本容量。
若成立,即“吸烟与患肺癌没有关系”,则应该很小,利用公式计算得到的观测值为,统计学家经过研究发现,在成立的情况下,,即在成立的情况下的观测值大于6.635的概率非常小,近似于0.010,是一个小概率事件。现在,远远大于6.635,所以有理由断定不成立,即认为“吸烟与患肺癌有关系”。但这种判断会犯错误,犯错误的概率不会超过0.010,即我们是以99%的把握认为“吸烟与患肺癌是有关系”的。在此规则中,把结论“成立”错判成“不成立”的概率不超过,即有99%的把握认为不成立。
(三)独立性检验的步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,
Y1
Y2
总计
X1
a
b
a+b
X2
c
d
c+d
总 计
a+c
b+d
a+b+c+d
计算的值并与临界值比较(当成立时,我们称为α的临界值);
(3)根据检验规则得出推断结论:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当时,我们没有充分证据推断H0不成立,可以认为X和Y独立
这种利用取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验
下表给出了独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
例如,对于小概率值α=0.05,我们有如下的具体检验规则:
当时,我们推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过0.05:
当时,我们没有充分证据推断H0不成立,可以认为X和Y独立
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律
001
002