8.4列联表独立性分析案例
创设情境,引入新课
问题1、吸烟与患肺癌有关系吗?
问题2、有多大程度把握吸烟与患肺癌有关?
吸烟与肺癌的调查数据
患肺癌
不患肺癌
总计
吸烟
39
15
54
不吸烟
21
25
46
总计
60
40
100
为了调查吸烟是否对肺癌有影响,某医疗研究所随机地调查了100人,得到如下结果(单位:人)
在不吸烟者中患肺癌的比例是
在吸烟者中患肺癌的比例是
45.65%
72.22%
列联表(2×2)
创设情境,引入新课
分析:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.
三维
柱状图
通过图形直观判断得吸烟与患肺癌之间是否相关
二维
条形图
从三维柱形图能清晰看出
各个频数的相对大小
等高
条形图
从二维条形图、等高条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例
假设检验
H0:吸烟 和 患肺癌 之间没有关系
用 X 表示“吸烟”, Y 表示“患肺癌”
则
独立性
患肺癌
不患肺癌
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
Y
X
引入一个随机变量:卡方统计量
用它的大小作为衡量“两个因素(分类变量)”独立性强弱的标准
患肺癌
不患肺癌
总计
吸烟
39
15
54
不吸烟
21
25
46
总计
60
40
100
查对临界值表,作出判断
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
0.1%把握认为A与B无关
1%把握为A与B无关
99.9%把握认为A与B有关
99%把握认为A与B有关
95%把握认为A与B有关
5%把握认为A与B无关
没有充分的依据显示A与B有关,但也不能显示A与B无关
独立性检验
第一步:H0: 假设吸烟和患病之间没有关系
患病
不患病
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
第二步:列出2×2列联表
用χ2统计量研究这类问题的方法
步骤
第三步:代入公式
第四步:查对临界值表,作出判断
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例1、为考察高中生性别与是否喜欢数学课程之间的关系,在我校高中生中随机抽取100名学生,得到如下列联表:试分析:高中生的性别差异是否会对喜欢数学课程程度产生影响?为什么?
喜欢数学课程
不喜欢数学课程
总计
男
15
35
50
女
4
46
50
总计
19
81
100
Y
X
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例2、某项试验,在100次试验中,成功率只有10%,进行技术改造后,又进行了100次试验.试问:若要有97.5%以上的把握认为“技术改造有明显效果”,试验的成功率至少为多少?(设 )
例3、为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的193个病人的数据,能否作出药的效果和给药方式有关的结论?
有效
无效
合计
口服
58
40
98
注射
64
31
95
合计
122
71
193
解:设H0:药的效果与给药方式没有关系
<3.841
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
Y
X
1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误
D.以上三种说法都不正确.
练习巩固:
2. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:
根据以上数据,则( )
A.种子经过处理跟是否生病有关
B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
种子处理
种子未处理
合计
得病
32
101
133
不得病
61
213
274
合计
93
314
407
3.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下:
问这种血清能否起到预防感冒的作用?
未感冒
感冒
合 计
试验过
252
248
500
未用过
224
276
500
合 计
476
524
1000
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
假设该结论不成立
构造卡方统计量
根据卡方观测值的大小判断假设的合理程度
得到原结论成立的可信程度
课堂小结:
P(c2 ≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
设H0:X和Y之间没有关系
故有 的把握认为X与Y相关
列出2×2列联表