8.3.2独立性检验 课件(共17张PPT)

文档属性

名称 8.3.2独立性检验 课件(共17张PPT)
格式 pptx
文件大小 1.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-06-13 10:04:28

图片预览

文档简介

(共17张PPT)
8.3.2独立性检验
一、普查与抽样调查的区别:
在现实问题中,我们常常需要推断两个分类变量之间是否存在关联.通过分类变量的样本观测数据,依据随机事件频率稳定性可以推断两个变量之间是否有关联.但对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.这是本节课的主要任务.
X Y 合计
Y=0 Y=1 X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
一般地通过简单随机抽样得到了X和Y的抽样数据列联有如下:
二、零假设(原假设):
“X对Y没有影响”可描述为:
P(Y=1|X=0)=P(Y=1|X=1)
零假设H0 : P(Y=1|X=0)=P(Y=1|X=1)
三、零假设(原假设)的等价条件:
三、零假设(原假设)的等价条件:
X Y 合计
Y=0 Y=1 X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
问题:依据频率稳定于概率的原理,你能构造一个能对分类变量X和Y的独立性作出推断的统计量吗?
若 H0成立,则 应很小。
-----卡方统计量
四、卡方统计量:
五、卡方独立性检验:
五、卡方独立性检验:
例1:某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
将所给数据进行整理,得到两种疗法治疗数据的列联表,
疗法 疗效 合计
未治愈 治愈 甲 15 52 67
乙 6 63 69
合计 21 115 136
根据列联表中的数据,经计算得到
根据小概率值=0.005的独立性检验,没有充分证据推断 H0不成立,因此可以认为 H0成立,即认为两种疗法效果没有差异.
问题求解:
问题1:根据小概率值=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
问题1:根据小概率值=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,经计算得到
根据小概率值=0.05的独立性检验,我们推断 H0不成立,即可以认为两种疗法效果有差异,该推断犯错误的概率不超过0.05,即有95%的把握认为疗法与疗效是有关的.
问题求解:
甲种疗法未治愈和治愈的频率分别是和
乙种疗法未治愈和治愈的频率分别是和 913.
因此可以推断乙种疗法的效果比甲种疗法好。
问题1:根据小概率值=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
疗法 疗效 合计
未治愈 治愈 甲 15 52 67
乙 6 63 69
合计 21 115 136
问题2:根据同一抽查数据推断两个分类变量之间是否有关联,应用不同的小概率值,为什么会得出不同的结论?
问题求解:
问题2:根据同一抽查数据推断两个分类变量之间是否有关联,应用不同的小概率值,为什么会得出不同的结论?
对于同一抽样数据,计算出来的是确定的.在独立性检验中,基于不同的小概率值的α的检验规则,对应不同的临界值xα,其与的大小关系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
问题求解:
例2.为了调查吸烟是否对肺癌有影响,某肿瘤研究所采取有放回简单随机抽样,调查了9965人,得到如下结果(单位:人).依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.
解:零假设为H0: 吸烟和患肺癌之间没有关系
根据列联表中的数据,经计算得到
2 =
χ

根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸 烟与患肺癌有关联,此推断犯错误的概率不大于0.001,即我们有99.9%的把握认为“吸烟与患肺癌有关系”.
吸烟 肺癌 合计
非肺癌患者(Y=0) 肺癌患者(Y=1) 非吸烟者(X=0) 7775 42 7817
吸烟者(X=1) 2099 49 2148
合计 9874 91 9965
问题求解:
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
吸烟者中不患肺癌和患肺癌的频率分别为

可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以上。于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌。
吸烟 肺癌 合计
非肺癌患者 肺癌患者 非吸烟者 7775 42 7817
吸烟者 2099 49 2148
合计 9874 91 9965
问题求解:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
应用独立性检验解决实际问题大致应包括以下几个主要环节:
注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.
六、方法总结
七、独立性检验与反证法之间的相同和不同之处
反证法原理:在某种假设H0之下,推出一个矛盾结论,从而证明了H0不成立.
独立性检验原理:在假设H0之下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断错误的概率不超过这个小概率.
在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.
谢谢观看!