课件15张PPT。
1.1 独立性检验 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病, 183人不患病;不吸烟的295人中21人患病, 274人不患病。 根据这些数据能否断定:患病与
吸烟有关吗?问题:问题:为了研究这个问题,我们将上述问题用下表表示:2×2列联表注:什么叫列联表?列联表:列出两个分类变量的频数统计表分类变量:变量的不同“值”表示个体所属的不同
类别,这样的变量称为分类变量.
注:分类变量的取值一定是离散的,而且不同的
取值仅表示个体所属的类别如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等. 性别有两种:性别变量,只取男、女两个值男、女问题:为了研究这个问题,我们将上述问题用下表表示:2×2列联表21/295 ≈ 7.12%37/220≈16.82%上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?如果“吸烟与患病没有关系””,则在吸烟者中不患病
的比例应该与不吸烟者中相应的比例差不多,即因此|ad-bc|越小,说明吸烟与患病之间关系越弱; |ad-bc| 越大,说明吸烟与患病之间关系越强.为便于研究,用字母代替数据,得2×2列联表列出2×2列联表 我们不妨作出相反的假设,H0:吸烟和患病之间没有关系 即H0:P(AB)=P(A)P(B) 其中A为某人吸烟,B为某人患病 设n=a+b+c+d
为样本量 吸烟且患病人数吸烟但未患病人数不吸烟但患病人数不吸烟且未患病人数怎样描述实际观测值与预期值的差异呢?统计学中,为度量观测值与预期值的差值
皮尔逊(K.Pearson)引进卡方统计量即卡尔.皮尔逊——
英国著名的应用数学家 、
生物统计学家、优生学家
和科学哲学家.若H0成立,即“吸烟与患病没有关系””,则χ2应很小 独立性检验通过公式计算H0: 吸烟和患病之间没有关系解:这个值是不是很大呢?在H0成立的情况下,统计学家估算出如下的概率: H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系” 独立性检验第一步:H0: 吸烟和患病之间没有关系 通过数据和图表分析,得到结论是:吸烟与患病有关结论的可靠程度如何? 第二步:列出2×2列联表 用χ2统计量研究这类问题的方法步骤第三步:引入一个随机变量:卡方统计量第四步:查对临界值表,作出判断。0.1%把握认
为A与B无关1%把握认为A与B无关99.9%把握认
为A与B有关99%把握认
为A与B有关90%把握认
为A与B有关10%把握认为
A与B无关没有充分的依据显示A与B有关,但也不能显示A与B无关例如:反证法原理与假设检验原理反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。总结: