课件22张PPT。1.2
独立性检验的基本思想
及初步应用(1)问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ;
“这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件;
这个小概率事件的发生使庞加莱得出推断结果。一:假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个
叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。例如,在前面的例子中, 原假设为: H0:面包分量足,
备择假设为 H1:面包分量不足。
这个假设检验问题可以表达为:
H0:面包分量足 ←→ H1:面包分量不足
二:求解假设检验问题考虑假设检验问题:
H0:面包分量足 ←→ H1:面包分量不足在H0成立的条件下,构造与H0矛盾的小概率事件;
如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。
求解思路:三:三个概念1、分类变量2、列联表
3、等高条形图问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28% 1)通过图形直观判断两个分类变量是否相关:
二维条形图2)通过图形直观判断两个分类变量是否相关:
患肺癌
比例不患肺癌
比例H0: 吸烟和患肺癌之间没有关系
←→ H1: 吸烟和患肺癌之间有关系通过数据和图表分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何? 引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准 。通过公式计算 独立性检验已知在 成立的情况下,即在 成立的情况下,K2 大于6.635概率非常小,近似为0.01现在的K2=56.632的观测值远大于6.635独立性检验: 利用随机变量 来确定在多大程度上可以认为”两个分类变量有关系”的方法称为两个分类变量的独立性检验.(为假设检验的特例)
分类变量之间关系条形图柱形图列联表独立性检验背景分析例3、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
试根据上述数据比较这两种手术对对病人又发作心脏病的影响有没有差别。 练习:1:某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示
对于人力资源部的研究项目,根据上述数据能得出什么结论?
2、在一次恶劣气候飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此资料您是否认为在恶劣气候飞行中男人比女人更容易晕机?
3、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?
?