独立性检验的基本思想及其初步应用

文档属性

名称 独立性检验的基本思想及其初步应用
格式 rar
文件大小 314.2KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2011-06-04 11:28:44

图片预览

文档简介

(共32张PPT)
独立性检验的基本
思想及其初步应用
研读教材P10-P12
1. 分类变量的概念;
2. 列联表的概念;
3.分类变量的独立性检验。
1.两种变量
定量变量:体重、身高、温度、考试成绩等等 分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等
变量
在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、相关指数R2、残差分析) 分类变量——独立性检验
变量
本节研究的是两个分类变量的独立性检验问题。
2. 你有哪些方法研究P10探究部分的问题:
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
那么吸烟是否对患肺癌有影响
为调查吸烟是否对患肺癌有影响, 某肿瘤研究所随机地调查了9965人,得 到如下结果(单位:人)
探 究
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在不吸烟者中患肺癌的比重是________; 在吸烟者中患肺癌的比重是_________;
列 联 表
探 究
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在不吸烟者中患肺癌的比重是________; 在吸烟者中患肺癌的比重是_________;
0.54%
2.28%
列 联 表
探 究
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在不吸烟者中患肺癌的比重是________; 在吸烟者中患肺癌的比重是_________; 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。
0.54%
2.28%
列 联 表
通过图形直观判断两个分类变量是否相关:
1. 列联表
通过图形直观判断两个分类变量是否相关:
1. 列联表
2. 三维柱形图
从三维柱形图能清晰看出各个频数的相对大小。
通过图形直观判断两个分类变量是否相关:
1. 列联表
2. 三维柱形图
3. 二维条形图
从三维柱形图能清晰看出各个频数的相对大小。
从二维条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例。
4. 等高条形图
等高条形图更清晰地表达了两种情况下患肺癌的比例。
3. 独立性检验可以考察两个分类变量是 否有关系, 且能较精确给出可靠程度:
(1) 假设两个分类变量X、Y没有关系;
总计
总计
(2) 列出X、Y的联表:
如果 “吸烟与患肺癌没有关系”,则在吸烟者中不患肺癌的比例与不吸烟者中且不患肺癌的比例差不多。即:
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。
H0
独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量——卡方统计量
若H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。
根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:
那么这个值到底能告诉我们什么呢?
在实际应用中,要在获取样本数据之前通过下表确定临界值:
也就是说,在H0成立的情况下,对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01。
也就是说,在H0成立的情况下,对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01。
[思考] 如果K2 6.635,就断定H0不成立,这种判断出错的可能性有多大
也就是说,在H0成立的情况下,对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01。
[思考] 如果K2 6.635,就断定H0不成立,这种判断出错的可能性有多大 答:判断出错的概率为0.01
判断H0是否成立的规则 如果K 6.635,就判断H0不成立,即认为吸 烟与患肺癌有关系;否则,就判断H0成立,即认 为吸烟与患肺癌有关系。 在该规则下,把结论“H0成立”错判成 “H0不成立”的概率不会差过P(K2 6.635) 0.01. 即有99%的把握认为H0不成立。 独立性检验的定义
判断H0是否成立的规则 如果K 6.635,就判断H0不成立,即认为吸 烟与患肺癌有关系;否则,就判断H0成立,即认 为吸烟与患肺癌有关系。 在该规则下,把结论“H0成立”错判成 “H0不成立”的概率不会差过P(K2 6.635) 0.01. 即有99%的把握认为H0不成立。 独立性检验的定义 上面这种利用随机变量K2来确定在多大程 度上可以认为“两个分类变量有关系”的方 法,称为两个分类变量的独立性检验。
[例1] 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系 你所得的结论在什么范围内有效?
[例1] 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系 你所得的结论在什么范围内有效? 解:根据题目所给数据得到如下列联表:
解:根据题目所给数据得到如下列联表:
根据联表中的数据,得到
例1理解: 秃头与患心脏病 1. 在解决实际问题时,可以直接计算K2的观测值k进行独立检验,而不必写出K2的推导过程 。
2. 本例中的边框中的注解,主要是使得学生们注意统计结果的适用范围(这由样本的代表性所决定)。
因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.
3. 独立性检验可以考察两个分类变量是 否有关系, 且能较精确给出可靠程度:
归纳小结
1. 列联表;
2. 等高线;
  独立性检验可以考察两个分类变量是 否有关系, 且能较精确给出可靠程度:
(1)假设两个分类变量X、Y没有关系;
归纳小结
2. 独立性检验可以考察两个分类变量是 否有关系, 且能较精确给出可靠程度:
(1) 假设两个分类变量X、Y没有关系;
总计
总计
(2) 列出X、Y的联表:
独立性检验的基本思想(类似反证法) (1) 假设结论不成立,即H0“两个分类变量 没有关系”。
(2) 在此假设下我们所构造的随机变量K2 应该很小,如果由观测数据计算得到K2的观测 值k很大,则在一定可信程度上说明H0不成立. 即在一定可信程度上认为“两个分类变量有关 系”;如果k的值很小,则说明由样本观测数 据没有发现反对H0的充分证据。 (3) 根据随机变量K2的含义,可以通过评 价该假设不合理的程度,由实际计算出的,说 明假设合理的程度为99%,即“两个分类变量 有关系”这一结论成立的可信度为约为99%。
***作业布置***
考一本《第30课时》