教
案
教学基本信息
课题
3.2.2
独立性检验的基本思想及其初步应用(2)
学科
数学
学段:高中
年级
高二
教材
书名:普通高中课程标准实验教科书数学选修2-3(A版)
出版社:人民教育出版社
出版日期:2009年4月
教学目标及教学重点、难点
教学目标:
了解独立性检验的基本思想及其初步应用,能从列联表的数据,等高条形图直观观察两个分类变量是否有关系,并会用公式判断两个分类变量是否有关系,以及这种判断犯错误的概率;
通过对典型案例(吸烟与患肺癌是否有关系)的探究,了解独立性检验的基本思想,总结独立性检验的基本步骤,初步感受假设检验的思想;
通过对典型案例(吸烟与患肺癌是否有关系)的探究,感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常生活问题中的作用.
教学重点:进一步理解独立性检验的统计学原理.
教学难点:了解随机变量的定义原理,了解的含义.
教学过程
教学环节
主要教学活动
设置意图
引入
复习旧知
我们知道,变量可以分为数值变量和分类变量.
数值变量的取值一定是实数,取值大小有特定的含义,不同值之间的运算也有特定的含义.
分类变量也称为定性变量,这种变量的不同“值”表示个体所属的不同类别,它们的取值一定是离散的.
问题1.
前面我们学习了独立性检验的基本思想及其初步应用第一课时内容,事件A与事件B相互独立是怎么定义的呢?
三张奖券中只有一张能中奖,现分别由三名同学有放回地抽取,事件A为“第一名同学没有抽到中奖奖券”,事件B为“最后一名同学抽到中奖奖券”.
,
.
一般地,为两个事件,若,则称事件与事件相互独立.
,
,
.
问题2:某肿瘤研究所随机地调查了9965人,得到如下结果.请你回答,吸烟与患肺癌是否有关系?
在不吸烟的7817个样本中,有42人患肺癌,频率为;在吸烟的2148个样本中,有49人患肺癌,频率为.
复习上课节所学内容,唤醒学生的记忆,为本节课顺利实施做好知识和思想方面的准备;
复习时间的独立性,为进一步从理论上说明“独立性检验”的原因作铺垫.
“如果事件A与事件B相互独立,那么A与,与B,与都相互独立”是非常重要的一个概念,也是本节课要用的知识,需要复习.
继续用这个例子,复习独立性检验的步骤.
通过列联表数据可以得出结论.
观察等高条形图,也可以直观上可以认为吸烟更容易引发肺癌.
新课
讲解新课
问题3:通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”,那么这种判断是否可靠呢?
假设:“吸烟与患肺癌没有关系”;
A:不吸烟,B:不患肺癌.
“吸烟与患肺癌没有关系”“吸烟与患肺癌独立”;
所以假设成立.
由于事件发生的频数为,频率为;事件发生的频数为,频率为;事件发生的频数为,频率为.
因为所以有,化简方式,将其整理为,通分可得,最后可整理为
.
因为事件A与事件B相互独立,那么事件与事件B也相互独立,所以,有,将其整理为,通分整理可得.
同理时,;
时,.
所以定义.
问题4:的观测值是大还是小,有没有一个确定的标准呢?
统计学家经过研究后制作了下面的临界值表
因为,所以我们可以下结论“吸烟与患肺癌有关系”.
问题5:你能总结一下独立性检验的步骤吗?
第一步,根据实际问题的需要确定容许犯错误概率的上界,然后查表确定的临界值.
第二步,利用公式求得随机变量的观测值.
第三部,进行判断.如果,就推断在犯错误概率不超过的情况下,两个分类变量有关系;否则,两个分类变量没有关系.
问题6:检验是独立性检验的常用方法,但是不是唯一的方法.你能够尝试给出一种判断分类变量“吸烟(X)和患肺癌(Y)是否有关系”的规则呢?
假设“吸烟与患肺癌没有关系”;“吸烟和不吸烟两个群体患肺癌或不患肺癌的概率是相同的”,所以有和.
所以可以定义.
问题7:上面我们学习了检验的计算公式,这里又定义了检验的计算公式,请同学们思考,这两个公式之间有联系吗?
因为,所以,等价于,所以可取.
之后我们就可以制定检验的具体做法:
首先编制检验的临界值表,包括犯错误的上界和的临界值。
之后根据实际问题的需要确定容许犯错误概率的上界,然后查表确定的临界值.
第二步,利用公式求得随机变量的观测值.
第三部,进行判断.如果,就推断在犯错误概率不超过的情况下,两个分类变量有关系;否则,两个分类变量没有关系.
通过本例让学生进一步体会独立性检验的基本思想,明白“独立”的重要性.
此处的整理方式与上节课不同,要体会这种不同,为进一步理解的结构作铺垫.
此处的探究活动有助于学生深刻的理解的结构特征.
对上述因式特征进行分析,“自然”地得到的表达式.
从小概率事件的角度理解左侧所述公式,是很困难的,但又是独立性检验的最终目的.
从方法的角度对独立性检验的步骤进行规范.
检验是独立性检验的常用方法,但是不是唯一的方法,进一步体会计算公式的“合理性”.
考虑不同公式之间的联系,化未知为已知.
针对不同的列联表,学生可以自己编织界值表,由于太难,本节课不做探究.
规范解题步骤,其实是对检验的基本思想及其应用的一个再次巩固.
例题
例1
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.
(1)利用图形判断秃顶与患心脏病是否有关系;
(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?
解:(1)根据已知的数据得到如下列联表:
(2)根据列联表中的数据,得到的观测值
.
因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.
说明:该结论只适用于该院的住院病人群体,不适用于其他群体.
让学生复习列联表的制作方法,运用独立性检验的思想解决实际问题.
总结
通过归纳总结,进一步加深学生对独立性检验思想的理解.
从章节的角度对所学内容进行总结.
作业
为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
能否在犯错误的概率不超过0.025的前提下认为药物有效呢?
复习回顾独立性检验的思想方法.(共27张PPT)
独立性检验的基本思想及其初步应用(
)
高二年级
数学
分类变量也称为定性变量,这种变量的不同“值”表示个体所属的不同类别,它们的取值一定是离散的.
变量
数值变量
分类变量
两个变量间的关系:
数值变量的取值一定是实数,取值大小有特定的含义,不同值之间的运算也有特定的含义.
回归分析
独立性检验
问题1:前面我们学习了独立性检验的基本思想及其初步应用第一课时内容.事件
与事件
相互独立是怎么定义的呢?
三张奖券中只有一张能中奖,现分别由三名同学有放回地抽取,事件A为“第一名同学没有抽到中奖奖券”,事件B为
“最后一名同学抽到中奖奖券”
一般地,A,B为两个事件,若
,则称事件A与事件B相互独立.
可以证明,如果事件A与事件B相互独立,那么
与
,
与
,
与
都相互独立.
问题1:前面我们学习了独立性检验的基本思想及其初步应用第一课时内容.事件
与事件
相互独立是怎么定义的呢?
列联表
不患肺癌
患肺癌
总
计
不吸烟
7775
42
7817
吸 烟
2099
49
2148
总 计
9874
91
9965
问题2:某肿瘤研究所随机地调查了9965人,得到如下结果.请你回答,吸烟与患肺癌是否有关系?
吸烟群体和不吸烟群体患肺癌的可能性存在差异;直观上可以认为吸烟更容易引发肺癌.
等高条形图
问题3:通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”,那么这种判断是否可靠呢?
假设
:吸烟与患肺癌没有关系
事件A:不吸烟
事件B:不患肺癌
吸烟与患肺癌没有关系
吸烟与患肺癌独立
成立
不患肺癌
患肺癌
总
计
不吸烟
a
b
a+b
吸 烟
c
d
c+d
总 计
a+c
b+d
a+b+c+d
:不吸烟且不患肺癌
:不吸烟
:不患肺癌
将上面的列联表中的数字用字母代替,得到如下列联表:
频率
概率
假设
:“吸烟与患肺癌没有关系”成立
成立时,有:
不患肺癌
患肺癌
总
计
不吸烟
a
b
a+b
吸 烟
c
d
c+d
总 计
a+c
b+d
a+b+c+d
:吸烟
:不患肺癌
假设
:“吸烟与患肺癌没有关系”成立
假设
:“吸烟与患肺癌没有关系”成立
成立时,有:
假设
:“吸烟与患肺癌没有关系”成立
建立统一标准
构造一个随机变量
的观测值
直观感觉
的观测值比较大,所以假设
不成立,
也就是说“吸烟与患肺癌有关系”.
的观测值应该很小
若假设
成立
的观测值
是大还是小,有没有一个确定的标准呢?
统计学家经过研究后制作了下面的临界值表:
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
,这个式子的含义是,我们所下结论“吸烟与患肺癌有关系”犯错误的概率不会超过0.01.
的观测值
,可知“吸烟与患肺癌有关系”.
小概率事件
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
所以,在犯错误的概率不超过0.001的条件下,可以认为“吸烟与患肺癌有关系”.
如果开始确定犯错误的概率不超过0.001,我们能否认为吸烟与患肺癌有关?
依然求得
的观测值
,有
.
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
独立性检验的具体做法:
犯错误概率的上界
的“临界值”
(1)根据实际问题的需要确定容许犯错误的上界
,然后查表确定
的临界值
.
(2)利用
公式求得随机变量
的观测值
.
(3)如果
,就推断在犯错误概率不超过
的情况下,两个分类变量有关系;否则,两个分类变量没有关系.
例1
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.
(1)利用图形判断秃顶与患心脏病是否有关系;
(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?
秃顶
患心脏病
解:根据已知的数据得到如下列联表:
患心脏病
患其他病
总计
秃顶
不秃顶
总计
214
665
451
175
772
597
389
1437
1048
(1)等高条形图如图所示:
比较图中两个绿色条的高可以发现,秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率.所以可以认为秃顶与患心脏病有关系.
不秃顶
(2)根据列联表中的数据,得到
的观测值
因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心
脏病有关系.
说明:该结论只适用于该院的住院病人群体,不适用于其他群体.
问题4:
检验是独立性检验的常用方法,但是不是唯一的方法.你能够尝试给出一种判断分类变量“吸烟(X)和患肺癌(Y)是否有关系”的规则吗?
不患肺癌
患肺癌
总
计
不吸烟
a
b
a+b
吸 烟
c
d
c+d
总 计
a+c
b+d
a+b+c+d
假设:“吸烟与患肺癌没有关系”;
考虑到符号,我们不妨定义
.
假设:“吸烟与患肺癌没有关系”
越小(大)
吸烟与患肺癌之间关系越弱(强)
问题5:
检验的计算公式是
,
我们上面研究的
检验的计算公式
,
这两个公式之间有联系吗?
因为
,
所以
等价于
,所以可取
.
的“临界值”
检验的具体做法:
犯错误概率的上界
(1)根据实际问题的需要确定容许犯错误的上界
,然后查表确定
的临界值
.
(2)利用
公式求得随机变量
的观测值
.
(3)如果
,就推断在犯错误概率不超过
的情况下,两个分类变量有关系;否则,两个分类变量没有关系.
编制
检验的临界值表,包括
和
独立性检验必要性
列联表数据、等高条形图
独立性检验
样本数据
数据具有随机性
提供所得结论犯错误的概率
独立性检验步骤
确定犯错误概率的上界
确定临界值
比
大小
作判断
课堂小结
课堂小结
画图
引入指标
准确刻画
“身高”可以解释64%
“体重”变化
引入随机变量
准确刻画
99%的把握认为“吸烟”
和“患肺癌”有关
犯错概率不超过0.01
列表
列表
画图
数值变量
分类变量
回归分析
独立性检验
为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
能否在犯错误的概率不超过0.025的前提下认为药物有效呢?
患病
未患病
总
计
服用药
10
45
55
没服用药
20
30
50
总计
30
75
105
课后作业
药物效果试验列联表