教
案
教学基本信息
课题
独立性检验(2)
学科
数学
学段:
高中
年级
高二
教材
书名:书名:普通高中课程标准实验教科书数学选修2-3
(B版)
出版社:人民教育出版社出版日期:2007
年
1
月
教学目标及教学重点、难点
教学目标:
1.通过对典型案例的探究,了解独立性检验的初步应用,加深对统计推断的认识.
2.经历案例学习的过程,运用所学方法进行初步的实际应用.
3.通过对数据整理和分析,培养分析问题解决问题的能力.
教学重点、难点:
重点:独立性检验的初步应用.
难点:加深对统计推断的认识.
教学过程(表格描述)
教学环节
主要教学活动
设置意图
引入
今天我们将继续学习独立性检验,首先复习相关知识
变量的分类及研究变量相关关系的方法
独立性检验的基本思想和方法
独立性检验的步骤
复习巩固.
新课
案例一:
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,对于人力资源部的研究项目,根据上述数据能得出什么结论?
积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189
首先,我们来看看需要研究的两个事件是工作态度和对企业改革的态度,对于工作态度有两个取值:积极和一般,对于企业改革的态度也有两个取值:支持和不太赞成,它们都是分类变量,要研究的是这两者间的关系,可以使用独立性检验.
其次,观察数据,通过比例值比较和等高线进行直观判断。
然后,假设二者独立,利用公式计算统计量值,公式比较复杂,我们带入数值时可以联系表格形式进行计算,值就是表格中四个数据的交叉乘积之差的平方,乘以总数,除以四个合计数据得到的。因为值10.759大于6.635,所以我们有99%的把握说员工工作积极与积极支持企改革是有关的,可以认为企业的全体员工对待企业改革的态度,与其工作积极性是有关的。
案例二:
在一次恶劣的飞行航程中调查男女乘客在机上晕机的情况,如下表所示,据此资料,你是否认为恶劣气候飞行中男性比女性更容易晕机?
晕机不晕机合计男243155女82634合计325789
首先,观察数据,通过比例值比较和等高线进行直观判断,可能会觉得男性晕机比例较高,
其次,在假设性别与晕机与否无关的前提下,计算
值为3.689,比对临界值,进行统计推断.
0.100.050.0250.0100.0052.7063.8415.0246.6357.879
,0.05通常称为显著性水平,3.841就是显著性水平0.05对应的分位数。类似的,任意给定一个显著性水平,可以找到其对应的分位数k,如果根据样本数据算出的值后,发现大于等于k成立,就称在犯错误概率不超过的前提下,可以认为A与B不独立;也称为有1-的把握认为A与B有关,小于k,就称没有1-的把握认为A与B有关。
现实中,显著性水平的取值是由具体问题确定的,如果接受犯错误的概率至多为0.05,那么对应的临界值是3.841,因为3.689<3.841,所以,没有95%的把握拒绝原假设,也就是说,没有95%的把握说晕机与否跟男女性别有关。所以,在本题中,尽管这次航班中男性晕机的比例比女性晕机的比例高,但我们不能认为在恶劣气候飞行中,男性比女性更容易晕机。
这和你的直觉是否一致呢?对两个分类变量的关系判断,我们从数据就会有一些直观的感觉,但是我们的结论是否可靠?统计的基本思维模式是归纳,它通过部分数据来推测全体数据的特征,因此,统计推断是可能犯错误的,独立性检验就是提供了一个标准,用卡方值来衡量事件之间的独立性是否成立。
案例三:
打鼾不仅影响别人休息,而且可能与某种疾病有关下表是一次调查所得的数据,请问每一晚都打鼾与患心脏病有关吗?
患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633
首先,通过计算比例值和等高线进行直观观察,
其次,假设二者独立,来算一下统计量,用列联表中间数据交叉乘积之差的平方,乘以总数除以四个合计数据,得到值约为68.033,因为68.033大于6.635,所以有99%的把握说每一晚都打鼾与患心脏病有关.
思考:在每一晚都打鼾的254人中,也只有30人患心脏病,患病概率0.118,略大于0.1,那为什么会有99%的把握说每一晚都打鼾与患心脏病有关?
辨析:1.
“有99%的把握说每一晚都打鼾与患心脏病有关”,指的是统计学上的关系,而不是因果关系。具体到某一个每一晚都打鼾的人,并不能说他患心脏病,至于他是否患心脏病,应该由医学检查来确定,这可不是统计学上的事儿.
2.
0.118是样本中每一晚都打鼾的人患心脏病的频率,我们用样本来估计总体,所以,可以认为总体中每一晚都打鼾的人患心脏病的概率是0.118.
3.
99%是反应实际观测到的数据与原假设之间不一致程度的一个概率是0.01,这个概率值越小,说明实际观测到的数据与原假设之间不一致程度越大,它与原假设对或错的概率无关,是关于数据的概率,是指在总体的许多样本中,若原假设成立,得到所观测数据的概率。小的概率值表明在原假设为真时,得到这样一个样本结果的可能性很小,所以应该拒绝原假设。这其实是基于小概率事件和实际推断原理进行的统计推断。
通过一个例子来理解一下小概率事件和实际推断原理在具体问题中的应用。
设鸡群中感染某种疾病的概率为20%,并且每只鸡是否受感染是相互独立的,新发现了一种血清,可能对预防这种疾病有效,为此对25健康的鸡注射了这种血清,过一段时间后发现其中只有一只鸡感染此病,请问这种血清是否有效?
稍微设想一下,可能觉得这种血清是有效的,毕竟有24只鸡未受感染,占绝大部分,但仔细一想,鸡群中大部分的鸡是不注射血清也不至于受感染,假如所抽取的25只鸡,正好属于这部分鸡群,那么不就反应不出这种血清的效力了吗?
.这一问题用下面的假设检验的方法来解决,首先做出统计假设:这种血清无效,
设A
=“25只鸡至多有一只鸡受到感染”,由于每只鸡是否受感染相互独立,所以,
用实际推断原理进行推断,这表明25只鸡中只有一只被感染是小概率事件,在一次实验中,实际上不可能发生的,但它现在竟然发生了,表明应该拒绝原假设这种血清无效,从而认为血清对于预防该病是有效的。
回到打鼾与患心脏病的问题中,当我们说有99%的把握是指在总体的许多样本中,若原假设成立,得到所观测数据的概率是0.01,
这个概率很小,所以和刚才的鸡群问题一样,应该拒绝原假设,我们就说有99%的把握拒绝原假设,也就是有99%的把握说每一晚都打鼾与患心脏病有关。
熟悉独立性检验的一般步骤,明白独立性检验进行的统计推断是面对全体而言。
将直观判断和独立性检验的结果对比,在认知冲突中解释显著性水平及对应分位数,加深对统计推断的理解。从直觉的判断到用卡方值推断,独立性检验源于统计学家对生活直觉的总结和抽象化,对它的学习有助于我们将变量间相关性的判断由直觉水平上升到科学水平.
辨析统计推断中
1-的含义,它是关于数据的概率,是指在总体的许多样本中,若原假设成立,得到所观测数据的概率。
假设检验是统计推断的一个重要组成部分,通过对小概率事件和实际推断原理的理解,加深独立性检验的统计推断的理解
练习
实际上在我们的周围,男女同学对许多问题的看法可能有差别,也可能没有差别,每个小组设计一个同学们较关心的只有两种答案的问题,如你打算报考理工类高校吗?你喜欢上数学课吗?通过询问同学取的数据,并对调查结果进行统计分析。注意决定样本容量时,必须保证所取得的四个数据都大于五。
这里有四个小组,他们分别研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的变量可能是其中的哪些呢?
成绩
性别不及格及格合计男61420女102232合计163652
表一
视力性别好差合计男51520女112132合计163652
表二
智商
性别偏高正常合计男71320女92332合计163652
表三
阅读量
性别丰富不丰富合计男81220女82432合计163652
表四
解:(1)假设性别与成绩独立,来算一下统计量,得到值约为0.009,因为0.009小于3.841,所以我们没有95%的把握说成绩及格与否与男女性别有关。
(2)假设性别与视力独立,来算一下统计量,得到值约为0.508,因为0.508小于3.841,所以没有理由拒绝原假设,也就是我们没有95%的把握说视力好坏与男女性别有关。
(3)假设性别与智商独立,来算一下卡方统计量,得到
值约为0.273,因为0.273小于3.841,所以也没有理由拒绝原假设,也就是我们没有95%的把握说智商与男女性别有关。
(4)假设阅读量与性别独立,来算一下卡方统计量,得到
值约为1.3,因为1.3小于3.841,所以也没有理由拒绝原假设,也就是我们没有95%的把握说阅读量丰富与否与男女性别有关。
不断经历从直观分析到独立性检验判断的过程,能够在现实生活中,对变量关系的判断主动上升到科学判断水平,并能够作出准确的统计推断。
总结
一、应用独立性检验解决了一些实际问题:
注意到独立性检验使用的一般步骤:会联系2
2列联表准确计算卡方值;也会进行统计推断。
二、不断加深对统计推断的认识:
1.统计推断是面向总体的推断,
2.对变量关系的直观判断上升到科学水平;
3.在具体问题中,通过对小概率事件和实际推断原理的理解,进一步理解了独立性检验中统计推断的含义。
在知识回顾提炼的过程中,反思学习过程,掌握独立性检验的一般步骤,进一步深化对统计推断的认识。
作业
分析以下案例:在500个人中试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下,问:该种血清对预防感冒是否有作用?
未感冒感冒合计用血清252248500未用血清224276500合计4765241000(共74张PPT)
独立性检验(2)
高二年级
数学
变量
数值变量
:如身高、体重、产量等
分类变量
:如性别,药物是否有效等
研究两个变量的相关关系
变量
数值变量
:回归分析
分类变量
:独立性检验
研究两个变量的相关关系
独立性检验的思想方法:
一般的,对于两个研究对象X
和Y
,X的取值
,
Y
的取值
,将得到的数据整理为2×2列联表,
X1
X2
合计
Y1
a
b
a+b
Y2
c
d
c+d
合计
a+c
b+d
n
表中:n=a+b+c+d.
独立性检验的思想方法:
假设:事件A,B无关,
X1
X2
合计
Y1
a
b
a+b
Y2
c
d
c+d
合计
a+c
b+d
n
独立性检验的思想方法:
独立性检验的思想方法:
X1
X2
合计
Y1
a
b
a+b
Y2
c
d
c+d
合计
a+c
b+d
n
独立性检验的一般步骤:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
第一步,提出假设:两个分类变量相互独立,
第二步,根据2×2列联表和公式计算
统计量,
第三步,比对临界值,做出判断.
≥
独立性检验的一般步骤:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
第一步,提出假设:两个分类变量相互独立,
第二步,根据2×2列联表和公式计算
统计量,
第三步,比对临界值,做出判断.
≥
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
例
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,得到数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
分析:
在工作积极的员工中支持企业改革的比例:
.
在工作一般的员工中支持企业改革的比例:
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
工作积极
工作一般
支持企业改革
不太赞成企业改革
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
分析:
X1
X2
合计
Y1
a
b
a+b
Y2
c
d
c+d
合计
a+c
b+d
n
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
分析:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
典型例题
解:由公式,
.
典型例题
解:由公式,
因为10.759>6.635,所以有99%的把握说员工工作积极与积极支持企业改革是有关的,
.
典型例题
解:由公式,
因为10.759>6.635,所以有99%的把握说员工工作积极与积极支持企业改革是有关的,可以认为企业的全体员工对待企业改革的态度,与其工作积极性是有关的.
.
典型例题
例
在一次恶劣的飞行航程中调查男女乘客在机上晕机的情况,如下表所示,据此资料,你是否认为恶劣气候飞行中男性比女性更容易晕机?
晕机
不晕机
合计
男
24
31
55
女
8
26
34
合计
32
57
89
男性中晕机的比例:
女性中晕机的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
男性
女性
晕机
不晕机
典型例题
解:由公式,
.
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
≥
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
显著性水平
≥
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
显著性水平
显著性水平0.05
对应的分位数
≥
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
在犯错误概率不超过
的前提下,可以认为A与B不独立
有
的把握认为A与B有关
≥
.
典型例题
解:由公式,
因为3.689<3.841,所以我们没有95%的把握说晕机与否跟男女性别有关.
.
典型例题
例
打鼾不仅影响别人休息,而且可能与某种疾病有关,下表是一次调查所得的数据,请问每一晚都打鼾与患心脏病有关吗?
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
每一晚都打鼾的人中患心脏病的比例:
不打鼾的人中患心脏病的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
每一晚都打鼾
不打鼾
患心脏病
未患心脏病
典型例题
解:由公式,
因为68.033>6.635,所以有99%的把握说每一晚都打鼾与患心脏病有关.
.
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
VS
99%
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
VS
99%
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
小概率事件
实际推断原理
:发生的概率很小的事件.
:小概率事件在一次实验中,
实际不可能发生.
小概率事件
实际推断原理
典型例题
例
设鸡群中感染某种疾病的概率为20%,并且每只鸡是否受感染是相互独立的,新发现了一种血清,可能对预防这种疾病有效,为此对25只健康的鸡注射了这种血清,过一段时间后发现其中只有一只鸡感染此病,请问这种血清是否有效?
分析:假设这种血清无效,计算25只鸡至多有一只鸡受到感染的概率,用统计方法和概率方法进行推理.
例
设鸡群中感染某种疾病的概率为20%,并且每只鸡是否受感染是相互独立的,新发现了一种血清,可能对预防这种疾病有效,为此对25只健康的鸡注射了这种血清,过一段时间后发现其中只有一只鸡感染此病,请问这种血清是否有效?
解:设A
=“25只鸡至多有一只鸡受到感染”,
由于每只鸡是否受感染相互独立,
所以,
.
解:设A
=“25只鸡至多有一只鸡受到感染”,
由于每只鸡是否受感染相互独立,
所以,
因为0.027<0.05,表明25只鸡中只有一只被感染是小概率事件,在一次实验中,实际上不可能发生的,但它现在竟然发生了,表明应该拒绝原假设这种血清无效,从而认为血清对于预防该病是有效的.
.
VS
99%
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
≥
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
课堂练习
课堂练习
为研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的的变量是其中的哪些呢?
阅读量
性别
丰富
不丰富
合计
男
8
12
20
女
8
24
32
合计
16
36
52
表一
表二
表三
表四
成绩
性别
不及格
及格
合计
男
6
14
20
女
10
22
32
合计
16
36
52
视力
性别
好
差
合计
男
5
15
20
女
11
21
32
合计
16
36
52
智商
性别
偏高
正常
合计
男
7
13
20
女
9
23
32
合计
16
36
52
成绩
性别
不及格
及格
合计
男
6
14
20
女
10
22
32
合计
16
36
52
男生中成绩不及格的比例:
女生中成绩不及格的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
男生
女生
不及格
及格
解:由公式,
因为0.009<3.841,所以我们没有95%的把握说成绩及格与否跟男女性别有关.
.
视力
性别
好
差
合计
男
5
15
20
女
11
21
32
合计
16
36
52
男生中视力好的比例:
女生中视力好的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
视力好
视力差
男生
女生
解:由公式,
因为0.508<3.841,所以我们没有95%的把握说视力好坏跟男女性别有关.
.
智商
性别
偏高
正常
合计
男
7
13
20
女
9
23
32
合计
16
36
52
男生中智商偏高的比例:
女生中智商偏高的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
智商偏高
智商正常
男生
女生
解:由公式,
因为0.273<3.841,所以我们没有95%的把握说智商跟男女性别有关.
.
阅读量
性别
丰富
不丰富
合计
男
8
12
20
女
8
24
32
合计
16
36
52
男生中阅读量丰富的比例:
女生中阅读量丰富的比例:
分析:
.
.
典型例题
分析:
0
0.9
0.8
0.7
0.6
0.5
0.3
0.4
0.1
0.2
1
阅读量丰富
阅读量不丰富
男生
女生
解:由公式,
因为1.3<3.841,所以我们没有95%的把握说阅读量是否丰富跟男女性别有关.
.
综上所述,我们没有95%的把握说成绩、视力、智商、阅读量与性别有关.
1.独立性检验的一般步骤,
2.独立性检验中统计推断的含义.
课堂小结
课后作业
在500个人中试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下,问:该种血清对预防感冒是否有作用?
未感冒
感冒
合计
用血清
252
248
500
未用血清
224
276
500
合计
476
524
1000