高中数学(人教版A版选修2-3)配套课件2份、教案、学案、同步练习题,补习复习资料:3.2 独立性检验的基本思想及其初步应用

文档属性

名称 高中数学(人教版A版选修2-3)配套课件2份、教案、学案、同步练习题,补习复习资料:3.2 独立性检验的基本思想及其初步应用
格式 zip
文件大小 3.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-08-15 12:05:50

文档简介

课件40张PPT。第三章3.2
独立性检验的基本思想及其初步应用2 突破常考题型题型一1 理解教材新知题型二3 跨越高分障碍4 应用落实体验随堂即时演练课时达标检测知识点一知识点二[提出问题]独立性检验的有关概念 提示:有.
问题2:通过怎样比较看出有?
提示:通过考前紧张的人数占性格类型的比例.[导入新知]个体所属 {x1,x2} {y1,y2} a+b+c+d 两个分类变量有关系[化解疑难] 独立性检验的思想 吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌.
问题1:事件A,B发生的频率可求吗?
提示:可以.
问题2:通常情况下,为研究问题方便,常用什么近似于概率?
提示:频率.
问题3:事件A,B无关有怎样的概率公式?
提示:P(AB)=P(A)P(B).假设结论不成立 列联表和等高条形图的应用 考查独立性检验的原理 [解题流程][规范解答](2)根据所给的数据可以完成列联表,如下表所示: (6分)此处易犯错误有两点:①计算失误;②将公式中的数据搞错. 解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.
答案:D 答案:C 3.独立性检验所采用的思路是:要研究A,B两类型变量彼
此相关,首先假设这两类变量彼此________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设________.
答案:无关 不成立答案:③第三章 统计案例
3.2 独立性检验的基本思想及其初步应用
A级 基础巩固
一、选择题
1.若用独立性检验的方法,我们得到能有99%的把握认为变量X与Y有关系,则(   )
A.K2≥2.706      B.K2≥6.635
C.K2<2.706 D.K2<6.635
解析:根据临界值表可知,选项B正确.
答案:B
2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
分类
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为(  )
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4
解析:比较.选项A中,=;选项B中,=;选项C中 ,=;选项D中,=.所以选项D正确.
答案:D
3.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出(  )
A.性别与喜欢理科无关
B.女生中喜欢理科的比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的比为60%
解析:从等高条形图可以看出,男生比女生喜欢理科的可能性大些.
答案:C
4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(   )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
A.① B.①③
C.③ D.②
解析:①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A、B,③正确.排除D,所以选项C正确.
答案:C
5.某校为了研究初一学生吃零食是否与性别有关,从初一年级抽取了100名学生调查购买零食的费用,规定每月在零食上花费不低于30元的为吃零食较多,每月在零食上花费不满30元的为吃零食较少.根据收集的数据得到了一个2×2列联表,并计算得出K2的观测值为k=4.365,则下列结论正确的是(   )
A.有97.5%的把握认为“初一学生吃零食与性别有关”
B. 有95%的把握认为“初一学生吃零食与性别有关”
C. 该校初一学生中有95%的学生吃零食较多
D. 该校初一学生中有95%的女生吃零食较多
解析:因为k=4.365>3.841,所以有95%的把握认为“初一学生吃零食与性别有关”.
答案:B
二、填空题
6.下列关于K2的说法中,正确的有________.
①K2的值越大,两个分类变量的相关性越大;
②若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;
③独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则做出拒绝H0的推断.
解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错误;根据独立性检验的概念和临界值表知②③正确.
答案: ②③
7.某小学对232名小学生调查发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验的方法判断多动症与性别________(填“有关”或“无关”).
解析:由题目数据列出如下列联表:
性别
多动症
无多动症
总计
男生
98
82
180
女生
2
50
52
总计
100
132
232
由表中数据可看到
k=≈42.117>10.828.
所以,在犯错误的概率不超过0.001的前提下,认为多动症与性别有关系.
答案:有关
8. 某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.
解析:先作出如下糖尿病患者与遗传列联表(单位:人):
家族
糖尿病发病
糖尿病不发病
总计
阳性家族史
16
93
109
阴性家族史
17
240
257
总计
33
333
366
根据列联表中的数据,得到K2的观测值为k=≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.
答案:97.5%
三、解答题
9.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:
分类
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
试用等高条形图分析服用药和患病之间是否有关系.
解:根据列联表所给的数据可得出服用药患病的频率为≈0.18,未服用药患病的频率为=0.4,
两者的差距是|0.18-0.4|=0.22,两者相差很大,
作出等高条形图如图所示,
因此服用药与患病之间有关系的程度很大.
10.为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果(疱疹面积单位:mm2).
表1 注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
60,65)
65,70)
70,75)
75,80)
频数
30
40
20
10
表2 注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
60,65)
65,70)
70,75)
75,80)
80,85)
频数
10
25
20
30
15
完成表3中的2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3
药物
疱疹面积小于
70 mm2
疱疹面积不小于
70 mm2
总计
注射药物A
a=
b=
注射药物B
c=
d=
总计
n=
解:表3完成如下:
药物
疱疹面积小于
70 mm2
疱疹面积不小于
70 mm2
总计
注射药物A
a=70
b=30
100
注射药物B
c=35
d=65
100
总计
105
95
n=200
由列联表中的数据,得K2的观测值为k=≈24.561>10.828.
因此,有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
B级 能力提升
1.有两个分类变量x,y,其2×2列联表如下表.其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.1的前提下认为“x与y之间有关系”,则a的取值应为(   )
变量
y1
y2
x1
a
20-a
x2
15-a
30+a
A.5或6       B. 6或7
C.7 或8 D.8或9
解析:查表可知,要使在犯错误的概率不超过0.1的前提下,认为K2之间有关系,则K2>2.706,而K2===,要使K2>2.706得a>7.19或a<2.04.又因为a>5且15-a>5,a∈Z,所以a=8或9,故当a取8或9时在犯错误的概率不超过0.1的前提下,认为“x与y之间有关系”.
答案:D
2.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
分类
又发作过心脏病
未发作过心脏病
总计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
总计
68
324
392
试根据上述数据计算K2=________,比较这两种手术对病人又发作心脏病的影响有没有差别_________.
解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值.k=≈1.78.
当H0成立时,K2=1.78,又K2<2.072的概率为0.85.所以,不能否定假设H0.也就是不能做出这两种手术对病人又发作心脏病的影响有差别的结论.
答案:1.78 不能做出这两种手术对病人又发作心脏病的影响有差别的结论
3.某教育科研机构研发了一款新的学习软件,为了测试该软件的受欢迎程度,该公司在某市的两所初中和两所小学按分层抽样法抽取部分学生进行了调研.已知这四所
学校在校学生有9 000人,其中小学生5 400人,参加调研的初中生有180人.
(1)参加调研的小学生有多少人?
(2)该科研机构将调研的情况统计后得到下表:
学生
喜爱使用
该学习软件
不太喜爱使用
该学习软件
总计
初中生
60
120
180
小学生
90
总计
请将上表填写完整,并据此说明是否有99.9%的把握认为“喜爱使用该学习软件”与“学生年龄”有关.
解:(1)这四所学校共9 000人,其中小学生5 400人,
所以初中生有3 600人,
因为参加调研的初中生有180人,
所以抽取比例为=.
所以参加调研的小学生有5 400×=270(人).
(2)由(1)知参加调研的总人数为180+270=450,
所以表格中的数据如下表所示:
学生
喜爱使用
该学习软件
不太喜爱使用
该学习软件
总计
初中生
60
120
180
小学生
180
90
270
总计
240
210
450
因为,K2=≈16.071>10.828,
所以有99.9%的把握认为“喜爱玩该游戏”与“学生年龄”有关.
§3.2独立性检验的基本思想及其应用(1)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;
(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;
(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤。
【教学难点】:.(1)了解独立性检验的基本思想;
(2)了解随机变量的含义,太大认为两个分类变量是有关系的。
【教学过程设计】:
教学环节
教学活动
设计意图
一、问题引入
介绍分类变量的概念:变量的不同”值”表示个体所属的不同类别,如性别变量男女,是否吸烟,宗教信仰,国籍等.
2. 在日常生活中,我们关心两个分类变量之间是否有关系,如:吸烟是否与患肺癌有关?
引例.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
那么吸烟是否对患肺癌有影响?
为探索新知识做准备.
二、探究新知
教师引导:统计学中一般采取什么方式手段研究分析解决问题? 如何运用统计学的方法进行分析判断?
学生探究:
1.利用频率分布表判断;
不患肺癌
患肺癌
总计
不吸烟
99.46%
0.54%
1
吸烟
97.72%
2.28%
1
由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;
利用统计图直观判断
(1) 通过三维柱形图判断两个分类变量是否有关系:
由图中能清晰看出各个频数的相对大小, 由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响;
(2) 通过二维条形图判断两个分类变量是否有关系:
作出患肺癌在吸烟者与不吸烟者中的的频率条形图
由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例, 可估计吸烟对患肺癌有影响.
教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题.
师生共同探究:
为研究的一般性,在列联表中用字母代替数字
不患肺癌
患肺癌
总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
师:若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论?
生:在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即
a/a+b≈c/c+d a(c+d) ≈ c(a+b) ad -bc ≈ 0
师:若计算ad –bc的结果,由此可以初步得出什么结论?
生:︱ad –bc︱越小,说明吸烟与患肺癌之间关系越弱;
︱ad –bc︱越大,说明吸烟与患肺癌之间关系越强.
师:为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量
其中 为样本容量
若假设成立,应该很小;若很大,说明假设不成立,即两变量有关系. 利用上述公式,可计算出问题中的的观测值为
同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大?
在假设成立的情况下,统计学家估算出如下的概率:
现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99%的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基本思想,可以表述为:当 很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。
师:类比反证法的原理,你能否总结出独立性检验的基本步骤?
生:(1)假设两个分类变量与无关系;
(2)计算出的观测值;
(3)把k的值与临界值比较确定与有关的程度或无关。
鼓励学生自己寻找研究问题的一般统计学的方法
通过图表的方法,使学生巩固统计学中一般研究问题的基本思路。
利用独立事件同时发生的概率公式启发学生做出假设
采用类比的方法,便于学生理解假设检验的思想
三、形成方法
方法总结:
要推断“X与Y有关系”成立的可能性的方法:
1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系, (1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求k值 (3)下结论
培养学生归纳的能力
四、练习巩固
1、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个变量有关系的可能性就( A )
A.越大 B.越小 C.无关系 D.无法确定
2、对于2×2列联表,在二维条形图中,两个比例的值相差越大,则
“与有关系”的可能性 越大 。
3、为了调查高中生的数学成绩和物理成绩的关系,在某校随机抽取部分学生做调查,得到下列两份图表
根据以上图表,列出相应的列联表,根据图形回答,数学成绩好坏与物理成绩好坏 关系。
解:列联表如下:
物理好
物理差
合计
数学好
80
120
200
数学差
70
30
100
合计
150
150
300
根据图形,可知数学成绩好坏与物理成绩好坏 有 关系。
巩固知识,培养技能.
五、拓展与提高
思考:
某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的,今研制一种新的预防药,任选5只羊做试验,结果这5只羊服用此药后均未患病,问此药是否有效?
解:假设药无效,5只羊都不生病的概率是,这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明假设不对,即药是有效的。
某接待站在某一周曾接待过12次来访,已知所有这12次接待都是在周二和周四进行的,问是否可以推断接待时间是有规定的?
解:利用小概率事件进行判断。假设接待时间没有有规定,即一周内任意一天都等可能,则12次接待在周二和周四的概率为,即千万分之三,根据小概率事件在一次实验中几乎不可能发生的思想,可知假设不成立,即可推断接待时间是有规定的。
加深学生对假设检验思想的理解,能应用于实际问题中
五、小结
判断两个分类变量是否有关的方法
反思归纳
六、作业
1为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
请问有多大把握认为药物有效?
2、通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:


总计
读营养说明
16
28
44
不读营养说明
20
8
28
总计
36
36
72
请问性别和读营养说明之间在多大程度上有关系?
同步练习与测试:
(基础题)
1、根据下表计算:
不看电视
看电视

37
85

35
143
计算随机变量的观测值k= 。
解:把表格补充完整
不看电视
看电视
总计

37
85
122

35
143
178
总计
72
228
300
4.51
2、独立性检验常作的图形是 和 。
答案 :三维柱形图 ,二维条形图
3、两个临界值为3.841与6.635。当时,认为事件A与B是 (填“有关的”或“无关的”);当时,有99%的把握说事件A与B是 (填“有关的”或“无关的”)。
答案:无关的 ,有关的
4、用统计量进行独立性检验时使用的表称为 ,要求表中的四个数据大于 。
答案:列联表 ,5
(中等题)
5、设A为一随机事件,则下列式子中不正确的是()
A. B.
C. D.
答案:选C
6、统计假设成立时,有以下判断:
其中真命题个数是( )
A.1 B.2 C.3 D.4
答案:选C
7、设事件A与B相互独立,则(1)和B相互独立;(2)和A相互独立;(3)和相互独立,其中真命题是( )
A.(1)(2) B.(1)(3) C.(2)(3) D.(1)(2)(3)
答案:选D
§3.2独立性检验的基本思想及其应用(2)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:进一步加强阅读三维柱形图和二维条形图的能力;加强理解独立性检验思想,会利用独立性检验方法解决实际问题。
(2)过程与方法:提供多个案例,让学生能自觉运用独立性检验的思维解决问题。
(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤,初步应用。
【教学难点】:(1)了解独立性检验的基本思想;
(2)了解随机变量的含义,太大认为两个分类变量是有关系的。
【教学过程设计】:
教学环节
教学活动
设计意图
一、复习巩固
要推断“X与Y有关系”成立的可能性的方法:
1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
(1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求k值 (3)下结论
二、例题讲解
例1、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关?你所得的结论在什么
范围内有效?
解:秃顶 与患心脏病列联表
 
患心脏病
患其他病
总计
秃顶
214
175
389
不秃顶
451
597
1048
总计
665
772
1437
相应的三维柱形图入图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,
因此可以在某种程度上认为“秃顶与患心脏病有关”。
在假设的前提下,
二、例题讲解
所以有99%的把握认为“秃顶与患心脏病有关”.所得结论只适合住院的病人群体
思考:因为k≈16.373>10.828,所以有99.9%以上的把握认为“秃顶与患心脏病有关”,这和上述结论矛盾吗?
解答:这种说法的推理过程也是正确的,两种说法不矛盾。
例2、为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校
高中生中随机抽取300名学生,得到如下列联表:
 
喜欢数学课程
不喜欢数学课程
总计

37
85
122

35
143
178
总计
72
228
300
(1)计算K2的观察值k;(2)在多大程度上可以认为高中生的性别与是否喜
欢数学课程之间有关系?为什么?
解 (1)在假设“性别与是否喜欢数学课程之间没有关系”的前提下,
k≈4.513
(2)在假设的前提下, K2 应该很小,k≈4.513>3.841,
P(K2>3.841) ≈0.05, “性别与是否喜欢数学课程之间有关系”错误的可能性为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间没有关系”.
例3、在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况,共调查了89位乘客,其中男乘客24人晕机,31人不晕机,女乘客有8人晕机,26人不晕机,根据此材料你是否认为在恶劣气候的飞行中,男人比女人更容易晕机?
分析:列2×2列联表进行独立性检验
解:由已知数据制成下表
晕机
不晕机
总计
男人
24
31
55
女人
8
26
34
总计
32
57
89
根据公式。由于k﹥2.706,我们有90%的把握认为在本次飞机飞行中,晕机与男女有关。尽管这次航班中男人晕机的比例比女人晕机的比例高,但我们不能认在恶劣气候的飞行中,男人比女人更容易晕机。晕机与男女关系是指统计上的关系,不误认为是因果关系。
由所给数据得到2X2列联表,由此复习列联表的制作方法
第二问主要复习样本的代表性。
在熟悉解列联表检验的基本原理后,可以通过直接计算K2的值(不画图)来解决独立性问题
解题中突出强调K2的含义。
三、问题探究
探究问题:某项实验,在100次试验中,成功率只有10%,进行技术改造后,又进行了100次试验,试问:若要有97.5%的把握认为“技术改造后有明显效果”,试验的成功率最少应为多少?(设)
解:由题意,设技术改造后试验成功次数为,给出列联表如下:
成功
不成功
总计
技术改造前
10
90
100
技术改造后
100-
100
总计
10+
190-
200
则有
解得或(舍去)
所以,若要有97.5%以上的把握认为“技术改造后有明显效果”,试验的成功率最少应为22%。
四、练习巩固
1、为了研究患支气管炎与吸烟的关系,共调查了228人的日吸烟量调查结果如下:
日吸烟10~19支
日吸烟20~40
合计
患者
98
25
123
非患者
89
16
105
合计
187
41
228
试问患支气管炎是否与吸烟有关?
解:由公式知
由于,我们没有理由认为患支气管炎与吸烟有关。
2、在500人身上实验某种血清预防感冒的作用,把记录与500个未用血清的人作比较,结果如下表所示:
未感冒
感冒
合计
试验过
252
248
500
未用过
224
276
500
合计
476
524
1000
作出二维条形图,通过图形判断这种血清是否能够起到预防感冒的作用,并进行独立性检验。
解:(二维条形图略)由公式得
从条形图看,这种血清对预防感冒有作用,由于,我们有90%的把握认为起作用。
四、练习巩固
3、甲乙两个班进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得出班级与成绩列联表:
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
45
总计
17
73
90
画出列联表的条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性检验估计,认为“成绩是否优秀与班级有关系”犯错误的概率是多少?
解:(图略)由图及表直观判断好象“成绩与班级有关系”
因为,
从而有50%的把握认为“成绩是否优秀与班级有关系”,即断言“成绩是否优秀
与班级有关系”犯错误的概率为0.5。
五、小结
独立性检验是一种假设检验,在对总体的估计中,通过抽取样本构造合适的统
计量,对假设的正确性进行判断。
六、作业
1、收集班上所有学生的身高的数据,构造一个关于每一个学生的性别与其身高是否高于(或低于)中位数的列联表,推断性别与身高在多大程度上有关系?
2、在报纸、杂志、互联网找一个抽样调查报告,构造一个2×2列联表,并讨
论调查中的两个分类变量之间在多大程度上相关。
同步练习:
(基础题)
1、在研究某种新措施对猪白痢的防治效果问题时,得到了以下数据:
存活数
死亡数
合计
新措施
132
18
150
对照
114
36
150
合计
246
54
300
试问新措施对猪白痢的防治效果如何?
解:由公式得:,由于7.3176.635,所以我们有99%的把握认为新措施对猪白痢的防治是有效的。
2、调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能以多大的把握认为婴儿的性别与出生时间有关系。
晚上
白天
合计
男婴
24
31
55
女婴
8
26
34
合计
32
57
89
解:由公式得:,所以没有充分的证据显示婴儿的性别与出生时间有关。
3、为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下列是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究实验结果。
70及70分以下
70分以上
合计
实验班
32
18
50
对照班
12
38
50
合计
44
56
100
解:由公式得:,所以有99.9 %的把握认为在初中一年级代数教学中加强概念和推理教学,与初中二年级平面几何期中测验成绩有关。
4、下列表格是两种教法实验的成绩对比统计,试分析两种教法的效果。
及格
不及格
合计
掌握教学法
36
8
44
常规教学法
40
16
56
合计
76
24
100
解:由公式得:,所以这两种教学方法对学生成绩的效果是相互独立的。
5、为了确定居民的头发颜色与居地的依赖关系,分别在两个地区A、B调查了两组人群,其结果如下表:
棕黄色、黑色
浅色
合计
A
24
6
30
B
32
38
70
合计
56
44
100
由调查得到的结果,能否证实居民的发色与他们的居地有关?
解:由公式得:,所以有99 %的把握认为居民的发色与他们的居地有关。
6、研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药有无恶心副作用?
有恶心
无恶心
合计
给此药
15
35
50
给安慰剂
4
46
50
合计
19
81
100
解:由公式得:,所以有99 %的把握认为此药有恶心副作用。
7、调查发现,在300名吸烟者和1200名不吸烟者中,都有6个人患了肺癌,
则根据这项调查,可以有多大的把握认为“吸烟与患肺癌有关”? ( )
A、99% B、95% C、90% D、没有充分证据显示吸烟与患肺癌有关
答案:选A
学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为(  )
A.在犯错误的概率不超过0.05的前提下认为X与Y有关系
B.在犯错误的概率不超过0.01的前提下认为X与Y有关系
C.没有充分理由认为X与Y有关系
D.不能确定
【解析】 ∵K2≤2.706,∴没有充分理由认为X与Y有关系.
【答案】 C
2.下列关于等高条形图的叙述正确的是(  )
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
【解析】 在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.
【答案】 C
3.分类变量X和Y的列联表如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
则下列说法正确的是(  )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越弱
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
【解析】 对于同一样本,|ad-bc|越小,说明X与Y之间关系越弱;|ad-bc|越大,说明X与Y之间的关系越强.
【答案】 C
4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是(  )
A.k≥6.635      B.k<6.635
C.k≥7.879 D.k<7.879
【解析】 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.
【答案】 C
5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下表的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,
k=≈7.8.
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是(  )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
【解析】 由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.
【答案】 C
二、填空题
6.在对某小学的学生进行吃零食的调查中,得到如下表数据:
吃零食
不吃零食
总计
男学生
27
34
61
女学生
12
29
41
总计
39
63
102
根据上述数据分析,我们得出的K2的观测值k约为________.
【解析】 由公式可计算得k=≈2.334.
【答案】 2.334
7.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析时的统计假设是________.
【解析】 根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.
【答案】 小白鼠的死亡与电离辐射的剂量无关
8.在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.(填序号)
【解析】 K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
【答案】 ③
三、解答题
9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.
阳性
阴性
总计
荧光抗体法
160
5
165
常规培养法
26
48
74
总计
186
53
239
附:
P(K2≥k0)
0.010
0.005
0.001
k0
6.635
7.879
10.828
(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系;
(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?
【解】 (1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.
(2)通过计算可知K2=≈113.184 6.而查表可知,因为P(K2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.
10.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表;
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?
【解】 (1)2×2的列联表:
中国人
外国人
总计
有数字
43
27
70
无数字
21
33
54
总计
64
60
124
(2)假设“国籍和邮箱名称里与是否含有数字无关”.
由表中数据得k=≈6.201.
因为k>5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”.
[能力提升]
1.对两个分类变量A,B,下列说法中正确的个数为(  )
①A与B无关,即A与B互不影响;
②A与B关系越密切,则K2的值就越大;
③K2的大小是判定A与B是否相关的唯一依据.
A.1    B.2    C.3    D.0
【解析】 ①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.
【答案】 A
2.(2018·晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是(  )
A.有95%的把握认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血清,那么他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
【解析】 K2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.
【答案】 A
3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
设H:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
【解析】 由公式计算得K2的观测值k≈4.9.∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.
【答案】 4.9 5%
4.(2018·潍坊高二检测)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:
高茎
矮茎
总计
圆粒
11
19
30
皱粒
13
7
20
总计
24
26
50
(1)现采用分层抽样的方法,从该样本所含的圆粒玉米中取出6株玉米,再从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;
(2)根据对玉米生长情况作出的统计,是否有95%的把握认为玉米的圆粒与玉米的高茎有关?
【解】 (1)依题意,取出的6株圆粒玉米中含高茎2株,记为a,b;矮茎4株,记为A,B,C,D,从中随机选取2株的情况有如下15种:aA,aB,aC,aD,bA,bB,bC,bD,ab,AB,AC,AD,BC,BD,CD.
其中满足题意的共有aA,aB,aC,aD,bA,bB,bC,bD,共8种,则所求概率为P=.
(2)根据已知列联表,
得k=≈3.860>3.841,即有95%的把握认为玉米的圆粒与玉米的高茎有关.
课件53张PPT。3.2 独立性检验的
基本思想及其初步应用自主学习 新知突破1.通过对实际问题的分析探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;了解独立性检验的常用方法:等高条形图及K2统计量法.
2.通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.
3.理解独立性检验的基本思想及实施步骤,能运用自己所学知识对具体案例进行检验. 饮用水的质量是人类普遍关心的问题.
据统计,饮用优质水的518人中,身体状
况优秀的有466人,饮用一般水的312人中,
身体状况优秀的有218人.
人的身体健康状况与饮用水的质量之间有关系吗?
[提示] 人的身体健康状况与饮用水的质量之间有关系.1.分类变量
变量的不同“值”表示个体所属的___________,像这样的变量称为分类变量.
2.列联表
(1)定义:列出的两个分类变量的___________,称为列联表.分类变量和列联表不同类别频数表 (2)2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:分类变量及其关系的分析的理解
(1)这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等.
(2)频数分析是指用不同类别的事件发生的频率的大小比较来分析分类变量是否有关联关系.
(3)等高条形图更加形象直观地反映两个分类变量之间的差异,进而推断它们之间是否具有关联关系.1.等高条形图与表格相比,更能直观地反映出两个分类变量间是否___________,常用等高条形图展示列联表数据的___________.
2.观察等高条形图发现_________和________相差很大,就判断两个分类变量之间有关系.等高条形图相互影响频率特征绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色.独立性检验独立性检验思想的理解及常用的几个数值
(1)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算得K2的观测值k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.(2)在实际问题中要记住以下几个常用值:
①若k≥6.635,则在犯错误的概率不超过0.01的前提下认为“X与Y有关系”;
②若k≥3.841,则在犯错误的概率不超过0.05的前提下认为“X与Y有关系”;
③若k≥2.706,则在犯错误的概率不超过0.1的前提下认为“X与Y有关系”;
④若k<2.706,则认为没有充分证据显示“X与Y有关系”.1.观察下列各图,其中两个分类变量x,y之间关系最强的是(  )
解析: 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.
答案: D2.下面是一个2×2列联表:
则表中a,b处的值分别为(  )
A.94,96      B.52,50
C.52,54 D.54,523.在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.
解析: K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
答案: ③4.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.附:合作探究 课堂互动利用等高条形图判断分类变量间的关系 2012年5月1日起我国对醉驾列入法律,交通事故明显降低,现从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:
(1)试作出相应的等高条形图;
(2)结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系. [思路点拨]    (1)相应的等高条形图如图:
(2)图中两个深色条的高分别表示司机血液中有酒精和无酒精样本中对事故负有责任的频率,从图中可以看出,司机血液中有酒精样本中对事故负有责任的频率明显高于司机血液中无酒精样本中对事故负有责任的频率.由此可以认为司机血液中含有酒精与对事故负有责任有关系.
2.分析分类变量关系的步骤:
(1)作大量的调查、研究,统计出结果;
(2)列出列联表利用频率粗略估计;
(3)作出等高条形图,从直观上进一步判断分类变量之间的关联关系.
特别提醒: 通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度.1.某校对学生课外活动进行调查,结果整理成下表:
请根据数据,利用图形判断:喜欢体育或喜欢文娱是否与性别有关系.解析: 其等高条形图如图所示.
由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系.利用随机变量K2判断分类变量间的关系 下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.
[思路点拨]  (1)根据表中的信息计算K2的观测值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).
两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们在犯错误的概率不超过0.001的前提下肯定结论的正确性,(2)中我们在犯错误的概率不超过0.025的前提下肯定结论的正确性. 12分[规律方法] 利用K2公式判断两分类变量是否有关系的方法2.某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:
根据表中数据,能否在犯错误的概率不超过0.001的前提下认为这一问题的看法与性别有关系?(P(K2≥10.828)≈0.001)独立性检验的综合应用 为了调查某生产线上质量监督员甲对产品质量的好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量的好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲在不在生产现场与产品质量的好坏有关系? [思路点拨]  解析: (1)2×2列联表如下:
由列联表可得|ac-bd|=|982×17-493×8|=12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关”. (2)由等高条形图可知:在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
[规律方法] 判断两个分类变量之间有无关系,可以用2×2列联表、等高条形图、独立性检验等方法作出判断,其中从列联表和等高条形图中只能粗略地进行估计,要进行精确的判断,必须利用独立性检验进行计算并与临界值对比.3.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,做出列联表,试用独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?解析: 根据题目所给的数据作出如下的列联表:◎为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,数据如表,试问吸烟量与年龄是否有关?
[提示]  由于对2×2列联表中a,b,c,d的位置不确定,在代入公式时取错了数值,导致计算结果的错误.谢谢观看!