8.3 列联表与独立性检验
A组
1.在研究打鼾与患心脏病之间的关系时,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )
A.100个心脏病患者中至少有99人打鼾
B.若1个人患心脏病,则这个人有99%的概率打鼾
C.100个心脏病患者中一定有打鼾的人
D.100个心脏病患者中可能一个打鼾的人都没有
答案:D
2.下列关于等高堆积条形图的叙述正确的是( )
A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系
B.从等高堆积条形图中可以看出两个变量频数的相对大小
C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
答案:C
3.分类变量X和Y的列联表如下:
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
则下列说法正确的是( )
A.ad-bc越小,说明X与Y的关系越弱
B.ad-bc越大,说明X与Y的关系越弱
C.(ad-bc)2越大,说明X与Y的关系越强
D.(ad-bc)2越接近于0,说明X与Y的关系越强
解析:对于同一样本,|ad-bc|越小,说明X与Y之间的关系越弱;|ad-bc|越大,说明X与Y之间的关系越强.
答案:C
4.有两个分类变量X,Y,其列联表如下,
X Y 合计
Y1 Y2
X1 a 20-a 20
X2 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( )
A.8 B.9
C.8或9 D.6或8
解析:根据公式,得
χ2=
=>3.841,
根据a>5,且15-a>5,a∈Z,求得当a=8或9时满足题意.
答案:C
5.在对某小学的学生进行吃零食的调查中,得到如下表数据:
性别 是否吃零食 总计
吃零食 不吃零食
男学生 27 34 61
女学生 12 29 41
总计 39 63 102
根据上述数据分析,我们得出的χ2值约为 .
解析:由公式可计算得χ2=≈2.334.
答案:2.334
6.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,阴性家族史者糖尿病发病的有17例,不发病的有240例,那么,在犯错误的概率不超过 的前提下认为糖尿病患者与遗传有关系.
解析:列出2×2列联表:
家族史 是否发病 总计
发病 不发病
阳性家族史 16 93 109
阴性家族史 17 240 257
总计 33 333 366
χ2=≈6.067>3.841,
因此,在犯错误的概率不超过0.05的前提下认为糖尿病患者与遗传有关.
答案:0.05
7.有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表;
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,依据小概率值α=0.05的χ2独立性检验,你能帮他判断一下吗
解:(1)2×2的列联表如下:
有无数字 国别 合计
中国人 外国人
有数字 43 27 70
无数字 21 33 54
合计 64 60 124
(2)零假设为H0:国籍和邮箱名称里是否含有数字无关.
由表中数据得χ2=≈6.201>3.841=x0.05.
根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即认为国籍和邮箱名称里含有数字有关,此推断犯错误的概率不超过0.05.
8.某校为调查高中生在校参加体育活动的时间,随机抽取了100名高中学生进行调查,其中男女各占一半,下面是根据调查结果绘制的学生日均体育锻炼时间的频率分布直方图:
将日均体育锻炼时间不低于40分钟的学生评价为“良好”,已知“良好”评价中有18名女生.
学生性别 是否良好 合计
非良好 良好
男生
女生
合计
(1)请将列联表补充完整;
(2)试依据小概率值α=0.01的独立性检验,分析高中生的性别是否与喜欢体育锻炼有关.
参考公式:χ2=,n=a+b+c+d.
χ2独立性检验中常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)设学生日均体育锻炼时间为x分钟,
根据频率分布直方图可知P(x≥40)=(0.025+0.020+0.005)×10=0.5.
抽取总人数为100,故评价为“良好”的学生人数为50.列联表如下:
学生性别 是否良好 合计
非良好 良好
男生 18 32 50
女生 32 18 50
合计 50 50 100
(2)零假设为H0:高中生的性别与喜欢体育锻炼无关.
则χ2=
=
=
=7.84>6.635
=x0.01;
根据小概率值α=0.01的独立性检验,有充分证据推断H0不成立,即高中生的性别与喜欢体育锻炼有关,此推断犯错误的概率不超过0.01.
B组
1.用旧设备和改造后的新设备冶炼某种金属,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表:
设备 杂质含量
杂质高 杂质低
旧设备 37 121
新设备 22 202
根据以上数据,则( )
A.在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.新设备生产的产品中所含杂质比旧设备低
D.以上答案都错误
解析:由已知数据得到如下2×2列联表:
设备 杂质含量 合计
杂质高 杂质低
旧设备 37 121 158
新设备 22 202 224
合计 59 323 382
χ2=≈13.11.
由于13.11>10.828,则在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造是有关的.
答案:A
2.某机构调查市民收入增减与购买愿望的关系时,采用独立性检验法抽查了6 000人,计算发现χ2=7.831,则根据这一数据查阅下表,该机构断言市民收入增减与购买愿望有关系的可信程度是( )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.90% B.95%
C.99% D.99.9%
答案:C
3.针对时下的“短视频热”,某校团委对“学生性别和喜欢短视频是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢短视频的人数占男生人数的,女生喜欢短视频的人数占女生人数的.零假设为H0:喜欢短视频与性别无关.若根据小概率值α=0.05的独立性检验,有充分证据推断出H0不成立,即认为喜欢短视频与性别有关,且此推断犯错误的概率不超过0.05,则男生至少有( )
A.12人 B.6人
C.10人 D.18人
解析:设男生至少为x人,依题意可得列联表如下:
学生性别 是否喜欢短视频 合计
喜欢短视频 不喜欢短视频
男生 x
女生
合计 x
由题意可得χ2>3.841,
由χ2=x>3.841,解得x>10.24,
∵都为整数,∴男生至少有12人.
答案:A
4.(多选题)下列说法正确的是( )
附:χ2独立性检验中常用的小概率值和相应的临界值
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.经验回归方程对应的直线x+至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
B.命题“ x≥1,x2+3≥4”的否定是“ x≥1,x2+3<4”
C.样本相关系数r越小,表明两个变量相关性越弱
D.由一个2×2列联表,得χ2=13.079,根据小概率值α=0.001的独立性检验,认为这两个变量间有关系
解析:经验回归方程对应的直线x+一定经过(),可能不经过样本数据点,故A不正确;
命题“ x≥1,x2+3≥4”的否定是“ x≥1,x2+3<4”,故B正确;
样本相关系数|r|越小,表明两个变量的相关性越弱,故C不正确;
列联表中计算χ2=13.079>10.828=x0.001,故D正确.故选BD.
答案:BD
5.某足球联赛期间,某电视台对年龄高于40岁和不高于40岁的人是否喜欢甲队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
年龄 是否喜欢甲队 合计
不喜欢甲队 喜欢甲队
高于40岁 p q 50
不高于40岁 15 35 50
合计 a b 100
若工作人员从调查的所有人中任取一个,取到喜欢甲队的人的概率为,在犯错误的概率不超过 的前提下认为年龄与甲队的被喜欢程度有关.
附:χ2=.
χ2独立性检验中常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解析:设“从所有人中任意抽取一人,取到喜欢甲队的人”为事件A,由已知得P(A)=,
解得q=25,p=25,a=40,b=60.
χ2=≈4.167>3.841.
故在犯错误的概率不超过0.05的前提下认为年龄与甲队的被喜欢程度有关.
答案:0.05
6.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件.试分别用列联表、小概率值α=0.001的独立性检验的方法分析监督员甲是否在生产现场对产品质量有影响.
分析 根据题目中给出的相关数据,列出2×2列联表求解.
解:2×2列联表如下.
甲是否在现场 合格品数 次品数 合计
在生产现场 982 8 990
不在生产现场 493 17 510
合计 1 475 25 1 500
由列联表可得|ac-bd|=|982×17-493×8|=12 750,则ac与bd相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
零假设为H0:质量监督员甲是否在生产现场与产品质量无关.由2×2列联表中数据,计算得到χ2=≈13.097>10.828=x0.001,根据小概率值α=0.001的独立性检验,有充分证据推断出H0不成立,即质量监督员甲是否在生产现场与产品质量有关,该推断犯错误的概率不超过0.001.
7.某市各中学组织了一次“创建全国文明城市”知识问答竞赛.为便于对答卷进行对比研究,抽取了1 000名男生和1 000名女生的答卷,他们竞赛成绩的频率分布直方图如下:
(注:问卷满分为100分,成绩高于或等于90分的试卷为“优秀”等级,成绩高于或等于80分且低于90分的试卷为“良好”等级)
(1)从现有1 000名男生和1 000名女生的答卷中各取一份,分别求答卷成绩为“良好”等级的概率;
(2)把等级为“优秀”和“良好”统称为“优良”,求列联表中a,b,c,d的值,依据小概率值α=0.01的独立性检验,分析答卷等级优良是否与性别有关.
是否优良 性别 合计
男 女
优良 a b a+b
非优良 c d c+d
合计 1 000 1 000 2 000
附:χ2独立性检验中常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
χ2=,n=a+b+c+d.
解:(1)男生答卷成绩良好的概率为P=(0.058+0.034)×5=0.46,
女生答卷成绩良好的概率为P=(0.046+0.034)×5=0.4.
(2)由题意可得,a=(0.058+0.034+0.014+0.010)×5×1 000=580,
b=(0.046+0.034+0.016+0.010)×5×1 000=530,
c=1 000-580=420,d=1 000-530=470,
综上可知,a=580,b=530,c=420,d=470;
零假设为H0:答卷等级优良与性别无关.
由列联表计算
χ2=≈5.06<6.635
=x0.01,
根据小概率值α=0.01的独立性检验,没有充分证据推断出H0不成立,因此可以认为H0成立,即答卷等级优良与性别无关.(共51张PPT)
8.3 列联表与独立性检验
第八章
2022
内容索引
01
02
03
自主预习 新知导学
合作探究 释疑解惑
随堂练习
课标定位素养阐释
1.了解分类变量、2×2列联表、随机变量χ2的意义.
2.了解独立性检验的基本思想方法.
3.了解两个分类变量的独立性检验的应用.
4.通过本节课的学习,进一步培养学生的逻辑推理、数据分析的核心素养.
自主预习 新知导学
一、分类变量与列联表
【问题思考】
1.某省大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:
如何直观判定“喜欢体育还是文娱与性别有联系”
提示:可通过表格与图形进行直观分析.
性别 课外活动 合计
体育 文娱
男生 210 230 440
女生 60 290 350
合计 270 520 790
2.填一填:(1)我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为 分类变量 .
(2)按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为 2×2列联表 ,关于分类变量X和Y的抽样数据的2×2列联表如下:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
3.做一做:
下面是一个2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a 21 73
X=1 2 25 27
合计 b 46 100
则表中a,b处的值分别为( )
A.94,96 B.52,50 C.52,54 D.54,52
解析:a=73-21=52,b=100-46=54.
答案:C
二、独立性检验
【问题思考】
1.有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗 为什么
提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.
2.填一填:(1)利用χ2的取值推断分类变量X和Y是否独立的方法称为
χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过 α ;
当χ2(4)χ2独立性检验中几个常用的小概率值和相应的临界值:
(5)应用独立性检验解决实际问题大致应包括以下几个主要环节:
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
③根据检验规则得出推断结论.
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
3.做一做:
若两个分类变量X和Y的2×2列联表为:
则X与Y之间有关系的可信度为 ,此推断犯错误的概率不超过 .
X Y 合计
Y=0 Y=1
X=0 5 15 20
X=1 40 10 50
合计 45 25 70
解析:χ2≈18.8>10.828.
故有99.9%的把握认为X与Y有关系.又P(χ2≥10.828)=0.001,故此推断犯错误的概率不超过0.001.
答案:99.9% 0.001
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)列联表中的数据是两个分类变量的频数.( √ )
(2)χ2的大小是判断分类变量X与Y是否相关的统计量.( √ )
(3)当χ2≥x0.05=3.841时,认为X和Y不独立,该推断犯错误的概率超过0.05.( × )
(4)当χ2合作探究 释疑解惑
探究一
利用等高堆积条形图判断两个分类变量是否存在差异
【例1】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类型是否有关系.
解:作列联表如下:
心情 性格 合计
性格内向 性格外向
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
在考前心情紧张的群体中,性格内向的约占61%,在考前心情不紧张的群体中,性格内向的约占20%.
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.
利用等高堆积条形图判断两个分类变量是否相关的步骤:
(1)统计:收集数据,统计结果.
(2)列表:列出2×2列联表,计算频率、粗略估计.
(3)绘图:绘制等高堆积条形图,直观分析.
【变式训练1】 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试数学成绩不及格,而另外800人中有120人数学成绩不及格.利用图形判断学生经常上网与数学学习成绩是否有关.
解:根据题目所给的数据得到如下2×2列联表:
数学成绩 上网 合计
经常上网 不经常上网
不及格 80 120 200
及格 120 680 800
合计 200 800 1 000
得出等高堆积条形图如图所示:
比较图中阴影部分的高可以发现经常上网数学成绩不及格的频率明显高于经常上网数学成绩及格的频率,因此可以认为经常上网与数学成绩有关.
探究二
独立性检验
【例2】 某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,依据α=0.001的独立性检验,分析数学成绩优秀分别与物理、化学、总分优秀的相关性.
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.
数学成绩 物理优秀 化学优秀 总分优秀
优秀 228 225 267
非优秀 143 156 99
解:(1)零假设为H0:数学成绩与物理成绩独立,即数学成绩对物理成绩没有影响.根据已知数据列出2×2列联表如下:
数学成绩 物理成绩 合计
物理优秀 物理非优秀
数学优秀 228 b 360
数学非优秀 143 d 880
合计 371 b+d 1 240
∴b=360-228=132,d=880-143=737,b+d=132+737=869.
代入公式可得χ2≈270.114>10.828=x0.001.
(2)按照上述方法列出数学与化学优秀的2×2列联表如下:
数学成绩 化学成绩 合计
化学优秀 化学非优秀
数学优秀 225 135 360
数学非优秀 156 724 880
合计 381 859 1 240
代入公式可得χ2≈240.611>10.828=x0.001.
(3)列出数学与总分优秀的2×2列联表如下:
数学成绩 总成绩 合计
总分优秀 总分非优秀
数学优秀 267 93 360
数学非优秀 99 781 880
合计 366 874 1 240
代入公式可得χ2≈486.123>10.828=x0.001.
根据小概率值α=0.001的独立性检验,我们认为数学成绩优秀与物理、化学、总分优秀有关系,此推断犯错误的概率不大于0.001.
利用χ2进行独立性检验的步骤
(1)列表:列出2×2列联表.
(2)求值:求出χ2的值.
(3)判断:与临界值比较,得出事件有关的可能性大小,作出判断.
【变式训练2】 某周末,某公园内汇聚了八方来客.面对该公园内相邻的两个主题园区“千古蝶恋”和“西游传说”,成年人和未成年人选择游玩的意向会有所不同.某统计机构对公园内的100位游客(这些游客只在两个主题园区中二选一)进行了问卷调查.调查结果显示,在被调查的50位成年人中,只有10人选择“西游传说”,而选择“西游传说”的未成年人有20人.
(1)根据题意,请将下面的2×2列联表填写完整;
年龄特征 主题园区 合计
选择“西游传说” 选择“千古蝶恋”
成年人
未成年人
合计
(2)根据小概率值α=0.01的独立性检验,分析选择哪个主题园区与年龄特征的相关性.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)根据题目中的数据,列出2×2列联表如下:
年龄特征 主题园区 合计
选择“西游传说” 选择“千古蝶恋”
成年人 10 40 50
未成年人 20 30 50
合计 30 70 100
(2)零假设为H0:年龄特征与选择主题园区独立,即成年人和未成年人对主题园区的选择没有差异.
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为年龄特征与选择主题园区无关.
探究三
独立性检验的综合应用
【例3】 某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过简单随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示.
组别 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)
男 2 3 5 15 18 12
女 0 5 10 10 7 13
(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请列出2×2列联表,依据小概率值α=0.05的独立性检验,分析“环保关注者”是否与性别有关.
(2)若问卷得分不低于80分的人称为“环保达人”,视频率为概率:
①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又有女“环保达人”的概率;
②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得两次抽奖活动;其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对应的概率如下表:
现某市民要参加此次问卷调查,记X(单位:元)为该市民参加问卷调查获得的红包金额,求X的分布列及数学期望.
χ2独立性检验中常用的小概率值和相应的临界值
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)零假设为H0:性别与是否为“环保关注者”独立,
由题中表格可得2×2列联表如下:
性别 是否为“环保关注者” 合计
非“环保关注者” “环保关注者”
男 10 45 55
女 15 30 45
合计 25 75 100
将2×2列联表中的数据代入公式
根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为性别与“环保关注者”独立.
独立性检验综合应用的方法策略
(1)独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.
(2)近几年高考中较少单独考查独立性检验,经常与统计、概率等知识综合,频率分布表、频率分布直方图与独立性检验融合在一起是常见的考查形式,一般需要根据条件列出2×2列联表,计算χ2的值,从而解决问题.
【变式训练3】 为比较注射A,B两种药物产生的皮肤疱疹的面积,选200只家兔作试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2所示的分别是注射药物A和药物B后皮肤疱疹面积的频数分布.(疱疹面积单位:mm2)
表1
疱疹面积 [60,65) [65,70) [70,75) [75,80]
频数 30 40 20 10
表2
疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85]
频数 10 25 20 30 15
(1)完成图①和图②所示的分别注射药物A,B后皮肤疱疹面积的频率分布直方图,并求注射药物A后疱疹面积的中位数;
图①
图②
(2)完成下面的2×2列联表,依据小概率值α=0.001的独立性检验,分析注射两种药物是否与疱疹面积有关.
注射药物 疱疹面积 合计
疱疹面积小于70 mm2 疱疹面积不小于70 mm2
注射药物A a= b=
注射药物B c= d=
合计
χ2独立性检验中常用的小概率值和相应的临界值
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:(1)根据题意,完成图①和图②所示的频率分布直方图,如图所示:
图①
图②
(2)零假设为H0:注射药物与疱疹面积独立,即注射两种药物对疱疹面积没有差异.
根据题意填写列联表如下:
注射药物 疱疹面积 合计
疱疹面积小于70 mm2 疱疹面积不小于70 mm2
注射药物A a=70 b=30 100
注射药物B c=35 d=65 100
合计 105 95 200
根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为注射两种药物对疱疹面积有差异,此推断犯错误的概率不大于0.001.
易错辨析
独立性检验思想的应用
【典例】 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
是否需要志愿者 性别
男 女
需要 40 30
不需要 160 270
(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.
(2)试根据小概率值α=0.01的独立性检验,分析该地区老年人需要志愿者提供帮助是否与性别有关.
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例 说明理由.
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该地区老年人需要志愿者提供帮助与性别有关,此推断犯错误的概率不大于0.01.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层随机抽样方法,比采用简单随机抽样方法更好.
独立性检验与反证法的区别与联系
简单地说,反证法是在某种假设H0之下,推出一个矛盾结论,从而证明H0不成立;而独立性检验是在零假设H0之下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不大于这个小概率.另外,在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.
随堂练习
1.对于分类变量X与Y的随机变量χ2的值,下列说法正确的是( )
A.χ2越大,“X与Y有关系”的可信程度越小
B.χ2越小,“X与Y有关系”的可信程度越小
C.χ2越接近于0,“X与Y没有关系”的可信程度越小
D.χ2越大,“X与Y没有关系”的可信程度越大
解析:χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,χ2越小,“X与Y有关系”的可信程度越小.
答案:B
2.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是 .
答案:假设电离辐射的剂量与人体受损程度独立
剂量 死亡 存活 合计
第一种剂量 14 11 25
第二种剂量 6 19 25
合计 20 30 50
3.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果χ2>3.841,那么在犯错误的概率不大于 的前提下认为“X和Y有关系”.
χ2独立性检验中常用的小概率值和相应的临界值:
答案:0.05
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
4.研究人员选取170名青年男女大学生,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定回答的有22名,作否定回答的有38名;男生110名在相同的题目上作肯定回答的有22名,作否定回答的有88名.问:性别与态度之间是否存在某种关系 分别用等高堆积条形图和独立性检验的方法判断.
解:建立性别与态度的2×2列联表如下:
学生性别 肯定与否定 合计
肯定 否定
男生 22 88 110
女生 22 38 60
合计 44 126 170
根据列联表中所给的数据,可求出男生中作肯定回答的频率为 =0.2,女生中作肯定回答的频率为 ≈0.37.作等高堆积条形图如图,其中两个阴影条形的高分别表示男生和女生中作肯定回答的频率,比较图中阴影条形的高可以发现,女生中作肯定回答的频率明显高于男生中作肯定回答的频率,因此可以认为性别与态度有关系.
零假设为H0:性别与态度相互独立.
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即性别与态度有关系,该推断犯错误的概率不超过0.05.
本 课 结 束