4.3.2 独立性检验
1.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得χ2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )
A.0.1% B.1%
C.99% D.99.9%
2.某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)=0.05.则下列叙述中正确的是( )
A.有95%的把握认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血清,那么他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
3.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A.①②③ B.②④⑤
C.②③④⑤ D.①②③④⑤
4.下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的2×2列联表,则χ2的值为( )
不及格 及格 总计
甲班 12 33 45
乙班 9 36 45
总计 21 69 90
A.0.559 B.0.456
C.0.443 D.0.4
5.假设有两个分类变量X和Y的2×2列联表如下:
Y X y1 y2 总计
x1 a 10 a+10
x2 c 30 c+30
总计 60 40 100
对于同一样本,以下数据能说明X和Y有关系的可能性最大的一组是( )
A.a=45,c=15
B.a=40,c=20
C.a=35,c=25
D.a=30,c=30
6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有 的把握说,打鼾与患心脏病是 的.(“有关”或“无关”)
7.若两个分类变量x和y的列联表为:
y x y1 y2
x1 5 15
x2 40 10
则x与y之间有关系的概率约为 .
8.通过随机询问120名性别不同的大学生是否爱好某种类型的音乐,得到如下的2×2列联表:
男 女 总计
爱好 45 20 65
不爱好 25 30 55
总计 70 50 120
由χ2=算得,
χ2=≈6.9.
则 99%的把握说“爱好该类型的音乐与性别有关”(填“有”或“没有”).
9.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品 不喜欢甜品 总计
南方学生 60 20 80
北方学生 10 10 20
总计 70 30 100
(1)根据表中数据,问是否有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异;
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
10.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢数学文化的人数占男生人数的,女生喜欢数学文化的人数占女生人数的,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( )
A.24人 B.22人
C.20人 D.18人
11.某土特产超市为预估2024年元旦期间游客购买土特产的情况,对2023年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金 额(元) [0,15) [15, 30) [30, 45) [45, 60) [60, 75) [75, 90]
人数 10 15 20 15 20 10
(1)根据以上数据完成2×2列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.
不少于60元 少于60元 总计
男 40
女 18
总计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p(每次抽奖互不影响,且p的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数X(元)的分布列并求其数学期望.
4.3.2 独立性检验
1.C 易知χ2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.故选C.
2.A χ2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.
3.B 独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.故选B.
4.A 由2×2列联表,可得χ2=≈0.559,故选A.
5.A 根据2×2列联表与独立性检验的相关知识,当b,d一定时,与相差越大,χ2就越大,即X与Y有关系的可能性越大,即a,c相差越大,与就相差越大.选项A中a-c=45-15=30,与其他选项比较相差最大.故选A.
6.99% 有关 解析:∵χ2=7.63,∴χ2>6.635,故有99%的把握说,打鼾与患心脏病是有关的.
7.0.999 解析:χ2=≈18.822>10.828.∴x与y之间有关系的概率约为1-0.001=0.999.
8.有 解析:因为χ2≈6.9>6.635,所以根据统计量χ2的值可知有99%的把握说“爱好该类型的音乐与性别有关”.
9.解:(1)将2×2列联表中的数据代入公式计算,得
χ2==≈4.762.
由于4.762>3.841,所以有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.
(2)设5名学生中喜欢甜品的为a1,a2,不喜欢甜品的为b1,b2,b3,则从5名数学系学生中任取3人的一切可能结果所组成的样本空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)},
样本空间Ω包含10个样本点,且这些样本点的出现是等可能的.
用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}.
事件A包含7个样本点,因而P(A)=.
10.D 设男生至少有x人,根据题意,可列出如下2×2联表:
喜欢数学文化 不喜欢数学文化 总计
男生 x x x
女生 x x x
总计 x x x
则χ2==x,若有99%的把握认为是否喜欢数学文化和性别有关,
则χ2>6.635,即x>6.635,
解得x>17.694,
由于表中人数都为整数,可知男生至少有18人.故选D.
11.解:(1)2×2列联表如下:
不少于60元 少于60元 总计
男 12 40 52
女 18 20 38
总计 30 60 90
χ2==>5>3.841,
因此有95%的把握认为购买金额是否少于60元与性别有关.
(2)X取值范围是{65,70,75,80},且p==.
P(X=65)=×=.
P(X=70)=××=,
P(X=75)=××=,
P(X=80)=×=.
所以X的分布列为
X 65 70 75 80
P
E(X)=65×+70×+75×+80×=75.
3 / 34.3.2 独立性检验
新课程标准解读 核心素养
1.通过对典型案例的探究,了解独立性检验(2×2列联表)的基本思想,会对两个分类变量是否有关作出明确的判断 数据分析
2.明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题 逻辑推理
3.了解独立性检验的基本思想、方法及其简单应用 数学抽象
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 2×2列联表
设A,B为两个随机事件,将下表称为2×2列联表.
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
知识点二 独立性检验
χ2(读作“卡方”)统计量
(1)公式:χ2=;
(2)任意给定一个α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,就称不能得到前述结论.这一过程通常称为独立性检验.
【想一想】
独立性检验的基本思想是什么?
知识点三 临界值
统计学中,常用的显著性水平α以及对应的分位数k如下表所示.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
1.判断正误.(正确的画“√”,错误的画“×”)
(1)随机事件中的变量与函数中的变量是同一概念.( )
(2)独立性检验的方法就是反证法.( )
(3)独立性检验中可通过统计表从数据上说明两随机事件的相关性的大小.( )
2.某中学为了研究学生的视力和座位的关系(有关和无关),运用2×2列联表进行独立性研究,经计算χ2=7.069,则至少有 的把握认为“学生的视力与座位有关”.( )
A.95% B.99%
C.97.5% D.90%
3.下面是2×2列联表.
y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
则表中a= ,b= .
题型一 独立性检验的基本思想及简单应用
【例1】 有两个随机事件X和Y,其中一组观测值为如下的2×2列联表:
Y X y1 y2 总计
x1 a 15-a 15
x2 20-a 30+a 50
总计 20 45 65
其中a,15-a均为大于5的整数,则a= 时,在犯错误的概率不超过0.01的前提下认为“X和Y之间有关系”.
尝试解答
通性通法
本类题目的解题思路为:由2×2列联表及χ2统计量公式列关于参数a的不等式,解之求出参数并检验.
【跟踪训练】
统计学中,常用的显著性水平α以及对应的分位数k如下表:
P(χ2≥k) 0.50 0.40 0.25 0.15 0.10
k 0.455 0.708 1.323 2.072 2.706
P(χ2≥k) 0.05 0.025 0.010 0.005
k 3.841 5.024 6.635 7.879
已知两个随机变量X和Y,如果在犯错误的概率不超过0.025的前提下认为X和Y有关系,则随机变量χ2的分位数可以位于的区间是( )
A.(0.025,0.05) B.(0.010,0.025)
C.[3.841,5.024) D.[5.024,7.879)
题型二 独立性检验的实际应用
【例2】 下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 总计
干净水 52 466 518
不干净水 94 218 312
总计 146 684 830
(1)根据表中数据分析,判断这种传染病是否与饮用水的卫生程度有关?请说明理由;
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析,判断这种传染病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.
尝试解答
通性通法
独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个随机事件有关系”犯错误概率的显著性水平α,然后查表确定分位数k;
(2)利用公式,计算随机变量χ2;
(3)如果χ2>k,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
【跟踪训练】
新生儿某疾病要接种三次疫苗免疫(即0,1,6月龄),假设每次接种之间互不影响,每人每次接种成功的概率相等.为了解新生儿该疾病疫苗接种剂量与接种是否成功之间的关系,现进行了两种接种方案的临床试验:10 μg/次剂量组与20 μg/次剂量组.试验结果如下:
接种成功 接种不成功 总计
10 μg/次 剂量组 900 100 1 000
20 μg/次 剂量组 973 27 1 000
总计 1 873 127 2 000
根据数据说明哪种方案接种效果好?判断是否有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关?
题型三 独立性检验与统计、概率的综合应用
【例3】 节目《最强大脑》中,有一个游戏叫做盲拧魔方,就是玩家先观察魔方状态并进行记忆,记住后蒙住眼睛快速还原魔方,盲拧在外人看来很神奇,其实原理是十分简单的,要学会盲拧也是很容易的.根据调查显示,是否喜欢盲拧魔方与性别有关.为了验证这个结论,某兴趣小组随机抽取了50名魔方爱好者进行调查,得到的情况如表1所示:
表1
喜欢盲拧 不喜欢盲拧 总计
男 22 30
女 12
总计 50
现邀请这30名男生参加盲拧三阶魔方比赛,其完成情况如表2所示:
表2
成功完成 时间/min [0,10) [10,20) [20,30) [30,40]
人数 10 10 5 5
(1)将表1补充完整,判断是否在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关;
(2)根据表2中的数据,求这30名男生成功完成盲拧的平均时间;(以频率作为概率,以区间的中点值作为本组的完成时间)
(3)现从表2中成功完成时间在[0,10)内的10名男生中任意抽取3人对他们的盲拧情况进行视频记录,记成功完成时间在[0,10)内的甲、乙、丙3人中被抽到的人数为X,求X的分布列及数学期望E(X).
附:
P(χ2≥k) 0.10 0.05 0.025
k 2.706 3.841 5.024
P(χ2≥k) 0.010 0.005 0.001
k 6.635 7.879 10.828
尝试解答
通性通法
破解独立性检验、离散型随机变量的分布与期望相交汇问题的易错点有三处:一是忽视关键字眼,导致所得的数据出错,从而补全2×2列联表时出错;二是计算χ2时不会利用分子、分母先约分再计算的技巧,导致计算结果出错,从而推断出错;三是二项分布与超几何分布搞混,或把非二项分布误以为二项分布,导致求期望值出错.
【跟踪训练】
读书可以使人保持思想活力,让人得到智慧启发,让人滋养浩然正气.书籍是文化的重要载体,读书是承继文化的重要方式.某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图.将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求n,p的值;
(2)根据已知条件完成下面的2×2列联表,并判断是否有95%以上的把握认为“读书之星”与性别有关?
非读书之星 读书之星 总计
男
女 10 55
总计
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中,随机抽取3名学生,每次抽取1名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量X,求X的分布列和期望E(X).
1.利用独立性检验来考查两个变量A,B是否有关系,当随机变量χ2的值( )
A.越大,“A与B有关系”成立的可能性越大
B.越大,“A与B有关系”成立的可能性越小
C.越小,“A与B有关系”成立的可能性越大
D.与“A与B有关系”成立的可能性无关
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
经计算得χ2=≈7.8.
则正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
3.在一个2×2列联表中,由其数据计算得χ2=13.097,认为“两个变量有关系”犯错误的概率不超过 .
4.某学习小组在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是 .
4.3.2 独立性检验
【基础知识·重落实】
知识点二
想一想
提示:要判断“两个随机事件有关系”这一结论的可信程度,首先假设结论不成立,即假设“两个随机事件没有关系”成立,在该假设下构造的随机变量χ2应该很小.如果由计算得到的χ2值很大,则在一定程度上说明假设不合理,即认为“两个随机事件有关系”;如果χ2值很小,则说明在样本数据中没有发现足够证据拒绝假设.独立性检验的基本思想类似于反证法.
自我诊断
1.(1)× (2)× (3)√
2.B ∵χ2=7.069>6.635,∴有99%的把握认为学生的视力与座位有关系.故选B.
3.52 54 解析:a=73-21=52,b=a+2=52+2=54.
【典型例题·精研析】
【例1】 9 解析:由题意知χ2≥6.635,则
=≥6.635,
解得a≥8.65或a≤0.58.
因为a>5且15-a>5,a∈Z,所以a=9.
跟踪训练
D 根据题意,在犯错误的概率不超过0.025的前提下认为X和Y有关系,所以随机变量χ2的分位数k应满足:5.024≤k<7.879,即[5.024,7.879).
【例2】 解:(1)假设H0:传染病与饮用水的卫生程度无关.
由题意可知χ2=≈54.21,
因为54.21>10.828,
所以在犯错误的概率不超过0.001的前提下认为这种传染病与饮用水的卫生程度有关.
(2)依题意,得如下2×2列联表:
得病 不得病 总计
干净水 5 50 55
不干净水 9 22 31
总计 14 72 86
根据2×2列联表中的数据得到
χ2=≈5.785.
因为5.785>3.841,
所以在犯错误的概率不超过0.05的前提下认为这种传染病与饮用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)中是在犯错误的概率不超过0.001的前提下认为结论正确,(2)中是在犯错误的概率不超过0.05的前提下认为结论正确.
跟踪训练
解:由于两种接种方案都是1 000人接受临床试验,接种成功人数10 μg/次剂量组有900人,20 μg/次剂量组有973人,973>900,所以方案20 μg/次剂量组接种效果好.
由公式得χ2=
=≈44.806>10.828,
所以有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关.
【例3】 解:(1)依题意,补充完整的表1如下:
喜欢盲拧 不喜欢盲拧 总计
男 22 8 30
女 8 12 20
总计 30 20 50
由表中数据计算得χ2==≈5.556>5.024,因此能在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关.
(2)依题意,所求平均时间为5×+15×+25×+35×=+10=(min).
(3)依题意,X的取值范围是{0,1,2,3},P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,故X的分布列为
X 0 1 2 3
P
故E(X)=0×+1×+2×+3×=.
跟踪训练
解:(1)由频率分布直方图可知p=0.010,抽取的样本中日均课余读书时间低于10分钟的有10人.
∴n==100.
(2)∵n=100,∴“读书之星”有100×0.25=25(人),从而2×2列联表如表所示:
非读书之星 读书之星 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将2×2列联表中的数据代入公式计算得χ2=≈3.030<3.841.
因此没有95%以上的把握认为“读书之星”与性别有关.
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为,
由题意得X~B,
∴P(X=0)=×=,
P(X=1)=××=,
P(X=2)=××=,
P(X=3)=×=,
∴X的分布列为
X 0 1 2 3
P
∴E(X)=3×=.
随堂检测
1.A 用独立性检验来考查两个分类是否有关系时,算出的随机变量χ2的值越大,说明“A与B有关系”成立的可能性越大,由此可知A正确,B、C、D错误.故选A.
2.C 因为χ2≈7.8>6.635,所以有99%以上的把握认为“爱好该项运动与性别有关”.故选C.
3.0.001 解析:因为χ2=13.097>10.828,所以在犯错误的概率不超过0.001的前提下认为“两个变量有关系”.
4.男正教授人数,女正教授人数,男副教授人数,女副教授人数
解析:由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.
6 / 6(共70张PPT)
4.3.2 独立性检验
新课程标准解读 核心素养
1.通过对典型案例的探究,了解独立性检验(2×2列联
表)的基本思想,会对两个分类变量是否有关作出明确
的判断 数据分析
2.明确独立性检验的基本步骤,并能利用独立性检验的
基本思想来解决实际问题 逻辑推理
3.了解独立性检验的基本思想、方法及其简单应用 数学抽象
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低
人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月
31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 2×2列联表
设 A , B 为两个随机事件,将下表称为2×2列联表.
A 总计
B a b a + b
c d c + d
总计 a + c b + d a + b + c + d
知识点二 独立性检验
χ2(读作“卡方”)统计量
(1)公式:χ2= ;
(2)任意给定一个α(称为显著性水平),可以找到满足条件 P
(χ2≥ k )=α的数 k (称为显著性水平α对应的分位数).如果
根据样本数据算出χ2的值后,发现χ2≥ k 成立,就称在犯错误的
概率不超过α的前提下,可以认为 A 与 B 不独立(也称为 A 与 B
有关);或说有1-α的把握认为 A 与 B 有关.若χ2< k 成立,就
称不能得到前述结论.这一过程通常称为独立性检验.
【想一想】
独立性检验的基本思想是什么?
提示:要判断“两个随机事件有关系”这一结论的可信程度,首先假
设结论不成立,即假设“两个随机事
件没有关系”成立,在该假设下构造的随机变量χ2应该很小.如果由计
算得到的χ2值很大,则在一定程度上说明假设不合理,即认为“两个
随机事件有关系”;如果χ2值很小,则说明在样本数据中没有发现足
够证据拒绝假设.独立性检验的基本思想类似于反证法.
知识点三 临界值
统计学中,常用的显著性水平α以及对应的分位数 k 如下表所示.
α= P
(χ2≥
k ) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)随机事件中的变量与函数中的变量是同一概念. ( × )
(2)独立性检验的方法就是反证法. ( × )
(3)独立性检验中可通过统计表从数据上说明两随机事件的相关
性的大小. ( √ )
×
×
√
2. 某中学为了研究学生的视力和座位的关系(有关和无关),运用
2×2列联表进行独立性研究,经计算χ2=7.069,则至少
有 的把握认为“学生的视力与座位有关”.( )
A. 95% B. 99%
C. 97.5% D. 90%
解析: ∵χ2=7.069>6.635,∴有99%的把握认为学生的视力
与座位有关系.故选B.
3. 下面是2×2列联表.
y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
则表中 a = , b = .
解析: a =73-21=52, b = a +2=52+2=54.
52
54
典型例题·精研析
02
课堂互动 关键能力提升
题型一 独立性检验的基本思想及简单应用
【例1】 有两个随机事件 X 和 Y ,其中一组观测值为如下的2×2
列联表:
Y X y1 y2 总计
x1 a 15- a 15
x2 20- a 30+ a 50
总计 20 45 65
其中 a ,15- a 均为大于5的整数,则 a = 时,在犯错误的概率不
超过0.01的前提下认为“ X 和 Y 之间有关系”.
解析:由题意知χ2≥6.635,则
= ≥6.635,解得 a ≥8.65或 a ≤0.58.
因为 a >5且15- a >5, a ∈Z,所以 a =9.
9
通性通法
本类题目的解题思路为:由2×2列联表及χ2统计量公式列关于参
数 a 的不等式,解之求出参数并检验.
【跟踪训练】
统计学中,常用的显著性水平α以及对应的分位数 k 如下表:
P (χ2≥ k ) 0.50 0.40 0.25 0.15 0.10
k 0.455 0.708 1.323 2.072 2.706
P (χ2≥ k ) 0.05 0.025 0.010 0.005
k 3.841 5.024 6.635 7.879
已知两个随机变量 X 和 Y ,如果在犯错误的概率不超过0.025的前提下
认为 X 和 Y 有关系,则随机变量χ2的分位数可以位于的区间是( )
A. (0.025,0.05) B. (0.010,0.025)
C. [3.841,5.024) D. [5.024,7.879)
解析: 根据题意,在犯错误的概率不超过0.025的前提下认为 X 和
Y 有关系,所以随机变量χ2的分位数 k 应满足:5.024≤ k <7.879,即
[5.024,7.879).
题型二 独立性检验的实际应用
【例2】 下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 总计
干净水 52 466 518
不干净水 94 218 312
总计 146 684 830
(1)根据表中数据分析,判断这种传染病是否与饮用水的卫生程度
有关?请说明理由;
解: 假设 H0:传染病与饮用水的卫生程度无关.
由题意可知χ2= ≈54.21,
因为54.21>10.828,
所以在犯错误的概率不超过0.001的前提下认为这种传染病与饮
用水的卫生程度有关.
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,
不得病22人.按此样本数据分析,判断这种传染病是否与饮用水
的卫生程度有关,并比较两种样本在反映总体时的差异.
解: 依题意,得如下2×2列联表:
得病 不得病 总计
干净水 5 50 55
不干净水 9 22 31
总计 14 72 86
根据2×2列联表中的数据得到
χ2= ≈5.785.
因为5.785>3.841,
所以在犯错误的概率不超过0.05的前提下认为这种传染病与饮
用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相
同结论,但(1)中是在犯错误的概率不超过0.001的前提下认
为结论正确,(2)中是在犯错误的概率不超过0.05的前提下认
为结论正确.
通性通法
独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个随机事件有关系”犯
错误概率的显著性水平α,然后查表确定分位数 k ;
(2)利用公式,计算随机变量χ2;
(3)如果χ2> k ,就推断“ X 与 Y 有关系”,这种推断犯错误的概率
不超过α;否则,就认为在犯错误的概率不超过α的前提下不
能推断“ X 与 Y 有关系”,或者在样本数据中没有发现足够证据
支持结论“ X 与 Y 有关系”.
【跟踪训练】
新生儿某疾病要接种三次疫苗免疫(即0,1,6月龄),假设每次
接种之间互不影响,每人每次接种成功的概率相等.为了解新生儿该
疾病疫苗接种剂量与接种是否成功之间的关系,现进行了两种接种方
案的临床试验:10 μg/次剂量组与20 μg/次剂量组.试验结果如下:
接种成功 接种不成功 总计
10 μg/次
剂量组 900 100 1 000
20 μg/次
剂量组 973 27 1 000
总计 1 873 127 2 000
根据数据说明哪种方案接种效果好?判断是否有99.9%的把握认为该
疾病疫苗接种成功与两种接种方案有关?
解:由于两种接种方案都是1 000人接受临床试验,接种成功人数10
μg/次剂量组有900人,20 μg/次剂量组有973人,973>900,所以方
案20 μg/次剂量组接种效果好.
由公式得χ2=
= ≈44.806>10.828,
所以有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关.
题型三 独立性检验与统计、概率的综合应用
【例3】 节目《最强大脑》中,有一个游戏叫做盲拧魔方,就是玩
家先观察魔方状态并进行记忆,记住后蒙住眼睛快速还原魔方,盲拧
在外人看来很神奇,其实原理是十分简单的,要学会盲拧也是很容易
的.根据调查显示,是否喜欢盲拧魔方与性别有关.为了验证这个结
论,某兴趣小组随机抽取了50名魔方爱好者进行调查,得到的情况如
表1所示:
表1
喜欢盲拧 不喜欢盲拧 总计
男 22 30
女 12
总计 50
现邀请这30名男生参加盲拧三阶魔方比赛,其完成情况如表2所示:
表2
成功完成 时间/min [0,10) [10,20) [20,30) [30,40]
人数 10 10 5 5
(1)将表1补充完整,判断是否在犯错误的概率不超过0.025的前提
下认为是否喜欢盲拧与性别有关;
解: 依题意,补充完整的表1如下:
喜欢盲拧 不喜欢盲拧 总计
男 22 8 30
女 8 12 20
总计 30 20 50
由表中数据计算得χ2= = ≈5.556>5.024,
因此能在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧
与性别有关.
(2)根据表2中的数据,求这30名男生成功完成盲拧的平均时间;
(以频率作为概率,以区间的中点值作为本组的完成时间)
解: 依题意,所求平均时间为5× +15× +25× +
35× = +10= (min).
(3)现从表2中成功完成时间在[0,10)内的10名男生中任意抽取3
人对他们的盲拧情况进行视频记录,记成功完成时间在[0,
10)内的甲、乙、丙3人中被抽到的人数为 X ,求 X 的分布列及
数学期望 E ( X ).
附:
P (χ2≥
k ) 0.10 0.05 0.025 0.010 0.005 0.001
k 2.706 3.841 5.024 6.635 7.879 10.828
解: 依题意, X 的取值范围是{0,1,2,3}, P ( X =0)
= = , P ( X =1)= = , P ( X =2)= =
, P ( X =3)= = ,故 X 的分布列为
X 0 1 2 3
P
故 E ( X )=0× +1× +2× +3× = .
通性通法
破解独立性检验、离散型随机变量的分布与期望相交汇问题的易
错点有三处:一是忽视关键字眼,导致所得的数据出错,从而补全
2×2列联表时出错;二是计算χ2时不会利用分子、分母先约分再计算
的技巧,导致计算结果出错,从而推断出错;三是二项分布与超几何
分布搞混,或把非二项分布误以为二项分布,导致求期望值出错.
【跟踪训练】
读书可以使人保持思想活力,让人得
到智慧启发,让人滋养浩然正气.书籍是
文化的重要载体,读书是承继文化的重要
方式.某地区为了解学生课余时间的读书
情况,随机抽取了 n 名学生进行调查,根
据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图.将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求 n , p 的值;
解: 由频率分布直方图可知 p =0.010,抽取的样本中日均
课余读书时间低于10分钟的有10人.
∴ n = =100.
(2)根据已知条件完成下面的2×2列联表,并判断是否有95%以上
的把握认为“读书之星”与性别有关?
非读书之星 读书之星 总计
男
女 10 55
总计
解: ∵ n =100,∴“读书之星”有100×0.25=25
(人),从而2×2列联表如下表所示:
非读书之星 读书之星 总计
男 30 15 45
女 45 10 55
总计 75 25 100
将2×2列联表中的数据代入公式计算得χ2= ≈3.030<3.841.
因此没有95%以上的把握认为“读书之星”与性别有关.
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中,
随机抽取3名学生,每次抽取1名,已知每个人是否被抽到互不
影响,记被抽取的“读书之星”人数为随机变量 X ,求 X 的分布
列和期望 E ( X ).
解: 将频率视为概率,即从该地区学生中抽取一名学生是
“读书之星”的概率为 ,
由题意得 X ~ B ,
∴ P ( X =0)= × = ,
P ( X =1)= × × = ,
P ( X =2)= × × = ,
P ( X =3)= × = ,
∴ X 的分布列为
X 0 1 2 3
P
∴ E ( X )=3× = .
1. 利用独立性检验来考查两个变量 A , B 是否有关系,当随机变量χ2
的值( )
A. 越大,“ A 与 B 有关系”成立的可能性越大
B. 越大,“ A 与 B 有关系”成立的可能性越小
C. 越小,“ A 与 B 有关系”成立的可能性越大
D. 与“ A 与 B 有关系”成立的可能性无关
解析: 用独立性检验来考查两个分类是否有关系时,算出的随
机变量χ2的值越大,说明“ A 与 B 有关系”成立的可能性越大,由
此可知A正确,B、C、D错误.故选A.
2. 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如
下的列联表:
男 女 总计
爱好 40 20 60
不爱
好 20 30 50
总计 60 50 110
经计算得χ2= ≈7.8.
则正确结论是( )
A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性
别有关”
B. 在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别
无关”
C. 有99%以上的把握认为“爱好该项运动与性别有关”
D. 有99%以上的把握认为“爱好该项运动与性别无关”
解析: 因为χ2≈7.8>6.635,所以有99%以上的把握认为“爱好
该项运动与性别有关”.故选C.
3. 在一个2×2列联表中,由其数据计算得χ2=13.097,认为“两个变
量有关系”犯错误的概率不超过 .
解析:因为χ2=13.097>10.828,所以在犯错误的概率不超过
0.001的前提下认为“两个变量有关系”.
0.001
4. 某学习小组在研究性别与职称(分正教授、副教授)之间是否有关
系,你认为应该收集的数据是
.
解析:由研究的问题可知,需收集的数据应为男正教授人数,女正
教授人数,男副教授人数,女副教授人数.
男正教授人数,女正教授人数,男
副教授人数,女副教授人数
知能演练·扣课标
03
课后巩固 核心素养落地
1. 为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与
性别的关系,运用2×2列联表进行独立性检验,经计算得χ2=
7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )
A. 0.1% B. 1%
C. 99% D. 99.9%
解析: 易知χ2=7.01>6.635,对照临界值表知,有99%的把握
认为喜欢乡村音乐与性别有关系.故选C.
1
2
3
4
5
6
7
8
9
10
11
2. 某研究所为了检验某血清预防感冒的作用,把500名使用了该血清
的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作
比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用
2×2列联表计算得χ2≈3.918,经查临界值表知 P (χ2≥3.841)=
0.05.则下列叙述中正确的是( )
A. 有95%的把握认为“这种血清能起到预防感冒的作用”
B. 若有人未使用该血清,那么他一年中有95%的可能性得感冒
C. 这种血清预防感冒的有效率为95%
D. 这种血清预防感冒的有效率为5%
1
2
3
4
5
6
7
8
9
10
11
解析: χ2≈3.918>3.841,因此有95%的把握认为“这种血清能
起到预防感冒的作用”,故选A.
1
2
3
4
5
6
7
8
9
10
11
3. 给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区
别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与
青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A. ①②③ B. ②④⑤
C. ②③④⑤ D. ①②③④⑤
解析: 独立性检验是判断两个分类变量是否有关系的方法,而
①③都是概率问题,不能用独立性检验.故选B.
1
2
3
4
5
6
7
8
9
10
11
4. 下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统
计成绩后的2×2列联表,则χ2的值为( )
不及格 及格 总计
甲班 12 33 45
乙班 9 36 45
总计 21 69 90
A. 0.559 B. 0.456
C. 0.443 D. 0.4
解析: 由2×2列联表,可得χ2= ≈0.559,故选A.
1
2
3
4
5
6
7
8
9
10
11
5. 假设有两个分类变量 X 和 Y 的2×2列联表如下:
Y X y1 y2 总计
x1 a 10 a +10
x2 c 30 c +30
总计 60 40 100
对于同一样本,以下数据能说明 X 和 Y 有关系的可能性最大的一组
是( )
A. a =45, c =15 B. a =40, c =20
C. a =35, c =25 D. a =30, c =30
1
2
3
4
5
6
7
8
9
10
11
解析: 根据2×2列联表与独立性检验的相关知识,当 b , d 一
定时, 与 相差越大,χ2就越大,即 X 与 Y 有关系的可能性
越大,即 a , c 相差越大, 与 就相差越大.选项A中 a - c
=45-15=30,与其他选项比较相差最大.故选A.
1
2
3
4
5
6
7
8
9
10
11
6. 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=
7.63,根据这一数据分析,有 的把握说,打鼾与患心脏病
是 的.(“有关”或“无关”)
99%
解析:∵χ2=7.63,∴χ2>6.635,故有99%的把握说,打鼾与患心
脏病是有关的.
有关
1
2
3
4
5
6
7
8
9
10
11
7. 若两个分类变量 x 和 y 的列联表为:
y x y1 y2
x1 5 15
x2 40 10
则 x 与 y 之间有关系的概率约为 .
解析:χ2= ≈18.822>10.828.∴ x 与 y
之间有关系的概率约为1-0.001=0.999.
0.999
1
2
3
4
5
6
7
8
9
10
11
8. 通过随机询问120名性别不同的大学生是否爱好某种类型的音乐,
得到如下的2×2列联表:
男 女 总计
爱好 45 20 65
不爱好 25 30 55
总计 70 50 120
由χ2= 算得,
1
2
3
4
5
6
7
8
9
10
11
χ2= ≈6.9.
则 99%的把握说“爱好该类型的音乐与性别有关”(填
“有”或“没有”).
解析:因为χ2≈6.9>6.635,所以根据统计量χ2的值可知有99%的把
握说“爱好该类型的音乐与性别有关”.
有
1
2
3
4
5
6
7
8
9
10
11
9. 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行
了抽样调查,调查结果如下表所示:
喜欢甜品 不喜欢甜品 总计
南方学生 60 20 80
北方学生 10 10 20
总计 70 30 100
1
2
3
4
5
6
7
8
9
10
11
(1)根据表中数据,问是否有95%的把握认为南方学生和北方学
生在选用甜品的饮食习惯方面有差异;
解: 将2×2列联表中的数据代入公式计算,得
χ2= = ≈4.762.
由于4.762>3.841,所以有95%的把握认为南方学生和北方
学生在选用甜品的饮食习惯方面有差异.
1
2
3
4
5
6
7
8
9
10
11
解: 设5名学生中喜欢甜品的为 a1, a2,不喜欢甜品
的为 b1, b2, b3,则从5名数学系学生中任取3人的一切可
能结果所组成的样本空间Ω={( a1, a2, b1),( a1,
a2, b2),( a1, a2, b3),( a1, b1, b2),( a1,
b1, b3),( a1, b2, b3),( a2, b1, b2),( a2,
b1, b3),( a2, b2, b3),( b1, b2, b3)},
样本空间Ω包含10个样本点,且这些样本点的出现是等可
能的.
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜
欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢
甜品的概率.
1
2
3
4
5
6
7
8
9
10
11
用 A 表示“3人中至多有1人喜欢甜品”这一事件,则 A =
{( a1, b1, b2),( a1, b1, b3),( a1, b2, b3),
( a2, b1, b2),( a2, b1, b3),( a2, b2, b3),
( b1, b2, b3)}.
事件 A 包含7个样本点,因而 P ( A )= .
1
2
3
4
5
6
7
8
9
10
11
10. 在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学
文化是否有关”作了一次调查,其中被调查的女生人数是男生人
数的 ,男生喜欢数学文化的人数占男生人数的 ,女生喜欢数学
文化的人数占女生人数的 ,若有99%的把握认为是否喜欢数学文
化和性别有关,则男生至少有( )
A. 24人 B. 22人
C. 20人 D. 18人
1
2
3
4
5
6
7
8
9
10
11
解析: 设男生至少有 x 人,根据题意,可列出如下2×2联表:
喜欢数学文化 不喜欢数学文化 总计
男生 x x x
女生 x x x
总计 x x x
1
2
3
4
5
6
7
8
9
10
11
则χ2= = x ,若
有99%的把握认为是否喜欢数学文化和性别有关,
则χ2>6.635,即 x >6.635,
解得 x >17.694,
由于表中人数都为整数,可知男生至少有18人.故选D.
1
2
3
4
5
6
7
8
9
10
11
11. 某土特产超市为预估2024年元旦期间游客购买土特产的情况,对
2023年元旦期间的90位游客购买情况进行统计,得到如下人数分
布表.
购买金 额
(元) [0,
15) [15,
30) [30,
45) [45,
60) [60,
75) [75,
90]
人数 10 15 20 15 20 10
1
2
3
4
5
6
7
8
9
10
11
(1)根据以上数据完成2×2列联表,并判断是否有95%的把握认
为购买金额是否少于60元与性别有关.
不少于60元 少于60元 总计
男 40
女 18
总计
1
2
3
4
5
6
7
8
9
10
11
解: 2×2列联表如下:
不少于60元 少于60元 总计
男 12 40 52
女 18 20 38
总计 30 60 90
χ2= = >5>3.841,
因此有95%的把握认为购买金额是否少于60元与性别有关.
1
2
3
4
5
6
7
8
9
10
11
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60
元可抽奖3次,每次中奖概率为 p (每次抽奖互不影响,且 p
的值等于人数分布表中购买金额不少于60元的频率),中奖
1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划
购买80元的土特产,请列出实际付款数 X (元)的分布列并
求其数学期望.
1
2
3
4
5
6
7
8
9
10
11
解: X 取值范围是{65,70,75,80},且 p = = .
P ( X =65)= × = .
P ( X =70)= × × = ,
P ( X =75)= × × = ,
P ( X =80)= × = .
1
2
3
4
5
6
7
8
9
10
11
所以 X 的分布列为
X 65 70 75 80
P
E ( X )=65× +70× +75× +80× =75.
1
2
3
4
5
6
7
8
9
10
11
谢 谢 观 看!