第九章 第四节 列联表与独立性检验(课件 学案 练习,共3份)2026届高中数学(通用版)一轮复习

文档属性

名称 第九章 第四节 列联表与独立性检验(课件 学案 练习,共3份)2026届高中数学(通用版)一轮复习
格式 zip
文件大小 3.8MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2025-05-14 07:53:30

文档简介

第四节 列联表与独立性检验
1.(2025·安徽一模)根据分类变量x与y的成对样本数据,计算得到χ2=7.174.根据α=0.005的独立性检验,结论为(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量x与y独立
B.变量x与y独立,这个结论犯错误的概率不超过0.005
C.变量x与y不独立
D.变量x与y不独立,这个结论犯错误的概率不超过0.005
2.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
是否喜欢体育锻炼 性别 合计
男 女
喜欢 a b 73
不喜欢 c 25
合计 74
则a-b-c=(  )
A.7 B.8
C.9 D.10
3.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则χ2约为(  )
班级 数学成绩 合计
优秀 不优秀
甲班 11 34 45
乙班 8 37 45
合计 19 71 90
A.0.600 B.0.828
C.2.712 D.6.014
4.为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是(  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
5.〔多选〕某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算χ2≈4.762,则可以推断出(  )
性别 满意 不满意
男 30 20
女 40 10
A.该学校男生对食堂服务满意的概率的估计值为
B.调查结果显示,该学校男生比女生对食堂服务更满意
C.认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过0.05
D.认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过0.01
6.某高校《统计初步》课程的教师随机调查了选该课的学生情况,调查数据如下表:
性别 非统计专业 统计专业
男 13 10
女 7 20
为了判断是否主修统计专业与性别有无关系,根据表中的数据,计算得到χ2≈    (保留三位小数),所以判定    (填“能”或“不能”)在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.
7.〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则(  )
A.高中M的前50名学生中有60%的学生学习效率高
B.高中N的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D.认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05
8.〔多选〕针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为(  )
A.25          B.45
C.60 D.75
9.某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过    .
10.(情境创新)为了了解空气质量指数(AQI)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI值,并制作了如下散点图:
环保小组发现散点有分区聚集的特点,尝试作聚类分析.用直线x=100与y=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5,10,10,35,并初步认定“参加户外健身运动的人数不少于100与AQI值不大于100有关联”,则该“初步认定”犯错误的概率范围是    .
11.(2024·全国甲卷理17题改编)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙甲间 70 28 2 100
总计 96 52 2 150
(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
第四节 列联表与独立性检验
1.A 因为χ2=7.174<7.879=x0.005,所以依据α=0.005的独立性检验,我们认为变量x与y独立,故选A.
2.C 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21.∴a-b-c=52-21-22=9.
3.A χ2=≈0.600,故选A.
4.B 从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.
5.AC 对于A,该学校男生对食堂服务满意的概率的估计值为=,故A正确;对于B,该学校女生对食堂服务满意的概率的估计值为=>,故B错误;因为χ2≈4.762>3.841=x0.05,认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过0.05,故C正确,D错误.
6.4.844 能 解析:由题意可知,χ2=≈4.844>3.841=x0.05,所以能在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.
7.AC 高中M的前50名学生中有30人学习效率高,即×100%=60%,所以A正确.高中N的前50名学生中有10人学习效率高,即×100%=20%,所以B错误.这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写列联表如下.
学校 学习效率高低 合计
学习效率高 学习效率不高
高中M 30 20 50
高中N 10 40 50
合计 40 60 100
χ2==≈16.667>10.828=x0.001,有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关,C正确.认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,所以D错误.故选A、C.
8.BCD 设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下所示:
是否喜欢航天 性别 合计
男生 女生
喜欢航天 4n 3n 7n
不喜欢航天 n 2n 3n
合计 5n 5n 10n
则χ2==,∵依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,∴χ2≥3.841,即≥3.841,得n≥8.066 1,∴5n≥40.330 5,又n∈N*,∴结合选项知B、C、D正确.故选B、C、D.
9.0.001 解析:由题意,可得如下2×2列联表:
考试情况 培训方式 合计
集中培训 分散培训
一次考试通过 50 30 80
一次考试未通过 5 20 25
合计 55 50 105
则χ2=≈13.793>10.828=x0.001,故认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.001.
10.(0.001,0.005) 解析:根据散点图,建立2×2列联表为
AQI值 参加户外健身运动人数 合计
人数<100 人数≥100
AQI>100 10 5 15
AQI≤100 10 35 45
合计 20 40 60
则χ2==10.因为7.879<10<10.828,故犯错率在0.001与0.005之间,所以该“初步认定”犯错误的概率范围是(0.001,0.005).
11.解:(1)根据题意列出列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得χ2===4.687 5,
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,
用频率估计概率可得=0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
可知>p+1.65,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
3 / 3第四节 列联表与独立性检验
课标要求
1.掌握分类变量的含义.
2.通过实例,理解2×2列联表的统计意义.
3.通过实例,了解2×2列联表独立性检验及其应用.
1.分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的    ,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
2.等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(2)如果通过直接计算或等高堆积条形图发现和相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)概念:利用随机变量χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;
(2)χ2的计算公式:χ2=      ;
(3)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设该结论不成立,即H0:两个分类变量相互独立成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2的观测值很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据推断H0不成立;
(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);
(5)应用独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释;
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
③根据检验规则得出推断结论;
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(6)独立性检验中几个常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1.判断正误.(正确的画“√”,错误的画“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(  )
(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(  )
(3)χ2的大小是判断事件A和B是否相关的统计量.(  )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(  )
(5)独立性检验的方法就是用的反证法.(  )
2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是(  )
3.第19届亚运会于2023年9月23日在中国杭州举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,下表为“性别与会俄语”的2×2列联表,则a-b+d=    .
性别 是否会俄语 合计
会俄语 不会俄语
男 a b 20
女 6 d
合计 18 50
4.已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:
α 0.10 0.05 0.025 0.010 0.005
xα 2.706 3.841 5.024 6.635 7.879
则最大有    的把握说变量X,Y有关系(填百分数).
分类变量与列联表
(基础自学过关)
1.〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是(  )
A.吸烟患肺病的频率约为0.2
B.吸烟不患肺病的频率约为0.8
C.不吸烟患肺病的频率小于0.05
D.吸烟与患肺病无关系
2.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
对同一样本,以下数据能说明X与Y有关联关系可能性最大的一组为(  )
A.a=9,b=3,c=2,d=1
B.a=9,b=2,c=3,d=1
C.a=2,b=3,c=1,d=9
D.a=3,b=1,c=2,d=9
3.(2024·江西模拟)在某次独立性检验中,得到如下列联表:
A 总计
B 200 800 1 000
180 a 180+a
总计 380 800+a 1 180+a
最后发现,两个分类变量没有关联,则a的值可能是(  )
A.200 B.720
C.100 D.180
练后悟通
两个分类变量之间关联关系的定性分析方法
(1)频率分析法:比较列联表中与的大小,粗略地判断分类变量X和Y之间有无关系.一般来说,这两个值相差越大,分类变量有关系的可能性越大;
(2)图形分析法:常用等高堆积条形图展示列联表数据的频率特征,将列联表中的两行数据用高度相同的两个条形表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图.两个深色条的高相差越明显,说明两个分类变量之间关系越强.
分类变量关联性的判断
(师生共研过关)
某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
患心脏病 无心脏病
秃发 20 300
不秃发 5 450
根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定中年人秃发与患心脏病有关系.那么这种判断出错的可能性为(  )
A.0.001 B.0.05
C.0.025 D.0.01
听课记录                                                                                                                                      解题技法
  如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是(  )
A.90% B.95%
C.99% D.99.5%
独立性检验的应用
(师生共研过关)
(2024·保定二模)某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练后的平均成绩(同一组中的数据用该组区间的中点值作代表)与成绩的中位数(中位数精确到0.01);
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
强化训练 是否优秀 合计
优秀 非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值α=0.005的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关?
附:χ2=,n=a+b+c+d.
α 0.05 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
解题技法
独立性检验的具体步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据样本数据整理出2×2列联表,利用公式计算χ2的值;
(3)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值xα;
(4)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2≤xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
(2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物(单位:只)试验,得到如下列联表:
药物 疾病 合计
未患病 患病
未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
第四节 列联表与独立性检验
【知识·逐点夯实】
知识梳理夯基
1.(2)频数
3.(2)
对点自测诊断
1.(1)√ (2)√ (3)√ (4)× (5)×
2.B 3.28 4.95%
【考点·分类突破】
考点1
1.ABC 从等高堆积条形图中可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.所以吸烟与患肺病有关,D错误;由题图得,A、B、C都正确.
2.D 根据χ2的计算公式及a+b+c+d=15可得,当n相等时,|ad-bc|越小,说明X与Y之间的关系越弱;|ad-bc|越大,说明X与Y之间的关系越强,经过逐一验证,可知选D.
3.B ∵两个分类变量没有关联,∴≈,解得a≈720,故选B.
考点2
【例1】 A 因为χ2>10.828=x0.001,因此判断出错的可能性为0.001,故选A.
跟踪训练
B 结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市民收入增减与旅游愿望有关系的可信程度为95%.
考点3
【例2】 解:(1)强化训练后的平均成绩约为55×0.04+65×0.16+75×0.2+85×0.32+95×0.28=81.4(分).
由于前三组概率之和为0.04+0.16+0.2=0.4,设中位数为80+x,则0.032x=0.1,
解得x=3.125,所以中位数约为83.13.
(2)零假设为H0:跳水运动员是否优秀与强化训练无关.
补充完整的表格为
强化训练 是否优秀 合计
优秀 非优秀
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2==8>7.879=x0.005,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为跳水运动员是否优秀与强化训练有关.
跟踪训练
解:(1)由列联表知s=100+80=180,t=80+70=150.
(2)由列联表知,未服用药物A的动物有s=180只,
未服用药物A且患疾病B的动物有80只,
所以未服用药物A的动物患疾病B的频率为=,
所以未服用药物A的动物患疾病B的概率的估计值为P=.
(3)零假设为H0:药物A对预防疾病B无效,
由列联表得到χ2==≈6.734>6.635=x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,
即认为药物A对预防疾病B有效,该推断犯错误的概率不超过0.01,
所以根据小概率值α=0.01的独立性检验,能认为药物A对预防疾病B有效.
5 / 5(共63张PPT)
第四节 列联表与独立性检验
高中总复习·数学
课标要求
1. 掌握分类变量的含义.
2. 通过实例,理解2×2列联表的统计意义.
3. 通过实例,了解2×2列联表独立性检验及其应用.
目 录
CONTENTS
知识·逐点夯实
01.
考点·分类突破
02.
课时·跟踪检测
03.
PART 01
知识·逐点夯实
必备知识 | 课前自修
1. 分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的
变量称为分类变量;
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分
类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互
对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y
=y}(x,y=0,1)的 ,n是样本量,其样本频数列联表(称为
2×2列联表)如表所示:
频数 
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
2. 等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是
否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(2)如果通过直接计算或等高堆积条形图发现 和 相差很大,就
判断两个分类变量之间有关系.
(1)概念:利用随机变量χ2的取值推断分类变量X和Y是否独立的方法称
为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;
(2)χ2的计算公式:χ2= ;
 
3. 独立性检验
(3)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要
判断“两个分类变量有关系”,首先假设该结论不成立,即H0:两个分类
变量相互独立成立.在该假设下所构造的随机变量χ2应该很小.如果由观测
数据计算得到的χ2的观测值很大,则断言H0不成立,即认为“两个分类变
量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据推
断H0不成立;
(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,
即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们
没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界
值);
(5)应用独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释;
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
③根据检验规则得出推断结论;
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y
间的影响规律.
(6)独立性检验中几个常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)2×2列联表中的数据是两个分类变量的频数. ( √ )
(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验
中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.
( √ )
(3)χ2的大小是判断事件A和B是否相关的统计量. ( √ )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关
系越强. ( × )
(5)独立性检验的方法就是用的反证法. ( × )



×
×
2. 观察下面各等高堆积条形图,其中两个分类变量关系最强的是(  )

解析:  通过等高堆积条形图可知,选项B中y1,y2的差异最大,故两个
分类变量关系最强.故选B.
3. 第19届亚运会于2023年9月23日在中国杭州举行.为了搞好对外宣传工
作,会务组选聘了50名记者担任对外翻译工作,下表为“性别与会俄语”
的2×2列联表,则a-b+d= .
性别 是否会俄语 合计
会俄语 不会俄语
男 a b 20
女 6 d
合计 18 50
28
解析:由2×2列联表得a+6=18,所以a=12,因为a+b=20,所以b=
8,因为6+d=50-20=30,所以d=24,所以a-b+d=12-8+24=
28.
4. 已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界
值表如下:
α 0.10 0.05 0.025 0.010 0.005
xα 2.706 3.841 5.024 6.635 7.879
则最大有 的把握说变量X,Y有关系(填百分数).
解析:因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前
提下认为变量X,Y有关系.所以最大有95%的把握说变量X,Y有关系.
95%
PART 02
考点·分类突破
精选考点 | 课堂演练
分类变量与列联表(基础自学过关)
1. 〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是(  )
A. 吸烟患肺病的频率约为0.2
B. 吸烟不患肺病的频率约为0.8
C. 不吸烟患肺病的频率小于0.05
D. 吸烟与患肺病无关系



解析:  从等高堆积条形图中可以明显地看出,吸烟患肺病的频率远
远大于不吸烟患肺病的频率.所以吸烟与患肺病有关,D错误;由题图得,
A、B、C都正确.
2. 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},
其2×2列联表如下:
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
对同一样本,以下数据能说明X与Y有关联关系可能性最大的一组为( )
A. a=9,b=3,c=2,d=1 B. a=9,b=2,c=3,d=1
C. a=2,b=3,c=1,d=9 D. a=3,b=1,c=2,d=9

解析:  根据χ2的计算公式及a+b+c+d=15可得,当n相等时,|
ad-bc|越小,说明X与Y之间的关系越弱;|ad-bc|越大,说明X
与Y之间的关系越强,经过逐一验证,可知选D.
3. (2024·江西模拟)在某次独立性检验中,得到如下列联表:
A 总计
B 200 800 1 000
180 a 180+a
总计 380 800+a 1 180+a
最后发现,两个分类变量没有关联,则a的值可能是(  )
A. 200 B. 720
C. 100 D. 180

解析: ∵两个分类变量没有关联,∴ ≈ ,解得a≈720,故选B.
练后悟通
两个分类变量之间关联关系的定性分析方法
(1)频率分析法:比较列联表中 与 的大小,粗略地判断分类变
量X和Y之间有无关系.一般来说,这两个值相差越大,分类变量有关系的
可能性越大;
(2)图形分析法:常用等高堆积条形图展示列联表数据的频率特征,将
列联表中的两行数据用高度相同的两个条形表示出来,其中两列的数据分
别对应不同的颜色,这就是等高堆积条形图.两个深色条的高相差越明
显,说明两个分类变量之间关系越强.
分类变量关联性的判断(师生共研过关)
某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了
一些中年人的情况,具体数据如表:
患心脏病 无心脏病
秃发 20 300
不秃发 5 450
根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定中年人秃发与患心
脏病有关系.那么这种判断出错的可能性为(  )
A. 0.001 B. 0.05
C. 0.025 D. 0.01
解析: 因为χ2>10.828=x0.001,因此判断出错的可能性为0.001,故选A.
解题技法
  如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;
否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关
系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查
了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有
关系的可信程度是(  )
A. 90% B. 95%
C. 99% D. 99.5%
解析:  结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市
民收入增减与旅游愿望有关系的可信程度为95%.

独立性检验的应用(师生共研过关)
(2024·保定二模)某青少年跳水队共有100人,在强化训练前、后,
教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率
分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练后的平均成绩(同一组中的数据用该
组区间的中点值作代表)与成绩的中位数(中位数精确到0.01);
解: 强化训练后的平均成绩约为55×0.04+65×0.16+75×0.2+
85×0.32+95×0.28=81.4(分).
由于前三组概率之和为0.04+0.16+0.2=0.4,设中位数为80+x,则
0.032x=0.1,
解得x=3.125,所以中位数约为83.13.
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优
秀”.
强化训练 是否优秀 合计
优秀 非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值α=0.005的独立性检验,能否据
此推断跳水运动员是否优秀与强化训练有关?
附:χ2= ,n=a+b+c+d.
α 0.05 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
解: 零假设为H0:跳水运动员是否优秀与强化训练无关.
补充完整的表格为
强化训练 是否优秀 合计
优秀 非优秀
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2= =8>7.879=x0.005,根据小概率值α=0.005
的独立性检验,我们推断H0不成立,即认为跳水运动员是否优秀与强化训
练有关.
解题技法
独立性检验的具体步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据样本数据整理出2×2列联表,利用公式计算χ2的值;
(3)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误
概率的上界α,然后查表确定临界值xα;
(4)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯
错误的概率不超过α;当χ2≤xα时,我们没有充分证据推断H0不成立,可
以认为X和Y独立.
(2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物
(单位:只)试验,得到如下列联表:
药物 疾病 合计
未患病 患病
未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
解: 由列联表知s=100+80=180,t=80+70=150.
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
解: 由列联表知,未服用药物A的动物有s=180只,
未服用药物A且患疾病B的动物有80只,
所以未服用药物A的动物患疾病B的频率为 = ,
所以未服用药物A的动物患疾病B的概率的估计值为P= .
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B
有效?
附:χ2= ,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解: 零假设为H0:药物A对预防疾病B无效,
由列联表得到χ2= = ≈6.734>6.635=
x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,
即认为药物A对预防疾病B有效,该推断犯错误的概率不超过0.01,
所以根据小概率值α=0.01的独立性检验,能认为药物A对预防疾病B
有效.
PART 03
课时·跟踪检测
关键能力 | 课后练习
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20
22
23
24
25
1. (2025·安徽一模)根据分类变量x与y的成对样本数据,计算得到χ2=
7.174.根据α=0.005的独立性检验,结论为(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A. 变量x与y独立
B. 变量x与y独立,这个结论犯错误的概率不超过0.005
C. 变量x与y不独立
D. 变量x与y不独立,这个结论犯错误的概率不超过0.005

解析:  因为χ2=7.174<7.879=x0.005,所以依据α=0.005的独立性检
验,我们认为变量x与y独立,故选A.
2. 为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内
调查了120位学生,得到如下2×2列联表:
是否喜欢体育锻炼 性别 合计
男 女
喜欢 a b 73
不喜欢 c 25
合计 74
则a-b-c=(  )
A. 7 B. 8
C. 9 D. 10

解析:  根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21.∴a-b-c=52-21-22=9.
3. 对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,
得到如下的列联表,则χ2约为(  )
班级 数学成绩 合计
优秀 不优秀
甲班 11 34 45
乙班 8 37 45
合计 19 71 90
A. 0.600 B. 0.828
C. 2.712 D. 6.014

解析:  χ2= ≈0.600,故选A.
4. 为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,
说法最佳的一项是(  )
A. 药物B的预防效果优于药物A的预防效果
B. 药物A的预防效果优于药物B的预防效果
C. 药物A,B对该疾病均有显著的预防效果
D. 药物A,B对该疾病均没有预防效果

解析:  从等高堆积条形图可以看出,服用药物A后未患病的比例比服
用药物B后未患病的比例大得多,预防效果更好.
5. 〔多选〕某大学为了解学生对学校食堂服务的满意度,随机调查了50名
男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到
如下所示的列联表,经计算χ2≈4.762,则可以推断出(  )
性别 满意 不满意
男 30 20
女 40 10
A. 该学校男生对食堂服务满意的概率的估计值为
B. 调查结果显示,该学校男生比女生对食堂服务更满意
C. 认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过
0.05
D. 认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超
过0.01


解析:  对于A,该学校男生对食堂服务满意的概率的估计值为
= ,故A正确;对于B,该学校女生对食堂服务满意的概率的估计值为
= > ,故B错误;因为χ2≈4.762>3.841=x0.05,认为男、女生对
该食堂服务的评价有差异,此推断犯错误的概率不超过0.05,故C正确,D
错误.
6. 某高校《统计初步》课程的教师随机调查了选该课的学生情况,调查数
据如下表:
性别 非统计专业 统计专业
男 13 10
女 7 20
为了判断是否主修统计专业与性别有无关系,根据表中的数据,计算得到
χ2≈ (保留三位小数),所以判定 (填“能”或“不
能”)在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性
别有关.
4.844

解析:由题意可知,χ2= ≈4.844>3.841=x0.05,
所以能在犯错误的概率不超过0.05的前提下,认为是否主修统计专业
与性别有关.
7. 〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年
级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11
点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别
对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调
查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1
人,抽到学习效率高的学生的概率是0.4,则(  )
A. 高中M的前50名学生中有60%的学生学习效率高
B. 高中N的前50名学生中有40%的学生学习效率高
C. 有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D. 认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05


解析:  高中M的前50名学生中有30人学习效率高,即 ×100%=
60%,所以A正确.高中N的前50名学生中有10人学习效率高,即 ×100%
=20%,所以B错误.这100名学生中学习效率高的学生有100×0.4=40
(人),根据题意填写列联表如下.
学校 学习效率高低 合计
学习效率高 学习效率不高
高中M 30 20 50
高中N 10 40 50
合计 40 60 100
χ2= = ≈16.667>10.828=x0.001,有99.9%的把握
认为学生学习效率高低与晚上睡眠是否充足有关,C正确.认为学生学习效
率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,所以D错误.故选
A、C.
8. 〔多选〕针对时下的“航天热”,某校团委对“是否喜欢航天与学生性
别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜
欢航天的人数占男生人数的 ,女生中喜欢航天的人数占女生人数的 ,若
依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,则被调
查的学生中男生的人数可能为(  )
A. 25 B. 45
C. 60 D. 75



解析:  设男生的人数为5n(n∈N*),根据题意列出2×2列联表如
下所示:
是否喜欢航天 性别 合计
男生 女生
喜欢航天 4n 3n 7n
不喜欢航天 n 2n 3n
合计 5n 5n 10n
则χ2= = ,∵依据α=0.05的独立性检验,认为
是否喜欢航天与学生性别有关,∴χ2≥3.841,即 ≥3.841,得
n≥8.066 1,∴5n≥40.330 5,又n∈N*,∴结合选项知B、C、D正确.故
选B、C、D.
9. 某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中
培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大
密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训
的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过
与是否集中培训有关”犯错误的概率不超过 .
0.001 
考试情况 培训方式 合计
集中培训 分散培训
一次考试通过 50 30 80
一次考试未通过 5 20 25
合计 55 50 105
则χ2= ≈13.793>10.828=x0.001,故认为“能否一次
考试通过与是否集中培训有关”犯错误的概率不超过0.001.
解析:由题意,可得如下2×2列联表:
10. (情境创新)为了了解空气质量指数(AQI)与参加户外健身运动
的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统
计活动:每天记录到体育公园参加户外健身运动的人数,并与当天
AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,
2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI
值,并制作了如下散点图:
环保小组发现散点有分区聚集的特点,尝试作聚类分析.用直线x=100与y
=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的
点数分别为5,10,10,35,并初步认定“参加户外健身运动的人数不少
于100与AQI值不大于100有关联”,则该“初步认定”犯错误的概率范围
是 .
(0.001,0.005)
则χ2= =10.因为7.879<10<10.828,故犯错率在
0.001与0.005之间,所以该“初步认定”犯错误的概率范围是(0.001,
0.005).
解析:根据散点图,建立2×2列联表为
AQI值 参加户外健身运动人数 合计
人数<100 人数≥100
AQI>100 10 5 15
AQI≤100 10 35 45
合计 20 40 60
11. (2024·全国甲卷理17题改编)某工厂进行生产线智能化升级改造,升
级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,
数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙甲间 70 28 2 100
总计 96 52 2 150
(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否
有99%的把握认为甲、乙两车间产品的优级品率存在差异?
解: 根据题意列出列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得χ2= = =4.687 5,
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%
的把握认为甲、乙两车间产品的优级品率存在差异.
(2)已知升级改造前该工厂产品的优级品率p=0.5,设 为升级改造后
抽取的n件产品的优级品率.如果 >p+1.65 ,则认为该工厂
产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线
智能化升级改造后,该工厂产品的优级品率提高了?( ≈12.247)
解: 由题意可知:生产线智能化升级改造后,该工厂产品的优级品
的频率为 =0.64,
用频率估计概率可得 =0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65 =0.5+1.65× ≈0.5+1.65×
≈0.57,
可知 >p+1.65 ,所以可以认为生产线智能化升级改造后,
该工厂产品的优级品率提高了.
THANKS
演示完毕 感谢观看
同课章节目录