3.1 独立性检验 3.2 独立性检验的基本思想 3.3 独立性检验的应用
新课程标准解读 核心素养
1.通过实例,理解2×2列联表的统计意义 数学建模
2.通过实例,了解2×2列联表独立性检验及其应用 数据分析
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 2×2列联表及作用
1.2×2列联表
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=;变量B:B1,B2=.我们将下表这种形式的数据统计表称为2×2列联表:
A B
B1 B2 总计
A1 a b a+b
A2 c d c+d
总计 a+c b+d n=a+b+c+d
2.列联表的作用
分别用频率,,,估计P(A1B1),P(A1B2),P(A2B1),P(A2B2);用频率,,,,估计P(A1),P(B1),P(A2),P(B2);由事件的相互独立性可知:
若有式子=·,则可以认为A1与B1独立;
若=·,则可以认为A1与B2独立;
若=·,则可以认为A2与B1独立;
若=·,则可以认为A2与B2独立.
在=·中,由于,,表示的是频率,不同于概率.即使变量A,B之间独立,式子两边也不一定恰好相等.但是当两边相差很大时,变量A,B之间就不独立.
知识点二 独立性检验的基本思想及应用
1.统计思想
统计学家选取以下统计量,用它的大小来检验变量之间是否独立:
χ2= (其中n=a+b+c+d).
在变量A,B独立的前提下,当样本量很大时,χ2近似服从一个已知的分布χ2(1).当χ2较大时,说明变量之间不独立.
2.应用
在统计中,用以下结果对变量的独立性进行判断:
(1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是 关联的;
(2)当χ2>2.706时,有 的把握判断变量A,B有关联;
(3)当χ2>3.841时,有 的把握判断变量A,B有关联;
(4)当χ2>6.635时,有 的把握判断变量A,B有关联.
【想一想】
如何对独立性检验的基本思想进行理解?
1.判断正误.(正确的画“√”,错误的画“×”)
(1)随机事件中的变量与函数中的变量是同一概念.( )
(2)独立性检验的方法就是用样本频率估计概率的应用.( )
(3)独立性检验中可通过统计表从数据上说明两随机事件的相关性的大小.( )
2.下面是2×2列联表:
X Y
y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
则表中a= ,b= .
3.若由一个2×2列联表中的数据计算得χ2=4.013,那么,有 的把握判断两个变量之间有关系.
题型一 独立性检验的思想
【例1】 为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
(2)是否有99%的把握判断40岁以上的人患胃病与否和生活规律有关系?
尝试解答
通性通法
解决独立性检验问题的基本步骤
(1)根据相关数据,列出2×2列联表,确定a,b,c,d的值;
(2)求χ2的统计量;
(3)由χ2的值判断两变量是否具有关联关系.
【跟踪训练】
某调查机构对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
手术类型 发作心脏病情况
又发作过 心脏病 未发作 心脏病 总计
心脏搭桥手术 39 157 196
血管清障手术 29 167 196
总计 68 324 392
试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.
题型二 独立性检验的实际应用
【例2】 (2022·全国甲卷17题)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
尝试解答
通性通法
利用独立性检验解决实际问题的步骤
(1)计算χ2=;
(2)比较χ2与三个临界值:2.706,3.841和6.635的大小;
(3)得出结论.
【跟踪训练】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2 PM2.5 [0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2 PM2.5 [0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
1.对于两个变量X与Y的随机变量χ2,下列说法正确的是( )
A.χ2越大,“X与Y有关系”的可信程度越小
B.χ2越小,“X与Y有关系”的可信程度越小
C.χ2越接近于0,“X与Y没有关系”的可信程度越小
D.χ2越大,“X与Y没有关系”的可信程度越大
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
是否爱好某项运动 性别
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
经计算得χ2=≈7.8.则正确结论是( )
A.有90%的把握认为“爱好该项运动与性别有关”
B.有90%的把握认为“爱好该项运动与性别无关”
C.有99%的把握认为“爱好该项运动与性别有关”
D.有99%的把握认为“爱好该项运动与性别无关”
3.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论是成立的,则下列说法中正确的是( )
A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
4.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:
学历 销售任务
能按时完成 销售任务 不能按时完 成销售任务 总计
具有相关 大学学历 57 42 99
不具有相关 大学学历 36 65 101
总计 93 107 200
根据上述数据能得出结论:有 的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.
3.1 独立性检验
3.2 独立性检验的基本思想
3.3 独立性检验的应用
【基础知识·重落实】
知识点二
1. 2.(1)没有 (2)90% (3)95% (4)99%
想一想
提示:独立性检验的基本思想是经过选取统计量χ2,按照计算公式χ2=,当χ2较大时,说明两变量A,B有关联(不独立),χ2越大,A与B关联性就越强,当χ2小于一个临界值时,A与B两变量基本相互独立,即没有关联性.因此用χ2作为判断变量A与B是否有具有关联性的统计量.
自我诊断
1.(1)× (2)√ (3)√
2.52 54 解析:a=73-21=52,b=a+2=52+2=54.
3.95% 解析:因为χ2=4.013>3.841,所以有95%的把握认为两个变量之间有关系.
【典型例题·精研析】
【例1】 解:(1)由已知可列2×2列联表:
生活规律情况 患胃病情况
患胃病 未患胃病 总计
生活规律 20 200 220
生活不规律 60 260 320
总计 80 460 540
(2)根据列联表中的数据,由计算公式得
χ2=≈9.638.
因为9.638>6.635,
故有99%的把握判断40岁以上的人患胃病与否和生活规律有关系.
跟踪训练
解:这是一个2×2列联表的独立性检验问题,
χ2=≈1.779.
因为1.779<2.706,所以我们认为这两种手术对病人又发作心脏病的影响无差别.
【例2】 解:(1)由题表可得A公司甲、乙两城之间的长途客车准点的概率为=,
B公司甲、乙两城之间的长途客车准点的概率为=.
(2)K2=
≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
跟踪训练
解:(1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表:
SO2 PM2.5 [0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)根据(2)的列联表得
K2=≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
随堂检测
1.B χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.
2.C 根据独立性检验的思想方法,正确选项为C.
3.AD 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.
4.99% 解析:χ2=≈9.67>6.635,所以有99%的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.
5 / 5(共67张PPT)
3.3 独立性检验的应用
新课程标准解读 核心素养
1.通过实例,理解2×2列联表的统计意义 数学建模
2.通过实例,了解2×2列联表独立性检验及其应用 数据分析
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低
人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月
31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 2×2列联表及作用
1.2×2列联表
设 A , B 为两个变量,每一个变量都可以取两个值,变量 A : A1,
A2= ;变量 B : B1, B2= .我们将下表这种形式的数据统计表
称为2×2列联表:
A B B1 B2 总计
A1 a b a + b
A2 c d c + d
总计 a + c b + d n = a + b + c + d
2. 列联表的作用
分别用频率 , , , 估计 P ( A1 B1), P ( A1 B2), P
( A2 B1), P ( A2 B2);用频率 , , , ,
估计 P ( A1), P ( B1), P ( A2), P ( B2);由事件的相
互独立性可知:
若有式子 = · ,则可以认为 A1与 B1独立;
若 = · ,则可以认为 A1与 B2独立;
若 = · ,则可以认为 A2与 B1独立;
若 = · ,则可以认为 A2与 B2独立.
在 = · 中,由于 , , 表示的是频率,不同于概
率.即使变量 A , B 之间独立,式子两边也不一定恰好相等.但是当两
边相差很大时,变量 A , B 之间就不独立.
知识点二 独立性检验的基本思想及应用
1. 统计思想
统计学家选取以下统计量,用它的大小来检验变量之间是否独立:
χ2= (其中 n = a + b + c + d ).
在变量 A , B 独立的前提下,当样本量很大时,χ2近似服从一个已
知的分布χ2(1).当χ2较大时,说明变量之间不独立.
2. 应用
在统计中,用以下结果对变量的独立性进行判断:
(1)当χ2≤2.706时,没有充分的证据判断变量 A , B 有关联,可以
认为变量 A , B 是 关联的;
(2)当χ2>2.706时,有 的把握判断变量 A , B 有关联;
(3)当χ2>3.841时,有 的把握判断变量 A , B 有关联;
(4)当χ2>6.635时,有 的把握判断变量 A , B 有关联.
没有
90%
95%
99%
提示:独立性检验的基本思想是经过选取统计量χ2,按照
计算公式χ2= ,当χ2较大时,说
明两变量 A , B 有关联(不独立),χ2越大, A 与 B 关联
性就越强,当χ2小于一个临界值时, A 与 B 两变量基本相
互独立,即没有关联性.因此用χ2作为判断变量 A 与 B 是否
有具有关联性的统计量.
【想一想】
如何对独立性检验的基本思想进行理解?
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)随机事件中的变量与函数中的变量是同一概念. ( × )
(2)独立性检验的方法就是用样本频率估计概率的应用.
( √ )
(3)独立性检验中可通过统计表从数据上说明两随机事件的相关
性的大小. ( √ )
×
√
√
2. 下面是2×2列联表:
X Y y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
则表中 a = , b = .
解析: a =73-21=52, b = a +2=52+2=54.
52
54
3. 若由一个2×2列联表中的数据计算得χ2=4.013,那么,有 的
把握判断两个变量之间有关系.
解析:因为χ2=4.013>3.841,所以有95%的把握认为两个变量之间
有关系.
95%
典型例题·精研析
02
课堂互动 关键能力提升
题型一 独立性检验的思想
【例1】 为了调查胃病是否与生活规律有关,在某地对540名40岁以
上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病
者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病
者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
解:由已知可列2×2列联表:
生活规律情况 患胃病情况 患胃病 未患胃病 总计
生活规律 20 200 220
生活不规律 60 260 320
总计 80 460 540
(2)是否有99%的把握判断40岁以上的人患胃病与否和生活规律
有关系?
解:根据列联表中的数据,由计算公式得
χ2= ≈9.638.
因为9.638>6.635,
故有99%的把握判断40岁以上的人患胃病与否和生活规律有
关系.
通性通法
解决独立性检验问题的基本步骤
(1)根据相关数据,列出2×2列联表,确定 a , b , c , d 的值;
(2)求χ2的统计量;
(3)由χ2的值判断两变量是否具有关联关系.
【跟踪训练】
某调查机构对196个接受心脏搭桥手术的病人和196个接受血
管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作
过心脏病,调查结果如下表所示:
手术类型 发作心脏病情况 又发作过心脏病 未发作心脏病 总计
心脏搭桥手术 39 157 196
血管清障手术 29 167 196
总计 68 324 392
试根据上述数据比较这两种手术对病人又发作心脏病的影响有
没有差别.
解:这是一个2×2列联表的独立性检验问题,
χ2= ≈1.779.
因为1.779<2.706,所以我们认为这两种手术对病人又发作心脏
病的影响无差别.
题型二 独立性检验的实际应用
【例2】 (2022·全国甲卷17题)甲、乙两城之间的长途客车均由 A
和 B 两家公司运营.为了解这两家公司长途客车的运行情况,随机调查
了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准
点的概率;
解:由题表可得 A 公司甲、乙两城之间的长途客车准点的
概率为 = ,
B 公司甲、乙两城之间的长途客车准点的概率为 = .
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客
车所属公司有关?
附: K2= ,
P ( K2≥ k ) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
解:K2=
≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客
车所属公司有关.
通性通法
利用独立性检验解决实际问题的步骤
(1)计算χ2= ;
(2)比较χ2与三个临界值:2.706,3.841和6.635的大小;
(3)得出结论.
【跟踪训练】
为加强环境保护,治理空气污染,环境监测部门对某市空气
质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单
位:μg/m3),得下表:
SO2 PM2.5 [0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超
过150”的概率;
解:根据抽查数据,该市100天空气中的PM2.5浓度不超过75,
且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空
气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为
=0.64.
(2)根据所给数据,完成下面的2×2列联表:
SO2 PM2.5 [0,150] (150,475]
[0,75]
(75,115]
解:根据抽查数据,可得2×2列联表:
SO2 PM2.5 [0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空
气中PM2.5浓度与SO2浓度有关?
附: K2= ,
P ( K2≥ k ) 0.050 0.010 0.001
k 3.841 6.635 10.828
解:根据(2)的列联表得
K2= ≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5
浓度与SO2浓度有关.
1. 对于两个变量 X 与 Y 的随机变量χ2,下列说法正确的是( )
A. χ2越大,“ X 与 Y 有关系”的可信程度越小
B. χ2越小,“ X 与 Y 有关系”的可信程度越小
C. χ2越接近于0,“ X 与 Y 没有关系”的可信程度越小
D. χ2越大,“ X 与 Y 没有关系”的可信程度越大
解析: χ2越大,“ X 与 Y 没有关系”的可信程度越小,则“ X 与 Y 有
关系”的可信程度越大.即χ2越小,“ X 与 Y 有关系”的可信程度越小.
2. 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如
下的列联表:
是否爱好某项运动 性别 男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
A. 有90%的把握认为“爱好该项运动与性别有关”
B. 有90%的把握认为“爱好该项运动与性别无关”
C. 有99%的把握认为“爱好该项运动与性别有关”
D. 有99%的把握认为“爱好该项运动与性别无关”
解析: 根据独立性检验的思想方法,正确选项为C.
经计算得χ2= ≈7.8.则正确结论是( )
3. (多选)若在研究吸烟与患肺癌的关系中,通过收集、整理分析数
据得“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论
是成立的,则下列说法中正确的是( )
A. 在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系
B. 1个人吸烟,那么这个人有99%的概率患有肺癌
C. 在100个吸烟者中一定有患肺癌的人
D. 在100个吸烟者中可能一个患肺癌的人也没有
解析: 独立性检验的结论是一个统计量,统计的结果只是说
明事件发生的可能性的大小,具体到一个个体,则不一定发生.
4. 某销售部门为了研究具有相关大学学历和能按时完成销售任务的关
系,对本部门200名销售人员进行调查,所得数据如下表所示:
学历 销售任务 能按时完成 销售任务 不能按时完 成销售任务 总计
具有相关 大学学历 57 42 99
不具有相关 大学学历 36 65 101
总计 93 107 200
根据上述数据能得出结论:有 的把握认为“销售人员具有相关
大学学历与能按时完成销售任务是有关系的”.
解析:χ2= ≈9.67>6.635,所以有99%的把握
认为“销售人员具有相关大学学历与能按时完成销售任务是有关系
的”.
99%
知能演练·扣课标
03
课后巩固 核心素养落地
1. 在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名
女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采
用的数据分析方法应是( )
A. 频率分布直方图 B. 回归分析
C. 独立性检验 D. 用样本估计总体
解析: 根据题意,结合题目中的数据,列出2×2列联表,求出
χ2,得出概率结论,这种分析数据的方法是独立性检验.
1
2
3
4
5
6
7
8
9
10
11
12
13
2. 给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区
别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与
青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A. ①②③ B. ②④⑤
C. ②③④⑤ D. ①②③④⑤
解析: 独立性检验是判断两个分类变量是否有关系的方法,而
①③都是概率问题,不能用独立性检验.
1
2
3
4
5
6
7
8
9
10
11
12
13
3. 下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统
计成绩后的2×2列联表,则χ2的值约为( )
班级 考试成绩 不及格 及格 总计
甲班 12 33 45
乙班 9 36 45
总计 21 69 90
A. 0.559 B. 0.456
C. 0.443 D. 0.4
解析: χ2= ≈0.559,故选A.
1
2
3
4
5
6
7
8
9
10
11
12
13
4. 利用独立性检验对两个分类变量是否有关系进行研究时,若有95%
的把握认为事件 A 和 B 有关系,则具体计算出的数据应该是( )
A. χ2>6.635 B. χ2<6.635
C. χ2>3.841 D. χ2<3.841
解析: 有95%的把握认为事件 A 和 B 有关系,由独立性检验可知
应为χ2>3.841.
1
2
3
4
5
6
7
8
9
10
11
12
13
5. (多选)下列关于独立性检验的说法中,正确的是( )
A. 独立性检验依据小概率原理
B. 利用独立性检验原理得到的结论一定正确
C. 样本不同,独立性检验的结论可能有差异
D. 独立性检验不是判定两类事物是否相关的唯一方法
1
2
3
4
5
6
7
8
9
10
11
12
13
解析: 根据独立性检验的概念,可得独立性检验依据小概率
原理,所以A正确;利用独立性检验时与样本的选取有关,所以得
到的结论可能有误,所以B错误;利用独立性检验时与样本的选取
有关,所以样本不同,独立性检验的结论可能有差异,所以C正
确;例如回归分析也能判定两类事物的相关性,所以独立性检验不
是判定两类事物是否相关的唯一方法,所以D正确,故选A、C、D.
1
2
3
4
5
6
7
8
9
10
11
12
13
6. (多选)晚上睡眠充足是提高学习效率的必要条件,某高中 M 的高
三年级学生晚上10点10分必须休息,另一所同类高中 N 的高三年级
学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休
息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的
学习效率进行问卷调查,其中高中 M 有30名学生的学习效率高,且
从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是
0.4,则( )
A. 高中 M 的前50名学生中有60%的学生学习效率高
B. 高中 N 的前50名学生中有40%的学生学习效率高
C. 有99%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D. 没有99%的把握认为学生学习效率高低与晚上睡眠是否充足有关
1
2
3
4
5
6
7
8
9
10
11
12
13
解析: 高中 M 的前50名学生中有30人学习效率高,即
×100%=60%,所以A正确.这100名学生中学习效率高的学生有
100×0.4=40(人),高中 N 的前50名学生中有10人学习效率高,
即 ×100%=20%,所以B错误.根据题意填写列联表如下.
1
2
3
4
5
6
7
8
9
10
11
12
13
学校 学习效率情况 学习效率高 学习效率不高 总计
高中 M 30 20 50
高中 N 10 40 50
总计 40 60 100
χ2= = ≈16.667>6.635,有99%的把握认为
学生学习效率高低与晚上睡眠是否充足有关,C正确,D错误.故选
A、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
7. 博鳌亚洲论坛2023年年会于3月28日至31日在海南博鳌举行.为了搞
好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下
面“性别与会俄语”的2×2列联表中, a - b + d = .
性别 会俄语情况
会俄语 不会俄语 总计 男 a b 20 女 6 d 总计 18 30 8
1
2
3
4
5
6
7
8
9
10
11
12
13
解析:由2×2列联表的性质,可得: a =18-6=12, b =20-12=
8,6+ d =30-20,可得 d =4,所以 a - b + d =8.
1
2
3
4
5
6
7
8
9
10
11
12
13
8. 在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2≥3.841
时,至少有95%的把握说明两个事件有关;当χ2≥6.635时,至少有
99%的把握说明两个事件有关;当χ2<3.841时,认为两个事件无关.
在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算得χ2=
20.87.根据这一数据,我们可认为打鼾与患心脏病 (填“有关”
或“无关”).
解析:当χ2=20.87>6.635时,至少有99%的把握认为打鼾与患心脏
病有关.
有关
1
2
3
4
5
6
7
8
9
10
11
12
13
9. 为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表
中的数据:
性别 疗效 无效 有效 总计
男性患者 15 35 50
女性患者 6 44 50
总计 21 79 100
1
2
3
4
5
6
7
8
9
10
11
12
13
由上表中数据计算得χ2≈ ,从而得出结论:有 的把握认
为服用此药的效果与患者的性别有关.
解析:由公式计算得χ2≈4.882.因为χ2>3.841,所以我们有95%的把
握认为服用此药的效果与患者的性别有关.
4.882
95%
1
2
3
4
5
6
7
8
9
10
11
12
13
10. 某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分
工人,得到结果如下:
文化程度 月收入 月收入2 000 元以下 月收入2 000 元及以上 总计
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
1
2
3
4
5
6
7
8
9
10
11
12
13
由上表中数据计算得χ2= ≈6.109,请估计有
多大把握认为“文化程度与月收入有关系”( )
A. 1% B. 99% C. 2.5% D. 95%
解析: 由于6.109>3.841,故有95%的把握认为“文化程度与月
收入有关系”.
1
2
3
4
5
6
7
8
9
10
11
12
13
11. (多选)有两个分类变量 X , Y ,其列联表如下所示:
X Y Y1 Y2
X1 a 20- a
X2 15- a 30+ a
1
2
3
4
5
6
7
8
9
10
11
12
13
A. 6 B. 7
C. 8 D. 9
解析: 根据公式,
得χ2= = >3.841,根
据 a >5且15- a >5, a ∈Z,求得当 a =8或9时满足题意.
其中 a ,15- a 均为大于5的整数,若有95%的把握判断 X , Y 有
关,则 a 的值为( )
1
2
3
4
5
6
7
8
9
10
11
12
13
12. 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样
的方法从该地区调查了500位老年人,结果如下:
是否需要志愿者 性别
男 女 需要 40 30 不需要 160 270 1
2
3
4
5
6
7
8
9
10
11
12
13
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比
例;
解:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为 ×100%=14%.
1
2
3
4
5
6
7
8
9
10
11
12
13
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供
帮助与性别有关?
解:χ2= ≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是
否需要帮助与性别有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
(3)根据(2)的结论,能否提出更好的调查方法来估计该地
区的老年人中,需要志愿者提供帮助的老年人的比例?说
明理由.
解:由(2)的结论知,该地区老年人是否需要帮助与
性别有关,并且从样本数据能看出该地区男性老年人与女性
老年人中需要帮助的比例有明显差异,因此在调查时,先确
定该地区老年人中男、女的比例,再把老年人分成男、女两
层并采用分层随机抽样方法比采用简单随机抽样方法更好.
1
2
3
4
5
6
7
8
9
10
11
12
13
13. 某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学
生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看
篮球赛的人数占男生人数的 ,女生喜欢看篮球赛的人数占女生人
数的 .若被调查的男生人数为 n ,且有95%的把握认为喜欢看篮球
赛与性别有关,求 n 的最小值.
解:由题意得到如下列联表:
1
2
3
4
5
6
7
8
9
10
11
12
13
性别 看篮球赛情况 喜欢 不喜欢 总计
男 n
女
总计 n
1
2
3
4
5
6
7
8
9
10
11
12
13
所以χ2= = .
因为有95%的把握认为喜欢看篮球赛与性别有关,所以χ2>3.841,
即 >3.841,得 n > ≈10.24.
又 , , 为整数,所以 n 的最小值为12.
1
2
3
4
5
6
7
8
9
10
11
12
13
谢 谢 观 看!3.1 独立性检验 3.2 独立性检验的基本思想 3.3 独立性检验的应用
1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )
A.频率分布直方图 B.回归分析
C.独立性检验 D.用样本估计总体
2.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A.①②③ B.②④⑤
C.②③④⑤ D.①②③④⑤
3.下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的2×2列联表,则χ2的值约为( )
班级 考试成绩
不及格 及格 总计
甲班 12 33 45
乙班 9 36 45
总计 21 69 90
A.0.559 B.0.456
C.0.443 D.0.4
4.利用独立性检验对两个分类变量是否有关系进行研究时,若有95%的把握认为事件A和B有关系,则具体计算出的数据应该是( )
A.χ2>6.635 B.χ2<6.635
C.χ2>3.841 D.χ2<3.841
5.(多选)下列关于独立性检验的说法中,正确的是( )
A.独立性检验依据小概率原理
B.利用独立性检验原理得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判定两类事物是否相关的唯一方法
6.(多选)晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )
A.高中M的前50名学生中有60%的学生学习效率高
B.高中N的前50名学生中有40%的学生学习效率高
C.有99%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D.没有99%的把握认为学生学习效率高低与晚上睡眠是否充足有关
7.博鳌亚洲论坛2023年年会于3月28日至31日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与会俄语”的2×2列联表中,a-b+d= .
性别 会俄语情况
会俄语 不会俄语 总计
男 a b 20
女 6 d
总计 18 30
8.在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2≥3.841时,至少有95%的把握说明两个事件有关;当χ2≥6.635时,至少有99%的把握说明两个事件有关;当χ2<3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算得χ2=20.87.根据这一数据,我们可认为打鼾与患心脏病 (填“有关”或“无关”).
9.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
性别 疗效
无效 有效 总计
男性患者 15 35 50
女性患者 6 44 50
总计 21 79 100
由上表中数据计算得χ2≈ ,从而得出结论:有 的把握认为服用此药的效果与患者的性别有关.
10.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到结果如下:
文化程度 月收入
月收入2 000元以下 月收入2 000元及以上 总计
高中文化以上 10 45 55
高中文化及以下 20 30 50
总计 30 75 105
由上表中数据计算得χ2=≈6.109,请估计有多大把握认为“文化程度与月收入有关系”( )
A.1% B.99% C.2.5% D.95%
11.(多选)有两个分类变量X,Y,其列联表如下所示:
X Y
Y1 Y2
X1 a 20-a
X2 15-a 30+a
其中a,15-a均为大于5的整数,若有95%的把握判断X,Y有关,则a的值为( )
A.6 B.7 C.8 D.9
12.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:
是否需要志愿者 性别
男 女
需要 40 30
不需要 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
13.某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的.若被调查的男生人数为n,且有95%的把握认为喜欢看篮球赛与性别有关,求n的最小值.
3.1 独立性检验
3.2 独立性检验的基本思想
3.3 独立性检验的应用
1.C 根据题意,结合题目中的数据,列出2×2列联表,求出χ2,得出概率结论,这种分析数据的方法是独立性检验.
2.B 独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.
3.A χ2=≈0.559,故选A.
4.C 有95%的把握认为事件A和B有关系,由独立性检验可知应为χ2>3.841.
5.ACD 根据独立性检验的概念,可得独立性检验依据小概率原理,所以A正确;利用独立性检验时与样本的选取有关,所以得到的结论可能有误,所以B错误;利用独立性检验时与样本的选取有关,所以样本不同,独立性检验的结论可能有差异,所以C正确;例如回归分析也能判定两类事物的相关性,所以独立性检验不是判定两类事物是否相关的唯一方法,所以D正确,故选A、C、D.
6.AC 高中M的前50名学生中有30人学习效率高,即×100%=60%,所以A正确.这100名学生中学习效率高的学生有100×0.4=40(人),高中N的前50名学生中有10人学习效率高,即×100%=20%,所以B错误.根据题意填写列联表如下.
学校 学习效率情况
学习效率高 学习效率不高 总计
高中M 30 20 50
高中N 10 40 50
总计 40 60 100
χ2==≈16.667>6.635,有99%的把握认为学生学习效率高低与晚上睡眠是否充足有关,C正确,D错误.故选A、C.
7.8 解析:由2×2列联表的性质,可得:a=18-6=12,b=20-12=8,6+d=30-20,可得d=4,所以a-b+d=8.
8.有关 解析:当χ2=20.87>6.635时,至少有99%的把握认为打鼾与患心脏病有关.
9.4.882 95% 解析:由公式计算得χ2≈4.882.因为χ2>3.841,所以我们有95%的把握认为服用此药的效果与患者的性别有关.
10.D 由于6.109>3.841,故有95%的把握认为“文化程度与月收入有关系”.
11.CD 根据公式,得
χ2==>3.841,根据a>5且15-a>5,a∈Z,求得当a=8或9时满足题意.
12.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为×100%=14%.
(2)χ2=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层随机抽样方法比采用简单随机抽样方法更好.
13.解:由题意得到如下列联表:
性别 看篮球赛情况
喜欢 不喜欢 总计
男 n
女
总计 n
所以χ2==.
因为有95%的把握认为喜欢看篮球赛与性别有关,所以χ2>3.841,
即>3.841,得n>≈10.24.
又,,为整数,所以n的最小值为12.
1 / 3