8.3 列联表与独立性检验(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册

文档属性

名称 8.3 列联表与独立性检验(课件 学案 练习)高中数学人教A版(2019)选择性必修 第三册
格式 zip
文件大小 11.8MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-09-11 21:26:17

文档简介

(共103张PPT)
8.3 列联表与独立性检验
探究点一 用2×2列联表分析两变量间的关系
探究点二 用等高堆积条形图分析两变量间的关系
探究点三 独立性检验的综合应用
【学习目标】
1.理解独立性检验的基本思想及其实施步骤.
2.能利用等高堆积条形图、 列联表探讨两个分类变量的关联.
3.了解 的含义及其应用.
4.通过对数据的处理,提高解决实际问题的能力.
知识点一 分类变量与列联表
1.分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,
这类随机变量称为分类变量.
2.列联表
(1)定义:列出的两个分类变量的________,称为列联表.
(2)列联表:一般地,定义一对分类变量和如下:
和其样本频数列联表(称为 列联表)为:
Y 合计
合计
频数表
3.等高堆积条形图
(1)等高堆积条形图和表格相比,更能直观地反映出两个分类变量
间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.
(2)如果直接观察等高堆积条形图发现 与
相差很大,就可以判断两个分类变量之间有关联.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)分类变量中的变量与函数中的变量是同一概念.( )
×
(2) 列联表是借助两个分类变量之间频率大小的差异说明两
个变量之间是否有关联.( )

知识点二 独立性检验
1.零假设
要判断事件和 之间是否有关联,需要判断假定关系
是否成立,通常称 为零假设.
也可改述为分类变量和 独立.
2.独立性检验:利用的取值推断分类变量和 __________的方法
称为 独立性检验,读作“卡方独立性检验”,简称____________.
3.公式:_ _________________,其中 _____________.
是否独立
独立性检验
4.小概率值 的检验规则
(1)当时,我们推断不成立,即认为和 不独立,该推
断犯错误的概率不超过 ;
(2)当时,我们没有充分证据推断不成立,可以认为
和 独立.
5.临界值表
0.1 0.05 0.01 0.005 0.001
2.706 ______ 6.635 7.879 _______
3.841
10.828
6.应用独立性检验解决实际问题包括的主要环节
(1)提出零假设和 __________,并给出在问题中的解释;
(2)根据抽样数据整理出 列联表,计算____的值,并与_____
_____比较;
(3)根据检验规则得出推断结论;
(4)在和 不独立的情况下,根据需要,通过比较相应的频率,
分析和 间的影响规律.
相互独立
临界值
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)在独立性检验中,若 越大,则两个分类变量有关联的可能性越
大.( )

(2)若 ,则在犯错误的概率不超过0.01的前提下,认为
吸烟与患肺病有关联,那么在100个吸烟的人中必有99人患有肺病.
( )
×
(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一
定是正确的.( )
×
(4)零假设可以表述为:分类变量和 相互独立.( )

(5)独立性检验的样本不同,其结论可能不同.( )

探究点一 用2×2列联表分析两变量间的关系
例1 在对人们饮食习惯的一次调查中,从某一居民小区中共调查了1
24位居民,其中六十岁及六十岁以上的有70人,六十岁以下的有54
人.六十岁及六十岁以上的人中有43人的饮食以蔬菜为主,另外27人
以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33
人以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利
用与 判断二者是否有关联.
解:用 表示调查的124人所构成的集合,对于 中的每1位居民,
定义一对分类变量和

用表格整理数据,得到 列联表如下:
饮食习惯 年龄 合计
43 21 64
27 33 60
合计 70 54 124
单位:人
则 ,
显然二者具有较为明显的差距,
据此可以在某种程度上认为饮食习惯与年龄有关联.
变式 假设有两个分类变量与,它们的可能取值分别为 和
其 列联表如下:
Y 合计
10 18 28
26
合计 44
若与相互独立,则 的值约为( )
A.8 B.9 C.14 D.19
[解析] 若与相互独立,则有,解得 .

[素养小结]
(1)作 列联表,关键是对涉及的变量分清类别,同时计算时
要准确无误.
(2)利用 列联表分析两个分类变量间的关系时,首先要根据
题中数据获得 列联表,然后根据频率特征,即将
与 的值相比,可直观地反映出两个分
类变量间是否相互影响.
探究点二 用等高堆积条形图分析两变量间的关系
例2 为了解铅中毒病人与尿棕色素为阳性是否有关联,分别对病人
组和对照组的尿液进行尿棕色素定性检查,结果如下:
单位:人
分组 尿棕色素定性 合计
29 7 36
9 28 37
合计 38 35 73
试作出等高堆积条形图,分析铅中毒病人与尿棕色素为阳性是否有
关联.
解:病人组中尿棕色素为阳性和阴性的频率分别为 和
.
对照组中尿棕色素为阳性和阴性的频率分别为和
.
作出等高堆积条形图如图所示.
其中两个深色条的高分别代表病人组和对照组
样本中尿棕色素为阳性的频率.
由图可以直观地看出病人组与对照组相比,
尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为
阳性有关联.
变式 某学校对高三学生做了一项调查,发现在平时的模拟考试中,
性格内向的426名学生中有332人在考前心情紧张,性格外向的594名
学生中有213人在考前心情紧张,作出等高堆积条形图,利用图形判
断考前心情与性格类型是否有关联.
解:作列联表如下:
单位:人
考前心情 性格类型 合计
332 213 545
94 381 475
合计 426 594 1020
考前心情紧张中性格内向和性格外向的频率分别
为和 .
考前心情不紧张中性格内向和性格外向的频率分
别为 和 .
作等高堆积条形图如图:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比
例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考
前心情不紧张的样本中性格内向占的比例高,可以认为考前心情与
性格类型有关联.
[素养小结]
利用等高堆积条形图判断两个分类变量是否有关联的步骤
(1)收集数据,统计结果;
(2)列出 列联表,计算频率粗略估计;
(3)画等高堆积条形图,直观分析.
探究点三 独立性检验的综合应用
例3 某大型企业人力资源部为了研究企业员工工作积极性和对待企
业改革态度的关系,经过调查得到如下 列联表:
单位:人
工作态度 对待企业改革态度 合计
积极支持 不太支持 积极 54 40 94
一般 32 63 95
合计 86 103 189
能否根据小概率值 的独立性检验,认为员工工作态度与对
待企业改革态度之间有关联?
解:零假设为 员工工作态度与对待企业改革态度之间无关联.
由 列联表中的数据,经计算得到

因此,根据小概率值的独立性检验,我们推断 不成立,
即认为员工工作态度与对待企业改革态度之间有关联,此推断犯错
误的概率不大于0.005.
变式 游泳作为一项重要的求生技能和运动项目受到很多人的喜爱,
某中学对100名学生进行了问卷调查,得到如下 列联表:
单位:人
性别 是否喜欢游泳 合计
喜欢 不喜欢 男 10
女 20
合计
已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为 .
(1)请将上述 列联表补充完整.
解:因为在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为 ,
所以这100人中喜欢游泳的学生人数为
列联表补充完整如下:
单位:人
性别 是否喜欢游泳 合计
喜欢 不喜欢 男 40 10 50
女 20 30 50
合计 60 40 100
(2)根据小概率值 的独立性检验,能否认为该校学生是
否喜欢游泳与性别之间有关联?
解:零假设为 该校学生是否喜欢游泳与性别之间无关联.
根据 列联表中的数据,经计算得到

根据小概率值的独立性检验,我们推断 不成立,
即认为该校学生是否喜欢游泳与性别之间有关联,此推断犯错误的
概率不大于0.001.
[素养小结]
利用 进行独立性检验的步骤:
(1)提出零假设 ;
(2)列出 列联表;
(3)计算出 的值;
(4)与临界值 比较,得出事件有关的可能性大小,进行判断.
拓展 随着生活水平的提高,人们的休闲方式也发生了变化.某机构
随机调查了个人,其中男性占调查人数的 .已知男性中有一半的人
的休闲方式是运动,而女性中只有 的人的休闲方式是运动.
(1)完成下列 列联表:
单位:人
性别 休闲方式 合计
运动 非运动 男性
女性
合计
解:补全 列联表如下:
单位:人
性别 休闲方式 合计
运动 非运动 男性
女性
合计
(2)如果根据小概率值 的独立性检验,可认为性别与休闲
方式有关联,那么本次调查至少调查了多少人?
解:若根据小概率值 的独立性检验,可认为性别与休闲方
式有关联,则 .
因为,所以 ,即.
又因为,所以 ,故如果根据小概率值 的
独立性检验,可认为性别与休闲方式有关联,那么本次调查至少
调查了140人.
卡尔·皮尔逊(1857年 年)是英国数学家,生物统计学家,
数理统计学的创立者.他被公认是旧派理学派和描述统计学派的代表
人物,并被誉为现代统计科学的创立者.
皮尔逊从九十年代初开始进军生物统计学.他不断运用统计方法
对生物学、遗传学、优生学做出新的贡献.同时,他在先辈们的概率
论研究的基础上,导入了许多新的概念,把生物统计方法提炼成为
一般处理统计资料的通用方法,发展了统计方法论,把概率论与统
计学两者熔为一炉.1900年皮尔逊提出了有名的“卡方检验法”.
1.如何用列联表判定两个分类变量是否有关联?
提示:利用列联表中的数据计算,若 ,
则说明两分类变量无关联,若 ,
则说明两分类变量有关联.
2.用 进行独立性检验的依据
独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量
独立”成立,计算随机变量的值,如果 的值很大,说明假设不合
理. 越大,两个分类变量有关联的可能性越大.
3.独立性检验与反证法的异同点
(1)两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来
断定结论是否成立.
(2)但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合
逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的
小概率事件的发生,即在结论不成立的假设下,推出有利于结论成
立的小概率事件发生.
4.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.
(1)准确给出 列联表.
合计
合计
,并且 为样本容量.
(2)当与无关时,指事件与 相互独立,应该有,
我们用字母 表示上式,即,我们称之为统计
假设.当 成立时,下面三个式子都成立:,
, .
(3)计算 ,它的大小可以决定是否拒绝假设 .
(4)为 的临界值,当时,推断不成立,即认为和
不独立,该推断犯错误的概率不超过 .当 时,没有充分证
据推断不成立,可以认为和 独立.
独立性检验问题的求解策略
(1)等高堆积条形图法:依据题目信息画出等高堆积条形图,依据
频率差异来粗略地判断两个变量是否有关联.
(2)统计量法:通过公式,计算 ,根
据小概率值 的独立性检验,推断 是否成立,最后得出结论.
1.等高堆积条形图的应用举例
例1 为考察某种药物预防疾病的效果,进行动物试验,试验结果如
下表:
患病 未患病 合计
服用药 10 45 55
没有服用药 20 30 50
合计 30 75 105
试用等高堆积条形图判断服用药与患病之间是否有关联.
解:相应的等高堆积条形图如图所示.
从图形可以看出,服用药的样本中患病的比例明显低于没有服用药
的样本中患病的比例,因此可以认为服用药与患病之间有关联.
2.卡方检验举例
例2 为调研某中学足球训练开展情况,随机抽取
该校男、女学生各100名,统计每人日均参加足球
训练的时间,结果都在 分钟之间,其中60
分钟及以上者106人.将100名男生参加足球训练
的时间分成6组:,,, ,
得到的频率分布直方图如图所示.
(1)求频率分布直方图中 的值,并估计男生参
加足球训练时间的样本数据的 分位数;
解:根据男生参加足球训练时间的频率分布直方
图可得,解得 .
设样本数据的分位数为 ,则
,解
得 .
(2)若将参加足球训练时间在60分钟及以上者视为爱好足球,根据
小概率值 的独立性检验,能否认为是否爱好足球与性别有
关联?
附:,其中 .

0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:由频率分布直方图可知,样本中爱好足球的
男生人数为 ,
所以爱好足球的女生人数为 ,
可得 列联表如下:
单位:人
性别 足球 合计
爱好 不爱好 男 60 40 100
女 46 54 100
合计 106 94 200
零假设为 是否爱好足球与性别无关联.
根据以上数据,计算得到

根据小概率值的独立性检验,我们推断 不成立,即认
为是否爱好足球与性别有关联,此推断犯错误的概率不大于0.05.
练习册
一、选择题
1.下列变量中不属于分类变量的是( )
A.性别 B.吸烟 C.年龄 D.国籍
[解析] “吸烟”不是分类变量,“是否吸烟”才是分类变量.

2.下列关于回归分析与独立性检验的说法正确的是( )
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两
个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变
量是否具有某种关联的一种检验;
④独立性检验可以 确定两个变量之间是否具有某种关联.
A.①② B.③ C.③④ D.①②③④

[解析] 回归分析是对两个变量之间的相关关系的一种分析,而相关
关系是一种不确定关系,通过回归分析分析两个变量之间可能具有
的相关关系.
而独立性检验是对两个变量之间是否具有某种关联的分析,
并且可以分析这两个变量在多大程度上具有这种关联,但不能
肯定这种关联.
故①②④错误,③正确.故选B.
3.[2024·濮阳高二期中]为研究男生和女生对数学课程的喜爱程度是
否有差异,运用列联表进行检验,经计算得 ,参考
下表,则认为“男生和女生对数学课程的喜爱程度有差异”犯错误的
概率不超过( )
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A. B. C. D.
[解析] 因为,结合表格可知 ,
所以认为“男生和女生对数学课程的喜爱程度有差异”犯错误的概率
不超过,即 .故选A.

4.为考察, 两种药物预防某种疾病的效果,进行动物试验,得到
如图所示的等高堆积条形图:
根据图中信息,下列说法中正确的是( )
A.药物的预防效果优于药物 的预防效果
B.药物的预防效果优于药物 的预防效果
C.药物 对该疾病没有显著的预防效果
D.药物, 对该疾病均没有预防效果
[解析] 从等高堆积条形图可以看出,服用药物A后未患病的比例比
服用药物B后未患病的比例大得多,所以药物A的预防效果更好.

5.通过随机询问110名大学生是否爱好某项运动,得到如下的 列
联表.
单位:人
性别 是否爱好某项运动 合计
不爱好 爱好 男 20 40 60
女 30 20 50
合计 50 60 110
则下列结论正确的是( )
A.在犯错误的概率不超过0.01的前提下,认为“是否爱好某项运动与
性别有关联”
B.在犯错误的概率不超过0.01的前提下,认为“是否爱好某项运动与
性别无关联”
C.在犯错误的概率不超过0.001的前提下,认为“是否爱好某项运动与
性别有关联”
D.在犯错误的概率不超过0.001的前提下,认为“是否爱好某项运动与
性别无关联”

[解析] 由题意,可得
,所以在犯错误的
概率不超过0.01的前提下,认为“是否爱好某项运动与性别有关联”.
故选A.
6.[2024·江西九江同文中学高二期末]假设有两个变量和 ,它们的
取值分别为,和,,其 列联表为
合计
合计
根据以下选项中的数据计算的值,其中 最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
[解析] 对于A, ;
对于B, ;
对于C, ;
对于D,.显然 最大,故选C.

7.[2024·武汉武钢三中高二月考]某校团委对“学生性别和是否喜欢某
视频 是否有关联”做了一次调查,其中被调查的女生人数是男生
人数的一半,男生喜欢该视频的人数占男生人数的 ,女生喜欢
该视频的人数占女生人数的,若依据小概率值 的独立
性检验,认为是否喜欢该视频 和性别有关联,则男生至少有
( )
附:
0.05 0.01
3.841 6.635
, .
A.12人 B.6人 C.10人 D.18人

[解析] 设被调查的男生人数为,则被调查的女生人数为,则
列联表为
单位:人
性别 合计
喜欢 不喜欢 男生
女生
合计
根据小概率值的独立性检验,认为是否喜欢某视频 和性
别有关联,则 ,
因为,所以,则 ,
又,, 均为整数,所以男生至少有12人.故选A.
8.(多选题)[2024·河南南阳高二期中] 如表,在两个变量与 的
列联表中,已知 ,其中
,则下列结论正确的是( )
合计
合计
A.若每个数据,,,均变为原来的2倍,则 的值不变
B. 越大,两个变量有关联的可能性越大
C.对于独立性检验,随机变量 的值越小,判定“两变量有关联”犯
错误的概率越大
D.若计算得到,则认为“与 有关联”犯错误的概率不超
过0.05



[解析] 对于A,若 列联表中的每个数字均变成原来的2倍,则
,此时 的
值变为原来的2倍,所以A错误;
对于B,同一个样本中, 越小,说明两个变量有关联的可能性越
小, 越大,说明两个变量有关联的可能性越大,所以B正确;
对于C,独立性检验中,随机变量 的值越小,判定“两变量有关联”犯错
误的概率越大,所以C正确;
对于D,根据独立性检验的意义可知,所以认
为“与 有关联”犯错误的概率不超过,所以D正确.故选 .
9.(多选题)某大学为了解学生对学校食堂服务的满意度,随机调查
了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意
的评价,得到如下列联表.经计算 ,则下列说法正确
的是( )
单位:人
性别 对食堂服务的评价 合计
不满意 满意 男 20 30 50
女 10 40 50
合计 30 70 100
A.该学校男生对食堂服务满意的概率的估计值为
B.调查结果显示,该学校男生比女生对食堂服务更满意
C.在犯错误的概率不超过0.05的前提下,认为男、女生对食堂服务的
评价有差异
D.在犯错误的概率不超过0.01的前提下,认为男、女生对食堂服务的
评价有差异


[解析] 对于A,该学校男生对食堂服务满意的概率的估计值为 ,
故A正确;
对于B,该学校女生对食堂服务满意的概率的估计值为,
故B错误;
对于C,D,因为 ,所以在犯错误的概率不
超过0.05的前提下,认为男、女生对食堂服务的评价有差异,故C正
确,D错误.故选 .
二、填空题
10.为了解某挑战赛中受邀者的性别与是否接受挑战的关联性,得到
如下 列联表:
单位:人
性别 挑战 合计
不接受挑战 接受挑战 男 21 73
女 8 25 33
合计 46 106
则表中, 的值分别为______.
52,60
[解析] ,, .
11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史
者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发
病的有17人,不发病的有240人,故根据小概率值 _____的独立性
检验,认为糖尿病与家族史有关联.(填“0.05”“0.01”或“0.005”)
0.05
[解析] 由题作出 列联表如下:
单位:人
家族史 糖尿病 合计
糖尿病发病 糖尿病不发病 阳性家族史 16 93 109
阴性家族史 17 240 257
合计 33 333 366
零假设为 糖尿病与家族史无关联.
经计算得到 ,
故根据小概率值的独立性检验,我们推断 不成立,
即认为糖尿病与家族史有关联.
12.[2024·丹东高二期中] 为了考察某种药物预防疾病的效果,进行
动物试验,得到如下列联表:
单位:只
药物 是否患病 合计
未患病 患病 服用 50
未服用 50
合计 80 20 100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物
有效”的结论,则的最小值为____.(其中且 ,参考
数据:, )
附:, .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
46
[解析] 由题意可得 ,
整理得,
因为 ,所以 ,所以
,解得 ,
又因为,所以,所以 的最小值为46.
三、解答题
13. 是一种基于人工智能的语言模型,具备卓越的自然语言
处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们
学习、工作与生活中的出色助手.尽管如此,也有部分人认为
会对人类未来工作产生威胁,将在未来取代一部分人的职业.
现对200家企业开展调查,统计每家企业一年内应用 的广
泛性及招聘人数的增减,得到数据结果统计如表所示:
单位:人
招聘人数 合计
减少 增加 广泛应用 60 50 110 没有广泛应用 40 50 90 合计 100 100 200 根据小概率值的独立性检验,能否认为 企业招聘人数的增
减与 应用的广泛性有关联?
解:零假设为企业招聘人数的增减与 应用的广泛性无
关联,
因为 ,所以根
据小概率值的独立性检验,没有充分证据推断 不成立,
因此可认为成立,即认为企业招聘人数的增减与 应用
的广泛性无关联.
14.某校学生社团组织社会调查活动,随机调查了市区某个路口100个
工作日中每天早高峰时段(7点至9点)的天气情况和当天早高峰时
段经过该路口的机动车车次,整理数据得到下表:
天气 机动车车次
晴天 10 52 13
阴天 2 9 8
雨天 0 2 4
(1)分别估计该市一天早高峰时段的天气为晴天和雨天的概率.
解:该市一天早高峰时段的天气为晴天的概率的估计值为
,
该市一天早高峰时段的天气为雨天的概率的估计值为 .
(2)晴天记为“天气好”,阴天或雨天记为“天气不好”.若当天早高峰
时段经过该路口的机动车车次小于1600,则视为交通顺畅,否则视
为交通拥堵.根据所给数据,试列出 列联表,根据小概率值
的独立性检验,能否认为交通状况与天气情况有关联?
附:, .
0.05 0.01 0.005
3.841 6.635 7.879
解: 列联表如下:
单位:天
天气情况 交通状况 合计
交通顺畅 交通拥堵 天气好 62 13 75
天气不好 13 12 25
合计 75 25 100
零假设为 交通状况与天气情况无关联.
由表中数据,得 .
根据小概率值的独立性检验,我们推断 不成立,即认为
交通状况与天气情况有关联.
15.(多选题)某网店商家想通过软件广告推荐功能吸引潜在客户.为
使广告能够精准投放达到利益最大化,随机抽取了200名在本店一季
度消费过的客户数据,所得统计图如图.
按照年龄分为年轻人(30岁以下)和非年轻人(30岁及以上),若
一季度内购买3次及以上就记为优质客户,其中非年轻人占 ,则下
列说法正确的是( )
附:, .
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A.为了增加优质客户的比例,应向30岁以下人群投放广告
B.根据小概率值 的独立性检验,认为是否为优质客户与年
龄有关联
C.已知一位顾客是年轻人,则他是优质客户的概率是
D.已知一位顾客一季度内仅购买1次,则他是非年轻人的概率是


[解析] 由题意可知抽取的年轻人有
(人),非年轻人有 (人),
抽取的优质客户有 (人),
则非优质客户有80人,
其中优质客户中年轻人有60人,非年轻人有60人,
画出 列联表如下:
单位:人
年龄 客户 合计
优质客户 非优质客户 年轻人 60 60 120
非年轻人 60 20 80
合计 120 80 200
对于A,优质客户中年轻人和非年轻人的占比相同,而年轻人中优质
客户占,非年轻人中优质客户占 ,所以非年轻人购买力强,
所以为了增加优质客户的比例,应向30岁及以上人群投放广告,故A
错误;
对于B,零假设为 是否为优质客户与年龄无关联,经计
算得到 ,所以根据
小概率值的独立性检验,我们推断 不成立,即认为是否
为优质客户与年龄有关联,故B正确;
对于C,因为年轻人有120人,
其中优质客户有60人,所以已知一位顾客是年轻人,则他是优质客
户的概率是,故C正确;
对于D,因为非优质客户中非年轻人占 ,
所以已知一位顾客一季度内仅购买1次,则他是非年轻人的概率是 ,
故D错误.故选 .
16.[2024·龙岩上杭一中高二月考] 某兴趣小组调查并统计了某班级
学生期末统考中的数学成绩和建立个性化错题本的情况,用来研究
这两者是否有关联.若从该班级中随机抽取1名学生,设 “抽取的
学生期末统考中的数学成绩不及格”, “抽取的学生建立了个性化
错题本”,且,, .
(1)求和 .
解:因为, ,
所以, ,
由,得 ,
因为 ,
所以,所以. ,
解得 .
(2)若该班级共有36名学生,请完成列联表,并依据小概率值
的独立性检验,分析学生期末统考中的数学成绩与建立个
性化错题本是否有关联?
单位:人
个性化错题本 期末统考中的数学成绩 合计
及格 不及格 建立
未建立
合计
参考公式及数据:, .
0.01 0.005 0.001
6.635 7.879 10.828
解:由(1)可知,期末统考中的数学成绩及格的学生人数为
,其中建立了个性化错题本的学生人数为
,未建立个性化错题本的学生人数为

期末统考中的数学成绩不及格的学生人数为 ,其中建
立了个性化错题本的学生人数为

未建立个性化错题本的学生人数为 ,列联表如下:
单位:人
个性化错题本 期末统考中的数学成绩 合计
及格 不及格 建立 20 4 24
未建立 4 8 12
合计 24 12 36
零假设为 :期末统考中的数学成绩与建立个性化错题本无关联.
根据列联表中的数据,经计算得到

根据小概率值 的独立性检验,我们推断 不成立,
即认为期末统考中的数学成绩与建立个性化错题本有关联,
此推断犯错误的概率不大于0.005.8.3 列联表与独立性检验
【课前预习】
知识点一
2.(1)频数表
诊断分析
(1)× (2)√
知识点二
2.是否独立 独立性检验
3. a+b+c+d
5.3.841 10.828 6.(1)相互独立 (2)χ2 临界值xα
诊断分析
(1)√ (2)× (3)× (4)√ (5)√
【课中探究】
例1 解:用Ω表示调查的124人所构成的集合,对于Ω中的每1位居民,定义一对分类变量X和Y:令X=
Y=用表格整理数据,得到2×2列联表如下:
单位:人
饮食习惯 年龄 合计
六十岁及六十岁以上(Y=0) 六十岁以下(Y=1)
以蔬菜为主(X=0) 43 21 64
以肉类为主(X=1) 27 33 60
合计 70 54 124
则P(Y=1|X=0)==≈0.328,P(Y=1|X=1)===0.55.显然二者具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关联.
变式 C [解析] 若X与Y相互独立,则有=,解得m≈14.
例2 解:病人组中尿棕色素为阳性和阴性的频率分别为≈0.805 6和≈0.194 4.对照组中尿棕色素为阳性和阴性的频率分别为≈0.243 2和≈0.756 8.作出等高堆积条形图如图所示.其中两个深色条的高分别代表病人组和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出病人组与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关联.
变式 解:作列联表如下:
单位:人
考前心情 性格类型 合计
性格内向 (Y=0) 性格外向 (Y=1)
心情紧张(X=0) 332 213 545
心情不紧张(X=1) 94 381 475
合计 426 594 1020
考前心情紧张中性格内向和性格外向的频率分别为≈0.609 2和≈0.390 8.考前心情不紧张中性格内向和性格外向的频率分别为≈0.197 9和≈0.802 1.作等高堆积条形图如图:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张的样本中性格内向占的比例高,可以认为考前心情与性格类型有关联.
例3 解:零假设为H0:员工工作态度与对待企业改革态度之间无关联.由2×2列联表中的数据,经计算得到χ2=≈10.759>7.879=x0.005,因此,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为员工工作态度与对待企业改革态度之间有关联,此推断犯错误的概率不大于0.005.
变式 解:(1)因为在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为,所以这100人中喜欢游泳的学生人数为100×=60.2×2列联表补充完整如下:
单位:人
性别 是否喜欢游泳 合计
喜欢 不喜欢
男 40 10 50
女 20 30 50
合计 60 40 100
(2)零假设为H0:该校学生是否喜欢游泳与性别之间无关联.根据2×2列联表中的数据,经计算得到χ2=≈16.667>10.828=x0.001,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为该校学生是否喜欢游泳与性别之间有关联,此推断犯错误的概率不大于0.001.
拓展 解:(1)补全2×2列联表如下:
单位:人
性别 休闲方式 合计
运动 非运动
男性 n n n
女性 n n n
合计 n n n
(2)若根据小概率值α=0.05的独立性检验,可认为性别与休闲方式有关联,则χ2≥3.841.
因为χ2==,所以≥3.841,
即n≥138.276.又因为n∈Z,所以n≥140,故如果根据小概率值α=0.05的独立性检验,可认为性别与休闲方式有关联,那么本次调查至少调查了140人.8.3 列联表与独立性检验
1.B [解析] “吸烟”不是分类变量,“是否吸烟”才是分类变量.
2.B [解析] 回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析分析两个变量之间可能具有的相关关系.而独立性检验是对两个变量之间是否具有某种关联的分析,并且可以分析这两个变量在多大程度上具有这种关联,但不能100%肯定这种关联.故①②④错误,③正确.故选B.
3.A [解析] 因为χ2=3.526,结合表格可知χ2=3.526>2.706=x0.1,所以认为“男生和女生对数学课程的喜爱程度有差异”犯错误的概率不超过0.1,即10%.故选A.
4.B [解析] 从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,所以药物A的预防效果更好.
5.A [解析] 由题意,可得χ2=≈7.822>6.635=x0.01,所以在犯错误的概率不超过0.01的前提下,认为“是否爱好某项运动与性别有关联”.故选A.
6.C [解析] 对于A,==;对于B,==;对于C,==;对于D,=
=.显然最大,故选C.
7.A [解析] 设被调查的男生人数为x,则被调查的女生人数为,则2×2列联表为
单位:人
性别 对某视频APP的态度 合计
喜欢 不喜欢
男生 x
女生
合计 x
根据小概率值α=0.05的独立性检验,认为是否喜欢某视频APP和性别有关联,则χ2≥3.841=x0.05,
因为χ2==,所以≥3.841,则x≥≈10.243,又,,均为整数,所以男生至少有12人.故选A.
8.BCD [解析] 对于A,若2×2列联表中的每个数字均变成原来的2倍,则χ2==2×,此时χ2的值变为原来的2倍,所以A错误;对于B,同一个样本中,|ad-bc|越小,说明两个变量有关联的可能性越小,|ad-bc|越大,说明两个变量有关联的可能性越大,所以B正确;对于C,独立性检验中,随机变量χ2的值越小,判定“两变量有关联”犯错误的概率越大,所以C正确;对于D,根据独立性检验的意义可知χ2=5.012>3.841=x0.05,所以认为“X与Y有关联”犯错误的概率不超过0.05,所以D正确.故选BCD.
9.AC [解析] 对于A,该学校男生对食堂服务满意的概率的估计值为=,故A正确;对于B,该学校女生对食堂服务满意的概率的估计值为=>,故B错误;对于C,D,因为χ2≈4.762>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下,认为男、女生对食堂服务的评价有差异,故C正确,D错误.故选AC.
10.52,60 [解析] ∵a+21=73,∴a=52,∴b=a+8=52+8=60.
11.0.05 [解析] 由题作出2×2列联表如下:
单位:人
家族史 糖尿病 合计
糖尿病发病 糖尿病不发病
阳性家族史 16 93 109
阴性家族史 17 240 257
合计 33 333 366
零假设为H0:糖尿病与家族史无关联.经计算得到χ2=≈6.067>3.841=x0.05,故根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为糖尿病与家族史有关联.
12.46 [解析] 由题意可得χ2=
≥6.635=x0.01,整理得(100m-4000)2≥502×42×6.635,因为m≥40,所以100m-4000≥0,所以100m-4000≥200×≈200×2.58=516,解得m≥45.16,又因为m∈N*,所以m≥46,所以m的最小值为46.
13.解:零假设为H0:IT企业招聘人数的增减与ChatGPT应用的广泛性无关联,
因为χ2==≈2.02<6.635=x0.01,所以根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,
因此可认为H0成立,即认为IT企业招聘人数的增减与ChatGPT应用的广泛性无关联.
14.解:(1)该市一天早高峰时段的天气为晴天的概率的估计值为=0.75,
该市一天早高峰时段的天气为雨天的概率的估计值为=0.06.
(2)2×2列联表如下:
单位:天
天气情况 交通状况 合计
交通顺畅 交通拥堵
天气好 62 13 75
天气不好 13 12 25
合计 75 25 100
零假设为H0:交通状况与天气情况无关联.
由表中数据,得χ2=≈9.404>7.879=x0.005.
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为交通状况与天气情况有关联.
15.BC [解析] 由题意可知抽取的年轻人有200×(14.5%+45.5%)=120(人),非年轻人有200×(34%+5.5%+0.5%)=80(人),抽取的优质客户有200×(1-40%)=120(人),则非优质客户有80人,其中优质客户中年轻人有60人,非年轻人有60人,画出2×2列联表如下:
单位:人
年龄 客户 合计
优质客户 非优质客户
年轻人 60 60 120
非年轻人 60 20 80
合计 120 80 200
对于A,优质客户中年轻人和非年轻人的占比相同,而年轻人中优质客户占,非年轻人中优质客户占,所以非年轻人购买力强,所以为了增加优质客户的比例,应向30岁及以上人群投放广告,故A错误;对于B,零假设为H0:是否为优质客户与年龄无关联,经计算得到χ2==12.5>10.828=x0.001,所以根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为是否为优质客户与年龄有关联,故B正确;对于C,因为年轻人有120人,其中优质客户有60人,所以已知一位顾客是年轻人,则他是优质客户的概率是,故C正确;对于D,因为非优质客户中非年轻人占,所以已知一位顾客一季度内仅购买1次,则他是非年轻人的概率是,故D错误.故选BC.
16.解:(1)因为P(A|)=,P(B|)=,
所以P(|)=1-P(A|)=,P(|)=1-P(B|)=,由P(B)=,得P()=1-P(B)=,
因为P(|)·P()=P(|)·P(),
所以P()=,所以P(A)=.P(A)=P(B)·P(A|B)+P()·P(A|),解得P(A|B)=.
(2)由(1)可知,期末统考中的数学成绩及格的学生人数为36×P()=36×=24,其中建立了个性化错题本的学生人数为24×P(B|)=24×=20,未建立个性化错题本的学生人数为24-20=4,
期末统考中的数学成绩不及格的学生人数为36-24=12,其中建立了个性化错题本的学生人数为12×P(B|A)=12×=12×=4,
未建立个性化错题本的学生人数为12-4=8,列联表如下:
单位:人
个性化 错题本 期末统考中的数学成绩 合计
及格 不及格
建立 20 4 24
未建立 4 8 12
合计 24 12 36
零假设为H0;期末统考中的数学成绩与建立个性化错题本无关联.根据列联表中的数据,经计算得到χ2==9>7.879=x0.005,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为期末统考中的数学成绩与建立个性化错题本有关联,此推断犯错误的概率不大于0.005.8.3 列联表与独立性检验
【学习目标】
  1.理解独立性检验的基本思想及其实施步骤.
  2.能利用等高堆积条形图、2×2列联表探讨两个分类变量的关联.
  3.了解χ2的含义及其应用.
  4.通过对数据的处理,提高解决实际问题的能力.
◆ 知识点一 分类变量与列联表
1.分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.列联表
(1)定义:列出的两个分类变量的    ,称为列联表.
(2)2×2列联表:一般地,定义一对分类变量X和Y如下:X=和Y=其样本频数列联表(称为2×2列联表)为:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
3.等高堆积条形图
(1)等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.
(2)如果直接观察等高堆积条形图发现P(Y=1|X=0)与P(Y=1|X=1)相差很大,就可以判断两个分类变量之间有关联.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)分类变量中的变量与函数中的变量是同一概念. (  )
(2)2×2列联表是借助两个分类变量之间频率大小的差异说明两个变量之间是否有关联. (  )
◆ 知识点二 独立性检验
1.零假设
要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立,通常称H0为零假设.
也可改述为H0:分类变量X和Y独立.
2.独立性检验:利用χ2的取值推断分类变量X和Y     的方法称为χ2独立性检验,读作“卡方独立性检验”,简称      .
3.公式:χ2=         ,其中n=      .
4.小概率值α的检验规则
(1)当χ2≥xα时,我们推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
(2)当χ25.临界值表
α 0.1 0.05 0.01 0.005 0.001
xα 2.706    6.635 7.879   
6.应用独立性检验解决实际问题包括的主要环节
(1)提出零假设H0:X和Y      ,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算    的值,并与      比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)在独立性检验中,若χ2越大,则两个分类变量有关联的可能性越大. (  )
(2)若χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关联,那么在100个吸烟的人中必有99人患有肺病. (  )
(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的. (  )
(4)零假设H0可以表述为:分类变量X和Y相互独立. (  )
(5)独立性检验的样本不同,其结论可能不同. (  )
◆ 探究点一 用2×2列联表分析两变量间的关系
例1 在对人们饮食习惯的一次调查中,从某一居民小区中共调查了124位居民,其中六十岁及六十岁以上的有70人,六十岁以下的有54人.六十岁及六十岁以上的人中有43人的饮食以蔬菜为主,另外27人以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用P(Y=1|X=0)与P(Y=1|X=1)判断二者是否有关联.
                 
变式 假设有两个分类变量X与Y,它们的可能取值分别为X=和Y=其2×2列联表如下:
X Y 合计
Y=0 Y=1
X=0 10 18 28
X=1 m 26 m+26
合计 10+m 44 m+54
若X与Y相互独立,则m的值约为 (  )
A.8 B.9 C.14 D.19
[素养小结]
(1)作2×2列联表,关键是对涉及的变量分清类别,同时计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将P(Y=1|X=0)与P(Y=1|X=1)的值相比,可直观地反映出两个分类变量间是否相互影响.
◆ 探究点二 用等高堆积条形图分析两变量间的关系
例2 为了解铅中毒病人与尿棕色素为阳性是否有关联,分别对病人组和对照组的尿液进行尿棕色素定性检查,结果如下:
单位:人
分组 尿棕色素定性 合计
阳性(Y=0) 阴性(Y=1)
病人组(X=0) 29 7 36
对照组(X=1) 9 28 37
合计 38 35 73
试作出等高堆积条形图,分析铅中毒病人与尿棕色素为阳性是否有关联.
变式 某学校对高三学生做了一项调查,发现在平时的模拟考试中,性格内向的426名学生中有332人在考前心情紧张,性格外向的594名学生中有213人在考前心情紧张,作出等高堆积条形图,利用图形判断考前心情与性格类型是否有关联.
[素养小结]
利用等高堆积条形图判断两个分类变量是否有关联的步骤
(1)收集数据,统计结果;
(2)列出2×2列联表,计算频率粗略估计;
(3)画等高堆积条形图,直观分析.
◆ 探究点三 独立性检验的综合应用
例3 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下2×2列联表:
单位:人
工作态度 对待企业改革态度 合计
积极支持 不太支持
积极 54 40 94
一般 32 63 95
合计 86 103 189
能否根据小概率值α=0.005的独立性检验,认为员工工作态度与对待企业改革态度之间有关联
变式 游泳作为一项重要的求生技能和运动项目受到很多人的喜爱,某中学对100名学生进行了问卷调查,得到如下2×2列联表:
单位:人
性别 是否喜欢游泳 合计
喜欢 不喜欢
男 10
女 20
合计
已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为.
(1)请将上述2×2列联表补充完整.
(2)根据小概率值α=0.001的独立性检验,能否认为该校学生是否喜欢游泳与性别之间有关联
[素养小结]
利用χ2进行独立性检验的步骤:
(1)提出零假设H0;
(2)列出2×2列联表;
(3)计算出χ2的值;
(4)与临界值xα比较,得出事件有关的可能性大小,进行判断.
拓展 随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动.
(1)完成下列2×2列联表:
单位:人
性别 休闲方式 合计
运动 非运动
男性
女性
合计
(2)如果根据小概率值α=0.05的独立性检验,可认为性别与休闲方式有关联,那么本次调查至少调查了多少人 8.3 列联表与独立性检验
一、选择题
1.下列变量中不属于分类变量的是 (  )                 
A.性别 B.吸烟
C.年龄 D.国籍
2.下列关于回归分析与独立性检验的说法正确的是 (  )
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关联的一种检验;
④独立性检验可以100%确定两个变量之间是否具有某种关联.
A.①② B.③
C.③④ D.①②③④
3.[2024·濮阳高二期中] 为研究男生和女生对数学课程的喜爱程度是否有差异,运用2×2列联表进行检验,经计算得χ2=3.526,参考下表,则认为“男生和女生对数学课程的喜爱程度有差异”犯错误的概率不超过 (  )
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.10% B.5% C.1% D.0.1%
4.为考察A,B两种药物预防某种疾病的效果,进行动物试验,得到如图所示的等高堆积条形图:
根据图中信息,下列说法中正确的是 (  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A对该疾病没有显著的预防效果
D.药物A,B对该疾病均没有预防效果
5.通过随机询问110名大学生是否爱好某项运动,得到如下的2×2列联表.
单位:人
性别 是否爱好某项运动 合计
不爱好 爱好
男 20 40 60
女 30 20 50
合计 50 60 110
则下列结论正确的是 (  )
A.在犯错误的概率不超过0.01的前提下,认为“是否爱好某项运动与性别有关联”
B.在犯错误的概率不超过0.01的前提下,认为“是否爱好某项运动与性别无关联”
C.在犯错误的概率不超过0.001的前提下,认为“是否爱好某项运动与性别有关联”
D.在犯错误的概率不超过0.001的前提下,认为“是否爱好某项运动与性别无关联”
6.[2024·江西九江同文中学高二期末] 假设有两个变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X Y 合计
Y=y1 Y=y2
X=x1 a b a+b
X=x2 c d c+d
合计 a+c b+d n=a+b+c+d
根据以下选项中的数据计算χ2的值,其中χ2最大的一组为 (  )
A.a=60,b=50,c=40,d=30
B.a=60,b=40,c=50,d=30
C.a=40,b=30,c=50,d=60
D.a=30,b=40,c=50,d=60
7.[2024·武汉武钢三中高二月考] 某校团委对“学生性别和是否喜欢某视频APP是否有关联”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢该视频APP的人数占男生人数的,女生喜欢该视频APP的人数占女生人数的,若依据小概率值α=0.05的独立性检验,认为是否喜欢该视频APP和性别有关联,则男生至少有 (  )
附:
α 0.05 0.01
xα 3.841 6.635
χ2=,n=a+b+c+d.
A.12人 B.6人 C.10人 D.18人
8.(多选题)[2024·河南南阳高二期中] 如表,在两个变量X与Y的2×2列联表中,已知χ2=,其中n=a+b+c+d,则下列结论正确的是 (  )
X Y 合计
Y=y1 Y=y2
X=x1 a b a+b
X=x2 c d c+d
合计 a+c a+d a+b+c+d
A.若每个数据a,b,c,d均变为原来的2倍,则χ2的值不变
B.|ad-bc|越大,两个变量有关联的可能性越大
C.对于独立性检验,随机变量χ2的值越小,判定“两变量有关联”犯错误的概率越大
D.若计算得到χ2=5.012,则认为“X与Y有关联”犯错误的概率不超过0.05
9.(多选题)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下2×2列联表.经计算χ2≈4.762,则下列说法正确的是 (  )
单位:人
性别 对食堂服务的评价 合计
不满意 满意
男 20 30 50
女 10 40 50
合计 30 70 100
A.该学校男生对食堂服务满意的概率的估计值为
B.调查结果显示,该学校男生比女生对食堂服务更满意
C.在犯错误的概率不超过0.05的前提下,认为男、女生对食堂服务的评价有差异
D.在犯错误的概率不超过0.01的前提下,认为男、女生对食堂服务的评价有差异
二、填空题
10.为了解某挑战赛中受邀者的性别与是否接受挑战的关联性,得到如下2×2列联表:
单位:人
性别 挑战 合计
不接受挑战 接受挑战
男 a 21 73
女 8 25 33
合计 b 46 106
则表中a,b的值分别为    .
11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故根据小概率值α=    的独立性检验,认为糖尿病与家族史有关联.(填“0.05”“0.01”或“0.005”)
12.[2024·丹东高二期中] 为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
单位:只
药物 是否患病 合计
未患病 患病
服用 m 50-m 50
未服用 80-m m-30 50
合计 80 20 100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则m的最小值为    .(其中m≥40且m∈N*,参考数据:≈2.58,≈3.29)
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
三、解答题
13.ChatGPT是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如此,也有部分人认为ChatGPT会对人类未来工作产生威胁,将在未来取代一部分人的职业.现对200家IT企业开展调查,统计每家企业一年内应用ChatGPT的广泛性及招聘人数的增减,得到数据结果统计如表所示:
单位:人
ChatGPT应用 广泛性 招聘人数 合计
减少 增加
广泛应用 60 50 110
没有广泛应用 40 50 90
合计 100 100 200
根据小概率值α=0.01的独立性检验,能否认为IT企业招聘人数的增减与ChatGPT应用的广泛性有关联
14.某校学生社团组织社会调查活动,随机调查了市区某个路口100个工作日中每天早高峰时段(7点至9点)的天气情况和当天早高峰时段经过该路口的机动车车次,整理数据得到下表:
天气 机动车车次
[0,800) [800,1600) [1600,2400]
晴天 10 52 13
阴天 2 9 8
雨天 0 2 4
(1)分别估计该市一天早高峰时段的天气为晴天和雨天的概率.
(2)晴天记为“天气好”,阴天或雨天记为“天气不好”.若当天早高峰时段经过该路口的机动车车次小于1600,则视为交通顺畅,否则视为交通拥堵.根据所给数据,试列出2×2列联表,根据小概率值α=0.005的独立性检验,能否认为交通状况与天气情况有关联
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.005
xα 3.841 6.635 7.879
15.(多选题)某网店商家想通过软件广告推荐功能吸引潜在客户.为使广告能够精准投放达到利益最大化,随机抽取了200名在本店一季度消费过的客户数据,所得统计图如图.
按照年龄分为年轻人(30岁以下)和非年轻人(30岁及以上),若一季度内购买3次及以上就记为优质客户,其中非年轻人占,则下列说法正确的是 (  )
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.为了增加优质客户的比例,应向30岁以下人群投放广告
B.根据小概率值α=0.001的独立性检验,认为是否为优质客户与年龄有关联
C.已知一位顾客是年轻人,则他是优质客户的概率是
D.已知一位顾客一季度内仅购买1次,则他是非年轻人的概率是
16.[2024·龙岩上杭一中高二月考] 某兴趣小组调查并统计了某班级学生期末统考中的数学成绩和建立个性化错题本的情况,用来研究这两者是否有关联.若从该班级中随机抽取1名学生,设A=“抽取的学生期末统考中的数学成绩不及格”,B=“抽取的学生建立了个性化错题本”,且P(A|)=,P(B|)=,P(B)=.
(1)求P(A)和P(A|B).
(2)若该班级共有36名学生,请完成列联表,并依据小概率值α=0.005的独立性检验,分析学生期末统考中的数学成绩与建立个性化错题本是否有关联
单位:人
个性化 错题本 期末统考中的数学成绩 合计
及格 不及格
建立
未建立
合计
参考公式及数据:χ2=,n=a+b+c+d.
α 0.01 0.005 0.001
xα 6.635 7.879 10.828