9.2 独立性检验(课件 学案 练习)高中数学苏教版(2019)选择性必修第二册

文档属性

名称 9.2 独立性检验(课件 学案 练习)高中数学苏教版(2019)选择性必修第二册
格式 zip
文件大小 10.8MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-09-19 15:22:12

文档简介

(共78张PPT)
9.2 独立性检验
探究点一 列联表
探究点二 对独立性检验的理解
探究点三 独立性检验的综合应用




课前预习
课中探究
备课素材
练习册
答案核查【导】
答案核查【练】
【学习目标】
1.通过实例,理解 列联表的统计意义.
2.通过实例,了解独立性检验及其应用.
知识点一 分类变量与列联表
1.分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,
这类随机变量称为分类变量.
2.列联表
(1)定义:一个描述两个分类变量分布的________,称为列联表.
频数表
2.列联表
(2)一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类和类 ;
Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:
Ⅱ 合计
类1 类2
Ⅰ 类

合计 ______
上述表格称为____________.
列联表
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)分类变量中的变量与函数中的变量是同一概念.( )
×
(2) 列联表是借助两个分类变量之间频率大小的差异说明两
个变量之间是否有关系.( )

知识点二 独立性检验
(1)定义:用 统计量研究两个分类变量Ⅰ和Ⅱ是否有关系的方法称
为独立性检验.
(2)统计量:_ _________________,其中 _____________.
(3)独立性检验的步骤
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
①提出假设 与Ⅱ没有关系;
②根据列联表及的公式,计算 的值;
③根据临界值,作出判断.
其中临界值如表所示:
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如:
①若,则有 的把握认为“Ⅰ与Ⅱ有关系”;
②若,则有 的把握认为“Ⅰ与Ⅱ有关系”;
③若,则有 的把握认为“Ⅰ与Ⅱ有关系”;
④若 ,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不
能得出结论“ 成立”,即Ⅰ与Ⅱ没有关系.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)应用独立性检验的基本思想对两个变量间的关系作出的推断一
定是正确的.( )
×
(2)假设 可以表述为:分类变量Ⅰ和Ⅱ相互独立.( )

(3)独立性检验的样本不同,其结论可能不同.( )

探究点一 列联表
例1(1)[2025·江苏泰州高二期中]下面是一个 列联表,则表
中, 的值分别为( )
合计
25 73
21
合计 49
A.98,28 B.28,98 C.48,45 D.45,48

[解析] 由列联表知,, ,
解得,, .故选C.
(2)[2025·江苏锡山高中高二月考]在一项有关医疗保健的社会
调查中,发现调查的男性有530人,女性有670人,其中男性中喜欢
吃甜食的有117人,女性中喜欢吃甜食的有492人,请作出性别与是
否喜欢吃甜食的 列联表.
解: 列联表如下:
喜欢吃甜食 不喜欢吃甜食 合计
男 117 413 530
女 492 178 670
合计 609 591 1200
变式 [2024·江苏宿迁高二期末]某高校有10 000名学生,其中女
生3000名,男生7000名.为调查学生是否喜爱体育运动与性别是否有
关系,用分层抽样的方法抽取120名学生,制成独立性检验的
列联表,如下表,则 ____.(用数字作答)
男生 女生 合计
喜爱体育运动 9
不喜爱体育运动 28
合计 120
29
[解析] 根据分层抽样原理,可得抽取的男生有
(名),女生有(名),所以 ,
,所以 .
[素养小结]
制作列联表的基本步骤:
第一步,合理选取两个分类变量,且每一个分类变量都可以取两个值;
第二步,抽取样本,整理数据;
第三步,作出列联表.
探究点二 对独立性检验的理解
例2(1)[2025·江苏镇江期中]某医疗研究机构为了解打鼾与患心
脏病的关系,运用列联表进行独立性检验,经计算 ,
则所得到的统计学结论是认为打鼾与患心脏病有关系的把握约为
( )
A. B. C. D.
[解析] 因为,所以有 的把握认为打鼾与患心
脏病有关系.故选B.

(2)(多选题)[2025·江苏启东东南中学高二月考]给出下列实
际问题,其中用独立性检验可以解决的问题有( )
A.两种药物治疗同一种疾病的疗法是否有区别
B.吸烟者得肺病的概率
C.是否吸烟与性别是否有关系
D.网吧与青少年的犯罪是否有关系
[解析] 独立性检验是判断两个分类变量是否有关系的方法,而B中
问题是概率问题,不可以用独立性检验解决,A,C,D中问题可以
用独立性检验解决,故选 .



变式(1)[2025·山东滨州高二期末]针对时下的“短视频热”,某高
校团委对学生性别和是否喜欢看短视频是否有关系进行了一次调查,
其中被调查的男生、女生人数均为 ,男生中喜欢看短视
频的人数占男生人数的 ,女生中喜欢看短视频的人数占女生人数的
.提出假设是否喜欢看短视频和性别相互独立.若有 的把握
认为是否喜欢看短视频和性别不独立,则 的最小值为( )
A.7 B.8 C.9 D.10

[解析] 根据题意,可得 列联表如下:
男生 女生 合计
喜欢看短视频
不喜欢看短视频
合计
根据列联表中数据可得,因为有 的把
握认为是否喜欢看短视频和性别不独立,所以 ,解得
,又,所以 .故选C.
(2)(多选题)[2025·江苏扬州高二期末]下列关于独立性检验
的说法中正确的有( )
A.样本不同,独立性检验的结论可能有差异
B.分类变量Ⅰ与Ⅱ的统计量 越小,判断“Ⅰ与Ⅱ有关系”的可信程度越小
C.由独立性检验可知有 的把握认为“秃顶与患心脏病有关”,所
以我们说某人秃顶,那么他有 的可能患有心脏病
D.有 的把握认为“吸烟与患肺癌有关”,是指在犯错误的概率不
超过 的前提下认为“吸烟与患肺癌有关”



[解析] 有 的把握认为“秃顶与患心脏病有关”,不表示某人秃顶
就有 的可能患有心脏病,所以C中说法不正确;
根据独立性检验的概率可知,A,B,D中说法正确.
故选 .
[素养小结]
(1)独立性检验是研究两个分类变量是否有关的统计方法,在独立
性检验的概念中要准确分析出两个分类变量;在学习中还要注意其
与相关关系概念的区别,相关性分析是研究两个变量之间的相关关
系的统计方法.
(2)的实质就是两个变量有关系的概率为.
探究点三 独立性检验的综合应用
例3 某消费者协会为了解2024年当地居民
网购消费情况,随机抽取了100人,对其
2024年全年网购消费金额(单位:千元)
进行了统计,所统计的金额数据均在区间
内,并按, , 分成6组,制成如图所示的
频率分布直方图.
(1)求图中 的值,并估计居民网购消费金额的中位数;
解:根据频率分布直方图中所有小矩形的
面积为1,
可得
,
解得 .
数据在, ,内的频率分别为,,, ,
,,可得网购消费金额数据的中位数位于内,设中位数为 ,
则, 解得 ,
故估计居民网购消费金额的中位数为17 500元.
(2)若将全年网购消费金额在20千元及以上者称为网购迷,结合图
表数据,补全下面的列联表,并判断是否有 的把握认为是
否是网购迷与性别有关.
男 女 合计
网购迷 20
非网购迷 47
附:,其中 .
合计
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:根据频率分布直方图得样本中网购迷的人数为
,补全 列联表如下:
男 女 合计
网购迷 15 20 35
非网购迷 47 18 65
合计 62 38 100
提出假设 是否是网购迷与性别无关.
根据表中数据可得 ,
因为当成立时,的概率约为,所以有 的把握
认为是否是网购迷与性别有关.
变式 [2025·江苏南通高二期中]某医院采用甲、乙两种方案治疗
胃痛.采用有放回简单随机抽样的方法对治疗情况进行检查,得到下
面两种疗法治疗数据的列联表:
未治愈 治愈 合计
方案甲 15 50 65
方案乙 5 60 65
合计 20 110 130
(1)分析两种治疗方案的疗效是否有差异;
解:提出假设 两种治疗方案的疗效没有差异,
根据列联表中的数据,经计算得到

因为当成立时, ,计算得到的
,所以有 的把握认为,两种治疗方案的疗
效有差异.
(2)从未治愈的20名患者中随机抽取2人进行电话回访,求2人采用
不同治疗方法的概率.
附: .
0.05 0.010 0.005 0.001
3.841 6.635 7.879 10.828
解:从未治愈的20名患者中随机抽取2人,共有 (种)不
同取法,
2人采用不同治疗方案的取法共有 (种),
故所求概率 .
1. 列联表
(1) 列联表主要用于研究两个分类变量之间是相互独立
的还是存在某种关联性,它适用于分析两个分类变量之间的关系.
(2) 列联表有助于直观地观测数据之间的关系.
(3)可以通过列联表中与 值的大小粗略地判断两个
分类变量之间有无关系.一般其值相差越大,两个分类变量有关系的
可能性越大.
2.独立性检验
的统计意义:当与独立时,也称为与无关,当
成立时,一般不直接说与 无关,也就是说独立性检验通常得到的
结果是有的把握认为与 有关,或者没有
的把握认为与 有关.
3.独立性检验与反证法的异同点
(1)两者都是先假设结论不成立,然后根据是否能够推出“矛
盾”来断定结论是否成立.
(2)但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不
符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑
的小概率事件的发生,即在结论不成立的假设下,推出有利于结论
成立的小概率事件发生.
例 为调研某中学足球训练开展情况,随机抽
取该校男、女学生各100名,统计每人日均参
加足球训练的时间(单位:分钟),结果都
在 内,其中日均参加足球训练的时间
在60分钟及以上的有106人.将100名男生参加足球训练的时间分成6
组:,,, ,得到的
频率分布直方图如图所示.
(1)求频率分布直方图中 的值,并估计男
生参加足球训练时间的样本数据的 分位
数;
解:根据男生参加足球训练时间的频率分布
直方图可得

解得 .
设样本数据的分位数的估计值为 ,则

解得 .
(2)将参加足球训练时间在60分钟及以上者视为爱好足球,是否有
的把握认为“是否爱好足球与性别有关系”
附:,其中 .

0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:由频率分布直方图可知,样本中爱好足球的男生人数为

所以爱好足球的女生人数为 ,
可得 列联表如下:
爱好足球 不爱好足球 合计
男生 60 40 100
女生 46 54 100
合计 106 94 200
提出假设 是否爱好足球与性别无关.根据列联表中数据,计算得
到 ,
因为当成立时, ,计算得到的
,所以有 的把握认为“是否爱好足球与性别
有关系”.
练习册
1.[2024·江苏苏州高二期末]为调查乘客的晕车情况,在某一次行
程中,50名男乘客中有25名晕车,30名女乘客中有5名晕车.在检验这
些乘客是否晕车与性别是否有关时,常采用的数据分析方法是
( )
A.回归分析 B.独立性检验
C.频率分布直方图 D.用样本估计总体

[解析] 根据题意,结合题目中的数据,可列 列联表,求出统计
量 的观测值,对照临界值得出概率结论,这种数据分析的方法是
独立性检验.故选B.
2.设研究某两个分类变量是否有关时,提出假设 两个变量相互独
立,根据统计数据得到列联表,计算得 ,则下列说
法正确的是 ( )
A.有的把握认为 不成立
B.有的把握认为 的反面正确
C.有的把握判断 正确
D.有的把握能反驳
[解析] 由独立性检验的基本思想可知,有的把握能反驳 .故选D.

3.[2025·江苏南京高二期末]为了考查某种营养液对有机蔬菜的增
产效果,某研究所进行试验获得数据,经过计算后得到 ,
那么可以认为该营养液对有机蔬菜有增产效果的把握为( )
A.以上 B.以上 C.以上 D. 以下
[解析] 因为,,所以至少有 的
把握认为该营养液对有机蔬菜有增产效果.故选C.

4.[2025·山东烟台高二期中]下列关于独立性检验的说法正确的是
( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以 确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关系中,当有 的把握
认为吸烟与患肺病有关系时,我们可以说在100个吸烟的人中,有99
人患肺病
D.对于独立性检验,随机变量 的值越小,判定“两变量有关系”犯
错误的概率越大

[解析] 对于A,独立性检验是通过卡方计算来判断两个变量存在关
系的可能性的一种方法,并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能 确定两个变量相关,故错误;
对于C, 是指“抽烟”和“患肺病”存在关系的可能性,并非抽烟人中
患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确.
故选D.
5.[2025·福建漳州高二期中]为加强素质教育,使学生各方面全面发
展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:
体育课不及格 体育课及格 合计
文化课及格 57 221 278
文化课不及格 16 43 59
合计 73 264 337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可
得到 ( )
A.38.214 B.1.255 C. D.2.058

[解析] 由题可得 ,故选B.
6.(多选题)[2025·上海黄浦区期中]某村庄对该村内50名村民去
年参加体检的情况进行了调查,统计数据如下表所示:
参加体检 未参加体检 合计
老年人 7
年轻人 6
合计 50
已知抽取的村民中老年人、年轻人各25名,则下列结论正确的是
( )
A. B. C. D.



[解析] 因为抽取的村民中,老年人有25名,年轻人有25名,所以
,,所以, ,
,, ,
.故选 .
7.[2024·江苏南通如皋中学高二期中]下面是一个 列联表:
合计
21 70
5 30
合计 100
则___, _______(保留小数点后3位).
24.047
[解析] 补全 列联表:
合计
49 21 70
5 25 30
合计 54 46 100
所以, .
8.[2025·上海静安区期末]在独立性检验中,为了调查变量 与变
量的关系,提出假设变量和变量无关.通过统计得到 列
联表,计算得到,已知 ,则可以得
出的结论是______(填序号).
①有的把握认为变量与变量 没有关系;
②有的把握认为变量与变量 有关系;
③有的把握认为变量与变量 有关系;
④有的把握认为变量与变量 没有关系.
③④
[解析] 在独立性检验中,由,可以得出的结论是:有
的把握认为变量与变量没有关系,即有的把握认为变量 与
变量 有关系,所以③④正确.故填③④.
9.(13分)[2025·江苏南京期中]为了有针对性地提高学生体育锻
炼的积极性,某中学需要了解性别是否对学生体育锻炼的经常性有
影响,为此随机抽查了男、女生各100名,得到如下数据:
不经常锻炼 经常锻炼 合计
女生 40 60 100
男生 20 80 100
合计 60 140 200
(1)依据表中数据,能否认为性别与学生体育锻炼的经常性有关系?
解:提出假设 性别与学生体育锻炼的经常性没有关系,
根据表中数据可得 ,
因为当成立时,的概率约为,所以有 的把握
认为性别与学生体育锻炼的经常性有关系.
9.(13分)[2025·江苏南京期中]为了有针对性地提高学生体育锻
炼的积极性,某中学需要了解性别是否对学生体育锻炼的经常性有
影响,为此随机抽查了男、女生各100名,得到如下数据:
不经常锻炼 经常锻炼 合计
女生 40 60 100
男生 20 80 100
合计 60 140 200
(2)从这200人中随机选择1人,已知选到的学生经常参加体育锻炼,
求他是男生的概率.
解:从这200人中随机选择1人,设选到经常锻炼的学生为事件 ,选
到的学生为男生为事件,则, ,所以在已
知选到的学生经常参加体育锻炼的情况下,他是男生的概率为
.
10.(13分)[2025·江苏镇江高二期中]为了检测
某种抗病毒疫苗的免疫效果,需要进行动物与人体
试验.研究人员将疫苗注射到200只小白鼠体内,一
段时间后测量小白鼠的某项指标值,按
,, 分组,
绘制频率分布直方图如图所示,试验发现小白鼠体内产生抗体的共
有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫
苗后是否产生抗体相互独立.填写下面的 列联表,根据表中数据,
能否断定注射疫苗后小白鼠产生抗体与指标值不小于60有关?
指标值小于60 指标值不小于60 合计
有抗体
没有抗体
合计
解:由频率分布直方图知,指标值在 内的有
(只),
在内的有 (只),
在内的有 (只),
在内的有 (只),
在内的有 (只).
由题意,有抗体且指标值小于60的有 (只),
而指标值小于60的小白鼠共有 (只),所以指标
值小于60且没有抗体的小白鼠有 (只).
同理,指标值不小于60且没有抗体的小白鼠有20只,故列联表如下:
提出假设 注射疫苗后小白鼠产生抗体与指标值不小于60无关.
根据表中数据可得,当 成立时,
的概率约为 ,所以有 的把握认为注射疫苗后小白鼠
产生抗体与指标值不小于60有关.
指标值小于60 指标值不小于60 合计
有抗体
没有抗体
合计
50
110
160
20
20
40
70
130
200
11.[2025·广东肇庆高二期末]已知某独立性检验中,由
计算出 ,若将
列联表中的数据,,,分别变成,,, 后,计算出的
,则( )
A. B. C. D.

[解析] 因为 ,所以
.故选B.
12.[2024·江苏徐州侯集中学高二月考]随着国家对中小学“双减”政
策的逐步落实,增加中学生体育锻炼时间的政策引发社会的广泛关
注.某教育时报为研究“是否支持增加中学生体育锻炼时间与性别是否
有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如
表数据
支持 不支持
男生
女生
提出假设 是否支持增加中学生体育锻炼时间与性别无关.通过计
算可得有 以上的把握认为“是否支持增加中学生体育锻炼时间与
性别有关”,则在被调查的80名女生中支持增加中学生体育锻炼时间
的人数的最小值为( )
A.15 B.65 C.16 D.66

[解析] 因为有 以上的把握认为“是否支持增加中学生体育锻炼时
间与性别有关”, ,所以

化简得,
因为函数在 上单调递
增,当时,, ,
所以 的最小值为16,即在被调查的80名女生中支持增加中学生体育
锻炼时间的人数的最小值为 .故选D.
13.为了更好地开展多媒体化教学,某小学对“是否喜欢用平板教学与
文理学科教师是否有关”做了一次研究调查,其中被调查的文科、理
科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人
数的 ,文科教师喜欢用平板教学的人数占文科教师总人数的
,提出假设 是否喜欢用平板教学与文理科教师无关.若有
以上的把握认为是否喜欢用平板教学与文理学科教师有关,则
被调查的理科教师人数最少是( )
A.8 B.12 C.15 D.20

[解析] 由题意被调查的文理科教师人数相同,设理科教师的人数为
,,由题意可列出 列联表如下:
理科教师 文科教师 合计
喜欢用平板教学
不喜欢用平板教学
合计
根据表中数据可得 .
因为有 以上的把握认为是否喜欢用平板教学与文理学科教师有
关,,所以,解得 ,
因为,所以,即 ,所以被调查的理科教师人数最
少是15.故选C.
14.[2024·福建福州高二期末]为了研究某种药物预防某种疾病的效
果,进行动物试验,得到如下列联表
未患病 患病 合计
服药 50
未服药 50
合计 80 20 100
提出假设 该种药物对某种疾病没有预防效果.若在本次研究中得出
“有 以上的把握认为该种药物对某种疾病有预防效果”的结论,
则的最小值为____.(参考数据:, )
46
附:, .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
[解析] 由题意可得 ,整理得
,所以

,解得
或,
又因为且 ,所以,且,
所以 的最小值为46.
15.(15分)[2022·新高考全国Ⅰ卷]一医疗团队为研究某地的一种
地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好
两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例
组),同时在未患该疾病的人群中随机调查了100人(称为对照组),
得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
解:由题知的观测值 ,所以
有 的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(1)能否有 的把握认为患该疾病群体与未患该疾病群体的卫生
习惯有差异?
(2)从该地的人群中任选一人, 表示事件“选到的人卫生习惯不够
良好”,表示事件“选到的人患有该疾病”,与 的比值是卫
生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为 .
(ⅰ)证明: ;
证明:由题知 .
(2)从该地的人群中任选一人, 表示事件“选到的人卫生习惯不够
良好”,表示事件“选到的人患有该疾病”,与 的比值是卫
生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为 .
(ⅱ)利用该调查数据,给出,的估计值,并利用
的结果给出 的估计值.
附: ,
解: 由调查数据可知, ,则
,,所以 .
快速核答案(导学案)
课前预习 知识点一 2.(1)频数表 (2) 列联表
【诊断分析】 (1)× (2)√
知识点二
【诊断分析】(1)× (2)√ (3)√
课中探究 例1 (1)C (2)略 变式 29
例2 (1)B (2)ACD 变式 (1)C (2)ABD
例3 (1),估计居民网购消费金额的中位数为17 500元.
(2)列联表略,有的把握认为是否是网购迷与性别有关.
变式 (1)有的把握认为,两种治疗方案的疗效有差异.(2)
快速核答案(练习册)
1.B 2.D 3.C 4.D 5.B 6.ABC 7. 24.047 8.③④
9.(1)有的把握认为性别与学生体育锻炼的经常性有关系(2)
50 110 160 20 20 40 70 130 200
的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
11.B 12.D 13.C 14.46
15.(1)有的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异
(2)(ⅰ)略(ⅱ),9.2 独立性检验
【课前预习】
知识点一
2.(1)频数表 (2)b+d 2×2列联表
诊断分析
(1)× (2)√
知识点二
(2) a+b+c+d
诊断分析
(1)× (2)√ (3)√
【课中探究】
探究点一
例1 (1)C [解析] 由2×2列联表知a+25=73,b+25=49,b+21=c,解得a=48,b=24,c=45.故选C.
(2)解:2×2列联表如下:
喜欢吃甜食 不喜欢吃甜食 合计
男 117 413 530
女 492 178 670
合计 609 591 1200
变式 29 [解析] 根据分层抽样原理,可得抽取的男生有120×=84(名),女生有120×=36(名),所以a=84-28=56,b=36-9=27,所以a-b=56-27=29.
探究点二
例2 (1)B (2)ACD [解析] (1)因为χ2≈6.803>6.635,所以有99%的把握认为打鼾与患心脏病有关系.故选B.
(2)独立性检验是判断两个分类变量是否有关系的方法,而B中问题是概率问题,不可以用独立性检验解决,A,C,D中问题可以用独立性检验解决,故选ACD.
变式 (1)C (2)ABD [解析] (1)根据题意,可得2×2列联表如下:
男生 女生 合计
喜欢看短视频 4m 3m 7m
不喜欢看短视频 m 2m 3m
合计 5m 5m 10m
根据列联表中数据可得χ2==,因为有95%的把握认为是否喜欢看短视频和性别不独立,所以≥3.841,解得m≥8.066 1,又m∈N*,所以m≥8.故选C.
(2)有95%的把握认为“秃顶与患心脏病有关”,不表示某人秃顶就有95%的可能患有心脏病,所以C中说法不正确;根据独立性检验的概率可知,A,B,D中说法正确.故选ABD.
探究点三
例3 解:(1)根据频率分布直方图中所有小矩形的面积为1,
可得5×(0.01+0.02+0.03+2a+0.06)=1,解得a=0.04.
数据在[0,5),[5,10),…,[25,30]内的频率分别为0.05,0.1,0.2,0.3,0.2,0.15,可得网购消费金额数据的中位数位于[15,20)内,设中位数为x,
则0.05+0.1+0.2+(x-15)×0.06=0.5,解得x=17.5,
故估计居民网购消费金额的中位数为17 500元.
(2)根据频率分布直方图得样本中网购迷的人数为100×(0.2+0.15)=35,补全2×2列联表如下:
男 女 合计
网购迷 15 20 35
非网购迷 47 18 65
合计 62 38 100
提出假设H0:是否是网购迷与性别无关.
根据表中数据可得χ2=≈8.375,
因为当H0成立时,χ2≥6.635的概率约为0.01,所以有99%的把握认为是否是网购迷与性别有关.
变式 解:(1)提出假设H0:两种治疗方案的疗效没有差异,
根据列联表中的数据,经计算得到χ2==≈5.909 1,
因为当H0成立时,P(χ2≥3.841)≈0.05,计算得到的χ2≈5.909 1>3.841,所以有95%的把握认为,两种治疗方案的疗效有差异.
(2)从未治愈的20名患者中随机抽取2人,共有=190(种)不同取法,
2人采用不同治疗方案的取法共有=75(种),
故所求概率P==.9.2 独立性检验
1.B [解析] 根据题意,结合题目中的数据,可列2×2列联表,求出统计量χ2的观测值,对照临界值得出概率结论,这种数据分析的方法是独立性检验.故选B.
2.D [解析] 由独立性检验的基本思想可知,有95%的把握能反驳H0.故选D.
3.C [解析] 因为χ2≈6.795,P(χ2≥6.635)≈0.01,所以至少有99%的把握认为该营养液对有机蔬菜有增产效果.故选C.
4.D [解析] 对于A,独立性检验是通过卡方计算来判断两个变量存在关系的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能100%确定两个变量相关,故错误;对于C,99%是指“抽烟”和“患肺病”存在关系的可能性,并非抽烟人中患肺病的发病率,故错误;对于D,根据卡方计算的定义可知该选项正确.故选D.
5.B [解析] 由题可得χ2=≈1.255,故选B.
6.ABC [解析] 因为抽取的村民中,老年人有25名,年轻人有25名,所以c=25,d=25,所以a=25-7=18,b=25-6=19,e=a+6=18+6=24,f=7+b=7+19=26,c+d=50,e-f=24-26=-2.故选ABC.
7.8 24.047 [解析] 补全2×2列联表:
y1 y2 合计
x1 49 21 70
x2 5 25 30
合计 54 46 100
所以b-d=54-46=8,χ2=≈24.047.
8.③④ [解析] 在独立性检验中,由χ2≥6.635,可以得出的结论是:有1%的把握认为变量X与变量Y没有关系,即有99%的把握认为变量X与变量Y有关系,所以③④正确.故填③④.
9.解:(1)提出假设H0:性别与学生体育锻炼的经常性没有关系,
根据表中数据可得χ2=≈9.524,
因为当H0成立时,χ2≥6.635的概率约为0.01,所以有99%的把握认为性别与学生体育锻炼的经常性有关系.
(2)从这200人中随机选择1人,设选到经常锻炼的学生为事件A,选到的学生为男生为事件B,则n(AB)=80,n(A)=140,所以在已知选到的学生经常参加体育锻炼的情况下,他是男生的概率为P(B|A)===.
10.解:由频率分布直方图知,指标值在[0,20)内的有0.002 5×20×200=10(只),
在[20,40)内的有0.006 25×20×200=25(只),
在[40,60)内的有0.008 75×20×200=35(只),
在[60,80)内的有0.025×20×200=100(只),
在[80,100]内的有0.007 5×20×200=30(只).
由题意,有抗体且指标值小于60的有160-110=50(只),
而指标值小于60的小白鼠共有10+25+35=70(只),所以指标值小于60且没有抗体的小白鼠有70-50=20(只).
同理,指标值不小于60且没有抗体的小白鼠有20只,
故列联表如下:
指标值小于60 指标值不小于60 合计
有抗体 50 110 160
没有抗体 20 20 40
合计 70 130 200
提出假设H0:注射疫苗后小白鼠产生抗体与指标值不小于60无关.
根据表中数据可得χ2=≈4.945,当H0成立时,χ2≥3.841的概率约为0.05,
所以有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
11.B [解析] 因为=,所以===2.故选B.
12.D [解析] 因为有95%以上的把握认为“是否支持增加中学生体育锻炼时间与性别有关”,P(χ2≥3.841)≈0.05,所以χ2=≥3.841,化简得(m-10)2≥28.807 5,因为函数y=(m-10)2在[10,20]上单调递增,当m∈N*时,(15-10)2<28.807 5,(16-10)2>28.807 5,所以m的最小值为16,即在被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为50+16=66.故选D.
13.C [解析] 由题意被调查的文理科教师人数相同,设理科教师的人数为5m,m∈N*,由题意可列出2×2列联表如下:
理科教师 文科教师 合计
喜欢用平板教学 4m 2m 6m
不喜欢用平板教学 m 3m 4m
合计 5m 5m 10m
根据表中数据可得χ2==.
因为有95%以上的把握认为是否喜欢用平板教学与文理学科教师有关,P(χ2≥3.841)≈0.05,所以≥3.841,解得m≥2.304 6,因为m∈N*,所以m≥3,即5m≥15,所以被调查的理科教师人数最少是15.故选C.
14.46 [解析] 由题意可得χ2=≥6.635,整理得(100a-4000)2≥502×42×6.635,所以100a-4000≥200×≈200×2.58=516或100a-4000≤-200×≈-200×2.58=-516,解得a≥45.16或a≤34.84,又因为40≤a≤50且a∈N*,所以46≤a≤50,且a∈N*,所以a的最小值为46.
15.解:(1)由题知K2的观测值k==24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:由题知R=·=·=·=·=·=·.
(ii)由调查数据可知P(A|B)==,P(A|)==,则P(|B)=1-P(A|B)=,P(|)=,所以R=×=6.9.2 独立性检验
【学习目标】
  1.通过实例,理解2×2列联表的统计意义.
  2.通过实例,了解独立性检验及其应用.
◆ 知识点一 分类变量与列联表
1.分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.列联表
(1)定义:一个描述两个分类变量分布的      ,称为列联表.
(2)一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:
Ⅱ 合计
类1 类2
Ⅰ 类A a b a+b
类B c d c+d
合计 a+c     a+b+c+d
上述表格称为       .
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)分类变量中的变量与函数中的变量是同一概念. (  )
(2)2×2列联表是借助两个分类变量之间频率大小的差异说明两个变量之间是否有关系. (  )
◆ 知识点二 独立性检验
(1)定义:用χ2统计量研究两个分类变量Ⅰ和Ⅱ是否有关系的方法称为独立性检验.
(2)χ2统计量:χ2=         ,其中n=      .
(3)独立性检验的步骤
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
①提出假设H0:Ⅰ与Ⅱ没有关系;
②根据2×2列联表及χ2的公式,计算χ2的值;
③根据临界值,作出判断.
其中临界值如表所示:
P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如:
①若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;
②若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;
③若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;
④若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能得出结论“H0成立”,即Ⅰ与Ⅱ没有关系.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的. (  )
(2)假设H0可以表述为:分类变量Ⅰ和Ⅱ相互独立. (  )
(3)独立性检验的样本不同,其结论可能不同. (  )
◆ 探究点一 2×2列联表
例1 (1)[2025·江苏泰州高二期中] 下面是一个2×2列联表,则表中a,c的值分别为 (  )
y1 y2 合计
x1 a 25 73
x2 21 b c
合计 d 49
                 
A.98,28 B.28,98
C.48,45 D.45,48
(2)[2025·江苏锡山高中高二月考] 在一项有关医疗保健的社会调查中,发现调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,女性中喜欢吃甜食的有492人,请作出性别与是否喜欢吃甜食的2×2列联表.
变式 [2024·江苏宿迁高二期末] 某高校有10 000名学生,其中女生3000名,男生7000名.为调查学生是否喜爱体育运动与性别是否有关系,用分层抽样的方法抽取120名学生,制成独立性检验的2×2列联表,如下表,则a-b=    .(用数字作答)
男生 女生 合计
喜爱体育运动 a 9
不喜爱体育运动 28 b
合计 120
[素养小结]
制作2×2列联表的基本步骤:
第一步,合理选取两个分类变量,且每一个分类变量都可以取两个值;
第二步,抽取样本,整理数据;
第三步,作出2×2列联表.
◆ 探究点二 对独立性检验的理解
例2 (1)[2025·江苏镇江期中] 某医疗研究机构为了解打鼾与患心脏病的关系,运用2×2列联表进行独立性检验,经计算χ2≈6.803,则所得到的统计学结论是认为打鼾与患心脏病有关系的把握约为 (  )                 
A.99.5% B.99%
C.0.1% D.0.5%
(2)(多选题)[2025·江苏启东东南中学高二月考] 给出下列实际问题,其中用独立性检验可以解决的问题有 (  )
A.两种药物治疗同一种疾病的疗法是否有区别
B.吸烟者得肺病的概率
C.是否吸烟与性别是否有关系
D.网吧与青少年的犯罪是否有关系
变式 (1)[2025·山东滨州高二期末] 针对时下的“短视频热”,某高校团委对学生性别和是否喜欢看短视频是否有关系进行了一次调查,其中被调查的男生、女生人数均为5m(m∈N*),男生中喜欢看短视频的人数占男生人数的,女生中喜欢看短视频的人数占女生人数的.提出假设H0:是否喜欢看短视频和性别相互独立.若有95%的把握认为是否喜欢看短视频和性别不独立,则m的最小值为 (  )
A.7 B.8
C.9 D.10
(2)(多选题)[2025·江苏扬州高二期末] 下列关于独立性检验的说法中正确的有 (  )
A.样本不同,独立性检验的结论可能有差异
B.分类变量Ⅰ与Ⅱ的统计量χ2越小,判断“Ⅰ与Ⅱ有关系”的可信程度越小
C.由独立性检验可知有95%的把握认为“秃顶与患心脏病有关”,所以我们说某人秃顶,那么他有95%的可能患有心脏病
D.有99%的把握认为“吸烟与患肺癌有关”,是指在犯错误的概率不超过1%的前提下认为“吸烟与患肺癌有关”
[素养小结]
(1)独立性检验是研究两个分类变量是否有关的统计方法,在独立性检验的概念中要准确分析出两个分类变量;在学习中还要注意其与相关关系概念的区别,相关性分析是研究两个变量之间的相关关系的统计方法.
(2)χ2≥x0的实质就是两个变量有关系的概率为1-P(χ2≥x0).
◆ 探究点三 独立性检验的综合应用
例3 某消费者协会为了解2024年当地居民网购消费情况,随机抽取了100人,对其2024年全年网购消费金额(单位:千元)进行了统计,所统计的金额数据均在区间[0,30]内,并按[0,5),[5,10),…,[25,30]分成6组,制成如图所示的频率分布直方图.
(1)求图中a的值,并估计居民网购消费金额的中位数;
(2)若将全年网购消费金额在20千元及以上者称为网购迷,结合图表数据,补全下面的2×2列联表,并判断是否有99%的把握认为是否是网购迷与性别有关.
男 女 合计
网购迷 20
非网购迷 47
合计
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0) 0.10 0.05 0.010 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
变式 [2025·江苏南通高二期中] 某医院采用甲、乙两种方案治疗胃痛.采用有放回简单随机抽样的方法对治疗情况进行检查,得到下面两种疗法治疗数据的列联表:
未治愈 治愈 合计
方案甲 15 50 65
方案乙 5 60 65
合计 20 110 130
(1)分析两种治疗方案的疗效是否有差异;
(2)从未治愈的20名患者中随机抽取2人进行电话回访,求2人采用不同治疗方法的概率.
附:χ2=.
P(χ2≥x0) 0.05 0.010 0.005 0.001
x0 3.841 6.635 7.879 10.8289.2 独立性检验
1.[2024·江苏苏州高二期末] 为调查乘客的晕车情况,在某一次行程中,50名男乘客中有25名晕车,30名女乘客中有5名晕车.在检验这些乘客是否晕车与性别是否有关时,常采用的数据分析方法是 (  )                 
A.回归分析
B.独立性检验
C.频率分布直方图
D.用样本估计总体
2.设研究某两个分类变量是否有关时,提出假设H0:两个变量相互独立,根据统计数据得到2×2列联表,计算得χ2>3.841,则下列说法正确的是(P(χ2≥3.841)≈0.05) (  )
A.有99.5%的把握认为H0不成立
B.有5%的把握认为H0的反面正确
C.有95%的把握判断H0正确
D.有95%的把握能反驳H0
3.[2025·江苏南京高二期末] 为了考查某种营养液对有机蔬菜的增产效果,某研究所进行试验获得数据,经过计算后得到χ2≈6.795,那么可以认为该营养液对有机蔬菜有增产效果的把握为(  )
A.99.9%以上 B.99.5%以上
C.99%以上 D.95%以下
4.[2025·山东烟台高二期中] 下列关于独立性检验的说法正确的是 (  )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关系中,当有99%的把握认为吸烟与患肺病有关系时,我们可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大
5.[2025·福建漳州高二期中] 为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:
体育课不及格 体育课及格 合计
文化课及格 57 221 278
文化课不及格 16 43 59
合计 73 264 337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2≈ (  )
A.38.214 B.1.255
C.0.003 7 D.2.058
6.(多选题)[2025·上海黄浦区期中] 某村庄对该村内50名村民去年参加体检的情况进行了调查,统计数据如下表所示:
参加体检 未参加体检 合计
老年人 a 7 c
年轻人 6 b d
合计 e f 50
已知抽取的村民中老年人、年轻人各25名,则下列结论正确的是 (  )
A.a=18 B.b=19
C.c+d=50 D.e-f=2
7.[2024·江苏南通如皋中学高二期中] 下面是一个2×2列联表:
y1 y2 合计
x1 a 21 70
x2 5 c 30
合计 b d 100
则b-d=    ,χ2=    (保留小数点后3位).
8.[2025·上海静安区期末] 在独立性检验中,为了调查变量X与变量Y的关系,提出假设H0:变量X和变量Y无关.通过统计得到2×2列联表,计算得到χ2≥6.635,已知P(χ2≥6.635)≈0.01,则可以得出的结论是     (填序号).
①有99%的把握认为变量X与变量Y没有关系;
②有1%的把握认为变量X与变量Y有关系;
③有99%的把握认为变量X与变量Y有关系;
④有1%的把握认为变量X与变量Y没有关系.
9.(13分)[2025·江苏南京期中] 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别是否对学生体育锻炼的经常性有影响,为此随机抽查了男、女生各100名,得到如下数据:
不经常锻炼 经常锻炼 合计
女生 40 60 100
男生 20 80 100
合计 60 140 200
(1)依据表中数据,能否认为性别与学生体育锻炼的经常性有关系
(2)从这200人中随机选择1人,已知选到的学生经常参加体育锻炼,求他是男生的概率.
10.(13分)[2025·江苏镇江高二期中] 为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘制频率分布直方图如图所示,试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.填写下面的2×2列联表,根据表中数据,能否断定注射疫苗后小白鼠产生抗体与指标值不小于60有关
指标值小于60 指标值不小于60 合计
有抗体
没有抗体
合计
11.[2025·广东肇庆高二期末] 已知某独立性检验中,由χ2=(n=a+b+c+d)计算出χ2=,若将2×2列联表中的数据a,b,c,d分别变成2a,2b,2c,2d后,计算出的χ2=,则 (  )
A.= B.=2
C.=2 D.=4
12.[2024·江苏徐州侯集中学高二月考] 随着国家对中小学“双减”政策的逐步落实,增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“是否支持增加中学生体育锻炼时间与性别是否有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如表数据(10≤m≤20,m∈N*):
支持 不支持
男生 70-m 10+m
女生 50+m 30-m
提出假设H0:是否支持增加中学生体育锻炼时间与性别无关.通过计算可得有95%以上的把握认为“是否支持增加中学生体育锻炼时间与性别有关”,则在被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为(  )
A.15 B.65
C.16 D.66
13.为了更好地开展多媒体化教学,某小学对“是否喜欢用平板教学与文理学科教师是否有关”做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,提出假设H0:是否喜欢用平板教学与文理科教师无关.若有95%以上的把握认为是否喜欢用平板教学与文理学科教师有关,则被调查的理科教师人数最少是 (  )
A.8 B.12
C.15 D.20
14.[2024·福建福州高二期末] 为了研究某种药物预防某种疾病的效果,进行动物试验,得到如下列联表(40≤a≤50,a∈N*):
未患病 患病 合计
服药 a 50-a 50
未服药 80-a a-30 50
合计 80 20 100
提出假设H0:该种药物对某种疾病没有预防效果.若在本次研究中得出“有99%以上的把握认为该种药物对某种疾病有预防效果”的结论,则a的最小值为    .(参考数据:≈2.58,≈3.29)
附:χ2=,n=a+b+c+d.
P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
15.(15分)[2022·新高考全国Ⅰ卷] 一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(i)证明:R=·;
(ii)利用该调查数据,给出P(A|B),P(A|)的估计值,并利用(i)的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.