9.2 独立性检验 同步学案(含答案) 2024-2025学年高二数学苏教版(2019)选择性必修第二册

文档属性

名称 9.2 独立性检验 同步学案(含答案) 2024-2025学年高二数学苏教版(2019)选择性必修第二册
格式 docx
文件大小 100.8KB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-05-26 23:50:54

图片预览

文档简介

9.2 独立性检验
1. 通过实例,理解2×2列联表的统计意义.
2. 通过实例,了解2×2列联表独立性检验的基本思想、方法和初步应用.
3. 经历由实际问题建立数学模型的过程,体会其中的基本方法,提高数学模型建立和数据处理的能力.
活动一 了解分类变量及2×2列联表
某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,数据整理如下表:
患病 未患病 合计
吸烟 37 183 220
不吸烟 21 274 295
合计 58 457 515
根据这些数据能否断定:患呼吸道疾病与吸烟有关?
1. 分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2. 列联表
(1) 列联表是一个描述两个分类变量分布的频数表.
(2) 2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)如下:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
活动二 了解独立性检验 
阅读教材,了解独立性检验.
1. 定义:利用统计量χ2来判断“两个分类变量是否有关系”的方法称为独立性检验.
2. χ2=,其中n=a+b+c+d为样本容量.
3. 推断“Ⅰ与Ⅱ有关系”的步骤:
(1) 提出假设H0:Ⅰ与Ⅱ没有关系;
(2) 根据2×2列联表与公式计算χ2的值;
(3) 根据临界值表,作出判断.
活动三 实际应用 
例1 在500人身上试验某种血清预防感冒的作用,把他们1年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如下表所示.问:该种血清对预防感冒是否有作用?
未感冒 感冒 合计
使用血清 258 242 500
未使用血清 216 284 500
合计 474 526 1 000
  
独立性检验的注意点:
在2×2列联表中,如果两个分类变量没有关系,那么应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
例2 为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如下表所示.根据所选择的193个病人的数据,能否做出药的效果与给药方式有关的结论?
有效 无效 合计
口服 58 40 98
注射 64 31 95
合计 122 71 193
  
例3 气管炎是一种常见的呼吸道疾病.医药研究人员对两种中草药治疗慢性气管炎的疗效进行了对比,所得数据如下表所示.问:它们的疗效有无差异?
有效 无效 合计
复方江剪刀草 184 61 245
胆黄片 91 9 100
合计 275 70 345
  
1. (2024九江期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算,得χ2=8.133.根据独立性检验的相关知识,对照下表,有 t% 的把握认为喜欢篮球与性别有关,则t的值为(  )
附:                         
P(χ2≥x0) 0.05 0.01 0.005 0.001
x0 3.841 6.635 7.879 10.828
A. 95 B. 99.5 C. 99 D. 99.9
2. (2024南阳月考)某高校团委对学生喜欢短视频和性别是否有关进行了一次调查,其中被调查的男生、女生人数均为6m(m∈N*),男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有99%的把握认为喜欢短视频和性别有关,则m的最小值为(  )
附:
P(χ2≥x0) 0.05 0.01 0.005 0.001
x0 3.841 6.635 7.879 10.828
A. 18 B. 20 C. 22 D. 24
3. (多选)北京冬奥会成功举办后,大众对冰雪运动关注度不断上升,为研究市民对冰雪运动的喜好是否和性别有关,某校学生社团对市民进行了一次抽样调查,得到列联表如下:
冰雪运动的喜好 性别 合计
男性 女性
喜欢 140 m 140+m
不喜欢 n 80 80+n
合计 140+n 80+m 220+m+n
若男性喜欢冰雪运动的人数占男性人数的,女性喜欢冰雪运动的人数占女性人数的,则下列结论中正确的是(  )
A. 列联表中n的值为60,m的值为120
B. 随机对一位路人进行调查,有95%的可能性对方喜欢冰雪运动
C. 有95%的把握认为市民对冰雪运动的喜好和性别有关
D. 没有99%的把握认为市民对冰雪运动的喜好和性别有关
4. (2024常州期末)某单位为了调查对工作的满意程度与性别是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N*,且x<6,若有95%的把握认为对工作的满意程度与性别有关,则x的值是________.
对工作满意 对工作不满意
男 4x 6x
女 6x 4x
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
5. (2024南阳月考)爬虫软件是一种自动抓取互联网信息的程序,它能够模拟浏览器行为,自动化地获取网页源代码,并从中提取出所需数据.爬虫软件在互联网上爬行并采集目标数据,这个过程类似于一只大蜘蛛在互联网上爬行,因此得名“爬虫”.现有某电商运营部门为分析消费能力与性别的关系,使用爬虫软件了解到,2023年第4季度在本店网购的消费者共12 000名,现随机抽取100名消费者,其中男女各半.若消费者总消费金额不低于3 000元,则称其为网购达人.男性消费者中,网购达人占.网购达人中,男性消费者占.
(1) 请完成下列的2×2列联表;
网购达人 非网购达人 合计
男性
女性
合计
(2) 如果认为是否为网购达人与性别有关犯错误的概率不超过P,那么根据临界值表,最精确的P的值应为多少?请说明理由.
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
P(χ2≥x0) 0.10 0.05 0.010 0.001
x0 2.706 3.841 6.635 10.828
9.2 独立性检验
【活动方案】
背景引入:在吸烟的人中,有≈16.82%的人患病;
在不吸烟的人中,有≈7.12%的人患病,
可知吸烟者与不吸烟者患病的可能性存在差异,所以有患病与吸烟有关这一推论.
例1 提出假设H0:感冒与是否使用该种血清没有关系.
根据列联表中的数据,可以求得χ2=≈7.075.
因为当H0成立时,χ2≥6.635的概率约为0.01,所以我们有99%的把握认为,该种血清能起到预防感冒的作用.
例2 提出假设H0:药的效果与给药方式没有关系.
根据列联表中的数据可以求得χ2=≈1.389 6<2.072.
因为当H0成立时,χ2≥1.389 6的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论.
例3 提出假设H0:两种中草药的治疗效果没有差异,即病人使用这两种药物中何种药物对疗效没有明显差异.
根据列联表中的数据可以求得χ2=≈11.098.
因为当H0成立时,P(χ2≥10.828)≈0.001,这里的χ2≈11.098>10.828,所以我们有99.9%的把握认为,两种药物的疗效有差异.
【检测反馈】
1. B 因为χ2=8.133>7.879,所以有99.5%的把握认为喜欢篮球与性别有关.
2. B 根据题意,2×2列联表如下:
喜欢 不喜欢 合计
男 3m 3m 6m
女 4m 2m 6m
合计 7m 5m 12m
则χ2===.因为有99%的把握认为喜欢短视频和性别有关,所以>6.635,所以m>19.352,又m∈N*,所以m的最小值为20.
3. ACD 因为男性喜欢冰雪运动的人数占男性人数的,所以=,解得n=60.又因为女性喜欢冰雪运动的人数占女性人数的,所以=,解得m=120,故A正确;计算=0.65,所以随机对一路人进行调查,有65%的可能性对方喜欢冰雪运动,故B错误;由列联表中的数据,计算得到χ2=≈4.396>3.841,所以有95%的把握认为市民喜欢冰雪运动和性别有关系,故C正确;因为χ2≈4.396<6.635,所以没有99%的把握认为市民喜欢冰雪运动和性别有关系,故D正确.故选ACD.
4. 5 由题意,得χ2==>3.841,得x>4.801 25.因为x∈N*且x<6,所以x=5.
5. (1) 由题意可得男性消费者50人,女性消费者50人,男性消费者网购达人有50×=20(人),则男性消费者中非网购达人有50-20=30(人),则网购达人共有20×=50(人),
则女性消费者中网购达人有50-20=30(人),女性消费者中非网购达人有50-30=20(人),
故得2×2列联表如下:
网购达人 非网购达人 合计
男性 20 30 50
女性 30 20 50
合计 50 50 100
(2) 由(1)可得χ2==4,
因为3.841<4<6.635,认为是否为网购达人与性别有关系犯错的概率不超过5%,
即P的值为5%.