9.2 独立性检验
一、 单项选择题
1 (2024九江期末)设有两个变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1 y2
x1 a b
x2 c d
根据下列选项中的数据计算χ2的值,其中χ2最大的一组为( )
A. a=60,b=50,c=40,d=30
B. a=60,b=40,c=50,d=30
C. a=40,b=30,c=50,d=60
D. a=30,b=40,c=50,d=60
2 (2024龙岩阶段练习)设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下,当X与Y的关系最弱时,m的值为( )
y1 y2
x1 10 18
x2 m 26
A. 8 B. 9 C. 14 D. 19
3 为研究高中生爱好某项运动是否与性别有关,某校研究性学习小组采取简单随机抽样的方法调查了200名高中生,依据独立性检验,经计算得到χ2=7.63,则下列结论中正确的是( )
P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
A. 有99%的高中生爱好该项运动
B. 有99%以上的把握认为“爱好该项运动与性别无关”
C. 在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”
D. 在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”
4 某校团委对“学生喜欢羽毛球运动和性别是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢羽毛球运动的人数占男生总人数的,女生喜欢羽毛球运动的人数占女生总人数的,若有99%的把握认为是否喜欢羽毛球运动和性别有关,则男生至少有( )
附:χ2=.
P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001
x0 2.706 3.841 5.024 6.635 7.879 10.828
A. 12人 B. 18人 C. 24人 D. 30人
5 (2024潍坊期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据,则下列结论中正确的是( )
男生 女生
篮球迷 30 15
非篮球迷 45 10
附:χ2=.
P(χ2≥x0) 0.10 0.05 0.01
x0 2.706 3.841 6.635
A. 没有95%的把握认为是不是篮球迷与性别有关
B. 有99%的把握认为是不是篮球迷与性别有关
C. 在犯错误的概率不超过0.05的前提下,可以认为是不是篮球迷与性别有关
D. 在犯错误的概率不超过0.01的前提下,可以认为是不是篮球迷与性别有关
6 为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
患流感 未患流感
服用药 2 18
未服用药 8 12
根据表中数据,计算χ2=,若由此认为“该药物有效”,则该结论出错的概率不超过( )
附:
P(χ2≥x0) 0.10 0.05 0.01 0.005
x0 2.706 3.841 6.635 7.879
A. 0.05 B. 0.1 C. 0.01 D. 0.005
二、 多项选择题
7 针对时下的“航天热”,某校团委对“学生是否喜欢航天与性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若有95%的把握认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为( )
A. 25 B. 45 C. 60 D. 75
8 (2024南平模拟)2023年10月全国多地医院出现较多的支原体肺炎感染患者,患者多以儿童为主.某研究所在某小学随机抽取了46名儿童,得到他们是否接种流感疫苗和是否感染支原体肺炎的情况的相关数据,如下表所示,则下列结论中正确的是( )
感染支原
体肺炎 未感染支
原体肺炎 合计
接种流感疫苗 a=12 b a+b
未接种流感疫苗 c d=13 c+d
合计 a+c b+d=28 46
附:χ2=,n=a+b+c+d.
P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
A. >
B. χ2>2.706
C. 认为是否感染支原体肺炎与接种流感疫苗有关联,此推断犯错的概率不大于0.1
D. 没有充分的证据推断是否感染支原体肺炎与接种流感疫苗有关联
三、 填空题
9 已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,部分临界值表如下:
P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005
x0 2.706 3.841 5.024 6.635 7.879
则最大有________的把握认为变量X,Y有关系.(填百分数)
10 (2024南阳期中)ChatGPT爆火以来,各种人工智能平台如雨后春笋般层出不穷.某人工智能服务商提供了A,B两种会员服务套餐,购买会员服务的既有个人用户也有公司用户.后台随机调取m名会员的基本信息,统计发现购买B套餐的用户数占总用户数的,购买B套餐的用户中公司用户数是个人用户数的倍,购买A套餐的用户中公司用户数是个人用户数的一半.根据独立性检验,有99.5%的把握认为购买的套餐类型与用户类型有关系,则m的最小值为________.
附:χ2=,n=a+b+c+d.
P(χ2≥x0) 0.050 0.010 0.005 0.001
x0 3.841 6.635 7.879 10.828
11 为研究某新药的疗效,给50名患者服用此药,跟踪调查后得到以下数据:
无效 有效 合计
男性患者 15 35 50
女性患者 6 44 50
合计 21 79 100
设H0:服用此药的效果与患者的性别无关,则χ2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
四、 解答题
12 (2024北京期中)为提升学生综合素养,某中学为高二年级提供了“书法”和“剪纸”两门选修课.为了解学生选择“书法”或“剪纸”是否与性别有关,调查了高二年级1 500名学生的选择倾向,随机抽取了100名,统计选择两门课程的人数如下表:
选书法 选剪纸 合计
男生 40 50
女生
合计 30
(1) 补全2×2列联表;
(2) 在犯错的概率不超过5%的前提下,是否可以认为学生选择“书法”或“剪纸”与性别有关(计算结果保留到小数点后三位)
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0) 0.100 0.050 0.025
x0 2.706 3.841 5.024
13 (2024陕西三模)“村超”是贵州省榕江县举办的“和美乡村足球超级联赛”的简称.在2023年火爆“出圈”后,“村超”热度不减.2024年1月6日,万众瞩目的2024年“村超”新赛季在“村味”十足的热闹中拉开帷幕,一场由乡村足球发起的“乐子”正转化为乡村振兴的“路子”.为了解不同年龄的游客对“村超”的满意度,某组织进行了一次抽样调查,分别抽取年龄超过35周岁和年龄不超过35周岁各200人作为样本,每位参与调查的游客都对“村超”给出满意或不满意的评价.设事件A为“游客对‘村超’满意”,事件B为“游客年龄不超过35周岁”,据统计,P(A|B)=,P(B|A)=.
(1) 根据已知条件,将下列2×2列联表补充完整;
满意 不满意 合计
年龄不超过35周岁
年龄超过35周岁
合计
(2) 由(1)中的2×2列联表,分析是否有99%的把握认为游客对“村超”的满意度与年龄有关联?
附:χ2=,n=a+b+c+d.
P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001
x0 2.706 3.841 5.024 6.635 7.879 10.828
9.2 独立性检验
1. C 对于A,χ==;对于B,χ==;对于C,χ==;对于D,χ==,显然χ最大,故C正确.
2. C 在两个分类变量的列联表中,当|ad-bc|的值越小时,认为两个分类变量有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
3. C 由χ2=7.63∈(6.635,7.879),得在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”.
4. B 设男生的人数为x,女生的人数为,则 2×2 列联表如下:
喜欢羽毛球运动 不喜欢羽毛球运动 合计
男生 x
女生
合计 x
所以χ2==>6.635,解得x>≈17.69,所以男生至少有18人.
5. A 由题意可得2×2列联表如下:
男生 女生 合计
篮球迷 30 15 45
非篮球迷 45 10 55
合计 75 25 100
所以χ2=≈3.03>2.706,所以在犯错误的概率不超过0.1的前提下,可以认为是不是篮球迷与性别有关.又χ2≈3.03<3.841,所以没有95%的把握认为是不是篮球迷与性别有关.
6. A 由题意,得χ2==4.8>3.841,由临界值表可知,认为“该药物有效”,且该结论出错的概率不超过0.05.
7. BCD 设男生有x人,依题意得女生有x人,2×2列联表如下:
喜欢航天 不喜欢航天 合计
男生 x x x
女生 x x x
合计 x x 2x
由χ2==x>3.841,解得x>40.330 5,又x是5的整数倍,所以被调查的学生中男生的人数可能为45,60,75.故选BCD.
8. AD 由表中数据,得a=12,b=15,c=6,d=13,a+b=27,c+d=19,a+c=18,b+d=28.对于A,=,=,>,故A正确;对于B,χ2=≈0.775<2.706,故B错误;对于C,D,由B知χ2≈0.775<2.706,所以没有充分的证据推断是否感染支原体肺炎与接种流感疫苗有关联,故C错误,D正确.故选AD.
9. 95% 因为χ2≈4.328>3.841,所以最大有95%的把握认为变量X,Y有关系.
10. 170 由题意可得用户类型与购买的套餐类型2×2列联表如下:
A B 合计
个人用户 m m m
公司用户 m m m
合计 m m m
χ2==>7.879,解得m>165.459,又因为m必须是10的倍数,所以m的最小值为170.
11. 4.882 5% χ2=≈4.882>3.841,所以我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.
12. (1) 根据题意,共抽取了100人,则补全2×2列联表如下表所示.
选书法 选剪纸 合计
男生 40 10 50
女生 30 20 50
合计 70 30 100
(2) 由表中数据,得χ2=≈4.762>3.841,
故在犯错的概率不超过5%的前提下,能认为学生选择“书法”或“剪纸”与性别有关.
13. (1) 因为P(A|B)=,
所以年龄不超过35周岁且对“村超”满意的游客人数为×200=160.
因为P(B|A)=,
所以对“村超”满意的游客人数为160×=300,
所以年龄超过35周岁且对“村超”满意的游客人数为300-160=140,
所以2×2列联表如下:
满意 不满意 合计
年龄不超过35周岁 160 40 200
年龄超过35周岁 140 60 200
合计 300 100 400
(2) 因为χ2==≈5.333<6.635,
所以没有99%的把握认为游客对“村超”的满意度与年龄有关联.