8.3.2 独立性检验
一、 单项选择题
1 经过对χ2的统计量的研究,得到了若干个临界值,当χ2<2.706时,我们认为事件A与B( )
A. 有95%的把握认为A与B有关系
B. 有99%的把握认为A与B有关系
C. 没有充分理由说明事件A与B有关系
D. 不能确定
2 为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得χ2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )
A. 0.1% B. 1% C. 99% D. 99.9%
3 (2024苏州模拟)设研究某两个属性变量时,作出零假设H0并得到2×2列联表,计算得χ2>x0.05,则下列说法中正确的是( )
A. 有99.5%的把握认为H0不成立 B. 有5%的把握认为H0的反面正确
C. 有95%的把握判断H0正确 D. 有95%的把握能反驳H0
4 (2024广东实验中学月考)为了研究经常使用手机是否对数学学习成绩有影响,某校高二数学研究性学习小组进行了调查,随机抽取高二年级50名学生的一次数学单元测试成绩,并制成下面的2×2列联表:
使用手机情况 成绩 合计
及格 不及格
很少 20 5 25
经常 10 15 25
合计 30 20 50
参考公式:χ2=,其中n=a+b+c+d.
附表:
α 0.05 0.025 0.010 0.005 0.001
xα 3.841 5.024 6.635 7.879 10.828
参照附表,下列结论中正确的是( )
A. 依据小概率值α=0.01的独立性检验,认为“经常使用手机与数学学习成绩无关”
B. 依据小概率值α=0.001的独立性检验,认为“经常使用手机与数学学习成绩有关”
C. 在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩无关”
D. 在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩有关”
5 (2024吉安期末)为了解喜爱钓鱼是否与性别有关,某同学随机抽取了若干人进行调查,抽取的女性人数是男性人数的2倍,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的.若本次调查得出“有99%的把握认为是否喜爱钓鱼与性别有关”的结论,则被调查的男性至少有( )
附:χ2=,且≈0.82.
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A. 8人 B. 10人
C. 15人 D. 20人
6 在独立性检验中,两个分类变量“X与Y有关系”的可信度为99%,则随机变量χ2的取值范围是( )
A. [2.706,3.841) B. [3.841,6.635)
C. [6.635,7.879) D. [7.879,10.828)
二、 多项选择题
7 (2024濮阳期末)某农科院研制出了一种防治玉米病虫害的新药.为了解该药的防治效果,科研人员选用了100粒玉米种子(其中一部分用该药做了处理)进行试验,从中任选1粒,发现此粒种子抗病虫害的概率为0.8.未填写完整的2×2列联表如下,则下列结论中正确的是( )
抗病虫害 不抗病虫害 合计
种子经过该药处理 60
种子未经过该药处理 14
合计 100
附:χ2=,其中n=a+b+c+d.
α 0.1 0.01 0.005 0.001
xα 2.706 6.635 7.879 10.828
A. 这100粒玉米种子中经过该药处理且不抗病虫害的有6粒
B. 这100粒玉米种子中抗病虫害的有84粒
C. χ2的观测值约为13.428
D. 根据小概率值α=0.001的独立性检验,可以认为该新药有效
8 (2024厦门质检)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼的人数是不经常锻炼的人数的2倍,绘制其等高堆积条形图如图所示,则下列命题中正确的是( )
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A. 参与调查的男生中经常锻炼的人数比不经常锻炼的人数多
B. 从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为
C. 依据α=0.1的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1
D. 假设调查人数为600,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05
三、 填空题
9 (2024靖远一中期末)为检验某种药物预防某一疾病的效果,进行了动物试验,得到如下的2×2列联表:
患病 未患病 合计
服用药 10 45 55
没服用药 20 30 50
合计 30 75 105
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.025 0.01 0.005
xα 2.706 3.841 5.024 6.635 7.879
给出下列结论,其中正确的是________.(填序号)
①不能在犯错误的概率不超过0.05的前提下认为药物有效;
②能在犯错误的概率不超过0.025的前提下认为药物有效;
③不能在犯错误的概率不超过0.010的前提下认为药物有效;
④能在犯错误的概率不超过0.005的前提下认为药物有效.
10 某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,________(填“有”或“没有”)95%的把握认为糖尿病患者与遗传有关系.
11 随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(10≤m≤20,m∈N*):
支持 不支持
男生 70-m 10+m
女生 50+m 30-m
若通过计算及根据小概率值α=0.05的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为__________.
附:χ2=,其中n=a+b+c+d.
α 0.050 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
四、 解答题
12 某校对学生课外活动进行调查,结果整理成下表,用你所学过的知识进行分析,能否在犯错误的概率不超过0.005 的前提下,认为“喜欢体育还是文娱与性别有关系”.
体育 文娱 合计
男生 21 23 44
女生 6 29 35
合计 27 52 79
13 (2024吉林期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙两种方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各100株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图(统计数据分组区间为[50,60),[60,70),[70,80),[80,90),[90,100]),记综合评分为80及以上的花苗为优质花苗.
(1) 求图中a的值,并求综合评分的中位数;
(2) 填写下面的2×2列联表,并根据小概率值α=0.01的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.
优质花苗 非优质花苗 合计
甲培育法 50
乙培育法 70
合计
附:χ2=,其中n=a+b+c+d.
a 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
8.3.2 独立性检验
1. C 当χ2≥2.706=x0.1时,有90%以上的把握说明A与B有关系,但当χ2<2.706=x0.1时,只能说明A与B是否有关系的理由不够充分.
2. C 因为χ2=7.01>6.635=x0.01,所以有99%的把握认为喜欢乡村音乐与性别有关系.
3. D 因为χ2>x0.05,所以有95%的把握能反驳H0.
4. D 由题中数据可得χ2==≈8.333>7.879,所以有99.5%的把握认为“经常使用手机与数学学习成绩有关”,即在犯错误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成绩有关”,故C错误,D正确;因为χ2≈8.333>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,认为“经常使用手机与数学学习成绩有关”,故A错误;因为χ2≈8.333<10.828=x0.001,所以依据小概率值α=0.001的独立性检验,认为“经常使用手机与数学学习成绩无关”,故B错误.
5. B 设被调查的男性有x人,则女性有2x人,根据题意,可得如下的2×2列联表:
男性 女性 合计
喜欢钓鱼
不喜欢钓鱼
合计 x 2x 3x
则χ2==≈0.82x,本次调查得出“有99%的把握认为是否喜爱钓鱼与性别有关”的结论,可得0.82x≥6.635,解得x≥8.09.又因为x=5n,n∈N*,结合选项,所以被调查的男性至少有10人.
6. C 对照临界值表可知选C.
7. AD 由题可将2×2列联表补充完整如下:
抗病虫害 不抗病虫害 合计
种子经过该药处理 60 6 66
种子未经过该药处理 20 14 34
合计 80 20 100
由上表可知A正确,B错误;由表中数据可得χ2=≈14.439>10.828,因此根据小概率值α=0.001的独立性检验,可以认为该新药有效,故C错误,D正确.故选AD.
8. ABD 对于A,由题意知经常锻炼的人数是不经常锻炼的人数的2倍,则经常锻炼的人数为200,不经常锻炼的人数为100,所以男生中经常锻炼的人数为200×0.5=100,不经常锻炼的人数为100×0.6=60,故男生中经常锻炼的人数比不经常锻炼的人数多,故A正确;对于B,经常锻炼的女生人数为200×0.5=100,不经常锻炼的人数为100×0.4=40,故从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为=,故B正确;对于C,由题意结合男女生中经常锻炼和不经常锻炼的人数,可得如下的2×2列联表:
经常锻炼 不经常锻炼 合计
男 100 60 160
女 100 40 140
合计 200 100 300
则χ2=≈2.679<2.706,故依据α=0.1的独立性检验,不能认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1,故C错误;对于D,由题意可得如下的2×2列联表:
经常锻炼 不经常锻炼 合计
男 200 120 320
女 200 80 280
合计 400 200 600
则此时χ2=≈5.357>3.841,故依据α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05,故D正确.故选ABD.
9. ②③ 由表格数据可得χ2=≈6.1>5.024,所以能在犯错误的概率不超过0.025的前提下认为药物有效,故①错误,②正确;又6.1<6.635,所以不能在犯错误的概率不超过0.010的前提下认为药物有效,故③正确,④错误.
10. 有 根据题意列出如下的2×2列联表:
发病 不发病 合计
阳性家庭史 16 93 109
阴性家庭史 17 240 257
合计 33 333 366
则χ2=≈6.067>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下,即有95%的把握认为糖尿病患者与遗传有关.
11. 66 因为根据小概率值α=0.05的独立性检验,认为“支持增加中学生体育锻炼时间的政策与性别有关”,所以≥3.841,即(m-10)2≥28.8075,因为函数y=(m-10)2在10≤m≤20时单调递增,且m∈N*,(15-10)2<28.8075,(16-10)2≥28.8075,所以m的最小值为16,所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为50+16=66.
12. 零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.
由表中数据,得χ2=≈8.106>7.879=x0.005.
根据小概率值α=0.005的χ2独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关系,此推断犯错误的概率不超过0.005.
13. (1) 由频率分布直方图可得(0.005+a+0.025+0.04+0.02)×10=1,解得a=0.010.
因为(0.005+0.01+0.025)×10=0.4<0.5,(0.005+0.01+0.025+0.04)×10=0.8>0.5,
所以中位数位于[80,90)内,设中位数为x,
则有0.4+0.04×(x-80)=0.5,解得x=82.5,
故综合评分的中位数为82.5.
(2) 由频率分布直方图可得优质花苗的频率为(0.04+0.02)×10=0.6,
所以优质花苗共有2×100×0.6=120(株),则非优质花苗共有200-120=80(株),
所以补充完整的2×2列联表如下:
优质花苗 非优质花苗 合计
甲培育法 50 50 100
乙培育法 70 30 100
合计 120 80 200
零假设为H0:优质花苗与培育方法无关,
由表中数据得χ2==≈8.333>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为优质花苗与培育方法有关,该推断犯错误的概率不大于0.01.