4.3.2 独立性检验
课后篇巩固提升
基础达标练
1.(多选)掷一枚正六面体骰子,记事件A=“出现偶数点”,B=“出现3的倍数点”,下列说法中正确的是( )
A.A与B相互独立 B.A与B相互独立
C.A与B相互独立 D.A与B不相互独立
答案ABC
2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据可得出( )
A.种子是否经过处理与是否生病有关
B.没有充足的理由认为种子经过处理与生病有关
C.种子是否经过处理决定是否生病
D.有90%的把握认为种子经过处理与生病有关
解析χ2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有充足的理由认为种子经过处理跟生病有关.
答案B
3.某防疫站对屠宰场及肉食零售点的猪肉进行沙门氏菌带菌情况的检查,结果如下表:
带菌头数
不带菌头数
总计
屠宰场
8
32
40
零售点
14
18
32
总计
22
50
72
利用独立性检验估计屠宰场与零售点猪肉带菌率( )
A.有95%的把握有关
B.无关
C.有99%的把握有关
D.无法判断
解析χ2=72×(8×18-14×32)222×50×40×32≈4.726>3.841.故选A.
答案A
4.已知2×2列联表:
B
B
总计
A
a
21
73
A
2
25
27
总计
b
46
则a,b的值分别为 .?
解析因为a+21=73,所以a=52.
又因为a+2=b,所以b=54.
答案52,54
5.为了研究子女吸烟与父母吸烟的关系,调查了1 520名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
试问:父母吸烟对子女是否吸烟有影响吗?
解由2×2列联表中的数据得χ2=1 520×(237×522-83×678)2320×1 200×915×605≈32.52>10.828.
所以,我们有99.9%的把握认为父母吸烟对子女是否吸烟有影响.
6.高中流行这样一句话:“文科就怕数学不好,理科就怕英语不好.”下表是一次针对高三文科学生进行调查所得的数据,试判断文科学生总成绩不好与数学成绩不好是否有关.
总成绩好
总成绩不好
总计
数学成绩好
478
12
490
数学成绩不好
393
30
423
总计
871
42
913
解根据题意计算得χ2=913×(478×30-12×393)2490×423×871×42≈11.153>10.828.因此有99.9%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.
7.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解(1)第二种生产方式的效率更高.
理由如下:
①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
③由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.
④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
(以上给出了4种理由,答出其中任意一种或其他合理理由均可)
(2)由茎叶图知m=79+812=80.
列联表如下:
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)由于χ2=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.
能力提升练
1.(2019山东菏泽一中高二月考)某班主任对班级51名同学进行了作业量多少的调查,结合数据建立了一个2×2列联表可能用到的公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),可能用到的数据:P(χ2≥6.635)=0.01,P(χ2≥3.841)=0.05,参照以上公式和数据,得到的正确结论是( )
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
18
12
30
不喜欢玩电脑游戏
5
16
21
总计
23
28
51
A.有95%的把握认为喜欢玩电脑游戏与认为作业多少有关
B.有95%的把握认为喜欢玩电脑游戏与认为作业多少无关
C.有99%的把握认为喜欢玩电脑游戏与认为作业多少有关
D.有99%的把握认为喜欢玩电脑游戏与认为作业多少无关
解析根据所给数据可得观测值为χ2=51×(18×16-12×5)223×28×21×30≈6.535>3.841,所以有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.故选A.
答案A
2.(多选)某学校为了了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:
喜欢该项运动
不喜欢该项运动
总计
男
40
20
60
女
20
30
50
总计
60
50
110
由公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),算得χ2≈7.82.
附表:
P(χ2≥k)
0.025
0.01
0.005
k
5.024
6.635
7.879
参照附表,以下结论不正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别无关”
D.有99%以上的把握认为“爱好该项运动与性别有关”
解析由列联表知,χ2=7.82>6.635,所以这个结论有0.010的机会出错,即有99%以上的把握认为“爱好该项运动与性别有关”,故D正确,A,B,C错误,故选ABC.
答案ABC
3.(2019重庆高二期末)下列说法中,正确说法的个数是( )
①在用2×2列联表分析两个分类变量A与B之间的关系时,χ2越大,说明“A与B有关系”的可信度越大;
②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;
③已知两个变量具有线性相关关系,其回归直线方程为y^=a+bx,若b=2,x=1,y=3,则a=1.
A.0 B.1 C.2 D.3
解析对于①,χ2越大,说明“A与B有关系”的可信度越大,①正确;
对于②,以模型y=cekx去拟合一组数据时,设z=ln y,由y=cekx,两边取对数,可得ln y=ln cekx=ln c+ln ekx=ln c+kx,令z=ln y,可得z=ln c+kx,又z=0.3x+4,∴ln c=4,k=0.3,c=e4,②正确;
对于③,根据回归直线方程为y^=a+bx,b=2,x=1,y=3,∴a=y-bx=3-2×1=1,∴③正确;
综上,正确的命题为①②③,共3个.
故选D.
答案D
4.(2019安徽泗县第一中学高二月考)在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)
男
女
正常
73
117
色弱
7
3
你能在犯错误的概率不超过 的前提下认为“是否色弱与性别有关”.?
解析由题意得列联表为
男
女
总计
正常
73
117
190
色弱
7
3
10
总计
80
120
200
由列联表中的数据可得χ2=200×(73×3-117×7)280×120×10×190≈3.947>3.841,
所以在犯错误的概率不超过0.05的前提下可认为“是否色弱与性别有关”.
答案0.05
5.(2019福建莆田八中高二期中)某学生对其亲属30人的饮食习惯进行了一次调查,2×2列联表如下:
主食蔬菜
主食肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
有 的把握认为其亲属的饮食习惯与年龄有关.?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
P(χ2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
解析由题可得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=30×(2×4-8×16)220×10×12×18=10,所以6.635<χ2<10.828,
所以有99%的把握认为其亲属的饮食习惯与年龄有关.
答案99%
6.(2019天津南开中学高二期末)某校为了了解学生对电子竞技的兴趣,从该校高二年级的学生中随机抽取了100人进行检查,已知这100人中有50名男生对电子竞技有兴趣,而对电子竞技没兴趣的学生人数与对电子竞技有兴趣的女生人数一样多,且女生中有58的人对电子竞技有兴趣.
(1)在被抽取的女生中有6名高二(20)班的学生,其中有3名女生对电子竞技有兴趣,先从这6名学生中随机抽取3人,求其中至少有2人对电子竞技有兴趣的概率;
(2)完成下面的2×2列联表,并判断是否有99%的把握认为“对电子竞技的兴趣与性别有关”.
有兴趣
没兴趣
总计
男生
女生
总计
参考数据:
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
解(1)从6名学生中随机抽取3人,共有C63=20种不同的抽取方案;抽到的3人中至少有2人对电子竞技有兴趣的方案数有C32C31+C33=10种,
∴抽取3人中至少有2人对电子竞技有兴趣的概率为1020=12.
(2)设对电子竞技没兴趣的学生人数为x,
∵对电子竞技没兴趣的学生人数与对电子竞技有兴趣的女生人数一样多,
∴2x+50=100,解得x=25.
又女生中有58的人对电子竞技有兴趣,
∴女生人数为8x5=40.
男生人数为60,其中有60-50=10人对电子竞技没兴趣.
得到下面列联表
有兴趣
没兴趣
总计
男生
50
10
60
女生
25
15
40
总计
75
25
100
χ2=100×(50×15-10×25)260×40×75×25≈5.556<6.635,
∴没有99%的把握认为“对电子竞技的兴趣与性别有关”.
素养培优练
(2019海南高二期末)某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示:
组别
[40,50)
[50,60)
[60,70)
男
2
3
5
女
0
5
10
组别
[70,80)
[80,90)
[90,100]
男
15
18
12
女
10
7
13
(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请判断能否在犯错误的概率不超过0.05的前提下,认为是否为“环保关注者”与性别有关?
(2)若问卷得分不低于80分的人称为“环保达人”.视频率为概率.
①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又有女“环保达人”的概率;
②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得两次抽奖活动;其他参与的市民获得一次抽奖活动.每次抽奖获得红包的金额和对应的概率如下表:
红包金额(单位:元)
10
20
概率
34
14
现某市民要参加此次问卷调查,记X(单位:元)为该市民参加问卷调查获得的红包金额,求X的分布列及数学期望.
附表及公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解(1)由图中表格可得2×2列联表如下:
非“环保关注者”
是“环保关注者”
总计
男
10
45
55
女
15
30
45
总计
25
75
100
将2×2列联表中的数据代入公式得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(45×15-30×10)225×75×55×45
≈3.030<3.841,
所以在犯错误的概率不超过0.05的前提下,不能认为是否为“环保关注者”与性别有关.
(2)视频率为概率,用户为男“环保达人”的概率为35,为女“环保达人”的概率为25,
①抽取的3名用户中既有男“环保达人”又有女“环保达人”的概率为
P=1-253-353=1825.
该市民是“环保达人”的概率为12.
②X可能的取值为10,20,30,40.
P(X=10)=12×34=38,
P(X=20)=12×14+12×34×34=1332,
P(X=30)=12×C21×14×34=316,
P(X=40)=12×14×14=132,
所以X的分布列为
X
10
20
30
40
P
38
1332
316
132
E(X)=10×38+20×1332+30×316+40×132=754.