4.3.2 独立性检验(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册

文档属性

名称 4.3.2 独立性检验(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册
格式 zip
文件大小 7.6MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2025-09-18 06:46:01

文档简介

(共39张PPT)
4.3 统计模型
4.3.2 独立性检验
探究点一 2×2列联表
探究点二 独立性检验在实际中的应用
◆课前预习
◆课中探究
◆课堂评价
◆备课素材
【学习目标】
1.理解独立性检验的基本思想及其实施步骤;
2.能利用 列联表探讨两个随机事件的关系;
3.了解 的含义及其应用;
4.通过对数据的处理来提高解决实际问题的能力.
知识点一 2×2列联表及随机事件的概率
1.定义:如果随机事件与 的样本数据整理成如下的表格形式.
总计
总计
因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为
列联表.
2. 列联表中随机事件的概率:
如上表,记 ,则由表可知:
(1)事件发生的概率可估计为 ;
(2)事件发生的概率可估计为 ;
(3)事件发生的概率可估计为 .
知识点二 独立性检验
1.计算公式:_ _________________,其中 _____________.
2.定义:任意给定一个 (称为____________,通常取为, 等),可以
找到满足条件 的数(称为显著性水平 对应的________).如
果根据样本数据算出的值后,发现 成立,就称在犯错误的概率不超过
___的前提下,可以认为与不独立(也称为与 有关);或说有______的把
握认为与有关.若 成立,就称不能得到前述结论.这一过程通常称为独
立性检验.
显著性水平
分位数
3.统计学中,常用的显著性水平 以及对应的分位数 如下表所示.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)的大小是判断事件与 是否相关的统计量.( )

(2)事件与 独立性检验无关,即两个事件互不影响.( )
×
(3)应用独立性检验对两个事件间的关系作出的推断一定是正确的.( )
×
探究点一 2×2列联表
例1 某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位
市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分
(满分:100分)数据,统计结果如下表所示.
组别
男 2 3 5 15 18 12
女 0 5 10 10 7 13
若规定问卷得分不低于70分的市民为“环保关注者”,根据以上数据写出一个
列联表.
解:根据题中数据可得 列联表如下.
非“环保关注者” “环保关注者” 总计
男 10 45 55
女 15 30 45
总计 25 75 100
变式 已知下表是一个列联表,则表中, 的值分别为( )
总计
21
25 33
总计 106
B
A.96,94 B.60,52 C.52,54 D.50,52
[解析] 由,得,由,得 ,则
,.所以表中, 的值分别为
60,52.故选B.
[素养小结]
作 列联表时需注意:
(1) 列联表应该是4行4列,对涉及的变量要分清类别.
(2)计算时要准确无误.
探究点二 独立性检验在实际中的应用
例2 某市为了调研本市学生的体质情况,按性别采用分层抽样的方法进行调查,
得到体质检测样本的统计数据(单位:人)如下.
优秀 良好 一般 不及格
男生 100 200 780 120
女生 120 200 520 120
(1)记体质检测结果为优秀、良好或一般的学生为体质达标,否则为体质不
达标.根据所给数据,完成下面的 列联表.
体质达标 体质不达标 总计
男生 ______ _____ ______
女生 _____ _____ _____
总计 ______ _____ ______
解: 列联表如下:
体质达标 体质不达标 总计
男生 1080 120 1200
女生 840 120 960
总计 1920 240 2160
(2)依据(1)的统计结果判断,是否有 的把握认为该市学生的体质是否
达标与性别有关?
附:, .
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
解: 由(1)知 ,因为
,而且查表可得,由于 ,所以
没有 的把握认为该市学生的体质是否达标与性别有关.
变式 某中学对高二甲、乙两个同类班级进行“加强语文阅读理解训练对提高数
学应用题得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),
乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学
生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试
的平均成绩(均取整数)如下表所示.
60分以下
甲班(人数) 3 11 6 12 18
乙班(人数) 7 8 10 10 15
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分析估计两个班级的优秀率;
解:由题意知,甲、乙两个班级均有50名学生,
甲班学生的优秀人数为30,优秀率为 ,
乙班学生的优秀人数为25,优秀率为 ,
所以甲、乙两个班级的优秀率分别为和 .
(2)由以上统计数据填写下面的 列联表,并根据表中数据,判断能否有
的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助.
优秀 非优秀 总计
甲班
乙班
总计
解:根据题中数据可得 列联表如下.
优秀 非优秀 总计
甲班 30 20 50
乙班 25 25 50
总计 55 45 100

因为,而且查表可得 ,
由于,所以没有 的把握认为加强语文阅读理解训练对提高数
学应用题得分率有帮助.
[素养小结]
独立性检验的步骤:
(1)列出 列联表.
(2)利用公式,其中 ,计算随机变
量 .
(3)发现, ,就推断“与 有关”,这种推断犯错误的概
率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“与
有关”,或者在样本数据中没有发现足够的证据支持结论“与 有关”.
1.用独立性检验考查两个事件,是否有关时,随机变量 的值( )
A
A.越大,“与 有关”成立的可能性越大
B.越大,“与 有关”成立的可能性越小
C.越小,“与 有关”成立的可能性越大
D.与“与 有关”成立的可能性无关
[解析] 用独立性检验考查两个事件A,B是否有关时,随机变量 的值越大,说
明“A与B有关”成立的可能性越大,由此可知A正确.故选A.
2.[2024·江西九江高二期末]某校随机调查了100名高中生是否喜欢篮球,按照男
女区分得到列联表,经计算得 .根据独立性检验的相关知识对照
下表,则认为是否喜欢篮球与性别有关这一判断犯错误的概率为( )
0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828
B
A. B. C. D.
[解析] , 在犯错误的概率不超过 的前提下
可以认为是否喜欢篮球与性别有关,故选B.
3.下面是一个列联表,则表中, 的值分别为( )
总计
21 73
7 20 27
总计 41 100
C
A.94,96 B.52,40 C.52,59 D.59,52
[解析] 由题意可知,所以,又,所以 .故选C.
4.[2023·山东滨州高二期末]手机给人们的生活带来便捷,但同时也对中学生的
生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就是否使用
手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下
列联表,则下列说法正确的是( )
成绩优秀 成绩不优秀 总计
不用手机 40 10 50
使用手机 5 45 50
总计 45 55 100
(参考公式:,其中 )
A.在犯错误的概率不超过0.01的前提下认为是否使用手机与学习成绩无关
B.在犯错误的概率不超过0.1的前提下认为是否使用手机与学习成绩无关
C.有 的把握认为是否使用手机对学习成绩有影响
D.没有 的把握认为是否使用手机对学习成绩有影响

[解析] 由列联表中的数据,得 ,所以在
犯错误的概率不超过0.01的前提下,可以认为是否使用手机与学习成绩有关,
即有 的把握认为是否使用手机对学习成绩有影响,故A,B错误,C正确,
D错误.故选C.
独立性检验的注意事项:
1.在列联表中注意事件的对应及有关值的确定,避免混乱.
2.在判断两个随机事件之间的关系的可靠性时,一般利用随机变量 来确定.
3.在实际问题中,独立性检验的结论仅仅是一种数字关系,得到的判断也可能出错.
比如,在推测吸烟与患肺癌是否有关时,通过收集、整理、分析数据,我们得到“吸
烟与患肺癌有关”的结论并且有超过 的把握说明吸烟与患肺癌有关,或者说这
个结论出错的概率为0.01以下.但实际上一个人吸烟也不一定会患肺癌,患肺癌也
不一定是由吸烟引起的,这是数学中的统计思维与确定性思维差异的反映,但我们
可以利用统计分析的结果去预测实际问题的结果.
4.把计算出的的值与相关的分位数作比较,确定出“与 有关系”的把握.
1.利用进行独立性检验,可以对推断的正确性的概率作出估计,样本容量 越
大,这个估计值越准确,如果抽取的样本容量很小,那么利用 进行独立性检
验的结果就不具有可靠性.
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.
(1)绘制 列联表.
总计
总计
,并且 为样本容量.
(2)计算卡方数值,,其中 ,该公
式较准确地刻画了两个事件相关性的可靠程度.
(3)与显著性水平对应的分位数作比较.
(4)若,就称在犯错误的概率不超过 的前提下,可以认为与 不独
立(也称与有关),或者说有 的把握认为与有关;若 ,则说
没有 的把握认为与 有关.
例1 读书可以使人保持思想活力,让人得到
智慧启发,让人滋养浩然正气.书籍是文化的
重要载体,读书是承继文化的重要方式.某地
区为了解学生课余时间的读书情况,随机抽
取了 名学生进行调查,根据调查得到的学生
日均课余读书时间绘制成如图所示的频率分
布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书
时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于
10分钟的有10人.
(1)求, 的值;
解:,解得 ,所以
.
(2)根据已知条件完成下面的列联表,并判断是否有 的把握认为是否
为“读书之星”与性别有关;
非读书之星 读书之星 总计
男生
女生 10 55
总计
解:因为,所以“读书之星”有(人),从而 列联表
如下表所示.
非读书之星 读书之星 总计
男生 30 15 45
女生 45 10 55
总计 75 25 100
将 列联表中的数据代入公式计算得
,
因为,所以没有 的把握认为是否为“读书之星”与性别有关.
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中随机抽取3名学
生,每次抽取1名,已知每个人是否被抽到互不影响,记抽取的“读书之星”人数为随
机变量,求 的分布列和期望.
附:,其中 .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:将频率视为概率,可得从该地区学生中抽取一名学生,这名学生是“读书之星”
的概率为 .
由题意可知的取值范围为,1,2,,且 ,
所以 ,
,
,
,
所以 的分布列为
0 1 2 3
.
例2 [2024·四川成都七中高二期末]某校团委对“是否喜欢吃水果和学生性别是
否有关”进行了一次调查,其中被调查的女生人数是男生人数的 ,男生喜欢吃
水果的人数占被调查的男生人数的 ,女生喜欢吃水果的人数占被调查的女生人
数的.若有 的把握认为是否喜欢吃水果和学生性别有关,则被调查的男生至
少有( )
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
B
A.12人 B.18人 C.24人 D.30人
[解析] 设被调查的男生人数为,则被调查的女生人数为,得到 列联表如
下:
喜欢吃水果 不喜欢吃水果 总计
男生
女生
总计
则,由题得,解得 ,
又因为男、女生人数均为整数,所以被调查的男生至少有18人.故选B.4.3.2 独立性检验
【课前预习】
知识点二
1. a+b+c+d
2.显著性水平 分位数 α 1-α
诊断分析
(1)√ (2)× (3)×
【课中探究】
探究点一
例1 解:根据题中数据可得2×2列联表如下.
非“环保关注者” “环保关注者” 总计
男 10 45 55
女 15 30 45
总计 25 75 100
变式 B [解析] 由c+25=33,得c=8,由e+33=106,得e=73,则b=e-21=73-21=52,a=b+c=52+8=60.所以表中a,b的值分别为60,52.故选B.
探究点二
例2 解:(1)2×2列联表如下:
体质达标 体质不达标 总计
男生 1080 120 1200
女生 840 120 960
总计 1920 240 2160
(2)由(1)知χ2===3.375,因为1-95%=5%,而且查表可得P(χ2≥3.841)=0.05,由于3.375<3.841,所以没有95%的把握认为该市学生的体质是否达标与性别有关.
变式 解:(1)由题意知,甲、乙两个班级均有50名学生,
甲班学生的优秀人数为30,优秀率为=60%,
乙班学生的优秀人数为25,优秀率为=50%,
所以甲、乙两个班级的优秀率分别为60%和50%.
(2)根据题中数据可得2×2列联表如下.
优秀 非优秀 总计
甲班 30 20 50
乙班 25 25 50
总计 55 45 100
χ2==≈1.010,
因为1-95%=5%,而且查表可得P(χ2≥3.841)=0.05,
由于1.010<3.841,所以没有95%的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助.
【课堂评价】
1.A [解析] 用独立性检验考查两个事件A,B是否有关时,随机变量χ2的值越大,说明“A与B有关”成立的可能性越大,由此可知A正确.故选A.
2.B [解析] ∵χ2=8.133∈(7.879,10.828),∴在犯错误的概率不超过0.5%的前提下可以认为是否喜欢篮球与性别有关,故选B.
3.C [解析] 由题意可知a+21=73,所以a=52,又a+7=b,所以b=59.故选C.
4.C [解析] 由列联表中的数据,得χ2=≈49.49>6.635,所以在犯错误的概率不超过0.01的前提下,可以认为是否使用手机与学习成绩有关,即有99%的把握认为是否使用手机对学习成绩有影响,故A,B错误,C正确,D错误.故选C.4.3.2 独立性检验
【学习目标】
1.理解独立性检验的基本思想及其实施步骤;
2.能利用2×2列联表探讨两个随机事件的关系;
3.了解χ2的含义及其应用;
4.通过对数据的处理来提高解决实际问题的能力.
◆ 知识点一 2×2列联表及随机事件的概率
1.定义:如果随机事件A与B的样本数据整理成如下的表格形式.
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
2.2×2列联表中随机事件的概率:
如上表,记n=a+b+c+d,则由表可知:
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
◆ 知识点二 独立性检验
1.χ2计算公式:χ2=          ,其中n=       .
2.定义:任意给定一个α(称为      ,通常取为0.05,0.01等),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的    ).如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错误的概率不超过    的前提下,可以认为A与B不独立(也称为A与B有关);或说有    的把握认为A与B有关.若χ23.统计学中,常用的显著性水平α以及对应的分位数k如下表所示.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)χ2的大小是判断事件A与B是否相关的统计量. (  )
(2)事件A与B独立性检验无关,即两个事件互不影响. (  )
(3)应用独立性检验对两个事件间的关系作出的推断一定是正确的. (  )
◆ 探究点一 2×2列联表
例1 某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如下表所示.
组别 [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100]
男 2 3 5 15 18 12
女 0 5 10 10 7 13
若规定问卷得分不低于70分的市民为“环保关注者”,根据以上数据写出一个2×2列联表.
变式 已知下表是一个2×2列联表,则表中a,b的值分别为 (  )
y1 y2 总计
x1 b 21 e
x2 c 25 33
总计 a d 106
A.96,94 B.60,52
C.52,54 D.50,52
[素养小结]
作2×2列联表时需注意:
(1)2×2列联表应该是4行4列,对涉及的变量要分清类别.
(2)计算时要准确无误.
◆ 探究点二 独立性检验在实际中的应用
例2 某市为了调研本市学生的体质情况,按性别采用分层抽样的方法进行调查,得到体质检测样本的统计数据(单位:人)如下.
优秀 良好 一般 不及格
男生 100 200 780 120
女生 120 200 520 120
(1)记体质检测结果为优秀、良好或一般的学生为体质达标,否则为体质不达标.根据所给数据,完成下面的2×2列联表.
体质达标 体质不达标 总计
男生
女生
总计
(2)依据(1)的统计结果判断,是否有95%的把握认为该市学生的体质是否达标与性别有关
附:χ2=,n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01 0.001
k 2.706 3.841 6.635 10.828
变式 某中学对高二甲、乙两个同类班级进行“加强语文阅读理解训练对提高数学应用题得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示.
60分 以下 61~ 70分 71~ 80分 81~ 90分 91~ 100分
甲班 (人数) 3 11 6 12 18
乙班 (人数) 7 8 10 10 15
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分析估计两个班级的优秀率;
(2)由以上统计数据填写下面的2×2列联表,并根据表中数据,判断能否有95%的把握认为加强语文阅读理解训练对提高数学应用题得分率有帮助.
优秀 非优秀 总计
甲班
乙班
总计
[素养小结]
独立性检验的步骤:
(1)列出2×2列联表.
(2)利用公式χ2=,其中n=a+b+c+d,计算随机变量χ2.
(3)发现χ2≥k,P(χ2≥k)=α,就推断“A与B有关”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“A与B有关”,或者在样本数据中没有发现足够的证据支持结论“A与B有关”.
1.用独立性检验考查两个事件A,B是否有关时,随机变量χ2的值 (  )
A.越大,“A与B有关”成立的可能性越大
B.越大,“A与B有关”成立的可能性越小
C.越小,“A与B有关”成立的可能性越大
D.与“A与B有关”成立的可能性无关
2.[2024·江西九江高二期末] 某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到2×2列联表,经计算得χ2=8.133.根据独立性检验的相关知识对照下表,则认为是否喜欢篮球与性别有关这一判断犯错误的概率为 (  )
α=P(χ2≥k) 0.05 0.01 0.005 0.001
k 3.841 6.635 7.879 10.828
A.5% B.0.5%
C.1% D.0.1%
3.下面是一个2×2列联表,则表中a,b的值分别为 (  )
y1 y2 总计
x1 a 21 73
x2 7 20 27
总计 b 41 100
A.94,96 B.52,40
C.52,59 D.59,52
4.[2023·山东滨州高二期末] 手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就是否使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下2×2列联表,则下列说法正确的是 (  )
成绩优秀 成绩不优秀 总计
不用手机 40 10 50
使用手机 5 45 50
总计 45 55 100
A.在犯错误的概率不超过0.01的前提下认为是否使用手机与学习成绩无关
B.在犯错误的概率不超过0.1的前提下认为是否使用手机与学习成绩无关
C.有99%的把握认为是否使用手机对学习成绩有影响
D.没有99%的把握认为是否使用手机对学习成绩有影响4.3.2 独立性检验
1.C [解析] 因为χ2=7.213>6.635,所以有99%的把握认为两个随机事件有关.故选C.
2.C [解析] 因为在犯错误的概率不超过0.01的前提下认为这个结论是成立的,所以有99%的把握认为“高血压与肥胖有关”,只是该结论成立的可能性为99%,与有多少个人患高血压无关,更谈不上概率,故A,B,D不正确,C正确.故选C.
3.B [解析] 由表可知,女生有21人,其中经常锻炼的有7人,频率为=,男生有19人,其中经常锻炼的有11人,频率为,因为>,所以依据频率稳定于概率的原理,可以认为学生是否经常锻炼与性别有关,故①正确,②错误;因为χ2=≈2.431<3.841,所以没有95%的把握认为学生是否经常锻炼与性别有关,故③错误,④正确.故选B.
4.C [解析] 在两个随机事件的2×2列联表中,|ad-bc|的值越小,两个随机事件有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,所以当m=14时,A与B有关的可能性最小.故选C.
5.C [解析] ∵在全部105人中随机抽取1人,其成绩优秀的概率为,∴成绩优秀的人数为105×=30,∴非优秀的人数为105-30=75,∴c=30-10=20,b=75-30=45,∴χ2==≈6.109>3.841,∴有95%的把握认为成绩是否优秀与班级有关.故选C.
6.A [解析] 因为χ2=2.974<3.841,所以没有95%的把握认为两个随机事件有关,因为χ2=2.974>2.706,所以有90%的把握认为两个随机事件有关.故选A.
7.D [解析] 对于选项A,B,C都有|ad-bc|=|10-12|=2,对于选项D,有|ad-bc|=|15-8|=7,显然7>2.故选D.
8.ABD [解析] 对于A,两个随机事件的2×2列联表中,对角线上数据的乘积相差越大,说明两个随机事件有关系成立的可能性就越大,故A正确;对于B,对随机事件X与Y的随机变量χ2来说,χ2的值越小,“X与Y有关”的可信度越低,故B正确;对于C,从独立性检验可知,有95%的把握认为秃顶与患心脏病有关,不是说某人秃顶,那么他有95%的可能患有心脏病,故C错误;对于D,从独立性检验可知,有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,故D正确.故选ABD.
9.ACD [解析] 由题知,280=(280+q),p=(120+p),解得q=120,p=180,故A正确.补全2×2列联表如下:
男生 女生 总计
喜欢 280 180 460
不喜欢 120 120 240
总计 400 300 700
所以从该中学随机选一名学生,该学生喜欢阅读的概率P=≈65.7%,故B错误.χ2=≈7.609,因为6.635<7.609<10.828,所以有99%的把握认为学生是否喜欢阅读与性别有关,没有99.9%的把握认为学生是否喜欢阅读与性别有关,故C,D正确.故选ACD.
10.有 [解析] 由题意可得2×2列联表如下:
英语成绩及格 英语成绩不及格 总计
语文成绩及格 20 4 24
语文成绩不及格 5 11 16
总计 25 15 40
因为χ2=≈11.111>6.635,所以有99%的把握认为学生的英语成绩与语文成绩有关.
11.① [解析] ∵χ2≈3.918>3.841,∴有95%的把握认为“这种血清能起到预防感冒的作用”.故填①.
12.9 [解析] 由题意知χ2≥6.635,即=≥6.635,又因为a>5且15-a>5,a∈Z,所以a=9.
13.解:(1)由题得,2×2列联表如下.
优秀 非优秀 总计
女生 80 20 100
男生 70 30 100
总计 150 50 200
(2)因为χ2=≈2.667<2.706,所以没有90%的把握认为测试成绩是否优秀与性别有关.
14.解:(1)由2(a+2a+4a+0.2+4a+a)=1,解得a=0.025.
(2)抽取的优质棉的样本数为120×2(4a+a)=120×2×0.125=30,则抽取的非优质棉的样本数为120-30=90,则2×2列联表如下:
A试验区 B试验区 总计
优质棉 10 20 30
非优质棉 60 30 90
总计 70 50 120
因为χ2=≈10.286<10.828,
所以没有99.9%的把握认为是否为优质棉与A,B两个试验区有关.
(3)X的取值范围为{0,1,2,3},
则P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=.
15.A [解析] 由题意得2×2列联表如下,
A 总计
B 10 21 31
c 35-c 35
总计 10+c 56-c 66
则χ2=.当c=3时,χ2≈5.831>3.841;当c=5时,χ2≈3.024<3.841;当c=6时,χ2≈2.045<3.841;当c=7时,χ2≈1.292<3.841.故选A.
16.解:(1)由题意,2×2列联表如下:
喜欢 不喜欢 总计
男生 75 25 100
女生 55 45 100
总计 130 70 200
因为χ2=≈8.791>6.635,
所以能在犯错误的概率不超过0.01的前提下,认为该校学生是否喜欢羽毛球运动与性别有关.
(2)由列联表可知,该校学生喜欢羽毛球运动的频率为=,所以随机变量X~B,
所以P(X=m)=.
要使P(X=m)取得最大值,
则需
解得≤m≤,又m∈N*,所以当m=20时,P(X=m)取得最大值.4.3.2 独立性检验
一、选择题
1.若由一个2×2列联表中的数据计算得到χ2=7.213,则有 (  )
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.90%的把握认为两个随机事件有关
B.95%的把握认为两个随机事件有关
C.99%的把握认为两个随机事件有关
D.99.9%的把握认为两个随机事件有关
2.在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是 (  )
A.在100个高血压患者中一定有肥胖的人
B.在100个肥胖的人中至少有99人患有高血压
C.在100个高血压患者中可能没有肥胖的人
D.肥胖的人至少有99%的概率患有高血压
3.为了了解学生是否经常锻炼与性别的关系,某校随机抽取了40名学生进行调查,按照性别和锻炼情况整理出如下的2×2列联表.
不经常锻炼 经常锻炼 总计
女生 14 7 21
男生 8 11 19
总计 22 18 40
注:χ2=,n=a+b+c+d.
根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为学生是否经常锻炼与性别有关;
②依据频率稳定于概率的原理,可以认为学生是否经常锻炼与性别无关;
③有95%的把握认为学生是否经常锻炼与性别有关;
④没有95%的把握认为学生是否经常锻炼与性别有关.
其中正确结论的序号是 (  )
A.①③ B.①④
C.②③ D.②④
4.两个随机事件A,B的2×2列联表如下:
B 总计
A 10 18 28
m 26 m+26
总计 10+m 44 54+m
则当m取下面何值时,A与B有关的可能性最小 (  )
A.8 B.9
C.14 D.19
5.有甲、乙两个班级进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩,得到如下表所示的列联表.
优秀 非优秀 总计
甲班 10 b
乙班 c 30
总计 105
已知在全部105人中随机抽取1人,其成绩优秀的概率为,则下列说法正确的是 (  )
A.c的值为30,b的值为35
B.c的值为15,b的值为50
C.根据列联表中的数据,有95%的把握认为成绩是否优秀与班级有关
D.根据列联表中的数据,没有95%的把握认为成绩是否优秀与班级有关
6.[2024·辽宁营口高中高二月考] 根据两个随机事件的观测数据,计算得到χ2=2.974,则(  )
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.有90%的把握认为两个随机事件有关
B.两个随机事件有关,这个结论犯错误的概率不超过0.05
C.没有90%的把握认为两个随机事件有关
D.两个随机事件无关,这个结论犯错误的概率不超过0.05
7.假设随机事件A与B的数据如下表:
B 总计
A a b a+b
c d c+d
总计 a+c b+d a+b+c+d
对于以下数据,能说明A与B有关系的可能性最大的一组为 (  )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=3,b=2,c=4,d=5
8.(多选题)下列有关独立性检验的四个说法中正确的是 (  )
A.两个随机事件的2×2列联表中,对角线上数据的乘积相差越大,说明两个随机事件有关系成立的可能性就越大
B.对随机事件X与Y的随机变量χ2来说,χ2的值越小,“X与Y有关”的可信度越低
C.从独立性检验可知,有95%的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病
D.从独立性检验可知,有99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关
9.(多选题)某中学为了解学生是否喜欢阅读与性别的关系,为此对学生是否喜欢阅读进行普查,得到下表.
男生 女生 总计
喜欢 280 p 280+p
不喜欢 q 120 120+q
总计 280+q 120+p 400+p+q
附:χ2=,n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01 0.001
k 2.706 3.841 6.635 10.828
已知男生喜欢阅读的人数占男生人数的,女生喜欢阅读的人数占女生人数的,则下列说法正确的是 (  )
A.q=120,p=180
B.从该中学随机选一名学生,该学生有90%的可能喜欢阅读
C.有99%的把握认为学生是否喜欢阅读与性别有关
D.没有99.9%的把握认为学生是否喜欢阅读与性别有关
二、填空题
10.某中学统计了一个班40名学生中每名学生的英语成绩和语文成绩,并制成了一个不完整的2×2列联表,如下:
英语成绩及格 英语成绩不及格 总计
语文成绩及格 20
语文成绩不及格 11
总计 25 40
则    (填“有”或“没有”)99%的把握认为学生的英语成绩与语文成绩有关.
11.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用该血清的人与另外500名未使用该血清的人一年中的感冒次数进行统计,并利用2×2列联表计算得χ2≈3.918,对此四名同学给出了以下说法:
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,则他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
其中正确说法的序号是    .
12.有两个随机事件X和Y,其中一组统计数据的2×2列联表如下.
Y 总计
X a 15-a 15
20-a 30+a 50
总计 20 45 65
其中a,15-a均为大于5的整数,则当a=    时,在犯错误的概率不超过0.01的前提下认为“X与Y有关”.
三、解答题
13.某校组织了团史知识测试,测试成绩分为优秀与非优秀两个等级.随机抽查了高一年级、高二年级各100名学生的测试成绩,统计数据如下表.
高一年级成绩
优秀 非优秀
女生 36 14
男生 32 18
高二年级成绩
优秀 非优秀
女生 44 6
男生 38 12
(1)根据给出的数据,完成下面的2×2列联表:
优秀 非优秀 总计
女生
男生
总计
(2)根据(1)中列联表,判断能否有90%的把握认为测试成绩是否优秀与性别有关
附:χ2=,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01
k 2.706 3.841 6.635
14.[2023·江苏徐州高二期末] 某棉纺厂为了解一批棉花的质量,在该批棉花中随机抽取了容量为120的样本,测量每个样本棉花的纤维长度(单位:mm,纤维长度是棉花质量的重要指标),所得数据均在区间[20,32]内,从20开始,组距为2确定计数区间,制作成如图所示的频率分布直方图,其中纤维长度不小于28 mm的棉花为优质棉.
(1)求频率分布直方图中a的值.
(2)已知抽取的容量为120的样本棉花产自于A,B两个试验区,部分数据如下:
A试验区 B试验区 总计
优质棉 10
非优质棉 30
总计 120
将2×2列联表补充完整.判断能否有99.9%的把握认为是否为优质棉与A,B两个试验区有关
(3)若从这批120个样本棉花中随机抽取3个,其中有X个是优质棉,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
15.两个随机事件A,B的样本频数如下表,其中a=10,b=21,c+d=35.若有95%的把握认为A与B有关,则c的值可以为 (  )
A
B a b
c d
A.3 B.7
C.5 D.6
16.[2024·海南三沙高二期末] 某校准备开设羽毛球兴趣班,在全校范围内采用简单随机抽样的方法分别抽取了男生和女生各100名作为样本,调查学生是否喜欢羽毛球运动,经统计,得到了如图所示的等高堆积条形图.
(1)根据等高堆积条形图,填写下列2×2列联表,能否在犯错误的概率不超过0.01的前提下,认为该校学生是否喜欢羽毛球运动与性别有关
喜欢 不喜欢 总计
男生
女生
总计
(2)已知该校男生与女生人数相同,将样本的频率视为概率,现从全校学生中随机抽取30名学生,设其中喜欢羽毛球运动的学生人数为X,求P(X=m)取得最大值时m(m∈N*)的值.
附:
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
参考公式:
χ2=,其中n=a+b+c+d.