人教B版(2019)高中数学 选择性必修第二册 4.3.2 独立性检验课件(72张)+学案

文档属性

名称 人教B版(2019)高中数学 选择性必修第二册 4.3.2 独立性检验课件(72张)+学案
格式 zip
文件大小 1.4MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2020-12-09 13:16:29

文档简介

4.3.2 独立性检验
学习目标 1.了解2×2列联表、随机变量χ2的意义.2.理解独立性检验中P(χ2≥k)的具体含义.3.掌握独立性检验的方法和步骤,并能解决实际问题.
知识点一 2×2列联表及随机事件的概率
1.2×2列联表:如果随机事件A与B的样本数据如下表格形式:
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
2.2×2列联表中随机事件的概率:
如上表,记n=a+b+c+d,则
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
知识点二 独立性检验
1.定义:在2×2列联表中,定义随机变量
χ2=,任意给定α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数),
(1)若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关),或说有1-α的把握认为A与B有关;
(2)若χ2这一过程通常称为独立性检验.
2.统计学中,常用的显著性水平α以及对应的分位数k如下表所示.
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
思考 若χ2答案 不对,若χ21.2×2列联表只有4个格子.( × )
2.χ2的大小是判断事件A与B是否相关的统计量.( √ )
3.当χ2≥3.841时,有95%的把握说事件A与B有关.( √ )
一、2×2列联表
例1 “一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人口逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表.
热烈参与者
非热烈参与者
总计

140

55
总计
解 (1)以200人中“热烈参与者”的频率作为概率,
可得该市“热烈参与者”的人数约为20
000×=4
000.
(2)由题意可得2×2列联表如下:
热烈参与者
非热烈参与者
总计

35
105
140

5
55
60
总计
40
160
200
反思感悟 列2×2列联表的关注点
(1)作2×2列联表时,注意应该是4行4列,计算时要准确无误.
(2)作2×2列联表时,关键是对涉及的变量分清类别.
跟踪训练1 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.
(1)请根据以上数据作出饮食习惯与年龄的列联表;
(2)求年龄在六十岁以上且饮食以肉类为主的人群的概率.
解 (1)饮食习惯与年龄的2×2列联表如下:
年龄在六十岁以上
年龄在六十岁以下
总计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
总计
70
54
124
(2)由列联表得,年龄在六十岁以上且饮食以肉类为主的人群的概率为.
二、独立性检验
命题角度1 两个变量的独立性检验
例2 某人研究中学生的性别与成绩、视力这2个变量的关系,随机抽查52名中学生,得到统计数据如表1与表2,则与性别有关联的可能性较大的变量是________.
表1
   成绩
性别
不及格
及格
总计

6
14
20

10
22
32
总计
16
36
52
表2
   
视力
性别


总计

4
16
20

12
20
32
总计
16
36
52
答案 视力
解析 因为χ=
=,
χ==,
所以χ>χ,故视力与性别有关联的可能性较大.
命题角度2 独立性检验的实际应用问题
例3 某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:χ2=.
α=P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解 (1)由调查数据,男顾客中对该商场服务满意的频率为=0.8,
因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的频率为=0.6,
因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)χ2=≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
(学生)
反思感悟 独立性检验的应用需要注意的问题
(1)χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.
(2)判断时把计算结果与临界值比较,其值越大,有关的可信度越高.
跟踪训练2 为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:
患胃病
未患胃病
总计
生活不规律
60
260
320
生活有规律
20
200
220
总计
80
460
540
根据以上数据判断40岁以上的人患胃病与生活是否有规律有关吗?
解  由公式得χ2=≈9.638.
∵9.638>6.635,
∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.
1.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有(  )
A.①②③
B.②④⑤
C.②③④⑤
D.①②③④⑤
答案 B
解析 独立性检验是判断两个随机事件是否有关系的方法,而①③都是求概率问题,不能用独立性检验.
2.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是__________________.
答案 男正教授人数,女正教授人数,男副教授人数,女副教授人数
解析 由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.
3.下面2×2列联表中:
B
总计
A
a
21
70
5
25
30
总计
b
46
a,b的值分别为________.
答案 49,54
解析 ∵a+21=70,∴a=49.
又∵a+5=b,∴b=54.
4.下面2×2列联表中的χ2的值为________(结果保留3位小数).
B
总计
A
5
10
15
22
13
35
总计
27
23
50
答案 3.685
解析 χ2=≈3.685.
5.若由一个2×2列联表中的数据计算得χ2=4.013,那么有________的把握认为两个随机事件之间有关系.
答案 95%
解析 因为χ2=4.013>3.841,查阅χ2表知有95%的把握认为两个随机事件之间有关系.
1.知识清单:
(1)2×2列联表.
(2)独立性检验的应用.
2.方法归纳:转化法.
3.常见误区:独立性检验原理理解错误.
1.下面是一个2×2列联表:
Y
总计
X
a
11
63
b
15
23
总计
60
26
则表中a,b处的值分别为(  )
A.74,38
B.52,10
C.52,8
D.8,52
答案 C
解析 ∵a+11=63,b+15=23,∴a=52,b=8.
2.下列选项中,哪一个χ2的值可以有99%以上的把握认为“A与B有关系”(  )
A.χ2=2.715
B.χ2=3.910
C.χ2=6.165
D.χ2=7.014
答案 D
解析 ∵7.014>6.635,查阅χ2表知有99%的把握认为两个随机事件之间有关系.
3.通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
经计算得χ2=≈7.822.则正确结论是(  )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%
的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
答案 C
解析 根据独立性检验的思想方法,正确选项为C.
4.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据可得出(  )
A.种子是否经过处理与是否生病有关
B.种子是否经过处理与是否生病无关
C.种子是否经过处理决定是否生病
D.有90%的把握认为种子经过处理与生病有关
答案 B
解析 χ2=≈0.164<2.706,即没有充足的理由认为种子是否经过处理跟生病有关.
5.(多选)下列说法正确的是(  )
A.事件A与B独立,即两个事件互不影响
B.事件A与B关系越密切,则χ2就越大
C.χ2的大小是判定事件A与B是否相关的唯一根据
D.若判定两事件A与B相关,则A发生B一定发生
答案 AB
解析 由事件的独立性知,A选项正确;由独立性检验的意义知,B选项正确;χ2的大小是判定事件A与B是否相关的一种方法,不是唯一依据,C选项不正确;若事件A与B相关,则A发生B可能发生,也可能不发生,D选项不正确.
6.在一项打鼾与患心脏病的调查中,共调查了1
671人,经过计算χ2=7.63,根据这一数据分析,有________的把握说,打鼾与患心脏病是________的.(填“有关”“无关”)
答案 99% 有关
解析 ∵χ2=7.63,∴χ2>6.635,因此,有99%的把握说,打鼾与患心脏病是有关的.
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
   专业性别
非统计专业
统计专业

13
10

7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得
χ2=≈4.844>3.841.
因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________.
答案 0.05
解析 根据χ2>3.841,可判断有95%的把握认为主修统计专业与性别有关系.故出错的概率为0.05.
8.下表是关于男婴与女婴出生时间调查的列联表:
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么,A=________,B=________,C=________,D=________,E=________.
答案 47 92 88 82 53
解析 由列联表得解得
9.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:
分数段
29~40
41~50
51~60
61~70
71~80
81~90
91~100
午休考生人数
23
47
30
21
14
31
14
不午休考生人数
17
51
67
15
30
17
3
(1)根据上述表格完成列联表:
及格人数
不及格人数
总计
午休
不午休
总计
(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?
解 (1)2×2列联表如下表所示:
及格人数
不及格人数
总计
午休
80
100
180
不午休
65
135
200
总计
145
235
380
(2)计算可知,午休的考生及格率为P1==.不午休的考生的及格率为P2==,由P1>P2,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.
10.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:
性别
打篮球
总计
喜爱
不喜爱
男生
6
女生
10
总计
48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整(不用写计算过程);
(2)能否有95%的把握认为喜爱打篮球与性别有关?
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
解 (1)列联表补充如下:
性别
打篮球
总计
喜爱
不喜爱
男生
22
6
28
女生
10
10
20
总计
32
16
48
(2)由χ2=≈4.286>3.841,所以有95%的把握认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X
0
1
2
P
X的均值为E(X)=0++=1.
11.(多选)下列关于回归分析与独立性检验的说法不正确的是(  )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
答案 ABD
12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是(  )
A.男人、女人中患色盲的频率分别为0.038和0.006
B.男、女患色盲的概率分别为,
C.男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性别是有关的
D.调查人数太少,不能说明色盲与性别有关
答案 C
解析 男人中患色盲的比例为=,要比女人中患色盲的比例=大,其差值为≈0.067
6,差值较大,故认为患色盲与性别是有关的.
13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
12
63
86
182
92
61
4
乙厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
29
71
85
159
76
62
18
(1)两个分厂生产的零件的优质品率分别为________;
(2)有________的把握认为“两个分厂生产的零件的质量有差异”.
答案 (1)72%,64% 
(2)99%
解析 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.
(2)
甲厂
乙厂
总计
优质品
360
320
680
非优质品
140
180
320
总计
500
500
1
000
χ2=≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
14.2018年世界杯期间,某电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
年龄
西班牙队
总计
不喜欢
喜欢
高于40岁
p
q
50
不高于40岁
15
35
50
总计
a
b
100
若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.
附:χ2=.
临界值表:
a=P(χ2≥k)
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
答案 95%
解析 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A,由已知得P(A)==,
所以q=25,p=25,a=40,b=60.
χ2==≈4.167>3.841.
故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.
15.(多选)有两个分类变量X,Y,其2×2列联表如下所示:
Y1
Y2
总计
X1
a
20-a
20
X2
15-a
30+a
45
总计
15
50
65
其中a,15-a均为大于5的整数,若有95%的把握认为X,Y有关,则a的值为(  )
A.6
B.7
C.8
D.9
答案 CD
解析 由题意可知
χ2=
=>3.841,根据a>5且15-a>5,
a∈Z,求得当a=8或9时满足题意.
16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:
男性
女性
总计
反感
10
不反感
8
总计
30
已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是.
(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?
(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X,求X的分布列和均值.
附:χ2=.
解 (1)
男性
女性
总计
反感
10
6
16
不反感
6
8
14
总计
16
14
30
由已知数据得χ2=≈1.158<2.706.
所以,没有充足的理由认为反感“中国式过马路”与性别有关.
(2)X的可能取值为0,1,2,
P(X=0)==,
P(X=1)==,
P(X=2)==.
所以X的分布列为
X
0
1
2
P
X的均值为E(X)=0×+1×+2×=.(共72张PPT)
学习目标
XUE
XI
MU
BIAO
1.了解2×2列联表、随机变量χ2的意义.
2.理解独立性检验中P(χ2≥k)的具体含义.
3.掌握独立性检验的方法和步骤,并能解决实际问题.




知识梳理
题型探究
随堂演练
课时对点练
1
知识梳理
PART
ONE
1.2×2列联表:如果随机事件A与B的样本数据如下表格形式:
?
在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
知识点一 2×2列联表及随机事件的概率
?
A
?
总计
B
a
b
a+b
?
c
d
c+d
总计
a+c
b+d
a+b+c+d
2.2×2列联表中随机事件的概率:
如上表,记n=a+b+c+d,则
(1)事件A发生的概率可估计为P(A)=________;
(2)事件B发生的概率可估计为P(B)=________;
(3)事件AB发生的概率可估计为P(AB)=____.
1.定义:在2×2列联表中,定义随机变量
,任意给定α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数),
(1)若χ2≥k成立,就称在犯错误的概率
的前提下,可以认为A与B不独立(也称A与B有关),或说有
的把握认为A与B有关;
(2)若χ2这一过程通常称为独立性检验.
知识点二 独立性检验
不超过α
1-α
2.统计学中,常用的显著性水平α以及对应的分位数k如下表所示.
思考 若χ2答案 不对,若χ2α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
1.2×2列联表只有4个格子.( 
 )
2.χ2的大小是判断事件A与B是否相关的统计量.( 
 )
3.当χ2≥3.841时,有95%的把握说事件A与B有关.( 
 )
思考辨析
判断正误
SI
KAO
BIAN
XI
PAN
DUAN
ZHENG
WU
×


2
题型探究
PART
TWO
一、2×2列联表
例1 
“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人口逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
解 以200人中“热烈参与者”的频率作为概率,
(2)根据上表的数据,填写下列2×2列联表.
?
热烈参与者
非热烈参与者
总计

?
?
140

?
55
?
总计
?
?
?
解 由题意可得2×2列联表如下:
?
热烈参与者
非热烈参与者
总计

35
105
140

5
55
60
总计
40
160
200
反思感悟
列2×2列联表的关注点
(1)作2×2列联表时,注意应该是4行4列,计算时要准确无误.
(2)作2×2列联表时,关键是对涉及的变量分清类别.
跟踪训练1 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.
(1)请根据以上数据作出饮食习惯与年龄的列联表;
解 饮食习惯与年龄的2×2列联表如下:
?
年龄在六十岁以上
年龄在六十岁以下
总计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
总计
70
54
124
(2)求年龄在六十岁以上且饮食以肉类为主的人群的概率.
命题角度1 两个变量的独立性检验
例2 某人研究中学生的性别与成绩、视力这2个变量的关系,随机抽查52名中学生,得到统计数据如表1与表2,则与性别有关联的可能性较大的变量是________.
二、独立性检验
视力
表1
   成绩
性别
不及格
及格
总计

6
14
20

10
22
32
总计
16
36
52
表2
   
视力
性别


总计

4
16
20

12
20
32
总计
16
36
52
命题角度2 独立性检验的实际应用问题
例3 某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
?
(1)分别估计男、女顾客对该商场服务满意的概率;
?
满意
不满意
男顾客
40
10
女顾客
30
20
因此男顾客对该商场服务满意的概率的估计值为0.8.
因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
α=P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
反思感悟
独立性检验的应用需要注意的问题
(1)χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.
(2)判断时把计算结果与临界值比较,其值越大,有关的可信度越高.
跟踪训练2 为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:
?
根据以上数据判断40岁以上的人患胃病与生活是否有规律有关吗?
?
患胃病
未患胃病
总计
生活不规律
60
260
320
生活有规律
20
200
220
总计
80
460
540
∵9.638>6.635,
∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.
3
随堂演练
PART
THREE
1.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有
A.①②③
B.②④⑤
C.②③④⑤
D.①②③④⑤
1
2
3
4
5

解析 独立性检验是判断两个随机事件是否有关系的方法,而①③都是求概率问题,不能用独立性检验.
2.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是______________________________________________
___________.
1
2
3
4
5
解析 由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.
男正教授人数,女正教授人数,男副教授人数,女副教授人数
1
2
3
4
5
3.下面2×2列联表中:
?
a,b的值分别为________.
49,54
解析 ∵a+21=70,∴a=49.
又∵a+5=b,∴b=54.
1
2
3
4
5
4.下面2×2列联表中的χ2的值为________(结果保留3位小数).
3.685
1
2
3
4
5
5.若由一个2×2列联表中的数据计算得χ2=4.013,那么有______的把握认为两个随机事件之间有关系.
95%
解析 因为χ2=4.013>3.841,查阅χ2表知有95%的把握认为两个随机事件之间有关系.
1.知识清单:
(1)2×2列联表.
(2)独立性检验的应用.
2.方法归纳:转化法.
3.常见误区:独立性检验原理理解错误.
课堂小结
KE
TANG
XIAO
JIE
4
课时对点练
PART
FOUR
1.下面是一个2×2列联表:
则表中a,b处的值分别为
A.74,38
B.52,10
C.52,8
D.8,52
基础巩固
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

解析 ∵a+11=63,b+15=23,∴a=52,b=8.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2.下列选项中,哪一个χ2的值可以有99%以上的把握认为“A与B有关系”
A.χ2=2.715
B.χ2=3.910
C.χ2=6.165
D.χ2=7.014
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

解析 ∵7.014>6.635,查阅χ2表知有99%的把握认为两个随机事件之间有关系.
3.通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:
?
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%
的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
?


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

16
解析 根据独立性检验的思想方法,正确选项为C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
?
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
4.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:
?
根据以上数据可得出
A.种子是否经过处理与是否生病有关
B.种子是否经过处理与是否生病无关
C.种子是否经过处理决定是否生病
D.有90%的把握认为种子经过处理与生病有关
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

16
即没有充足的理由认为种子是否经过处理跟生病有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
5.(多选)下列说法正确的是
A.事件A与B独立,即两个事件互不影响
B.事件A与B关系越密切,则χ2就越大
C.χ2的大小是判定事件A与B是否相关的唯一根据
D.若判定两事件A与B相关,则A发生B一定发生
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

16

解析 由事件的独立性知,A选项正确;
由独立性检验的意义知,B选项正确;
χ2的大小是判定事件A与B是否相关的一种方法,不是唯一依据,C选项不正确;
若事件A与B相关,则A发生B可能发生,也可能不发生,D选项不正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.在一项打鼾与患心脏病的调查中,共调查了1
671人,经过计算χ2=7.63,根据这一数据分析,有_______的把握说,打鼾与患心脏病是______的.(填“有关”“无关”)
有关
99%
解析 ∵χ2=7.63,∴χ2>6.635,因此,有99%的把握说,打鼾与患心脏病是有关的.
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
?
为了判断主修统计专业是否与性别有关系,根据表中的数据,得
因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
0.05
   专业
性别
非统计专业
统计专业

13
10

7
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 根据χ2>3.841,可判断有95%的把握认为主修统计专业与性别有关系.故出错的概率为0.05.
8.下表是关于男婴与女婴出生时间调查的列联表:
?
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
47
16
88
92
82
53
?
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
9.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:
16
分数段
29~40
41~50
51~60
61~70
71~80
81~90
91~100
午休考生人数
23
47
30
21
14
31
14
不午休考生人数
17
51
67
15
30
17
3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)根据上述表格完成列联表:
16
解 2×2列联表如下表所示:
?
及格人数
不及格人数
总计
午休
?
?
?
不午休
?
?
?
总计
?
?
?
?
及格人数
不及格人数
总计
午休
80
100
180
不午休
65
135
200
总计
145
235
380
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?
16
?
及格人数
不及格人数
总计
午休
80
100
180
不午休
65
135
200
总计
145
235
380
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由P1>P2,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.
10.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:
?
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为
.
(1)请将上面的2×2列联表补充完整(不用写计算过程);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
性别
打篮球
总计
喜爱
不喜爱
?
男生
?
6
?
女生
10
?
?
总计
?
?
48
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解 列联表补充如下:
性别
打篮球
总计
喜爱
不喜爱
?
男生
22
6
28
女生
10
10
20
总计
32
16
48
(2)能否有95%的把握认为喜爱打篮球与性别有关?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解 喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
故X的分布列为
11.(多选)下列关于回归分析与独立性检验的说法不正确的是
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量
之间的不确定关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否
具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
综合运用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

16


12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是
A.男人、女人中患色盲的频率分别为0.038和0.006
B.男、女患色盲的概率分别为
C.男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性
别是有关的
D.调查人数太少,不能说明色盲与性别有关
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
12
63
86
182
92
61
4
13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
乙厂:
?
(1)两个分厂生产的零件的优质品率分别为_________________;
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
29
71
85
159
76
62
18
72%,64%
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)有_______的把握认为“两个分厂生产的零件的质量有差异”.
99%
解析 
?
甲厂
乙厂
总计
优质品
360
320
680
非优质品
140
180
320
总计
500
500
1
000
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
14.2018年世界杯期间,某电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
年龄
西班牙队
总计
不喜欢
喜欢
?
高于40岁
p
q
50
不高于40岁
15
35
50
总计
a
b
100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
95%
a=P(χ2≥k)
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
解析 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A,
所以q=25,p=25,a=40,b=60.
故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.(多选)有两个分类变量X,Y,其2×2列联表如下所示:
?
其中a,15-a均为大于5的整数,若有95%的把握认为X,Y有关,则a的值为
A.6
B.7
C.8
D.9
拓广探究
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
?
Y1
Y2
总计
X1
a
20-a
20
X2
15-a
30+a
45
总计
15
50
65


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 由题意可知
根据a>5且15-a>5,
a∈Z,求得当a=8或9时满足题意.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:
?
已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是
.
(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?
?
男性
女性
总计
反感
10
?
?
不反感
?
8
?
总计
?
?
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解 
?
所以,没有充足的理由认为反感“中国式过马路”与性别有关.
16
?
男性
女性
总计
反感
10
6
16
不反感
6
8
14
总计
16
14
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X,求X的分布列和均值.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
解 X的可能取值为0,1,2,
所以X的分布列为
16