北师大版数学选修1-2 §1.2 独立性检验60张PPT+45张PPT

文档属性

名称 北师大版数学选修1-2 §1.2 独立性检验60张PPT+45张PPT
格式 zip
文件大小 5.9MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2019-11-23 11:58:28

文档简介

第一章 §2 第1课时
A级 基础巩固
一、选择题
1.某机械零件加工由两道工序组成,第一道工序的废品率为a,第二道工序的废品率为b,假定这两道工序出废品是彼此无关的,那么产品的合格率是( A )
A.ab-a-b+1      B.1-a-b
C.1-ab D.1-2ab
[解析] 设第一道工序出现废品为事件A,第二道工序出现废品为事件B,
则P(A)=a,P(B)=b,且A与B相互独立.
则产品合格率为P( )=P()·P()
=[1-P(A)][1-P(B)]
=(1-a)(1-b)=1-a-b+ab.
2.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为( A )
A.   B.  
C.   D.
[解析] 记“从甲袋中任取一球为白球”为事件A,“从乙袋中任取一球为白球”为事件B,则事件A、B是相互独立事件.P(A∩B)=P(A)·P(B)=×=.
3.甲口袋内装有大小相等的8个红球和4个白球,乙口袋内装有大小相等的9个红球和3个白球,从两个口袋内各摸出一球,那么等于( B )
A.2个球都是白球的概率
B.2个球中恰好有1个是白球的概率
C.2个球都不是白球的概率
D.2个球不都是红球的概率
[解析] 两个球都是白球的概率为×=;两个球恰好有一个是白球的概率为×+×=.
二、填空题
4.掷两枚均匀的骰子,已知点数不同,则至少有一个是6点的概率为__ .
[解析] 设掷两枚骰子点数不同记为事件A,至少有一个是6点记为事件B.则P(B|A)==.
5.明天上午李明要参加奥运志愿者活动,为了准时起床,他用甲、乙两个闹钟叫醒自己,假设甲闹钟准时响的概率是0.80,乙闹钟准时响的概率是0.90,则两个闹钟至少有一个准时响的概率是__0.98__.
[解析] 设A=“两个闹钟至少有一个准时响”,
∴P(A)=1-P()=1-(1-0.80)×(1-0.90)=1-0.2×0.1=0.98.
三、解答题
6.集合A={1,2,3,4,5,6},甲、乙两人各从A中任取一个数,若甲先取(不放回),乙后取,在甲抽到奇数的条件下,求乙抽到的数比甲抽到的数大的概率.
[解析] 将甲抽到数字a,乙抽到数字b,记作(a,b),则所有可能的抽取结果为:(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),共30个.
其中甲抽到奇数的情形有15个,在这15个中,乙抽到的数比甲抽到的数大的有9个,
∴所求概率P==.
解法2:设甲抽到奇数的事件为A,甲抽到奇数且乙抽到的数比甲大为事件B,则P(A)==.
P(AB)===.∴P(B|A)==.
B级 素养提升
一、选择题
1.已知某产品的次品率为4%,其合格品中75%为一级品,则任选一件为一级品的概率为( C )
A.75% B.96%
C.72% D.78.125%
[解析] 记“任选一件产品是合格品”为事件A,则P(A)=1-P()=1-4%=96%.
记“任选一件产品是一级品”为事件B. 由于一级品必是合格品,所以事件A包含事件B,故P(AB)=P(B).
由合格品中75%为一级品知P(B|A)=75%;
故P(B)=P(AB)=P(A)·P(B|A)=96%×75%=72%.
2.从甲口袋内摸出1个白球的概率是,从乙口袋内摸出1个白球的概率是,从两个口袋内各摸出1个球,那么等于( C )
A.2个球都是白球的概率
B.2个球都不是白球的概率
C.2个球不都是白球的概率
D.2个球中恰有1个是白球的概率
[解析] 记从甲口袋内摸出1个白球为事件A,从乙口袋内摸出1个白球为事件B,则A,B是独立事件,于是P(AB)=P(A)P(B)=×=,它表示从甲、乙口袋中摸出来的都是白球,故为2个球不都是白球的概率.
3.如图,已知电路中4个开关闭合的概率都是且互相独立,灯亮的概率为( C )
A. B.
C. D.
[解析] 因为灯不亮的概率为××(1-×)=,所以灯亮的概率为1-=.
二、填空题
4.从一副不含大小王的52张扑克牌中不放回地抽取2次,每次抽1张,已知第1次抽到A,则第2次也抽到A的概率__ .
[解析] 设第1次抽到A为事件M,第2次也抽到A为事件N,则MN表示两次都抽到A,
P(M)==,
P(MN)==,
P(N|M)==.
5.一道数学竞赛试题,甲生解出它的概率为,乙生解出它的概率为,丙生解出它的概率为,由甲、乙、丙三人独立解答此题只有一人解出的概率为__ .
[解析] P=××+××+××=.
三、解答题
6.某班有两个课外活动小组,其中第一小组有足球票6张,排球票4张;第二小组有足球票4张,排球票6张.甲从第一小组的10张票中任抽1张,乙从第二小组的10张票中任抽1张.
(1)两人都抽到足球票的概率是多少?
(2)两人中至少有1人抽到足球票的概率是多少?
[解析] 记“甲从第一小组的10张票中任抽1张,抽到足球票”为事件A,“乙从第二小组的10张票中任抽1张,抽到足球票”为事件B,则“甲从第一小组的10张票中任抽1张,抽到排球票”为事件,“乙从第二小组的10张票中任抽1张,抽到排球票”为事件,于是
P(A)==,P()=;P(B)==,P()=.
由于甲(或乙)是否抽到排球票,对乙(或甲)是否抽到足球票没有影响,因此A与B是相互独立事件.
(1)两人都抽到足球票的概率为P=P(A)·P(B)
=×=.
(2)两人都抽到排球票的概率为P=P()·P()
=×=.
故两人至少有1人抽到足球票的概率为P=1-=.
C级 能力提高
1.一个家庭中有若干个小孩,假设生男孩和生女孩是等可能的,令A={一个家庭中有男孩,又有女孩},B={一个家庭中最多有一个女孩},对下述两种情形,讨论A与B的独立性:
(1)家庭中有两个小孩;
(2)家庭中有三个小孩.
[解析] (1)有两个小孩的家庭,所有的情形为:
Ω={(男,男),(男,女),(女,男),(女,女)}.
它有4个基本事件,由等可能性知概率各为,这时A={(男,女),(女,男)},B={(男,男),(男,女),(女,男)},AB={(男,女),(女,男)}.∴P(A)=,P(B)=,P(AB)=,由此可知P(AB)≠P(A)·P(B).∴A,B不相互独立.(2)有三个小孩的家庭,所有的情形为Ω={(男,男,男),(男,男,女),(男,女,男),(女,男,男),(男,女,女),(女,男,女),(女,女,男),(女,女,女)}.由等可能性知这8个基本事件的概率为.这时A包含6个基本事件,B中含有4个基本事件.AB中含有3个基本事件,P(A)=,P(B)=,P(AB)=,P(AB)==P(A)·P(B),∴A与B相互独立.
2.甲、乙两个人独立地破译一个密码,他们能译出密码的概率分别为和,求:
(1)2个人都译出密码的概率;
(2)2个人都译不出密码的概率;
(3)恰有1个人译出密码的概率;
(4)至多1个人译出密码的概率;
(5)至少1个人译出密码的概率.
[分析] 我们把“甲独立地译出密码”记为事件A,把“乙独立地译出密码”记为事件B,显然,A、B为相互独立事件,问题(1)相当于事件A、B同时发生,即事件A·B.问题(2)相当于事件·.问题(3)相当于事件A·+·B.问题(4)“至多1个人译出密码”的对立事件是2个人都译出密码(即事件AB).问题(5)“至少1个人译出密码”的对立事件是2个人都未译出密码(即事件·).由于A,B是独立事件,上述问题中,与B,A与,与都是相互独立事件,可以用公式计算相关概率.
[解析] 记“甲独立地译出密码”为事件A,“乙独立地译出密码”为事件B,A,B为相互独立事件,P(A)=,P(B)=.
(1)2个人都译出密码的概率为P(A·B)=P(A)×P(B)=×=.
(2)2个人都译不出密码的概率为P(·)=P()×P()=[1-P(A)]×[1-P(B)]=(1-)×(1-)=.
(3)恰有1个人译出密码可以分为两类:甲译出乙未译出以及甲未译出乙译出,且两个事件为互斥事件,所以恰有1个人译出密码的概率为
P(A·+·B)=P(A·)+P(·B)=P(A)P()+P()P(B)=×(1-)+(1-)×=.
(4)“至多1个人译出密码”的对立事件为“有2个人译出密码”,所以至多1个人译出密码的概率为1-P(AB)=1-P(A)P(B)=1-×=.
(5)“至少有1个人译出密码”的对立事件为“2个都未译出密码”,所以至少有1个人译出密码的概率为
1-P(·)=1-P()P()=1-×=.
课件45张PPT。第一章统计案例§2 独立性检验第1课时 条件概率与独立事件自主预习学案李明给王飞打电话商议周日一起去看电影,李明:“周日去看电影吗?”王飞:“如果不下雨的话,我们就去.”1.条件概率
(1)事件的交:
把由事件A和B同时发生所构成的事件D,称为事件A与B的交(或积),记做D=A∩B(或D=AB).
(2)条件概率的概念
在事件B发生的条件下,事件A发生的概率,称为____________________________,记为________________.B发生时A发生的条件概率 P(A|B) 类似地,在事件A发生的条件下,事件B发生的概率,称为____________________________,记为________________.
(3)条件概率计算公式
当P(B)>0时,P(A|B)=______________;
当P(A)>0时,P(B|A)=______________.
2.独立事件
对于两个事件A、B,如果P(AB)=___________,则称A、B相互独立.A发生时B发生的条件概率 P(B|A) P(A)·P(B) 相互独立 1.条件概率的几个注意点:
(1)事件B在“事件A已发生”这个附加条件下的概率与没有这个附加条件的概率是不同的.
(2)应该说,每一个随机试验都是在一定条件下进行的.而这里所说的条件概率,则是当试验结果的一部分信息已知(即在原随机试验的条件上,再加上一定的条件),求另一事件在此条件下发生的概率.3.“互斥”与“相互独立”的区别与联系它们之间的概率关系如下表所示.B D C 4.甲、乙、丙三人将参加某项测试,他们能达标的概率分别是0.8、0.6、0.5,则三人都达标的概率是____________,三人中至少有一人达标的概率是____________.
[解析] 三人均达标的概率为0.8×0.6×0.5=0.24,三人中至少有一人达标的概率为1-(1-0.8)×(1-0.6)×(1-0.5)=0.96.0.24 0.96 互动探究学案命题方向1 ?条件概率[思路分析] 设A=“甲地为雨天”,B=“乙地为雨天”,则根据题意有P(A)=0.20,P(B)=0.18,P(A∩B)=0.12.问题(1)为求P(A|B),(2)为求P(B|A).
命题方向2 ?相互独立事件的概率『规律方法』 如果事件A发生与否不影响事件B的发生,事件B发生与否也不影响事件A的发生,则A与B相互独立,且P(AB)=P(A)P(B).命题方向3 ?综合应用〔跟踪练习3〕
制造一机器零件,甲机床生产的废品率是0.04,乙机床生产的废品率是0.05,从它们生产的产品中各任取1件,求:
(1)两件都是废品的概率;
(2)其中没有废品的概率;
(3)其中恰有1件废品的概率;
(4)其中至少有1件废品的概率;
(5)其中至多有1件废品的概率.
[分析] 利用相互独立事件的概率公式及对立事件的关系求解.
[辨析] 第一次摸出红心,放回后再摸第二次.表明A,B两事件相互独立,而误解则按照互斥事件计算.1.两人打靶,甲击中的概率为0.8,乙击中的概率为0.7,若两人同时射击一目标,则它们都中靶的概率是(  )
A.0.56  B.0.48 
C.0.75  D.0.6
[解析] 设甲击中为事件A,乙击中为事件B.∵A、B相互独立,则P(AB)=P(A)·P(B)=0.8×0.7=0.56.A2.如图,A、B、C表示3种开关,若在某段时间内它们正常工作的概率分别为0.9、0.8、0.7,那么系统的可靠性是(  )
A.0.504 B.0.994
C.0.496 D.0.06
[解析] 系统可靠即A、B、C 3种开关至少有一个能正常工作,
则P=1-[1-P(A)][1-P(B)][1-P(C)]
=1-(1-0.9)(1-0.8)(1-0.7)
=1-0.1×0.2×0.3
=0.994.BB
4.在由12道选择题和4道填空题组成的考题中,如果不放回地依次抽取2道题.
求:(1)第一次抽到填空题的概率;
(2)第一次和第二次都抽到填空题的概率;
(3)在第一次抽到填空题的前提下,第二次抽到填空题的概率.课 时 作 业 学 案第一章 §2 第2课时
A级 基础巩固
一、选择题
1.在2×2列联表中,两个比值_________相差越大,两个分类变量之间的关系越强( A )
A.与    B.与
C.与 D.与
[解析] 与相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.
2.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( C )
A.吸烟,不吸烟 B.患病,不患病
C.是否吸烟、是否患病 D.以上都不对
[解析] “是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.
3.下列是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则该表中a、b的值分别为( C )
A.94,96 B.52,50
C.52,54 D.54,52
[解析] a=73-21=52,b=a+2=52+2=54.
4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( C )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
A.①  B.①③
C.③  D.②
[解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.
5.为了研究男子的年龄与吸烟的关系,抽查了100个男人,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
年龄
吸烟量    
不超过40岁
超过40岁
合计
吸烟量不多于20支/天
50
15
65
吸烟量多于20支/天
10
25
35
合计
60
40
100
则在犯错误的概率不超过_________的前提下认为吸烟与年龄有关.( B )
A.0.1 B.0.01
C.0.05 D.没有理由
[解析] χ2=≈22.16>6.635.
故我们在犯错误的概率不超过0.01的前提下认为吸烟量与年龄有关.
6.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( D )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=2,b=3,c=5,d=4
[解析] 比较|-|.
选项A中,|-|=;
选项B中,|-|=;
选项C中,|-|=;
选项D中,|-|=.故选D.
二、填空题
7.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
合计
吸烟
43
162
205
不吸烟
13
121
134
合计
56
283
339
根据列表数据,求得χ2的观测值k≈__7.469__.
[解析] k=≈7.469.
8.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名)
性别与喜欢文科还是理科列联表
喜欢文科
喜欢理科
总计
男生
8
28
36
女生
20
16
36
总计
28
44
72
中学生的性别和喜欢文科还是理科__有__关系.(填“有”或“没有”)
[解析] 通过计算χ2的观测值k=≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.
三、解答题
9.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对160位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?
受伤
不受伤
总计
做热身
19
76
95
不做热身
45
20
65
总计
64
96
160
[解析] ∵a=19,b=76,c=45,d=20,a+b=95,c+d=65,a+c=64,b+d=96,n=160.
∴由计算公式得χ2=≈38.974.
∵38.974>6.635,
∴有99%的把握认为运动员受伤与不做热身运动有关.
B级 素养提升
一、选择题
1.某研究中心为研究运动与性别的关系得到2×2列联表如下:
喜欢运动
不喜欢运动
合计
男生
60
20
80
女生
10
10
20
合计
70
30
100
则随机变量χ2的观测值约为( A )
A.4.762 B.9.524
C.0.011 9 D.0.023 8
[解析] χ2=≈4.762.
2.某研究机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如下表:
心脏病
无心脏病
秃发
20
300
不秃发
5
450
根据表中数据得到χ2=≈15.968>6.635,所以断定秃发与心脏病有关系,那么这种判断出错的可能性为( D )
A.0.1 B.0.05
C.0.025 D.0.01
[解析] ∵χ2>6.635,∴有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性有1-0.99=0.01.
3.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总数
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总数
26
24
50
则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( B )
A.99% B.95%
C.90% D.无充分依据
[解析] 由表中数据得k=
≈5.059>3.841.
所以约有95%的把握认为两变量之间有关系.
4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有_____的把握认为糖尿病患者与遗传有关系.( D )
A.99.9% B.99.5%
C.99% D.97.5%
[解析] 可以先作出如下列联表(单位:人):
糖尿病患者与遗传列联表
糖尿病发病
糖尿病不发病
总计
阳性家族史
16
93
109
阴性家族史
17
240
257
总计
33
333
366
根据列联表中的数据,得到χ2的观测值为
k=≈6.067>5.024.
故我们有97.5%的把握认为糖尿病患者与遗传有关系.
5.有两个分类变量X,Y,其一组的2×2列联表如下所示,
Y1
Y2
X1
a
20-a
X2
15-a
30+a
其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( C )
A.8 B.9
C.8,9 D.6,8
[解析] 根据公式,得χ2的观测值k==>3.841,数据a>5且15-a>5,a∈Z,求得a=8,9满足题意.
二、填空题
6.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过__0.025__的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.
超重
不超重
总计
偏高
4
1
5
不偏高
3
12
15
总计
7
13
20
[解析] 根据公式χ2=得,χ2的观测值k=≈5.934,
因为k>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.
7.两个分类变量X、Y,它们的取值分别为x1、x2和y1、y2,其列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若两个分类变量X、Y独立,则下列结论:
①ad≈bc;②≈;③≈;④≈;
⑤≈0.
其中正确的序号是__①②⑤__.
[解析] ∵分类变量X、Y独立,
∴≈×,
化简得ad≈bc,故①⑤正确;
②式化简得ad≈bc,故②正确.
三、解答题
8.2016年夏季奥运会在巴西里约热内卢举行.体育频道为了解某地区关于奥运会直播的收视情况.随机抽取了100名观众进行调查.其中40岁以上的观众有55名.下面奥运会直播时间的频率分布表(时间:min):
分组
[0,20)
[20,40)
[40,60)
[60,80)
[80,100)
[100,120)
频率
0.1
0.18
0.22
0.25
0.2
0.05
将每天收看奥运会直播的时间不低于80 min的观众称为“奥运迷”.已知“奥运迷”中有10名40岁以上的观众.
(1)根据已知条件完成下面的2×2列联表;
非“奥运迷”
“奥运迷”
合计
40岁以下
40岁以上
合计
(2)并据此资料你是否有95%以上的把握认为“奥运迷”与年龄有关.
附:χ2=
P(χ2≥k)
0.05
0.01
k
3.841
6.635
[解析] (1)由题意得100名观众中“奥运迷”共有(0.2+0.05)×100=25名,其中40岁以上的“奥运迷”有10名,∴40岁以下的“奥运迷”有15名,∴2×2列联表如下:
非“奥运迷”
“奥运迷”
合计
40岁以下
30
15
45
40岁以上
45
10
55
合计
75
25
100
(2)χ2=
≈4.862>3.841,
∴有95%以上的把握认为“奥运迷”与年龄有关.
C级 能力提高
1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别
非统计专业
统计专业

13
10

7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
χ2=≈4.844,
因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为__5% .
[解析] ∵k>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.
2.下表是某地区的一种传染病与饮用水的调查表:
得病
不得病
合计
干净水
52
466
518
不干净水
94
218
312
合计
146
684
830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种传染病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.
[解析] (1)提出假设H0:传染病与饮用水的卫生程度无关.
由公式得χ=≈54.21.
因为54.21>10.828,因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关.
(2)依题意得2×2列联表:
得病
不得病
合计
干净水
5
50
55
不干净水
9
22
31
合计
14
72
86
由公式得χ=≈5.785.
由5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性.
课件60张PPT。第一章统计案例§2 独立性检验第2课时 独立性检验的基本思想及其初步应用自主预习学案饮用水的质量是人类普遍关心的问题.据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人,人的身体健康状况与饮用水的质量之间有关系吗?
1.分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的____________,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的__________称为列联表.不同类别 频数表 ②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否____________,常用等高条形图表示列联表数据的____________.
(2)观察等高条形图发现______和______相差很大,就判断两个分类变量之间有关系.相互影响 频率特征 3.独立性检验a+b+c+d 临界值k0 观测值k k≥k0 犯错误的概率 没有发现足够证据 3.841 6.635 2.706 1.分类变量与定量变量
分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量只取男、女两个值,商品的等级变量只取一级、二级、三级等等.有时也可以把分类变量的不同取值用数字来表示,但这时的数字除了分类以外没有其他的含义.例如,用0表示“男”,1表示“女”,性别变量就变成取值为0和1的随机变量,但是这些数字并没有其他的含义.此时比较性别变量的两个不同值之间的大小没有意义,性别变量的均值和方差也没有意义.定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义.例如身高、体重、考试成绩等,张明的身高是180 cm,李立的身高是175 cm,说明张明比李立高180-175=5(cm).定量变量的数字特征,如均值和方差都有实际意义.
2.利用独立性检验的思想解决实际问题.
利用独立性检验的思想解决实际问题的思路如下:
(1)独立性检验原理只能解决“包含两个对象,且每个对象有两类属性”这一类的问题,所以对于一个实际问题,我们要首先看能不能用独立性检验的思想加以解决.1.对于分类变量X与Y的随机变量χ2的观测值k,下列说法正确的是(  )
A.k越大,推断“X与Y有关系”,犯错误的概率越大
B.k越小,推断“X与Y有关系”,犯错误的概率越大
C.k越接近于0,推断“X与Y无关”,犯错误的概率越大
D.k越大,推断“X与Y无关”,犯错误的概率越小B2.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过(  )
A.0.25       B.0.75
C.0.025 D.0.975
[解析] 通过查表确定临界值k.当k>k0=5.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.C3.甲、乙两校体育达标抽样测试,其数据见下表:
两校体育达标情况抽检
若要考察体育达标情况与学校是否有关系最适宜的统计方法是(  )
A.回归分析 B.独立性检验
C.相关系数 D.平均值B4.(2019·全国卷Ⅰ文,17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:互动探究学案命题方向1 ?独立性检验的应用 现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分析估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?[思路分析] (1)由表格统计出甲、乙两个班的总人数和优秀人数,求出优秀率;
(2)依统计数据填写列联表,代入公式计算K2的估计值,查表下结论.
如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
2.由于独立性检验计算量大,要细致,避免计算失误.〔跟踪练习1〕
“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:
能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?命题方向2 ?综合应用〔跟踪练习2〕
为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.
下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表
(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:[解析] 本小题考查频率分布直方图、独立性检验及2×2列联表等统计学知识.
解题思路是(1)绘制频率分布直方图,并从图中观察出中位数进行比较,(2)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.(1)可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.(2)表3:准确掌握公式中的参数含义 〔跟踪练习3〕
调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示.能否在犯错误的概率不超过0.10的前提下认为是否看营养说明与性别有关系?独立性检验的基本思想 1.独立性检验的基本思想
独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关这一结论成立的可信度为99%,不合理的程度可查下表得出:2.反证法与假设检验的对照表3.独立性检验与反证法的异同
独立性检验的思想来自统计中的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生,而假设检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.我们知道小概率事件在一次试验中通常是不会发生的,若在实际中这个事件发生了,说明保证这个事件为小概率事件的条件有问题,即结论在很大的程度上应该成立.其基本步骤如下:
(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量.
(2)根据样本数据作出2×2列联表.
(3)通过等高条形图直观地判断两个分类变量是否相关.
(4)计算随机变量χ2,并查表分析,当χ2的观测值很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关. 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有90%的把握认为箱产量与养殖方法有关;
[思路分析] (1)根据频率估计概率.
(2)根据独立性检验的步骤求解.
(3)观察频率分布直方图得出平均值(或中位数)的取值区间,再进行比较.
[解析] (1)旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
因此,事件A的概率估计值为0.62.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.1.对服用某种维生素对婴儿头发稀疏与稠密的影响调查如下:服用的60人中头发稀疏的有5人,不服用的60人中头发稀疏的有46人,作出如下列联表:
则表中a,b的值分别为(  )
A.9,14        B.55,14
C.55,24 D.69,14B
2.对两个分类变量进行独立性检验的主要作用是(  )
A.判断模型的拟合效果
B.对两个变量进行相关分析
C.给出两个分类变量有关系的可靠程度
D.估计预报变量的平均值
[解析] 独立性检验的目的就是明确两个分类变量有关系的可靠程度.C3.在研究“吸烟与患肺癌”的关系中,通过收集数据,整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是(  )
A.在100个吸烟者中至少有99人患肺癌
B.如果1个人吸烟,那么这个人至少有99%的概率患肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟在者中可能一个患肺癌的人也没有
4.若由一个2×2列联表中的数据计算得χ2的观测值k≈4.013,那么在犯错误的概率不超过____________的前提下,认为两个分类变量之间有关系.D0.05 5.高二(1)班班主任对全班50名同学的学习积极性与对待班级工作的态度进行调查, 统计数据如表所示:
试运用独立性检验的思想方法分析,能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.课 时 作 业 学 案
同课章节目录