高中数学人教A版选修2-3 3.2 独立性检验的基本思想及其初步应用(课件:44张PPT+练习)

文档属性

名称 高中数学人教A版选修2-3 3.2 独立性检验的基本思想及其初步应用(课件:44张PPT+练习)
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2020-03-16 14:11:04

文档简介

3-2
[综合训练·能力提升]
一、选择题(每小题5分,共30分)
1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是
A.2×2列联表     B.独立性检验
C.等高条形图 D.其他
解析 A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度;独立性检验通过计算得出相关的可能性,较为准确.
答案 B
2.观察下列各图,其中两个分类变量x,y之间关系最强的是
解析 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.
答案 D
3.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
则表中a、b处的值分别为
A.94,96   B.52,50   C.52,54   D.54,52
解析 由得
答案 C
4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是
A.k≥6.635 B.k<6.635
C.k≥7.879 D.k<7.879
解析 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.
答案 C
5.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为
Y
X  
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于同一样本,以下数据能说明X与Y相有关的可能性最大的一组为
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5
解析 对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于A、B、C都有|ad-bc|=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然7>2.
答案 D
6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,观测值k=≈7.8.
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析 由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.
答案 A
二、填空题(每小题5分,共15分)
7.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如表所示:
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析的统计假设是________.
解析 由独立性检验的步骤知第一步先假设两分类变量无关,即假设电离辐射的剂量与人体的受损程度无关.
答案 假设电离辐射的剂量与人体的受损程度无关
8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).
解析 因为在20至40岁的58名观众中有18名观众收看新闻节目,而在大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
答案 是
9.某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高与体重之间有关系.
超重
不超重
总计
偏高
4
1
5
不偏高
3
12
15
总计
7
13
20
解析 K2=≈5.934>5.024,所以可以在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高与体重之间有关系.
答案 0.025
三、解答题(本大题共3小题,共35分)
10.(10分)在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数110人,其中男、女各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.
(1)请根据题目所提供的调查结果填写下列2×2列联表:
看电视
运动
总计


总计
(2)能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”?
解析 (1)根据题目所提供的调查结果,可得下列2×2列联表:
看电视
运动
总计

30
25
55

20
35
55
总计
50
60
110
(2)根据列联表中的数据,可计算K2的观测值k;
k=≈3.667<3.841,
所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.
答案 见解析
11.(12分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该本育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的列联表,并据此资料你是否认为在犯错误的概率不超过5%的前提下“体育迷”与性别有关?
非体育迷
体育迷
总计


10
55
总计
解析 由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:
非体育迷
体育迷
总计

30
15
45

45
10
55
总计
75
25
100
由2×2列联表中数据代入公式计算,得:
K2=
=≈3.030.
因为3.030<3.841,
所以,没有理由认为在犯错误的概率不超过5%的前提下“体育迷”与性别有关.
答案 见解析
12.(13分)为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下列表:
喜爱打篮球
不喜爱打篮球
总计
男生
5
女生
10
总计
50
已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整(不用写计算过程).
(2)能否在犯错误的概率不超过0.005的前提下认为喜爱打篮球与性别有关?说明你的理由.
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为ξ,求ξ的分布列与期望.
解析 (1)列联表补充如下:
喜爱打篮球
不喜爱打篮球
总计
男生
20
5
25
女生
10
15
25
总计
30
20
50
(2)因为K2=≈8.333>7.879.
所以在犯错误的概率不超过0.005的前提下,认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数ξ的可能取值为0,1,2.
其概率分别为P(ξ=0)==,
P(ξ=1)==,P(ξ=2)==,
故ξ的分布列为:
ξ
0
1
2
P



ξ的期望值为:E(ξ)=0×+1×+2×=.
答案 见解析
课件44张PPT。§3.2 独立性检验的基本思想及其初步应用
[课标解读]
1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(难点)
2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.(重点)
3.经历由实际问题建立数学模型的过程,体会其基本方法.1.与列联表相关的概念
(1)分类变量:变量的不同“___”表示____所属的__________,像这样的变量称为分类变量.
(2)列联表:
①列出的_____分类变量的______称为列联表.
②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
基础知识整合值个体不同类别两个频数表a+bc+da+cb+da+b+c+d2.等高条形图
等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否__________,常用等高条形图展示列表数据的__________.
3.独立性检验的基本思想
(1)定义:利用随机变量___来判断“两个分类变量________”的方法称为独立性检验.相互影响频率特征K2有关系a+b+c+d观测值临界值③如果_____,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在_____________不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中__________________支持结论“X与Y有关系”.
k≥k0犯错误的概率没有发现足够证据知识点一 分类变量
探究1:根据所给材料完成下列填空,明确直观研究两分类变量的方法.
材料:从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任,将数据整理如下:
核心要点探究(1)由列联表可粗略地看出:
①有酒精者有______人有责任;
②无酒精者有______人有责任.
因此,直观上得出结论:________________.提示 (1)①650 ②700 含有酒精与对事故负有责任有关
(2)根据列联表的数据,作出等高条形图如图所示:
由图可以直观地看出,含有酒精与对事故负有责任是否有关?
提示 由条形图可得,有酒精的阴影占比例大.故含有酒精与对事故负有责任有关.
探究2:据材料完成下面问题,理解分类变量的概念.
(1)材料中的是否含有酒精和是否负有事故责任是分类变量吗?这类变量有哪些特点?
提示 是分类变量.是否含有酒精,其取值为含有酒精和不含有酒精;是否有责任,其取值为有责任和无责任.这类变量的不同“值”表示个体所属的不同类别,这类变量我们称为分类变量.此类变量的特点是一般取值为两个,也可多个,且这两个取值是相互对立的.
(2)试分析直观地研究两分类变量是否有关的两种方法的特点.
提示 列联表能展示分类变量的频率特征,等高条形图更清晰地表达了两种情况下是否有责任的比例.
(2)计算:求K2=__________的观测值k(它越小,原假设“H0:酒精与事故责任没有关系”成立 的可能性______).(3)查表得出结论:
探究2:回答下面几个问题进一步理解独立性检验的基本思想.
(1)在计算K2,判断变量是否相关时,若K2的观测值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确的?
提示 两种说法均正确.
P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提下,认为两变量相关.(2)独立性检验的步骤与反证法的步骤中在推导假设不成立时主要区别是什么?
提示 其主要区别为,反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立. 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
题型一 列联表和等高条形图的应用例1【自主解答】 作列联表如下:
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.
(3)看趋势:在作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,以便对结论的判断不出现偏差.在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.
1.某校对学生课外活动进行调查,结果整理成下表试用等高条形图直观地分析,喜欢体育还是文娱与性别是否有关?◎变式训练解析 其等高条形图如图所示.
图中阴影部分表示男生与女生中喜欢文娱的比例,从图中可以看出女生中喜欢文娱的比例比男生中喜欢文娱的比例高,由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系.
答案 喜欢体育还是喜欢文娱与性别在某种程度上有关系
(1)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关系”的可信度.如果k≥3.841,那么在犯错误的概率不超过多少的前提下认为“X和Y有关系”
题型二 两个变量的独立性检验例2A.5%   B.75%  C.99.5%  D.95%(2)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
①根据以上数据建立一个2×2的列联表;并估计,以运动为主的休闲方式的人的比例;
②能否在犯错误的概率不超过0.025的前提下,认为性别与休闲方式有关系?
附表:【自主解答】 (1)因为k≥3.841,所以有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=95%的把握说明两个变量之间有关系.
(2)①由所给的数据得到列联表【答案】 (1)A (2)①15∶31 ②能2.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:
◎变式训练(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
解析 (1)第二种生产方式的效率更高.理由如下:
回答方法一 由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
回答方法二 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
回答方法三 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.
回答方法四 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同.故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录进行比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列表述中正确的是
◎典题示例易错误区(十二) 因不理解独立性检验的含义致误典例A.在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血清,那么他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
【解析】 由题意可知根据k≈3.918≥3.841,又P(K2≥3.841)≈0.05,因此说明了在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”,B、C、D表达有误.
【答案】 A
[易错防范]
1.搞不清P(K2≥3.841)≈0.05的含义,从而错选B或D.
2.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理.例如,本例的求解主要涉及独立性检验的思想,即对“P(K2≥3.841)≈0.05”的含义理解是解题的关键.
在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;◎典题试解③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.
解析 K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
答案 ③
本讲结束
请按ESC键返回综合训练·能力提升