专题1.2独立性检验的基本思想及其初步应用-2017-2018学年高二数学人教版(选修1-2)

文档属性

名称 专题1.2独立性检验的基本思想及其初步应用-2017-2018学年高二数学人教版(选修1-2)
格式 zip
文件大小 547.0KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-01-26 09:13:21

图片预览

文档简介

1.2 独立性检验的基本思想及其初步应用

1.分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的______________,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的______________称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否______________,常用等高条形图表示列联表数据的______________.
(2)观察等高条形图发现______________和______________相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.
(2)公式:,其中______________为样本容量.
(3)独立性检验的具体步骤
①确定,根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定______________;
②计算的观测值,利用公式计算随机变量的观测值为______________;
③下结论,如果______________,就推断“与有关系”,这种推断______________不超过;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中______________支持结论“与有关系”.
K知识参考答案:
1.(1)不同类别 (2)频数表
2.(1)相互影响 频率特征 (2)
3.(2)
(3)①临界值 ② ③观测值 犯错误的概率 没有发现足够证据

K—重点
了解分类变量的意义,会列出的列联表,会计算,并理解其意义
K—难点
了解实际推理和假设检验的基本思想
K—易错
思维不清易出错,错把统计当确定
列联表和等高条形图的应用
某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
【答案】见解析.
【解析】作列联表如下:
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
总计
426
594
1020
相应的等高条形图如图所示:

图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.
从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,
可以认为考前紧张与性格类型有关.
【名师点睛】(1)判断两个分类变量是否有关系的两种常用方法:
①利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法;
②一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.
(2)利用等高条形图判断两个分类变量是否相关的步骤:

独立性检验
某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
7
25
学习积极性一般
6
19
25
合计
24
26
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由?
参考公式及数据:,其中为样本容量.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1),;(2)有99.9%的把握说学习积极性与对待班级工作的态度有关系.
【解析】(1)积极参加班级工作的学生有24人,总人数为50人.概率为;
不太主动参加班级工作且学习积极性一般的学生有19人,概率为.

【名师点睛】独立性检验的步骤如下:
第一步,确定分类变量,获取样本频数,得到列联表.
第二步,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值.
第三步,利用公式计算随机变量的观测值.
第四步,作出判断.
如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
思维不清易出错,错把统计当确定
试分析下列说法正确与否:
在用独立性检验的方法检验某单位招聘行政工作人员和技术工作人员所招聘的男女人数时,得到了的观测值为,这就证明该单位在两类工作岗位上的招聘中一定存在性别歧视.
【错解】这种说法都是正确的.
【错因分析】统计思维得出的结论是带有随机性的、不能完全确定的结论.错解中依据确定性思维对统计计算的结果给出了错误的解释.
【正解】说法错误.根据独立性检验,当的观测值为时,有95%的把握认为该单位在两类工作岗位上的招聘中存在性别歧视,即该单位在招聘工作中存在性别歧视的嫌疑很大,概率高达95%,即使是这样也不能100%肯定该单位在招聘工作中存在性别歧视.
另一方面,由于男女在选择工作岗位上的心理不同,也会造成各个岗位招聘男女人数的差异,导致计算的的观测值过大,因此,单纯从这个计算结果不能得出该单位在两类工作岗位上的招聘中一定存在性别歧视的结论.


1.下列关于K2的说法正确的是
A.K2在任何相互独立问题中都可以用来检验是有关还是无关
B.K2的值越大,两个事件的相关性就越大
C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.K2的观测值k的计算公式为
2.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出

A.性别与喜欢理科无关 B.女生中喜欢理科的比为80%
C.男生比女生喜欢理科的可能性大些 D.男生不喜欢理科的比为60%
3.假设有两个分类变量X和Y,它们的值分别为{x1,x2}和{y1,y2},其列联表如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对同一样本,以下数据能说明X与Y有关的可能性最大的一组为
A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5
4.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是
A.若K2的观测值为k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌
B.由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌
C.从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误
D.以上三种说法都不正确
5.通过随机询问110名性别不同的大学生是否爱好排球运动,得到如下的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由算得k≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是
A.在犯错误的概率不超过0.01的前提下,认为“爱好排球运动与性别有关”
B.在犯错误的概率不超过0.01的前提下,认为“爱好排球运动与性别无关”
C.在犯错误的概率不超过0.001的前提下,认为“爱好排球运动与性别有关”
D.在犯错误的概率不超过0.001的前提下,认为“爱好排球运动与性别无关”
6.若由一个2×2列联表中的数据计算得k=4.013,那么在犯错误的概率不超过_______________的前提下认为两个变量之间有关系.
7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众与年龄_______________.(填“有关”或“无关”)
8.某校对学生课外活动进行调查,结果整理成下表:
体育
文娱
合计
男生
21
23
44
女生
6
29
35
合计
27
52
79
运用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?
参考公式和数据:.

9.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:


需要
40
30
不需要
160
270
(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例;
(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?
参考公式和数据:.


10.下列关于等高条形图的叙述正确的是
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图中可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
11.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
总计
多看电视
68
42
110
少看电视
20
38
58
总计
88
80
168
则大约有多大的把握认为多看电视与人变冷漠有关系
A.99.9% B.97.5%
C.95% D.99%
12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是
A.男、女人患色盲的频率分别为0.038,0.006
B.男、女人患色盲的概率分别为,
C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的
D.调查人数太少,不能说明色盲与性别有关
13.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到随机变量K2的观测值:k≈4.844>3.841.因此判定主修统计专业与性别有关系,那么这种判断出错的概率为_______________.
非统计专业
统计专业

13
10

7
20
14.某企业有两个分厂生产某种零件,规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:

(1)试分别估计两个分厂生产零件的优质品率;
(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
甲厂
乙厂
合计
优质品
非优质品
合计
参考公式和数据:.


15.(2017新课标全国II文)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:

(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P()
0.050 0.010 0.001
k
3.841 6.635 10.828


1.【答案】C
【解析】K2是用来判断两个分类变量是否有关的随机变量,所以A错;K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性的大小,B错;D中应为.故选C.
3.【答案】D
【解析】对于同一样本,越小,说明x与y相关性越弱,越大,说明x与y相关性越强.通过计算知,对于选项A,B,C,都有.对于选项D,有,故选D.
4.【答案】C
【解析】在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,即不表示二者的关系具体有多大,而只是指“有关系”的可信度为99%,或者说把“没有关系”误判为“有关系”的概率为1%.故选C.
5.【答案】A
【解析】因为7.8>6.635,所以在犯错误的概率不超过0.01的前提下,认为“爱好排球运动与性别有关”.故选A.
6.【答案】0.05
【解析】因随机变量k2的观测值k=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.
7.【答案】有关
【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,两者相差较大,所以认为收看新闻节目的观众与年龄有关.
8.【答案】能否在犯错误的概率不超过0.005的前提下,认为喜欢体育还是文娱与性别有关系.
【解析】假设“喜欢体育还是喜欢文娱与性别没有关系”,
因为a=21,b=23,c=6,d=29,n=79,
所以K2的观测值.
又P(K2≥7.879)≈0.005,所以我们认为“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.
9.【答案】(1);(2)在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.
【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,
因此该地区老年人中需要帮助的老年人的比例的估计值为.
(2)由题可得K2的观测值,
由于9.967>6.635,
所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.
11.【答案】A
【解析】由题中数据通过计算可得,则有99.9%的把握认为多看电视与人变冷漠有关系.故选A.
12.【答案】C
【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,
其差值为,差值较大,所以认为患色盲与性别是有关的.故选C.
13.【答案】0.05
【解析】根据k>3.841,可判断在犯错误的概率不超过0.05的前提下,认为主修统计专业与性别有关系.故出错的概率为0.05.
14.【答案】(1)甲厂生产的零件的优质品率为,乙厂生产的零件的优质品率为;(2)在犯错误的概率不超过0.01的前提下,即有99%的把握认为“两个分厂生产的零件的质量有差异”.
【解析】(1)甲厂抽查的产品中有360件优质品,
从而估计甲厂生产的零件的优质品率为;
乙厂抽查的产品中有320件优质品,
从而估计乙厂生产的零件的优质品率为.
(2)列联表如下:
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1000
所以,
因此,在犯错误的概率不超过0.01的前提下,即有99%的把握认为“两个分厂生产的零件的质量有差异”.
15.【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.

(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66

由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.