3.2 独立性检验的基本思想及其初步应用 同步学案

文档属性

名称 3.2 独立性检验的基本思想及其初步应用 同步学案
格式 zip
文件大小 140.8KB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2019-06-10 13:59:50

图片预览

文档简介

选修2-3 第三章 §3.2独立性检验的基本思想及其初步应用
班级 姓名
学习目标
1、理解回归模型的一般步骤;
2、回归模型在实际生活中的应用。
学习过程
一、课前准备
引入:某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。根据这些数据能否断定:患肺癌与吸烟有关?
二、新课导学
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表
患肺癌
不患肺癌
总计
吸烟
7775
42
7817
不吸烟
2099
49
2148
总计
9874
91
9965
在不吸烟者中患肺癌的比重是
在吸烟者中患肺癌的比重是
问题1:判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是否有差异?
问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?能否用数量刻画出
“有关”的程度?
独立性检验:通过数据和图表分析,得到结论是:吸烟与患肺癌有关
思考:结论的可靠程度如何?
吸烟与肺癌列联表
患肺癌
不患肺癌
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
令H: 吸烟和患肺癌之间没有关系 :吸烟和患肺癌之间有关系
吸烟的人中患肺癌的比例:
不吸烟的人中患肺癌的比例:
若H成立,则:
独立性检验
引入一个随机变量:卡方统计量
作为检验在多大程度上可以认为“两个变量有关系”的标准
例1、引例
吸烟与肺癌列联表
患肺癌
不患肺癌
总计
吸烟
7775
42
7817
不吸烟
2099
49
2148
总计
9874
91
9965
通过公式计算 =
独立性检验过程:
已知在成立的情况下,
即在成立的情况下,大于10.828概率非常小,近似为0.001
现在的=56.632的观测值远大于10.828,出现这样的观测值的概率不超过0.001。
故有99.9%的把握认为不成立,即有99.9%的把握认为“患肺癌与吸烟有关系”。
归纳:独立性检验的一般步骤:
独立性检验与反证法的联系:
※ 典型例题
例2、某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
7
25
学习积极性一般
6
19
25
合计
24
26
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?
三、总结提升
独立性检验的基本思想及其应用步骤
课后作业
1.班级与成绩2×2列联表:
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
p
总计
m
n
q
表中数据m,n,p,q的值应分别为(  )
A.70,73,45,188    B.17,73,45,90 C.73,17,45,90 D.17,73,45,45
2.下列关于回归分析与独立性检验的说法正确的是(  )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
3.对于独立性检验,下列说法正确的是(  )
A.X2>3.841时,有95%的把握说事件A与B无关
B.X2>6.635时,有99%的把握说事件A与B有关
C.X2≤3.841时,有95%的把握说事件A与B有关
D.X2>6.635时,有99%的把握说事件A与B无关
4.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验(  )
A.H0:男性喜欢参加体育活动 B.H0:女性不喜欢参加体育活动
C.H0:喜欢参加体育活动与性别有关 D.H0:喜欢参加体育活动与性别无关
5.在列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大(  )
A.与     B.与 C.与 D.与
6.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是(  )
A.k越大,“X与Y有关系”的可信程度越小 B.k越小,“X与Y有关系”的可信程度越小
C.k越接近于0,“X与Y没有关系”的可信程度越小
D.k越大,“X与Y没有关系”的可信程度越大
7.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校学生中随机抽取了50名学生,得到如下列联表:
喜欢数学
不喜欢数学
合计

13
10
23

7
20
27
合计
20
30
50
根据表中数据,得到k=≈4.844>3.841,你认为性别与是否喜欢数学课程之间有关系,这种判断犯错误的概率不超过(  )
A.0    B.0.05    C.0.01    D.1
8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).
9.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.
10.若两个分类变量X与Y的列联表为:
y1
y2
总计
x1
10
15
25
x2
40
16
56
总计
50
31
81
则“X与Y之间有关系”这个结论出错的概率为________.
11.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?
12.有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?
选修2-3 第三章 §3.2独立性检验的基本思想及其初步应用参考答案
1、【答案】 B
【解析】 m=7+10=17,n=35+38=73,
p=7+38=45,q=m+n=90.
2、【答案】 C
【解析】 由回归分析及独立性检验的特点知选项C正确.
3、【答案】 B
【解析】 由独立性检验的知识知:X2>3.841时,有95%的把握认为“变量X与Y有关系”;
X2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.
4、【答案】 D
【解析】 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.
5、【答案】 C
【解析】 由等高条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.
6、【答案】 B
【解析】 K2的观测值k越大,“X与Y有关系”的可信程度越大.因此,A、C、D都不正确.
7、【答案】 B
【解析】 ∵4.844>3.841,根据临界值表可知,认为性别与是否喜欢数学有关系,这种判断犯错误的概率不超过0.05.
8、【答案】 是
【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.
9、【答案】 5%
【解析】 ∵P(k2≥3.841)≈0.05.
∴判断性别与是否爱好运动有关,出错的可能不超过5%.
10、【答案】 0.01
【解析】 由列联表的数据,可求得随机变量K2的观测值k=≈7.227>6.635.
因为P(K2≥6.635)≈0.01,所以“X与Y之间有关系”出错的概率仅为0.01.
11、【解】 (1)由已知可列2×2列联表:
患胃病
未患胃病
总计
生活规律
20
200
220
生活不规律
60
260
320
总计
80
460
540
(2)根据列联表中的数据,由计算公式得K2的观测值
k=≈9.638.
∵9.638>6.635,
因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.
12、【解】 查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而
k===.
由k≥2.706得a≥7.19或a≤2.04.
又a>5且15-a>5,a∈Z,即a=8或9.
故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.