(共45张PPT)
8.3.1 分类变量与列联表 8.3.2 独立性检验
激趣诱思
知识点拨
有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?“如果你认为健康问题不一定是由吸烟引起的,那么可以吸烟”的说法对吗?要回答这个问题,我们先一起来学习本课时的知识吧!
激趣诱思
知识点拨
一、分类变量与列联表
1.分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.列联表:在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.
激趣诱思
知识点拨
名师点析制作2×2列联表的基本步骤
第一步,合理选取两个变量,且每一个变量都可以取两个值;
第二步,抽取样本,整理数据;
第三步,画出2×2列联表.
激趣诱思
知识点拨
微练习
在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个2×2列联表.
解:2×2列联表如下:
类别
存活数
死亡数
合计
药物治疗
132
18
150
常规治疗
114
36
150
合计
246
54
300
激趣诱思
知识点拨
二、独立性检验
1.2×2列联表
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
激趣诱思
知识点拨
2.χ2统计量的计算公式
3.独立性的判断方法
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2激趣诱思
知识点拨
4.独立性检验
利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
激趣诱思
知识点拨
微练习
某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
态度
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
对于人力资源部的研究项目,依据小概率α=0.005的独立性检验,分析企业员工工作积极性和对待企业改革态度是否有关联.
激趣诱思
知识点拨
解:零假设为H0:企业的员工工作积极性和对待企业改革的态度无关联.
从题表中的数据可知:
a=54,b=40,c=32,d=63,
a+b=94,c+d=95,a+c=86,b+d=103,
n=189,
代入公式得
依据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为员工工作积极性与对待企业改革的态度有关联.
探究一
探究二
素养形成
当堂检测
独立性检验
例1某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
类型
喜欢甜品
不喜欢甜品
合计
南方学生
60
20
80
北方学生
10
10
20
合计
70
30
100
试根据小概率值α=0.05的独立性检验,分析南方学生和北方学生在选用甜品的饮食习惯方面是否有差异.
探究一
探究二
素养形成
当堂检测
解:零假设为H0:南方学生和北方学生在选用甜品的饮食习惯方面无差异.将2×2列联表中的数据代入公式计算,得
依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.
探究一
探究二
素养形成
当堂检测
反思感悟
独立性检验的具体做法
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
探究一
探究二
素养形成
当堂检测
变式训练1某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关联.
探究一
探究二
素养形成
当堂检测
解:(1)2×2列联表如下:
教师类型
赞同
不赞同
合计
老教师
10
10
20
青年教师
24
6
30
合计
34
16
50
(2)零假设为H0:对新课程教学模式的赞同情况与教师年龄无关联.
依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为对新课程教学模式的赞同情况与教师年龄无关联.
探究一
探究二
素养形成
当堂检测
独立性检验的综合应用
例2海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
探究一
探究二
素养形成
当堂检测
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50
kg,新养殖法的箱产量不低于50
kg”,估计事件A的概率;
(2)填写下面列联表,并依据α=0.01的独立性检验,分析箱产量与养殖方法是否有关联;
类型
箱产量<50
kg
箱产量≥50
kg
合计
旧养殖法
?
?
?
新养殖法
?
?
?
合计
?
?
?
探究一
探究二
素养形成
当堂检测
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
探究一
探究二
素养形成
当堂检测
解:(1)记B表示事件“旧养殖法的箱产量低于50
kg”,C表示事件“新养殖法的箱产量不低于50
kg”.
由题意知P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50
kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50
kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66.
故P(C)的估计值为0.66.
因此,事件A的概率估计值为0.62×0.66=0.409
2.
探究一
探究二
素养形成
当堂检测
(2)零假设为H0:箱产量与养殖方法无关联.根据箱产量的频率分布直方图得如下列联表:
类型
箱产量<50
kg
箱产量≥50
kg
合计
旧养殖法
62
38
100
新养殖法
34
66
100
合计
96
104
200
根据列联表中的数据,经计算得到
依据α=0.01的独立性检验,我们推断H0不成立,即认为箱产量与养殖方法有关联.
探究一
探究二
素养形成
当堂检测
(3)因为在新养殖法的箱产量频率分布直方图中,箱产量低于50
kg的直方图面积为
(0.004+0.020+0.044)×5=0.34<0.5,
箱产量低于55
kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法箱产量的中位数的估计值为
反思感悟
两个分类变量相关关系的判断
通过2×2列联表,先计算χ2的值,再借助χ2的取值判断两个分类变量是否有关联.
探究一
探究二
素养形成
当堂检测
变式训练2为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,并得到了如下的2×2列联表:
性别
喜爱打篮球
不喜爱打篮球
合计
男生
?
6
?
女生
10
?
?
合计
?
?
48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为
探究一
探究二
素养形成
当堂检测
(1)请将上面的2×2列联表补充完整(不用写计算过程).
(2)依据α=0.05的独立性检验,能否认为喜爱打篮球与性别有关联?说明你的理由.
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
探究一
探究二
素养形成
当堂检测
解:(1)列联表补充如下:
性别
喜爱打篮球
不喜爱打篮球
合计
男生
22
6
28
女生
10
10
20
合计
32
16
48
(2)零假设为H0:喜爱打篮球与性别无关联.根据列联表中的数据,经
依据α=0.05的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.
探究一
探究二
素养形成
当堂检测
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
故X的分布列为
探究一
探究二
素养形成
当堂检测
独立性检验与统计的综合应用
典例某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50人,一年后对两班进行测试,成绩如下表(总分:150分):
甲班
成绩
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
人数
4
20
15
10
1
乙班
成绩
[80,90)
[90,100)
[100,110)
[110,120)
[120,130)
人数
1
11
23
13
2
探究一
探究二
素养形成
当堂检测
(1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果.
(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8分,请你估计乙班的平均分,并计算两班平均分的差距.
(3)完成下面2×2列联表,并依据α=0.05的独立性检验,分析这两个班在这次测试中成绩的差异与实施课题实验是否有关联,并请说明理由.
班别
成绩小于100分
成绩不小于100分
合计
甲班
a= ?
26
50
乙班
12
d= ?
50
合计
36
64
100
探究一
探究二
素养形成
当堂检测
解:(1)用分层随机抽样的方法更合理.甲班成绩位于[90,120)内的试
探究一
探究二
素养形成
当堂检测
(3)补全列联表如下:
班别
成绩小于100分
成绩不小于100分
合计
甲班
a=24
26
50
乙班
12
d=38
50
合计
36
64
100
零假设为H0:这两个班在这次测试中成绩的差异与实施课题实验无关联.由表中的数据,
依据α=0.05的独立性检验,我们推断H0不成立,即认为这两个班在这次测试中成绩的差异与实施课题实验有关联.
探究一
探究二
素养形成
当堂检测
方法点睛
1.由[90,120)内的三组数据存在差异确定抽样方法,从而确定各区间抽样份数.
2.累加各组的组中值与频率的积,并计算乙班的平均分,从而得到两班平均分的差.
3.根据所给的数据得到2×2列联表,由列联表中的数据求出χ2,结合临界值表得出结论.
探究一
探究二
素养形成
当堂检测
1.(2019天津高二期中)在吸烟与患肺病这两个分类变量中,零假设为H0:吸烟与患肺病无关联.下列说法正确的是( )
①依据α=0.05的独立性检验认为吸烟与患肺病有关联时,我们说某人吸烟,他一定患有肺病;
②从统计量中得知依据α=0.05的独立性检验认为吸烟与患肺病有关联,是指不超过0.05的概率使得推断出现错误;
③如果由χ2的值得到依据α=0.05的独立性检验认为吸烟与患肺病有关联,那么在100个吸烟的人中必有95人患有肺病.
A.①
B.②
C.③
D.②③
解析:根据α=0.05的独立性检验认为吸烟与患肺病有关联时,指的是不超过0.05的概率使得推断出现错误,故②正确;可知①③错误.故选B.
答案:B
探究一
探究二
素养形成
当堂检测
2.(2019重庆巴蜀中学高二期末)在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:
性别
看书
运动
合计
男
8
20
28
女
16
12
28
合计
24
32
56
附:
α
0.05
0.01
xα
3.841
6.635
A.0.99
B.0.95
C.0.01
D.0.05
探究一
探究二
素养形成
当堂检测
解析:零假设为H0:休闲方式与性别无关联.结合题意和独立性检验的结论,由χ2≈4.667>3.841=x0.05,
根据α=0.05的独立性检验,我们推断H0不成立,即认为休闲方式与性别有关联.
故选D.
答案:D
探究一
探究二
素养形成
当堂检测
3.(2020湖北高二期末)手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了严重的影响.某校高一几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成下表,则下列说法正确的是( )
类别
成绩优秀
成绩不优秀
合计
不用手机
40
10
50
使用手机
5
45
50
合计
45
55
100
α
0.01
0.005
0.001
xα
6.635
7.879
10.828
探究一
探究二
素养形成
当堂检测
A.依据α=0.001的独立性检验认为使用手机与学习成绩有关联
B.依据α=0.001的独立性检验认为使用手机与学习成绩无关联
C.依据α=0.005的独立性检验认为使用手机对学习成绩无影响
D.依据α=0.01的独立性检验认为使用手机对学习成绩有影响
解析:零假设为H0:使用手机与学习成绩无关联.因为
所以依据α=0.001的独立性检验,我们推断H0不成立,即认为使用手机与学习成绩有关联.
故选A.
答案:A
探究一
探究二
素养形成
当堂检测
4.(2020广东高三月考)2019年10月18日到27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示:
满意度
男性运动员
女性运动员
合计
对主办方表示满意
200
220
420
对主办方表示不满意
50
30
80
合计
250
250
500
探究一
探究二
素养形成
当堂检测
现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为
;②依据α=0.01的独立性检验认为对主办方表示满意与运动员的性别有关联;③依据α=0.01的独立性检验认为对主办方表示满意与运动员的性别无关联.其中正确的个数为( )
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
A.0
B.1
C.2
D.3
探究一
探究二
素养形成
当堂检测
答案:B
探究一
探究二
素养形成
当堂检测
5.(2019北京师大附中高考模拟)已知某企业有职工5
000人,其中男职工3
500人,女职工1
500人.该企业为了丰富职工的业余生活,决定新建职工活动中心.为此,该企业工会采用分层随机抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:h),汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间.
平均运动时间
频数
频率
[0,2)
15
0.05
[2,4)
m
0.2
[4,6)
45
0.15
[6,8)
755
0.25
[8,10)
90
0.3
[10,12)
p
n
合计
300
1
探究一
探究二
素养形成
当堂检测
(1)求抽取的女职工的人数;
(2)①根据频率分布表,求出m,n,p的值,补全如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4
h的概率;
运动时间
男职工
女职工
合计
平均运动时间低于4
h
?
?
?
平均运动时间不低于4
h
?
?
?
合计
?
?
?
②若在样本数据中,有60名女职工每周的平均运动时间不低于4
h,请完成以下2×2列联表,并说明依据α=0.05的独立性检验,能否认为该企业职工每周的平均运动时间不低于4
h与性别有关联.
探究一
探究二
素养形成
当堂检测
α
0.25
0.15
0.10
0.05
0.025
xα
1.323
2.072
2.706
3.841
5.024
探究一
探究二
素养形成
当堂检测
(2)①n=1-0.05-0.2-0.15-0.25-0.3=0.05,
p=300×0.05=15,m=300-15-45-75-90-15=60.
频率分布直方图如图:
探究一
探究二
素养形成
当堂检测
估计该企业职工每周的平均运动时间不低于4
h的概率为
P=0.15+0.25+0.3+0.05=0.75=
②2×2列联表如下所示:
运动时间
男职工
女职工
合计
平均运动时间低于4
h
45
30
75
平均运动时间不低于4
h
165
60
225
合计
210
90
300
探究一
探究二
素养形成
当堂检测
零假设为H0:该企业职工每周的平均运动时间不低于4
h与性别无关联.根据列联表中的数据,经计算得到
依据α=0.05的独立性检验,我们推断H0不成立,即认为该企业职工每周的平均运动时间不低于4
h与性别有关联.第八章成对数据的统计分析
8.3 列联表与独立性检验
8.3.1 分类变量与列联表 8.3.2 独立性检验
课后篇巩固提升
基础达标练
1.(2020全国高三专题练习)下列说法错误的是( )
A.经验回归直线过()
B.若两个随机变量的线性相关性越强,则样本相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量χ2越大,则推断X与Y有关联时犯错误的概率越大
D.在经验回归方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量增加0.2个单位
解析根据相关定义分析知A,B,D正确;对分类变量X与Y,随机变量χ2越大,则推断X与Y有关联时犯错误的概率越小,故C错误,故选C.
答案C
2.(2020江西高安中学高二期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关联”进行了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.零假设为H0:追星和性别无关联.若依据α=0.05的独立性检验认为追星和性别有关联,则男生的人数至少为( )
参考数据及公式如下:
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
χ2=
A.12
B.11
C.10
D.18
解析设男生人数为x,依题意可得如下2×2列联表:
性别
喜欢追星
不喜欢追星
合计
男生
x
女生
合计
x
若依据α=0.05的独立性检验认为喜欢追星和性别有关联,
则χ2≥3.841.
由χ2=x≥3.841,解得x≥10.24.
因为为整数,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为喜欢追星和性别有关联,男生的人数至少为12.故选A.
答案A
3.(2020山东高三期末)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下的列联表.零假设为H0:男、女生对该食堂的服务评价无差异.经计算χ2≈4.762,则可以推断出( )
性别
满意
不满意
合计
男
30
20
50
女
40
10
50
合计
70
30
100
附:
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.依据α=0.05的独立性检验认为男、女生对该食堂服务的评价有差异
D.依据α=0.01的独立性检验认为男、女生对该食堂服务的评价有差异
解析对于选项A,该学校男生对食堂服务满意的概率的估计值为,故A错误;
对于选项B,该学校女生对食堂服务满意的概率的估计值为,故B错误;
因为χ2≈4.762>3.841=x0.05,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
故选C.
答案C
4.在对某小学的学生进行吃零食的调查中,得到数据如下表:
性别
吃零食
不吃零食
合计
男
27
34
61
女
12
29
41
合计
39
63
102
根据上述数据分析,可得χ2约为 .?
解析χ2=≈2.334.
答案2.334
5.在独立性检验中,xα有两个临界值:3.841和6.635.当χ2>3.841时,依据α=0.05的独立性检验认为两个事件有关联;当χ2>6.635时,依据α=0.01的独立性检验认为两个事件有关联;当χ2≤3.841时,依据α=0.05的独立性检验认为两个事件无关联.在一项打鼾与患心脏病的调查中,共调查了2
000人,零假设为H0:打鼾与患心脏病之间无关联.经计算χ2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间 .(有关联、无关联).?
解析因为χ2=20.87>6.635,所以依据α=0.01的独立性检验,我们推断H0不成立,即认为两者有关联.
答案有关联
6.有人发现了一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少.为了研究国籍和邮箱名称里含有数字的关系,小明收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.
(1)根据以上数据建立2×2列联表;
(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关联,你能依据α=0.025的独立性检验帮他判断一下吗?
附:
α
0.15
0.10
0.05
0.025
0.010
xα
2.072
2.706
3.841
5.024
6.635
解(1)2×2的列联表如下:
类型
中国人
外国人
合计
有数字
43
27
70
无数字
21
33
54
合计
64
60
124
(2)零假设为H0:国籍和邮箱名称里是否含有数字无关联.
由表中数据得χ2=≈6.201>5.024=x0.025.
依据α=0.025的独立性检验,我们推断H0不成立,即认为国籍和邮箱名称里是否含有数字有关联.
能力提升练
1.某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,零假设为H0:这种血清与预防感冒之间无关联.利用2×2列联表计算得χ2≈3.918.下列叙述中正确的是( )
A.依据α=0.05的独立性检验认为这种血清与预防感冒之间有关联
B.若有人未使用该血清,则他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
解析因为χ2≈3.918>3.841=x0.05,所以依据α=0.05的独立性检验,我们推断H0不成立,即认为这种血清与预防感冒之间有关联.故选A.
答案A
2.(多选)(2020山东高三期末)针对时下的“抖音热”,某校团委对学生性别和喜欢抖音是否有关联进行了一次调查,其中被调查的男生、女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的.零假设为H0:喜欢抖音和性别无关联.若依据α=0.05的独立性检验认为喜欢抖音和性别有关联,则调查人数中男生的人数可能为( )
附表:
α
0.050
0.010
xα
3.841
6.635
附:χ2=
A.25
B.45
C.60
D.75
解析设男生的人数为5n(n∈N
),根据题意列出2×2列联表如下:
类型
男生
女生
合计
喜欢抖音
4n
3n
7n
不喜欢抖音
n
2n
3n
合计
5n
5n
10n
则χ2=.
因为依据α=0.05的独立性检验,我们推断H0不成立,即认为喜欢抖音和性别有关联,所以χ2≥3.841,
即≥3.841,解得n≥8.066
1,
因为n∈N
,
所以调查人数中男生人数的可能值为45或60.
故选BC.
答案BC
3.某班主任对全班50名学生进行了一次调查,所得数据如下表:
态度
认为作业多
认为作业不多
合计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
合计
26
24
50
由表中数据计算得到χ2≈5.059,依据α=0.01的独立性检验认为喜欢玩电脑游戏与认为作业多 .(有关联、无关联)?
解析零假设为H0:喜欢玩电脑游戏与认为作业多无关联.由题意可得χ2=≈5.059<6.635=x0.01.依据α=0.01的独立性检验,我们推断H0不成立,即认为喜欢玩电脑游戏与认为作业多无关联.
答案无关联
4.(2019湖北高二期末)某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:
性别
同意限定区域停车
不同意限定区域停车
合计
男
20
5
25
女
10
15
25
合计
30
20
50
则依据α= 的独立性检验认为同意限定区域停车与家长的性别有关联.?
附:χ2=,其中n=a+b+c+d.
α
0.050
0.005
0.001
xα
3.841
7.879
10.828
解析零假设为H0:同意限定区域停车与家长的性别无关联.因为χ2=≈8.333>7.789=x0.005,
所以依据α=0.005的独立性检验,我们推断H0不成立,即认为同意限定区域停车与家长的性别有关联.
答案0.005
5.随着生活水平的提高,人们患肝病的越来越多.为了解中年人患肝病与经常饮酒是否有关联,现对30名中年人进行了问卷调查,得到的数据如下列联表:
类别
常饮酒
不常饮酒
合计
患肝病
2
不患肝病
18
合计
30
已知在全部30人中随机抽取1人,抽到肝病患者的概率为.
(1)请将上面的列联表补充完整,依据α=0.005的独立性检验能否认为患肝病与常饮酒有关联?说明你的理由.
(2)现从常饮酒且患肝病的中年人(恰有2名女性)中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?
参考数据:
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解(1)设患肝病中常饮酒的人有x人,则,解得x=6.
补充完整的列联表如下:
类别
常饮酒
不常饮酒
合计
患肝病
6
2
8
不患肝病
4
18
22
合计
10
20
30
零假设为H0:患肝病与经常饮酒无关联.由已知数据可求得
χ2=≈8.523>7.879=x0.005,
依据α=0.005的独立性检验,我们推断H0不成立,即认为患肝病与经常饮酒有关联.
(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=.
6.(2020山东高三期末)书籍是文化的重要载体,读书是承继文化的重要方式.某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求n,p的值;
(2)根据已知条件完成下面的2×2列联表,依据α=0.05的独立性检验能否认为“读书之星”与性别有关联?
性别
非读书之星
读书之星
合计
男
女
10
55
合计
(3)将上述调查所得到的频率视为概率,现从该地区大量学生中随机抽取3名学生,每次抽取1名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量X,求X的分布列和均值E(X).
附:χ2=,其中n=a+b+c+d.
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
解(1)因为(0.005+p+0.018+0.020+0.022+0.025)×10=1,
所以p=0.01.
所以n==100.
(2)因为n=100,所以“读书之星”有100×0.25=25(人).
从而2×2列联表如下所示:
性别
非读书之星
读书之星
合计
男
30
15
45
女
45
10
55
合计
75
25
100
零假设为H0:“读书之星”与性别无关联.将2×2列联表中的数据代入公式计算得
χ2=≈3.030<3.841=x0.05.
依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为“读书之星”与性别无关联.
(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为.
由题意可知X~B3,.
所以P(X=0)=;
P(X=1)=;
P(X=2)=×1-=;
P(X=3)=.
所以X的分布列为
X
0
1
2
3
P
E(X)=3×.
素养培优练
(2020山东新泰第二中学高三模拟)某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造前后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:
改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21
改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36
(1)完成下面的列联表,依据α=0.01的独立性检验,能否据此判断技术改造前后的连续正常运行时间有差异?
时间
超过30
不超过30
合计
改造前
改造后
合计
(2)工厂的生产设备需要进行维护,工厂对生产设备的维护费用包括正常维护费和保障维护费两种.对生产设备设定维护周期为T天,即从开工运行到第kT天(k∈N
)进行维护.生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还会产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次保障维护费增加0.2万元.现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内维护费用的分布列及均值.
附:χ2=
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
解(1)零假设为H0:技术改造前后的连续正常运行时间无差异.由题意可得列联表如下:
时间
超过30
不超过30
合计
改造前
5
15
20
改造后
15
5
20
合计
20
20
40
根据列联表中的数据,经计算得到χ2==10>6.635=x0.01.
依据α=0.01的独立性检验,我们推断H0不成立,即认为技术改造前后的连续正常运行时间有差异.
(2)由题知,生产周期内有4个维护周期,一个维护周期为30天.在一个维护周期内,生产线需保障维护的概率为P=.
设一个生产周期内需保障维护的次数为ξ,可知ξ~B4,.一个生产周期内的正常维护费为0.5×4=2(万元),保障维护费为=(0.1ξ2+0.1ξ)(万元).
所以一个生产周期内需保障维护ξ次时的维护费用为(0.1ξ2+0.1ξ+2)万元.
设一个生产周期内的维护费用为X,则X的所有可能取值为2,2.2,2.6,3.2,4,
且P(X=2)=;
P(X=2.2)=;
P(X=2.6)=;
P(X=3.2)=1-;
P(X=4)=.
所以X的分布列为
X
2
2.2
2.6
3.2
4
P
所以E(X)=2×+2.2×+2.6×+3.2×+4×
==2.275.
所以一个生产周期内生产维护费的均值为2.275.