8.3.2 独立性检验(同步训练)
1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )
A.零假设H0:男性喜欢参加体育活动
B.零假设H0:女性不喜欢参加体育活动
C.零假设H0:喜欢参加体育活动与性别有关
D.零假设H0:喜欢参加体育活动与性别无关
2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现χ2的观测值χ=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
A.90% B.95% C.99% D.99.5%
3.下列选项中可以有95%以上的把握认为“X与Y有关系”的χ2 的值为( )
A.χ2=2.700 B.χ2=2.710
C.χ2=3.765 D.χ2=5.014
4.某卫生机构抽取了366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人,阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病与遗传有关系出错的概率不超过( )
A.0.001 B.0.005 C.0.01 D.0.05
5.考察棉花种子是否经过处理跟生病之间的关系得到下表数据:
生病情况 是否处理 合计
种子处理 种子未处理
得病 32 101 133
不得病 61 213 274
总计 93 314 407
根据以上数据,可得出( )
A.种子是否经过处理跟是否生病有关 B.种子是否经过处理跟是否生病无关
C.种子是否经过处理决定是否生病 D.以上都是错误的
6.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,经过计算得到x2=4.844>3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约是( )
A.0.5% B.1%
C.5% D.10%
7.(多选)有两个分类变量X,Y,其列联表为:
X Y 合计
Y=y1 Y=y2
X=x1 a 20-a 20
X=x2 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,若依据α=0.05的独立性检验可以认为Y与X有关,则a的可能取值为( )
A.6 B.7 C.8 D.9
8.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
态度 性别 合计
男 女
爱好 40 20 60
不爱好 20 30 50
合计 60 50 110
经计算得χ2=7.8,则正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
9.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________(填“有关的”或“无关的”).
10.下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
性别 是否知道想学专业 合计
知道想学专业 不知道想学专业
男生 63 117 180
女生 42 82 124
合计 105 199 304
根据表中数据,下列说法正确的是______.(填序号)
①性别与知道想学专业有关;②性别与知道想学专业无关;
③女生比男生更易知道所学专业.
11.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:
学历 是否按时完成销售任务 合计
能按时完成 销售任务 不能按时完 成销售任务
具有相关大学学历 57 42 99
不具有相关大学学历 36 65 101
合计 93 107 200
根据上述数据能得出结论:有________以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.
12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________.
①若χ2的观测值χ=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
13.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的题目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断.
14.为研究患肺癌与吸烟是否有关,有人做了一次相关调查,其中部分数据丢失,但可以确定的是不吸烟人数与吸烟人数相等,吸烟患癌人数占吸烟总人数的,不吸烟的人数中,患肺癌与不患肺癌的人数之比为1∶4.若研究得到在犯错误概率不超过0.001的前提下,认为患肺癌与吸烟有关,则吸烟人数至少有多少?
15.某学校为了解该校高三年级学生在市一模考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.
(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异?
数学 成绩 学生 合计
文科 理科
优秀
非优秀
合计 50 50 100
(2)某高校派出2名教授对该校随机抽取的学生成绩中一模数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.
参考答案:
1.D
解析:独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的χ2应该很小,如果χ2很大,则可以否定假设,如果χ2很小,则不能够肯定或者否定假设.
2.B 解析:因为χ2=6.023>3.841=x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.
3.D 解析:因为5.014>3.841,所以D正确.
4.D
解析:可先作出如下列联表:
遗传 健康体检 合计
糖尿病发病 糖尿病不发病
阳性家族史者 16 93 109
阴性家族史者 17 240 257
合计 33 333 366
根据列联表中的数据,得到χ2的观测值χ2=≈6.067>3.841=x0.05.故在犯错误的概率不超过0.05的前提下认为糖尿病患者与遗传有关系.
5.B
解析:由χ2=≈0.164<2.706=x0.1,即没有把握认为种子是否经过处理跟是否生病有关.
6.C 解析:∵P(χ2≥3.841)≈0.05,∴判断出错的可能性有5%.
7.CD
解析:根据a>5且15-a>5,a∈Z,知a可取6,7,8,9,由表中数据及题意,得χ2=≥3.841=x0.05,知a可能取值为8,9.
8.答案:A
解析:根据独立性检验的定义,由χ2=7.8>6.635=x0.01可知,有99%以上把握认为“爱好该项运动与性别有关”.
9.答案:有关的
解析:χ2=27.63>10.828=x0.001,有99.9%以上的把握认为这两个量是有关的.
10.答案:②
解析:χ2=≈0.041≤2.706=x0.1,所以性别与知道想学专业无关.
11.答案:99%
解析:χ2=≈9.67>6.635=x0.01,所以有99%以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.
12.答案:③
解析:χ2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
13.解:建立性别与态度的2×2列联表如下:
性别 态度 合计
肯定 否定
男生 22 88 110
女生 22 38 60
合计 44 126 170
根据列联表中所给的数据,可求出男生中作肯定态度的频率为=0.2,女生中作肯定态度的频率为≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.
假设H0:性别和态度无关.
根据列联表中的数据得到χ2的观测值χ2=≈5.622>3.841=x0.05.
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为性别和态度有关系,此推断犯错误的概率不大于0.05.
14.解:设吸烟人数为5x,由题意可得列联表如下:
吸烟 情况 患病情况 合计
患肺癌 不患肺癌
吸烟 4x x 5x
不吸烟 x 4x 5x
合计 5x 5x 10x
χ2==3.6x. 由题意知3.6x≥10.828,故x≥3.008.
因为x为整数,故x最小值为4.故5x=20,吸烟人数至少为20人.
15.解:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.
则2×2列联表如下:
数学成绩 学生 合计
文科 理科
优秀 8 20 28
非优秀 42 30 72
合计 50 50 100
∴χ2=≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.
(2)由(1)知,该校随机抽取的学生成绩中一模数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为CC+CC+CC=14,则P(ξ=1)==,P(ξ=2)==,P(ξ=3)==.
∴ξ的分布列为
ξ 1 2 3
P
∴E(ξ)=1×+2×+3×=2.