8.3列联表与独立性检验
一、单选题
1.下列关于独立性检验的叙述
①常用等高条形图表示列联表数据的频率特征;
②独立性检验依据小概率原理;
③独立性检验的结果是完全正确的;
④对分类变量与的随机变量的观测值来说,越小,与有关系的把握程度就越大.
其中叙述正确的个数为(
)
A.1
B.2
C.3
D.4
2.“微信”和“QQ”是腾讯社交体系中的两款产品,小明为了解不同群体对这两款产品的首选情况,统计了周围老师和同学关于首选“微信”或“QQ”的比例,得到如图等高条形图.根据等高条形图中的信息,可判断下列说法正确的是(
)
A.对老师而言,更倾向于首选“微信”
B.对学生而言,更倾向于首选“QQ”
C.首选“微信”的老师比首选“微信”的同学多
D.如果首选“微信”的老师比首选“微信”的同学多,则小明统计的老师人数一定比学生多
3.在一次独立性检验中,得出列联表如图:且最后发现,两个分类变量A和B没有任何关系,则a的可能值是(
)
A
合计
B
200
800
1000
180
a
180+a
合计
380
800+a
1180+a
A.200
B.720
C.100
D.180
4.如图是调查某学校高一、高二年级学生参加社团活动的等高条形图,阴影部分的高表示参加社团的频率.已知该校高一、高二年级学生人数均为人(所有学生都参加了调查),现从参加社团的同学中按分层抽样的方式抽取人,则抽取的高二学生人数为(
)
A.
B.
C.
D.
5.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男生女生各500名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽取32人,则抽取的男生人数为
A.16
B.32
C.24
D.8
6.下面是一个列联表
则表中处的值分别为
A.
B.
C.
D.
7.2018年12月1日,贵阳市地铁一号线全线开通,在一定程度上缓解了出行的拥堵状况.为了了解市民对地铁一号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:
根据图中(岁以上含岁)的信息,下列结论中不一定正确的是
A.样本中男性比女性更关注地铁一号线全线开通
B.样本中多数女性是岁以上
C.岁以下的男性人数比岁以上的女性人数多
D.样本中岁以上的人对地铁一号线的开通关注度更高
8.观察如图所示的等高条形图,其中最有把握认为两个分类变量x,y之间有关系的是
A.
B.
C.
D.
9.下列关于独立性检验的叙述:
①常用等高条形图展示列联表数据的频率特征;
②独立性检验依据小概率原理;
③样本不同,独立性检验的结论可能有差异;
④对分类变量与的随机变量的观测值来说,越小,与有关系的把握程度就越大.
其中正确的个数为
A.1
B.2
C.3
D.4
10.对于分类变量X与Y的随机变量x2的值,下列说法正确的是(
)
A.x2越大,“X与Y有关系”的可信程度越小
B.x2越小,“X与Y有关系”的可信程度越小
C.x2越接近于0,“X与Y没有关系”的可信程度越小
D.x2越大,“X与Y没有关系”的可信程度越大
11.以下结论不正确的是(
)
A.根据列联表中的数据计算得出,而,则有99%的把握认为两个分类变量有关系
B.的值越大,两个事件的相关性就越大
C.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
D.在回归直线中,变量时,变量的值一定是15
12.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;
③吸烟者得肺病的概率;④吸烟是否与性别有关系;
⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有(
)
A.①②③
B.②④⑤
C.②③④⑤
D.①②③④⑤
13.为了调查中学生近视情况,某校名男生中有名近视,名女生中有名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力(
)
A.平均数
B.方差
C.回归分析
D.独立性检验
14.如果根据性别与是否爱好运动的列联表得到,所以判断性别与运动有关,那么这种判断犯错的可能性不超过(
).
A.%
B.%
C.1%
D.5%
15.为调查乘客晕车情况,在某一次行程中,50名男乘客中有25名晕车,30名女乘客中有5名晕车.在检验这些乘客晕车是否与性别相关时,常采用的数据分析方法是(
)
A.回归分析
B.独立性检验
C.频率分布直方图
D.用样本估计总体
16.给出以下四个说法:①残差点分布的带状区域的宽度越窄,相关指数越小;②在刻画回归模型的拟合效果时,相关指数越接近于,说明拟合的效果越好;③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加个单位:④对分类变量与,若它们的随机变量的观测值越小,则判断“与有关系”的把握程度越大.其中正确的说法是(
)
A.①④
B.②④
C.①③
D.②③
17.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(
)
附:独立性检验的临界值表:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.若K2的观测值k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能性患有肺病
C.从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得判断出现错误
D.以上三种说法都不正确
18.下列说法中不正确的是(
)
A.独立性检验是检验两个分类变量是否有关的一种统计方法
B.独立性检验得到的结论一定是正确的
C.独立性检验的样本不同,其结论可能不同
D.独立性检验的基本思想是带有概率性质的反证法
第II卷(非选择题)
请点击修改第II卷的文字说明
二、解答题
19.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.附表:
(1)根据已知条件完成下面的列联表,并据此资料判断是否有的把握认为“体育迷”与性别有关?
非体育迷
体育迷
合计
男
女
合计
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取名观众,抽取次,记被抽取的名观众中的“体育迷”人数为.若每次抽取的结果是相互独立的,求的分布列,期望和方差.
20.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据以上数据完成下列列联表:
主食蔬菜
主食肉类
总计
50岁以下
50岁以上
总计
(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.
参考公式和数据:,.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
21.为推动更多人阅读,联合国教科文组织确定每年的月日为“世界读书日”.设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了名居民,经统计这人中通过电子阅读与纸质阅读的人数之比为,将这人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.
(1)求的值及通过电子阅读的居民的平均年龄;
(2)把年龄在第组的居民称为青少年组,年龄在第组的居民称为中老年组,若选出的人中通过纸质阅读的中老年有人,请完成上面列联表,则是否有的把握认为阅读方式与年龄有关?
参考答案
1.【答案】B
【分析】
因为独立性检验常用等高条形图表示列联表数据的频率特征,故①正确;
独立性检验依据的是小概率原理,故②正确;
独立性检验的结果是不完全正确的,故③不正确;
对分类变量与的随机变量的观测值来说,越大,
与有关系的把握程度才越大,故④不正确.
所以正确的个数为2
故选:B
2.【答案】A
【分析】
解:A对老师群体而言,首选“微信”与首选“QQ”的比例为:,故对老师而言,更倾向于首选“微信”,即A正确,
B对学生群体而言,首选“微信”与首选“QQ”的比例为:,故对学生而言,更倾向于首选“微信”,即B错误,
C由于老师群体与学生群体人数不定,即首选“微信”的老师比首选“微信”的同学无法比较,即C错误,
D设老师群体人,学生群体人,则有,即,则小明统计的老师人数不一定比学生多,即D错误,
综上所述得:A正确.
故选:A.
3.【答案】B
【分析】
解:因为两个分类变量A和B没有任何关系,
所以
,
代入验证可知
.
故选:B.
4.【答案】C
【分析】
根据等高条形图可知,参加社团的高一和高二的人数比为,由分层抽样的性质可得,抽取的高二学生人数为人,
故选:C.
5.【答案】C
【分析】
由等高条形图可知:喜欢数学的女生和男生的比为1:3,所以抽取的男生数为24人.故选C.
6.【答案】C
【分析】
根据题意:
故答案选C
7.【答案】C
【分析】
由左图知,样本中的男性数量多于女性数量,A正确;
由右图知女性中岁以上的占多数,B正确;
由右图知,岁以下的男性人数比岁以上的女性人数少,
C错误;
由右图知样本中岁以上的人对地铁一号线的开通关注度更高,D正确.
故选C.
8.【答案】D
【分析】
在等高条形图中,x1,x2所占比例相差越大,分类变量x,y有关系的把握越大,
故答案为D
9.【答案】C
【分析】
根据独立性检验的定义及思想,可得结论.
①常用等高条形图展示列联表数据的频率特征;正确;
②独立性检验依据小概率原理;正确;
③样本不同,独立性检验的结论可能有差异;正确;
④对分类变量与的随机变量的观测值来说,越大,与有关系的把握程度就越大.故④错误.
故选C.
10.【答案】B
【分析】
根据独立性检验的基本思想可知,分类变量X与Y的随机变量x2的观测值越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;x2越小,“X与Y有关系”的可信程度越小,“X与Y没有关系”的可信程度越大,故ACD错误,B正确.
故选:B.
11.【答案】D
【分析】
解:对于A,,故有99%的把握认为两个分类变量有关系,即A正确:
对于B,越大,“与有关系”可信程度越大,相关性就越大,即B正确;
对于C,在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即C正确;
对于D,当回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故D错误.
故选:D.
12.【答案】B
【分析】
独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验解决.
故选:B
13.【答案】D
【分析】
分析已知条件,得如下表格.
男生
女生
合计
近视
80
70
150
不近视
70
70
140
合计
150
140
290
根据列联表利用公式可得的值,
再与临界值比较,检验这些中学生眼睛近视是否与性别有关,
故利用独立性检验的方法最有说服力.
故选:D.
14.【答案】D
【分析】
因为,
所以由临界值表可得有%的把握说性别与运动有关,
即有1-%=5%的犯错误的可能性,
故选:D
15.【答案】B
【分析】
解:根据题意,结合题目中的数据,可列列联表,
求观测值,对照临界值得出概率结论;
这种数据分析的方法是独立性检验.
故选:.
16.【答案】D
【分析】
对于命题①,在回归分析中,残差图中残差点分布的带状区域的宽度越窄,说明拟合的精确度越高,相关指数的绝对值越接近于,而不是越小,命题①错误;
对于命题②,相关指数来刻画回归效果,的值越大,说明模型的拟合效果越好,命题②正确;
对于命题③,在回归直线中,当解释变量每增加一个单位时,预报变量平均增加个单位,命题③正确;
对于命题④,对于分类变量和,它们的随机变量的观测值来说,越大,“与有关系”的把握程度越大,命题④错误.
故选:D.
17.【答案】C
【分析】
解:对于,的观测值时,有的把握认为吸烟与患肺病有关系,不是指“在100个吸烟的人中必有99人患有肺病”,
错误;
对于,从独立性检验可知有的把握认为吸烟与患肺病有关系时,不能说某人吸烟,那么他有的可能性患有肺病,错误;
对于,根据独立性原理知,从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误,正确.
故选:.
18.【答案】B
【分析】
独立性检验独立性检验是检验两个分类变量是否相关的一种统计方法,
只是在一定的可信度下进行判断,不一定正确,
会因为样本不同导致结论可能不同,带有反证法思想.
故选:B
19.【答案】(1)列联表答案见解析,没有的把握认为“体育迷”与性别有关;(2)分布列答案见解析,,.
【分析】
(1)由频率分布直方图可知,在抽取的人中,“体育迷”有人,从而列联表如下:
非体育迷
体育迷
合计
男
女
合计
将列联表中的数据代入公式计算,得.
因为,
所以没有的把握认为“体育迷”与性别有关.
(2)由频率分布直方图知,抽到“体育迷”的频率为,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.
由题意,从而的分布列为
,
.
20.【答案】(1)列联表见解析;(2)有,详见解析
【分析】
(1)列联表如下:
主食蔬菜
主食肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
(2)因为,
所以有99%的把握认为其亲属的饮食习惯与年龄有关.
21.【答案】(1),;(2)有.
【分析】
(1)由频率分布直方图可得:10×(0.01+0.015+a+0.03+0.01)=1,
解得a=0.035,
所以通过电子阅读的居民的平均年龄为:
20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5;
(2)由题意人中通过电子阅读与纸质阅读的人数之比为,
∴纸质阅读的人数为200=50,其中中老年有人,∴纸质阅读的青少年有20人,电子阅读的总人数为150,
青少年人数为150=90,则中老年有人,
得2×2列联表,
电子阅读
纸质阅读
合计
青少年(人)
90
20
110
中老年(人)
60
30
90
合计(人)
150
50
200
计算,
所以有的把握认为认为阅读方式与年龄有关.