8.3.1 分类变量与列联表
1.如图,2×2列联表中a,b的值分别为( )
X Y 合计
Y1 Y2
X1 c a e
X2 23 d 48
合计 b 78 121
A.54,43 B.53,43 C.53,42 D.54,42
2.已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},观察下列各图,其中两个分类变量X,Y之间关系最强的是( )
3.假设有两个分类变量X与Y,它们的可能取值分别为X=和Y=其2×2列联表为:
X Y 合计
Y=0 Y=1
X=0 10 18 28
X=1 m 26 m+26
合计 10+m 44 m+54
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9 C.14 D.19
4.(多选)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图中可以看出( )
A.性别与喜欢数学无关
B.女生中喜欢数学的百分比为80%
C.男生比女生喜欢数学的可能性大些
D.男生不喜欢数学的百分比为40%
5.(多选)随着我国经济结构调整和方式转变,社会对高质量人才的需求越来越大,因此考研现象在我国不断升温.某大学一学院甲、乙两个本科专业,研究生的报考和录取情况如表,则( )
性别 甲专业 报考人数 乙专业 报考人数 性别 甲专业 录取率 乙专业 录取率
男 100 400 男 25% 45%
女 300 100 女 30% 50%
A.甲专业比乙专业的录取率高
B.乙专业比甲专业的录取率高
C.男生比女生的录取率高
D.女生比男生的录取率高
6.下表是不完整的2×2列联表,其中3a=c,b=2d,则a= .
X Y 合计
y1 y2
x1 a b 55
x2 c d
合计 120
7.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如表所示:
年龄 电视节目 合计
文艺节目 新闻节目
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
由表中数据直观分析,收看新闻节目与年龄 关联.(填“有”或“无”)
8.针对某新型病毒,某科研机构已研发出甲、乙两种疫苗,为比较两种疫苗的效果,选取100名志愿者,将他们随机分成两组,每组50人.第一组志愿者注射甲种疫苗,第二组志愿者注射乙种疫苗,经过一段时间后,对这100名志愿者进行该新型病毒抗体检测,发现有的志愿者未产生该新型病毒抗体,在未产生该新型病毒抗体的志愿者中,注射甲种疫苗的志愿者占.根据上述数据,试完成如下列联表:
类别 是否产生抗体 合计
产生抗体 未产生抗体
甲
乙
合计
9.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出等高堆积条形图(如图),根据图中的信息,下列结论中不正确的是( )
A.样本中的男生数量多于女生数量
B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢现金支付
D.样本中多数女生喜欢手机支付
10.(多选)户外运动已经成为一种时尚,某单位为了了解员工喜欢户外运动是否与性别有关,从本单位所有员工共计650人中采用分层随机抽样的方法抽取50人进行问卷调查,得到了如下2×2列联表:
性别 户外运动 合计
喜欢 不喜欢
男性 a 5 b
女性 10 c d
合计 e f 50
在这50人中随机抽取1人,抽到喜欢户外运动的员工的概率是0.6,则下列说法正确的是( )
A.抽取的50人中喜欢户外运动的有30人
B.a=20,c=15
C.e=30,f=10
D.女性中喜欢户外运动的概率为0.4
11.如图是调查某学校高三年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为 .
12.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如表所示:
分数段 29~ 40 41~ 50 51~ 60 61~ 70 71~ 80 81~ 90 91~ 100
午休 考生人数 23 47 30 21 14 31 14
不午休 考生人数 17 51 67 15 30 17 3
(1)根据上述表格完成2×2列联表:
是否午休 成绩 合计
及格 不及格
午休
不午休
合计
(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?
8.3.1 分类变量与列联表
1.B 由2×2列联表,可得b+78=121,则b=43,又由解得a=53.
2.D 等高堆积条形图中和相差越大,两个分类变量之间关系越强.
3.C 若X与Y之间没有影响,则有=.解得m≈14.4,所以当m=14时,X与Y的关系最弱.
4.CD 由题图知女生中喜欢数学的百分比为20%,男生不喜欢数学的百分比为40%,男生比女生喜欢数学的可能性大些,故A、B不正确,C、D正确.
5.BC 由题意可得甲专业录取了男生25人,女生90人,乙专业录取了男生180人,女生50人.甲专业的录取率为=28.75%,乙专业的录取率为=46%,所以乙专业比甲专业的录取率高.男生的录取率为=41%,女生的录取率为=35%,所以男生比女生的录取率高.
6.15 解析:由题意得又3a=c,b=2d,所以解得a=15.
7.有 解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,则=≈0.310 3,=≈0.642 9,两者相差较大,所以可以在某种程度上认为收看新闻节目与年龄有关联.
8.
类别 是否产生抗体 合计
产生抗体 未产生抗体
甲 48 2 50
乙 42 8 50
合计 90 10 100
解析:由题意可得未产生该新型病毒抗体的志愿者的人数为100×=10,
则注射甲种疫苗的志愿者中未产生抗体的人数为10×=2,
产生抗体的人数为50-2=48,
注射乙种疫苗的志愿者中未产生抗体的人数为10-2=8,
产生抗体的人数为50-8=42.所得列联表为:
类别 是否产生抗体 合计
产生抗体 未产生抗体
甲 48 2 50
乙 42 8 50
合计 90 10 100
9.C 对于A,由题中左图可知,样本中的男生数量多于女生数量,所以A正确;对于B,由题中右图可知,样本中喜欢手机支付的数量多于现金支付的数量,所以B正确;对于C,由题中右图可知,样本中多数男生喜欢手机支付,所以C不正确;对于D,由题中右图可知,样本中多数女生喜欢手机支付,所以D正确.故选C.
10.ABD 从50人中随机抽取1人,抽到喜欢户外运动的员工的概率是0.6,可得50人中喜欢户外运动的人数为50×0.6=30,即e=30,f=20.因为喜欢户外运动的女性有10人,所以喜欢户外运动的男性有30-10=20(人),即a=20,b=25.因为不喜欢户外运动的男性有5人,所以不喜欢户外运动的女性有20-5=15(人),即c=15,d=25.女性中喜欢户外运动的概率为=0.4.故选A、B、D.
11.15 解析:根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层随机抽样的方法抽取23人,则抽取的男生人数为×23=15.
12.解:(1)根据题表中数据可以得到2×2列联表如下:
是否 午休 成绩 合计
及格 不及格
午休 80 100 180
不午休 65 135 200
合计 145 235 380
(2)计算可知,午休的考生及格率为P1==,不午休的考生的及格率为P2==,则P1>P2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应适当午休,以保持最佳的学习状态.
4 / 48.3.1 分类变量与列联表
新课程标准解读 核心素养
1.通过实例,理解2×2列联表的统计意义 数学抽象
2.理解判断两个分类变量是否有关系的常用方法 数据分析
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 分类变量
为了表述方便,经常会使用一种特殊的随机变量,以区别不同的 或 ,这类随机变量称为分类变量.
分类变量的取值可以用 表示.
知识点二 列联表
1.定义:观测数据按两个或更多属性进行交叉分类时所列出的频数表,称为列联表.
2.2×2列联表:定义一对分类变量X和Y如下:X=和Y=其样本频数列联表(称为2×2列联表)为:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
知识点三 等高堆积条形图
将列联表中的 用高度相同的两个条形图表示出来,其中两列的 分别对应不同的颜色,这就是等高堆积条形图.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)分类变量中的变量与函数中的变量是同一概念.( )
(2)列联表中的数据是两个分类变量的频数.( )
(3)列联表、频率分析法、等高堆积条形图都可初步分析两分类变量是否有关系.( )
(4)在2×2列联表中,如果两个分类变量没有关联,则应满足≈,即ad-bc≈0.因此,|ad-bc|越小,说明两个分类变量之间关联性越弱;|ad-bc|越大,说明两个分类变量之间关联性越强.( )
2.下表是一个2×2列联表,则表中m,n的值分别为( )
x y 合计
y1 y2
x1 a 35 45
x2 7 b n
合计 m 73 s
A.10,38 B.17,45
C.10,45 D.17,38
题型一 2×2列联表
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
通性通法
利用2×2列联表分析两变量间关系的步骤
(1)根据题中数据列出2×2列联表;
(2)根据频率特征,即将与(或与)的值相比,直观地反映出两个分类变量间是否相互影响.
【跟踪训练】
在对人们的休闲方式的一次调查中,共调查了110人,其中女性50人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)由列联表判断性别与休闲方式是否有关系.
题型二 等高堆积条形图及应用
【例2】 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.
通性通法
利用等高堆积条形图判断两个分类变量是否相关的步骤
【跟踪训练】
某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形图如图,则这80名学生中喜欢国画的人数为( )
A.24 B.32
C.48 D.58
1.下列不是分类变量的是( )
A.血型 B.性别
C.国籍 D.身高
2.下面是一个2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a 21 73
X=1 8 25 33
合计 b 46 106
则表中a,b处的值分别为( )
A.94,96 B.52,50
C.52,60 D.54,52
3.根据如图所示的等高堆积条形图可知吸烟与患肺病 关系.(填“有”或“没有”)
4.在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据:对150只动物服用药物,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个2×2列联表.
8.3.1 分类变量与列联表
【基础知识·重落实】
知识点一
现象 性质 实数
知识点三
数据 数据
自我诊断
1.(1)× (2)√ (3)√ (4)√
2.B 根据2×2列联表可知,a+35=45,解得a=10,则m=a+7=10+7=17,又由35+b=73,解得b=38,则n=7+38=45,故选B.
【典型例题·精研析】
【例1】 解:2×2列联表如下:
饮食习惯 年龄 合计
六十岁以上 六十岁以下
以蔬菜为主 43 21 64
以肉类为主 27 33 60
合计 70 54 124
将表中数据代入公式得=≈0.67,==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
跟踪训练
解:(1)2×2列联表如下:
性别 休闲方式 合计
看电视 运动
女 30 20 50
男 20 40 60
合计 50 60 110
(2)根据列联表中的数据,可得女性中休闲方式为看电视的频率为=0.6,男性中休闲方式为看电视的频率为≈0.333,二者差别较大,可知性别与休闲方式有关系.
【例2】 解:作列联表如下:
考前心情 性格 合计
内向 外向
紧张 332 213 545
不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示.
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.
从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张的样本中性格内向占的比例高,可以认为考前心情紧张与性格类别有关.
跟踪训练
D 由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+30×60%=58,故选D.
随堂检测
1.D 身高的取值为实数,其大小与运算都有实际含义,不能区别不同的现象或性质,所以不是分类变量.
2.C 因为a+21=73,所以a=52,b=a+8=52+8=60.
3.有 解析:从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.
4.解:2×2列联表如表所示:
类别 治疗效果 合计
存活 死亡
药物治疗 132 18 150
常规治疗 114 36 150
合计 246 54 300
4 / 4(共52张PPT)
8.3.1
分类变量与列联表
新课程标准解读 核心素养
1.通过实例,理解2×2列联表的统计意义 数学抽象
2.理解判断两个分类变量是否有关系的常用方法 数据分析
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.
【问题】 你知道是如何判定吸烟有害健康的吗?
知识点一 分类变量
为了表述方便,经常会使用一种特殊的随机变量,以区别不同
的 或 ,这类随机变量称为分类变量.
分类变量的取值可以用 表示.
现象
性质
实数
知识点二 列联表
1. 定义:观测数据按两个或更多属性进行交叉分类时所列出的频数
表,称为列联表.
2.2×2列联表:定义一对分类变量X和Y如下:X=和Y=
其样本频数列联表(称为2×2列联表)为:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
知识点三 等高堆积条形图
将列联表中的 用高度相同的两个条形图表示出来,其中两
列的 分别对应不同的颜色,这就是等高堆积条形图.
数据
数据
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)分类变量中的变量与函数中的变量是同一概念. ( × )
(2)列联表中的数据是两个分类变量的频数. ( √ )
(3)列联表、频率分析法、等高堆积条形图都可初步分析两分类
变量是否有关系. ( √ )
(4)在2×2列联表中,如果两个分类变量没有关联,则应满足
≈ ,即ad-bc≈0.因此,|ad-bc|越小,说明两
个分类变量之间关联性越弱;|ad-bc|越大,说明两个分
类变量之间关联性越强. ( √ )
×
√
√
√
2. 下表是一个2×2列联表,则表中m,n的值分别为( )
x y 合计
y1 y2
x1 a 35 45
x2 7 b n
合计 m 73 s
A. 10,38 B. 17,45
C. 10,45 D. 17,38
解析: 根据2×2列联表可知,a+35=45,解得a=10,则m
=a+7=10+7=17,又由35+b=73,解得b=38,则n=7+38
=45,故选B.
典型例题·精研析
02
课堂互动 关键能力提升
题型一 2×2列联表
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六
十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮
食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮
食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习
惯与年龄的列联表,并利用 与 判断二者是否有关系.
解:2×2列联表如下:
饮食习惯 年龄 合计
六十岁以上 六十岁以下
以蔬菜为主 43 21 64
以肉类为主 27 33 60
合计 70 54 124
将表中数据代入公式得 = ≈0.67, = =0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食
习惯与年龄有关系.
通性通法
利用2×2列联表分析两变量间关系的步骤
(1)根据题中数据列出2×2列联表;
(2)根据频率特征,即将 与 (或 与 )的值相比,
直观地反映出两个分类变量间是否相互影响.
【跟踪训练】
在对人们的休闲方式的一次调查中,共调查了110人,其中女性50
人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主
要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外
40人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
解: 2×2列联表如下:
性别 休闲方式 合计
看电视 运动
女 30 20 50
男 20 40 60
合计 50 60 110
(2)由列联表判断性别与休闲方式是否有关系.
解: 根据列联表中的数据,可得女性中休闲方式为看电视
的频率为 =0.6,男性中休闲方式为看电视的频率为
≈0.333,二者差别较大,可知性别与休闲方式有关系.
题型二 等高堆积条形图及应用
【例2】 某学校对高三学生作了一项调查,发现:在平时的模拟考
试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的
学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图
形判断考前心情紧张与性格类别是否有关系.
解:作列联表如下:
考前心情 性格 合计
内向 外向
紧张 332 213 545
不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示.
图中阴影部分表示考前心情紧张
与考前心情不紧张中性格内向的
比例.
从图中可以看出考前心情紧张的
样本中性格内向占的比例比考前心情不紧张的样本中性格内向占
的比例高,可以认为考前心情紧张与性格类别有关.
通性通法
利用等高堆积条形图判断两个分类变量是否相关的步骤
【跟踪训练】
某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名
学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形
图如图,则这80名学生中喜欢国画的人数为( )
A. 24
B. 32
C. 48
D. 58
解析: 由等高堆积条形图可知,男生中喜欢国画的占80%,女生
中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+
30×60%=58,故选D.
1. 下列不是分类变量的是( )
A. 血型 B. 性别
C. 国籍 D. 身高
解析: 身高的取值为实数,其大小与运算都有实际含义,不能
区别不同的现象或性质,所以不是分类变量.
2. 下面是一个2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a 21 73
X=1 8 25 33
合计 b 46 106
则表中a,b处的值分别为( )
A. 94,96 B. 52,50
C. 52,60 D. 54,52
解析: 因为a+21=73,所以a=52,b=a+8=52+8=60.
3. 根据如图所示的等高堆积条形图可知吸烟与患肺病 关系.
(填“有”或“没有”)
有
解析:从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.
4. 在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,
得到以下数据:对150只动物服用药物,其中132只动物存活,18只
动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只
动物死亡.请根据以上数据建立一个2×2列联表.
解:2×2列联表如表所示:
类别 治疗效果 合计
存活 死亡
药物治疗 132 18 150
常规治疗 114 36 150
合计 246 54 300
知能演练·扣课标
03
课后巩固 核心素养落地
1. 如图,2×2列联表中a,b的值分别为( )
X Y 合计
Y1 Y2
X1 c a e
X2 23 d 48
合计 b 78 121
A. 54,43 B. 53,43
C. 53,42 D. 54,42
1
2
3
4
5
6
7
8
9
10
11
12
解析: 由2×2列联表,可得b+78=121,则b=43,又由
解得a=53.
1
2
3
4
5
6
7
8
9
10
11
12
2. 已知两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},观察下列各图,其中两个分类变量X,Y之间关系最强的是( )
解析: 等高堆积条形图中 和 相差越大,两个分类变量之间关系越强.
1
2
3
4
5
6
7
8
9
10
11
12
3. 假设有两个分类变量X与Y,它们的可能取值分别为X=和Y
=其2×2列联表为:
X Y 合计
Y=0 Y=1
X=0 10 18 28
X=1 m 26 m+26
合计 10+m 44 m+54
则当m取下面何值时,X与Y的关系最弱( )
A. 8 B. 9
C. 14 D. 19
1
2
3
4
5
6
7
8
9
10
11
12
解析: 若X与Y之间没有影响,则有 = .解得m≈14.4,
所以当m=14时,X与Y的关系最弱.
1
2
3
4
5
6
7
8
9
10
11
12
4. (多选)如图是调查某地区男、女中学生喜欢数学的等高堆积条形
图,阴影部分表示喜欢数学的百分比,从图中可以看出( )
A. 性别与喜欢数学无关
B. 女生中喜欢数学的百分比为80%
C. 男生比女生喜欢数学的可能性大些
D. 男生不喜欢数学的百分比为40%
解析: 由题图知女生中喜欢数学的百分比为20%,男生不喜
欢数学的百分比为40%,男生比女生喜欢数学的可能性大些,故
A、B不正确,C、D正确.
1
2
3
4
5
6
7
8
9
10
11
12
5. (多选)随着我国经济结构调整和方式转变,社会对高质量人才的
需求越来越大,因此考研现象在我国不断升温.某大学一学院甲、
乙两个本科专业,研究生的报考和录取情况如表,则( )
性别 甲专业 报考人数 乙专业 报考人数 性别 甲专业 录取率 乙专业
录取率
男 100 400 男 25% 45%
女 300 100 女 30% 50%
A. 甲专业比乙专业的录取率高 B. 乙专业比甲专业的录取率高
C. 男生比女生的录取率高 D. 女生比男生的录取率高
1
2
3
4
5
6
7
8
9
10
11
12
解析: 由题意可得甲专业录取了男生25人,女生90人,乙专
业录取了男生180人,女生50人.甲专业的录取率为 =
28.75%,乙专业的录取率为 =46%,所以乙专业比甲专业
的录取率高.男生的录取率为 =41%,女生的录取率为
=35%,所以男生比女生的录取率高.
1
2
3
4
5
6
7
8
9
10
11
12
6. 下表是不完整的2×2列联表,其中3a=c,b=2d,则a
= .
X Y 合计
y1 y2
x1 a b 55
x2 c d
合计 120
15
1
2
3
4
5
6
7
8
9
10
11
12
解析:由题意得又3a=c,b=2d,所以
解得a=15.
1
2
3
4
5
6
7
8
9
10
11
12
7. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随
机抽取了100名电视观众,相关的数据如表所示:
年龄 电视节目 合计
文艺节目 新闻节目
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
1
2
3
4
5
6
7
8
9
10
11
12
由表中数据直观分析,收看新闻节目与年龄 关联.(填
“有”或“无”)
解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而
大于40岁的42名观众中有27名观众收看新闻节目,则 =
≈0.310 3, = ≈0.642 9,两者相差较大,所以可以在某种程
度上认为收看新闻节目与年龄有关联.
有
1
2
3
4
5
6
7
8
9
10
11
12
8. 针对某新型病毒,某科研机构已研发出甲、乙两种疫苗,为比较两
种疫苗的效果,选取100名志愿者,将他们随机分成两组,每组50
人.第一组志愿者注射甲种疫苗,第二组志愿者注射乙种疫苗,经
过一段时间后,对这100名志愿者进行该新型病毒抗体检测,发现
有 的志愿者未产生该新型病毒抗体,在未产生该新型病毒抗体
的志愿者中,注射甲种疫苗的志愿者占 .根据上述数据,完成如
下列联表:
1
2
3
4
5
6
7
8
9
10
11
12
类别 是否产生抗体 合计
产生抗体 未产生抗体
甲 48 2 50
乙 42 8 50
合计 90 10 100
48
2
50
42
8
50
90
10
100
1
2
3
4
5
6
7
8
9
10
11
12
解析:由题意可得未产生该新型病毒抗体的志愿者的人数为
100× =10,则注射甲种疫苗的志愿者中未产生抗体的人数为
10× =2,产生抗体的人数为50-2=48,注射乙种疫苗的志愿者
中未产生抗体的人数为10-2=8,产生抗体的人数为50-8=42.所
得列联表为:
类别 是否产生抗体 合计
产生抗体 未产生抗体
甲 48 2 50
乙 42 8 50
合计 90 10 100
1
2
3
4
5
6
7
8
9
10
11
12
9. 为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出等高堆积条形图
(如图),根据图中的信息,下列结论中不正确的是( )
A. 样本中的男生数量多于女生数量
B. 样本中喜欢手机支付的数量多于现金支付的数量
C. 样本中多数男生喜欢现金支付
D. 样本中多数女生喜欢手机支付
1
2
3
4
5
6
7
8
9
10
11
12
解析: 对于A,由题中左图可知,样本中的男生数量多于女
生数量,所以A正确;对于B,由题中右图可知,样本中喜欢手
机支付的数量多于现金支付的数量,所以B正确;对于C,由题
中右图可知,样本中多数男生喜欢手机支付,所以C不正确;
对于D,由题中右图可知,样本中多数女生喜欢手机支付,所
以D正确.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
10. (多选)户外运动已经成为一种时尚,某单位为了了解员工喜
欢户外运动是否与性别有关,从本单位所有员工共计650人中
采用分层随机抽样的方法抽取50人进行问卷调查,得到了如
2×2列联表:
性别 户外运动 合计
喜欢 不喜欢
男性 a 5 b
女性 10 c d
合计 e f 50
在这50人中随机抽取1人,抽到喜欢户外运动的员工的概率是0.6,则下列说法正确的是( )
A. 抽取的50人中喜欢户外运动的有30人
B. a=20,c=15
C. e=30,f=10
D. 女性中喜欢户外运动的概率为0.4
1
2
3
4
5
6
7
8
9
10
11
12
解析: 从50人中随机抽取1人,抽到喜欢户外运动的员工
的概率是0.6,可得50人中喜欢户外运动的人数为50×0.6=30,
即e=30,f=20.因为喜欢户外运动的女性有10人,所以喜欢户
外运动的男性有30-10=20(人),即a=20,b=25.因为不喜
欢户外运动的男性有5人,所以不喜欢户外运动的女性有20-5=
15(人),即c=15,d=25.女性中喜欢户外运动的概率为 =
0.4.故选A、B、D.
1
2
3
4
5
6
7
8
9
10
11
12
11. 如图是调查某学校高三年级男、女学生是否喜欢徒步运动而得到
的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男
生500人、女生400人(假设所有学生都参加了调查),现从所有
喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男
生人数为 .
15
1
2
3
4
5
6
7
8
9
10
11
12
解析:根据等高堆积条形图可知:喜欢徒步的男生人数为
0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜
欢徒步的总人数为300+160=460,按分层随机抽样的方法抽取23
人,则抽取的男生人数为 ×23=15.
1
2
3
4
5
6
7
8
9
10
11
12
12. 在某测试中,卷面满分为100分,60分为及格,为了调查午休对本
次测试前两个月复习效果的影响,特对复习中进行午休和不进行
午休的考生进行了测试成绩的统计,数据如表所示:
分数段 29~ 40 41~ 50 51~ 60 61~ 70 71~ 80 81~ 90 91~
100
午休考生 人数 23 47 30 21 14 31 14
不午休考
生 人数 17 51 67 15 30 17 3
1
2
3
4
5
6
7
8
9
10
11
12
(1)根据上述表格完成2×2列联表:
是否午休 成绩 合计
及格 不及格
午休
不午休
合计
1
2
3
4
5
6
7
8
9
10
11
12
解: 根据题表中数据可以得到2×2列联表如下:
是否午休 成绩 合计
及格 不及格
午休 80 100 180
不午休 65 135 200
合计 145 235 380
1
2
3
4
5
6
7
8
9
10
11
12
(2)根据列联表可以得出什么样的结论?对今后的复习有什么指
导意义?
解: 计算可知,午休的考生及格率为P1= = ,不
午休的考生的及格率为P2= = ,则P1>P2,因此,可
以粗略判断午休与考生考试及格有关系,并且午休的及格率
高,所以在以后的复习中考生应适当午休,以保持最佳的学
习状态.
1
2
3
4
5
6
7
8
9
10
11
12
谢 谢 观 看!