(共64张PPT)
第47讲 数据分析——列联表与独立性检验
第九章
统计
1.为调查中学生近视情况,测得某校150名男生中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,下列方法最有说服力的是 ( )
A.回归分析 B.均值与方差
C.独立性检验 D.概率
激 活 思 维
C
附:
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如右表:
【解析】
因为χ2>10.828=x0.001,所以判断出错的可能性不大于0.001.
心脏病 无心脏病
秃发 20 300
不秃发 5 450
根据表中数据得到χ2≈15.968,因为χ2>10.828,所以断定秃发与心脏病有关系.则这种判断出错的可能性不大于 ( )
A.0.001 B.0.05
C.0.025 D.0.01
A
3.根据分类变量x与y的观测数据,计算得到χ2=2.974.依据α=0.05的独立性检验,结论为 ( )
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率不超过0.05
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.05
C
【解析】
因为χ2=2.974<x0.05=3.841,所以变量x与y独立.又2.706<2.974<3.841,所以这个结论犯错误的概率不超过0.1.
4.已知变量X,Y,由它们的样本数据计算得到χ2的观测值χ2≈4.328,则最大有________(填百分数)的把握说变量X,Y有关系.
95%
【解析】
因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系,所以最大有95%的把握认为变量X,Y有关系.
5.调查某医院一段时间内婴儿出生的时间和性别的关联性,得到如右的列联表(单位:人):
【解析】
性别 出生时间 合计
晚上 白天 女 24 31 55
男 8 26 34
合计 32 57 89
依据α=0.1的独立性检验,则在犯错误的概率不超过_______的前提下可以认为性别与出生时间有关联.
0.1
1.2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
聚 焦 知 识
X Y 合计
Y=y1 Y=y2 X=x1 a b a+b
X=x2 c d c+d
合计 a+c b+d n=a+b+c+d
3.独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
近期世界地震、洪水、森林大火等自然灾害频繁出现,紧急避险知识越来越引起人们的重视.某校为考察学生对紧急避险知识的掌握情况,从全校学生中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成绩都在区间[50,100]范围内,由测试成绩数据作出如图所示的频率分布直方图.
列联表与独立性检验
举 题 说 法
1
(1) 若从频率分布直方图中估计出样本的平均数与中位数相等,求图中m的值;
【解答】
近期世界地震、洪水、森林大火等自然灾害频繁出现,紧急避险知识越来越引起人们的重视.某校为考察学生对紧急避险知识的掌握情况,从全校学生中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的测试成绩都在区间[50,100]范围内,由测试成绩数据作出如图所示的频率分布直方图.
1
(2) 规定测试成绩不低于80分为优秀,已知共有45名男生成绩优秀,完成下面的列联表,并根据小概率值α=0.05的独立性检验,能否推断男生和女生的测试成绩优秀率有差异?
参考公式与数据:
性别 测试成绩 合计
优秀 不优秀 男生 45
女生
合计
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
【解答】
总的成绩优秀人数为200×10×(0.025+0.01)=70,补全列联表如右:
性别 测试成绩 合计
优秀 不优秀 男生 45 65 110
女生 25 65 90
合计 70 130 200
(1) 求批次甲的芯片的次品率.
【解答】
(2) 该企业改进生产工艺后,生产了批次乙的芯片.某手机厂商获得批次甲与批次乙的芯片,并在某款手机上使用.现对使用这款手机的100名用户回访,对开机速度进行调查.据统计,安装批次甲的芯片有40名,其中对开机速度满意的有30名;安装批次乙的芯片有60名,其中对开机速度满意的有55名.试整理出2×2列联表(单位:名),并依据小概率值α=0.05的独立性检验,分析芯片批次是否与用户对开机速度满意有关.
批次 是否满意 合计
满意 不满意 甲
乙
合计
α 0.10 0.05 0.005 0.001
xa 2.706 3.841 7.879 10.828
【解答】
零假设为H0:芯片批次与用户对开机速度满意无关.由题得2×2列联表如右:
批次 是否满意 合计
满意 不满意 甲 30 10 40
乙 55 5 60
合计 85 15 100
机动车行经人行横道时,应当减速慢行,遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干道路口监控设备所抓拍的5个月内驾驶员不“礼让行人”违章驾驶人次统计数据.
独立性检验与回归分析的综合
2
月份 1 2 3 4 5
违章驾驶人次 125 105 100 90 80
【解答】
机动车行经人行横道时,应当减速慢行,遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干道路口监控设备所抓拍的5个月内驾驶员不“礼让行人”违章驾驶人次统计数据.
独立性检验与回归分析的综合
2
月份 1 2 3 4 5
违章驾驶人次 125 105 100 90 80
(2) 交警从这5个月内通过该路口的驾驶员中随机抽查90人,调查驾驶员“礼让行人”行为与驾龄的关系,得到右表:
不礼让行人 礼让行人
驾龄不超过2年 24 16
驾龄2年以上 26 24
依据小概率值α=0.1的独立性检验,判断礼让行人行为与驾龄是否有关联,并用一句话谈谈你对结论判断的体会.
【解答】
根据题中的列联表补全得右表:
不礼让行人 礼让行人 合计
驾龄不超过2年 24 16 40
驾龄2年以上 26 24 50
合计 50 40 90
“礼让行人”是一种良好的驾驶习惯,无论驾龄多少,都需遵守规章,礼让行人.
(1) 求y关于x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱(若|r|>0.9,则可判断y与x线性相关程度较强);
【解答】
(2) 该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
依据小概率值α=0.05的独立性检验,能否认为购买电动汽车与车主性别有关.
性别 购买非电动汽车 购买电动汽车 总计
男性 39 6 45
女性 30 15 45
总计 69 21 90
【解答】
零假设为H0:购买电动汽车与车主性别相互独立,即购买电动汽车与车主性别无关.
随 堂 练习
1.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样的方法在校园内调查了120位学生,得到如下2×2列联表:
【解析】
由题意得c=120-73-25=22,a=74-22=52,b=73-52=21,所以a-b-c=52-21-22=9.
男 女 合计
爱好 a b 73
不爱好 c 25
合计 74
则a-b-c= ( )
A.7 B.8
C.9 D.10
C
2.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c= ( )
附:
α 0.05 0.025
xα 3.841 5.024
A.3 B.4
C.5 D.6
【解析】
【答案】A
2×2列联表如右:
X Y 合计
y1 y2 x1 10 21 31
x2 c d 35
合计 10+c 21+d 66
3.(多选)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是 ( )
【解析】
因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.根据小概率值α=0.05的独立性检验,分析变量x与y相互独立
B.根据小概率值α=0.05的独立性检验,分析变量x与y不相互独立
C.变量x与y相互独立,这个结论犯错误的概率不超过0.1
D.变量x与y不相互独立,这个结论犯错误的概率不超过0.1
AD
4.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”
……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下2×2 列联表,并计算得到χ2≈19.05,下列小波对A地区天气的判断正确的是 ( )
C.依据α=0.005 的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.依据α=0.005 的独立性检验,若出现“日落云里走”,则认为夜晚一定会下雨
日落云里走 夜晚天气 下雨 未下雨
出现 25 5
未出现 25 45
【解析】
【答案】ABC
χ2≈19.05>7.879=x0.005,因此依据α=0.005 的独立性检验,认为“日落云里走”是否出现与夜晩天气有关,C正确.
依据α=0.005的独立性检验,可判断“日落云里走,雨在半夜后”的说法犯错误的概率小于0.005,但不代表一定会下雨,D错误.
配套精练
附:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A组 夯基精练
一、 单项选择题
1.下列关于独立性检验的说法正确的是 ( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联,若有99%的把握认为吸烟与患肺病有关系,则我们可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大
【解析】
【答案】D
对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故A错误;
对于B,独立性检验并不能100%确定两个变量相关,故B错误;
对于C,99%是指“吸烟”和“患肺病”存在关联的可能性,并非吸烟的人中患肺病的发病率,故C错误;
对于D,根据χ2计算的定义可知D正确.
2.某校为了研究“学生的性别”与“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算χ2=7.069,则认为“学生性别”与“对待某一活动的态度有关系”的犯错误的概率不超过 ( )
A.0.1% B.1%
C.99% D.99.9%
B
【解析】
因为χ2=7.069>6.635=x0.01,所以认为“学生性别”与“对待某一活动的态度”有关系的犯错误的概率不超过1%.
3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
【解析】
药物 流感 患流感 未患流感
服用 2 18
未服用 8 12
A
4.为考察某种药物预防疾病的效果,某机构进行了动物试验,得到如下列联表:(单位:人)
由上述数据得出下列结论,其中结论正确的是( )
A.依据α=0.05的独立性检验,认为药物有效
B.依据α=0.1的独立性检验,认为药物无效
C.依据α=0.01的独立性检验,认为药物有效
D.依据α=0.005的独立性检验,认为药物有效
药物A 疾病B 合计
患病 未患病 服用药 10 45 55
没服用药 20 30 50
合计 30 75 105
【解析】
【答案】A
对于B,因为6.109>2.706=x0.1,所以依据α=0.1的独立性检验,认为药物有效,故B错误;
对于C,因为6.109<6.635=x0.01,所以依据α=0.01的独立性检验,认为药物无效,故C错误;
对于D,因为6.109<7.879=x0.005,所以依据α=0.005的独立性检验,认为药物无效,故D错误.
二、 多项选择题
5.某中学为了解性别因素是否对本校学生体育锻炼的经常性有影响,从本校所有学生中随机调查了50名男生和50名女生,得到如下列联表:
经计算χ2≈4.762,则可以推断出 ( )
B.该学校男生比女生更经常锻炼
C.有95%的把握认为男、女生在体育锻炼的经常性方面有差异
D.有99%的把握认为男、女生在体育锻炼的经常性方面有差异
经常锻炼 不经常锻炼
男 40 10
女 30 20
【解析】
【答案】BC
对于C,χ2≈4.762>3.841,故有95%的把握认为男、女生在体育锻炼的经常性方面有差异,故C正确;
对于D,χ2≈4.762<6.635,故没有99%的把握认为男、女生在体育锻炼的经常性方面有差异,故D错误.
6.为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼的人数是不经常锻炼的人数的2倍,绘制其等高堆积条形图如图所示,则( )
【解析】
由题意知经常锻炼的有200名,不经常锻炼的有100名,根据等高堆积条形图列表如下:
经常锻炼 不经常锻炼 合计
男生 100 60 160
女生 100 40 140
合计 200 100 300
参与调查的男生经常锻炼的有100名,不经常锻炼的有60名,故A正确;
【答案】ABD
三、 填空题
7.如表是对于“喜欢运动”与性别是否有关的2×2列联表,依据表中的数据,得到χ2≈_________(结果保留到小数点后3位).
4.722
【解析】
喜欢运动 不喜欢运动 合计
男 40 28 68
女 5 12 17
合计 45 40 85
【解析】
设男性患者有x人,则女性患者有2x人,得2×2列联表如右:
【答案】12
四、 解答题
9.某中学团委在高二年级(其中男生150名,女生150名)中,对是否喜欢观看足球世界杯进行了问卷调查,各班男生喜欢观看的人数统计分别为6,7,8,8,6,5,14,14,12,10,各班女生喜欢观看的人数统计分别为4,4,4,5,5,6,7,7,8,10.
喜欢观看 不喜欢观看 合计
男生 150
女生 150
合计 300
(1) 根据题意补全2×2列联表;
【解答】
由题设,喜欢观看的男生有6+7+8+8+6+5+14+14+12+10=90人,故不喜欢观看的男生有150-90=60人;喜欢观看的女生有4+4+4+5+5+6+7+7+8+10=60人,故不喜欢观看的女生有150-60=90人.
补全列联表如下:
喜欢观看 不喜欢观看 合计
男生 90 60 150
女生 60 90 150
合计 150 150 300
9.某中学团委在高二年级(其中男生150名,女生150名)中,对是否喜欢观看足球世界杯进行了问卷调查,各班男生喜欢观看的人数统计分别为6,7,8,8,6,5,14,14,12,10,各班女生喜欢观看的人数统计分别为4,4,4,5,5,6,7,7,8,10.
喜欢观看 不喜欢观看 合计
男生 150
女生 150
合计 300
(2) 依据小概率值α=0.001的独立性检验,能否认为该校学生喜欢观看世界杯与性别有关?
【解答】
10.某校为调研学生对新开设劳动课程的满意度并不断改进劳动教育,该校从2022年1月到10月每两个月从全校3 000名学生中随机抽取150名学生进行问卷调查,统计数据如下表.
月份x 2 4 6 8 10
满意人数y 80 95 100 105 120
【解答】
10.某校为调研学生对新开设劳动课程的满意度并不断改进劳动教育,该校从2022年1月到10月每两个月从全校3 000名学生中随机抽取150名学生进行问卷调查,统计数据如下表.
月份x 2 4 6 8 10
满意人数y 80 95 100 105 120
(2) 10月份时,该校为进一步深化劳动教育改革,了解不同性别的学生对劳动课程是否满意,经调研得如下统计表:
请根据上表判断是否有95%的把握认为该校的学生对劳动课程是否满意与性别有关.
满意 不满意 合计
男生 65 10 75
女生 55 20 75
合计 120 30 150
【解答】
【解析】
【答案】
【解答】
如图,取BD中点O,连接OA,OP.因为四边形ABCD是边长为2的菱形,∠BAD=60°,所以△ABD,△PBD是边长为2的正三角形.
【解答】
谢谢观赏2025高考数学一轮复习-第47讲-列联表与独立性检验-专项训练【原卷版】
时间:45分钟
一、选择题
1.下列关于回归分析与独立性检验的说法正确的是( )
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;
④独立性检验可以100%确定两个变量之间是否具有某种关系.
A.①② B.③
C.③④ D.全选
2.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.805,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系”( )
α 0.100 0.050 0.025 0.010 0.001
xα 2.706 3.841 5.024 6.635 10.828
A.1% B.0.1%
C.99% D.99.9%
3.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则χ2的观测值可能为( )
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.χ2=3.206 B.χ2=6.561
C.χ2=7.869 D.χ2=11.208
4.为了了解中学生戴眼镜与性别的相关性,某研究机构分别调查了A,B,C三个地区的100名中学生是否戴眼镜的情况,得到三个列联表如下图所示:
根据列联表的数据,可以得到的结论为( )
A.在这三个地区中,A地区的中学生戴眼镜与性别关联性最强
B.在这三个地区中,B地区的中学生戴眼镜与性别关联性最强
C.在这三个地区中,B地区的中学生戴眼镜与性别关联性最弱
D.在这三个地区中,C地区的中学生戴眼镜与性别关联性最弱
5.考察棉花种子经过处理跟生病之间的关系得到如下表的数据:
项目 种子处理 种子未处理 总计
得病 33 102 135
不得病 193 214 407
总计 226 316 542
根据以上数据,依据α=0.001的独立性检验,可以认为( )
A.种子经过处理跟是否生病有关
B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
6.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
α 0.100 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
附: χ2=.
A.25人 B.35人
C.45人 D.60人
二、填空题
7.如果由一个2×2列联表中的数据计算得χ2=4.073,那么有95%的把握认为两变量 关系,已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.
8.江苏省从2021年开始将全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了判断学生选修历史、物理与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
物理 历史
男 13 10
女 7 20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据公式χ2=,则我们有 把握认为选科与性别是有关系的.
9.2020年春季,世界各地相继出现肺炎疫情,这已经成为全球性的公共卫生问题.为了考察某种疫苗的效果,某实验室随机抽取100只健康小鼠进行实验,得到如下列联表:
感染 未感染 总计
注射 10 40 50
未注射 20 30 50
总计 30 70 100
参照附表,在犯错误的概率最多不超过 的前提下,可认为“注射疫苗”与“感染肺炎”有关系.
参照公式: χ2=,n=a+b+c+d.
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
三、解答题
10.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求t的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关?
强力有效 效力一般 合计
男性 50
女性 10
合计 100
参考数据:
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
χ2=,其中n=a+b+c+d.
11.(多选题)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如下表所示:
晕机 不晕机 合计
男 n11 15 n1+
女 6 n22 n2+
合计 n+1 28 46
则下列说法正确的是( )
附:参考公式: χ2=,其中n=a+b+c+d.
独立性检验临界值表
α 0.10 0.05 0.025 0.010
xα 2.706 3.841 5.024 6.635
A.>
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关
D.女乘客不晕机的人数为13
12.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的2×2列联表.
年轻人 非年轻人 总计
经常用流行用语 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式: χ2=,
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
则根据列联表判断是否有95%的把握认为“经常用流行用语”与“年轻人”有关系.
2025高考数学一轮复习-第47讲-列联表与独立性检验-专项训练【解析版】
时间:45分钟
一、选择题
1.下列关于回归分析与独立性检验的说法正确的是( B )
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;
④独立性检验可以100%确定两个变量之间是否具有某种关系.
A.①② B.③
C.③④ D.全选
解析:回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析分析可能两个变量之间具有的相关关系.而独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.故①②④错误,③正确.故选B.
2.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.805,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系”( C )
α 0.100 0.050 0.025 0.010 0.001
xα 2.706 3.841 5.024 6.635 10.828
A.1% B.0.1%
C.99% D.99.9%
解析:∵χ2=7.805,对照表格:6.635<7.805<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”.
∴有1-0.010=0.99=99%的把握认为“学生性别与是否支持该活动有关系”,故选C.
3.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则χ2的观测值可能为( C )
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.χ2=3.206 B.χ2=6.561
C.χ2=7.869 D.χ2=11.208
解析:因为有99%的把握但没有99.9%的把握,所以χ2的观测值区间范围为[6.635,10.828),因此χ2的观测值可能为7.869.故选C.
4.为了了解中学生戴眼镜与性别的相关性,某研究机构分别调查了A,B,C三个地区的100名中学生是否戴眼镜的情况,得到三个列联表如下图所示:
根据列联表的数据,可以得到的结论为( B )
A.在这三个地区中,A地区的中学生戴眼镜与性别关联性最强
B.在这三个地区中,B地区的中学生戴眼镜与性别关联性最强
C.在这三个地区中,B地区的中学生戴眼镜与性别关联性最弱
D.在这三个地区中,C地区的中学生戴眼镜与性别关联性最弱
解析:由χ=≈0.167,
χ=≈4.167,
χ==1.5,
∴χ>χ>χ.故在这三个地区中,B地区的中学生戴眼镜与性别关联性最强,A地区的中学生戴眼镜与性别关联性最弱.故选B.
5.考察棉花种子经过处理跟生病之间的关系得到如下表的数据:
项目 种子处理 种子未处理 总计
得病 33 102 135
不得病 193 214 407
总计 226 316 542
根据以上数据,依据α=0.001的独立性检验,可以认为( A )
A.种子经过处理跟是否生病有关
B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
解析:χ2=≈22.013>10.828,所以依据α=0.01的独立性检验,可以认为种子经过处理跟是否生病有关.故选A.
6.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( CD )
附表:
α 0.100 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
附: χ2=.
A.25人 B.35人
C.45人 D.60人
解析:设男生可能有x人,依题意得女生有x人,可得2×2列联表如下:
喜欢抖音 不喜欢抖音 总计
男生 x x x
女生 x x x
合计 x x 2x
若有95%的把握认为是否喜欢抖音和性别有关,则χ2≥3.841,即χ2==x≥3.841,解得x≥40.330 5,由题意知x>0,且x是5的整数倍,所以45和60都满足题意.故选CD.
二、填空题
7.如果由一个2×2列联表中的数据计算得χ2=4.073,那么有95%的把握认为两变量有关系,已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.
解析:∵由一个2×2列联表中的数据计算得χ2=4.073>3.841,∴有95%的把握说这两个变量有关系.
8.江苏省从2021年开始将全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了判断学生选修历史、物理与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
物理 历史
男 13 10
女 7 20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据公式χ2=,则我们有95%把握认为选科与性别是有关系的.
解析:根据表中数据,得到χ2=
≈4.844>3.841,∴我们有95%的把握认为选科与性别是有关系的.
9.2020年春季,世界各地相继出现肺炎疫情,这已经成为全球性的公共卫生问题.为了考察某种疫苗的效果,某实验室随机抽取100只健康小鼠进行实验,得到如下列联表:
感染 未感染 总计
注射 10 40 50
未注射 20 30 50
总计 30 70 100
参照附表,在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染肺炎”有关系.
参照公式: χ2=,n=a+b+c+d.
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
解析:由题意得,χ2=≈4.762
>3.841,所以在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染肺炎”有关系.
三、解答题
10.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求t的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关?
强力有效 效力一般 合计
男性 50
女性 10
合计 100
参考数据:
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
χ2=,其中n=a+b+c+d.
解:(1)由(0.005+t+0.020+0.025+0.030+0.005)×10=1,解得t=0.015.平均得分为45×0.005×10+55×0.015×10+65×0.020×10+75×0.030×10+85×0.025×10+95×0.005×10=72.
(2)由已知可得,强力有效人数有100×(0.025+0.005)
×10=30人,则2×2列联表为:
强力有效 效力一般 合计
男性 20 30 50
女性 10 40 50
合计 30 70 100
χ2==
≈4.762>3.841.
所以能在犯错误的概率不超过0.05的前提下认为疫苗强效力与性别有关.
11.(多选题)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如下表所示:
晕机 不晕机 合计
男 n11 15 n1+
女 6 n22 n2+
合计 n+1 28 46
则下列说法正确的是( ABD )
附:参考公式: χ2=,其中n=a+b+c+d.
独立性检验临界值表
α 0.10 0.05 0.025 0.010
xα 2.706 3.841 5.024 6.635
A.>
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关
D.女乘客不晕机的人数为13
解析:由列联表数据知,,得,
∴==>=,即A正确;
晕机 不晕机 合计
男 12 15 27
女 6 13 19
合计 18 28 46
∴χ2=≈0.775<2.706,即B正确,C错误;经上述计算女乘客不晕机的人数为13,即D正确.故选ABD.
12.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的2×2列联表.
年轻人 非年轻人 总计
经常用流行用语 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式: χ2=,
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
则根据列联表判断是否有95%的把握认为“经常用流行用语”与“年轻人”有关系.
解:有.χ2==4.167>3.841,所以根据临界值知有95%的把握认为“经常用流行语”与“年轻人”有关系.