中小学教育资源及组卷应用平台
2024人教版高中数学选择性必修第三册同步
第八章 成对数据的统计分析
8.3 列联表与独立性检验
基础过关练
题组一 分类变量与列联表
1.(2023广东佛山华南师范大学附属中学月考)已知四川省从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”的模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高堆积条形图,根据条形图的信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中选择历史意愿的女生人数多于男生人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
2.(2023浙江宁波北仑中学期中)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
单位:名
每年体检 每年未体检 合计
老年人 a 7 c
年轻人 6 b d
合计 e f 50
已知抽取的老年人、年轻人各25名,则对列联表中数据的分析错误的是( )
A.a=18 B.b=19
C.c+d=50 D.e-f=2
3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,426名性格内向的学生中有332人在考前心情紧张,594名性格外向的学生中有213人在考前心情紧张.作出等高堆积条形图,并利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.
题组二 独立性检验及其应用
4.(2022山东烟台期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验判断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系,则可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大
5.(2023陕西西安第三中学期中)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人进行独立性检验,经计算得 χ2≈5.879,临界值如下表,则下列说法正确的是( )
α 0.15 0.10 0.05 0.025 0.010
xα 2.072 2.706 3.841 5.024 6.635
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下,认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下,认为“学生对2022年冬奥会的关注与性别无关”
6.(2023江西赣州兴国平川中学期中)两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表如表所示:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
下列四组数据中,分类变量X和Y之间的关系最强的是( )
A.a=4,b=2,c=3,d=6
B.a=2,b=1,c=3,d=5
C.a=4,b=5,c=6,d=8
D.a=2,b=3,c=4,d=6
7.某大学餐饮中心对全校一年级新生的饮食习惯进行抽样调查,调查结果如下:南方学生喜欢甜品的有60人,不喜欢甜品的有20人;北方学生喜欢甜品的有10人,不喜欢甜品的有10人.那么至少有 %的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
附: χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
8.(2023河北部分学校模拟)为了解大家对养宠物的看法,某单位对本单位450名员工(其中女职工有150人)进行了调查,发现女职工中支持养宠物的人数占,从男职工与女职工中各随机选取一名,至少有一名职工支持养宠物的概率为.
(1)求该单位男职工支持养宠物的人数,并填写下列2×2列联表;
单位:人
支持养宠物 不支持养宠物 合计
男职工
女职工
合计 450
(2)依据α=0.05的独立性检验分析,该单位职工是否支持养宠物与性别是否有关.
附: χ2=,n=a+b+c+d.
α 0.10 0.05 0.010 0.001
xα 2.706 3.841 6.635 10.828
能力提升练
题组 独立性检验的综合应用
1.福建省采用“3+1+2”的新高考模式,其中“3”为全国统考科目:语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、化学和生物四门中选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的有120人,选考历史的有80人,统计各选科人数如下表,则下列说法正确的是( )
选考类别 选择科目
思想政治 地理 化学 生物
物理类 35 50 90 65
历史类 50 45 30 35
附: χ2=,其中n=a+b+c+d.
α 0.100 0.050 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
B.物理类的学生中选择生物的比例比历史类的学生中选择生物的比例低
C.有90%以上的把握认为选择生物与选考类别有关
D.没有95%以上的把握认为选择生物与选考类别有关
2.(多选题)(2023河南南阳期中)某学校对“学生性别和喜欢抖音是否有关”进行了一次调查,其中被调查的男、女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则被调查的男生人数可能为( )
附: χ2=,其中n=a+b+c+d.
α 0.100 0.050 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.50 B.45 C.40 D.35
3.(2022辽宁辽阳期末)某大学生社团组织社会调查活动,随机调查了某市区某个路口100个工作日中每天的天气情况和当天早高峰(7点至9点)时段经过该路口的机动车车次,整理数据得到下表:
天气 机动车车次
[0,800) [800,1 600) [1 600,2 400)
晴天 10 52 13
阴天 2 9 8
雨天 0 2 4
若晴天记为“天气好”,阴天或雨天记为“天气不好”,当天早高峰时段经过该路口的机动车车次小于1 600视为交通顺畅,否则视为交通拥堵,则在犯错误的概率不超过 的前提下,认为交通状况与天气情况有关.
附: χ2=,n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
4.某调查机构为了解国庆节通过短视频APP、微信或微博表达对祖国祝福的人们是否存在年龄差异,通过不同途径调查了数千个表达了祝福的人,并从参与者中随机选出200人,经统计,这200人中通过微信或微博表达对祖国祝福的有160人.将这160人按年龄(单位:岁)分组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示:
(1)求a的值并估计这160人的平均年龄(同一组中的数据用该组区间的中点值作代表);
(2)若把年龄在第1,2,3组的人称为青年人,年龄在第4,5组的人称为中年人,已知选出的200人中通过短视频APP表达对祖国祝福的中年人有26人,依据α=0.010的独立性检验,能否认为是否通过微信或微博表达对祖国的祝福与年龄有关
附: χ2=,n=a+b+c+d.
α 0.050 0.025 0.010 0.005 0.001
xα 3.841 5.024 6.635 7.879 10.828
5.(2023吉林长春外国语学校月考)某校组织学生观看“天宫课堂”,并对其中1 000名学生进行了一次“飞天宇航梦”的调查,得到如下两个等高堆积条形图,其中被调查的男、女生比例为3∶2.
(1)求m,n的值;
(2)完成以下表格,根据小概率值α=0.001的独立性检验,能否认为“学生性别和是否有‘飞天宇航梦’有关”
单位:人
有“飞天宇航梦” 无“飞天宇航梦” 合计
男生
女生
合计
(3)在抽取的样本女生中,按有无“飞天宇航梦”用分层随机抽样的方法抽取5人,若从这5人中随机抽取3人进一步调查,求抽到有“飞天宇航梦”的女生人数X的分布列及数学期望.
附: χ2=,其中n=a+b+c+d.
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
6.(2023河北石家庄正定中学月考)某企业有甲、乙两条零件生产线,为了解零件质量情况,采用简单随机抽样的方法从两条生产线共抽取了180个零件,测量其尺寸(单位:mm)得到如下统计表,其中尺寸在[55,58)内的零件为一等品,在[54,55)和[58,59)内的零件为二等品,其余为三等品.
生产线 甲 乙
[53,54) 4 2
[54,55) 9 14
[55,56) 23 15
[56,57) 28 17
[57,58) 24 16
[58,59) 10 15
[59,60] 2 1
(1)完成2×2列联表,依据小概率值α=0.05的独立性检验,能否认为零件为一等品与生产线有关联
单位:个
一等品 非一等品 合计
甲
乙
合计
(2)将样本频率视为概率,从甲、乙两条生产线上分别随机抽取1个零件,每次抽取零件互不影响,用ξ表示这2个零件中一等品的数量,求ξ的分布列和数学期望;
(3)已知该企业生产的零件随机装箱出售,每箱60个.产品出厂前,该企业可自愿选择是否对每箱零件进行检验,若检验,则每个零件的检验费用为5元,并将检验出的三等品更换为一等品或二等品;若不检验,则对卖出的每个三等品支付120元的赔偿费.现对一箱零件随机检验了20个,检验出1个三等品.将从两条生产线抽取的所有样本数据的频率视为概率,以整箱检验费用与赔偿费用之和的期望作为决策依据,判断是否需要对该箱余下的所有零件进行检验,并说明理由.
附: χ2=,其中n=a+b+c+d.
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
答案与分层梯度式解析
第八章 成对数据的统计分析
8.3 列联表与独立性检验
基础过关练
1.C 2.D 4.D 5.C 6.A
1.C 由题图1知,样本中选择物理学科的人数多于选择历史学科的人数,故C正确;由题图2知,选择物理学科的男生人数较多,选择历史学科的女生人数较少,所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;由题图2知,样本中选择历史意愿的女生人数少于男生人数,故B错误;由题图2知,样本中男生人数多于女生人数,故D错误.
2.D 由题意得,a+7=c=25,6+b=d=25,c+d=50,a+6=e,7+b=f,e+f=50,所以a=18,b=19,e=24, f=26,所以e-f=-2.故选D.
3.解析 由题意可作2×2列联表如下:
单位:人
性格内向 性格外向 合计
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张的学生中性格内向的学生的比例.从图中可以看出,考前心情紧张的学生中性格内向的学生占的比例比考前心情不紧张的学生中性格内向的学生占的比例高,故可以认为该校高三学生考前心情紧张与性格类型有关系.
4.D 对于A,独立性检验是通过计算χ2来判断两个变量存在关联的可能性的一种方法,并非检验二者是否线性相关,故A错误;对于B,独立性检验并不能100%确定两个变量相关,故B错误;对于C,99%是指“吸烟”和“患肺病”存在关联的可能性,故C错误;显然D正确.故选D.
5.C 根据题意知, χ2≈5.879>5.024,所以有97.5%的把握认为“学生对2022年冬奥会的关注与性别有关”,即在犯错误的概率不超过2.5%的前提下,认为“学生对2022年冬奥会的关注与性别有关”.故选C.
6.A 对于A, χ2==≈1.607;
对于B, χ2==≈0.749;
对于C, χ2==≈0.006;
对于D, χ2==0.
因为1.607>0.749>0.006>0,
所以A中分类变量X和Y之间的关系最强.故选A.
7.答案 95
解析 由题意得,2×2列联表如下:
单位:人
喜欢甜品 不喜欢甜品 合计
南方学生 60 20 80
北方学生 10 10 20
合计 70 30 100
χ2=≈4.762>3.841,所以至少有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
8.解析 (1)设男职工支持养宠物的概率为p,
由题意得1-(1-p)=,解得p=,
又男职工有450-150=300(人),
所以男职工中支持养宠物的人数为300×=75.
女职工中支持养宠物的人数为150×=50.
2×2列联表如下:
单位:人
支持养宠物 不支持养宠物 合计
男职工 75 225 300
女职工 50 100 150
合计 125 325 450
(2)零假设H0:该单位职工是否支持养宠物与性别无关.由(1)中的2×2列联表,得χ2=≈3.462<3.841=x0.05,
依据α=0.05的独立性检验分析,没有充分证据推断H0不成立,因此可以认为H0成立,即该单位职工是否支持养宠物与性别无关.
能力提升练
1.D 依据题表中数据可知,物理类的学生中选择地理的比例为=,历史类的学生中选择地理的比例为=,因为<,所以物理类的学生中选择地理的比例比历史类的学生中选择地理的比例低,故A错误;
物理类的学生中选择生物的比例为=,历史类的学生中选择生物的比例为=,因为>,所以物理类的学生中选择生物的比例比历史类的学生中选择生物的比例高,故B错误;
由题中表格可列2×2列联表如下:
单位:人
选考生物 不选考生物 合计
物理类 65 55 120
历史类 35 45 80
合计 100 100 200
故χ2=≈2.083,
由2.083<2.706=x0.100,知没有90%以上的把握认为选择生物与选考类别有关,故C错误;
由2.083<3.841=x0.050,知没有95%以上的把握认为选择生物与选考类别有关,故D正确.
故选D.
2.AB 设男生有x人,则女生也有x人,2×2列联表如下:
单位:人
喜欢抖音 不喜欢抖音 合计
男生 x x x
女生 x x x
合计 x x 2x
由题意得χ2==x>3.841,解得x>40.330 5,
易知x>0且x是5的倍数,结合选项可知被调查的男生人数为45或50.故选AB.
3.答案 0.5%
解析 交通状况与天气情况的2×2列联表如下:
单位:天
交通顺畅 交通拥堵 合计
天气好 62 13 75
天气不好 13 12 25
合计 75 25 100
χ2=≈9.404,
因为9.404>7.879,所以在犯错误的概率不超过0.5%的前提下,认为交通状况与天气情况有关.
4.解析 (1)由10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,
这160人的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)题图中,前3组的人数为10×(0.01+0.015+0.035)×160=96.
由题可得,2×2列联表如下:
单位:人
通过短视频APP 表达祝福 通过微信或微博 表达祝福 合计
青年人 14 96 110
中年人 26 64 90
合计 40 160 200
零假设H0:是否通过微信或微博表达对祖国的祝福与年龄无关.
χ2=≈8.081>6.635=x0.010,
所以根据小概率值α=0.010的独立性检验,有充分证据推断H0不成立,即认为是否通过微信或微博表达对祖国的祝福与年龄有关,此推断犯错误的概率不大于0.010.
5.解析 (1)由题意得,被调查的学生中,男生有600人,女生有400人,
所以男生中有“飞天宇航梦”的人数为600×0.7=420,无“飞天宇航梦”的人数为600×0.3=180,
女生中有“飞天宇航梦”的人数为400×0.6=240,无“飞天宇航梦”的人数为400×0.4=160,
所以m==,n==.
(2)2×2列联表如下:
单位:人
有“飞天宇 航梦” 无“飞天 宇航梦” 合计
男生 420 180 600
女生 240 160 400
合计 660 340 1 000
零假设H0:学生性别和是否有“飞天宇航梦”无关.
χ2==≈10.695<10.828=x0.001,
所以根据小概率值α=0.001的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为“学生性别和是否有‘飞天宇航梦’无关”.
(3)由题意得,在抽取的5名女生中,有3名有“飞天宇航梦”,有2名无“飞天宇航梦”.
X的可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X 1 2 3
P
E(X)=1×+2×+3×=.
6.解析 (1)2×2列联表如下:
单位:个
一等品 非一等品 合计
甲 75 25 100
乙 48 32 80
合计 123 57 180
零假设H0:零件为一等品与生产线无关联.
χ2=≈4.621>3.841=x0.05,
所以根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即认为零件为一等品与生产线有关联,此推断犯错误的概率不大于0.05.
(2)由题意得,任取一个甲生产线上的零件,为一等品的概率为=,任取一个乙生产线上的零件,为一等品的概率为=.
ξ的可能取值为0,1,2,
P(ξ=0)=×=,
P(ξ=1)=×+×=,
P(ξ=2)=×=,
所以ξ的分布列为
ξ 0 1 2
P
E(ξ)=0×+1×+2×=.
(3)由题意得,零件为三等品的频率为=.
设余下的40个零件中三等品的个数为X,则X~B,所以E(X)=40×=2.
设检验费用与赔偿费用之和为Y元,
若不对余下的所有零件进行检验,则Y=20×5+120X,所以E(Y)=100+120E(X)=100+240=340.
若对余下的所有零件进行检验,则检验费用为60×5=300(元).
因为340>300,所以应对该箱余下的所有零件进行检验.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)