第9章第2节 独立性检验
题型1 等高堆积条形图 题型2 独立性检验
▉题型1 等高堆积条形图
【知识点的认识】
﹣等高堆积条形图:用于显示分类数据的组成部分,条形的高度代表总体数值的累积.
【解题方法点拨】
﹣绘制:将不同分类的数值堆叠在条形上,展示每部分的相对比例.
(多选)1.某短视频平台以讲故事,赞家乡,聊美食,展才艺等形式展示了丰富多彩的新时代农村生活,吸引了众多粉丝,该平台通过直播带货把家乡的农产品推销到全国各地,从而推进了“新时代乡村振兴”.从平台的所有主播中,随机选取300人进行调查,其中青年人,中年人,其他人群三个年龄段的比例饼状图如图1所示,各年龄段主播的性别百分比等高堆积条形图如图2所示,则下列说法正确的有( )
A.该平台女性主播占比的估计值为0.4
B.从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性的概率为0.7
C.按年龄段把所调查的主播分为三层,用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取6名
D.从所调查的主播中,随机选取一位做为幸运主播,已知该幸运主播是青年人的条件下,又是女性的概率为0.6
【答案】AC
【解答】解:该平台女性主播占比的估计值为60%×40%+30%×30%+10%×70%=0.4,A选项正确;
随机抽取一位主播是中年男性的概率为30%×70%=0.21,B选项错误;
用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取20×30%=6名,C选项正确;
随机选取一位做为幸运主播,设该幸运主播是青年人为事件A,该幸运主播是女性为事件B,则,D选项错误;
故选:AC.
(多选)2.为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图,如图所示,则( )
附:,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多
B.从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为
C.依据α=0.1的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1
D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05
【答案】ABD
【解答】解:随机抽取了300名学生,则经常锻炼人数为200人,不经常锻炼人数为100人,
A,由等高堆积条形图知,男生中经常锻炼的人数200×50%=100人,不经常锻炼的人数为100×60%=60人,∴正确,
B,由等高堆积条形图知,女生中经常锻炼的人数200×50%=100人,不经常锻炼的人数为100×40%=40人,
∴从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为,∴正确,
C,∵X22.706,
∴依据α=0.1的独立性检验,不能认为性别因素影响学生体育锻炼的经常性,∴错误,
D,2×2列联表如下,
性别 锻炼情况 合计
不经常 经常
女生 80 200 280
男生 120 200 320
合计 200 400 600
∴X25.357>3.841,
∴依据α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05,∴正确.
故选:ABD.
3.等高堆积条形图是一种数据可视化方式,能够清晰呈现多个变量的数据并进行比较,这种类型图表将多个条形图堆积在一起并用颜色进行区分,形成一条整体条形图,每个条形图的高度表示对应变量的值,不同颜色表示不同变量,能够更好的理解每个变量在总体中的占比.北方的冬天室外温度极低,如果轻薄、保暖的石墨烯发热膜能用在衣服上,那么可爱的医务工作者们在冬季行动会更方便.石墨烯发热膜的制作如下:从石墨中分离出石墨烯,制成石墨烯发热膜.从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了50次再结晶试验,得到如下等高堆积条形图.
A材料 B材料 合计
试验成功
试验失败
合计
单位:次
(1)根据等高堆积条形图,填写2×2列联表,并判断是否有99.9%的把握认为试验的结果与材料有关;
(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV胶层;②石墨烯层;③表面封装层.第一、二环节生产合格的概率均为,第三环节生产合格的概率为,且各生产环节相互独立.已知生产1吨石墨烯发热膜的固定成本为1万元,若生产不合格还需进行修复,第三环节的修复费用为4000元,其余环节修复费用均为2000元.试问如何定价(单位:万元),才能实现每生产1吨石墨烯发热膜获利不低于1万元的目标?(精确到0.001)
附:,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表如下:
A材料 B材料 合计
试验成功 45 30 75
试验失败 5 20 25
合计 50 50 100
有99.9%的把握认为试验的结果与材料有关;
(2)石墨烯发热膜的定价至少为2.233万元/吨,才能实现预期的利润目标.
【解答】解:(1)根据题中所给等高堆积条形图,得列联表如下:
A材料 B材料 合计
试验成功 45 30 75
试验失败 5 20 25
合计 50 50 100
计算可得,
依据α=0.001的独立性检验,有99.9%的把握认为试验的结果与材料有关;
(2)设生产1吨石墨烯发热膜所需的修复费用为X万元,
则X的可能取值为0,0.2,0.4,0.6,0.8,
所以,,,,
所以X的分布列为:
X 0 0.2 0.4 0.6 0.8
P
所以,
即石墨烯发热膜的定价至少为1+1+0.233=2.233万元/吨,才能实现预期的利润目标.
4.为持续深化“一盔一带”安全守护行动,有效遏制和减少因电动车闯红灯、逆行、不佩戴安全头盔等行为带来的交通安全隐患,2022年5月以来,泰安交警景区大队根据辖区实际.稳步推进“一盔一带”安全守护行动,确保辖区道路交通环境畅通、有序,该行动开展一段时间后,针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,其中年龄低于40岁占60%,得到如图的等高堆积条形图.
(1)据等积条所给的数据,完成下面的列联表:
年龄 佩戴头盔 合计
是 否
年龄低于40岁
年龄不低于40岁
合计
(2)根据(1)中的列联表,依据小概率值α=0.01的独立性检验,能否认为佩戴安全头盔与年龄有关.
附:,其中n=a+b+c+d.
α 0.05 0.01 0.005
xα 3.841 6.635 7.879
【答案】(1)答案见解答;
(2)认为佩戴安全头盔与年龄无关.
【解答】解:(1)根据等高堆积条形图所给的数据,得列联表如下:
年龄 佩戴头盔 合计
是 否
年龄低于40岁 540 60 600
年龄不低于40岁 340 60 400
合计 880 120 1000
(2)零假设为H0:佩戴安全头盔与年龄无关,
根据列联表中的数据,计算得:,
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,
因此可以认为H0成立,即认为佩戴安全头盔与年龄无关.
▉题型2 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生 女生
篮球迷 90 20
非篮球迷 60 30
附:
P(X2≥k) 0.10 0.05 0.01 0.005
k 2.706 3.841 6.635 7.789
A.有99.5%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【解答】解:列出2×2列联表:
男生 女生
篮球迷 90 20 110
非篮球迷 60 30 90
150 50 200
零假设为H0:认为是否是篮球迷与性别无关联,
由表中数据计算可得,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D.
6.已知一项统计结果表明有99%的把握认为“吸烟与患肺癌有关”是正确的,则( )
A.吸烟者一定会患肺癌
B.吸烟者患肺癌的概率为99%
C.100个吸烟者大约有99个会患肺癌
D.认为“吸烟与患肺癌有关”犯错的概率不超过1%
【答案】D
【解答】解:已知一项统计结果表明有99%的把握认为“吸烟与患肺癌有关”是正确的,
根据独立性检验相关知识可得,认为”吸烟与患肺癌有关”犯错的概率不超过1%.
故选:D.
7.下列说法正确的是( )
K2的部分临界值如下表:
P(K2≥k0) 0.1 0.05 0.025 0.01
k0 2.706 3.841 5.024 6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量X,Y,由它们的样本数据计算得到K2的观测值k≈5.527,则在犯错误的概率不超过0.025的前提下认为变量X,Y没有关系
【答案】A
【解答】解:对于A,由题意,若一组数据x1,x2, ,xn的标准差,
则有,故A正确;
对于B,两组数据的标准差相等,若是都为1和都为2的两组数据,则这两组数据的平均数不相等,故B错误;
对于C,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
对于D,k≈5.527>5.024,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量X,Y有关系,故D错误.
故选:A.
8.根据分类变量x与y的观测数据,计算得到χ2≈0.837,依据小概率值α=0.1(x0.1=2.706)的独立性检验,则( )
A.变量x与y不独立
B.变量x与y独立
C.变量x与y不独立,这个结论犯错误的概率不超过0.1
D.变量x与y独立,这个结论犯错误的概率不超过0.1
【答案】B
【解答】解:已知χ2≈0.837,小概率值α=0.1对应的临界值x0.1=2.706,
由于0.837<2.706,故依据该独立性检验,认为变量x与y独立.
故选:B.
9.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是( )
A.均值与方差 B.排列与组合
C.概率 D.独立性检验
【答案】D
【解答】解:由题意可知,检验两个变量是否相关时,应选择独立性检验.
故选:D.
10.某校乒乓球社团为了解喜欢乒乓球运动是否与性别有关,随机抽取了若干人进行调查.已知抽查的男生、女生人数均为6m(m∈N*),其中男生喜爱乒乓球运动的人数占男生人数的,女生喜爱乒乓球运动的人数占女生人数的.若本次调查得出“有99.5%的把握认为喜爱乒乓球运动与性别有关”的结论,则m的最小值为( )附:参考公式及数据:.
a 0.10 0.05 0.01 0.005 0.001
xa 2.706 3.841 6.635 7.879 10.828
A.20 B.21 C.22 D.23
【答案】D
【解答】解:由题意可得列联表如下:
男性 女性 合计
喜爱乒乓球 4m 3m 7m
不喜爱乒乓球 2m 3m 5m
合计 6m 6m 12m
则χ2m,
若本次调查得出“有99.5%的把握认为喜爱乒乓球运动与性别有关”,
所以有χ2≥7.879,解得m≥22.980,
又因为上述列联表中的所有数字均为整数,m最小为23.
故选:D.
11.根据分类变量x与y的观测数据,计算得到χ2=3.974,依据α=0.05的独立性检验,结论为( )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量x与y不独立,这个结论犯错误的概率不超过0.01
B.变量x与y不独立,这个结论犯错误的概率不超过0.05
C.变量x与y独立,这个结论犯错误的概率不超过0.05
D.变量x与y独立,这个结论犯错误的概率不超过0.01
【答案】B
【解答】解:因为χ2=3.974>3.841,
所以变量x与y不独立,这个结论犯错误的概率不超过0.05.
故选:B.
12.在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量χ2的值为α.已知P(χ2≥3.841)≈0.05,则( )
A.α的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.α的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.α的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.α的值越小,说明实验数据的观测值与预测值的总体偏差越大
【答案】B
【解答】解:因为P(χ2≥3.841)≈0.05,
所以若α的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”,
故A错误,B正确;
由独立性检验的性质可知,α的值的大小不能说明实验数据的观测值与预测值的总体偏差,
故C错误,D错误.
故选:B.
(多选)13.下列论述正确的是( )
A.已知随机变量,则E(X)=3
B.数据1,3,9,4,5,16,7,11的下四分位数为3.5
C.对某两个分类变量进行独立性检验时,若χ2≥x0.05,则有95%的把握能推断零假设成立.其中x0.05表示概率值0.05所对应的临界值
D.记两个变量的样本相关系数为r,若|r|越接近1,线性相关程度越强
【答案】ABD
【解答】解:对于A:因为,所以,故A正确;
对于B:数据1,3,9,4,5,16,7,11从小到大排列为1,3,4,5,7,9,11,16,
因为8×25%=2,所以数据下四分位数为,故B正确;
对于C:当χ2≥x0.05,有95%的把握能推断零假设不成立,故C不正确;
对于D:根据相关系数的性质可知|r|越接近1,线性相关程度越强,故D正确.
故选:ABD.
(多选)14.下列说法正确的是( )
A.依据分类变量x与y的成对样本数据,计算得到χ2=7.301>6.635=x0.01,则依据α=0.01的独立性检验,没有充分的证据推断x与y有关联
B.极差、方差、标准差均能刻画一组数据的离散程度
C.若事件A、B发生的概率分别为P(A)、P(B),且P(A)P(B)=P(AB),则A与B独立
D.若随机变量X N(4,σ2),且,则
【答案】BCD
【解答】解:对于A:因为χ2=7.301>6.635=x0.01,
所以认为变量x与y有关联,故A错误;
对于B:因为极差、方差、标准差均能刻画一组数据的离散程度,故B正确;
对于C:根据定义,若P(AB)=P(A)P(B),则称事件A与B相互独立,故C正确;
对于D:由X N(4,σ2),则μ=4,
因为,则,
所以,故D正确.
故选:BCD.
(多选)15.下列说法正确的是( )
A.数据﹣3,﹣1,3,7,8,9,11,15的下四分位数是1
B.若用不同的模型拟合同一组数据,则决定系数R2越大的模型,拟合效果越好
C.已知随机变量X~B(n,p),若E(X)=36,D(X)=9,则n=48
D.依据分类变量x与y的成对样本数据,计算得到χ2=6.998>0.635=x0.01,则依据α=0.01的独立性检验,可以认为两个变量没有关联
【答案】ABC
【解答】解:对于A:8个数从小到大排列,因为8×0.25=2,且,
可得下四分位数是1,故A正确;
对于B:由决定系数R2越大,残差平方和越小,即模型的拟合效果越好,故B正确;
对于C:因为X~B(n,p),E(X)=36,D(X)=9,
则,解得:n=48,,故C正确;
对于D:由χ2=6.998>6.635=x0.01,依据α=0.01的独立性检验,
可以认为两个变量有关联的可信度越高,故D错误.
故选:ABC.
16.为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设H0:患慢性气管炎与吸烟没有关系,并通过计算得到统计量χ2≈3.468,则可推断 拒绝 原假设H0.(填“拒绝”或“接受”,规定显著性水平α=0.1,P(χ2≥2.706)≈0.1.)
【答案】拒绝.
【解答】解:由题意可知,χ2≈3.468>2.707,
所以可推断拒绝原假设H0.
故答案为:拒绝.
17.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 45 人.
参考数据:,P(χ2≥3.841)=0.05.
【答案】45.
【解答】解:设被调查的男女生为5m人,则男生喜欢抖音有4m人,女生喜欢抖音有3m人,
则2×2列联表如下:
喜欢抖音 不喜欢抖音 总计
男生 4m m 5m
女生 3m 2m 5m
总计 7m 3m 10m
若有95%的把握判断是否喜欢抖音和性别有关,
则,解得,
因此被调查的男生为5m≥40.35,又m∈N*,则人数是5的正整数倍,
所以大于等于45的5的整数倍都符合题意,调查人数中男生至少有45人.
故答案为:45.
18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,至少有 95% 的把握认为该学校15至16周岁的男生的身高与体重之间有关系.
身高 体重
超重 不超重 总计
偏高 4 1 5
不偏高 3 12 15
总计 7 13 20
附表:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
【答案】95%.
【解答】解:由2×2列联表可知,χ25.934,
因为3.841<5.934<6.635,
所以至少有95%的把握认为该学校15至16周岁的男生的身高与体重之间有关系.
故答案为:95%.
19.某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有 12 人.
α 0.050 0.010
xα 3.841 6.635
【答案】12.
【解答】解:设男生人数为x,则女生人数为,则列联表如下:
喜欢该软件 不喜欢该软件 合计
男生 x
女生
合计 x
若有95%的把握认为是否喜欢该软件和性别有关,
则,
解得x>10.24.
又因为,,,为整数,
所以男生至少有12人.
故答案为:12.
20.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如表所示:
喜欢甜品 不喜欢甜品 合计
南方学生 60 20 80
北方学生 10 10 20
合计 70 30 100
附:
P(K2≥k0) 0.10 0.05 0.010 0.005
k0 2.706 3.841 6.635 7.879
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 有 (填有或没有).
【答案】有.
【解答】解:由题意可知,K24.762,
因为4.762>3.841,
所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
故答案为:有.
21.已知某独立性检验中,由χ2,n=a+b+c+d,计算出χ2=χ12≠0,若将2×2列联表中的数据a,b,c,d分别变成4a,4b,4c,4d,计算出的χ2=χ22,则χ22是χ12的多少倍 4 .
【答案】4.
【解答】解:根据题意可知,
.
故答案为:4.
22.近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以(H1N1)pdm09亚型为主.为考察某新药A预防甲流的效果,进行了个体(单位:例)试验,得到如下列联表:
药物 疾病 总计
未患病 患病
未服用 80 180
服用 150
总计 250 400
(1)请完成2×2列联表,记未服用新药A的个体患甲流的概率为P,给出P的估计值;
(2)根据小概率值α=0.01的独立性检验,能否认为新药A对预防甲流有效?
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
附:
【答案】(1)
药物 疾病 总计
未患病 患病
未服用 100 80 180
服用 150 70 220
总计 250 150 400
;
(2)认为药物A对预防甲流有效.
【解答】解:(1)由题意可得2×2列联表,
药物 疾病 总计
未患病 患病
未服用 100 80 180
服用 150 70 220
总计 250 150 400
所以未服用药物A的个体患甲流的概率的估计值为;
(2)零假设为H0:药物A对预防甲流无效,
由列联表得到,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为药物A对预防甲流有效,该推断错误的概率不超过0.01,
所以根据小概率值α=0.01的独立性检验,能认为药物A对预防甲流有效.
23.某工厂甲乙两条生产线生产了同一种产品,为了解产品质量与生产线的关系,现从这两条生产线所生产的产品中,随机抽取了500件进行检测,检测结果(“合格”或“优良”)如下表:
生产线 检测结果 合计
合格 优良
甲生产线 20 180 200
乙生产线 60 240 300
合计 80 420 500
(1)根据小概率值α=0.01的独立性检验,能否推断产品检测结果与生产线有关联?
(2)用样本估计总体,频率估计概率.现等可能地从这两条生产线中抽取一条生产线,然后从该生产线随机抽取1件产品.
(i)求抽出的产品是优良品的概率;
(ii)已知抽出的产品是优良品,求它是从甲生产线抽出的概率.
附:,
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
【答案】(1)有关联;
(2)(i);(ii).
【解答】解:(1)提出零假设H0:产品检测结果与生产线没有关联,
由,
根据小概率值α=0.01的χ2独立性检验,推断H0不成立,
即产品检测结果与生产线有关联,此推断犯错的概率不大于0.01;
(2)用样本估计总体,频率估计概率,
现等可能地从这两条生产线中抽取一条生产线,然后从该生产线随机抽取1件产品,
设事件A=“被选出的是甲生产线”,事件B=“取出的产品是优良品”;
(ⅰ)依题意,,
,
由全概率公式得:;
(ⅱ)已知取出的产品是优良品,则它是从甲生产线取出的概率为:
.第9章第2节 独立性检验
题型1 等高堆积条形图 题型2 独立性检验
▉题型1 等高堆积条形图
【知识点的认识】
﹣等高堆积条形图:用于显示分类数据的组成部分,条形的高度代表总体数值的累积.
【解题方法点拨】
﹣绘制:将不同分类的数值堆叠在条形上,展示每部分的相对比例.
(多选)1.某短视频平台以讲故事,赞家乡,聊美食,展才艺等形式展示了丰富多彩的新时代农村生活,吸引了众多粉丝,该平台通过直播带货把家乡的农产品推销到全国各地,从而推进了“新时代乡村振兴”.从平台的所有主播中,随机选取300人进行调查,其中青年人,中年人,其他人群三个年龄段的比例饼状图如图1所示,各年龄段主播的性别百分比等高堆积条形图如图2所示,则下列说法正确的有( )
A.该平台女性主播占比的估计值为0.4
B.从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性的概率为0.7
C.按年龄段把所调查的主播分为三层,用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取6名
D.从所调查的主播中,随机选取一位做为幸运主播,已知该幸运主播是青年人的条件下,又是女性的概率为0.6
(多选)2.为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻的经常性有影响,随机抽取了300名学生,对他们是否经常锻炼的情况进行了调查,调查发现经常锻炼人数是不经常锻炼人数的2倍,绘制其等高堆积条形图,如图所示,则( )
附:,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.参与调查的男生中经常锻炼的人数比不经常锻炼的人数多
B.从参与调查的学生中任取一人,已知该生为女生,则该生经常锻炼的概率为
C.依据α=0.1的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.1
D.假设调查人数为600人,经常锻炼人数与不经常锻炼人数的比例不变,统计得到的等高堆积条形图也不变,依据α=0.05的独立性检验,认为性别因素影响学生体育锻炼的经常性,该推断犯错误的概率不超过0.05
3.等高堆积条形图是一种数据可视化方式,能够清晰呈现多个变量的数据并进行比较,这种类型图表将多个条形图堆积在一起并用颜色进行区分,形成一条整体条形图,每个条形图的高度表示对应变量的值,不同颜色表示不同变量,能够更好的理解每个变量在总体中的占比.北方的冬天室外温度极低,如果轻薄、保暖的石墨烯发热膜能用在衣服上,那么可爱的医务工作者们在冬季行动会更方便.石墨烯发热膜的制作如下:从石墨中分离出石墨烯,制成石墨烯发热膜.从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了50次再结晶试验,得到如下等高堆积条形图.
A材料 B材料 合计
试验成功
试验失败
合计
单位:次
(1)根据等高堆积条形图,填写2×2列联表,并判断是否有99.9%的把握认为试验的结果与材料有关;
(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV胶层;②石墨烯层;③表面封装层.第一、二环节生产合格的概率均为,第三环节生产合格的概率为,且各生产环节相互独立.已知生产1吨石墨烯发热膜的固定成本为1万元,若生产不合格还需进行修复,第三环节的修复费用为4000元,其余环节修复费用均为2000元.试问如何定价(单位:万元),才能实现每生产1吨石墨烯发热膜获利不低于1万元的目标?(精确到0.001)
附:,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
4.为持续深化“一盔一带”安全守护行动,有效遏制和减少因电动车闯红灯、逆行、不佩戴安全头盔等行为带来的交通安全隐患,2022年5月以来,泰安交警景区大队根据辖区实际.稳步推进“一盔一带”安全守护行动,确保辖区道路交通环境畅通、有序,该行动开展一段时间后,针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,其中年龄低于40岁占60%,得到如图的等高堆积条形图.
(1)据等积条所给的数据,完成下面的列联表:
年龄 佩戴头盔 合计
是 否
年龄低于40岁
年龄不低于40岁
合计
(2)根据(1)中的列联表,依据小概率值α=0.01的独立性检验,能否认为佩戴安全头盔与年龄有关.
附:,其中n=a+b+c+d.
α 0.05 0.01 0.005
xα 3.841 6.635 7.879
▉题型2 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生 女生
篮球迷 90 20
非篮球迷 60 30
附:
P(X2≥k) 0.10 0.05 0.01 0.005
k 2.706 3.841 6.635 7.789
A.有99.5%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
6.已知一项统计结果表明有99%的把握认为“吸烟与患肺癌有关”是正确的,则( )
A.吸烟者一定会患肺癌
B.吸烟者患肺癌的概率为99%
C.100个吸烟者大约有99个会患肺癌
D.认为“吸烟与患肺癌有关”犯错的概率不超过1%
7.下列说法正确的是( )
K2的部分临界值如下表:
P(K2≥k0) 0.1 0.05 0.025 0.01
k0 2.706 3.841 5.024 6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量X,Y,由它们的样本数据计算得到K2的观测值k≈5.527,则在犯错误的概率不超过0.025的前提下认为变量X,Y没有关系
8.根据分类变量x与y的观测数据,计算得到χ2≈0.837,依据小概率值α=0.1(x0.1=2.706)的独立性检验,则( )
A.变量x与y不独立
B.变量x与y独立
C.变量x与y不独立,这个结论犯错误的概率不超过0.1
D.变量x与y独立,这个结论犯错误的概率不超过0.1
9.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是( )
A.均值与方差 B.排列与组合
C.概率 D.独立性检验
10.某校乒乓球社团为了解喜欢乒乓球运动是否与性别有关,随机抽取了若干人进行调查.已知抽查的男生、女生人数均为6m(m∈N*),其中男生喜爱乒乓球运动的人数占男生人数的,女生喜爱乒乓球运动的人数占女生人数的.若本次调查得出“有99.5%的把握认为喜爱乒乓球运动与性别有关”的结论,则m的最小值为( )附:参考公式及数据:.
a 0.10 0.05 0.01 0.005 0.001
xa 2.706 3.841 6.635 7.879 10.828
A.20 B.21 C.22 D.23
11.根据分类变量x与y的观测数据,计算得到χ2=3.974,依据α=0.05的独立性检验,结论为( )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量x与y不独立,这个结论犯错误的概率不超过0.01
B.变量x与y不独立,这个结论犯错误的概率不超过0.05
C.变量x与y独立,这个结论犯错误的概率不超过0.05
D.变量x与y独立,这个结论犯错误的概率不超过0.01
12.在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量χ2的值为α.已知P(χ2≥3.841)≈0.05,则( )
A.α的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.α的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.α的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.α的值越小,说明实验数据的观测值与预测值的总体偏差越大
(多选)13.下列论述正确的是( )
A.已知随机变量,则E(X)=3
B.数据1,3,9,4,5,16,7,11的下四分位数为3.5
C.对某两个分类变量进行独立性检验时,若χ2≥x0.05,则有95%的把握能推断零假设成立.其中x0.05表示概率值0.05所对应的临界值
D.记两个变量的样本相关系数为r,若|r|越接近1,线性相关程度越强
(多选)14.下列说法正确的是( )
A.依据分类变量x与y的成对样本数据,计算得到χ2=7.301>6.635=x0.01,则依据α=0.01的独立性检验,没有充分的证据推断x与y有关联
B.极差、方差、标准差均能刻画一组数据的离散程度
C.若事件A、B发生的概率分别为P(A)、P(B),且P(A)P(B)=P(AB),则A与B独立
D.若随机变量X N(4,σ2),且,则
(多选)15.下列说法正确的是( )
A.数据﹣3,﹣1,3,7,8,9,11,15的下四分位数是1
B.若用不同的模型拟合同一组数据,则决定系数R2越大的模型,拟合效果越好
C.已知随机变量X~B(n,p),若E(X)=36,D(X)=9,则n=48
D.依据分类变量x与y的成对样本数据,计算得到χ2=6.998>0.635=x0.01,则依据α=0.01的独立性检验,可以认为两个变量没有关联
16.为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设H0:患慢性气管炎与吸烟没有关系,并通过计算得到统计量χ2≈3.468,则可推断 原假设H0.(填“拒绝”或“接受”,规定显著性水平α=0.1,P(χ2≥2.706)≈0.1.)
17.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 人.
参考数据:,P(χ2≥3.841)=0.05.
18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,至少有 的把握认为该学校15至16周岁的男生的身高与体重之间有关系.
身高 体重
超重 不超重 总计
偏高 4 1 5
不偏高 3 12 15
总计 7 13 20
附表:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
19.某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有 人.
α 0.050 0.010
xα 3.841 6.635
20.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如表所示:
喜欢甜品 不喜欢甜品 合计
南方学生 60 20 80
北方学生 10 10 20
合计 70 30 100
附:
P(K2≥k0) 0.10 0.05 0.010 0.005
k0 2.706 3.841 6.635 7.879
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” (填有或没有).
21.已知某独立性检验中,由χ2,n=a+b+c+d,计算出χ2=χ12≠0,若将2×2列联表中的数据a,b,c,d分别变成4a,4b,4c,4d,计算出的χ2=χ22,则χ22是χ12的多少倍 .
22.近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以(H1N1)pdm09亚型为主.为考察某新药A预防甲流的效果,进行了个体(单位:例)试验,得到如下列联表:
药物 疾病 总计
未患病 患病
未服用 80 180
服用 150
总计 250 400
(1)请完成2×2列联表,记未服用新药A的个体患甲流的概率为P,给出P的估计值;
(2)根据小概率值α=0.01的独立性检验,能否认为新药A对预防甲流有效?
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
附:
23.某工厂甲乙两条生产线生产了同一种产品,为了解产品质量与生产线的关系,现从这两条生产线所生产的产品中,随机抽取了500件进行检测,检测结果(“合格”或“优良”)如下表:
生产线 检测结果 合计
合格 优良
甲生产线 20 180 200
乙生产线 60 240 300
合计 80 420 500
(1)根据小概率值α=0.01的独立性检验,能否推断产品检测结果与生产线有关联?
(2)用样本估计总体,频率估计概率.现等可能地从这两条生产线中抽取一条生产线,然后从该生产线随机抽取1件产品.
(i)求抽出的产品是优良品的概率;
(ii)已知抽出的产品是优良品,求它是从甲生产线抽出的概率.
附:,
α 0.1 0.01 0.001
xα 2.706 6.635 10.828