专题强化练6 独立性检验与统计、概率的综合应用
1.为了研究家用轿车在高速公路上的车速情况,交通部门随机对50名家用轿车的驾驶员进行调查,得到他们在高速公路上行驶时的平均车速情况:在30名男性驾驶员中,平均车速超过100 km/h的有20人,不超过100 km/h的有10人;在20名女性驾驶员中,平均车速超过100 km/h的有5人,不超过100 km/h的有15人.
(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100 km/h的人与性别有关;
平均车速超过 100 km/h的人数 平均车速不超过 100 km/h的人数 总计
男性驾驶 员人数
女性驾驶 员人数
总计
(2)从50名家用轿车的驾驶员中随机选取3人,记这3人中驾驶员为女性且车速不超过100 km/h的人数为ξ,若每次选取的结果是相互独立的,求ξ的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
P(χ2≥k) 0.10 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
2.某乒乓球教练决定检验运动员某项技能水平,随机选取100名运动员进行测试,并根据该项技能的评价指标,按[60,65),[65,70),[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]分成8组,得到如图所示的频率分布直方图.
(1)求a的值,并估计该项技能的评价指标的中位数(精确到0.1);
(2)根据频率分布直方图求样本评价指标的平均数(同一组中的数据用该组区间的中点值为代表),若平均数与中位数之差的绝对值小于1,则认为该项技能水平有显著稳定性,否则不认为有显著稳定性,请依据数据给出答案;
(3)在选取的100名运动员中,训练时间不少于1年的(记为A队)与少于1年的(记为B队)人数相同,若规定评价指标不低于80为优秀,低于80为良好,经统计,训练时间不少于1年的有40名运动员评价指标为优秀,请列出2×2列联表,并判断是否有99%的把握认为“评价指标是否优秀与训练时间有关”.
附:χ2=,其中n=a+b+c+d.
P(χ2≥k) 0.10 0.05 0.01
k 2.706 3.841 6.635
3.近年来,直播电商带货的模式发展势头迅猛,每年的“双十一”购物节成为各直播电商关注的焦点.某直播公司为增加销售额,准备采取新举措,将原本单一的直播团队拆分为甲、乙两个直播团队,相互竞争.该公司记录了新举措实施前40天全公司的日均总销售额和新举措实施后40天全公司的日均总销售额的天数频数分布表,分别如表1和表2所示:
表1
日均总销 售额/万元 [15,16) [16,17) [17,18) [18,19)
天数 12 15 6 2
日均总销 售额/万元 [19,20) [20,21) [21,22) [22,23]
天数 2 1 1 1
表2
日均总销 售额/万元 [15,16) [16,17) [17,18) [18,19)
天数 1 2 3 4
日均总销 售额/万元 [19,20) [20,21) [21,22) [22,23]
天数 13 14 2 1
(1)将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为公司销售额提高与采取新举措有关;
日均总销售额 小于20万元 日均总销售额 不小于20万元 总计
新举措实 施前40天
新举措实 施后40天
总计
(2)后期该公司还打算对甲、乙两个直播团队的表现进行如下考核:选定某周周一至周五的5天时间,对两队当天的销售额进行比较,若甲团队的销售额超过10万元且乙团队的销售额未超过10万元,则甲团队得1分,乙团队得-1分;若乙团队的销售额超过10万元且甲团队的销售额未超过10万元,则乙团队得1分,甲团队得-1分;若两团队的销售额都超过10万元或都未超过10万元,则两团队均得0分.根据以往数据,甲、乙两团队某天销售额超过10万元的概率分别为p1和p2,某一天的考核中甲团队的得分记为X.
①若p1=0.5,p2=0.8,求X的分布列;
②若甲、乙两团队在考核开始时都赋予3分,两队销售额比较1次算一轮,经过10轮比较后,甲团队得分的数学期望超过5分,求p1的取值范围(用p2表示).
参考公式及数据:
χ2=,其中n=a+b+c+d.
P(χ2≥k) 0.15 0.10 0.05 0.025 0.01 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
4.我国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取于2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着我国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.电动汽车是重要的战略新兴产业,对实现“双碳目标”具有重要的作用.为了解某一地区电动汽车的销售情况,一机构根据统计数据,用最小二乘法得到电动汽车年销售量y(单位:万台)关于年份x的回归直线方程为=4.7x-9 459.2,且年销售量y的方差为,年份x的方差为=2.
(1)求y与x的相关系数r,并据此判断电动汽车年销售量y与年份x的线性相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别 购车种类情况
购买非电动汽车 购买电动汽车 总计
男性 39 6 45
女性 30 15 45
总计 69 21 90
请判断是否有95%的把握认为是否购买电动汽车与车主性别有关;
(3)在购买电动汽车的车主中按照性别进行分层随机抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为X,求X的分布列和数学期望.
附:①参考数据:≈25.
②参考公式:(i)回归直线方程中,;(ii)相关系数r=,若|r|>0.9,则可判定y与x的线性相关性较强;(iii)χ2=,其中n=a+b+c+d.③临界值表:
P(χ2≥k) 0.10 0.05 0.01 0.001
k 2.706 3.841 6.635 10.828
答案与分层梯度式解析
专题强化练6 独立性检验与统计、概率的综合应用
1.解析 (1)2×2列联表如下:
平均车速超过 100 km/h的人数 平均车速不超过 100 km/h的人数 总计
男性驾驶 员人数 20 10 30
女性驾驶 员人数 5 15 20
总计 25 25 50
则χ2=≈8.333>7.879,
所以有99.5%的把握认为平均车速超过100 km/h的人与性别有关.
(2)由题意可知,从50名家用轿车的驾驶员中随机选取1人,
则选取的驾驶员为女性且车速不超过100 km/h的概率为,则ξ~B,
则P(ξ=0)=,
P(ξ=1)=,
P(ξ=2)=,
P(ξ=3)=,
所以ξ的分布列为
ξ 0 1 2 3
P
数学期望Eξ=3×.
2.解析 (1)由题图可知,(0.008+0.016+0.02+a+0.044+0.04+0.028+0.008)×5=1,
解得a=0.036.
因为(0.008+0.016+0.02+0.036)×5=0.4<0.5,
(0.008+0.016+0.02+0.036+0.044)×5=0.62>0.5,
所以该项技能的评价指标的中位数在[80,85)内.
设该项技能的评价指标的中位数为m,则(m-80)×0.044+0.4=0.5,
解得m≈82.3.
故该项技能的评价指标的中位数约为82.3.
(2)评价指标的平均数为(62.5×0.008+67.5×0.016+72.5×0.02+77.5×0.036+82.5×0.044+87.5×0.04+92.5×0.028+97.5×0.008)×5=81.6,
所以平均数与中位数之差的绝对值为|81.6-82.3|=0.7<1,所以认为该项技能水平有显著稳定性.
(3)评价指标不低于80的频率为(0.044+0.04+0.028+0.008)×5=0.6,
所以评价指标不低于80的运动员有100×0.6=60(名).
2×2列联表如下:
优秀 良好 总计
A队 40 10 50
B队 20 30 50
总计 60 40 100
则χ2=≈16.667>6.635.
所以有99%的把握认为“评价指标是否优秀与训练时间有关”.
3.解析 (1)补全2×2列联表如下:
日均总销售额小于20万元 日均总销售额 不小于20万元 总计
新举措实 施前40天 37 3 40
新举措实 施后40天 23 17 40
总计 60 20 80
则χ2=≈13.067>10.828,
所以有99.9%的把握认为公司销售额提高与采取新举措有关.
(2)X的所有可能取值为-1,0,1,
则P(X=-1)=p2(1-p1),
P(X=0)=p1p2+(1-p1)(1-p2),
P(X=1)=p1(1-p2).
①当p1=0.5,p2=0.8时,随机变量X的分布列如下表所示:
X -1 0 1
P 0.4 0.5 0.1
②EX=-p2(1-p1)+p1(1-p2)=p1-p2,
则E(10X)=10EX=10(p1-p2)>5-3=2,
所以p1>p2+,
又p1≤1,
所以p2+
4.解析 (1)相关系数r=
=·
=4.7×
=4.7×≈=0.94>0.9,
故电动汽车年销售量y与年份x的线性相关性较强.
(2)χ2=≈5.031>3.841,
所以有95%的把握认为是否购买电动汽车与车主性别有关.
(3)由题意得,抽取的7人中,男性车主有2人,女性车主有5人,则X的可能取值为0,1,2,
P(X=0)=,
故X的分布列为
X 0 1 2
P
数学期望EX=0×.
10