专题六 概率与统计
第1讲 小题研透——计数原理与统计初步
【锁定高考·明方向】
真题感悟
1.C 对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg, 故A错误;对于B,亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;对于C,稻田亩产量的极差最大为1 200-900=300,最小为1 150-950=200,故C正确;对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.故选C.
2.BD 若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.
3.B 先将丙和丁捆在一起有种排列方式,然后将其与乙、戊排列,有种排列方式,最后将甲插入中间两空,有种排列方式,所以不同的排列方式共有=24种,故选B.
4.24 112 解析:由题意知,选4个方格,每行和每列均恰有一个方格被选中,则第一列有4个方格可选,第二列有3个方格可选,第三列有2个方格可选,第四列有1个方格可选,所以共有4×3×2×1=24种选法.
法一(列举法) 每种选法可标记为(a,b,c,d),a,b,c,d分别表示第一、二、三、四行的数字,则所有的可能结果为:(11,22,33,44),(11,22,43,34),(11,33,22,44),(11,33,43,24),(11,42,22,34),(11,42,33,24),(21,12,33,44),(21,12,43,34),(21,33,13,44),(21,33,43,15),(21,42,13,34),(21,42,33,15),(31,12,22,44),(31,12,43,24),(31,22,13,44),(31,22,43,15),(31,42,13,24),(31,42,22,15),(40,12,22,34),(40,12,33,24),(40,22,13,34),(40,22,33,15),(40,33,13,24),(40,33,22,15),比较可知,所选方格中,(21,33,43,15)的和最大,最大为112.
法二(整体分析法) 先按列分析,每列必选出一个数,故所选4个数的十位上的数字分别为1,2,3,4.再按行分析,第一、二、三、四行个位上的数字的最大值分别为1,3,3,5,故从第一行选21,从第二行选33,从第三行选43,从第4行选15,此时个位上的数字之和最大.故选中方格中的4个数之和的最大值为21+33+43+15=112.
5.5 解析:由二项式定理知( +x)10=x10-k.记ak=,k=0,1,…,10.
法一 对于k=1,2,…,10,有=·=.当k≤2时,>1;当k≥3时,<1,因此a0<a1<a2,a2>a3>…>a10,所以展开式各项系数中的最大值为a2==5.
法二 对于k=1,2,…,10,有ak-ak-1=(-3)=·( -)=·,当k≤2时,ak-ak-1>0;当k≥3时,ak-ak-1<0.因此有a0<a1<a2,a2>a3>…>a10,所以展开式各项系数中的最大值为a2==5.
【研透高考·攻重点】
【例1】 (1)C (2)D 解析:(1)根据题意,可分为两类:①当新节目插在中间的四个空隙中的一个时,有=4×2=8种方法;②当新节目插在中间的四个空隙中的两个时,有=4×3=12种方法,由分类加法计数原理得,共有8+12=20种不同的插法.故选C.
(2)由题意可知,先将5人分成3组,有两类分法,第一类,各组人数分别为3,1,1,共有种分法;第二类,各组人数分别为1,2,2,共有种分法.将3组人员分配到A,B,C三个乡村学校去,共有种分法,所以不同的选派方法共有( +)=150(种).故选D.
跟踪训练
1.C 以A为起点时,三条路线依次连接即可到达B点.共有3×2=6种选择,自B连接到C时,在C右侧可顺时针连接或逆时针连接,共有2种选择,∴以A为起点,C为终点时,共有6×2=12种方法;同理可知,以C为起点,A为终点时,共有12种方法.∴完成该图“一笔画”的方法数为12+12=24种.
2.B 法一(排除法) 从7个点中任意取3个点共有种取法,因为B,D,E,F四点共线,其中任意三点都不能构成三角形,所以共可以构成-=35-4=31(个)不同三角形,故选B.
法二(分类法) 第一类:B,D,E,F四个点中一个点都不取,可构成=1(个)三角形;第二类:从B,D,E,F四个点中取1个点,在A,C,G中取2个点,可构成=12(个)三角形;第三类:从B,D,E,F四个点中取2个点,在A,C,G中取1个点,可构成=18(个)三角形.共可以构成1+12+18=31(个)三角形,故选B.
【例2】 (1)AC (2)-40 解析:(1)根据二项式定理,( 2x-)8的通项为Tk+1=28-k(-1)kx8-2k,常数项为24(-1)4=1 120,故A正确;第四项的系数为28-3(-1)3=-1 792,第六项的系数为28-5(-1)5=-448,故B错误;因为n=8,所以各项的二项式系数之和为28=256,故C正确;令x=1,各项的系数之和为1,故D错误.
(2)(x-2y)6的通项公式为Tr+1=x6-r(-2y)r=(-2)rx6-ryr,令r=2得,T3=(-2)2x4y2=60x4y2,此时60x4y2·2=120x4y2,令r=3得,T4=(-2)3x3y3=-160x3y3,此时-160x3y3·=-160x4y2,故x4y2的系数为120-160=-40.
跟踪训练
1.C 令x=0,则15=a0,∴a0=1;令x=1,则35=a0+a1+a2+a3+a4+a5,∴a1+a2+a3+a4+a5=35-1=242.故选C.
2.32 -1 080 解析:由二项式定理得(3x-y+2z)5的展开式的通项公式为Tr+1=(3x-y)5-r·(2z)r,欲使得不含z,则r=0,∴T1=(3x-y)5,令x=1,y=1,则所有不含字母z的项的系数之和为25=32;含x3yz的项是·(3x)3(-y)·2z=-1 080x3yz,故其系数为-1 080.
3.4 解析:由(a+b)2n的展开式的二项式系数的最大值为x,则有x=,由(a+b)2n+1的展开式的二项式系数的最大值为y,则有y=,由9x=5y,故有9=5,即9×=5×,即9×=5×,即9(n+1)=5(2n+1),解得n=4.
【例3】 (1)BCD (2)2.5 解析:(1)设极差为t,由题中频率分布直方图可知,组距为1,共有12组,所以t≤1×12=12,且不是一定取等号,所以A不正确;前6组频率之和为0.02+0.04+0.1+0.14+0.2+0.2=0.7,前7组频率之和为0.7+0.1=0.8,所以75%分位数应位于[8.5,9.5)内,由8.5+1×=9,可以估计75%分位数为9,所以B正确;家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64>0.5,所以C正确;由题中频率分布直方图可知,该地农户家庭年收入的平均值为3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+(12+13+14)×0.02=7.68(万元),又7.68>6.5,所以D正确.综上,选B、C、D.
(2)设样本数据x1,x2,…,x8的平均数为,则(xi-)2=2,设样本数据y1,y2,…,y8的平均数为,由yi=xi+(-1)i(i=1,2,…,8),则=,所以(yi-)2=[xi+(-1)i-]2=2+(-1)i(xi-)+1=3+(-1)ixi=3+×(-2)=2.5.
跟踪训练
1.ACD 对于A,这5天的最高气温的平均数为=24 ℃,最低气温的中位数为17 ℃,它们的差为7 ℃,A正确.对于B,这5天的最低气温的极差为6 ℃,B错误.对于C,这5天的最高气温的众数为26 ℃,C正确.对于D,最低气温从小到大排列为13 ℃,15 ℃,17 ℃,18 ℃,19 ℃,且5×0.4=2,所以这5天的最低气温的第40百分位数是16 ℃,D正确.故选A、C、D.
2.168 27 解析:易知抽取的30名学生中,男生有20名,女生有10名,则用样本估计总体的平均值为=168,估计总体的方差为s2=×[16+(170-168)2]+×[25+(164-168)2]=27.
第2讲 小题研透——概率
【锁定高考·明方向】
真题感悟
1.A 法一 如图,左圆表示爱好滑冰的学生所占比例,右圆表示爱好滑雪的学生所占比例,A表示爱好滑冰且不爱好滑雪的学生所占比例,B表示既爱好滑冰又爱好滑雪的学生所占比例,C表示爱好滑雪且不爱好滑冰的学生所占比例,则0.6+0.5-B=0.7,所以B=0.4,C=0.5-0.4=0.1.所以若该学生爱好滑雪,则他也爱好滑冰的概率为==0.8,故选A.
法二 令事件A,B分别表示该学生爱好滑冰、该学生爱好滑雪,事件C表示该学生爱好滑雪的条件下也爱好滑冰,则P(A)=0.6,P(B)=0.5,P(AB)=P(A)+P(B)-0.7=0.4,所以P(C)=P(A|B)===0.8,故选A.
2.BC 法一 依题可知,=2.1,s2=0.01,所以Y~N(2.1,0.12),故P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3>0.5,C正确,D错误;因为X~N(1.8,0.12),所以P(X>2)=P(X>1.8+2×0.1),因为P(X<1.8+0.1)≈0.841 3,所以P(X>1.8+0.1)≈1-0.841 3=0.158 7<0.2,而P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)<0.2,B正确,A错误,故选B、C.
法二 由P(Z<μ+σ)≈0.841 3,得P(μ-σ<Z<μ+σ)≈0.682 6,又Y~N(2.1,0.12),X~N(1.8,0.12),则P(X>2)=≈=0.022 8<0.5,P(Y>2)=0.5+≈0.5+0.341 3=0.841 3>0.8>0.5,故选B、C.
3.ABD 对于A,因为信号的传输是相互独立的,所以采用单次传输方案依次发送1,0,1,依次收到1,0,1的概率p=(1-β)(1-α)(1-β)=(1-α)(1-β)2,则A正确;对于B,因为信号的传输是相互独立的,所以采用三次传输方案发送1,即发送3次1,依次收到1,0,1的概率p=(1-β)·β(1-β)=β(1-β)2,则B正确;对于C,因为信号的传输是相互独立的,所以采用三次传输方案发送1,译码为1包含两种情况:2次收到1,3次都收到1.而这两种情况是互斥的,所以采用三次传输方案发送1,收到译码为1的概率p=(1-β)2β+(1-β)3=3β(1-β)2+(1-β)3,则C错误;对于D,设“采用单次传输方案发送0,译码为0”为事件B,则P(B)=1-α.设采用三次传输方案发送0,收到的信号为0的次数为X,则P(X≥2)=P(X=2)+P(X=3)=(1-α)2α+(1-α)3=(1+2α)(1-α)2.又当0<α<0.5时,P(X≥2)-P(B)=(1+2α)(1-α)2-(1-α)=α(1-α)(1-2α)>0,所以采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率,则D正确.故选A、B、D.
4. 解析:甲出1一定输,所以最多得3分,要得3分,就只有一种组合1-8,3-2,5-4,7-6.
得2分有三类,分别列举如下:
(1)出3和出5时赢,其余输:1-6,3-2,5-4,7-8;
(2)出3和出7时赢,其余输:1-4,3-2,5-8,7-6;1-8,3-2,5-6,7-4;1-6,3-2,5-8,7-4;
(3)出5和出7时赢,其余输:1-2,3-8,5-4,7-6;1-4,3-8,5-2,7-6;1-8,3-4,5-2,7-6;1-6,3-8,5-2,7-4;1-8,3-6,5-2,7-4;1-6,3-8,5-4,7-2;1-8,3-6,5-4,7-2.
共12种组合满足要求,而所有组合为4!,所以甲得分不小于2的概率为=.
【研透高考·攻重点】
【例1】 D 将5名志愿者分配到4个场馆,共有种不同的方法,其中A,B两名志愿者在同一个场馆共有种不同的方法,所以A,B两名志愿者不在同一个场馆的概率为P=1-=.故选D.
跟踪训练
1.C 设A表示事件“丙不是第一个出场,且甲最后出场”,B表示事件“丙不是第一个出场,且乙最后出场”.四人由随机抽签的方式确定出场次序,基本事件共有24个,事件A包含的基本事件有4个,故P(A)==,同理有P(B)=.由于事件A与事件B互斥,故丙不是第一个出场,且甲或乙最后出场的概率为P(A∪B)=P(A)+P(B)=.
2.D 令6个挂件分别为A,A,B,B,C,C,则将这6个挂件分为3组有5种可能:①AB,AB,CC;②AC,AC,BB;③BC,BC,AA;④AA,BB,CC;⑤AB,BC,AC.再将这分成3组的挂件分给3位同学,有3+3+3++=21(种)情况,恰好有1位同学得到同类吉祥物挂件为分组①②③,有3+3+3=9(种)情况,所以恰好有1位同学得到同类吉祥物挂件的概率是=.故选D.
【例2】 (1)A (2)BCD 解析:(1)抛掷次数为1的概率为=,点数可能为3或4,抛掷次数为2的概率为1-=,此时基本事件有(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4)共八种,其中点数之和至少为4的情况有(1,3),(1,4),(2,2),(2,3),(2,4)共五种,故抛掷骰子所得的点数之和至少为4的概率为×+×=+=.故选A.
(2)对于A,∵n(A)=60,n(D)=10,n(A∪D)=70,∴n(A∪D)=n(A)+n(D),∴A与D互斥,故A错误;对于B,∵n(A∪B)=n(A)+n(B)=n(Ω),∴A与B互为对立,故B正确;对于C,∵P(A)==,P(C)==,P(A∩C)==,∴P(A∩C)=P(A)P(C)=,∴A与C相互独立,故C正确;对于D,∵n(Ω)=100,n(A)=60,n(B)=40,n(C)=20,n(A∪B)=100,n(A∩C)=12,∴n(B∩C)=8,∴P(B∩C)==,又∵P(B)==,P(C)==,∴P(B∩C)=P(B)P(C)=,∴B与C相互独立,故D正确.故选B、C、D.
跟踪训练
1.A 由题意得,P(A)=,P(B)=,P(AB)=,∴P(AB)=P(A)P(B),∴事件A与B相互独立,则A与也相互独立,∴P(A)=P(A)P()=P(A)(1-P(B))=×=.故选A.
2.D 当n=2时,AB表示一正一反,故P(AB)=2××=,故A正确;此时P(A)=2××=,P(B)=1-P()=1-×=,P(AB)=≠=P(A)P(B),故B正确;当n=3时,A+B表示并非每次都是正面朝上,故P(A+B)=1-P()=1-××=,故C正确;此时P(AB)=3×××=,P(A)=1-P()=1-××-××=,P(B)=××+3×××=,所以P(AB)==×=P(A)P(B),故D错误.故选D.
【例3】 (1)C (2)B 解析:(1)据题意,记甲击中目标为事件A,乙击中目标为事件B,目标被击中为事件C,甲、乙同时击中目标为事件D,则P(A)=,P(B)=,所以P(C)=1-P()P()=1-(1-)×(1-)=,P(DC)=P(D)=P(AB)=P(A)P(B)=×=,则在目标被击中的情况下,甲、乙同时击中目标的概率为P(D|C)===.
(2)设A1,A2分别表示取得的这块芯片是由甲、乙线生产的,B表示取得的芯片为次品,甲线生产该芯片的次品率为p,则P(A1)==,P(A2)=,P(B|A1)=p,P(B|A2)=.由全概率公式得P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)=p+×=0.08,解得p=.故选B.
跟踪训练
1. 解析:由题意知甲选到A的概率P==.记乙选择A活动为事件M,乙选了A活动再选择B活动为事件N,则P(M)==,P(MN)==,所以P(N|M)===.
2. 解析:设A=“在甲盒中拿到红球”,B=“在乙盒中拿到红球”.因为甲盒中有3个红球,2个黄球,所以P(A)=,P()=1-=,又乙盒中有2个红球,1个黄球,所以P(B|A)=,P(B|)=,所以P(B)=P(AB)+P(B)=P(A)P(B|A)+P()P(B|)=×+×=.
【例4】 D 因为正态密度函数为f(x)=,所以E(X)=90,所以正态曲线关于直线x=90对称,所以P(X<70)=P(X>110),又P(70≤X≤110)=0.8,所以P(X>110)==0.1,又共有50 000名学生参加这次考试,所以该市这次考试数学成绩超过110分的学生人数约为50 000×0.1=5 000,故选D.
跟踪训练
1.D 随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,所以P(1.5≤X<2)=0.36,P(X<1.5)=(1-0.36×2)=0.14,所以P(X>1.5)=1-0.14=0.86,故选D.
2.0.01(答案不唯一,小于等于0.02的正数即可) 解析:依题意可得μ=80,要使次品率不高于0.27%,则正品率不低于99.73%,又根据正态曲线的特征知,|ξ-80|<3σ,所以ξ∈(80-3σ,80+3σ) (79.94,80.06),所以解得σ≤0.02,故σ的一个值可以为0.01.
第3讲 大题专攻——随机变量及其分布
【锁定高考·明方向】
真题感悟
1.解:X的所有可能取值为0,1,2,
且P(X=k)=,k=0,1,2,
所以X的分布列为
X 0 1 2
P
X的数学期望E(X)=0×+1×+2×=1.
2.解:(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
所以比赛成绩不少于5分的概率P=(1-0.63)(1-0.53)=0.686.
(2)若甲参加第一阶段比赛,则甲、乙所在队的比赛成绩X的所有可能取值为0,5,10,15.
P(X=0)=(1-p)3+[1-(1-p)3]·(1-q)3,
P(X=5)=[1-(1-p)3]··q·(1-q)2,
P(X=10)=[1-(1-p)3]··q2·(1-q),
P(X=15)=[1-(1-p)3]·q3,
所以E(X)=[1-(1-p)3]·[15q(1-q)2+30q2·(1-q)+15q3]=[1-(1-p)3]·15q=15pq·(p2-3p+3).
若乙参加第一阶段比赛,则甲、乙所在队的比赛成绩Y的所有可能取值为0,5,10,15.
同理,可得E(Y)=15pq(q2-3q+3).
E(X)-E(Y)=15pq(p2-3p-q2+3q)=15pq(q-p)(3-p-q),
由0<p<q≤1,
得q-p>0,3-p-q=3-(p+q)>0,
所以E(X)-E(Y)>0,即E(X)>E(Y).
故应该由甲参加第一阶段比赛.
【研透高考·攻重点】
【例1】 解:(1)设一轮摸球游戏结束时摸球次数不超过3次为事件A,记第i次(i=1,2,3)摸到红球为事件Bi,
则事件A=∪B1∪B1B2,
显然,B1,B1B2彼此互斥,
由互斥事件概率的加法公式:P(A)=P(∪B1∪B1B2)=P()+P(B1)+P(B1B2),
因为每次摸到红球后放回,所以P(Bi)=,P()=,
所以P(A)=+×+××=.
(2)依题意,X的可能取值为2,3,4,5,
P(X=2)=P()=,
P(X=3)=P(B1)=×=,
P(X=4)=P(B1B2)+P(B1B2B3B4)=××+()4=,
P(X=5)=P(B1B2B3)=()3×=,
所以一轮摸球游戏结束时,此人总得分X的分布列为
X 2 3 4 5
P
E(X)=2×+3×+4×+5×=.
跟踪训练
解:(1)记抛掷骰子的样本点为(a,b),则样本空间Ω={(a,b)|1≤a≤6,1≤b≤6,a∈N*,b∈N*},
则n(Ω)=36,
记事件A=“X>0”,记事件B=“X=[]=”,
则A={(a,b)|1≤a≤b≤6,a∈N*,b∈N*,且[]>0},则n(A)=21.
又AB={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,2),(2,4),(2,6),(3,3),(3,6),(4,4),(5,5),(6,6)},
则n(AB)=14,
所以P(B|A)===,
即在X>0的条件下,X=的概率为.
(2)X的所有可能取值为0,1,2,3,4,5,6.
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)=,P(X=5)=,P(X=6)=,
所以X的分布列为:
X 0 1 2 3 4 5 6
P
所以E(X)=0×+1×+2×+3×+4×+5×+6×=.
【例2】 解:(1)记“从10所学校中随机选取的3所学校参与‘自由式滑雪’都超过40人”为事件A,
参与“自由式滑雪”的人数超过40的学校共4所,
从中随机选择3所学校的选法共=4(种),
所以P(A)===.
(2)参与“单板滑雪”人数在45以上的学校共4所,
所以X的所有可能取值为0,1,2,3,
则P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===,
所以X的分布列如下表:
X 0 1 2 3
P
所以E(X)=+2×+3×=.
(3)记“小明同学在一轮测试中要想获得优秀”为事件B,
则P(B)=( )2×+( )3=,
由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布B( n,),
由题意得n≥5,得n≥,
因为n∈N*,所以n的最小值为20,
故至少要进行20轮测试.
跟踪训练
解:(1)由题意可知:每次抛掷骰子上两级台阶的概率为=,上三级台阶的概率为=,
且X的可能取值为6,7,8,9,可得(X-6)~B(3,),则有:
P(X=6)=()3=,
P(X=7)=××()2=,
P(X=8)=×()2×=,
P(X=9)=()3=,
所以X的分布列为
X 6 7 8 9
P
因为E(X-6)=3×=1,所以E(X)=7.
(2)因为位于第10级台阶则认定游戏失败,无法获得奖品,
结合题意可知:若学生位于第10级台阶,则抛掷3次后,学生位于第7级台阶,抛掷第4次上三级台阶,
可知不能获得奖品的概率为P1=××()2×=,
所以甲、乙两位学生参加游戏,恰有一人获得奖品的概率P=××(1-)=.
【例3】 解:(1)记“从第1组抽取的20株鸡冠花样本中随机抽取2株,至少有1株鸡冠花的株高增量在(7,10]内”为事件A,所以P(A)==.
(2)记“从第i(i=1,2,3)组的鸡冠花中各随机抽取1株,这株鸡冠花的株高增量在(7,10]内”为事件Bi,
由题意可知:P(B1)=,P(B2)=,P(B3)=,
X的可能取值有0,1,2,3,则有:
P(X=0)=(1-)×(1-)×(1-)=,
P(X=1)=×(1-)×(1-)+(1-)××(1-)+(1-)×(1-)×=,
P(X=2)=××(1-)+×(1-)×+(1-)××=,
P(X=3)=××=.
所以X的分布列为
X 0 1 2 3
P
X的期望E(X)=0×+1×+2×+3×=.
(3)由题意可知:ζ1,ζ2,ζ3均服从两点分布,则有:
ζ1的分布列为:
ζ1 0 1
P
可得ζ1的方差D(ζ1)=×=;
ζ2的分布列为:
ζ2 0 1
P
可得ζ2的方差D(ζ2)=×=;
ζ3的分布列为:
ζ3 0 1
P
可得ζ3的方差D(ζ3)=×=;
因为>>,所以D(ζ2)>D(ζ3)>D(ζ1).
跟踪训练
解:(1)设ζ表示1条灯带在安全使用寿命内更换的灯珠数量,
则P(ζ=5)=P(ζ=7)=P(ζ=8)=0.2,P(ζ=6)=0.4,
X的取值范围是{10,11,12,13,14,15,16},
P(X=10)=0.2×0.2=0.04,
P(X=11)=2×0.2×0.4=0.16,
P(X=12)=0.42+2×0.2×0.2=0.24,
P(X=13)=2×(0.2×0.2+0.2×0.4)=0.24,
P(X=14)=0.22+2×0.4×0.2=0.2,
P(X=15)=2×0.2×0.2=0.08,
P(X=16)=0.2×0.2=0.04,
X的分布列为
X 10 11 12 13 14 15 16
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
(2)由(1)可知P(X≥12)=0.8,
P(X≥13)=0.56,
故n0=13.
(3)由(2)可知n0-1=12,
在灯带安全使用寿命期内,当n=12时,设购买替换灯珠所需总费用为u元,当n=13时,设购买替换灯珠所需总费用为v元,则
E(u)=24+0.24×4+0.2×8+0.08×12+0.04×16=28.16,
E(v)=26+0.2×4+0.08×8+0.04×12=27.92,
E(v)<E(u),
故以购买替换灯珠所需总费用的期望值为依据,n=n0比n=n0-1的方案更优.
第4讲 大题专攻——成对数据的统计分析
【锁定高考·明方向】
真题感悟
1.解:(1)填写如下列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
则完整的2×2列联表如下:
优级品 非优级品 总计
甲车间 26 24 50
乙车间 70 30 100
总计 96 54 150
K2==4.687 5.
因为K2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;
因为K2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知==0.64,
又p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
所以>p+1.65,
所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
2.解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,
估计该林区这种树木平均一棵的材积量===0.39.
(2)(xi-)(yi-)=xiyi-10=0.013 4,
(xi-)2=-10()2=0.002,
(yi-)2=-10()2=0.094 8,
所以==≈0.01×1.377=0.013 77,
所以样本相关系数r=
≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,
所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.
【研透高考·攻重点】
【例1】 解:(1)由已知可得,==3,
==5.1,
由题可列下表:
xi- -2 -1 0 1 2
yi- 1.3 0.4 -0.1 -0.3 -1.3
(xi-)(yi-)=-5.9,=,=,
r==≈≈-0.98.
(2)由问题(1)知,y与x的样本相关系数r≈-0.98,|r|接近1,所以y与x之间具有极强的线性相关关系,可用一元线性回归模型进行描述.
由问题(1)知,===-0.59,
=-=5.1-(-0.59)×3=6.87,
所求经验回归方程为=-0.59x+6.87.
(3)令x=9,则=-0.59×9+6.87=1.56,预测2028年的酸雨区面积占国土面积的百分比为1.56%.
跟踪训练
解:(1)=,=,
===5,
∴=-=-5×=2,
∴=5ln x+2.
(2)设投入食品淀粉的资金为x万元,投入药用淀粉的资金为(200-x)万元,年收益为f(x),
∴f(x)=5ln x+2+(200-x)=5ln x-x+22,
f'(x)=-=0 x=50,
当0<x<50时,f'(x)>0,f(x)单调递增;当50<x<200时,f'(x)<0,f(x)单调递减.
∴f(x)max=f(50)=5ln 50-5+22=5(2ln 5+ln 2)+17≈36.5.
【例2】 解:(1)强化训练后的平均成绩约为
55×0.04+65×0.16+75×0.2+85×0.32+95×0.28=81.4.
由于前三列概率之和为0.04+0.16+0.2=0.4,
设中位数为80+x,则0.032x=0.1,
解得x=3.125,所以中位数约为83.13.
(2)零假设为H0:跳水运动员是否优秀与强化训练无关.
补充完整的表格为
强化训练 是否优秀 合计
优秀人数 非优秀人数
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2==8>7.879=x0.005,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为跳水运动员是否优秀与强化训练有关.
跟踪训练
解:(1)由表中数据可得,选择A餐厅的概率为=,选择B餐厅的概率为=,
设事件A1:甲、乙两名同学去A餐厅用餐,
事件B1:甲、乙两名同学去B餐厅用餐,
事件A:甲、乙两名同学选择同一套餐用餐,
P(A1)=()2,P(B1)=()2,P(A|A1)=,P(A|B1)=,
则P(A)=P(A1)P(A|A1)+P(B1)·P(A|B1)=()2×+()2×=,
故甲、乙两名同学选择同一套餐的概率为.
(2)根据数据可得列联表:
餐厅 性别 合计
男 女
在A餐厅用餐 40 20 60
在B餐厅用餐 15 25 40
合计 55 45 100
零假设为H0:认为性别与选择餐厅之间无关,
根据列联表中的数据,经计算得到χ2=≈8.249>7.879=x0.005,
依据小概率值α=0.005的独立性检验,可以推断H0不成立,即性别与选择餐厅之间有关,此推断犯错误的概率不大于0.005.
培优点1 体育比赛与闯关
【例1】 解:(1)记事件A=“甲班在项目A中获胜”,则P(A)=××+×( )2××+×( )2×( )2×=,
所以甲班在项目A中获胜的概率为.
(2)记事件B=“甲班在项目B中获胜”,
则P(B)=( )3+×( )4+×( )5=.
X的可能取值为0,1,2,
则P(X=0)=P()=P()P()=×=,
P(X=2)=P(AB)=P(A)P(B)=×=,
P(X=1)=1-P(X=0)-P(X=2)=.
所以X的分布列为
X 0 1 2
P
故E(X)=0×+1×+2×=.所以甲班获胜的项目个数的数学期望为.
跟踪训练
解析:根据题意,设甲获胜为事件A,比赛进行两局为事件B,P(A)=×+×××=,P(AB)=××=,故P(B|A)====.
【例2】 解:(1)甲连胜四场的概率为.
(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.
比赛四场结束,共有三种情况:
甲连胜四场的概率为;
乙连胜四场的概率为;
丙上场后连胜三场的概率为.
所以需要进行第五场比赛的概率为1---=.
(3)丙最终获胜,有两种情况:
比赛四场结束且丙最终获胜的概率为;
比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为,,.
因此丙最终获胜的概率为+++=.
跟踪训练
解析:比赛进行四局结束有以下两种情况:第一局甲获胜,后三局丙连胜;第一局乙获胜,后三局丙连胜,第一局甲获胜,后三局丙连胜的概率P1=×××=,第一局乙获胜,后三局丙连胜的概率P2=×××=,故比赛进行四局结束的概率P=P1+P2=+=.
【例3】 解:(1)甲以11∶9赢得比赛,共计20次发球,在后4次发球中,需甲在最后一次获胜,最终甲以11∶9赢得比赛的概率为P=×( )2×( )2+( )2××=.
(2)设甲累计得分为随机变量X,X的可能取值为0,1,2,3.
P(X=0)=( )2×=,
P(X=1)=×( )2×+( )2×=,
P(X=2)=×( )2×+( )2×=,
P(X=3)=( )2×=,
所以随机变量X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=.
跟踪训练
D 三队中选一队与丙比赛,丙输,×,例如是丙甲,若丙与乙、丁的两场比赛一赢一平,则丙只得4分,这时,甲乙、甲丁两场比赛中甲只能输,否则甲的分数不小于4分,不合题意,在甲输的情况下,乙、丁已有3分,那么它们之间的比赛无论什么情况,乙、丁中有一队得分不小于4分,不合题意.若丙全赢( 概率是( )2)时,丙得6分,其他3队分数最高为5分,这时甲乙,甲丁两场比赛中甲不能赢,否则甲的分数不小于6分,(1)若甲乙,甲丁两场比赛中甲一平一输,则一平一输的概率是( )2,如平乙,输丁,则乙丁比赛时,丁不能赢,概率是;(2)若甲乙,甲丁两场比赛中甲两场均平,概率是( )2,乙丁这场比赛无论结果如何均符合题意;(3)若甲乙,甲丁两场比赛中甲都输,概率是( )2,乙丁这场比赛只能平,概率是.综上,概率为××( )2×[×( )2×+( )2+( )2×]=,D正确.故选D.
培优点2 概率与统计中的创新问题
【例1】 解:(1)K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:R=
=,
由题意知,证明=即可,
左边=
=,
右边=
=.
左边=右边,故R=·.
②由调查数据可知P(A|B)==,P(A|)==,
且P(|B)=1-P(A|B)=,P(|)=1-P(A|)=,
所以R=×=6.
跟踪训练
解:(1)依题意,X1服从超几何分布,故X1的分布列为P(X1=k)=,k∈N,0≤k≤100.
X1 0 1 … 99 100
P …
(2)①证明:由题可知Xi(i=1,2,…,20)均服从完全相同的超几何分布,所以E(X1)=E(X2)=…=E(X20),E()=E( Xi)=E( Xi)=E(Xi)=×20E(X1)=E(X1),
D()=D( Xi)=D( Xi)=D(Xi)=×20D(X1)=D(X1).
故E()=E(X1),D()=D(X1).
②由①可知的均值E()=E(X1)=.
由公式得X1的方差D(X1)=,
所以D()=.
依题意有
解得N=1 456,M=624,
所以可以估计M=624,N=1 456.
【例2】 解:(1)依题意,X~B( 5,),则P(X=0)=( )5=,P(X=1)=( )4( )=,
P(X=2)=( )3( )2==,
P(X=3)=( )2( )3=,
P(X=4)=( )( )4=,
P(X=5)=( )5=,
故X的分布列为:
X 0 1 2 3 4 5
P
故E(X)=5×=.
(2)设事件“Y=n”表示前n-1次试验只成功了1次,且第n次试验成功,
故P(Y=n)=××( )n-2×=×( )n-2,
当n为偶数时,
P(AB)=P(2)+P(4)+…+P(n)=[1·( )0+3·( )2+…+(n-1)·( )n-2],
令Sn=1·( )0+3·( )2+…+(n-1)·( )n-2,
则Sn=1·( )2+3·( )4+…+(n-1)·( )n,
两式相减得:Sn=1+2[( )2+( )4+…+( )n-2]-(n-1)·( )n,
则Sn=-( )n·( +n),
即P(AB)=-( +n)·( )n.
当n为奇数时,同理可得
P(AB)=P(2)+P(4)+…+P(n-1)=[1·( )0+3·( )2+…+(n-2)·( )n-3]
=-( n+)·( )n-1,
综上,P(AB)=
【例3】 解:(1)∵10×(0.012+0.026+0.032+a+0.01)=1,∴a=0.02.
样本平均数的估计值为50×0.12+60×0.26+70×0.32+80×0.2+90×0.1=69.
(2)∵μ=69,σ=10.5.
∴P(X≥90)=P(X≥μ+2σ)≈=0.022 75.
∴能参加复试的人数约为40 000×0.022 75=910.
(3)由题意有x2y=.
答对两道题的概率P=x2(1-y)+x(1-x)y=x2+2xy-3x2y.
而x2y=,∴P=x2+-.
令f(x)=x2+-(0<x≤1),
则f'(x)=2x-=,
∴当x∈( 0,)时,f'(x)<0,f(x)在( 0,)内单调递减;
当x∈( ,1]时,f'(x)>0,f(x)在( ,1]内单调递增.
∴当x=时,f(x)min=.故概率P的最小值为.
跟踪训练
解:(1)由题意知,X的可能取值为0,1,2,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X 0 1 2
P
则E(X)=0×+1×+2×=.
记事件A:小王已经答对一题,事件B:小王未进入决赛,
则小王在已经答对一题的前提下,仍未进入决赛的概率
P(B|A)====.
(2)①由题意知,f(p)=p(1-p)2
=3p3-6p2+3p( 0<p<),
则f'(p)=3(3p-1)(p-1),
令f'(p)=0,解得p=或p=1(舍),
当p∈( 0,)时,f'(p)>0,当p∈( ,)时,f'(p)<0,
所以f(p)在区间( 0,)内单调递增,在区间( ,)内单调递减,
所以当p=时,f(p)有极大值,且f(p)的极大值为f( )=.
②由题可设每名进入决赛的大学生获得的奖金为随机变量Y,
则Y的可能取值为60,120,180,360,
P(Y=60)=(1-p)3,
P(Y=120)=p(1-p)2,
P(Y=180)=p2(1-p),
P(Y=360)=p3,
所以E(Y)=60(1-p)3+120p(1-p)2+180p2(1-p)+360p3=60(2p3+3p+1),
所以9E(Y)≥1 120,
即540(2p3+3p+1)≥1 120,
整理得2p3+3p-≥0,
经观察可知p=是方程2p3+3p-=0的根,
故2p3+3p-=2( p3-p2)+( p2-p)+( p-)=( p-)( 2p2+p+),
因为2p2+p+>0恒成立,
所以由2p3+3p-≥0可得p-≥0,解得p≥,
又0<p<,所以p的取值范围为[,).
【例4】 解:(1)①二维离散型随机变量(ξ,η)的所有可能取值为(0,0),(0,1),(0,2),(0,3),(1,0),(1,1),(1,2),(2,0),(2,1),(3,0).
②由题意得0≤m+n≤3,
P(ξ=m,η=n)=P(ξ=m|η=n)·P(η=n),
因为P(η=n)=( )n( )3-n.
P(ξ=m|η=n)=( )m·( )3-n-m=( )3-n,
所以P(ξ=m,η=n)=( )3-n·( )n·( )3-n==·.
(2)证明:由定义及全概率公式知:
P(ξ=ai)=P{(ξ=ai)∩[(η=b1)∪(η=b2)∪…∪(η=bj)∪…]}
=P{[(ξ=ai)∩(η=b1)]∪[(ξ=ai)∩(η=b2)]∪…∪[(ξ=ai)∩(η=bj)]∪…}
=P[(ξ=ai)∩(η=b1)]+P[(ξ=ai)∩(η=b2)]+…+P[(ξ=ai)∩(η=bj)]+…
=P[(ξ=ai)∩(η=bj)]=P(ξ=ai,η=bj)
=Pij.
跟踪训练
解:(1)因为X~B( 3,),所以xk=P(X=k)=( )k( )3-k=(k=0,1,2,3),
因为Y~B( 3,),所以yk=P(Y=k)=( )k·( )3-k=(k=0,1,2,3),
所以==23-2k(k=0,1,2,3),
所以D(X||Y)=xkln=××ln 23+××ln 2+××ln 2-1+××ln 2-3=ln 2.
(2)因为xk=P(X=k)=pk(1-p)2-k(k=0,1,2),
y0=P(Y=0)=,y1=P(Y=1)=,y2=P(Y=2)=,
所以D(X||Y)=xkln
=x0ln+x1ln+x2ln
=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2).
令f(p)=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2),
则f'(p)=-2(1-p)ln[6(1-p)2]-2(1-p)+(2-4p)ln[3p(1-p)]+2-4p+2pln(6p2)+2p
=(-2+4p)ln 6-2ln(1-p)+2ln p+(2-4p)ln 3
=2ln p-2ln(1-p)+(4p-2)ln 2,
令g(p)=2ln p-2ln(1-p)+(4p-2)ln 2,
则g'(p)=++4ln 2,
因为0<p<1,所以g'(p)>0,故g(p)在(0,1)上单调递增,
又g( )=0,所以当0<p<时,g(p)<0,即f'(p)<0,当<p<1时,g(p)>0,即f'(p)>0,
所以f(p)在( 0,)上单调递减,在( ,1)上单调递增,
所以f(p)min=f( )=ln.
(3)证明:令φ(x)=ln x-x+1,则φ'(x)=-1=.易得当x∈(0,1)时,φ'(x)>0,当x∈(1,+∞)时,φ'(x)<0,故φ(x)在(0,1)上单调递增,在(1,+∞)上单调递减,
所以 x∈(0,+∞),φ(x)≤φ(1)=0,
所以ln x≤x-1,所以ln≤-1,
所以ln x≥1-,
所以D(X||Y)=xkln≥xk( 1-)
=(xk-yk)=xk-yk=1-1=0,
即D(X||Y)的值不可能为负.
1 / 3培优点2 概率与统计中的创新问题
概率与统计中的创新问题主要涉及概率统计中的证明问题、概率统计与数列、函数的交汇问题及概率统计中的新定义问题,考查题型多为解答题,难度中等偏上,或可作为压轴题出现.
概率与统计中的推理证明问题
【例1】 (2022·新高考Ⅰ卷20题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=·;
②利用该调查数据,给出P(A|B),P(A|)的估计值,并利用①的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
感悟提升
解答概率与统计中的推理证明问题的关键是要“死抠”定义,与别的类型证明题不同,高中阶段所学的概率问题都是初等概率.解答此类题目只需依定义按部就班推导即可.
(2024·辽宁三所重点中学第三次模拟)某自然保护区经过几十年的发展,某种濒临灭绝动物数量有大幅度增加.已知这种动物P拥有两个亚种(分别记为A种和B种).为了调查该区域中这两个亚种的数目,某动物研究小组计划在该区域中捕捉100只动物P,统计其中A种的数目后,将捕获的动物全部放回,作为一次试验结果.重复进行这个试验共20次,记第i次试验中A种的数目为随机变量Xi(i=1,2,…,20).设该区域中A种的数目为M,B种的数目为N(M,N均大于100),每一次试验均相互独立.
(1)求X1的分布列;
(2)记随机变量=Xi已知E(Xi+Xj)=E(Xi)+E(Xj),D(Xi+Xj)=D(Xi)+D(Xj).
①证明:E()=E(X1),D()=D(X1);
②该小组完成所有试验后,得到Xi的实际取值分别为xi(i=1,2,…,20).数据xi(i=1,2,…,20)的平均值=30,方差s2=1.采用和s2分别代替E()和D(),给出M,N的估计值.
( 已知随机变量X服从超几何分布记为X~H(P,n,Q)(其中P为总数,Q为某类元素的个数,n为抽取的个数),则D(X)=n( 1-))
概率统计与其他知识的交汇问题
考向1 概率统计与数列
【例2】 (2024·宁波“十校”联考)为了验证某款电池的安全性,小明在实验室中进行试验,假设小明每次试验成功的概率为p(0<p<1),且每次试验相互独立.
(1)若进行5次试验,且p=,求试验成功次数X的分布列以及期望;
(2)若恰好成功2次后停止试验,p=,记事件A:停止试验时试验次数不超过n(n≥2)次,事件B:停止试验时试验次数为偶数,求P(AB).(结果用含有n的式子表示)
感悟提升
概率统计与数列交汇的常见题型
(1)求通项公式:关键是找出概率Pn或数学期望E(Xn)的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式;
(2)求和:主要是数列中的倒序求和、错位求和、裂项求和;
(3)利用等差、等比数列的性质,研究单调性、最值或求极限.
考向2 概率统计与函数
【例3】 (2024·邵阳第二次联考)为了选拔创新型人才,某大学对高三年级学生的数学学科和物理学科进行了检测(检测分为初试和复试),共有4万名学生参加初试.组织者随机抽取了200名学生的初试成绩,绘制了频率分布直方图,如图所示.
(1)根据频率分布直方图,求a的值及样本平均数的估计值;
(2)若所有学生的初试成绩X近似服从正态分布N(μ,σ2),其中μ为样本平均数的估计值,σ=10.5.规定初试成绩不低于90分的学生才能参加复试,试估计能参加复试的人数;
(3)复试笔试试题包括两道数学题和一道物理题,已知小明进入了复试,且在复试笔试中答对每一道数学题的概率均为x,答对物理题的概率为y.若小明全部答对的概率为,答对两道题的概率为P,求概率P的最小值.
感悟提升
通过设置变量,利用数学期望、方差或概率的计算公式构造函数,是解决概率统计与函数结合问题最常用的方式.解决此类问题,应注意两点:
(1)准确构造函数,利用公式搭建函数模型时,由于随机变量的数学期望、方差及随机事件概率的计算中涉及的变量较多,式子较为复杂,所以准确运算化简是关键;
(2)注意变量的取值范围,一是题中给出的范围,二是实际问题中变量自身取值的限制.
(2024·菏泽三模)2024年7月26日至8月11日在法国巴黎举行夏季奥运会.为了普及奥运知识,M大学举办了一次奥运知识竞赛,竞赛分为初赛与决赛,初赛通过后才能参加决赛.
(1)初赛从6道题中任选2题作答,2题均答对则进入决赛.已知这6道题中小王能答对其中4道题,记小王在初赛中答对的题目个数为X,求X的数学期望以及小王在已经答对一题的前提下,仍未进入决赛的概率;
(2)M大学为鼓励大学生踊跃参赛并取得佳绩,对进入决赛的参赛大学生给予一定的奖励.奖励规则如下:已进入决赛的参赛大学生允许连续抽奖3次,中奖1次奖励120元,中奖2次奖励180元,中奖3次奖励360元,若3次均未中奖,则只奖励60元.假定每次抽奖中奖的概率均为p( 0<p<),且每次是否中奖相互独立.
①记一名进入决赛的大学生恰好中奖1次的概率为f(p),求f(p)的极大值;
②M大学数学系共有9名大学生进入了决赛,若这9名大学生获得的总奖金的期望值不小于1 120元,试求此时p的取值范围.
概率统计中的新定义问题
【例4】 若ξ,η是样本空间Ω上的两个离散型随机变量,则称(ξ,η)是Ω上的二维离散型随机变量或二维随机变量.设(ξ,η)的一切可能取值为(ai,bj),i,j=1,2,…,记Pij表示(ai,bj)在Ω中出现的概率,其中Pij=P(ξ=ai,η=bj)=P[(ξ=ai)∩(η=bj)].
(1)将三个相同的小球等可能地放入编号为1,2,3的三个盒子中,记1号盒子中的小球个数为ξ,2号盒子中的小球个数为η,则(ξ,η)是一个二维随机变量.
①写出该二维离散型随机变量(ξ,η)的所有可能取值;
②若(m,n)是①中的值,求P(ξ=m,η=n)(结果用m,n表示).
(2)P(ξ=ai)称为二维离散型随机变量(ξ,η)关于ξ的边缘分布律或边际分布律,求证:P(ξ=ai)=Pij.
感悟提升
解决概率统计中新定义问题的过程可以概括为“过三关”:第一关,准确转化关,即要解决新定义问题,一定要理解题目中定义的本质含义,紧扣题目所给的新定义、新运算法则、新符号等对所求问题进行恰当转化;第二关,方法选取关,对此类题可以采取特例法,从逻辑推理的角度进行转化,理解题目中定义的本质并进行推广、运算;第三关,审读题目关,严格按照新定义的要求,解答问题时要避免教材知识或者已有知识对信息的干扰,也就是突破思维定式或固有的已知信息束缚,按新定义寻求解决问题的方法.
(2024·河南九师联盟)设离散型随机变量X和Y的分布列分别为P(X=k)=xk,P(Y=k)=yk,xk>0,yk>0,k=0,1,2,…,n,xk=yk=1.定义D(X||Y)=xkln,用来刻画X和Y的相似程度,设X~B(n,p),0<p<1.
(1)若n=3,p=,Y~B( 3,),求D(X||Y);
(2)若n=2,且Y的分布列为
Y 0 1 2
P
求D(X||Y)的最小值;
(3)对任意与X有相同可能取值的随机变量Y,证明,D(X||Y)的值不可能为负数.
3 / 3培优点2 概率与统计中的创新问题
概率与统计中的创新问题主要涉及概率统计中的证明问题、概率统计与数列、函数的交汇问题及概率统计中的新定义问题,考查题型多为解答题,难度中等偏上,或可作为压轴题出现.
概率与统计中的推理证明问题
【例1】 (2022·新高考Ⅰ卷20题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=·;
②利用该调查数据,给出P(A|B),P(A|)的估计值,并利用①的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
解:(1)K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:R==,
由题意知,证明=即可,
左边==,
右边==.
左边=右边,故R=·.
②由调查数据可知P(A|B)==,P(A|)==,
且P(|B)=1-P(A|B)=,P(|)=1-P(A|)=,
所以R=×=6.
感悟提升
解答概率与统计中的推理证明问题的关键是要“死抠”定义,与别的类型证明题不同,高中阶段所学的概率问题都是初等概率.解答此类题目只需依定义按部就班推导即可.
(2024·辽宁三所重点中学第三次模拟)某自然保护区经过几十年的发展,某种濒临灭绝动物数量有大幅度增加.已知这种动物P拥有两个亚种(分别记为A种和B种).为了调查该区域中这两个亚种的数目,某动物研究小组计划在该区域中捕捉100只动物P,统计其中A种的数目后,将捕获的动物全部放回,作为一次试验结果.重复进行这个试验共20次,记第i次试验中A种的数目为随机变量Xi(i=1,2,…,20).设该区域中A种的数目为M,B种的数目为N(M,N均大于100),每一次试验均相互独立.
(1)求X1的分布列;
(2)记随机变量=Xi已知E(Xi+Xj)=E(Xi)+E(Xj),D(Xi+Xj)=D(Xi)+D(Xj).
①证明:E()=E(X1),D()=D(X1);
②该小组完成所有试验后,得到Xi的实际取值分别为xi(i=1,2,…,20).数据xi(i=1,2,…,20)的平均值=30,方差s2=1.采用和s2分别代替E()和D(),给出M,N的估计值.
( 已知随机变量X服从超几何分布记为X~H(P,n,Q)(其中P为总数,Q为某类元素的个数,n为抽取的个数),则D(X)=n( 1-))
解:(1)依题意,X1服从超几何分布,故X1的分布列为P(X1=k)=,k∈N,0≤k≤100.
X1 0 1 … 99 100
P …
(2)①证明:由题可知Xi(i=1,2,…,20)均服从完全相同的超几何分布,所以E(X1)=E(X2)=…=E(X20),E()=E( Xi)=E( Xi)=E(Xi)=×20E(X1)=E(X1),
D()=D( Xi)=D( Xi)=D(Xi)=×20D(X1)=D(X1).
故E()=E(X1),D()=D(X1).
②由①可知的均值E()=E(X1)=.
由公式得X1的方差D(X1)=,
所以D()=.
依题意有
解得N=1 456,M=624,
所以可以估计M=624,N=1 456.
概率统计与其他知识的交汇问题
考向1 概率统计与数列
【例2】 (2024·宁波“十校”联考)为了验证某款电池的安全性,小明在实验室中进行试验,假设小明每次试验成功的概率为p(0<p<1),且每次试验相互独立.
(1)若进行5次试验,且p=,求试验成功次数X的分布列以及期望;
(2)若恰好成功2次后停止试验,p=,记事件A:停止试验时试验次数不超过n(n≥2)次,事件B:停止试验时试验次数为偶数,求P(AB).(结果用含有n的式子表示)
解:(1)依题意,X~B( 5,),则P(X=0)=( )5=,P(X=1)=( )4( )=,
P(X=2)=( )3( )2==,
P(X=3)=( )2( )3=,
P(X=4)=( )( )4=,
P(X=5)=( )5=,
故X的分布列为:
X 0 1 2 3 4 5
P
故E(X)=5×=.
(2)设事件“Y=n”表示前n-1次试验只成功了1次,且第n次试验成功,
故P(Y=n)=××( )n-2×=×( )n-2,
当n为偶数时,
P(AB)=P(2)+P(4)+…+P(n)=[1·( )0+3·( )2+…+(n-1)·( )n-2],
令Sn=1·( )0+3·( )2+…+(n-1)·( )n-2,
则Sn=1·( )2+3·( )4+…+(n-1)·( )n,
两式相减得:Sn=1+2[( )2+( )4+…+( )n-2]-(n-1)·( )n,
则Sn=-( )n·( +n),
即P(AB)=-( +n)·( )n.
当n为奇数时,同理可得
P(AB)=P(2)+P(4)+…+P(n-1)=[1·( )0+3·( )2+…+(n-2)·( )n-3]
=-( n+)·( )n-1,
综上,P(AB)=
感悟提升
概率统计与数列交汇的常见题型
(1)求通项公式:关键是找出概率Pn或数学期望E(Xn)的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式;
(2)求和:主要是数列中的倒序求和、错位求和、裂项求和;
(3)利用等差、等比数列的性质,研究单调性、最值或求极限.
考向2 概率统计与函数
【例3】 (2024·邵阳第二次联考)为了选拔创新型人才,某大学对高三年级学生的数学学科和物理学科进行了检测(检测分为初试和复试),共有4万名学生参加初试.组织者随机抽取了200名学生的初试成绩,绘制了频率分布直方图,如图所示.
(1)根据频率分布直方图,求a的值及样本平均数的估计值;
(2)若所有学生的初试成绩X近似服从正态分布N(μ,σ2),其中μ为样本平均数的估计值,σ=10.5.规定初试成绩不低于90分的学生才能参加复试,试估计能参加复试的人数;
(3)复试笔试试题包括两道数学题和一道物理题,已知小明进入了复试,且在复试笔试中答对每一道数学题的概率均为x,答对物理题的概率为y.若小明全部答对的概率为,答对两道题的概率为P,求概率P的最小值.
解:(1)∵10×(0.012+0.026+0.032+a+0.01)=1,∴a=0.02.
样本平均数的估计值为50×0.12+60×0.26+70×0.32+80×0.2+90×0.1=69.
(2)∵μ=69,σ=10.5.
∴P(X≥90)=P(X≥μ+2σ)≈=0.022 75.
∴能参加复试的人数约为40 000×0.022 75=910.
(3)由题意有x2y=.
答对两道题的概率P=x2(1-y)+x(1-x)y=x2+2xy-3x2y.
而x2y=,∴P=x2+-.
令f(x)=x2+-(0<x≤1),
则f'(x)=2x-=,
∴当x∈( 0,)时,f'(x)<0,f(x)在( 0,)内单调递减;
当x∈( ,1]时,f'(x)>0,f(x)在( ,1]内单调递增.
∴当x=时,f(x)min=.故概率P的最小值为.
感悟提升
通过设置变量,利用数学期望、方差或概率的计算公式构造函数,是解决概率统计与函数结合问题最常用的方式.解决此类问题,应注意两点:
(1)准确构造函数,利用公式搭建函数模型时,由于随机变量的数学期望、方差及随机事件概率的计算中涉及的变量较多,式子较为复杂,所以准确运算化简是关键;
(2)注意变量的取值范围,一是题中给出的范围,二是实际问题中变量自身取值的限制.
(2024·菏泽三模)2024年7月26日至8月11日在法国巴黎举行夏季奥运会.为了普及奥运知识,M大学举办了一次奥运知识竞赛,竞赛分为初赛与决赛,初赛通过后才能参加决赛.
(1)初赛从6道题中任选2题作答,2题均答对则进入决赛.已知这6道题中小王能答对其中4道题,记小王在初赛中答对的题目个数为X,求X的数学期望以及小王在已经答对一题的前提下,仍未进入决赛的概率;
(2)M大学为鼓励大学生踊跃参赛并取得佳绩,对进入决赛的参赛大学生给予一定的奖励.奖励规则如下:已进入决赛的参赛大学生允许连续抽奖3次,中奖1次奖励120元,中奖2次奖励180元,中奖3次奖励360元,若3次均未中奖,则只奖励60元.假定每次抽奖中奖的概率均为p( 0<p<),且每次是否中奖相互独立.
①记一名进入决赛的大学生恰好中奖1次的概率为f(p),求f(p)的极大值;
②M大学数学系共有9名大学生进入了决赛,若这9名大学生获得的总奖金的期望值不小于1 120元,试求此时p的取值范围.
解:(1)由题意知,X的可能取值为0,1,2,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X 0 1 2
P
则E(X)=0×+1×+2×=.
记事件A:小王已经答对一题,事件B:小王未进入决赛,
则小王在已经答对一题的前提下,仍未进入决赛的概率
P(B|A)====.
(2)①由题意知,f(p)=p(1-p)2
=3p3-6p2+3p( 0<p<),
则f'(p)=3(3p-1)(p-1),
令f'(p)=0,解得p=或p=1(舍),
当p∈( 0,)时,f'(p)>0,当p∈( ,)时,f'(p)<0,
所以f(p)在区间( 0,)内单调递增,在区间( ,)内单调递减,
所以当p=时,f(p)有极大值,且f(p)的极大值为f( )=.
②由题可设每名进入决赛的大学生获得的奖金为随机变量Y,
则Y的可能取值为60,120,180,360,
P(Y=60)=(1-p)3,
P(Y=120)=p(1-p)2,
P(Y=180)=p2(1-p),
P(Y=360)=p3,
所以E(Y)=60(1-p)3+120p(1-p)2+180p2(1-p)+360p3=60(2p3+3p+1),
所以9E(Y)≥1 120,
即540(2p3+3p+1)≥1 120,
整理得2p3+3p-≥0,
经观察可知p=是方程2p3+3p-=0的根,
故2p3+3p-=2( p3-p2)+( p2-p)+( p-)=( p-)( 2p2+p+),
因为2p2+p+>0恒成立,
所以由2p3+3p-≥0可得p-≥0,解得p≥,
又0<p<,所以p的取值范围为[,).
概率统计中的新定义问题
【例4】 若ξ,η是样本空间Ω上的两个离散型随机变量,则称(ξ,η)是Ω上的二维离散型随机变量或二维随机变量.设(ξ,η)的一切可能取值为(ai,bj),i,j=1,2,…,记Pij表示(ai,bj)在Ω中出现的概率,其中Pij=P(ξ=ai,η=bj)=P[(ξ=ai)∩(η=bj)].
(1)将三个相同的小球等可能地放入编号为1,2,3的三个盒子中,记1号盒子中的小球个数为ξ,2号盒子中的小球个数为η,则(ξ,η)是一个二维随机变量.
①写出该二维离散型随机变量(ξ,η)的所有可能取值;
②若(m,n)是①中的值,求P(ξ=m,η=n)(结果用m,n表示).
(2)P(ξ=ai)称为二维离散型随机变量(ξ,η)关于ξ的边缘分布律或边际分布律,求证:P(ξ=ai)=Pij.
解:(1)①二维离散型随机变量(ξ,η)的所有可能取值为(0,0),(0,1),(0,2),(0,3),(1,0),(1,1),(1,2),(2,0),(2,1),(3,0).
②由题意得0≤m+n≤3,
P(ξ=m,η=n)=P(ξ=m|η=n)·P(η=n),
因为P(η=n)=( )n( )3-n.
P(ξ=m|η=n)=( )m( )3-n-m=( )3-n,
所以P(ξ=m,η=n)=( )3-n·( )n·( )3-n==·.
(2)证明:由定义及全概率公式知:
P(ξ=ai)=P{(ξ=ai)∩[(η=b1)∪(η=b2)∪…∪(η=bj)∪…]}
=P{[(ξ=ai)∩(η=b1)]∪[(ξ=ai)∩(η=b2)]∪…∪[(ξ=ai)∩(η=bj)]∪…}
=P[(ξ=ai)∩(η=b1)]+P[(ξ=ai)∩(η=b2)]+…+P[(ξ=ai)∩(η=bj)]+…
=P[(ξ=ai)∩(η=bj)]=P(ξ=ai,η=bj)
=Pij.
感悟提升
解决概率统计中新定义问题的过程可以概括为“过三关”:第一关,准确转化关,即要解决新定义问题,一定要理解题目中定义的本质含义,紧扣题目所给的新定义、新运算法则、新符号等对所求问题进行恰当转化;第二关,方法选取关,对此类题可以采取特例法,从逻辑推理的角度进行转化,理解题目中定义的本质并进行推广、运算;第三关,审读题目关,严格按照新定义的要求,解答问题时要避免教材知识或者已有知识对信息的干扰,也就是突破思维定式或固有的已知信息束缚,按新定义寻求解决问题的方法.
(2024·河南九师联盟)设离散型随机变量X和Y的分布列分别为P(X=k)=xk,P(Y=k)=yk,xk>0,yk>0,k=0,1,2,…,n,xk=yk=1.定义D(X||Y)=xkln,用来刻画X和Y的相似程度,设X~B(n,p),0<p<1.
(1)若n=3,p=,Y~B( 3,),求D(X||Y);
(2)若n=2,且Y的分布列为
Y 0 1 2
P
求D(X||Y)的最小值;
(3)对任意与X有相同可能取值的随机变量Y,证明,D(X||Y)的值不可能为负数.
解:(1)因为X~B( 3,),所以xk=P(X=k)=( )k( )3-k=(k=0,1,2,3),
因为Y~B( 3,),所以yk=P(Y=k)=( )k·( )3-k=(k=0,1,2,3),
所以==23-2k(k=0,1,2,3),
所以D(X||Y)=xkln=××ln 23+××ln 2+××ln 2-1+××ln 2-3=ln 2.
(2)因为xk=P(X=k)=pk(1-p)2-k(k=0,1,2),
y0=P(Y=0)=,y1=P(Y=1)=,y2=P(Y=2)=,
所以D(X||Y)=xkln
=x0ln+x1ln+x2ln
=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2).
令f(p)=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2),
则f'(p)=-2(1-p)ln[6(1-p)2]-2(1-p)+(2-4p)ln[3p(1-p)]+2-4p+2pln(6p2)+2p
=(-2+4p)ln 6-2ln(1-p)+2ln p+(2-4p)ln 3
=2ln p-2ln(1-p)+(4p-2)ln 2,
令g(p)=2ln p-2ln(1-p)+(4p-2)ln 2,
则g'(p)=++4ln 2,
因为0<p<1,所以g'(p)>0,故g(p)在(0,1)上单调递增,
又g( )=0,所以当0<p<时,g(p)<0,即f'(p)<0,当<p<1时,g(p)>0,即f'(p)>0,
所以f(p)在( 0,)上单调递减,在( ,1)上单调递增,
所以f(p)min=f( )=ln.
(3)证明:令φ(x)=ln x-x+1,则φ'(x)=-1=.易得当x∈(0,1)时,φ'(x)>0,当x∈(1,+∞)时,φ'(x)<0,故φ(x)在(0,1)上单调递增,在(1,+∞)上单调递减,
所以 x∈(0,+∞),φ(x)≤φ(1)=0,
所以ln x≤x-1,所以ln≤-1,
所以ln x≥1-,
所以D(X||Y)=xkln≥xk( 1-)
=(xk-yk)=xk-yk=1-1=0,
即D(X||Y)的值不可能为负.
1.某大学有A,B两个餐厅为学生提供午餐与晚餐服务,甲、乙两位学生每天午餐和晚餐都在学校就餐,近100天选择餐厅就餐情况统计如下:
选择餐厅情况 (午餐,晚餐) (A,A) (A,B) (B,A) (B,B)
甲 30天 20天 40天 10天
乙 20天 25天 15天 40天
(1)假设甲、乙选择餐厅相互独立,用频率估计概率,计算某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率;
(2)某天午餐,甲和乙两名同学准备去A,B这两个餐厅中某一个就餐.设事件M=“甲选择A餐厅就餐”,事件N=“乙选择A餐厅就餐”,P(M)>0,P(N)>0.若P(|N)=P(|),证明:事件M和N相互独立.
解:(1)设“某天中午甲去A餐厅用餐”为事件A,
“该天晚上甲去B餐厅用餐”为事件B,
由题知n(A)=50,n(AB)=20,
所以P(B|A)==0.4.
所以某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率为0.4.
(2)证明:由P(|N)=P(|),
可知==,
所以P(N)-P(N)P(N)=P()P(N)-P(N)P(N),
即P(N)=P()P(N),
所以P(N)-P(MN)=[1-P(M)]P(N),
得P(MN)=P(M)P(N),
即M和N相互独立得证.
2.(2024·杭州模拟)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,Xt-2,Xt-1,Xt,Xt+1,…,那么Xt+1状态下的条件概率仅依赖前一状态Xt,即P(Xt+1|…,Xt-2,Xt-1,Xt)=P(Xt+1|Xt).
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每局赌徒赌赢的概率为50%,且每局赌赢可以赢得1元,每局赌徒赌输的概率为50%,且每局赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B)元,赌博过程如图所示.
当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:
(1)请直接写出P(0)与P(B);
(2)证明{P(n)}是一个等差数列,并写出公差d;
(3)当A=100时, 分别计算B=200,B=1 000时P(A)的值,并结合实际解释当B→+∞时P(A)的统计含义.
解:(1)当n=0时,赌徒已经输光了,因此P(0)=1.
当n=B时,赌徒停止赌博,因此输光的概率P(B)=0.
(2)记赌徒手中有n元时最终输光为事件M,记赌徒手中有n元时上一局赌赢为事件N,则根据全概率公式可得,P(M)=P(N)P(M|N)+P()P(M|),
即P(n)=P(n-1)+P(n+1),
所以P(n)-P(n-1)=P(n+1)-P(n),
所以{P(n)}是一个等差数列.
设P(n)-P(n-1)=d,
则P(n-1)-P(n-2)=d,…,P(1)-P(0)=d,
累加得P(n)-P(0)=nd,故P(B)-P(0)=Bd,得d=-.
(3)当A=100时,由P(n)-P(0)=nd得P(A)-P(0)=Ad,即P(A)=1-,
当B=200时,P(A)=50%,
当B=1 000时,P(A)=90%.
当B→+∞时,P(A)→1,
因此可知久赌无赢家,即便是一个这样看似公平的游戏,只要赌徒一直玩下去就几乎有100%的概率输光.
3.(2024·汕头一模)2023年11月,我国教育部发布了《中小学实验教学基本目录》,内容包括高中数学在内共有16个学科900多项实验与实践活动.我市某学校的数学老师组织学生到“牛田洋”进行科学实践活动,在某种植番石榴的果园中,老师建议学生尝试去摘全园最大的番石榴,规定只能摘一次,并且只可以向前走,不能回头.结果,学生小明两手空空走出果园,因为他不知道前面是否有更大的,所以没有摘,走到前面时,又发觉总不及之前见到的,最后什么也没摘到.假设小明在果园中一共会遇到n个番石榴(不妨设n个番石榴的大小各不相同),最大的那个番石榴出现在各个位置上的概率相等,为了尽可能在这些番石榴中摘到那个最大的,小明在老师的指导下采用了如下策略:不摘前k(1≤k<n)个番石榴,自第k+1个开始,只要发现比他前面见过的番石榴大的,就摘这个番石榴,否则就摘最后一个.设k=tn,记小明摘到那个最大番石榴的概率为P.
(1)若n=4,k=2,求P;
(2)当n趋向于无穷大时,从理论的角度,求P的最大值及P取最大值时t的值.
( 取++…+=ln)
解:(1)依题意,4个番石榴的位置从第1个到第4个排序,有=24种情况,
要摘到那个最大的番石榴,有以下两种情况:
①最大的番石榴是第3个,其他的随意在哪个位置,有=6种情况;
②最大的番石榴是最后1个,第二大的番石榴是第1个或第2个,其他的随意在哪个位置,有2=4种情况,所以所求概率为=.
(2)记事件A表示最大的番石榴被摘到,事件Bi表示最大的番石榴排在第i个,则P(Bi)=,由全概率公式知:P(A)=P(A|Bi)P(Bi)=(A|Bi),
当1≤i≤k时,最大的番石榴在前k个中,不会被摘到,此时P(A|Bi)=0;
当k+1≤i≤n时,最大的番石榴被摘到,当且仅当前i-1个番石榴中的最大一个在前k个之中时,此时P(A|Bi)=,
因此P(A)=( ++…+)=ln,
令g(x)=ln(x>0),求导得g'(x)=ln-,由g'(x)=0,得x=,
当x∈( 0,)时,g'(x)>0,当x∈( ,n)时,g'(x)<0,
即函数g(x)在( 0,)上单调递增,在( ,n)上单调递减,
则g(x)max=g( )=,于是当k=时,P(A)=ln取得最大值,
所以P的最大值为,此时t的值为.
4.在数字1,2,…,n(n≥2)的任意一个排列A:a1,a2,…,an中,如果对于i,j∈N*,i<j,有ai>aj,那么就称(ai,aj)为一个逆序对.记排列A中逆序对的个数为S(A).如n=4时,在排列B:3,2,4,1中,逆序对有(3,2),(3,1),(2,1),(4,1),则S(B)=4.
(1)设排列C:a1,a2,a3,a4,写出两组具体的排列C,分别满足:①S(C)=5,②S(C)=4;
(2)对于数字1,2,…,n的一切排列A,求所有S(A)的算术平均值;
(3)如果把排列A:a1,a2,…,an中两个数字ai,aj(i<j)交换位置,而其余数字的位置保持不变,那么就得到一个新的排列A':b1,b2,…,bn,求证:S(A)+S(A')为奇数.
解:(1)①C:4,2,3,1,则逆序对有(4,2),(4,3),(2,1),(4,1),(3,1),则S(C)=5;
②C:2,4,3,1,则逆序对有(4,3),(3,1),(4,1),(2,1),则S(C)=4.
(2)考虑排列D:d1,d2,…,dn-1,dn与排列D1:dn,dn-1,…,d2,d1,
因为数对(di,dj)与(dj,di)中必有一个为逆序对(其中1≤i<j≤n),
且排列D中数对(di,dj)共有=个,
所以S(D)+S(D1)=.
所以排列D与D1的逆序对的个数的算术平均值为.
而对于数字1,2,…,n的任意一个排列A:a1,a2,…,an,都可以构造排列A1:an,an-1,…,a2,a1,且这两个排列的逆序对的个数的算术平均值为.
所以所有S(A)的算术平均值为.
(3)证明:①当j=i+1,即ai,aj相邻时,
不妨设ai<ai+1,则排列A'为a1,a2,…,ai-1,ai+1,ai,ai+2,…,an,
此时排列A'与排列A:a1,a2,…,an相比,仅多了一个逆序对(ai+1,ai),
所以S(A')=S(A)+1,
所以S(A)+S(A')=2S(A)+1为奇数.
②当j≠i+1,即ai,aj不相邻时,
假设ai,aj之间有m个数字,记排列A:a1,a2,…,ai,k1,k2,…,km,aj,…,an,
先将ai向右移动一个位置,得到排列A1:a1,a2,…,ai-1,k1,ai,k2,…,km,aj,…,an,
由①,知S(A1)与S(A)的奇偶性不同,
再将ai向右移动一个位置,得到排列A2:a1,a2,…,ai-1,k1,k2,ai,k3,…,km,aj,…,an,
由①,知S(A2)与S(A1)的奇偶性不同,
以此类推,ai共向右移动m次,得到排列Am:a1,a2,…,k1,k2,…,km,ai,aj,…,an,
再将aj向左移动一个位置,得到排列Am+1:a1,a2,…,ai-1,k1,…,km,aj,ai,…,an,
以此类推,aj共向左移动m+1次,得到排列A2m+1:a1,a2,…,aj,k1,…,km,ai,…,an,
即为排列A',
由①可知仅有相邻两数的位置发生变化时,排列的逆序对个数的奇偶性发生变化,
而排列A经过2m+1次的前后两数交换位置,可以得到排列A',
所以排列A与排列A'的逆序数的奇偶性不同,
所以S(A)+S(A')为奇数.
综上,得S(A)+S(A')为奇数.
11 / 11