培优点2 概率与统计中的创新问题
1.某大学有A,B两个餐厅为学生提供午餐与晚餐服务,甲、乙两位学生每天午餐和晚餐都在学校就餐,近100天选择餐厅就餐情况统计如下:
选择餐厅情况 (午餐,晚餐) (A,A) (A,B) (B,A) (B,B)
甲 30天 20天 40天 10天
乙 20天 25天 15天 40天
(1)假设甲、乙选择餐厅相互独立,用频率估计概率,计算某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率;
(2)某天午餐,甲和乙两名同学准备去A,B这两个餐厅中某一个就餐.设事件M=“甲选择A餐厅就餐”,事件N=“乙选择A餐厅就餐”,P(M)>0,P(N)>0.若P(|N)=P(|),证明:事件M和N相互独立.
2.(2024·杭州模拟)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,Xt-2,Xt-1,Xt,Xt+1,…,那么Xt+1状态下的条件概率仅依赖前一状态Xt,即P(Xt+1|…,Xt-2,Xt-1,Xt)=P(Xt+1|Xt).
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每局赌徒赌赢的概率为50%,且每局赌赢可以赢得1元,每局赌徒赌输的概率为50%,且每局赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B)元,赌博过程如图所示.
当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:
(1)请直接写出P(0)与P(B);
(2)证明{P(n)}是一个等差数列,并写出公差d;
(3)当A=100时, 分别计算B=200,B=1 000时P(A)的值,并结合实际解释当B→+∞时P(A)的统计含义.
3.(2024·汕头一模)2023年11月,我国教育部发布了《中小学实验教学基本目录》,内容包括高中数学在内共有16个学科900多项实验与实践活动.我市某学校的数学老师组织学生到“牛田洋”进行科学实践活动,在某种植番石榴的果园中,老师建议学生尝试去摘全园最大的番石榴,规定只能摘一次,并且只可以向前走,不能回头.结果,学生小明两手空空走出果园,因为他不知道前面是否有更大的,所以没有摘,走到前面时,又发觉总不及之前见到的,最后什么也没摘到.假设小明在果园中一共会遇到n个番石榴(不妨设n个番石榴的大小各不相同),最大的那个番石榴出现在各个位置上的概率相等,为了尽可能在这些番石榴中摘到那个最大的,小明在老师的指导下采用了如下策略:不摘前k(1≤k<n)个番石榴,自第k+1个开始,只要发现比他前面见过的番石榴大的,就摘这个番石榴,否则就摘最后一个.设k=tn,记小明摘到那个最大番石榴的概率为P.
(1)若n=4,k=2,求P;
(2)当n趋向于无穷大时,从理论的角度,求P的最大值及P取最大值时t的值.
( 取++…+=ln)
4.在数字1,2,…,n(n≥2)的任意一个排列A:a1,a2,…,an中,如果对于i,j∈N*,i<j,有ai>aj,那么就称(ai,aj)为一个逆序对.记排列A中逆序对的个数为S(A).如n=4时,在排列B:3,2,4,1中,逆序对有(3,2),(3,1),(2,1),(4,1),则S(B)=4.
(1)设排列C:a1,a2,a3,a4,写出两组具体的排列C,分别满足:①S(C)=5,②S(C)=4;
(2)对于数字1,2,…,n的一切排列A,求所有S(A)的算术平均值;
(3)如果把排列A:a1,a2,…,an中两个数字ai,aj(i<j)交换位置,而其余数字的位置保持不变,那么就得到一个新的排列A':b1,b2,…,bn,求证:S(A)+S(A')为奇数.
2 / 2专题六 概率与统计
第1讲 小题研透——计数原理与统计初步
1.C 法一(直接法) 选出的3位同学中男女生都要有,分为两类:1男2女、2男1女,故共有+=70(种)选法,故选C.
法二(间接法) 选出的3位同学中男女生都要有的反面是全男或全女,故共有--=70(种)选法,故选C.
2.C 二项式(-)6的展开式的通项为Tr+1=·()6-r·(-)r=(-1)r·,令=0得r=2,∴常数项为(-1)2=15.
3.D 根据题意,抽取的样本容量为(3 500+4 500+2 000)×10%=1 000,其中小学生、初中生、高中生抽取人数分别为350,450,200,根据题图2知抽取的小学生、初中生、高中生中,近视的人数分别为35,135,100,所以该地区中小学生的平均近视率为×100%=27%.故选D.
4.ABD 对于A,根据平均数的定义得n=xi,即7×6=1+3+5+6+9+11+m,得m=7,A正确.对于B,根据中位数的定义得,当m=2 024时,x0=6,B正确.对于C,若m=7,则=6,s2=×[(1-6)2+(3-6)2+(5-6)2+(6-6)2+(9-6)2+(11-6)2+(7-6)2]=10,C错误.对于D,i=7×80%=5.6,所以样本数据的80%分位数为按从小到大顺序排列后的第6个数11,D正确.综上,选A、B、D.
5.-30 解析:(a2-a+b)5=(a2-a+b)·(a2-a+b)·(a2-a+b)(a2-a+b)·(a2-a+b),则展开式中含有a5b2的项为(a2)2·(-a)·b2=-30a5b2,故(a2-a+b)5的展开式中a5b2的系数为-30.
6.180 解析:如图,从A开始摆放花卉,A有5种颜色花卉摆放方法,B有4种颜色花卉摆放方法,C有3种颜色花卉摆放方法;由D区与B,C区花卉颜色不一样,与A区花卉颜色可以同色也可以不同色.则D有3种颜色花卉摆放方法.故共有5×4×3×3=180种不同的绿化方案.
7.B 法一 因为5=1+4=2+3,所以可先考虑排中间一列的卡片,有种可能.余下四张卡片随意排列,有种可能,其中两侧某列的数字之和为5,有种可能,所以不同的排法有(-)=64(种).
法二 5=1+4=2+3,若数字1,4在中间一列,则数字3和2分开在第一列和第三列,共有=32(种)排法,若数字2,3在中间一列,也有32种排法,所以共有64种排法.
8.A 因(1+2x)10=[2(1+x)-1]10,其二项展开式的通项为:Tr+1=[2(1+x)]10-r(-1)r=(-1)r210-r(1+x)10-r,r=0,1,…,10,而a2是a2(1+x)2的系数,故只需取r=8,得T9=22(1+x)2=180(1+x)2,即a2=180.
9.C 若3≤a≤4,则这组数据由小到大排列依次为1,2,3,a,4,中位数为3,不合乎题意;若a>4,则这组数据由小到大排列依次为1,2,3,4,a,中位数为3,不合乎题意;若2≤a<3,则这组数据由小到大排列依次为1,2,a,3,4,中位数为a=2;若1≤a<2,则这组数据由小到大排列依次为1,a,2,3,4,中位数为2;若a<1,则这组数据由小到大排列依次为a,1,2,3,4,中位数为2.综上所述,实数a的取值范围是(-∞,2].故选C.
10.C 由题意,可得=16,所以m+n=32,所以这6个月的月慢走里程的平均数为=17,要使这6个月的月慢走里程的标准差最小,需要(m-17)2+(n-17)2最小,又由(m-17)2+(n-17)2=(m-17)2+(32-m-17)2=2m2-64m+172+152,故当标准差最小时,m=-=16.
11.B 第一种情况,甲、乙、丙三位同学都有安排时,先从3个人中选1个人,让他担任两门学科的课代表, 有=3种结果,然后从4门学科中选2门学科给同一个人,有=6种结果,余下的两个学科给剩下的两个人,有=2种结果,所以不同的安排方案共有3×6×2=36种,第二种情况,甲、乙、丙三位同学中只有两人被安排时,先选两人出来,有=3种结果,再将四门不同学科均分成两组,有=3种结果,将学科分给学生,有=2种结果,所以不同的安排方案共有3×3×2=18种,综合得不同的安排方案共有36+18=54种.故选B.
12.BCD 对于A,由10×80%=8,所以样本数据的第80百分位数为,故A错误;对于B,由题意存在这样一种可能,若x1=x2≤x3≤…≤x10,则极差为x10-x1=x10-x2,若去掉x1或x2,此时样本数据的极差不变,故B正确;对于C,样本数据的频率分布直方图为单峰不对称,向右边“拖尾”,大致如图,由于“右拖”时最高峰偏左,中位数靠近高峰处,平均数靠近中点处,此时平均数大于中位数,故C正确;对于D,由s2=-4=(xi-)2,则-40=(xi-)2=-2xi+10=-10,所以=4,因为xi(i=1,2,3,…,10)为正实数,所以>0,即=2,故D正确.故选B、C、D.
13.BCD 对于A,(1+x)8=+x+x2+…+x8,令x=1,得28=1+++…+=1+,则=28-1,故A错误.对于B,因为+=,所以=+++…+=+++…+=++…+=…=+=,故B正确.对于C、D,因为-=,所以=[-]=-+-+…+-=1-,故C正确.(1+x)16=(1+x)8(1+x)8,对于(1+x)16,其含有x8的项的系数为,对于(1+x)8(1+x)8,要得到含有x8的项的系数,须从第一个式子取出k(0≤k≤8,k∈N)个x,再从第二个式子取出(8-k)个x,它们对应的系数为=()2,所以()2=,故D正确.故选B、C、D.
14.10 解析:第一类:只选长、宽、高中的某一种棱进行截取,不同规格长方体的个数为=3,第二类:选长、宽、高中的某两种棱进行截取,不同规格长方体的个数为2=6,第三类:选长、宽、高三种棱进行截取,不同规格长方体的个数为1.故不同规格长方体的个数为3+6+1=10.
15.28 解析:因为展开式的所有项的二项式系数和为2n=256,解得n=8,则(+)8展开式的通项公式为Tr+1=()8-r()r=,r=0,1,2,…,8,可得第r+1项的系数为ar+1=,r=0,1,2,…,8,令即解得r=6,所以展开式中第7项系数最大,其二项式系数为=28.
16.AD 设甲球员的5场篮球比赛得分按从小到大排列为x1,x2,x3,x4,x5,则x1≤x2≤x3≤x4≤x5,x3=26,且24至少出现2次,故x1=x2=24,A正确;设乙球员的5场篮球比赛得分按从小到大排列为y1,y2,y3,y4,y5,则y1≤y2≤y3≤y4≤y5,y3=29,取y1=20,y2=23,y4=29,y5=29,可得其满足条件,但有2场得分低于24,B错误;设丙球员的5场篮球比赛得分按从小到大排列为z1,z2,z3,z4,z5,由已知[(z1-26)2+(z2-26)2+(z3-26)2+(z4-26)2+(z5-26)2]=9.6,所以(z1-26)2+(z2-26)2+(z3-26)2+(z4-26)2+(z5-26)2=48,若z4≥32,则z5≥32,所以(z1-26)2+(z2-26)2+(z3-26)2+(z4-26)2+(z5-26)2>72矛盾,所以z5=32,(z1-26)2+(z2-26)2+(z3-26)2+(z4-26)2=12,因为z1,z2,z3,z4,z5的平均数为26,所以z1+z2+z3+z4=98,取z1=23,z2=25,z3=25,z4=25,满足要求,但有一场得分低于24分,C错误;因为5×60%=3,所以丙球员连续5场比赛得分的第60百分位数为,若≤24,则≤24,故z1+z2+z3+z4<98,矛盾,所以>24,所以丙球员连续5场比赛得分的第60百分位数大于24,D正确.故选A、D.
17.(n+2)2n-1 解析:fk(1)=(n-k+1),F(1)=f0(1)+f1(1)+…+fk(1)+…+fn(1)=(n+1)+n+…+(n-k+1)+…+×1 ①.将F(1)倒序书写,可得F(1)=×1+×2+…+(k+1)+…+n+(n+1) ②.将①和②相加,可得2F(1)=(n+2)(++…++…+)=(n+2)2n.则F(1)=(n+2)2n-1.
第2讲 小题研透——概率
1.A 从2,3,5,7这四个数中随机地取两个不同的数相乘的基本事件总数为=6,其结果能被10整除的只有取2,5这一种情况,故所求概率为=.选A.
2.B 因为P(A)>0,P(B)>0,所以若事件A,B为对立事件,则P(A)+P(B)=1;但P(A)+P(B)=1推不出两个事件A,B对立,如掷一颗骰子,事件A为出现1点、2点、3点,事件B为出现3点、4点、5点,此时P(A)+P(B)=1,但两个事件不对立,所以“P(A)+P(B)=1”是“事件A,B互为对立事件”的必要不充分条件.故选B.
3.C 由题意知μ=78,σ=4,P(X>μ+σ)=≈≈0.16,所以等级为A的测验数据的最小值可能是82.故选C.
4.BCD 对B,P(B|A)===,∴P(AB)=,B正确;对A,P(AB)=P(A)P(B)=P(B),∴P(B)=,A错误;对C,P(B)=P()P(B)=×=,P(|B)===,C正确;对D,P(A+)=P(A)+P()-P(A)=P(A)+P()-P(A)P()=+-×=,D正确.故选B、C、D.
5.0.6 解析:由题知X~B(10,p),则D(X)=10p·(1-p)=2.4,解得p=0.4或0.6.又∵P(X=4)<P(X=6),即p4·(1-p)6<p6(1-p)4 (1-p)2<p2 p>0.5.∴p=0.6.
6. 解析:从10个球中任取3个球,共有=120种不同的情况.下面研究3个球编号之和能被3整除的情况:经过分析将这10个数分为三类,第一类,3的倍数{3,6,9},第二类,3的倍数减1{2,5,8},第三类,3的倍数加1{1,4,7,10},第一类任意两个数、三个数的和都是3的倍数;第二类、第三类两个数的和不是3的倍数,三个数的和是3的倍数,第二类、第三类里各取1个数,它们的和是3的倍数.所以3个球编号之和能被3整除共有+++=42种情况,所以其概率为=.
7.C 该系统正常工作的概率为P{[(AB)∪C]∩D}=P[(AB)∪C]·P(D)=[1-P()·P()]·P(D)=(1-P(∪)·P())·P(D)=[1-(1-P(AB))(1-P(C))]·P(D)=[1-(1-p2)(1-p)]p.
8.B 由于第四个礼盒中既有中国结,又有记事本,若抽到第四个礼盒,则事件A和事件B就同时发生了,因此事件A与事件B不是互斥事件,故A错误;由于P(A)=,P(B)=,P(A∩B)==P(A)·P(B),因此事件A与事件B相互独立,故B正确;由于第四个礼盒中既有中国结,又有记事本,还有笔袋,若抽到第四个礼盒,则事件A和事件B∪C就同时发生了,因此事件A与事件B∪C不是互斥事件,故C错误;由于P(A)=,P(B∩C)=,P(A∩B∩C)=≠P(A)·P(B∩C),因此事件A与事件B∩C不是相互独立的,故D错误.综上,选B.
9.A 设事件B1表示任选一件产品,来自于甲箱,事件B2表示任选一件产品,来自于乙箱,事件A表示从两箱产品中任取一件,恰好不合格,P(A)=P(A|B1)·P(B1)+P(A|B2)P(B2)=0.1×0.5+0.2×0.5=0.15,又P(B1|A)====,P(B2|A)====,经检验不合格,放回原箱后在该箱中再随机取一件产品,则该件产品合格的概率为×+×=.故选A.
10.D 法一 设棋手在第二盘与甲比赛连胜两盘的概率为P甲,在第二盘与乙比赛连胜两盘的概率为P乙,在第二盘与丙比赛连胜两盘的概率为P丙,由题意可知,P甲=2p1[p2(1-p3)+p3(1-p2)]=2p1p2+2p1p3-4p1p2p3,P乙=2p2[p1(1-p3)+p3(1-p1)]=2p1p2+2p2p3-4p1p2p3,P丙=2p3[p1(1-p2)+p2(1-p1)]=2p1p3+2p2p3-4p1p2p3.所以P丙-P甲=2p2(p3-p1)>0,P丙-P乙=2p1(p3-p2)>0,所以P丙最大,故选D.
法二(特殊值法) 不妨设p1=0.4,p2=0.5,p3=0.6,则该棋手在第二盘与甲比赛连胜两盘的概率P甲=2p1[p2(1-p3)+p3(1-p2)]=0.4;在第二盘与乙比赛连胜两盘的概率P乙=2p2[p1(1-p3)+p3(1-p1)]=0.52;在第二盘与丙比赛连胜两盘的概率P丙=2p3[p1(1-p2)+p2(1-p1)]=0.6.所以P丙最大,故选D.
11.ABC 对于A,Y的密度曲线更尖锐,即数据更集中,正确;对于B,∵c,μ2与Y的密度曲线围成的面积S1大于c,μ1与X的密度曲线围成的面积S2,P(Y≤c)=+S1,P(X≤c)=+S2,∴P(X≤c)<P(Y≤c),正确;对于C,∵μ2<μ1,∴甲种茶青每500克的红茶产量超过μ2的概率P=P(X>μ2)>,正确;对于D,由B知,P(X>c)=-S2,P(Y≤c)=+S1,∴P(X>c)+P(Y≤c)=1+S1-S2>1,错误.
12.AC 把“使用信用卡支付”记为事件A1,“使用支付宝支付”记为事件A2,“使用微信支付”记为事件A3,“遇到支付问题”记为事件B,则P(A1)=0.2,P(A2)=0.4,P(A3)=0.4,P(B)=0.06,P(A1|B)=P(A2|B)=P(A3|B)=.对于A,使用信用卡支付遇到支付问题的概率为P(B|A1)===0.1,故A正确;对于B,使用支付宝支付遇到支付问题的概率为P(B|A2)===0.05,使用微信支付遇到支付问题的概率为P(B|A3)===0.05,故B错误;对于C,关闭信用卡支付通道后,P(A2)=0.5,P(A3)=0.5,使用支付宝支付同时遇到支付问题的概率为P(A2B)=P(B|A2)P(A2)=0.05×0.5=0.025,使用微信支付同时遇到支付问题的概率为P(A3B)=P(B|A3)P(A3)=0.05×0.5=0.025,所以P(B)=P(A2B)+P(A3B)=0.025+0.025=0.05,故C正确;对于D,P(B)=P(A1B)+P(A2B)+P(A3B)=P(B|A1)P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)=P(A1)+P(A2)+P(A3),减少使用微信支付的人数,会使P(A3)变小,P(A1)变大,从而导致P(B)变大,即会提高出现支付问题的概率,故D错误.综上,选A、C.
13. 解析:由题意可知每位队员把球传给其他4人的概率都为,由甲开始传球,则前3次传球中,乙恰好有1次接到球的情况可分为:只在第一次接到球和只在第二次接到球以及只在第三次接到球,则概率为×1×+××1+××=.
14. 解析:由图可知,若想通过6次移动最终停在-2的位置上,则必然需要向右移动2次且向左移动4次,记向右移动一次为R,向左移动一次为L,则该题可转化为R,R,L,L,L,L六个字母排序的问题,故落在-2上的排法种数为=15,所有移动结果的总数为26=64,所以落在-2上的概率为P=.
15. 解析:设该篮球运动员投进第n-1(n≥2,n∈N*)个球的概率为Pn-1,第n-1个球投不进的概率为1-Pn-1,则他投进第n个球的概率为Pn=Pn-1+(1-Pn-1)=+Pn-1,所以Pn-=(Pn-1-).所以Pn-=·=×=.所以Pn=+(n∈N*),所以P5=.
16.ABD 对于A选项,抽奖人在不知道奖品在哪个箱子的情况下选择了1号箱,他的选择不影响奖品在四个箱子中的概率分配,因此A1,A2,A3,A4的概率均为,即A正确;对于B选项,奖品在2号箱里,主持人只能打开3,4号箱,故P(B3|A2)=,故B正确;对于C、D选项,奖品在1号箱里,主持人可打开2,3,4号箱,故P(B3|A1)=,奖品在2号箱里,主持人只能打开3,4号箱,故P(B3|A2)=,奖品在3号箱里,主持人打开3号箱的概率为0,故P(B3|A3)=0,奖品在4号箱里,主持人只能打开2,3号箱,故P(B3|A4)=,由全概率公式可得P(B3)=P(Ai)P(B3|Ai)=×(++0+)=,P(A1|B3)===,P(A2|B3)===>,P(A4|B3)===>,故C错误,D正确.
17.D 设事件D1,D2,D3分别为“此人来自甲、乙、丙三个地区”,事件F1,F2,F3分别为“此人患了流感,且分别来自甲、乙、丙地区”,事件G为“此人患了流感”.由x,y,z构成以1为公差的等差数列知y=x+1,z=x+2.由题意知,P(F1)=×x%=,同理P(F2)=,P(F3)=,P(G)=P(F1∪F2∪F3)=,所以P(D1|G)=,P(D2|G)=,P(D3|G)=.因为在此人患了流感的条件下,此人来自甲地区的概率最大,所以解得x>,故选D.
第3讲 大题专攻——随机变量及其分布
1.解:(1)从8个小球中,随机一次取出3个小球,
共有==56(种)结果.
先从数字1,2,3,4中选择3个数字,再从选定的数字中各取1个小球,共有=32(种)结果.
记事件A:“取出的3个小球上的数字两两不同”,
则P(A)==.
所以取出的3个小球上的数字两两不同的概率为.
(2)因为X为取出的3个小球上的最小数字,所以X的所有可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==.
故X的分布列为
X 1 2 3
P
X的数学期望E(X)=1×+2×+3×=.
2.解:(1)P(ζ≥12.2)=P(ζ≥μ+2σ)==0.022 75.
所以符合该项指标的学生人数为3 000×0.022 75=68.25≈68.
(2)①记A1表示解答A类试题第一次测试合格,
B1,B2分别表示解答B类试题第一次和第二次测试合格,测试共进行3次记为事件M,
则P(A1)=,P(A1M)=P(A1B2)+P(A1)=××+××=.
P(M|A1)==
==.
②由题知,X的取值为0,1,2,
P(X=0)=×=,
P(X=1)=××+×××=,
P(X=2)=1-P(X=0)-P(X=1)=,
所以X的分布列为:
X 0 1 2
P
数学期望E(X)=0×+1×+2×=.
3.解:(1)由题意可设1,2,3号球的个数分别为n,2n,n,
则取到异号球的概率P==,
所以=,即n2=2n.
解得n=2.
所以盒中2号球的个数为4.
(2)若甲先回答1号球再回答3号球中的谜语,
因为猜对谜语的概率相互独立,记X为甲获得的奖金总额,
则X可能的取值为0元,100元,600元,
P(X=0)=0.2,
P(X=100)=0.8×(1-0.5)=0.4,
P(X=600)=0.8×0.5=0.4.
X的分布列为
X 0 100 600
P 0.2 0.4 0.4
X的均值为E(X)=280.
若甲先回答3号球再回答1号球中的谜语,因为猜对谜语的概率相互独立,
记Y为甲获得的奖金总额,则Y可能的取值为0元,500元,600元,
P(Y=0)=0.5.
P(Y=500)=0.5×(1-0.8)=0.1,
P(Y=600)=0.5×0.8=0.4,
Y的分布列为
Y 0 500 600
P 0.5 0.1 0.4
Y的均值为E(Y)=290.
因为E(Y)>E(X),所以推荐甲先回答3号球中的谜语再回答1号球中的谜语.
4.解:(1)记“该应聘者应聘乙公司三项专业技能测试恰好通过两项”为事件A,
由题设P(A)=×××+××()2=.
(2)设“该应聘者应聘甲、乙公司三项专业技能测试中通过的项目数分别记为ζ,η”,
由题设知:ζ~B(3,),所以E(ζ)=3×=2,
η的所有可能取值为0,1,2,3,
P(η=0)=××(1-m)=,
P(η=1)=××(1-m)+××(1-m)+××m=,
P(η=2)=××(1-m)+××m+××m=,
P(η=3)=××m==,
故η的分布列为
η 0 1 2 3
P
从而E(η)=0×+1×+2×+3×=,
由得解得<m<1,
故m的取值范围为(,1).
第4讲 大题专攻——成对数据的统计分析
1.解:(1)因为采用分层随机抽样按性别从该班级中抽取6名同学,其中有男同学4名,女同学2名,所以男女同学的比例为2∶1,则=2,故a=10,
该班同学选择长跑的概率为=.
(2)依题意,完善2×2列联表,如下,
性别 跑步项目类别 合计
长跑 短跑
男同学 30 10 40
女同学 10 10 20
合计 40 20 60
零假设为H0:选择跑步项目类别与学生性别无关,
χ2===3.75<6.635=x0.01,
根据小概率值α=0.01的独立性检验,没有充分证据推断出H0不成立,
因此可以认为H0成立,即认为选择跑步项目类别与学生性别无关.
2.解:(1)经验回归方程②的残差数据如下表:
x 5 7 9 11
y 200 298 431 609
20 -18 -21 21
经验回归方程②的残差图如图所示:
经验回归方程①更适宜作为y关于x的经验回归方程.
(以下理由或其他合理的理由,说出一条即可得分):
理由1:经验回归方程①这4个样本点的残差的绝对值都比经验回归方程②的小.
理由2:经验回归方程①这4个样本的残差点落在的带状区域比经验回归方程②的带状区域更窄.
理由3:经验回归方程①这4个样本的残差点比经验回归方程②的残差点更贴近x轴.
(2)(ⅰ)由题意知,每件产品为优等品的概率P0==0.6,
则X~B(12,0.6),因此E(X)=12×0.6=7.2,
由Y=20X+15×(12-X)=5X+180,
则E(Y)=5E(X)+180=216.
(ⅱ)由(ⅰ)知总利润为216万元,总成本估计值=+173=749(万元),
则p=≈0.29.
3.解:(1)每天普及人数不少于240人的天数为3,则X的所有可能取值为0,1,2,3,
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
故X的分布列为
X 0 1 2 3
P
E(X)=0×+1×+2×+3×=.
(2)设原来数据的样本中心点为(,),去掉第5天的数据后样本中心点为(','),
'=(1+2+3+4+6+7+8+9)=5,'=x5=5=,
'=(9-y5)=(9×190-203)=,
故=
=
=
===30,
='-'=-30×5=,
所以=30x+.
4.解:(1)2×2列联表如下:
PM2.5的 平均浓度 燃油车日流量 合计
燃油车 日流量 x<1 500 燃油车 日流量 x≥1 500
PM2.5的 平均浓度 y<100 16 8 24
PM2.5的 平均浓度 y≥100 6 20 26
合计 22 28 50
零假设为H0:PM2.5的平均浓度小于100 μg/m3与燃油车日流量小于1 500辆无关联.
根据列联表中的数据,计算得
χ2=≈9.624>7.879=x0.005,
所以根据小概率值α=0.005的独立性检验,推断H0不成立,所以可以认为PM2.5的平均浓度小于100 μg/m3与燃油车日流量小于1 500辆有关联.
(2)①由题意,
得==0.12,
得(xi-)(yi-)=0.12(xi-)2,
由Sx==249,
Sy==36,
得r=
=
=0.12×=0.12×=0.83>0.75,
所以该经验回归方程有价值.
②因为Sx==249,
即=249,
所以=≈1 548.55,
又=0.12-73.86≈0.12×1 548.55-73.86=111.966≈112.0.
故可推算出这50天PM2.5平均浓度y的平均数约为112.0 μg/m3.
培优点1 体育比赛与闯关
1.C 甲、乙打满4局比赛的胜负情况如图所示,
由树状图可知,胜负情况共有16种,其中甲赢得比赛的情况有5种,故所求概率P=.
2.A 要使甲在第5局终止比赛并获胜,可分为2类情况:①甲前2局均失败,后3局中连胜,则甲在第5局终止比赛并获胜的概率为p1=( 1-)×( 1-)×××=;②甲第1局胜,第2局负,后3局中连胜,则甲在第5局终止比赛并获胜的概率为p2=×( 1-)×××=.所以甲在第5局终止比赛并获胜的概率为p=p1+p2=+=.
3.A 设每一轮训练过关的概率为p,则p=+××p2×(1-p2)+××p1×(1-p1)=-3+2p1p2(p1+p2)=-3+2p1p2×=-3+p1p2.又0<p1p2≤( )2=,当且仅当p1=p2=时等号成立.函数y=-3x2+x的图象的开口向下,对称轴为直线x=,所以0<-3+p1p2≤-3×( )2+×=,依题意,知X~B(n,p),则E(X)=n( -3+p1p2)=16,n=≥=27,所以至少需要27轮.故选A.
4.BCD 对于A,k=1时,甲、乙比赛结果为平局的概率为××=,故A错误;对于B,k=2时,甲赢得比赛的概率为·()4+·()4=,乙赢得比赛的概率为·()4+·()4=,故B正确;对于C,由二项分布的数学期望公式知,在2k局比赛中,甲获胜的局数的期望为2k×=k,故C正确;对于D,在2k局比赛中,甲赢得比赛的概率为·[1-·()2k],故随着k的增大,甲赢得比赛的概率会越来越接近,故D正确.
5.0.18 解析:甲队以4∶1获胜包含的情况有:①前5场比赛中,第一场负,另外4场全胜,其概率为p1=0.4×0.6×0.5×0.5×0.6=0.036,②前5场比赛中,第二场负,另外4场全胜,其概率为p2=0.6×0.4×0.5×0.5×0.6=0.036,③前5场比赛中,第三场负,另外4场全胜,其概率为p3=0.6×0.6×0.5×0.5×0.6=0.054,④前5场比赛中,第四场负,另外4场全胜,其概率为p4=0.6×0.6×0.5×0.5×0.6=0.054,则甲队以4∶1获胜的概率为p=p1+p2+p3+p4=0.036+0.036+0.054+0.054=0.18.
6.解:(1)前3局比赛甲都获胜的概率为P=××=.
(2)X的所有可能取值为0,1,2,3,
其中,X=0表示第1局乙输,第3局是乙上场,且乙输,则P(X=0)=×=;
X=1表示第1局乙输,第3局是乙上场,且乙赢,或者第1局乙赢,且第2局乙输,
则P(X=1)=×+×=;
X=2表示第1局乙赢,且第2局乙赢,第3局乙输,
则P(X=2)=××=;
X=3表示第1局乙赢,且第2局乙赢,第3局乙赢,
则P(X=3)=××=.
综上,X的分布列为
X 0 1 2 3
P
故X的数学期望为E(X)=0×+1×+2×+3×=.
7.解:(1)由条件,每次抢答题,甲得1分的概率为P甲=×+×=,
每次抢答题乙得1分的概率为P乙=1-P甲=1-=,
若第二题答完比赛结束,则前两次答题甲得2分或者乙得2分,
因此第二题答完比赛结束事件发生的概率P=( )2+( )2=.
(2)根据题意,竞赛结束时抢答题目的总数X的所有可能取值为2,4,6,8,…,2n,…(n∈N*),
记pn=P(X=2n),
由(1)知,当X=2时,p1=P(X=2)=,且pn+1=pn(n∈N*),
则X的分布列可表示为:
X 2 4 6 … 2n …
P p1 p2 p3 … pn …
∴E(X)=2p1+4p2+6p3+8p4+…+2n·pn+…=+4×p1+6×p2+8×p3+…+2n×pn-1+…=+[4p1+6p2+8p3+…+2n·pn-1+(2n+2)·pn+…]=+[(2p1+4p2+6p3+…+2n·pn+…)+2(p1+p2+p3+…+pn+…)]=+[E(X)+2],解得E(X)=.
8.解:(1)①记“甲获得第四名”为事件A,
则P(A)=(1-0.6)2=0.16.
②记甲在“双败淘汰制”下参与对阵的比赛场次为随机变量X,
则X的所有可能取值为2,3,4.
连败两局:P(X=2)=(1-0.6)2=0.16.
X=3可分为连胜两局,第三局不管胜负;负胜负;胜负负,
P(X=3)=0.62+(1-0.6)×0.6×(1-0.6)+0.6×(1-0.6)×(1-0.6)=0.552,
P(X=4)=(1-0.6)×0.6×0.6+0.6×(1-0.6)×0.6=0.288,
故X的分布列如下:
X 2 3 4
P 0.16 0.552 0.288
故数学期望E(X)=2×0.16+3×0.552+4×0.288=3.128.
(2)“双败淘汰制”下,甲获胜的概率为p3+p(1-p)p2+(1-p)p3=(3-2p)p3.
在“单败淘汰制”下,甲获胜的概率为p2.
因为(3-2p)p3-p2=p2(3p-2p2-1)=p2(2p-1)(1-p),且0<p<1,
所以p∈( ,1)时,(3-2p)p3>p2,“双败淘汰制”对甲夺冠有利;
p∈( 0,)时,(3-2p)p3<p2,“单败淘汰制”对甲夺冠有利;
p=时,两种赛制甲夺冠的概率一样.
培优点2 概率与统计中的创新问题
1.解:(1)设“某天中午甲去A餐厅用餐”为事件A,
“该天晚上甲去B餐厅用餐”为事件B,
由题知n(A)=50,n(AB)=20,
所以P(B|A)==0.4.
所以某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率为0.4.
(2)证明:由P(|N)=P(|),
可知=
=,
所以P(N)-P(N)P(N)=P()·P(N)-P(N)P(N),
即P(N)=P()P(N),
所以P(N)-P(MN)=[1-P(M)]·P(N),
得P(MN)=P(M)P(N),
即M和N相互独立得证.
2.解:(1)当n=0时,赌徒已经输光了,因此P(0)=1.
当n=B时,赌徒停止赌博,因此输光的概率P(B)=0.
(2)记赌徒手中有n元时最终输光为事件M,记赌徒手中有n元时上一局赌赢为事件N,则根据全概率公式可得,P(M)=P(N)P(M|N)+P()·P(M|),
即P(n)=P(n-1)+P(n+1),
所以P(n)-P(n-1)=P(n+1)-P(n),
所以{P(n)}是一个等差数列.
设P(n)-P(n-1)=d,
则P(n-1)-P(n-2)=d,…,P(1)-P(0)=d,
累加得P(n)-P(0)=nd,故P(B)-P(0)=Bd,得d=-.
(3)当A=100时,由P(n)-P(0)=nd得P(A)-P(0)=Ad,即P(A)=1-,
当B=200时,P(A)=50%,
当B=1 000时,P(A)=90%.
当B→+∞时,P(A)→1,
因此可知久赌无赢家,即便是一个这样看似公平的游戏,只要赌徒一直玩下去就几乎有100%的概率输光.
3.解:(1)依题意,4个番石榴的位置从第1个到第4个排序,有=24种情况,
要摘到那个最大的番石榴,有以下两种情况:
①最大的番石榴是第3个,其他的随意在哪个位置,有=6种情况;
②最大的番石榴是最后1个,第二大的番石榴是第1个或第2个,其他的随意在哪个位置,有2=4种情况,所以所求概率为=.
(2)记事件A表示最大的番石榴被摘到,事件Bi表示最大的番石榴排在第i个,则P(Bi)=,由全概率公式知:P(A)=P(A|Bi)P(Bi)=(A|Bi),
当1≤i≤k时,最大的番石榴在前k个中,不会被摘到,此时P(A|Bi)=0;
当k+1≤i≤n时,最大的番石榴被摘到,当且仅当前i-1个番石榴中的最大一个在前k个之中时,此时P(A|Bi)=,
因此P(A)=( ++…+)=ln,
令g(x)=ln(x>0),求导得g'(x)=ln-,由g'(x)=0,得x=,
当x∈( 0,)时,g'(x)>0,当x∈( ,n)时,g'(x)<0,
即函数g(x)在( 0,)上单调递增,在( ,n)上单调递减,
则g(x)max=g( )=,于是当k=时,P(A)=ln取得最大值,
所以P的最大值为,此时t的值为.
4.解:(1)①C:4,2,3,1,则逆序对有(4,2),(4,3),(2,1),(4,1),(3,1),则S(C)=5;
②C:2,4,3,1,则逆序对有(4,3),(3,1),(4,1),(2,1),则S(C)=4.
(2)考虑排列D:d1,d2,…,dn-1,dn与排列D1:dn,dn-1,…,d2,d1,
因为数对(di,dj)与(dj,di)中必有一个为逆序对(其中1≤i<j≤n),
且排列D中数对(di,dj)共有=个,
所以S(D)+S(D1)=.
所以排列D与D1的逆序对的个数的算术平均值为.
而对于数字1,2,…,n的任意一个排列A:a1,a2,…,an,都可以构造排列A1:an,an-1,…,a2,a1,且这两个排列的逆序对的个数的算术平均值为.
所以所有S(A)的算术平均值为.
(3)证明:①当j=i+1,即ai,aj相邻时,
不妨设ai<ai+1,则排列A'为a1,a2,…,ai-1,ai+1,ai,ai+2,…,an,
此时排列A'与排列A:a1,a2,…,an相比,仅多了一个逆序对(ai+1,ai),
所以S(A')=S(A)+1,
所以S(A)+S(A')=2S(A)+1为奇数.
②当j≠i+1,即ai,aj不相邻时,
假设ai,aj之间有m个数字,记排列A:a1,a2,…,ai,k1,k2,…,km,aj,…,an,
先将ai向右移动一个位置,得到排列A1:a1,a2,…,ai-1,k1,ai,k2,…,km,aj,…,an,
由①,知S(A1)与S(A)的奇偶性不同,
再将ai向右移动一个位置,得到排列A2:a1,a2,…,ai-1,k1,k2,ai,k3,…,km,aj,…,an,
由①,知S(A2)与S(A1)的奇偶性不同,
以此类推,ai共向右移动m次,得到排列Am:a1,a2,…,k1,k2,…,km,ai,aj,…,an,
再将aj向左移动一个位置,得到排列Am+1:a1,a2,…,ai-1,k1,…,km,aj,ai,…,an,
以此类推,aj共向左移动m+1次,得到排列A2m+1:a1,a2,…,aj,k1,…,km,ai,…,an,
即为排列A',
由①可知仅有相邻两数的位置发生变化时,排列的逆序对个数的奇偶性发生变化,
而排列A经过2m+1次的前后两数交换位置,可以得到排列A',
所以排列A与排列A'的逆序数的奇偶性不同,
所以S(A)+S(A')为奇数.
综上,得S(A)+S(A')为奇数.
1 / 2