第3讲 大题专攻——随机变量及其分布
备|考|领|航
一、考情分析
高频考点 高考预测
离散型随机变量的期望与方差 离散型随机变量的分布列、均值、方差和概率的计算问题常常结合在一起进行考查,重点考查超几何分布、二项分布及正态分布,以解答题为主,难度中等
二项分布与超几何分布
现实生活情境中的决策问题
二、真题感悟
1.(2023·全国甲卷理19题节选)(超几何分布概率模型的应用)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望.
2.(2024·新高考Ⅱ卷18题节选)(相互独立事件的概率、离散型随机变量的期望)某投篮比赛分为两个阶段,每个参赛队由两名队员组成.比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中1次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分,该队的比赛成绩为第二阶段的得分总和.
某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若p=0.4,q=0.5,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率;
(2)假设0<p<q,为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
重|难|排|查
1.离散型随机变量的期望与方差
(1)期望:E(X)=x1p1+x2p2+…+xnpn;
(2)方差:D(X)=(xi-E(X))2pi,标准差为;
(3)期望与方差的性质
E(aX+b)=aE(X)+b(a,b为常数),
D(aX+b)=a2D(X)(a,b为常数),
若X~B(n,p),则E(X)=np,D(X)=np(1-p).
2.二项分布概率模型的特征
(1)在每一次试验中,试验结果只有两个,即发生与不发生;
(2)各次试验中的事件是相互独立的;
(3)在每一次试验中,事件发生的概率与不发生的概率都保持不变.
3.超几何分布概率模型的特征
(1)实际问题所描述的事件只包含两个结果(发生与不发生),每进行一次上述抽取都不是原来的重复(再次抽取时,都与上次条件发生了变化);
(2)每次抽取中同一事件发生的概率都不同;
(3)实际问题中随机变量为抽到某类个体的个数;
(4)该问题属于不放回抽取问题.
易错提醒 涉及求分布列时,要注意区分是二项分布还是超几何分布.
离散型随机变量的期望与方差
【例1】 (2024·济宁一模)袋中装有大小相同的4个红球,2个白球.某人进行摸球游戏,一轮摸球游戏规则如下:①每次从袋中摸取一个小球,若摸到红球则放回袋中,充分搅拌后再进行下一次摸取;②若摸到白球或摸球次数达到4次时本轮摸球游戏结束.
(1)求一轮摸球游戏结束时摸球次数不超过3次的概率;
(2)若摸出1次红球计1分,摸出1次白球记2分,求一轮游戏结束时,此人总得分X的分布列和数学期望.
感悟提升
求随机变量X的均值与方差的方法及步骤
(1)理解随机变量X的意义,写出X可能的全部取值;
(2)求X取每个值时对应的概率,写出随机变量X的分布列;
(3)由均值和方差的计算公式,求得均值E(X),方差D(X).
(2024·济南高三模拟考试)抛掷甲、乙两枚质地均匀的骰子,所得的点数分别为a,b,记[]的取值为随机变量X,其中[]表示不超过的最大整数.
(1)求在X>0的条件下,X=的概率;
(2)求X的分布列及其数学期望.
二项分布与超几何分布
【例2】 某地为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了10所学校进行研究,得到如下数据:
(1)在这10所学校中随机选取3所来调查研究,求这3所学校参与“自由式滑雪”都超过40人的概率;
(2)“单板滑雪”参与人数超过45的学校可以作为“基地学校”,现在从这10所学校中随机选出3所,记X为选出可作“基地学校”的学校个数,求X的分布列和均值;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训,且在集训中进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在集训测试中,小明同学每个动作达到“优秀”的概率均为,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得“优秀”的次数的均值达到不少于5次,那么理论上至少要进行多少轮测试?
感悟提升
1.二项分布的期望与方差的求解策略
(1)如果ξ ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量;
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样也可求出D(aξ+b).
2.求超几何分布的分布列的三个步骤
(1)验证随机变量服从超几何分布,并确定参数N,M,n的值;
(2)根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率;
(3)用表格的形式列出分布列.
(2024·临沂一模)某学校举办了精彩纷呈的数学文化节活动,其中有一个“掷骰子赢奖品”的登台阶游戏最受欢迎.游戏规则如下:抛掷一枚质地均匀的骰子一次,出现3的倍数,则一次上三级台阶,否则上两级台阶,再重复以上步骤,当参加游戏的学生位于第8、第9或第10级台阶时游戏结束.规定:从平地开始,结束时学生位于第8级台阶可获得一本课外读物,位于第9级台阶可获得一套智力玩具,位于第10级台阶则认定游戏失败.
(1)某学生抛掷三次骰子后,按游戏规则位于第X级台阶,求X的分布列及数学期望E(X);
(2)甲、乙两位学生参加游戏,求恰有一人获得奖品的概率.
现实生活情境中的决策问题
【例3】 (2024·滨州二模)某高校“植物营养学专业”学生将鸡冠花的株高增量作为研究对象,观察长效肥和缓释肥对农作物的影响情况.其中长效肥、缓释肥、未施肥三种处理下的鸡冠花分别对应第1,2,3组.观察一段时间后,分别从第1,2,3组各随机抽取20株鸡冠花作为样本,得到相应的株高增量数据整理如下表:
株高增量(单位:厘米) (4,7] (7,10] (10,13] (13,16]
第1组鸡冠花样本株数 4 10 4 2
第2组鸡冠花样本株数 3 8 8 1
第3组鸡冠花样本株数 7 5 7 1
假设用频率估计概率,且所有鸡冠花生长情况相互独立.
(1)从第1组抽取的20株鸡冠花样本中随机抽取2株,求至少有1株鸡冠花的株高增量在(7,10]内的概率;
(2)分别从第1组,第2组,第3组的鸡冠花中各随机抽取1株,记这3株鸡冠花中恰有X株的株高增量在(7,10]内,求X的分布列和数学期望E(X);
(3)用“ζk=1”表示第k组鸡冠花的株高增量在(4,10]内,“ζk=0”表示第k组鸡冠花的株高增量在(10,16]内,k=1,2,3.比较方差D(ζ1),D(ζ2),D(ζ3)的大小,并说明理由.
感悟提升
决策类问题的解题关注点
(1)关注均值:随机变量的均值反映了随机变量取值的平均水平;
(2)关注方差:随机变量的方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据;
(3)先后顺序:一般先比较均值,若均值相同,再用方差来决策.
灯带是生活中常见的一种装饰材料,已知某款灯带的安全使用寿命为5年,灯带上照明的灯珠为易损配件,该灯珠的零售价为4元/只,但在购买灯带时可以以零售价五折的价格购买备用灯珠.该灯带销售老板为了给某顾客节省装饰及后期维护的支出,提供了150条这款灯带在安全使用寿命内更换的灯珠数量的数据,数据如图所示.以这150条灯带在安全使用寿命内更换的灯珠数量的频率代替1条灯带更换的灯珠数量发生的概率,若该顾客买1盒此款灯带,每盒有2条灯带,记X表示这1盒灯带在安全使用寿命内更换的灯珠数量,n表示该顾客购买1盒灯带的同时购买的备用灯珠数量.
(1)求X的分布列;
(2)若满足P(X≥n)≤0.6的n的最小值为n0,求n0;
(3)在灯带安全使用寿命期内,以购买替换灯珠所需总费用的期望值为依据,比较n=n0-1与n=n0哪种方案更优.
4 / 4专题六 概率与统计
第1讲 小题研透——计数原理与统计初步
【锁定高考·明方向】
真题感悟
1.C 对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg, 故A错误;对于B,亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;对于C,稻田亩产量的极差最大为1 200-900=300,最小为1 150-950=200,故C正确;对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.故选C.
2.BD 若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.
3.B 先将丙和丁捆在一起有种排列方式,然后将其与乙、戊排列,有种排列方式,最后将甲插入中间两空,有种排列方式,所以不同的排列方式共有=24种,故选B.
4.24 112 解析:由题意知,选4个方格,每行和每列均恰有一个方格被选中,则第一列有4个方格可选,第二列有3个方格可选,第三列有2个方格可选,第四列有1个方格可选,所以共有4×3×2×1=24种选法.
法一(列举法) 每种选法可标记为(a,b,c,d),a,b,c,d分别表示第一、二、三、四行的数字,则所有的可能结果为:(11,22,33,44),(11,22,43,34),(11,33,22,44),(11,33,43,24),(11,42,22,34),(11,42,33,24),(21,12,33,44),(21,12,43,34),(21,33,13,44),(21,33,43,15),(21,42,13,34),(21,42,33,15),(31,12,22,44),(31,12,43,24),(31,22,13,44),(31,22,43,15),(31,42,13,24),(31,42,22,15),(40,12,22,34),(40,12,33,24),(40,22,13,34),(40,22,33,15),(40,33,13,24),(40,33,22,15),比较可知,所选方格中,(21,33,43,15)的和最大,最大为112.
法二(整体分析法) 先按列分析,每列必选出一个数,故所选4个数的十位上的数字分别为1,2,3,4.再按行分析,第一、二、三、四行个位上的数字的最大值分别为1,3,3,5,故从第一行选21,从第二行选33,从第三行选43,从第4行选15,此时个位上的数字之和最大.故选中方格中的4个数之和的最大值为21+33+43+15=112.
5.5 解析:由二项式定理知( +x)10=x10-k.记ak=,k=0,1,…,10.
法一 对于k=1,2,…,10,有=·=.当k≤2时,>1;当k≥3时,<1,因此a0<a1<a2,a2>a3>…>a10,所以展开式各项系数中的最大值为a2==5.
法二 对于k=1,2,…,10,有ak-ak-1=(-3)=·( -)=·,当k≤2时,ak-ak-1>0;当k≥3时,ak-ak-1<0.因此有a0<a1<a2,a2>a3>…>a10,所以展开式各项系数中的最大值为a2==5.
【研透高考·攻重点】
【例1】 (1)C (2)D 解析:(1)根据题意,可分为两类:①当新节目插在中间的四个空隙中的一个时,有=4×2=8种方法;②当新节目插在中间的四个空隙中的两个时,有=4×3=12种方法,由分类加法计数原理得,共有8+12=20种不同的插法.故选C.
(2)由题意可知,先将5人分成3组,有两类分法,第一类,各组人数分别为3,1,1,共有种分法;第二类,各组人数分别为1,2,2,共有种分法.将3组人员分配到A,B,C三个乡村学校去,共有种分法,所以不同的选派方法共有( +)=150(种).故选D.
跟踪训练
1.C 以A为起点时,三条路线依次连接即可到达B点.共有3×2=6种选择,自B连接到C时,在C右侧可顺时针连接或逆时针连接,共有2种选择,∴以A为起点,C为终点时,共有6×2=12种方法;同理可知,以C为起点,A为终点时,共有12种方法.∴完成该图“一笔画”的方法数为12+12=24种.
2.B 法一(排除法) 从7个点中任意取3个点共有种取法,因为B,D,E,F四点共线,其中任意三点都不能构成三角形,所以共可以构成-=35-4=31(个)不同三角形,故选B.
法二(分类法) 第一类:B,D,E,F四个点中一个点都不取,可构成=1(个)三角形;第二类:从B,D,E,F四个点中取1个点,在A,C,G中取2个点,可构成=12(个)三角形;第三类:从B,D,E,F四个点中取2个点,在A,C,G中取1个点,可构成=18(个)三角形.共可以构成1+12+18=31(个)三角形,故选B.
【例2】 (1)AC (2)-40 解析:(1)根据二项式定理,( 2x-)8的通项为Tk+1=28-k(-1)kx8-2k,常数项为24(-1)4=1 120,故A正确;第四项的系数为28-3(-1)3=-1 792,第六项的系数为28-5(-1)5=-448,故B错误;因为n=8,所以各项的二项式系数之和为28=256,故C正确;令x=1,各项的系数之和为1,故D错误.
(2)(x-2y)6的通项公式为Tr+1=x6-r(-2y)r=(-2)rx6-ryr,令r=2得,T3=(-2)2x4y2=60x4y2,此时60x4y2·2=120x4y2,令r=3得,T4=(-2)3x3y3=-160x3y3,此时-160x3y3·=-160x4y2,故x4y2的系数为120-160=-40.
跟踪训练
1.C 令x=0,则15=a0,∴a0=1;令x=1,则35=a0+a1+a2+a3+a4+a5,∴a1+a2+a3+a4+a5=35-1=242.故选C.
2.32 -1 080 解析:由二项式定理得(3x-y+2z)5的展开式的通项公式为Tr+1=(3x-y)5-r·(2z)r,欲使得不含z,则r=0,∴T1=(3x-y)5,令x=1,y=1,则所有不含字母z的项的系数之和为25=32;含x3yz的项是·(3x)3(-y)·2z=-1 080x3yz,故其系数为-1 080.
3.4 解析:由(a+b)2n的展开式的二项式系数的最大值为x,则有x=,由(a+b)2n+1的展开式的二项式系数的最大值为y,则有y=,由9x=5y,故有9=5,即9×=5×,即9×=5×,即9(n+1)=5(2n+1),解得n=4.
【例3】 (1)BCD (2)2.5 解析:(1)设极差为t,由题中频率分布直方图可知,组距为1,共有12组,所以t≤1×12=12,且不是一定取等号,所以A不正确;前6组频率之和为0.02+0.04+0.1+0.14+0.2+0.2=0.7,前7组频率之和为0.7+0.1=0.8,所以75%分位数应位于[8.5,9.5)内,由8.5+1×=9,可以估计75%分位数为9,所以B正确;家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64>0.5,所以C正确;由题中频率分布直方图可知,该地农户家庭年收入的平均值为3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+(12+13+14)×0.02=7.68(万元),又7.68>6.5,所以D正确.综上,选B、C、D.
(2)设样本数据x1,x2,…,x8的平均数为,则(xi-)2=2,设样本数据y1,y2,…,y8的平均数为,由yi=xi+(-1)i(i=1,2,…,8),则=,所以(yi-)2=[xi+(-1)i-]2=2+(-1)i(xi-)+1=3+(-1)ixi=3+×(-2)=2.5.
跟踪训练
1.ACD 对于A,这5天的最高气温的平均数为=24 ℃,最低气温的中位数为17 ℃,它们的差为7 ℃,A正确.对于B,这5天的最低气温的极差为6 ℃,B错误.对于C,这5天的最高气温的众数为26 ℃,C正确.对于D,最低气温从小到大排列为13 ℃,15 ℃,17 ℃,18 ℃,19 ℃,且5×0.4=2,所以这5天的最低气温的第40百分位数是16 ℃,D正确.故选A、C、D.
2.168 27 解析:易知抽取的30名学生中,男生有20名,女生有10名,则用样本估计总体的平均值为=168,估计总体的方差为s2=×[16+(170-168)2]+×[25+(164-168)2]=27.
第2讲 小题研透——概率
【锁定高考·明方向】
真题感悟
1.A 法一 如图,左圆表示爱好滑冰的学生所占比例,右圆表示爱好滑雪的学生所占比例,A表示爱好滑冰且不爱好滑雪的学生所占比例,B表示既爱好滑冰又爱好滑雪的学生所占比例,C表示爱好滑雪且不爱好滑冰的学生所占比例,则0.6+0.5-B=0.7,所以B=0.4,C=0.5-0.4=0.1.所以若该学生爱好滑雪,则他也爱好滑冰的概率为==0.8,故选A.
法二 令事件A,B分别表示该学生爱好滑冰、该学生爱好滑雪,事件C表示该学生爱好滑雪的条件下也爱好滑冰,则P(A)=0.6,P(B)=0.5,P(AB)=P(A)+P(B)-0.7=0.4,所以P(C)=P(A|B)===0.8,故选A.
2.BC 法一 依题可知,=2.1,s2=0.01,所以Y~N(2.1,0.12),故P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3>0.5,C正确,D错误;因为X~N(1.8,0.12),所以P(X>2)=P(X>1.8+2×0.1),因为P(X<1.8+0.1)≈0.841 3,所以P(X>1.8+0.1)≈1-0.841 3=0.158 7<0.2,而P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)<0.2,B正确,A错误,故选B、C.
法二 由P(Z<μ+σ)≈0.841 3,得P(μ-σ<Z<μ+σ)≈0.682 6,又Y~N(2.1,0.12),X~N(1.8,0.12),则P(X>2)=≈=0.022 8<0.5,P(Y>2)=0.5+≈0.5+0.341 3=0.841 3>0.8>0.5,故选B、C.
3.ABD 对于A,因为信号的传输是相互独立的,所以采用单次传输方案依次发送1,0,1,依次收到1,0,1的概率p=(1-β)(1-α)(1-β)=(1-α)(1-β)2,则A正确;对于B,因为信号的传输是相互独立的,所以采用三次传输方案发送1,即发送3次1,依次收到1,0,1的概率p=(1-β)·β(1-β)=β(1-β)2,则B正确;对于C,因为信号的传输是相互独立的,所以采用三次传输方案发送1,译码为1包含两种情况:2次收到1,3次都收到1.而这两种情况是互斥的,所以采用三次传输方案发送1,收到译码为1的概率p=(1-β)2β+(1-β)3=3β(1-β)2+(1-β)3,则C错误;对于D,设“采用单次传输方案发送0,译码为0”为事件B,则P(B)=1-α.设采用三次传输方案发送0,收到的信号为0的次数为X,则P(X≥2)=P(X=2)+P(X=3)=(1-α)2α+(1-α)3=(1+2α)(1-α)2.又当0<α<0.5时,P(X≥2)-P(B)=(1+2α)(1-α)2-(1-α)=α(1-α)(1-2α)>0,所以采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率,则D正确.故选A、B、D.
4. 解析:甲出1一定输,所以最多得3分,要得3分,就只有一种组合1-8,3-2,5-4,7-6.
得2分有三类,分别列举如下:
(1)出3和出5时赢,其余输:1-6,3-2,5-4,7-8;
(2)出3和出7时赢,其余输:1-4,3-2,5-8,7-6;1-8,3-2,5-6,7-4;1-6,3-2,5-8,7-4;
(3)出5和出7时赢,其余输:1-2,3-8,5-4,7-6;1-4,3-8,5-2,7-6;1-8,3-4,5-2,7-6;1-6,3-8,5-2,7-4;1-8,3-6,5-2,7-4;1-6,3-8,5-4,7-2;1-8,3-6,5-4,7-2.
共12种组合满足要求,而所有组合为4!,所以甲得分不小于2的概率为=.
【研透高考·攻重点】
【例1】 D 将5名志愿者分配到4个场馆,共有种不同的方法,其中A,B两名志愿者在同一个场馆共有种不同的方法,所以A,B两名志愿者不在同一个场馆的概率为P=1-=.故选D.
跟踪训练
1.C 设A表示事件“丙不是第一个出场,且甲最后出场”,B表示事件“丙不是第一个出场,且乙最后出场”.四人由随机抽签的方式确定出场次序,基本事件共有24个,事件A包含的基本事件有4个,故P(A)==,同理有P(B)=.由于事件A与事件B互斥,故丙不是第一个出场,且甲或乙最后出场的概率为P(A∪B)=P(A)+P(B)=.
2.D 令6个挂件分别为A,A,B,B,C,C,则将这6个挂件分为3组有5种可能:①AB,AB,CC;②AC,AC,BB;③BC,BC,AA;④AA,BB,CC;⑤AB,BC,AC.再将这分成3组的挂件分给3位同学,有3+3+3++=21(种)情况,恰好有1位同学得到同类吉祥物挂件为分组①②③,有3+3+3=9(种)情况,所以恰好有1位同学得到同类吉祥物挂件的概率是=.故选D.
【例2】 (1)A (2)BCD 解析:(1)抛掷次数为1的概率为=,点数可能为3或4,抛掷次数为2的概率为1-=,此时基本事件有(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4)共八种,其中点数之和至少为4的情况有(1,3),(1,4),(2,2),(2,3),(2,4)共五种,故抛掷骰子所得的点数之和至少为4的概率为×+×=+=.故选A.
(2)对于A,∵n(A)=60,n(D)=10,n(A∪D)=70,∴n(A∪D)=n(A)+n(D),∴A与D互斥,故A错误;对于B,∵n(A∪B)=n(A)+n(B)=n(Ω),∴A与B互为对立,故B正确;对于C,∵P(A)==,P(C)==,P(A∩C)==,∴P(A∩C)=P(A)P(C)=,∴A与C相互独立,故C正确;对于D,∵n(Ω)=100,n(A)=60,n(B)=40,n(C)=20,n(A∪B)=100,n(A∩C)=12,∴n(B∩C)=8,∴P(B∩C)==,又∵P(B)==,P(C)==,∴P(B∩C)=P(B)P(C)=,∴B与C相互独立,故D正确.故选B、C、D.
跟踪训练
1.A 由题意得,P(A)=,P(B)=,P(AB)=,∴P(AB)=P(A)P(B),∴事件A与B相互独立,则A与也相互独立,∴P(A)=P(A)P()=P(A)(1-P(B))=×=.故选A.
2.D 当n=2时,AB表示一正一反,故P(AB)=2××=,故A正确;此时P(A)=2××=,P(B)=1-P()=1-×=,P(AB)=≠=P(A)P(B),故B正确;当n=3时,A+B表示并非每次都是正面朝上,故P(A+B)=1-P()=1-××=,故C正确;此时P(AB)=3×××=,P(A)=1-P()=1-××-××=,P(B)=××+3×××=,所以P(AB)==×=P(A)P(B),故D错误.故选D.
【例3】 (1)C (2)B 解析:(1)据题意,记甲击中目标为事件A,乙击中目标为事件B,目标被击中为事件C,甲、乙同时击中目标为事件D,则P(A)=,P(B)=,所以P(C)=1-P()P()=1-(1-)×(1-)=,P(DC)=P(D)=P(AB)=P(A)P(B)=×=,则在目标被击中的情况下,甲、乙同时击中目标的概率为P(D|C)===.
(2)设A1,A2分别表示取得的这块芯片是由甲、乙线生产的,B表示取得的芯片为次品,甲线生产该芯片的次品率为p,则P(A1)==,P(A2)=,P(B|A1)=p,P(B|A2)=.由全概率公式得P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)=p+×=0.08,解得p=.故选B.
跟踪训练
1. 解析:由题意知甲选到A的概率P==.记乙选择A活动为事件M,乙选了A活动再选择B活动为事件N,则P(M)==,P(MN)==,所以P(N|M)===.
2. 解析:设A=“在甲盒中拿到红球”,B=“在乙盒中拿到红球”.因为甲盒中有3个红球,2个黄球,所以P(A)=,P()=1-=,又乙盒中有2个红球,1个黄球,所以P(B|A)=,P(B|)=,所以P(B)=P(AB)+P(B)=P(A)P(B|A)+P()P(B|)=×+×=.
【例4】 D 因为正态密度函数为f(x)=,所以E(X)=90,所以正态曲线关于直线x=90对称,所以P(X<70)=P(X>110),又P(70≤X≤110)=0.8,所以P(X>110)==0.1,又共有50 000名学生参加这次考试,所以该市这次考试数学成绩超过110分的学生人数约为50 000×0.1=5 000,故选D.
跟踪训练
1.D 随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,所以P(1.5≤X<2)=0.36,P(X<1.5)=(1-0.36×2)=0.14,所以P(X>1.5)=1-0.14=0.86,故选D.
2.0.01(答案不唯一,小于等于0.02的正数即可) 解析:依题意可得μ=80,要使次品率不高于0.27%,则正品率不低于99.73%,又根据正态曲线的特征知,|ξ-80|<3σ,所以ξ∈(80-3σ,80+3σ) (79.94,80.06),所以解得σ≤0.02,故σ的一个值可以为0.01.
第3讲 大题专攻——随机变量及其分布
【锁定高考·明方向】
真题感悟
1.解:X的所有可能取值为0,1,2,
且P(X=k)=,k=0,1,2,
所以X的分布列为
X 0 1 2
P
X的数学期望E(X)=0×+1×+2×=1.
2.解:(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
所以比赛成绩不少于5分的概率P=(1-0.63)(1-0.53)=0.686.
(2)若甲参加第一阶段比赛,则甲、乙所在队的比赛成绩X的所有可能取值为0,5,10,15.
P(X=0)=(1-p)3+[1-(1-p)3]·(1-q)3,
P(X=5)=[1-(1-p)3]··q·(1-q)2,
P(X=10)=[1-(1-p)3]··q2·(1-q),
P(X=15)=[1-(1-p)3]·q3,
所以E(X)=[1-(1-p)3]·[15q(1-q)2+30q2·(1-q)+15q3]=[1-(1-p)3]·15q=15pq·(p2-3p+3).
若乙参加第一阶段比赛,则甲、乙所在队的比赛成绩Y的所有可能取值为0,5,10,15.
同理,可得E(Y)=15pq(q2-3q+3).
E(X)-E(Y)=15pq(p2-3p-q2+3q)=15pq(q-p)(3-p-q),
由0<p<q≤1,
得q-p>0,3-p-q=3-(p+q)>0,
所以E(X)-E(Y)>0,即E(X)>E(Y).
故应该由甲参加第一阶段比赛.
【研透高考·攻重点】
【例1】 解:(1)设一轮摸球游戏结束时摸球次数不超过3次为事件A,记第i次(i=1,2,3)摸到红球为事件Bi,
则事件A=∪B1∪B1B2,
显然,B1,B1B2彼此互斥,
由互斥事件概率的加法公式:P(A)=P(∪B1∪B1B2)=P()+P(B1)+P(B1B2),
因为每次摸到红球后放回,所以P(Bi)=,P()=,
所以P(A)=+×+××=.
(2)依题意,X的可能取值为2,3,4,5,
P(X=2)=P()=,
P(X=3)=P(B1)=×=,
P(X=4)=P(B1B2)+P(B1B2B3B4)=××+()4=,
P(X=5)=P(B1B2B3)=()3×=,
所以一轮摸球游戏结束时,此人总得分X的分布列为
X 2 3 4 5
P
E(X)=2×+3×+4×+5×=.
跟踪训练
解:(1)记抛掷骰子的样本点为(a,b),则样本空间Ω={(a,b)|1≤a≤6,1≤b≤6,a∈N*,b∈N*},
则n(Ω)=36,
记事件A=“X>0”,记事件B=“X=[]=”,
则A={(a,b)|1≤a≤b≤6,a∈N*,b∈N*,且[]>0},则n(A)=21.
又AB={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,2),(2,4),(2,6),(3,3),(3,6),(4,4),(5,5),(6,6)},
则n(AB)=14,
所以P(B|A)===,
即在X>0的条件下,X=的概率为.
(2)X的所有可能取值为0,1,2,3,4,5,6.
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)=,P(X=5)=,P(X=6)=,
所以X的分布列为:
X 0 1 2 3 4 5 6
P
所以E(X)=0×+1×+2×+3×+4×+5×+6×=.
【例2】 解:(1)记“从10所学校中随机选取的3所学校参与‘自由式滑雪’都超过40人”为事件A,
参与“自由式滑雪”的人数超过40的学校共4所,
从中随机选择3所学校的选法共=4(种),
所以P(A)===.
(2)参与“单板滑雪”人数在45以上的学校共4所,
所以X的所有可能取值为0,1,2,3,
则P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===,
所以X的分布列如下表:
X 0 1 2 3
P
所以E(X)=+2×+3×=.
(3)记“小明同学在一轮测试中要想获得优秀”为事件B,
则P(B)=( )2×+( )3=,
由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布B( n,),
由题意得n≥5,得n≥,
因为n∈N*,所以n的最小值为20,
故至少要进行20轮测试.
跟踪训练
解:(1)由题意可知:每次抛掷骰子上两级台阶的概率为=,上三级台阶的概率为=,
且X的可能取值为6,7,8,9,可得(X-6)~B(3,),则有:
P(X=6)=()3=,
P(X=7)=××()2=,
P(X=8)=×()2×=,
P(X=9)=()3=,
所以X的分布列为
X 6 7 8 9
P
因为E(X-6)=3×=1,所以E(X)=7.
(2)因为位于第10级台阶则认定游戏失败,无法获得奖品,
结合题意可知:若学生位于第10级台阶,则抛掷3次后,学生位于第7级台阶,抛掷第4次上三级台阶,
可知不能获得奖品的概率为P1=××()2×=,
所以甲、乙两位学生参加游戏,恰有一人获得奖品的概率P=××(1-)=.
【例3】 解:(1)记“从第1组抽取的20株鸡冠花样本中随机抽取2株,至少有1株鸡冠花的株高增量在(7,10]内”为事件A,所以P(A)==.
(2)记“从第i(i=1,2,3)组的鸡冠花中各随机抽取1株,这株鸡冠花的株高增量在(7,10]内”为事件Bi,
由题意可知:P(B1)=,P(B2)=,P(B3)=,
X的可能取值有0,1,2,3,则有:
P(X=0)=(1-)×(1-)×(1-)=,
P(X=1)=×(1-)×(1-)+(1-)××(1-)+(1-)×(1-)×=,
P(X=2)=××(1-)+×(1-)×+(1-)××=,
P(X=3)=××=.
所以X的分布列为
X 0 1 2 3
P
X的期望E(X)=0×+1×+2×+3×=.
(3)由题意可知:ζ1,ζ2,ζ3均服从两点分布,则有:
ζ1的分布列为:
ζ1 0 1
P
可得ζ1的方差D(ζ1)=×=;
ζ2的分布列为:
ζ2 0 1
P
可得ζ2的方差D(ζ2)=×=;
ζ3的分布列为:
ζ3 0 1
P
可得ζ3的方差D(ζ3)=×=;
因为>>,所以D(ζ2)>D(ζ3)>D(ζ1).
跟踪训练
解:(1)设ζ表示1条灯带在安全使用寿命内更换的灯珠数量,
则P(ζ=5)=P(ζ=7)=P(ζ=8)=0.2,P(ζ=6)=0.4,
X的取值范围是{10,11,12,13,14,15,16},
P(X=10)=0.2×0.2=0.04,
P(X=11)=2×0.2×0.4=0.16,
P(X=12)=0.42+2×0.2×0.2=0.24,
P(X=13)=2×(0.2×0.2+0.2×0.4)=0.24,
P(X=14)=0.22+2×0.4×0.2=0.2,
P(X=15)=2×0.2×0.2=0.08,
P(X=16)=0.2×0.2=0.04,
X的分布列为
X 10 11 12 13 14 15 16
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
(2)由(1)可知P(X≥12)=0.8,
P(X≥13)=0.56,
故n0=13.
(3)由(2)可知n0-1=12,
在灯带安全使用寿命期内,当n=12时,设购买替换灯珠所需总费用为u元,当n=13时,设购买替换灯珠所需总费用为v元,则
E(u)=24+0.24×4+0.2×8+0.08×12+0.04×16=28.16,
E(v)=26+0.2×4+0.08×8+0.04×12=27.92,
E(v)<E(u),
故以购买替换灯珠所需总费用的期望值为依据,n=n0比n=n0-1的方案更优.
第4讲 大题专攻——成对数据的统计分析
【锁定高考·明方向】
真题感悟
1.解:(1)填写如下列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
则完整的2×2列联表如下:
优级品 非优级品 总计
甲车间 26 24 50
乙车间 70 30 100
总计 96 54 150
K2==4.687 5.
因为K2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;
因为K2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知==0.64,
又p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
所以>p+1.65,
所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
2.解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,
估计该林区这种树木平均一棵的材积量===0.39.
(2)(xi-)(yi-)=xiyi-10=0.013 4,
(xi-)2=-10()2=0.002,
(yi-)2=-10()2=0.094 8,
所以==≈0.01×1.377=0.013 77,
所以样本相关系数r=
≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,
所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.
【研透高考·攻重点】
【例1】 解:(1)由已知可得,==3,
==5.1,
由题可列下表:
xi- -2 -1 0 1 2
yi- 1.3 0.4 -0.1 -0.3 -1.3
(xi-)(yi-)=-5.9,=,=,
r==≈≈-0.98.
(2)由问题(1)知,y与x的样本相关系数r≈-0.98,|r|接近1,所以y与x之间具有极强的线性相关关系,可用一元线性回归模型进行描述.
由问题(1)知,===-0.59,
=-=5.1-(-0.59)×3=6.87,
所求经验回归方程为=-0.59x+6.87.
(3)令x=9,则=-0.59×9+6.87=1.56,预测2028年的酸雨区面积占国土面积的百分比为1.56%.
跟踪训练
解:(1)=,=,
===5,
∴=-=-5×=2,
∴=5ln x+2.
(2)设投入食品淀粉的资金为x万元,投入药用淀粉的资金为(200-x)万元,年收益为f(x),
∴f(x)=5ln x+2+(200-x)=5ln x-x+22,
f'(x)=-=0 x=50,
当0<x<50时,f'(x)>0,f(x)单调递增;当50<x<200时,f'(x)<0,f(x)单调递减.
∴f(x)max=f(50)=5ln 50-5+22=5(2ln 5+ln 2)+17≈36.5.
【例2】 解:(1)强化训练后的平均成绩约为
55×0.04+65×0.16+75×0.2+85×0.32+95×0.28=81.4.
由于前三列概率之和为0.04+0.16+0.2=0.4,
设中位数为80+x,则0.032x=0.1,
解得x=3.125,所以中位数约为83.13.
(2)零假设为H0:跳水运动员是否优秀与强化训练无关.
补充完整的表格为
强化训练 是否优秀 合计
优秀人数 非优秀人数
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2==8>7.879=x0.005,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为跳水运动员是否优秀与强化训练有关.
跟踪训练
解:(1)由表中数据可得,选择A餐厅的概率为=,选择B餐厅的概率为=,
设事件A1:甲、乙两名同学去A餐厅用餐,
事件B1:甲、乙两名同学去B餐厅用餐,
事件A:甲、乙两名同学选择同一套餐用餐,
P(A1)=()2,P(B1)=()2,P(A|A1)=,P(A|B1)=,
则P(A)=P(A1)P(A|A1)+P(B1)·P(A|B1)=()2×+()2×=,
故甲、乙两名同学选择同一套餐的概率为.
(2)根据数据可得列联表:
餐厅 性别 合计
男 女
在A餐厅用餐 40 20 60
在B餐厅用餐 15 25 40
合计 55 45 100
零假设为H0:认为性别与选择餐厅之间无关,
根据列联表中的数据,经计算得到χ2=≈8.249>7.879=x0.005,
依据小概率值α=0.005的独立性检验,可以推断H0不成立,即性别与选择餐厅之间有关,此推断犯错误的概率不大于0.005.
培优点1 体育比赛与闯关
【例1】 解:(1)记事件A=“甲班在项目A中获胜”,则P(A)=××+×( )2××+×( )2×( )2×=,
所以甲班在项目A中获胜的概率为.
(2)记事件B=“甲班在项目B中获胜”,
则P(B)=( )3+×( )4+×( )5=.
X的可能取值为0,1,2,
则P(X=0)=P()=P()P()=×=,
P(X=2)=P(AB)=P(A)P(B)=×=,
P(X=1)=1-P(X=0)-P(X=2)=.
所以X的分布列为
X 0 1 2
P
故E(X)=0×+1×+2×=.所以甲班获胜的项目个数的数学期望为.
跟踪训练
解析:根据题意,设甲获胜为事件A,比赛进行两局为事件B,P(A)=×+×××=,P(AB)=××=,故P(B|A)====.
【例2】 解:(1)甲连胜四场的概率为.
(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.
比赛四场结束,共有三种情况:
甲连胜四场的概率为;
乙连胜四场的概率为;
丙上场后连胜三场的概率为.
所以需要进行第五场比赛的概率为1---=.
(3)丙最终获胜,有两种情况:
比赛四场结束且丙最终获胜的概率为;
比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为,,.
因此丙最终获胜的概率为+++=.
跟踪训练
解析:比赛进行四局结束有以下两种情况:第一局甲获胜,后三局丙连胜;第一局乙获胜,后三局丙连胜,第一局甲获胜,后三局丙连胜的概率P1=×××=,第一局乙获胜,后三局丙连胜的概率P2=×××=,故比赛进行四局结束的概率P=P1+P2=+=.
【例3】 解:(1)甲以11∶9赢得比赛,共计20次发球,在后4次发球中,需甲在最后一次获胜,最终甲以11∶9赢得比赛的概率为P=×( )2×( )2+( )2××=.
(2)设甲累计得分为随机变量X,X的可能取值为0,1,2,3.
P(X=0)=( )2×=,
P(X=1)=×( )2×+( )2×=,
P(X=2)=×( )2×+( )2×=,
P(X=3)=( )2×=,
所以随机变量X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=.
跟踪训练
D 三队中选一队与丙比赛,丙输,×,例如是丙甲,若丙与乙、丁的两场比赛一赢一平,则丙只得4分,这时,甲乙、甲丁两场比赛中甲只能输,否则甲的分数不小于4分,不合题意,在甲输的情况下,乙、丁已有3分,那么它们之间的比赛无论什么情况,乙、丁中有一队得分不小于4分,不合题意.若丙全赢( 概率是( )2)时,丙得6分,其他3队分数最高为5分,这时甲乙,甲丁两场比赛中甲不能赢,否则甲的分数不小于6分,(1)若甲乙,甲丁两场比赛中甲一平一输,则一平一输的概率是( )2,如平乙,输丁,则乙丁比赛时,丁不能赢,概率是;(2)若甲乙,甲丁两场比赛中甲两场均平,概率是( )2,乙丁这场比赛无论结果如何均符合题意;(3)若甲乙,甲丁两场比赛中甲都输,概率是( )2,乙丁这场比赛只能平,概率是.综上,概率为××( )2×[×( )2×+( )2+( )2×]=,D正确.故选D.
培优点2 概率与统计中的创新问题
【例1】 解:(1)K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:R=
=,
由题意知,证明=即可,
左边=
=,
右边=
=.
左边=右边,故R=·.
②由调查数据可知P(A|B)==,P(A|)==,
且P(|B)=1-P(A|B)=,P(|)=1-P(A|)=,
所以R=×=6.
跟踪训练
解:(1)依题意,X1服从超几何分布,故X1的分布列为P(X1=k)=,k∈N,0≤k≤100.
X1 0 1 … 99 100
P …
(2)①证明:由题可知Xi(i=1,2,…,20)均服从完全相同的超几何分布,所以E(X1)=E(X2)=…=E(X20),E()=E( Xi)=E( Xi)=E(Xi)=×20E(X1)=E(X1),
D()=D( Xi)=D( Xi)=D(Xi)=×20D(X1)=D(X1).
故E()=E(X1),D()=D(X1).
②由①可知的均值E()=E(X1)=.
由公式得X1的方差D(X1)=,
所以D()=.
依题意有
解得N=1 456,M=624,
所以可以估计M=624,N=1 456.
【例2】 解:(1)依题意,X~B( 5,),则P(X=0)=( )5=,P(X=1)=( )4( )=,
P(X=2)=( )3( )2==,
P(X=3)=( )2( )3=,
P(X=4)=( )( )4=,
P(X=5)=( )5=,
故X的分布列为:
X 0 1 2 3 4 5
P
故E(X)=5×=.
(2)设事件“Y=n”表示前n-1次试验只成功了1次,且第n次试验成功,
故P(Y=n)=××( )n-2×=×( )n-2,
当n为偶数时,
P(AB)=P(2)+P(4)+…+P(n)=[1·( )0+3·( )2+…+(n-1)·( )n-2],
令Sn=1·( )0+3·( )2+…+(n-1)·( )n-2,
则Sn=1·( )2+3·( )4+…+(n-1)·( )n,
两式相减得:Sn=1+2[( )2+( )4+…+( )n-2]-(n-1)·( )n,
则Sn=-( )n·( +n),
即P(AB)=-( +n)·( )n.
当n为奇数时,同理可得
P(AB)=P(2)+P(4)+…+P(n-1)=[1·( )0+3·( )2+…+(n-2)·( )n-3]
=-( n+)·( )n-1,
综上,P(AB)=
【例3】 解:(1)∵10×(0.012+0.026+0.032+a+0.01)=1,∴a=0.02.
样本平均数的估计值为50×0.12+60×0.26+70×0.32+80×0.2+90×0.1=69.
(2)∵μ=69,σ=10.5.
∴P(X≥90)=P(X≥μ+2σ)≈=0.022 75.
∴能参加复试的人数约为40 000×0.022 75=910.
(3)由题意有x2y=.
答对两道题的概率P=x2(1-y)+x(1-x)y=x2+2xy-3x2y.
而x2y=,∴P=x2+-.
令f(x)=x2+-(0<x≤1),
则f'(x)=2x-=,
∴当x∈( 0,)时,f'(x)<0,f(x)在( 0,)内单调递减;
当x∈( ,1]时,f'(x)>0,f(x)在( ,1]内单调递增.
∴当x=时,f(x)min=.故概率P的最小值为.
跟踪训练
解:(1)由题意知,X的可能取值为0,1,2,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X 0 1 2
P
则E(X)=0×+1×+2×=.
记事件A:小王已经答对一题,事件B:小王未进入决赛,
则小王在已经答对一题的前提下,仍未进入决赛的概率
P(B|A)====.
(2)①由题意知,f(p)=p(1-p)2
=3p3-6p2+3p( 0<p<),
则f'(p)=3(3p-1)(p-1),
令f'(p)=0,解得p=或p=1(舍),
当p∈( 0,)时,f'(p)>0,当p∈( ,)时,f'(p)<0,
所以f(p)在区间( 0,)内单调递增,在区间( ,)内单调递减,
所以当p=时,f(p)有极大值,且f(p)的极大值为f( )=.
②由题可设每名进入决赛的大学生获得的奖金为随机变量Y,
则Y的可能取值为60,120,180,360,
P(Y=60)=(1-p)3,
P(Y=120)=p(1-p)2,
P(Y=180)=p2(1-p),
P(Y=360)=p3,
所以E(Y)=60(1-p)3+120p(1-p)2+180p2(1-p)+360p3=60(2p3+3p+1),
所以9E(Y)≥1 120,
即540(2p3+3p+1)≥1 120,
整理得2p3+3p-≥0,
经观察可知p=是方程2p3+3p-=0的根,
故2p3+3p-=2( p3-p2)+( p2-p)+( p-)=( p-)( 2p2+p+),
因为2p2+p+>0恒成立,
所以由2p3+3p-≥0可得p-≥0,解得p≥,
又0<p<,所以p的取值范围为[,).
【例4】 解:(1)①二维离散型随机变量(ξ,η)的所有可能取值为(0,0),(0,1),(0,2),(0,3),(1,0),(1,1),(1,2),(2,0),(2,1),(3,0).
②由题意得0≤m+n≤3,
P(ξ=m,η=n)=P(ξ=m|η=n)·P(η=n),
因为P(η=n)=( )n( )3-n.
P(ξ=m|η=n)=( )m·( )3-n-m=( )3-n,
所以P(ξ=m,η=n)=( )3-n·( )n·( )3-n==·.
(2)证明:由定义及全概率公式知:
P(ξ=ai)=P{(ξ=ai)∩[(η=b1)∪(η=b2)∪…∪(η=bj)∪…]}
=P{[(ξ=ai)∩(η=b1)]∪[(ξ=ai)∩(η=b2)]∪…∪[(ξ=ai)∩(η=bj)]∪…}
=P[(ξ=ai)∩(η=b1)]+P[(ξ=ai)∩(η=b2)]+…+P[(ξ=ai)∩(η=bj)]+…
=P[(ξ=ai)∩(η=bj)]=P(ξ=ai,η=bj)
=Pij.
跟踪训练
解:(1)因为X~B( 3,),所以xk=P(X=k)=( )k( )3-k=(k=0,1,2,3),
因为Y~B( 3,),所以yk=P(Y=k)=( )k·( )3-k=(k=0,1,2,3),
所以==23-2k(k=0,1,2,3),
所以D(X||Y)=xkln=××ln 23+××ln 2+××ln 2-1+××ln 2-3=ln 2.
(2)因为xk=P(X=k)=pk(1-p)2-k(k=0,1,2),
y0=P(Y=0)=,y1=P(Y=1)=,y2=P(Y=2)=,
所以D(X||Y)=xkln
=x0ln+x1ln+x2ln
=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2).
令f(p)=(1-p)2ln[6(1-p)2]+2p(1-p)ln[3p(1-p)]+p2ln(6p2),
则f'(p)=-2(1-p)ln[6(1-p)2]-2(1-p)+(2-4p)ln[3p(1-p)]+2-4p+2pln(6p2)+2p
=(-2+4p)ln 6-2ln(1-p)+2ln p+(2-4p)ln 3
=2ln p-2ln(1-p)+(4p-2)ln 2,
令g(p)=2ln p-2ln(1-p)+(4p-2)ln 2,
则g'(p)=++4ln 2,
因为0<p<1,所以g'(p)>0,故g(p)在(0,1)上单调递增,
又g( )=0,所以当0<p<时,g(p)<0,即f'(p)<0,当<p<1时,g(p)>0,即f'(p)>0,
所以f(p)在( 0,)上单调递减,在( ,1)上单调递增,
所以f(p)min=f( )=ln.
(3)证明:令φ(x)=ln x-x+1,则φ'(x)=-1=.易得当x∈(0,1)时,φ'(x)>0,当x∈(1,+∞)时,φ'(x)<0,故φ(x)在(0,1)上单调递增,在(1,+∞)上单调递减,
所以 x∈(0,+∞),φ(x)≤φ(1)=0,
所以ln x≤x-1,所以ln≤-1,
所以ln x≥1-,
所以D(X||Y)=xkln≥xk( 1-)
=(xk-yk)=xk-yk=1-1=0,
即D(X||Y)的值不可能为负.
1 / 3第3讲 大题专攻——随机变量及其分布
备|考|领|航
一、考情分析
高频考点 高考预测
离散型随机变量的期望与方差 离散型随机变量的分布列、均值、方差和概率的计算问题常常结合在一起进行考查,重点考查超几何分布、二项分布及正态分布,以解答题为主,难度中等
二项分布与超几何分布
现实生活情境中的决策问题
二、真题感悟
1.(2023·全国甲卷理19题节选)(超几何分布概率模型的应用)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望.
解:X的所有可能取值为0,1,2,
且P(X=k)=,k=0,1,2,
所以X的分布列为
X 0 1 2
P
X的数学期望E(X)=0×+1×+2×=1.
2.(2024·新高考Ⅱ卷18题节选)(相互独立事件的概率、离散型随机变量的期望)某投篮比赛分为两个阶段,每个参赛队由两名队员组成.比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中1次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分,该队的比赛成绩为第二阶段的得分总和.
某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若p=0.4,q=0.5,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率;
(2)假设0<p<q,为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
解:(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
所以比赛成绩不少于5分的概率P=(1-0.63)·(1-0.53)=0.686.
(2)若甲参加第一阶段比赛,则甲、乙所在队的比赛成绩X的所有可能取值为0,5,10,15.
P(X=0)=(1-p)3+[1-(1-p)3]·(1-q)3,
P(X=5)=[1-(1-p)3]··q·(1-q)2,
P(X=10)=[1-(1-p)3]··q2·(1-q),
P(X=15)=[1-(1-p)3]·q3,
所以E(X)=[1-(1-p)3]·[15q(1-q)2+30q2·(1-q)+15q3]=[1-(1-p)3]·15q=15pq·(p2-3p+3).
若乙参加第一阶段比赛,则甲、乙所在队的比赛成绩Y的所有可能取值为0,5,10,15.
同理,可得E(Y)=15pq(q2-3q+3).
E(X)-E(Y)=15pq(p2-3p-q2+3q)
=15pq(q-p)(3-p-q),
由0<p<q≤1,
得q-p>0,3-p-q=3-(p+q)>0,
所以E(X)-E(Y)>0,即E(X)>E(Y).
故应该由甲参加第一阶段比赛.
重|难|排|查
1.离散型随机变量的期望与方差
(1)期望:E(X)=x1p1+x2p2+…+xnpn;
(2)方差:D(X)=(xi-E(X))2pi,标准差为;
(3)期望与方差的性质
E(aX+b)=aE(X)+b(a,b为常数),
D(aX+b)=a2D(X)(a,b为常数),
若X~B(n,p),则E(X)=np,D(X)=np(1-p).
2.二项分布概率模型的特征
(1)在每一次试验中,试验结果只有两个,即发生与不发生;
(2)各次试验中的事件是相互独立的;
(3)在每一次试验中,事件发生的概率与不发生的概率都保持不变.
3.超几何分布概率模型的特征
(1)实际问题所描述的事件只包含两个结果(发生与不发生),每进行一次上述抽取都不是原来的重复(再次抽取时,都与上次条件发生了变化);
(2)每次抽取中同一事件发生的概率都不同;
(3)实际问题中随机变量为抽到某类个体的个数;
(4)该问题属于不放回抽取问题.
易错提醒 涉及求分布列时,要注意区分是二项分布还是超几何分布.
离散型随机变量的期望与方差
【例1】 (2024·济宁一模)袋中装有大小相同的4个红球,2个白球.某人进行摸球游戏,一轮摸球游戏规则如下:①每次从袋中摸取一个小球,若摸到红球则放回袋中,充分搅拌后再进行下一次摸取;②若摸到白球或摸球次数达到4次时本轮摸球游戏结束.
(1)求一轮摸球游戏结束时摸球次数不超过3次的概率;
(2)若摸出1次红球计1分,摸出1次白球记2分,求一轮游戏结束时,此人总得分X的分布列和数学期望.
解:(1)设一轮摸球游戏结束时摸球次数不超过3次为事件A,记第i次(i=1,2,3)摸到红球为事件Bi,
则事件A=∪B1∪B1B2,
显然,B1,B1B2彼此互斥,
由互斥事件概率的加法公式:P(A)=P(∪B1∪B1B2)=P()+P(B1)+P(B1B2),
因为每次摸到红球后放回,所以P(Bi)=,P()=,
所以P(A)=+×+××=.
(2)依题意,X的可能取值为2,3,4,5,
P(X=2)=P()=,
P(X=3)=P(B1)=×=,
P(X=4)=P(B1B2)+P(B1B2B3B4)=××+()4=,
P(X=5)=P(B1B2B3)=()3×=,
所以一轮摸球游戏结束时,此人总得分X的分布列为
X 2 3 4 5
P
E(X)=2×+3×+4×+5×=.
感悟提升
求随机变量X的均值与方差的方法及步骤
(1)理解随机变量X的意义,写出X可能的全部取值;
(2)求X取每个值时对应的概率,写出随机变量X的分布列;
(3)由均值和方差的计算公式,求得均值E(X),方差D(X).
(2024·济南高三模拟考试)抛掷甲、乙两枚质地均匀的骰子,所得的点数分别为a,b,记[]的取值为随机变量X,其中[]表示不超过的最大整数.
(1)求在X>0的条件下,X=的概率;
(2)求X的分布列及其数学期望.
解:(1)记抛掷骰子的样本点为(a,b),则样本空间Ω={(a,b)|1≤a≤6,1≤b≤6,a∈N*,b∈N*},
则n(Ω)=36,
记事件A=“X>0”,记事件B=“X=[]=”,
则A={(a,b)|1≤a≤b≤6,a∈N*,b∈N*,且[]>0},则n(A)=21.
又AB={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,2),(2,4),(2,6),(3,3),(3,6),(4,4),(5,5),(6,6)},
则n(AB)=14,
所以P(B|A)===,
即在X>0的条件下,X=的概率为.
(2)X的所有可能取值为0,1,2,3,4,5,6.
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)=,P(X=5)=,P(X=6)=,
所以X的分布列为:
X 0 1 2 3 4 5 6
P
所以E(X)=0×+1×+2×+3×+4×+5×+6×=.
二项分布与超几何分布
【例2】 某地为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了10所学校进行研究,得到如下数据:
(1)在这10所学校中随机选取3所来调查研究,求这3所学校参与“自由式滑雪”都超过40人的概率;
(2)“单板滑雪”参与人数超过45的学校可以作为“基地学校”,现在从这10所学校中随机选出3所,记X为选出可作“基地学校”的学校个数,求X的分布列和均值;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训,且在集训中进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在集训测试中,小明同学每个动作达到“优秀”的概率均为,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得“优秀”的次数的均值达到不少于5次,那么理论上至少要进行多少轮测试?
解:(1)记“从10所学校中随机选取的3所学校参与‘自由式滑雪’都超过40人”为事件A,
参与“自由式滑雪”的人数超过40的学校共4所,
从中随机选择3所学校的选法共=4(种),
所以P(A)===.
(2)参与“单板滑雪”人数在45以上的学校共4所,
所以X的所有可能取值为0,1,2,3,
则P(X=0)===,
P(X=1)===,
P(X=2)===,
P(X=3)===,
所以X的分布列如下表:
X 0 1 2 3
P
所以E(X)=+2×+3×=.
(3)记“小明同学在一轮测试中要想获得优秀”为事件B,
则P(B)=( )2×+( )3=,
由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布B( n,),
由题意得n≥5,得n≥,
因为n∈N*,所以n的最小值为20,
故至少要进行20轮测试.
感悟提升
1.二项分布的期望与方差的求解策略
(1)如果ξ ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量;
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样也可求出D(aξ+b).
2.求超几何分布的分布列的三个步骤
(1)验证随机变量服从超几何分布,并确定参数N,M,n的值;
(2)根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率;
(3)用表格的形式列出分布列.
(2024·临沂一模)某学校举办了精彩纷呈的数学文化节活动,其中有一个“掷骰子赢奖品”的登台阶游戏最受欢迎.游戏规则如下:抛掷一枚质地均匀的骰子一次,出现3的倍数,则一次上三级台阶,否则上两级台阶,再重复以上步骤,当参加游戏的学生位于第8、第9或第10级台阶时游戏结束.规定:从平地开始,结束时学生位于第8级台阶可获得一本课外读物,位于第9级台阶可获得一套智力玩具,位于第10级台阶则认定游戏失败.
(1)某学生抛掷三次骰子后,按游戏规则位于第X级台阶,求X的分布列及数学期望E(X);
(2)甲、乙两位学生参加游戏,求恰有一人获得奖品的概率.
解:(1)由题意可知:每次抛掷骰子上两级台阶的概率为=,上三级台阶的概率为=,
且X的可能取值为6,7,8,9,可得(X-6)~B(3,),则有:
P(X=6)=()3=,
P(X=7)=××()2=,
P(X=8)=×()2×=,
P(X=9)=()3=,
所以X的分布列为
X 6 7 8 9
P
因为E(X-6)=3×=1,所以E(X)=7.
(2)因为位于第10级台阶则认定游戏失败,无法获得奖品,
结合题意可知:若学生位于第10级台阶,则抛掷3次后,学生位于第7级台阶,抛掷第4次上三级台阶,
可知不能获得奖品的概率为P1=××()2×=,
所以甲、乙两位学生参加游戏,恰有一人获得奖品的概率P=××(1-)=.
现实生活情境中的决策问题
【例3】 (2024·滨州二模)某高校“植物营养学专业”学生将鸡冠花的株高增量作为研究对象,观察长效肥和缓释肥对农作物的影响情况.其中长效肥、缓释肥、未施肥三种处理下的鸡冠花分别对应第1,2,3组.观察一段时间后,分别从第1,2,3组各随机抽取20株鸡冠花作为样本,得到相应的株高增量数据整理如下表:
株高增量(单位:厘米) (4,7] (7,10] (10,13] (13,16]
第1组鸡冠花样本株数 4 10 4 2
第2组鸡冠花样本株数 3 8 8 1
第3组鸡冠花样本株数 7 5 7 1
假设用频率估计概率,且所有鸡冠花生长情况相互独立.
(1)从第1组抽取的20株鸡冠花样本中随机抽取2株,求至少有1株鸡冠花的株高增量在(7,10]内的概率;
(2)分别从第1组,第2组,第3组的鸡冠花中各随机抽取1株,记这3株鸡冠花中恰有X株的株高增量在(7,10]内,求X的分布列和数学期望E(X);
(3)用“ζk=1”表示第k组鸡冠花的株高增量在(4,10]内,“ζk=0”表示第k组鸡冠花的株高增量在(10,16]内,k=1,2,3.比较方差D(ζ1),D(ζ2),D(ζ3)的大小,并说明理由.
解:(1)记“从第1组抽取的20株鸡冠花样本中随机抽取2株,至少有1株鸡冠花的株高增量在(7,10]内”为事件A,所以P(A)==.
(2)记“从第i(i=1,2,3)组的鸡冠花中各随机抽取1株,这株鸡冠花的株高增量在(7,10]内”为事件Bi,
由题意可知:P(B1)=,P(B2)=,P(B3)=,
X的可能取值有0,1,2,3,则有:
P(X=0)=(1-)×(1-)×(1-)=,
P(X=1)=×(1-)×(1-)+(1-)××(1-)+(1-)×(1-)×=,
P(X=2)=××(1-)+×(1-)×+(1-)××=,
P(X=3)=××=.
所以X的分布列为
X 0 1 2 3
P
X的期望E(X)=0×+1×+2×+3×=.
(3)由题意可知:ζ1,ζ2,ζ3均服从两点分布,则有:
ζ1的分布列为:
ζ1 0 1
P
可得ζ1的方差D(ζ1)=×=;
ζ2的分布列为:
ζ2 0 1
P
可得ζ2的方差D(ζ2)=×=;
ζ3的分布列为:
ζ3 0 1
P
可得ζ3的方差D(ζ3)=×=;
因为>>,所以D(ζ2)>D(ζ3)>D(ζ1).
感悟提升
决策类问题的解题关注点
(1)关注均值:随机变量的均值反映了随机变量取值的平均水平;
(2)关注方差:随机变量的方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据;
(3)先后顺序:一般先比较均值,若均值相同,再用方差来决策.
灯带是生活中常见的一种装饰材料,已知某款灯带的安全使用寿命为5年,灯带上照明的灯珠为易损配件,该灯珠的零售价为4元/只,但在购买灯带时可以以零售价五折的价格购买备用灯珠.该灯带销售老板为了给某顾客节省装饰及后期维护的支出,提供了150条这款灯带在安全使用寿命内更换的灯珠数量的数据,数据如图所示.以这150条灯带在安全使用寿命内更换的灯珠数量的频率代替1条灯带更换的灯珠数量发生的概率,若该顾客买1盒此款灯带,每盒有2条灯带,记X表示这1盒灯带在安全使用寿命内更换的灯珠数量,n表示该顾客购买1盒灯带的同时购买的备用灯珠数量.
(1)求X的分布列;
(2)若满足P(X≥n)≤0.6的n的最小值为n0,求n0;
(3)在灯带安全使用寿命期内,以购买替换灯珠所需总费用的期望值为依据,比较n=n0-1与n=n0哪种方案更优.
解:(1)设ζ表示1条灯带在安全使用寿命内更换的灯珠数量,
则P(ζ=5)=P(ζ=7)=P(ζ=8)=0.2,P(ζ=6)=0.4,
X的取值范围是{10,11,12,13,14,15,16},
P(X=10)=0.2×0.2=0.04,
P(X=11)=2×0.2×0.4=0.16,
P(X=12)=0.42+2×0.2×0.2=0.24,
P(X=13)=2×(0.2×0.2+0.2×0.4)=0.24,
P(X=14)=0.22+2×0.4×0.2=0.2,
P(X=15)=2×0.2×0.2=0.08,
P(X=16)=0.2×0.2=0.04,
X的分布列为
X 10 11 12 13 14 15 16
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
(2)由(1)可知P(X≥12)=0.8,
P(X≥13)=0.56,
故n0=13.
(3)由(2)可知n0-1=12,
在灯带安全使用寿命期内,当n=12时,设购买替换灯珠所需总费用为u元,当n=13时,设购买替换灯珠所需总费用为v元,则
E(u)=24+0.24×4+0.2×8+0.08×12+0.04×16=28.16,
E(v)=26+0.2×4+0.08×8+0.04×12=27.92,
E(v)<E(u),
故以购买替换灯珠所需总费用的期望值为依据,n=n0比n=n0-1的方案更优.
1.(2024·九省联考)盒中有标有数字1,2,3,4的小球各2个,随机一次取出3个小球.
(1)求取出的3个小球上的数字两两不同的概率;
(2)记取出的3个小球上的最小数字为X,求X的分布列及数学期望E(X).
解:(1)从8个小球中,随机一次取出3个小球,
共有==56(种)结果.
先从数字1,2,3,4中选择3个数字,再从选定的数字中各取1个小球,共有=32(种)结果.
记事件A:“取出的3个小球上的数字两两不同”,
则P(A)==.
所以取出的3个小球上的数字两两不同的概率为.
(2)因为X为取出的3个小球上的最小数字,所以X的所有可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==.
故X的分布列为
X 1 2 3
P
X的数学期望E(X)=1×+2×+3×=.
2.(2024·安庆二模)树人高中拟组织学生到某航天基地开展天宫模拟飞行器体验活动,该项活动对学生身体体能指标和航天知识素养有明确要求.学校所有3 000名学生参加了遴选活动,遴选活动分以下两个环节,当两个环节均测试合格时可以参加体验活动.
第一环节:对学生身体体能指标进行测试,当测试值ζ≥12.2时体能指标合格;
第二环节:对身体体能指标符合要求的学生进行航天知识素养测试,测试方案为对A,B两类试题依次作答,均测试合格才能符合遴选要求.每类试题均在题库中随机产生,有两次测试机会,在任一类试题测试中,若第一次测试合格,不再进行第二次测试.若第一次测试不合格,则进行第二次测试,若第二次测试合格,则该类试题测试合格,若第二次测试不合格,则该类试题测试不合格,测试结束.
经过统计,该校学生身体体能指标ζ服从正态分布N(9,2.56).
参考数值:P(μ-σ<X<μ+σ)=0.682 7,P(μ-2σ<X<μ+2σ)=0.954 5,P(μ-3σ<X<μ+3σ)=0.997 3.
(1)请估计树人高中遴选学生符合身体体能指标的人数(结果取整数);
(2)学生小华通过身体体能指标遴选,进入航天知识素养测试,作答A类试题,每次测试合格的概率为,作答B类试题,每次测试合格的概率为,且每次测试相互独立.
①在解答A类试题第一次测试合格的条件下,求测试共进行3次的概率;
②若解答A,B两类试题测试合格的类数为X,求X的分布列和数学期望.
解:(1)P(ζ≥12.2)=P(ζ≥μ+2σ)==0.022 75.
所以符合该项指标的学生人数为3 000×0.022 75=68.25≈68.
(2)①记A1表示解答A类试题第一次测试合格,
B1,B2分别表示解答B类试题第一次和第二次测试合格,测试共进行3次记为事件M,
则P(A1)=,P(A1M)=P(A1B2)+P(A1)=××+××=.
P(M|A1)==
==.
②由题知,X的取值为0,1,2,
P(X=0)=×=,
P(X=1)=××+×××=,
P(X=2)=1-P(X=0)-P(X=1)=,
所以X的分布列为:
X 0 1 2
P
数学期望E(X)=0×+1×+2×=.
3.(2024·菏泽一模)某商场举行“庆元宵,猜谜语”的促销活动,抽奖规则如下:在一个不透明的盒子中装有若干个标号为1,2,3的空心小球,球内装有难度不同的谜语.每次随机抽取2个小球,答对一个小球中的谜语才能回答另一个小球中的谜语,答错则终止游戏.已知标号为1,2,3的小球个数比为1∶2∶1,且取到异号球的概率为.
(1)求盒中2号球的个数;
(2)若甲抽到1号球和3号球,甲答对球中谜语的概率和对应奖金如表所示,请帮甲决策猜谜语的顺序(猜对谜语的概率相互独立).
球号 1号球 3号球
答对概率 0.8 0.5
奖金 100 500
解:(1)由题意可设1,2,3号球的个数分别为n,2n,n,
则取到异号球的概率P==,
所以=,即n2=2n.解得n=2.
所以盒中2号球的个数为4.
(2)若甲先回答1号球再回答3号球中的谜语,
因为猜对谜语的概率相互独立,记X为甲获得的奖金总额,
则X可能的取值为0元,100元,600元,
P(X=0)=0.2,
P(X=100)=0.8×(1-0.5)=0.4,
P(X=600)=0.8×0.5=0.4.
X的分布列为
X 0 100 600
P 0.2 0.4 0.4
X的均值为E(X)=280.
若甲先回答3号球再回答1号球中的谜语,因为猜对谜语的概率相互独立,
记Y为甲获得的奖金总额,则Y可能的取值为0元,500元,600元,
P(Y=0)=0.5.
P(Y=500)=0.5×(1-0.8)=0.1,
P(Y=600)=0.5×0.8=0.4,
Y的分布列为
Y 0 500 600
P 0.5 0.1 0.4
Y的均值为E(Y)=290.
因为E(Y)>E(X),所以推荐甲先回答3号球中的谜语再回答1号球中的谜语.
4.(2024·赣州模拟)某人准备应聘甲、乙两家公司的高级工程师,两家公司应聘程序都是:应聘者先进行三项专业技能测试,专业技能测试通过后进入面试.已知该应聘者应聘甲公司,每项专业技能测试通过的概率均为,该应聘者应聘乙公司,三项专业技能测试通过的概率依次为,,m,其中0<m<1,技能测试是否通过相互独立.
(1)若m=.求该应聘者应聘乙公司三项专业技能测试恰好通过两项的概率;
(2)已知甲、乙两家公司的招聘在同一时间进行,该应聘者只能应聘其中一家,应聘者以专业技能测试通过项目数的数学期望为决策依据,若该应聘者更有可能通过乙公司的技能测试,求m的取值范围.
解:(1)记“该应聘者应聘乙公司三项专业技能测试恰好通过两项”为事件A,
由题设P(A)=×××+××()2=.
(2)设“该应聘者应聘甲、乙公司三项专业技能测试中通过的项目数分别记为ζ,η”,
由题设知:ζ~B(3,),所以E(ζ)=3×=2,
η的所有可能取值为0,1,2,3,
P(η=0)=××(1-m)=,
P(η=1)=××(1-m)+××(1-m)+××m=,
P(η=2)=××(1-m)+××m+××m=,
P(η=3)=××m==,
故η的分布列为
η 0 1 2 3
P
从而E(η)=0×+1×+2×+3×=,
由得解得<m<1,
故m的取值范围为(,1).
12 / 12