资源详情

《直通名校》专题六培优点2　概率与统计中的创新问题（学生版+教师版讲义）-高考数学大二轮专题复习

文档属性

名称	《直通名校》专题六培优点2　概率与统计中的创新问题（学生版+教师版讲义）-高考数学大二轮专题复习
格式	zip
文件大小	432.7KB
资源类型	试卷
版本资源	通用版
科目	数学
更新时间	2026-01-26 00:00:00

点击下载

文档简介

专题六　概率与统计
第1讲　小题研透——计数原理与统计初步
【锁定高考·明方向】
真题感悟
1.C　对于A，根据频数分布表可知，6＋12＋18＝36＜50，所以亩产量的中位数不小于1 050 kg，故A错误；对于B，亩产量不低于1 100 kg的频数为24＋10＝34，所以低于1 100 kg的稻田占比为＝66％，故B错误；对于C，稻田亩产量的极差最大为1 200－900＝300，最小为1 150－950＝200，故C正确；对于D，由频数分布表可得，平均值为×（6×925＋12×975＋18×1 025＋30×1 075＋24×1 125＋10×1 175）＝1 067，故D错误.故选C.
2.BD　若该组样本数据为1，2，3，4，5，8，则2，3，4，5的平均数为，1，2，3，4，5，8的平均数为，两组数据的平均数不相等，故A错误；不妨设x1≤x2≤x3≤x4≤x5≤x6，则x2，x3，x4，x5的中位数等于x1，x2，x3，x4，x5，x6的中位数，故B正确；若该组样本数据为1，2，2，2，2，8，则2，2，2，2的标准差为0，而1，2，2，2，2，8的标准差大于0，故C错误；由对选项B的分析可知，x2，x3，x4，x5的极差为x5－x2，x1，x2，x3，x4，x5，x6的极差为x6－x1，且易得x6－x1≥x5－x2，故D正确.故选B、D.
3.B　先将丙和丁捆在一起有种排列方式，然后将其与乙、戊排列，有种排列方式，最后将甲插入中间两空，有种排列方式，所以不同的排列方式共有＝24种，故选B.
4.24　112　解析：由题意知，选4个方格，每行和每列均恰有一个方格被选中，则第一列有4个方格可选，第二列有3个方格可选，第三列有2个方格可选，第四列有1个方格可选，所以共有4×3×2×1＝24种选法.
法一（列举法）　每种选法可标记为（a，b，c，d），a，b，c，d分别表示第一、二、三、四行的数字，则所有的可能结果为：（11，22，33，44），（11，22，43，34），（11，33，22，44），（11，33，43，24），（11，42，22，34），（11，42，33，24），（21，12，33，44），（21，12，43，34），（21，33，13，44），（21，33，43，15），（21，42，13，34），（21，42，33，15），（31，12，22，44），（31，12，43，24），（31，22，13，44），（31，22，43，15），（31，42，13，24），（31，42，22，15），（40，12，22，34），（40，12，33，24），（40，22，13，34），（40，22，33，15），（40，33，13，24），（40，33，22，15），比较可知，所选方格中，（21，33，43，15）的和最大，最大为112.
法二（整体分析法）　先按列分析，每列必选出一个数，故所选4个数的十位上的数字分别为1，2，3，4.再按行分析，第一、二、三、四行个位上的数字的最大值分别为1，3，3，5，故从第一行选21，从第二行选33，从第三行选43，从第4行选15，此时个位上的数字之和最大.故选中方格中的4个数之和的最大值为21＋33＋43＋15＝112.
5.5　解析：由二项式定理知（＋x）10＝x10－k.记ak＝，k＝0，1，…，10.
法一　对于k＝1，2，…，10，有＝·＝.当k≤2时，＞1；当k≥3时，＜1，因此a0＜a1＜a2，a2＞a3＞…＞a10，所以展开式各项系数中的最大值为a2＝＝5.
法二　对于k＝1，2，…，10，有ak－ak－1＝（－3）＝·（－）＝·，当k≤2时，ak－ak－1＞0；当k≥3时，ak－ak－1＜0.因此有a0＜a1＜a2，a2＞a3＞…＞a10，所以展开式各项系数中的最大值为a2＝＝5.
【研透高考·攻重点】
【例1】　（1）C　（2）D　解析：（1）根据题意，可分为两类：①当新节目插在中间的四个空隙中的一个时，有＝4×2＝8种方法；②当新节目插在中间的四个空隙中的两个时，有＝4×3＝12种方法，由分类加法计数原理得，共有8＋12＝20种不同的插法.故选C.
（2）由题意可知，先将5人分成3组，有两类分法，第一类，各组人数分别为3，1，1，共有种分法；第二类，各组人数分别为1，2，2，共有种分法.将3组人员分配到A，B，C三个乡村学校去，共有种分法，所以不同的选派方法共有（＋）＝150（种）.故选D.
跟踪训练
1.C　以A为起点时，三条路线依次连接即可到达B点.共有3×2＝6种选择，自B连接到C时，在C右侧可顺时针连接或逆时针连接，共有2种选择，∴以A为起点，C为终点时，共有6×2＝12种方法；同理可知，以C为起点，A为终点时，共有12种方法.∴完成该图“一笔画”的方法数为12＋12＝24种.
2.B　法一（排除法）　从7个点中任意取3个点共有种取法，因为B，D，E，F四点共线，其中任意三点都不能构成三角形，所以共可以构成－＝35－4＝31（个）不同三角形，故选B.
法二（分类法）　第一类：B，D，E，F四个点中一个点都不取，可构成＝1（个）三角形；第二类：从B，D，E，F四个点中取1个点，在A，C，G中取2个点，可构成＝12（个）三角形；第三类：从B，D，E，F四个点中取2个点，在A，C，G中取1个点，可构成＝18（个）三角形.共可以构成1＋12＋18＝31（个）三角形，故选B.
【例2】　（1）AC　（2）－40　解析：（1）根据二项式定理，（ 2x－）8的通项为Tk＋1＝28－k（－1）kx8－2k，常数项为24（－1）4＝1 120，故A正确；第四项的系数为28－3（－1）3＝－1 792，第六项的系数为28－5（－1）5＝－448，故B错误；因为n＝8，所以各项的二项式系数之和为28＝256，故C正确；令x＝1，各项的系数之和为1，故D错误.
（2）（x－2y）6的通项公式为Tr＋1＝x6－r（－2y）r＝（－2）rx6－ryr，令r＝2得，T3＝（－2）2x4y2＝60x4y2，此时60x4y2·2＝120x4y2，令r＝3得，T4＝（－2）3x3y3＝－160x3y3，此时－160x3y3·＝－160x4y2，故x4y2的系数为120－160＝－40.
跟踪训练
1.C　令x＝0，则15＝a0，∴a0＝1；令x＝1，则35＝a0＋a1＋a2＋a3＋a4＋a5，∴a1＋a2＋a3＋a4＋a5＝35－1＝242.故选C.
2.32　－1 080　解析：由二项式定理得（3x－y＋2z）5的展开式的通项公式为Tr＋1＝（3x－y）5－r·（2z）r，欲使得不含z，则r＝0，∴T1＝（3x－y）5，令x＝1，y＝1，则所有不含字母z的项的系数之和为25＝32；含x3yz的项是·（3x）3（－y）·2z＝－1 080x3yz，故其系数为－1 080.
3.4　解析：由（a＋b）2n的展开式的二项式系数的最大值为x，则有x＝，由（a＋b）2n＋1的展开式的二项式系数的最大值为y，则有y＝，由9x＝5y，故有9＝5，即9×＝5×，即9×＝5×，即9（n＋1）＝5（2n＋1），解得n＝4.
【例3】　（1）BCD　（2）2.5　解析：（1）设极差为t，由题中频率分布直方图可知，组距为1，共有12组，所以t≤1×12＝12，且不是一定取等号，所以A不正确；前6组频率之和为0.02＋0.04＋0.1＋0.14＋0.2＋0.2＝0.7，前7组频率之和为0.7＋0.1＝0.8，所以75％分位数应位于[8.5，9.5）内，由8.5＋1×＝9，可以估计75％分位数为9，所以B正确；家庭年收入介于4.5万元至8.5万元之间的频率为0.1＋0.14＋0.2＋0.2＝0.64＞0.5，所以C正确；由题中频率分布直方图可知，该地农户家庭年收入的平均值为3×0.02＋4×0.04＋5×0.1＋6×0.14＋7×0.2＋8×0.2＋9×0.1＋10×0.1＋11×0.04＋（12＋13＋14）×0.02＝7.68（万元），又7.68＞6.5，所以D正确.综上，选B、C、D.
（2）设样本数据x1，x2，…，x8的平均数为，则（xi－）2＝2，设样本数据y1，y2，…，y8的平均数为，由yi＝xi＋（－1）i（i＝1，2，…，8），则＝，所以（yi－）2＝[xi＋（－1）i－]2＝2＋（－1）i（xi－）＋1＝3＋（－1）ixi＝3＋×（－2）＝2.5.
跟踪训练
1.ACD　对于A，这5天的最高气温的平均数为＝24 ℃，最低气温的中位数为17 ℃，它们的差为7 ℃，A正确.对于B，这5天的最低气温的极差为6 ℃，B错误.对于C，这5天的最高气温的众数为26 ℃，C正确.对于D，最低气温从小到大排列为13 ℃，15 ℃，17 ℃，18 ℃，19 ℃，且5×0.4＝2，所以这5天的最低气温的第40百分位数是16 ℃，D正确.故选A、C、D.
2.168　27　解析：易知抽取的30名学生中，男生有20名，女生有10名，则用样本估计总体的平均值为＝168，估计总体的方差为s2＝×[16＋（170－168）2]＋×[25＋（164－168）2]＝27.
第2讲　小题研透——概率
【锁定高考·明方向】
真题感悟
1.A　法一　如图，左圆表示爱好滑冰的学生所占比例，右圆表示爱好滑雪的学生所占比例，A表示爱好滑冰且不爱好滑雪的学生所占比例，B表示既爱好滑冰又爱好滑雪的学生所占比例，C表示爱好滑雪且不爱好滑冰的学生所占比例，则0.6＋0.5－B＝0.7，所以B＝0.4，C＝0.5－0.4＝0.1.所以若该学生爱好滑雪，则他也爱好滑冰的概率为＝＝0.8，故选A.
法二　令事件A，B分别表示该学生爱好滑冰、该学生爱好滑雪，事件C表示该学生爱好滑雪的条件下也爱好滑冰，则P（A）＝0.6，P（B）＝0.5，P（AB）＝P（A）＋P（B）－0.7＝0.4，所以P（C）＝P（A｜B）＝＝＝0.8，故选A.
2.BC　法一　依题可知，＝2.1，s2＝0.01，所以Y～N（2.1，0.12），故P（Y＞2）＝P（Y＞2.1－0.1）＝P（Y＜2.1＋0.1）≈0.841 3＞0.5，C正确，D错误；因为X～N（1.8，0.12），所以P（X＞2）＝P（X＞1.8＋2×0.1），因为P（X＜1.8＋0.1）≈0.841 3，所以P（X＞1.8＋0.1）≈1－0.841 3＝0.158 7＜0.2，而P（X＞2）＝P（X＞1.8＋2×0.1）＜P（X＞1.8＋0.1）＜0.2，B正确，A错误，故选B、C.
法二　由P（Z＜μ＋σ）≈0.841 3，得P（μ－σ＜Z＜μ＋σ）≈0.682 6，又Y～N（2.1，0.12），X～N（1.8，0.12），则P（X＞2）＝≈＝0.022 8＜0.5，P（Y＞2）＝0.5＋≈0.5＋0.341 3＝0.841 3＞0.8＞0.5，故选B、C.
3.ABD　对于A，因为信号的传输是相互独立的，所以采用单次传输方案依次发送1，0，1，依次收到1，0，1的概率p＝（1－β）（1－α）（1－β）＝（1－α）（1－β）2，则A正确；对于B，因为信号的传输是相互独立的，所以采用三次传输方案发送1，即发送3次1，依次收到1，0，1的概率p＝（1－β）·β（1－β）＝β（1－β）2，则B正确；对于C，因为信号的传输是相互独立的，所以采用三次传输方案发送1，译码为1包含两种情况：2次收到1，3次都收到1.而这两种情况是互斥的，所以采用三次传输方案发送1，收到译码为1的概率p＝（1－β）2β＋（1－β）3＝3β（1－β）2＋（1－β）3，则C错误；对于D，设“采用单次传输方案发送0，译码为0”为事件B，则P（B）＝1－α.设采用三次传输方案发送0，收到的信号为0的次数为X，则P（X≥2）＝P（X＝2）＋P（X＝3）＝（1－α）2α＋（1－α）3＝（1＋2α）（1－α）2.又当0＜α＜0.5时，P（X≥2）－P（B）＝（1＋2α）（1－α）2－（1－α）＝α（1－α）（1－2α）＞0，所以采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率，则D正确.故选A、B、D.
4.　解析：甲出1一定输，所以最多得3分，要得3分，就只有一种组合1－8，3－2，5－4，7－6.
得2分有三类，分别列举如下：
（1）出3和出5时赢，其余输：1－6，3－2，5－4，7－8；
（2）出3和出7时赢，其余输：1－4，3－2，5－8，7－6；1－8，3－2，5－6，7－4；1－6，3－2，5－8，7－4；
（3）出5和出7时赢，其余输：1－2，3－8，5－4，7－6；1－4，3－8，5－2，7－6；1－8，3－4，5－2，7－6；1－6，3－8，5－2，7－4；1－8，3－6，5－2，7－4；1－6，3－8，5－4，7－2；1－8，3－6，5－4，7－2.
共12种组合满足要求，而所有组合为4！，所以甲得分不小于2的概率为＝.
【研透高考·攻重点】
【例1】　D　将5名志愿者分配到4个场馆，共有种不同的方法，其中A，B两名志愿者在同一个场馆共有种不同的方法，所以A，B两名志愿者不在同一个场馆的概率为P＝1－＝.故选D.
跟踪训练
1.C　设A表示事件“丙不是第一个出场，且甲最后出场”，B表示事件“丙不是第一个出场，且乙最后出场”.四人由随机抽签的方式确定出场次序，基本事件共有24个，事件A包含的基本事件有4个，故P（A）＝＝，同理有P（B）＝.由于事件A与事件B互斥，故丙不是第一个出场，且甲或乙最后出场的概率为P（A∪B）＝P（A）＋P（B）＝.
2.D　令6个挂件分别为A，A，B，B，C，C，则将这6个挂件分为3组有5种可能：①AB，AB，CC；②AC，AC，BB；③BC，BC，AA；④AA，BB，CC；⑤AB，BC，AC.再将这分成3组的挂件分给3位同学，有3＋3＋3＋＋＝21（种）情况，恰好有1位同学得到同类吉祥物挂件为分组①②③，有3＋3＋3＝9（种）情况，所以恰好有1位同学得到同类吉祥物挂件的概率是＝.故选D.
【例2】　（1）A　（2）BCD　解析：（1）抛掷次数为1的概率为＝，点数可能为3或4，抛掷次数为2的概率为1－＝，此时基本事件有（1，1），（1，2），（1，3），（1，4），（2，1），（2，2），（2，3），（2，4）共八种，其中点数之和至少为4的情况有（1，3），（1，4），（2，2），（2，3），（2，4）共五种，故抛掷骰子所得的点数之和至少为4的概率为×＋×＝＋＝.故选A.
（2）对于A，∵n（A）＝60，n（D）＝10，n（A∪D）＝70，∴n（A∪D）＝n（A）＋n（D），∴A与D互斥，故A错误；对于B，∵n（A∪B）＝n（A）＋n（B）＝n（Ω），∴A与B互为对立，故B正确；对于C，∵P（A）＝＝，P（C）＝＝，P（A∩C）＝＝，∴P（A∩C）＝P（A）P（C）＝，∴A与C相互独立，故C正确；对于D，∵n（Ω）＝100，n（A）＝60，n（B）＝40，n（C）＝20，n（A∪B）＝100，n（A∩C）＝12，∴n（B∩C）＝8，∴P（B∩C）＝＝，又∵P（B）＝＝，P（C）＝＝，∴P（B∩C）＝P（B）P（C）＝，∴B与C相互独立，故D正确.故选B、C、D.
跟踪训练
1.A　由题意得，P（A）＝，P（B）＝，P（AB）＝，∴P（AB）＝P（A）P（B），∴事件A与B相互独立，则A与也相互独立，∴P（A）＝P（A）P（）＝P（A）（1－P（B））＝×＝.故选A.
2.D　当n＝2时，AB表示一正一反，故P（AB）＝2××＝，故A正确；此时P（A）＝2××＝，P（B）＝1－P（）＝1－×＝，P（AB）＝≠＝P（A）P（B），故B正确；当n＝3时，A＋B表示并非每次都是正面朝上，故P（A＋B）＝1－P（）＝1－××＝，故C正确；此时P（AB）＝3×××＝，P（A）＝1－P（）＝1－××－××＝，P（B）＝××＋3×××＝，所以P（AB）＝＝×＝P（A）P（B），故D错误.故选D.
【例3】　（1）C　（2）B　解析：（1）据题意，记甲击中目标为事件A，乙击中目标为事件B，目标被击中为事件C，甲、乙同时击中目标为事件D，则P（A）＝，P（B）＝，所以P（C）＝1－P（）P（）＝1－（1－）×（1－）＝，P（DC）＝P（D）＝P（AB）＝P（A）P（B）＝×＝，则在目标被击中的情况下，甲、乙同时击中目标的概率为P（D｜C）＝＝＝.
（2）设A1，A2分别表示取得的这块芯片是由甲、乙线生产的，B表示取得的芯片为次品，甲线生产该芯片的次品率为p，则P（A1）＝＝，P（A2）＝，P（B｜A1）＝p，P（B｜A2）＝.由全概率公式得P（B）＝P（A1）P（B｜A1）＋P（A2）P（B｜A2）＝p＋×＝0.08，解得p＝.故选B.
跟踪训练
1.　　解析：由题意知甲选到A的概率P＝＝.记乙选择A活动为事件M，乙选了A活动再选择B活动为事件N，则P（M）＝＝，P（MN）＝＝，所以P（N｜M）＝＝＝.
2.　解析：设A＝“在甲盒中拿到红球”，B＝“在乙盒中拿到红球”.因为甲盒中有3个红球，2个黄球，所以P（A）＝，P（）＝1－＝，又乙盒中有2个红球，1个黄球，所以P（B｜A）＝，P（B｜）＝，所以P（B）＝P（AB）＋P（B）＝P（A）P（B｜A）＋P（）P（B｜）＝×＋×＝.
【例4】　D　因为正态密度函数为f（x）＝，所以E（X）＝90，所以正态曲线关于直线x＝90对称，所以P（X＜70）＝P（X＞110），又P（70≤X≤110）＝0.8，所以P（X＞110）＝＝0.1，又共有50 000名学生参加这次考试，所以该市这次考试数学成绩超过110分的学生人数约为50 000×0.1＝5 000，故选D.
跟踪训练
1.D　随机变量X服从正态分布N（2，σ2），且P（2＜X≤2.5）＝0.36，所以P（1.5≤X＜2）＝0.36，P（X＜1.5）＝（1－0.36×2）＝0.14，所以P（X＞1.5）＝1－0.14＝0.86，故选D.
2.0.01（答案不唯一，小于等于0.02的正数即可）　解析：依题意可得μ＝80，要使次品率不高于0.27％，则正品率不低于99.73％，又根据正态曲线的特征知，｜ξ－80｜＜3σ，所以ξ∈（80－3σ，80＋3σ）（79.94，80.06），所以解得σ≤0.02，故σ的一个值可以为0.01.
第3讲　大题专攻——随机变量及其分布
【锁定高考·明方向】
真题感悟
1.解：X的所有可能取值为0，1，2，
且P（X＝k）＝，k＝0，1，2，
所以X的分布列为
X 0 1 2
P
X的数学期望E（X）＝0×＋1×＋2×＝1.
2.解：（1）甲、乙所在队的比赛成绩不少于5分，则甲第一阶段至少投中1次，乙第二阶段也至少投中1次，
所以比赛成绩不少于5分的概率P＝（1－0.63）（1－0.53）＝0.686.
（2）若甲参加第一阶段比赛，则甲、乙所在队的比赛成绩X的所有可能取值为0，5，10，15.
P（X＝0）＝（1－p）3＋[1－（1－p）3]·（1－q）3，
P（X＝5）＝[1－（1－p）3]··q·（1－q）2，
P（X＝10）＝[1－（1－p）3]··q2·（1－q），
P（X＝15）＝[1－（1－p）3]·q3，
所以E（X）＝[1－（1－p）3]·[15q（1－q）2＋30q2·（1－q）＋15q3]＝[1－（1－p）3]·15q＝15pq·（p2－3p＋3）.
若乙参加第一阶段比赛，则甲、乙所在队的比赛成绩Y的所有可能取值为0，5，10，15.
同理，可得E（Y）＝15pq（q2－3q＋3）.
E（X）－E（Y）＝15pq（p2－3p－q2＋3q）＝15pq（q－p）（3－p－q），
由0＜p＜q≤1，
得q－p＞0，3－p－q＝3－（p＋q）＞0，
所以E（X）－E（Y）＞0，即E（X）＞E（Y）.
故应该由甲参加第一阶段比赛.
【研透高考·攻重点】
【例1】　解：（1）设一轮摸球游戏结束时摸球次数不超过3次为事件A，记第i次（i＝1，2，3）摸到红球为事件Bi，
则事件A＝∪B1∪B1B2，
显然，B1，B1B2彼此互斥，
由互斥事件概率的加法公式：P（A）＝P（∪B1∪B1B2）＝P（）＋P（B1）＋P（B1B2），
因为每次摸到红球后放回，所以P（Bi）＝，P（）＝，
所以P（A）＝＋×＋××＝.
（2）依题意，X的可能取值为2，3，4，5，
P（X＝2）＝P（）＝，
P（X＝3）＝P（B1）＝×＝，
P（X＝4）＝P（B1B2）＋P（B1B2B3B4）＝××＋（）4＝，
P（X＝5）＝P（B1B2B3）＝（）3×＝，
所以一轮摸球游戏结束时，此人总得分X的分布列为
X 2 3 4 5
P
E（X）＝2×＋3×＋4×＋5×＝.
跟踪训练
　解：（1）记抛掷骰子的样本点为（a，b），则样本空间Ω＝{（a，b）｜1≤a≤6，1≤b≤6，a∈N*，b∈N*}，
则n（Ω）＝36，
记事件A＝“X＞0”，记事件B＝“X＝［］＝”，
则A＝{（a，b）｜1≤a≤b≤6，a∈N*，b∈N*，且［］＞0}，则n（A）＝21.
又AB＝{（1，1），（1，2），（1，3），（1，4），（1，5），（1，6），（2，2），（2，4），（2，6），（3，3），（3，6），（4，4），（5，5），（6，6）}，
则n（AB）＝14，
所以P（B｜A）＝＝＝，
即在X＞0的条件下，X＝的概率为.
（2）X的所有可能取值为0，1，2，3，4，5，6.
P（X＝0）＝＝，P（X＝1）＝＝，
P（X＝2）＝＝，P（X＝3）＝＝，
P（X＝4）＝，P（X＝5）＝，P（X＝6）＝，
所以X的分布列为：
X 0 1 2 3 4 5 6
P
所以E（X）＝0×＋1×＋2×＋3×＋4×＋5×＋6×＝.
【例2】　解：（1）记“从10所学校中随机选取的3所学校参与‘自由式滑雪’都超过40人”为事件A，
参与“自由式滑雪”的人数超过40的学校共4所，
从中随机选择3所学校的选法共＝4（种），
所以P（A）＝＝＝.
（2）参与“单板滑雪”人数在45以上的学校共4所，
所以X的所有可能取值为0，1，2，3，
则P（X＝0）＝＝＝，
P（X＝1）＝＝＝，
P（X＝2）＝＝＝，
P（X＝3）＝＝＝，
所以X的分布列如下表：
X 0 1 2 3
P
所以E（X）＝＋2×＋3×＝.
（3）记“小明同学在一轮测试中要想获得优秀”为事件B，
则P（B）＝（）2×＋（）3＝，
由题意，小明同学在集训测试中获得“优秀”的次数服从二项分布B（ n，），
由题意得n≥5，得n≥，
因为n∈N*，所以n的最小值为20，
故至少要进行20轮测试.
跟踪训练
　解：（1）由题意可知：每次抛掷骰子上两级台阶的概率为＝，上三级台阶的概率为＝，
且X的可能取值为6，7，8，9，可得（X－6）～B（3，），则有：
P（X＝6）＝（）3＝，
P（X＝7）＝××（）2＝，
P（X＝8）＝×（）2×＝，
P（X＝9）＝（）3＝，
所以X的分布列为
X 6 7 8 9
P
因为E（X－6）＝3×＝1，所以E（X）＝7.
（2）因为位于第10级台阶则认定游戏失败，无法获得奖品，
结合题意可知：若学生位于第10级台阶，则抛掷3次后，学生位于第7级台阶，抛掷第4次上三级台阶，
可知不能获得奖品的概率为P1＝××（）2×＝，
所以甲、乙两位学生参加游戏，恰有一人获得奖品的概率P＝××（1－）＝.
【例3】　解：（1）记“从第1组抽取的20株鸡冠花样本中随机抽取2株，至少有1株鸡冠花的株高增量在（7，10]内”为事件A，所以P（A）＝＝.
（2）记“从第i（i＝1，2，3）组的鸡冠花中各随机抽取1株，这株鸡冠花的株高增量在（7，10]内”为事件Bi，
由题意可知：P（B1）＝，P（B2）＝，P（B3）＝，
X的可能取值有0，1，2，3，则有：
P（X＝0）＝（1－）×（1－）×（1－）＝，
P（X＝1）＝×（1－）×（1－）＋（1－）××（1－）＋（1－）×（1－）×＝，
P（X＝2）＝××（1－）＋×（1－）×＋（1－）××＝，
P（X＝3）＝××＝.
所以X的分布列为
X 0 1 2 3
P
X的期望E（X）＝0×＋1×＋2×＋3×＝.
（3）由题意可知：ζ1，ζ2，ζ3均服从两点分布，则有：
ζ1的分布列为：
ζ1 0 1
P
可得ζ1的方差D（ζ1）＝×＝；
ζ2的分布列为：
ζ2 0 1
P
可得ζ2的方差D（ζ2）＝×＝；
ζ3的分布列为：
ζ3 0 1
P
可得ζ3的方差D（ζ3）＝×＝；
因为＞＞，所以D（ζ2）＞D（ζ3）＞D（ζ1）.
跟踪训练
　解：（1）设ζ表示1条灯带在安全使用寿命内更换的灯珠数量，
则P（ζ＝5）＝P（ζ＝7）＝P（ζ＝8）＝0.2，P（ζ＝6）＝0.4，
X的取值范围是{10，11，12，13，14，15，16}，
P（X＝10）＝0.2×0.2＝0.04，
P（X＝11）＝2×0.2×0.4＝0.16，
P（X＝12）＝0.42＋2×0.2×0.2＝0.24，
P（X＝13）＝2×（0.2×0.2＋0.2×0.4）＝0.24，
P（X＝14）＝0.22＋2×0.4×0.2＝0.2，
P（X＝15）＝2×0.2×0.2＝0.08，
P（X＝16）＝0.2×0.2＝0.04，
X的分布列为
X 10 11 12 13 14 15 16
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
（2）由（1）可知P（X≥12）＝0.8，
P（X≥13）＝0.56，
故n0＝13.
（3）由（2）可知n0－1＝12，
在灯带安全使用寿命期内，当n＝12时，设购买替换灯珠所需总费用为u元，当n＝13时，设购买替换灯珠所需总费用为v元，则
E（u）＝24＋0.24×4＋0.2×8＋0.08×12＋0.04×16＝28.16，
E（v）＝26＋0.2×4＋0.08×8＋0.04×12＝27.92，
E（v）＜E（u），
故以购买替换灯珠所需总费用的期望值为依据，n＝n0比n＝n0－1的方案更优.
第4讲　大题专攻——成对数据的统计分析
【锁定高考·明方向】
真题感悟
1.解：（1）填写如下列联表：
优级品非优级品
甲车间 26 24
乙车间 70 30
则完整的2×2列联表如下：
优级品非优级品总计
甲车间 26 24 50
乙车间 70 30 100
总计 96 54 150
K2＝＝4.687 5.
因为K2＝4.687 5＞3.841，所以有95％的把握认为甲、乙两车间产品的优级品率存在差异；
因为K2＝4.687 5＜6.635，所以没有99％的把握认为甲、乙两车间产品的优级品率存在差异.
（2）由题意可知＝＝0.64，
又p＋1.65＝0.5＋1.65×≈0.5＋1.65×≈0.57，
所以＞p＋1.65，
所以能认为生产线智能化升级改造后，该工厂产品的优级品率提高了.
2.解：（1）估计该林区这种树木平均一棵的根部横截面积＝＝＝0.06，
估计该林区这种树木平均一棵的材积量＝＝＝0.39.
（2）（xi－）（yi－）＝xiyi－10＝0.013 4，
（xi－）2＝－10（）2＝0.002，
（yi－）2＝－10（）2＝0.094 8，
所以＝＝≈0.01×1.377＝0.013 77，
所以样本相关系数r＝
≈≈0.97.
（3）设该林区这种树木的总材积量的估计值为Y m3，由题意可知，该种树木的材积量与其根部横截面积近似成正比，所以＝，
所以Y＝＝1 209，即该林区这种树木的总材积量的估计值为1 209 m3.
【研透高考·攻重点】
【例1】　解：（1）由已知可得，＝＝3，
＝＝5.1，
由题可列下表：
xi－－2 －1 0 1 2
yi－ 1.3 0.4 －0.1 －0.3 －1.3
（xi－）（yi－）＝－5.9，＝，＝，
r＝＝≈≈－0.98.
（2）由问题（1）知，y与x的样本相关系数r≈－0.98，｜r｜接近1，所以y与x之间具有极强的线性相关关系，可用一元线性回归模型进行描述.
由问题（1）知，＝＝＝－0.59，
＝－＝5.1－（－0.59）×3＝6.87，
所求经验回归方程为＝－0.59x＋6.87.
（3）令x＝9，则＝－0.59×9＋6.87＝1.56，预测2028年的酸雨区面积占国土面积的百分比为1.56％.
跟踪训练
　解：（1）＝，＝，
＝＝＝5，
∴＝－＝－5×＝2，
∴＝5ln x＋2.
（2）设投入食品淀粉的资金为x万元，投入药用淀粉的资金为（200－x）万元，年收益为f（x），
∴f（x）＝5ln x＋2＋（200－x）＝5ln x－x＋22，
f'（x）＝－＝0 x＝50，
当0＜x＜50时，f'（x）＞0，f（x）单调递增；当50＜x＜200时，f'（x）＜0，f（x）单调递减.
∴f（x）max＝f（50）＝5ln 50－5＋22＝5（2ln 5＋ln 2）＋17≈36.5.
【例2】　解：（1）强化训练后的平均成绩约为
55×0.04＋65×0.16＋75×0.2＋85×0.32＋95×0.28＝81.4.
由于前三列概率之和为0.04＋0.16＋0.2＝0.4，
设中位数为80＋x，则0.032x＝0.1，
解得x＝3.125，所以中位数约为83.13.
（2）零假设为H0：跳水运动员是否优秀与强化训练无关.
补充完整的表格为
强化训练是否优秀合计
优秀人数非优秀人数
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2＝＝8＞7.879＝x0.005，
根据小概率值α＝0.005的独立性检验，我们推断H0不成立，即认为跳水运动员是否优秀与强化训练有关.
跟踪训练
　解：（1）由表中数据可得，选择A餐厅的概率为＝，选择B餐厅的概率为＝，
设事件A1：甲、乙两名同学去A餐厅用餐，
事件B1：甲、乙两名同学去B餐厅用餐，
事件A：甲、乙两名同学选择同一套餐用餐，
P（A1）＝（）2，P（B1）＝（）2，P（A｜A1）＝，P（A｜B1）＝，
则P（A）＝P（A1）P（A｜A1）＋P（B1）·P（A｜B1）＝（）2×＋（）2×＝，
故甲、乙两名同学选择同一套餐的概率为.
（2）根据数据可得列联表：
餐厅性别合计
男女
在A餐厅用餐 40 20 60
在B餐厅用餐 15 25 40
合计 55 45 100
零假设为H0：认为性别与选择餐厅之间无关，
根据列联表中的数据，经计算得到χ2＝≈8.249＞7.879＝x0.005，
依据小概率值α＝0.005的独立性检验，可以推断H0不成立，即性别与选择餐厅之间有关，此推断犯错误的概率不大于0.005.
培优点1　体育比赛与闯关
【例1】　解：（1）记事件A＝“甲班在项目A中获胜”，则P（A）＝××＋×（）2××＋×（）2×（）2×＝，
所以甲班在项目A中获胜的概率为.
（2）记事件B＝“甲班在项目B中获胜”，
则P（B）＝（）3＋×（）4＋×（）5＝.
X的可能取值为0，1，2，
则P（X＝0）＝P（）＝P（）P（）＝×＝，
P（X＝2）＝P（AB）＝P（A）P（B）＝×＝，
P（X＝1）＝1－P（X＝0）－P（X＝2）＝.
所以X的分布列为
X 0 1 2
P
故E（X）＝0×＋1×＋2×＝.所以甲班获胜的项目个数的数学期望为.
跟踪训练
　　解析：根据题意，设甲获胜为事件A，比赛进行两局为事件B，P（A）＝×＋×××＝，P（AB）＝××＝，故P（B｜A）＝＝＝＝.
【例2】　解：（1）甲连胜四场的概率为.
（2）根据赛制，至少需要进行四场比赛，至多需要进行五场比赛.
比赛四场结束，共有三种情况：
甲连胜四场的概率为；
乙连胜四场的概率为；
丙上场后连胜三场的概率为.
所以需要进行第五场比赛的概率为1－－－＝.
（3）丙最终获胜，有两种情况：
比赛四场结束且丙最终获胜的概率为；
比赛五场结束且丙最终获胜，则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况：胜胜负胜，胜负空胜，负空胜胜，概率分别为，，.
因此丙最终获胜的概率为＋＋＋＝.
跟踪训练
　　解析：比赛进行四局结束有以下两种情况：第一局甲获胜，后三局丙连胜；第一局乙获胜，后三局丙连胜，第一局甲获胜，后三局丙连胜的概率P1＝×××＝，第一局乙获胜，后三局丙连胜的概率P2＝×××＝，故比赛进行四局结束的概率P＝P1＋P2＝＋＝.
【例3】　解：（1）甲以11∶9赢得比赛，共计20次发球，在后4次发球中，需甲在最后一次获胜，最终甲以11∶9赢得比赛的概率为P＝×（）2×（）2＋（）2××＝.
（2）设甲累计得分为随机变量X，X的可能取值为0，1，2，3.
P（X＝0）＝（）2×＝，
P（X＝1）＝×（）2×＋（）2×＝，
P（X＝2）＝×（）2×＋（）2×＝，
P（X＝3）＝（）2×＝，
所以随机变量X的分布列为
X 0 1 2 3
P
所以E（X）＝0×＋1×＋2×＋3×＝.
跟踪训练
　D　三队中选一队与丙比赛，丙输，×，例如是丙甲，若丙与乙、丁的两场比赛一赢一平，则丙只得4分，这时，甲乙、甲丁两场比赛中甲只能输，否则甲的分数不小于4分，不合题意，在甲输的情况下，乙、丁已有3分，那么它们之间的比赛无论什么情况，乙、丁中有一队得分不小于4分，不合题意.若丙全赢（概率是（）2）时，丙得6分，其他3队分数最高为5分，这时甲乙，甲丁两场比赛中甲不能赢，否则甲的分数不小于6分，（1）若甲乙，甲丁两场比赛中甲一平一输，则一平一输的概率是（）2，如平乙，输丁，则乙丁比赛时，丁不能赢，概率是；（2）若甲乙，甲丁两场比赛中甲两场均平，概率是（）2，乙丁这场比赛无论结果如何均符合题意；（3）若甲乙，甲丁两场比赛中甲都输，概率是（）2，乙丁这场比赛只能平，概率是.综上，概率为××（）2×［×（）2×＋（）2＋（）2×］＝，D正确.故选D.
培优点2　概率与统计中的创新问题
【例1】　解：（1）K2＝＝24＞6.635，
所以有99％的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
（2）①证明：R＝
＝，
由题意知，证明＝即可，
左边＝
＝，
右边＝
＝.
左边＝右边，故R＝·.
②由调查数据可知P（A｜B）＝＝，P（A｜）＝＝，
且P（｜B）＝1－P（A｜B）＝，P（｜）＝1－P（A｜）＝，
所以R＝×＝6.
跟踪训练
　解：（1）依题意，X1服从超几何分布，故X1的分布列为P（X1＝k）＝，k∈N，0≤k≤100.
X1 0 1 … 99 100
P …
（2）①证明：由题可知Xi（i＝1，2，…，20）均服从完全相同的超几何分布，所以E（X1）＝E（X2）＝…＝E（X20），E（）＝E（ Xi）＝E（ Xi）＝E（Xi）＝×20E（X1）＝E（X1），
D（）＝D（ Xi）＝D（ Xi）＝D（Xi）＝×20D（X1）＝D（X1）.
故E（）＝E（X1），D（）＝D（X1）.
②由①可知的均值E（）＝E（X1）＝.
由公式得X1的方差D（X1）＝，
所以D（）＝.
依题意有
解得N＝1 456，M＝624，
所以可以估计M＝624，N＝1 456.
【例2】　解：（1）依题意，X～B（ 5，），则P（X＝0）＝（）5＝，P（X＝1）＝（）4（）＝，
P（X＝2）＝（）3（）2＝＝，
P（X＝3）＝（）2（）3＝，
P（X＝4）＝（）（）4＝，
P（X＝5）＝（）5＝，
故X的分布列为：
X 0 1 2 3 4 5
P
故E（X）＝5×＝.
（2）设事件“Y＝n”表示前n－1次试验只成功了1次，且第n次试验成功，
故P（Y＝n）＝××（）n－2×＝×（）n－2，
当n为偶数时，
P（AB）＝P（2）＋P（4）＋…＋P（n）＝［1·（）0＋3·（）2＋…＋（n－1）·（）n－2］，
令Sn＝1·（）0＋3·（）2＋…＋（n－1）·（）n－2，
则Sn＝1·（）2＋3·（）4＋…＋（n－1）·（）n，
两式相减得：Sn＝1＋2［（）2＋（）4＋…＋（）n－2］－（n－1）·（）n，
则Sn＝－（）n·（＋n），
即P（AB）＝－（＋n）·（）n.
当n为奇数时，同理可得
P（AB）＝P（2）＋P（4）＋…＋P（n－1）＝［1·（）0＋3·（）2＋…＋（n－2）·（）n－3］
＝－（ n＋）·（）n－1，
综上，P（AB）＝
【例3】　解：（1）∵10×（0.012＋0.026＋0.032＋a＋0.01）＝1，∴a＝0.02.
样本平均数的估计值为50×0.12＋60×0.26＋70×0.32＋80×0.2＋90×0.1＝69.
（2）∵μ＝69，σ＝10.5.
∴P（X≥90）＝P（X≥μ＋2σ）≈＝0.022 75.
∴能参加复试的人数约为40 000×0.022 75＝910.
（3）由题意有x2y＝.
答对两道题的概率P＝x2（1－y）＋x（1－x）y＝x2＋2xy－3x2y.
而x2y＝，∴P＝x2＋－.
令f（x）＝x2＋－（0＜x≤1），
则f'（x）＝2x－＝，
∴当x∈（ 0，）时，f'（x）＜0，f（x）在（ 0，）内单调递减；
当x∈（，1］时，f'（x）＞0，f（x）在（，1］内单调递增.
∴当x＝时，f（x）min＝.故概率P的最小值为.
跟踪训练
　解：（1）由题意知，X的可能取值为0，1，2，
则P（X＝0）＝＝，
P（X＝1）＝＝，
P（X＝2）＝＝，
故X的分布列为
X 0 1 2
P
则E（X）＝0×＋1×＋2×＝.
记事件A：小王已经答对一题，事件B：小王未进入决赛，
则小王在已经答对一题的前提下，仍未进入决赛的概率
P（B｜A）＝＝＝＝.
（2）①由题意知，f（p）＝p（1－p）2
＝3p3－6p2＋3p（ 0＜p＜），
则f'（p）＝3（3p－1）（p－1），
令f'（p）＝0，解得p＝或p＝1（舍），
当p∈（ 0，）时，f'（p）＞0，当p∈（，）时，f'（p）＜0，
所以f（p）在区间（ 0，）内单调递增，在区间（，）内单调递减，
所以当p＝时，f（p）有极大值，且f（p）的极大值为f（）＝.
②由题可设每名进入决赛的大学生获得的奖金为随机变量Y，
则Y的可能取值为60，120，180，360，
P（Y＝60）＝（1－p）3，
P（Y＝120）＝p（1－p）2，
P（Y＝180）＝p2（1－p），
P（Y＝360）＝p3，
所以E（Y）＝60（1－p）3＋120p（1－p）2＋180p2（1－p）＋360p3＝60（2p3＋3p＋1），
所以9E（Y）≥1 120，
即540（2p3＋3p＋1）≥1 120，
整理得2p3＋3p－≥0，
经观察可知p＝是方程2p3＋3p－＝0的根，
故2p3＋3p－＝2（ p3－p2）＋（ p2－p）＋（ p－）＝（ p－）（ 2p2＋p＋），
因为2p2＋p＋＞0恒成立，
所以由2p3＋3p－≥0可得p－≥0，解得p≥，
又0＜p＜，所以p的取值范围为［，）.
【例4】　解：（1）①二维离散型随机变量（ξ，η）的所有可能取值为（0，0），（0，1），（0，2），（0，3），（1，0），（1，1），（1，2），（2，0），（2，1），（3，0）.
②由题意得0≤m＋n≤3，
P（ξ＝m，η＝n）＝P（ξ＝m｜η＝n）·P（η＝n），
因为P（η＝n）＝（）n（）3－n.
P（ξ＝m｜η＝n）＝（）m·（）3－n－m＝（）3－n，
所以P（ξ＝m，η＝n）＝（）3－n·（）n·（）3－n＝＝·.
（2）证明：由定义及全概率公式知：
P（ξ＝ai）＝P{（ξ＝ai）∩[（η＝b1）∪（η＝b2）∪…∪（η＝bj）∪…]}
＝P{[（ξ＝ai）∩（η＝b1）]∪[（ξ＝ai）∩（η＝b2）]∪…∪[（ξ＝ai）∩（η＝bj）]∪…}
＝P[（ξ＝ai）∩（η＝b1）]＋P[（ξ＝ai）∩（η＝b2）]＋…＋P[（ξ＝ai）∩（η＝bj）]＋…
＝P[（ξ＝ai）∩（η＝bj）]＝P（ξ＝ai，η＝bj）
＝Pij.
跟踪训练
　解：（1）因为X～B（ 3，），所以xk＝P（X＝k）＝（）k（）3－k＝（k＝0，1，2，3），
因为Y～B（ 3，），所以yk＝P（Y＝k）＝（）k·（）3－k＝（k＝0，1，2，3），
所以＝＝23－2k（k＝0，1，2，3），
所以D（X｜｜Y）＝xkln＝××ln 23＋××ln 2＋××ln 2－1＋××ln 2－3＝ln 2.
（2）因为xk＝P（X＝k）＝pk（1－p）2－k（k＝0，1，2），
y0＝P（Y＝0）＝，y1＝P（Y＝1）＝，y2＝P（Y＝2）＝，
所以D（X｜｜Y）＝xkln
＝x0ln＋x1ln＋x2ln
＝（1－p）2ln[6（1－p）2]＋2p（1－p）ln[3p（1－p）]＋p2ln（6p2）.
令f（p）＝（1－p）2ln[6（1－p）2]＋2p（1－p）ln[3p（1－p）]＋p2ln（6p2），
则f'（p）＝－2（1－p）ln[6（1－p）2]－2（1－p）＋（2－4p）ln[3p（1－p）]＋2－4p＋2pln（6p2）＋2p
＝（－2＋4p）ln 6－2ln（1－p）＋2ln p＋（2－4p）ln 3
＝2ln p－2ln（1－p）＋（4p－2）ln 2，
令g（p）＝2ln p－2ln（1－p）＋（4p－2）ln 2，
则g'（p）＝＋＋4ln 2，
因为0＜p＜1，所以g'（p）＞0，故g（p）在（0，1）上单调递增，
又g（）＝0，所以当0＜p＜时，g（p）＜0，即f'（p）＜0，当＜p＜1时，g（p）＞0，即f'（p）＞0，
所以f（p）在（ 0，）上单调递减，在（，1）上单调递增，
所以f（p）min＝f（）＝ln.
（3）证明：令φ（x）＝ln x－x＋1，则φ'（x）＝－1＝.易得当x∈（0，1）时，φ'（x）＞0，当x∈（1，＋∞）时，φ'（x）＜0，故φ（x）在（0，1）上单调递增，在（1，＋∞）上单调递减，
所以 x∈（0，＋∞），φ（x）≤φ（1）＝0，
所以ln x≤x－1，所以ln≤－1，
所以ln x≥1－，
所以D（X｜｜Y）＝xkln≥xk（ 1－）
＝（xk－yk）＝xk－yk＝1－1＝0，
即D（X｜｜Y）的值不可能为负.
1 / 3培优点2　概率与统计中的创新问题
　　概率与统计中的创新问题主要涉及概率统计中的证明问题、概率统计与数列、函数的交汇问题及概率统计中的新定义问题，考查题型多为解答题，难度中等偏上，或可作为压轴题出现.
概率与统计中的推理证明问题
【例1】　（2022·新高考Ⅰ卷20题）一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯（卫生习惯分为良好和不够良好两类）的关系，在已患该疾病的病例中随机调查了100例（称为病例组），同时在未患该疾病的人群中随机调查了100人（称为对照组），得到如下数据：
不够良好良好
病例组 40 60
对照组 10 90
（1）能否有99％的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异？
（2）从该地的人群中任选一人，A表示事件“选到的人卫生习惯不够良好”，B表示事件“选到的人患有该疾病”，与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标，记该指标为R.
①证明：R＝·；
②利用该调查数据，给出P（A｜B），P（A｜）的估计值，并利用①的结果给出R的估计值.
附：K2＝，
P（K2≥k） 0.050 0.010 0.001
k 3.841 6.635 10.828
.
感悟提升
　　解答概率与统计中的推理证明问题的关键是要“死抠”定义，与别的类型证明题不同，高中阶段所学的概率问题都是初等概率.解答此类题目只需依定义按部就班推导即可.
　（2024·辽宁三所重点中学第三次模拟）某自然保护区经过几十年的发展，某种濒临灭绝动物数量有大幅度增加.已知这种动物P拥有两个亚种（分别记为A种和B种）.为了调查该区域中这两个亚种的数目，某动物研究小组计划在该区域中捕捉100只动物P，统计其中A种的数目后，将捕获的动物全部放回，作为一次试验结果.重复进行这个试验共20次，记第i次试验中A种的数目为随机变量Xi（i＝1，2，…，20）.设该区域中A种的数目为M，B种的数目为N（M，N均大于100），每一次试验均相互独立.
（1）求X1的分布列；
（2）记随机变量＝Xi已知E（Xi＋Xj）＝E（Xi）＋E（Xj），D（Xi＋Xj）＝D（Xi）＋D（Xj）.
①证明：E（）＝E（X1），D（）＝D（X1）；
②该小组完成所有试验后，得到Xi的实际取值分别为xi（i＝1，2，…，20）.数据xi（i＝1，2，…，20）的平均值＝30，方差s2＝1.采用和s2分别代替E（）和D（），给出M，N的估计值.
（已知随机变量X服从超几何分布记为X～H（P，n，Q）（其中P为总数，Q为某类元素的个数，n为抽取的个数），则D（X）＝n（ 1－））
概率统计与其他知识的交汇问题
考向1　概率统计与数列
【例2】　（2024·宁波“十校”联考）为了验证某款电池的安全性，小明在实验室中进行试验，假设小明每次试验成功的概率为p（0＜p＜1），且每次试验相互独立.
（1）若进行5次试验，且p＝，求试验成功次数X的分布列以及期望；
（2）若恰好成功2次后停止试验，p＝，记事件A：停止试验时试验次数不超过n（n≥2）次，事件B：停止试验时试验次数为偶数，求P（AB）.（结果用含有n的式子表示）
感悟提升
概率统计与数列交汇的常见题型
（1）求通项公式：关键是找出概率Pn或数学期望E（Xn）的递推关系式，然后根据构造法（一般构造等比数列），求出通项公式；
（2）求和：主要是数列中的倒序求和、错位求和、裂项求和；
（3）利用等差、等比数列的性质，研究单调性、最值或求极限.
考向2　概率统计与函数
【例3】　（2024·邵阳第二次联考）为了选拔创新型人才，某大学对高三年级学生的数学学科和物理学科进行了检测（检测分为初试和复试），共有4万名学生参加初试.组织者随机抽取了200名学生的初试成绩，绘制了频率分布直方图，如图所示.
（1）根据频率分布直方图，求a的值及样本平均数的估计值；
（2）若所有学生的初试成绩X近似服从正态分布N（μ，σ2），其中μ为样本平均数的估计值，σ＝10.5.规定初试成绩不低于90分的学生才能参加复试，试估计能参加复试的人数；
（3）复试笔试试题包括两道数学题和一道物理题，已知小明进入了复试，且在复试笔试中答对每一道数学题的概率均为x，答对物理题的概率为y.若小明全部答对的概率为，答对两道题的概率为P，求概率P的最小值.
感悟提升
　　通过设置变量，利用数学期望、方差或概率的计算公式构造函数，是解决概率统计与函数结合问题最常用的方式.解决此类问题，应注意两点：
（1）准确构造函数，利用公式搭建函数模型时，由于随机变量的数学期望、方差及随机事件概率的计算中涉及的变量较多，式子较为复杂，所以准确运算化简是关键；
（2）注意变量的取值范围，一是题中给出的范围，二是实际问题中变量自身取值的限制.
　（2024·菏泽三模）2024年7月26日至8月11日在法国巴黎举行夏季奥运会.为了普及奥运知识，M大学举办了一次奥运知识竞赛，竞赛分为初赛与决赛，初赛通过后才能参加决赛.
（1）初赛从6道题中任选2题作答，2题均答对则进入决赛.已知这6道题中小王能答对其中4道题，记小王在初赛中答对的题目个数为X，求X的数学期望以及小王在已经答对一题的前提下，仍未进入决赛的概率；
（2）M大学为鼓励大学生踊跃参赛并取得佳绩，对进入决赛的参赛大学生给予一定的奖励.奖励规则如下：已进入决赛的参赛大学生允许连续抽奖3次，中奖1次奖励120元，中奖2次奖励180元，中奖3次奖励360元，若3次均未中奖，则只奖励60元.假定每次抽奖中奖的概率均为p（ 0＜p＜），且每次是否中奖相互独立.
①记一名进入决赛的大学生恰好中奖1次的概率为f（p），求f（p）的极大值；
②M大学数学系共有9名大学生进入了决赛，若这9名大学生获得的总奖金的期望值不小于1 120元，试求此时p的取值范围.
概率统计中的新定义问题
【例4】　若ξ，η是样本空间Ω上的两个离散型随机变量，则称（ξ，η）是Ω上的二维离散型随机变量或二维随机变量.设（ξ，η）的一切可能取值为（ai，bj），i，j＝1，2，…，记Pij表示（ai，bj）在Ω中出现的概率，其中Pij＝P（ξ＝ai，η＝bj）＝P[（ξ＝ai）∩（η＝bj）].
（1）将三个相同的小球等可能地放入编号为1，2，3的三个盒子中，记1号盒子中的小球个数为ξ，2号盒子中的小球个数为η，则（ξ，η）是一个二维随机变量.
①写出该二维离散型随机变量（ξ，η）的所有可能取值；
②若（m，n）是①中的值，求P（ξ＝m，η＝n）（结果用m，n表示）.
（2）P（ξ＝ai）称为二维离散型随机变量（ξ，η）关于ξ的边缘分布律或边际分布律，求证：P（ξ＝ai）＝Pij.
感悟提升
　　解决概率统计中新定义问题的过程可以概括为“过三关”：第一关，准确转化关，即要解决新定义问题，一定要理解题目中定义的本质含义，紧扣题目所给的新定义、新运算法则、新符号等对所求问题进行恰当转化；第二关，方法选取关，对此类题可以采取特例法，从逻辑推理的角度进行转化，理解题目中定义的本质并进行推广、运算；第三关，审读题目关，严格按照新定义的要求，解答问题时要避免教材知识或者已有知识对信息的干扰，也就是突破思维定式或固有的已知信息束缚，按新定义寻求解决问题的方法.
　（2024·河南九师联盟）设离散型随机变量X和Y的分布列分别为P（X＝k）＝xk，P（Y＝k）＝yk，xk＞0，yk＞0，k＝0，1，2，…，n，xk＝yk＝1.定义D（X｜｜Y）＝xkln，用来刻画X和Y的相似程度，设X～B（n，p），0＜p＜1.
（1）若n＝3，p＝，Y～B（ 3，），求D（X｜｜Y）；
（2）若n＝2，且Y的分布列为
Y 0 1 2
P
求D（X｜｜Y）的最小值；
（3）对任意与X有相同可能取值的随机变量Y，证明，D（X｜｜Y）的值不可能为负数.
3 / 3培优点2　概率与统计中的创新问题
　　概率与统计中的创新问题主要涉及概率统计中的证明问题、概率统计与数列、函数的交汇问题及概率统计中的新定义问题，考查题型多为解答题，难度中等偏上，或可作为压轴题出现.
概率与统计中的推理证明问题
【例1】　（2022·新高考Ⅰ卷20题）一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯（卫生习惯分为良好和不够良好两类）的关系，在已患该疾病的病例中随机调查了100例（称为病例组），同时在未患该疾病的人群中随机调查了100人（称为对照组），得到如下数据：
不够良好良好
病例组 40 60
对照组 10 90
（1）能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异？
（2）从该地的人群中任选一人，A表示事件“选到的人卫生习惯不够良好”，B表示事件“选到的人患有该疾病”，与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标，记该指标为R.
①证明：R＝·；
②利用该调查数据，给出P（A｜B），P（A｜）的估计值，并利用①的结果给出R的估计值.
附：K2＝，
P（K2≥k） 0.050 0.010 0.001
k 3.841 6.635 10.828
.
解：（1）K2＝＝24＞6.635，
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
（2）①证明：R＝＝，
由题意知，证明＝即可，
左边＝＝，
右边＝＝.
左边＝右边，故R＝·.
②由调查数据可知P（A｜B）＝＝，P（A｜）＝＝，
且P（｜B）＝1－P（A｜B）＝，P（｜）＝1－P（A｜）＝，
所以R＝×＝6.
感悟提升
　　解答概率与统计中的推理证明问题的关键是要“死抠”定义，与别的类型证明题不同，高中阶段所学的概率问题都是初等概率.解答此类题目只需依定义按部就班推导即可.
　（2024·辽宁三所重点中学第三次模拟）某自然保护区经过几十年的发展，某种濒临灭绝动物数量有大幅度增加.已知这种动物P拥有两个亚种（分别记为A种和B种）.为了调查该区域中这两个亚种的数目，某动物研究小组计划在该区域中捕捉100只动物P，统计其中A种的数目后，将捕获的动物全部放回，作为一次试验结果.重复进行这个试验共20次，记第i次试验中A种的数目为随机变量Xi（i＝1，2，…，20）.设该区域中A种的数目为M，B种的数目为N（M，N均大于100），每一次试验均相互独立.
（1）求X1的分布列；
（2）记随机变量＝Xi已知E（Xi＋Xj）＝E（Xi）＋E（Xj），D（Xi＋Xj）＝D（Xi）＋D（Xj）.
①证明：E（）＝E（X1），D（）＝D（X1）；
②该小组完成所有试验后，得到Xi的实际取值分别为xi（i＝1，2，…，20）.数据xi（i＝1，2，…，20）的平均值＝30，方差s2＝1.采用和s2分别代替E（）和D（），给出M，N的估计值.
（已知随机变量X服从超几何分布记为X～H（P，n，Q）（其中P为总数，Q为某类元素的个数，n为抽取的个数），则D（X）＝n（ 1－））
解：（1）依题意，X1服从超几何分布，故X1的分布列为P（X1＝k）＝，k∈N，0≤k≤100.
X1 0 1 … 99 100
P …
（2）①证明：由题可知Xi（i＝1，2，…，20）均服从完全相同的超几何分布，所以E（X1）＝E（X2）＝…＝E（X20），E（）＝E（ Xi）＝E（ Xi）＝E（Xi）＝×20E（X1）＝E（X1），
D（）＝D（ Xi）＝D（ Xi）＝D（Xi）＝×20D（X1）＝D（X1）.
故E（）＝E（X1），D（）＝D（X1）.
②由①可知的均值E（）＝E（X1）＝.
由公式得X1的方差D（X1）＝，
所以D（）＝.
依题意有
解得N＝1 456，M＝624，
所以可以估计M＝624，N＝1 456.
概率统计与其他知识的交汇问题
考向1　概率统计与数列
【例2】　（2024·宁波“十校”联考）为了验证某款电池的安全性，小明在实验室中进行试验，假设小明每次试验成功的概率为p（0＜p＜1），且每次试验相互独立.
（1）若进行5次试验，且p＝，求试验成功次数X的分布列以及期望；
（2）若恰好成功2次后停止试验，p＝，记事件A：停止试验时试验次数不超过n（n≥2）次，事件B：停止试验时试验次数为偶数，求P（AB）.（结果用含有n的式子表示）
解：（1）依题意，X～B（ 5，），则P（X＝0）＝（）5＝，P（X＝1）＝（）4（）＝，
P（X＝2）＝（）3（）2＝＝，
P（X＝3）＝（）2（）3＝，
P（X＝4）＝（）（）4＝，
P（X＝5）＝（）5＝，
故X的分布列为：
X 0 1 2 3 4 5
P
故E（X）＝5×＝.
（2）设事件“Y＝n”表示前n－1次试验只成功了1次，且第n次试验成功，
故P（Y＝n）＝××（）n－2×＝×（）n－2，
当n为偶数时，
P（AB）＝P（2）＋P（4）＋…＋P（n）＝［1·（）0＋3·（）2＋…＋（n－1）·（）n－2］，
令Sn＝1·（）0＋3·（）2＋…＋（n－1）·（）n－2，
则Sn＝1·（）2＋3·（）4＋…＋（n－1）·（）n，
两式相减得：Sn＝1＋2［（）2＋（）4＋…＋（）n－2］－（n－1）·（）n，
则Sn＝－（）n·（＋n），
即P（AB）＝－（＋n）·（）n.
当n为奇数时，同理可得
P（AB）＝P（2）＋P（4）＋…＋P（n－1）＝［1·（）0＋3·（）2＋…＋（n－2）·（）n－3］
＝－（ n＋）·（）n－1，
综上，P（AB）＝
感悟提升
概率统计与数列交汇的常见题型
（1）求通项公式：关键是找出概率Pn或数学期望E（Xn）的递推关系式，然后根据构造法（一般构造等比数列），求出通项公式；
（2）求和：主要是数列中的倒序求和、错位求和、裂项求和；
（3）利用等差、等比数列的性质，研究单调性、最值或求极限.
考向2　概率统计与函数
【例3】　（2024·邵阳第二次联考）为了选拔创新型人才，某大学对高三年级学生的数学学科和物理学科进行了检测（检测分为初试和复试），共有4万名学生参加初试.组织者随机抽取了200名学生的初试成绩，绘制了频率分布直方图，如图所示.
（1）根据频率分布直方图，求a的值及样本平均数的估计值；
（2）若所有学生的初试成绩X近似服从正态分布N（μ，σ2），其中μ为样本平均数的估计值，σ＝10.5.规定初试成绩不低于90分的学生才能参加复试，试估计能参加复试的人数；
（3）复试笔试试题包括两道数学题和一道物理题，已知小明进入了复试，且在复试笔试中答对每一道数学题的概率均为x，答对物理题的概率为y.若小明全部答对的概率为，答对两道题的概率为P，求概率P的最小值.
解：（1）∵10×（0.012＋0.026＋0.032＋a＋0.01）＝1，∴a＝0.02.
样本平均数的估计值为50×0.12＋60×0.26＋70×0.32＋80×0.2＋90×0.1＝69.
（2）∵μ＝69，σ＝10.5.
∴P（X≥90）＝P（X≥μ＋2σ）≈＝0.022 75.
∴能参加复试的人数约为40 000×0.022 75＝910.
（3）由题意有x2y＝.
答对两道题的概率P＝x2（1－y）＋x（1－x）y＝x2＋2xy－3x2y.
而x2y＝，∴P＝x2＋－.
令f（x）＝x2＋－（0＜x≤1），
则f'（x）＝2x－＝，
∴当x∈（ 0，）时，f'（x）＜0，f（x）在（ 0，）内单调递减；
当x∈（，1］时，f'（x）＞0，f（x）在（，1］内单调递增.
∴当x＝时，f（x）min＝.故概率P的最小值为.
感悟提升
　　通过设置变量，利用数学期望、方差或概率的计算公式构造函数，是解决概率统计与函数结合问题最常用的方式.解决此类问题，应注意两点：
（1）准确构造函数，利用公式搭建函数模型时，由于随机变量的数学期望、方差及随机事件概率的计算中涉及的变量较多，式子较为复杂，所以准确运算化简是关键；
（2）注意变量的取值范围，一是题中给出的范围，二是实际问题中变量自身取值的限制.
　（2024·菏泽三模）2024年7月26日至8月11日在法国巴黎举行夏季奥运会.为了普及奥运知识，M大学举办了一次奥运知识竞赛，竞赛分为初赛与决赛，初赛通过后才能参加决赛.
（1）初赛从6道题中任选2题作答，2题均答对则进入决赛.已知这6道题中小王能答对其中4道题，记小王在初赛中答对的题目个数为X，求X的数学期望以及小王在已经答对一题的前提下，仍未进入决赛的概率；
（2）M大学为鼓励大学生踊跃参赛并取得佳绩，对进入决赛的参赛大学生给予一定的奖励.奖励规则如下：已进入决赛的参赛大学生允许连续抽奖3次，中奖1次奖励120元，中奖2次奖励180元，中奖3次奖励360元，若3次均未中奖，则只奖励60元.假定每次抽奖中奖的概率均为p（ 0＜p＜），且每次是否中奖相互独立.
①记一名进入决赛的大学生恰好中奖1次的概率为f（p），求f（p）的极大值；
②M大学数学系共有9名大学生进入了决赛，若这9名大学生获得的总奖金的期望值不小于1 120元，试求此时p的取值范围.
解：（1）由题意知，X的可能取值为0，1，2，
则P（X＝0）＝＝，
P（X＝1）＝＝，
P（X＝2）＝＝，
故X的分布列为
X 0 1 2
P
则E（X）＝0×＋1×＋2×＝.
记事件A：小王已经答对一题，事件B：小王未进入决赛，
则小王在已经答对一题的前提下，仍未进入决赛的概率
P（B｜A）＝＝＝＝.
（2）①由题意知，f（p）＝p（1－p）2
＝3p3－6p2＋3p（ 0＜p＜），
则f'（p）＝3（3p－1）（p－1），
令f'（p）＝0，解得p＝或p＝1（舍），
当p∈（ 0，）时，f'（p）＞0，当p∈（，）时，f'（p）＜0，
所以f（p）在区间（ 0，）内单调递增，在区间（，）内单调递减，
所以当p＝时，f（p）有极大值，且f（p）的极大值为f（）＝.
②由题可设每名进入决赛的大学生获得的奖金为随机变量Y，
则Y的可能取值为60，120，180，360，
P（Y＝60）＝（1－p）3，
P（Y＝120）＝p（1－p）2，
P（Y＝180）＝p2（1－p），
P（Y＝360）＝p3，
所以E（Y）＝60（1－p）3＋120p（1－p）2＋180p2（1－p）＋360p3＝60（2p3＋3p＋1），
所以9E（Y）≥1 120，
即540（2p3＋3p＋1）≥1 120，
整理得2p3＋3p－≥0，
经观察可知p＝是方程2p3＋3p－＝0的根，
故2p3＋3p－＝2（ p3－p2）＋（ p2－p）＋（ p－）＝（ p－）（ 2p2＋p＋），
因为2p2＋p＋＞0恒成立，
所以由2p3＋3p－≥0可得p－≥0，解得p≥，
又0＜p＜，所以p的取值范围为［，）.
概率统计中的新定义问题
【例4】　若ξ，η是样本空间Ω上的两个离散型随机变量，则称（ξ，η）是Ω上的二维离散型随机变量或二维随机变量.设（ξ，η）的一切可能取值为（ai，bj），i，j＝1，2，…，记Pij表示（ai，bj）在Ω中出现的概率，其中Pij＝P（ξ＝ai，η＝bj）＝P[（ξ＝ai）∩（η＝bj）].
（1）将三个相同的小球等可能地放入编号为1，2，3的三个盒子中，记1号盒子中的小球个数为ξ，2号盒子中的小球个数为η，则（ξ，η）是一个二维随机变量.
①写出该二维离散型随机变量（ξ，η）的所有可能取值；
②若（m，n）是①中的值，求P（ξ＝m，η＝n）（结果用m，n表示）.
（2）P（ξ＝ai）称为二维离散型随机变量（ξ，η）关于ξ的边缘分布律或边际分布律，求证：P（ξ＝ai）＝Pij.
解：（1）①二维离散型随机变量（ξ，η）的所有可能取值为（0，0），（0，1），（0，2），（0，3），（1，0），（1，1），（1，2），（2，0），（2，1），（3，0）.
②由题意得0≤m＋n≤3，
P（ξ＝m，η＝n）＝P（ξ＝m｜η＝n）·P（η＝n），
因为P（η＝n）＝（）n（）3－n.
P（ξ＝m｜η＝n）＝（）m（）3－n－m＝（）3－n，
所以P（ξ＝m，η＝n）＝（）3－n·（）n·（）3－n＝＝·.
（2）证明：由定义及全概率公式知：
P（ξ＝ai）＝P{（ξ＝ai）∩[（η＝b1）∪（η＝b2）∪…∪（η＝bj）∪…]}
＝P{[（ξ＝ai）∩（η＝b1）]∪[（ξ＝ai）∩（η＝b2）]∪…∪[（ξ＝ai）∩（η＝bj）]∪…}
＝P[（ξ＝ai）∩（η＝b1）]＋P[（ξ＝ai）∩（η＝b2）]＋…＋P[（ξ＝ai）∩（η＝bj）]＋…
＝P[（ξ＝ai）∩（η＝bj）]＝P（ξ＝ai，η＝bj）
＝Pij.
感悟提升
　　解决概率统计中新定义问题的过程可以概括为“过三关”：第一关，准确转化关，即要解决新定义问题，一定要理解题目中定义的本质含义，紧扣题目所给的新定义、新运算法则、新符号等对所求问题进行恰当转化；第二关，方法选取关，对此类题可以采取特例法，从逻辑推理的角度进行转化，理解题目中定义的本质并进行推广、运算；第三关，审读题目关，严格按照新定义的要求，解答问题时要避免教材知识或者已有知识对信息的干扰，也就是突破思维定式或固有的已知信息束缚，按新定义寻求解决问题的方法.
　（2024·河南九师联盟）设离散型随机变量X和Y的分布列分别为P（X＝k）＝xk，P（Y＝k）＝yk，xk＞0，yk＞0，k＝0，1，2，…，n，xk＝yk＝1.定义D（X｜｜Y）＝xkln，用来刻画X和Y的相似程度，设X～B（n，p），0＜p＜1.
（1）若n＝3，p＝，Y～B（ 3，），求D（X｜｜Y）；
（2）若n＝2，且Y的分布列为
Y 0 1 2
P
求D（X｜｜Y）的最小值；
（3）对任意与X有相同可能取值的随机变量Y，证明，D（X｜｜Y）的值不可能为负数.
解：（1）因为X～B（ 3，），所以xk＝P（X＝k）＝（）k（）3－k＝（k＝0，1，2，3），
因为Y～B（ 3，），所以yk＝P（Y＝k）＝（）k·（）3－k＝（k＝0，1，2，3），
所以＝＝23－2k（k＝0，1，2，3），
所以D（X｜｜Y）＝xkln＝××ln 23＋××ln 2＋××ln 2－1＋××ln 2－3＝ln 2.
（2）因为xk＝P（X＝k）＝pk（1－p）2－k（k＝0，1，2），
y0＝P（Y＝0）＝，y1＝P（Y＝1）＝，y2＝P（Y＝2）＝，
所以D（X｜｜Y）＝xkln
＝x0ln＋x1ln＋x2ln
＝（1－p）2ln[6（1－p）2]＋2p（1－p）ln[3p（1－p）]＋p2ln（6p2）.
令f（p）＝（1－p）2ln[6（1－p）2]＋2p（1－p）ln[3p（1－p）]＋p2ln（6p2），
则f'（p）＝－2（1－p）ln[6（1－p）2]－2（1－p）＋（2－4p）ln[3p（1－p）]＋2－4p＋2pln（6p2）＋2p
＝（－2＋4p）ln 6－2ln（1－p）＋2ln p＋（2－4p）ln 3
＝2ln p－2ln（1－p）＋（4p－2）ln 2，
令g（p）＝2ln p－2ln（1－p）＋（4p－2）ln 2，
则g'（p）＝＋＋4ln 2，
因为0＜p＜1，所以g'（p）＞0，故g（p）在（0，1）上单调递增，
又g（）＝0，所以当0＜p＜时，g（p）＜0，即f'（p）＜0，当＜p＜1时，g（p）＞0，即f'（p）＞0，
所以f（p）在（ 0，）上单调递减，在（，1）上单调递增，
所以f（p）min＝f（）＝ln.
（3）证明：令φ（x）＝ln x－x＋1，则φ'（x）＝－1＝.易得当x∈（0，1）时，φ'（x）＞0，当x∈（1，＋∞）时，φ'（x）＜0，故φ（x）在（0，1）上单调递增，在（1，＋∞）上单调递减，
所以 x∈（0，＋∞），φ（x）≤φ（1）＝0，
所以ln x≤x－1，所以ln≤－1，
所以ln x≥1－，
所以D（X｜｜Y）＝xkln≥xk（ 1－）
＝（xk－yk）＝xk－yk＝1－1＝0，
即D（X｜｜Y）的值不可能为负.
　　
1.某大学有A，B两个餐厅为学生提供午餐与晚餐服务，甲、乙两位学生每天午餐和晚餐都在学校就餐，近100天选择餐厅就餐情况统计如下：
选择餐厅情况（午餐，晚餐）（A，A）（A，B）（B，A）（B，B）
甲 30天 20天 40天 10天
乙 20天 25天 15天 40天
（1）假设甲、乙选择餐厅相互独立，用频率估计概率，计算某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率；
（2）某天午餐，甲和乙两名同学准备去A，B这两个餐厅中某一个就餐.设事件M＝“甲选择A餐厅就餐”，事件N＝“乙选择A餐厅就餐”，P（M）＞0，P（N）＞0.若P（｜N）＝P（｜），证明：事件M和N相互独立.
解：（1）设“某天中午甲去A餐厅用餐”为事件A，
“该天晚上甲去B餐厅用餐”为事件B，
由题知n（A）＝50，n（AB）＝20，
所以P（B｜A）＝＝0.4.
所以某天甲同学午餐去A餐厅用餐的情况下晚餐去B餐厅用餐的概率为0.4.
（2）证明：由P（｜N）＝P（｜），
可知＝＝，
所以P（N）－P（N）P（N）＝P（）P（N）－P（N）P（N），
即P（N）＝P（）P（N），
所以P（N）－P（MN）＝[1－P（M）]P（N），
得P（MN）＝P（M）P（N），
即M和N相互独立得证.
2.（2024·杭州模拟）马尔科夫链是概率统计中的一个重要模型，也是机器学习和人工智能的基石，在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为：假设我们的序列状态是…，Xt－2，Xt－1，Xt，Xt＋1，…，那么Xt＋1状态下的条件概率仅依赖前一状态Xt，即P（Xt＋1｜…，Xt－2，Xt－1，Xt）＝P（Xt＋1｜Xt）.
现实生活中也存在着许多马尔科夫链，例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏，每局赌徒赌赢的概率为50%，且每局赌赢可以赢得1元，每局赌徒赌输的概率为50%，且每局赌输就要输掉1元.赌徒会一直玩下去，直到遇到如下两种情况才会结束赌博游戏：一种是手中赌金为0元，即赌徒输光；一种是赌金达到预期的B元，赌徒停止赌博.记赌徒的本金为A（A∈N*，A＜B）元，赌博过程如图所示.
当赌徒手中有n元（0≤n≤B，n∈N）时，最终输光的概率为P（n），请回答下列问题：
（1）请直接写出P（0）与P（B）；
（2）证明{P（n）}是一个等差数列，并写出公差d；
（3）当A＝100时，分别计算B＝200，B＝1 000时P（A）的值，并结合实际解释当B→＋∞时P（A）的统计含义.
解：（1）当n＝0时，赌徒已经输光了，因此P（0）＝1.
当n＝B时，赌徒停止赌博，因此输光的概率P（B）＝0.
（2）记赌徒手中有n元时最终输光为事件M，记赌徒手中有n元时上一局赌赢为事件N，则根据全概率公式可得，P（M）＝P（N）P（M｜N）＋P（）P（M｜），
即P（n）＝P（n－1）＋P（n＋1），
所以P（n）－P（n－1）＝P（n＋1）－P（n），
所以{P（n）}是一个等差数列.
设P（n）－P（n－1）＝d，
则P（n－1）－P（n－2）＝d，…，P（1）－P（0）＝d，
累加得P（n）－P（0）＝nd，故P（B）－P（0）＝Bd，得d＝－.
（3）当A＝100时，由P（n）－P（0）＝nd得P（A）－P（0）＝Ad，即P（A）＝1－，
当B＝200时，P（A）＝50%，
当B＝1 000时，P（A）＝90%.
当B→＋∞时，P（A）→1，
因此可知久赌无赢家，即便是一个这样看似公平的游戏，只要赌徒一直玩下去就几乎有100%的概率输光.
3.（2024·汕头一模）2023年11月，我国教育部发布了《中小学实验教学基本目录》，内容包括高中数学在内共有16个学科900多项实验与实践活动.我市某学校的数学老师组织学生到“牛田洋”进行科学实践活动，在某种植番石榴的果园中，老师建议学生尝试去摘全园最大的番石榴，规定只能摘一次，并且只可以向前走，不能回头.结果，学生小明两手空空走出果园，因为他不知道前面是否有更大的，所以没有摘，走到前面时，又发觉总不及之前见到的，最后什么也没摘到.假设小明在果园中一共会遇到n个番石榴（不妨设n个番石榴的大小各不相同），最大的那个番石榴出现在各个位置上的概率相等，为了尽可能在这些番石榴中摘到那个最大的，小明在老师的指导下采用了如下策略：不摘前k（1≤k＜n）个番石榴，自第k＋1个开始，只要发现比他前面见过的番石榴大的，就摘这个番石榴，否则就摘最后一个.设k＝tn，记小明摘到那个最大番石榴的概率为P.
（1）若n＝4，k＝2，求P；
（2）当n趋向于无穷大时，从理论的角度，求P的最大值及P取最大值时t的值.
（取＋＋…＋＝ln）
解：（1）依题意，4个番石榴的位置从第1个到第4个排序，有＝24种情况，
要摘到那个最大的番石榴，有以下两种情况：
①最大的番石榴是第3个，其他的随意在哪个位置，有＝6种情况；
②最大的番石榴是最后1个，第二大的番石榴是第1个或第2个，其他的随意在哪个位置，有2＝4种情况，所以所求概率为＝.
（2）记事件A表示最大的番石榴被摘到，事件Bi表示最大的番石榴排在第i个，则P（Bi）＝，由全概率公式知：P（A）＝P（A｜Bi）P（Bi）＝（A｜Bi），
当1≤i≤k时，最大的番石榴在前k个中，不会被摘到，此时P（A｜Bi）＝0；
当k＋1≤i≤n时，最大的番石榴被摘到，当且仅当前i－1个番石榴中的最大一个在前k个之中时，此时P（A｜Bi）＝，
因此P（A）＝（＋＋…＋）＝ln，
令g（x）＝ln（x＞0），求导得g'（x）＝ln－，由g'（x）＝0，得x＝，
当x∈（ 0，）时，g'（x）＞0，当x∈（，n）时，g'（x）＜0，
即函数g（x）在（ 0，）上单调递增，在（，n）上单调递减，
则g（x）max＝g（）＝，于是当k＝时，P（A）＝ln取得最大值，
所以P的最大值为，此时t的值为.
4.在数字1，2，…，n（n≥2）的任意一个排列A：a1，a2，…，an中，如果对于i，j∈N*，i＜j，有ai＞aj，那么就称（ai，aj）为一个逆序对.记排列A中逆序对的个数为S（A）.如n＝4时，在排列B：3，2，4，1中，逆序对有（3，2），（3，1），（2，1），（4，1），则S（B）＝4.
（1）设排列C：a1，a2，a3，a4，写出两组具体的排列C，分别满足：①S（C）＝5，②S（C）＝4；
（2）对于数字1，2，…，n的一切排列A，求所有S（A）的算术平均值；
（3）如果把排列A：a1，a2，…，an中两个数字ai，aj（i＜j）交换位置，而其余数字的位置保持不变，那么就得到一个新的排列A'：b1，b2，…，bn，求证：S（A）＋S（A'）为奇数.
解：（1）①C：4，2，3，1，则逆序对有（4，2），（4，3），（2，1），（4，1），（3，1），则S（C）＝5；
②C：2，4，3，1，则逆序对有（4，3），（3，1），（4，1），（2，1），则S（C）＝4.
（2）考虑排列D：d1，d2，…，dn－1，dn与排列D1：dn，dn－1，…，d2，d1，
因为数对（di，dj）与（dj，di）中必有一个为逆序对（其中1≤i＜j≤n），
且排列D中数对（di，dj）共有＝个，
所以S（D）＋S（D1）＝.
所以排列D与D1的逆序对的个数的算术平均值为.
而对于数字1，2，…，n的任意一个排列A：a1，a2，…，an，都可以构造排列A1：an，an－1，…，a2，a1，且这两个排列的逆序对的个数的算术平均值为.
所以所有S（A）的算术平均值为.
（3）证明：①当j＝i＋1，即ai，aj相邻时，
不妨设ai＜ai＋1，则排列A'为a1，a2，…，ai－1，ai＋1，ai，ai＋2，…，an，
此时排列A'与排列A：a1，a2，…，an相比，仅多了一个逆序对（ai＋1，ai），
所以S（A'）＝S（A）＋1，
所以S（A）＋S（A'）＝2S（A）＋1为奇数.
②当j≠i＋1，即ai，aj不相邻时，
假设ai，aj之间有m个数字，记排列A：a1，a2，…，ai，k1，k2，…，km，aj，…，an，
先将ai向右移动一个位置，得到排列A1：a1，a2，…，ai－1，k1，ai，k2，…，km，aj，…，an，
由①，知S（A1）与S（A）的奇偶性不同，
再将ai向右移动一个位置，得到排列A2：a1，a2，…，ai－1，k1，k2，ai，k3，…，km，aj，…，an，
由①，知S（A2）与S（A1）的奇偶性不同，
以此类推，ai共向右移动m次，得到排列Am：a1，a2，…，k1，k2，…，km，ai，aj，…，an，
再将aj向左移动一个位置，得到排列Am＋1：a1，a2，…，ai－1，k1，…，km，aj，ai，…，an，
以此类推，aj共向左移动m＋1次，得到排列A2m＋1：a1，a2，…，aj，k1，…，km，ai，…，an，
即为排列A'，
由①可知仅有相邻两数的位置发生变化时，排列的逆序对个数的奇偶性发生变化，
而排列A经过2m＋1次的前后两数交换位置，可以得到排列A'，
所以排列A与排列A'的逆序数的奇偶性不同，
所以S（A）＋S（A'）为奇数.
综上，得S（A）＋S（A'）为奇数.
11 / 11

点击下载

同课章节目录

点击下载

VIP下载

《直通名校》专题六 培优点2 概率与统计中的创新问题（学生版+教师版 讲义）-高考数学大二轮专题复习

文档属性

文档简介

《直通名校》专题六培优点2　概率与统计中的创新问题（学生版+教师版讲义）-高考数学大二轮专题复习