第七章 随机变量及其分布章末复习课
一、条件概率与全概率公式
1.求条件概率有两种方法:一种是基于样本空间Ω,先计算P(A)和P(AB),再利用P(B|A)=求解;另一种是缩小样本空间,即以A为样本空间计算AB的概率.
2.掌握条件概率与全概率运算,重点提升逻辑推理和数学运算的核心素养.
例1 采购员要购买10个一包的电器元件.他的采购方法是:从一包中随机抽查3个,如果这3个元件都是好的,他才买下这一包.假定含有4个次品的包数占30%,而其余包中各含1个次品.求:
(1)采购员拒绝购买的概率;
(2)在采购员拒绝购买的条件下,抽中的一包中含有4个次品的概率.
反思感悟 计算条件概率要注意以下三点
(1)明白是在谁的条件下,计算谁的概率.
(2)明确P(A),P(B|A)以及P(AB)三者间的关系,实现三者间的互化.
(3)理解全概率公式P(A)=(Bi)P(A|Bi)中化整为零的计算思想.
跟踪训练1 为了提升全民身体素质,学校十分重视学生体育锻炼,某校篮球运动员进行投篮练习.如果他前一球投进,则后一球投进的概率为;如果他前一球投不进,则后一球投进的概率为.若他第1球投进的概率为,则他第2球投进的概率为( )
A. B. C. D.
二、离散型随机变量的分布列、均值和方差
1.均值和方差都是随机变量的重要的数字特征,方差是建立在均值的基础之上,它表明了随机变量所取的值相对于它的均值的集中与离散程度,二者的联系密切,在现实生产生活中的应用比较广泛.
2.掌握离散型随机变量的分布列、均值和方差,重点提升逻辑推理与运算的核心素养.
角度1 二项分布的均值、方差
例2 某厂有4台大型机器,在一个月中,一台机器至多出现1次故障,且每台机器是否出现故障是相互独立的,出现故障时需1名工人进行维修,每台机器出现故障需要维修的概率为.
(1)问该厂至少有多少名维修工人才能保证每台机器在任何时刻同时出现故障时能及时进行维修的概率不小于90%
(2)已知1名工人每月只有维修1台机器的能力,每月需支付给每位工人1万元的工资,每台机器不出现故障或出现故障能及时维修,能使该厂产生5万元的利润,否则将不产生利润.若该厂现有2名工人,求该厂每月获利的均值.
角度2 超几何分布的均值、方差
例3 某学院为了调查本校学生2023年4月“健康上网”(健康上网是指每天上网不超过两个小时)的天数情况,随机抽取了40名本校学生,统计他们在该月30天内健康上网的天数,并将所得的数据分成以下六组:[0,5],(5,10],(10,15],…,(25,30],由此画出样本的频率分布直方图,如图所示.
(1)根据频率分布直方图,求这40名学生中健康上网天数超过20的人数;
(2)现从这40名学生中任取2名,设Y为取出的2名学生中健康上网天数超过20的人数,求Y的分布列及均值E(Y).
反思感悟 (1)关于二项分布的应用
把握二项分布的关键是理解随机试验中n次、独立、重复这些字眼,即试验是多次进行,试验之间是相互独立的,每次试验的概率是相同的,判定随机变量符合二项分布后结合相应的公式进行计算.
(2)关于超几何分布的应用
不放回取次品是超几何分布的典型试验,可以将取球、选队员等试验归入超几何分布问题,再利用其概率、均值公式进行计算.
跟踪训练2 (1)设X服从两点分布,分布列为
X 0 1
P p q
其中p∈(0,1),则( )
A.E(X)=p,D(X)=p3
B.E(X)=p,D(X)=p2
C.E(X)=q,D(X)=q2
D.E(X)=1-p,D(X)=p-p2
(2)(多选)在一个袋中装有质地、大小一样的6个黑球,4个白球,现从中任取4个小球,设取出的4个小球中白球的个数为X,则下列结论正确的是( )
A.P(X=2)=
B.随机变量X服从二项分布
C.随机变量X服从超几何分布
D.E(X)=
三、正态分布的综合应用
解答正态分布的实际应用题,关键是如何转化,同时注意以下两点:
(1)注意“3σ”原则,记住正态总体在三个区间内取值的概率.
(2)注意数形结合.由于正态分布密度曲线具有完美的对称性,体现了数形结合的重要思想,因此运用对称性和结合图象解决某一区间内的概率问题成为热点问题.
例4 为保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设,某高校为了解全校学生的阅读情况,随机调查了200名学生的每周阅读时间x(单位:小时)并绘制成如图所示的频率分布直方图.
(1)求这200名学生每周阅读时间的样本平均数和样本方差s2(同一组的数据用该组区间中点值代表);
(2)由频率分布直方图可以看出,目前该校学生每周的阅读时间x大致服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①一般正态分布N(μ,σ2)的概率都可以转化为标准正态分布N(0,1)的概率进行计算:若X~N(μ,σ2),令Y=,则Y~N(0,1),且P(X≤a)=P.利用频率分布直方图得到的正态分布,求P;
②从该高校的学生中随机抽取20名,记Z表示这20名学生中每周阅读时间超过10小时的人数,求Z的均值.
参考数据:≈,若Y~N(0,1),则P(Y≤0.75)=0.773 4.
反思感悟 利用正态曲线解决实际问题时常利用其对称性解题,并注意借助[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率值求解,要注意正态曲线与频率分布直方图的结合.
跟踪训练3 为了调查某苹果园中苹果的生长情况,在苹果园中随机采摘了100个苹果.经整理分析后发现,苹果的重量x(单位:kg)近似服从正态分布N,如图所示,已知P=0.1,P=0.3.
(1)若从苹果园中随机采摘1个苹果,求该苹果的重量在内的概率;
(2)从这100个苹果中随机挑出8个,这8个苹果的重量情况如下:
重量范围(单位:kg)
个数 2 4 2
为进一步了解苹果的甜度,从这8个苹果中随机选出3个,记随机选出的3个苹果中重量在内的个数为X,求随机变量X的分布列和均值.
章末复习课
例1 解 设B1=“取到的一包含4个次品”,
B2=“取到的一包含1个次品”,
A=“采购员拒绝购买”,P(B1)=,P(B2)=.
P(A|B1)=1-=,
P(A|B2)=1-=.
(1)由全概率公式得到P(A)
=P(B1)P(A|B1)+P(B2)P(A|B2)
=×+×=.
(2)P(B1|A)=
==.
跟踪训练1 B [记事件A为“第1球投进”,事件B为“第2球投进”,
P(B|A)=,P(B|)=,
P(A)=,
由全概率公式可得
P(B)=P(A)P(B|A)+P()P(B|)
=2+2=.]
例2 解 (1)设“机器出现故障需要维修”为事件A,
则P(A)=.
设出现故障的机器台数为X,
则X~B,
P(X=0)=C×4=,
P(X=1)=C××3=,
P(X=2)=C×2×2
==,
P(X=3)=C×3×=,
P(X=4)=C×4=.
故X的分布列为
X 0 1 2 3 4
P
设该厂有n名工人,则“每台机器在任何时刻同时出现故障时能及时进行维修”为X≤n,即为X=0,X=1,X=2,…,X=n这n+1个互斥事件的和事件,则
n 0 1 2 3 4
P(X≤n) 1
因为<90%<,所以至少要3名工人,才能保证每台机器在任何时刻同时出现故障时能及时进行维修的概率不小于90%.
(2)设该厂获利为Y万元,则Y的所有可能取值为18,13,8,
P(Y=18)=P(X=0)+P(X=1)+P(X=2)=,
P(Y=13)=P(X=3)=,
P(Y=8)=P(X=4)=.
故Y的分布列为
Y 18 13 8
P
所以E(Y)=18×+13×+8×=(万元),故该厂每月获利的均值为万元.
例3 解 (1)由图可知,健康上网天数未超过20的频率为(0.01+0.02+0.03+0.09)×5=0.15×5=0.75,所以健康上网天数超过20的学生人数是40×(1-0.75)=40×0.25=10.
(2)随机变量Y的所有可能取值为0,1,2,
且Y服从超几何分布.
所以P(Y=0)==,
P(Y=1)==,
P(Y=2)==.
所以Y的分布列为
Y 0 1 2
P
所以Y的均值E(Y)=1×+2×=.
跟踪训练2 (1)D [X服从两点分布,则E(X)=q=1-p,
D(X)=p(1-p)=p-p2.]
(2)ACD [由题意知随机变量X服从超几何分布,故B错误,C正确;随机变量X的所有可能取值为0,1,2,3,4,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
P(X=4)==,
故E(X)=0×+1×+2×+3×+4×=,故A,D正确.]
例4 解 (1)根据频率分布直方图知,=6×0.03+7×0.1+8×0.2+9×0.35+10×0.19+11×0.09+12×0.04=9,
s2=(6-9)2×0.03+(7-9)2×0.1+(8-9)2×0.2+(9-9)2×0.35+(10-9)2×0.19+(11-9)2×0.09+(12-9)2×0.04=1.78,
所以样本平均数和样本方差s2分别为9,1.78.
(2)①由题意知μ=9,σ2=1.78,
则有X~N(9,1.78),
σ==≈,
P(X≤10)=P
=P(Y≤0.75)
=0.773 4.
②由①知P(X>10)=1-P(X≤10)=0.226 6,
可得Z~B(20,0.226 6),
所以Z的均值E(Z)=20×0.226 6
=4.532.
跟踪训练3 解 (1)已知苹果的重量x(单位:kg)近似服从正态分布N,
由正态分布的对称性可知,
P
=P
=P-P
=0.3-0.1=0.2,
所以从苹果园中随机采摘1个苹果,该苹果的重量在(0.5,0.7]内的概率为0.2.
(2)由题意可知,随机变量X的所有可能取值为1,2,3,
P==,
P==,
P==,
所以随机变量X的分布列为
X 1 2 3
P
所以E=1×+2×+3×=.