7.3.1 离散型随机变量的均值
学习目标
1.理解离散型随机变量的均值的意义和性质.
2.会根据离散型随机变量的分布列求出均值.
3.会利用离散型随机变量的均值解决一些相关的实际问题.
重点难点
重点:离散型随机变量的均值的意义和性质
难点:用离散型随机变量的均值解决一些相关的实际问题
知识梳理
1. 随机变量X的均值:一般地,若离散型随机变量X的概率分布为:则称
X x1 x2 … xi … xn
P p1 p2 … pi … pn
为随机变量X的均值(mean)或数学期望(mathematical expectation),数学期望简称期望.均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
2. 两点分布的均值:一般地,如果随机变量X服从两点分布,
那么:
X 1 0
P p 1-p
3. 离散型随机变量的均值的性质:已知X是一个随机变量,且分布列如下表所示.
X … …
P … …
若X,Y是两个随机变量,且Y=aX+b,则有E(Y)=aE(X)+b,即随机变量X的线性函数的均值等于这个随机变量的均值E(X)的同一线性函数.特别地:
(1)当a=0时,E(b)=b,即常数的均值就是这个常数本身.
(2)当a=1时,E(X+b)=E(X)+b,即随机变量X与常数之和的均值等于X的均值与这个常数的和.
(3)当b=0时,E(aX)=aE(X),即常数与随机变量乘积的均值等于这个常数与随机变量的均值的乘积.
学习过程
问题探究
对于离散型随机变量,可以由它的概率分布列确定与该随机变量相关事件的概率。但在实际问题中,有时我们更感兴趣的是随机变量的某些数字特征。例如,要了解某班同学在一次数学测验中的总体水平,很重要的是看平均分;要了解某班同学数学成绩是否“两极分化”则需要考察这个班数学成绩的方差。
我们还常常希望直接通过数字来反映随机变量的某个方面的特征,最常用的有期望与方差.
探究1.甲乙两名射箭运动员射中目标靶的环数的分布列如下表所示:
如何比较他们射箭水平的高低呢?
环数X 7 8 9 10
甲射中的概率 0.1 0.2 0.3 0.4
乙射中的概率 0.15 0.25 0.4 0.2
二、典例解析
例1. 在篮球比赛中,罚球命中1次得1分,不中得0分,如果某运动员罚球命中的概率为0.8,那么他罚球1次的得分X的均值是多少
典例解
例2.抛掷一枚质地均匀的骰子,设出现的点数为X,求X的均值.
求离散型随机变量X的均值的步骤:
(1)理解X的实际意义,写出X全部可能取值;
(2)求出X取每个值时的概率;
(3)写出X的分布列(有时也可省略);
(4)利用定义公式求出均值
跟踪训练1.某地最近出台一项机动车驾照考试规定:每位考试者一年之内最多有4次参加考试的机会,一旦某次考试通过,即可领取驾照,不再参加以后的考试,否则就一直考到第4次为止.如果李明决定参加驾照考试,设他每次参加考试通过的概率依次为0.6,0.7,0.8,0.9,求在一年内李明参加驾照考试次数X的分布列和X的均值.
例3:猜歌名游戏是根据歌曲的主旋律制成的铃声来猜歌名.某嘉宾参加猜歌名节目,猜对每首歌曲的歌名相互独立,猜对三首歌曲A,B,C歌名的概率及猜对时获得相应的公益基金如下表所示:
规则如下:按照A,B,C的顺序猜,只有猜对当前歌曲的歌名才有资格猜下一首,求嘉宾获得的公益基金总额X的分布列及均值.
歌曲 A B C
猜对的概率 0.8 0.6 0.4
获得的公益基金额/元 1000 2000 3000
思考:如果改变猜歌的顺序,获得公益基金的均值是否相同?如果不同,你认为哪个顺序获得的公益基金均值最大?
例4.根据气象预报,某地区近期有小洪水的概率为0.25,有大洪水的概率为0.01,该地区某工地上有一台大型设备,遇到大洪水时要损失60000元,遇到小洪水时要损失10000元。为保护设备,有以下三种方案:
方案1:运走设备,搬运费为3800元。
方案2:建保护围墙,建设费为2000元,但围墙只能挡住小洪水。
方案3:不采取措施,希望不发生洪水。
工地的领导该如何决策呢
值得注意的是,上述结论是通过比较“期望总损失”而得出的,一般地,我们可以这样来理解“期望总损失”:如果问题中的天气状况多次发生,那么采用方案2将会使总损失减到最小,不过,因为洪水是否发生以及洪水发生的大小都是随机的,所以对于个别的一次决策,采用方案2也不一定是最好的.
达标检测
1.若随机变量X的分布列为
X -1 0 1
P
则E(X)=( )
A.0 B.-1 C.- D.-
2.某射手对靶射击,直到第一次命中为止,每次命中的概率为0.6,现有4颗子弹,命中后的剩余子弹数目X的数学期望为( )
A.2.44 B.3.376 C.2.376 D.2.4
3.已知ξ的分布列如下表,若η=3ξ+2,则E(η)= .
ξ 1 2 3
P t
4.设l为平面上过点(0,1)的直线,l的斜率等可能地取-2,-,-,0,,2.用X表示坐标原点到l的距离,则随机变量X的数学期望E(X)= .
5.口袋里装有大小相同的8张卡片,其中3张标有数字1,3张标有数字2,2张标有数字3.第一次从口袋里任意抽取1张,放回口袋里后第二次再任意抽取1张,记第一次与第二次取到卡片上数字之和为ξ.求:
(1)ξ为何值时,其发生的概率最大 并说明理由.
(2)随机变量ξ的数学期望E(ξ).
课堂小结
1.求离散型随机变量均值的步骤
(1)确定离散型随机变量X的取值;
(2)写出分布列,并检查分布列的正确与否;
(3)根据公式写出均值.
2.若X,Y是两个随机变量,且Y=aX+b,则E(Y)=aE(X)+b;如果一个随机变量服从两点分布,可直接利用公式计算均值.
参考答案
知识梳理
学习过程
问题探究
探究1.类似两组数据的比较,首先比较击中的平均环数,如果平均环数相等,再看稳定性.假设甲射箭n次,射中7环、8环、9环和10环的频率分别为:
甲n次射箭射中的平均环数
当n足够大时,频率稳定于概率,所以x稳定于7×0.1+8×0.2+9×0.3+10×0.4=9.
即甲射中平均环数的稳定值(理论平均值)为9,
这个平均值的大小可以反映甲运动员的射箭水平.
同理,乙射中环数的平均值为7×0.15+8×0.25+9×0.4+10×0.2=8.65.
从平均值的角度比较,甲的射箭水平比乙高.
二、典例解析
例1.分析:罚球有命中和不中两种可能结果,命中时X=1,不中时X=0,因此随机变量X服从两点分布,X的均值反映了该运动员罚球1次的平均得分水平.
解:因为P(X=1)=0.8,P(X=0)=0.2,
所以E(X)=1×P(X=1)+0×P(X=0)=1×0.8+0×0.2 =0.8
即该运动员罚球1次的得分X的均值是0.8.
例2.分析:先求出X的分布列,再根据定义计算X的均值。
解:X的分布列为 (X=k)= ,k=1,2,3,4,5,6
因此,E(X)= (1+2+3+4+5+6)=3.5.
跟踪训练1. [解] X的取值分别为1,2,3,4.
X=1,表明李明第一次参加驾照考试就通过了,
故P(X=1)=0.6.
X=2,表明李明第一次考试未通过,
第二次通过了,故P(X=2)=(1-0.6)×0.7=0.28.
X=3,表明李明第一、二次考试未通过,第三次通过了,
故P(X=3)=(1-0.6)×(1-0.7)×0.8=0.096.
X=4,表明李明第一、二、三次考试都未通过,
故P(X=4)=(1-0.6)×(1-0.7)×(1-0.8)=0.024.
所以李明一年内参加考试次数X的分布列为
X 1 2 3 4
P 0.6 0.28 0.096 0.024
所以X的均值为E(X)=1×0.6+2×0.28+3×0.096+4×0.024=1.544.
例3: 解:分别用A,B,C表示猜对歌曲A,B,C歌名的事件,A,B,C相互独立
( =0)=()=0.2,
( =1000)=(A)=0.8×0.4=0.32,
( =3000)= ( )=0.8×0.6×0.6=0.288,
( =6000)=( )=0.8×0.6×0.4=0.192.
X的分布列如下表所示:
X 0 1000 4000 6000
P 0.2 0.48 0.128 0.192
的均值为 ( )=0×0.2+1000×0.32+3000×0.288+6000×0.192=2336.
思考:解:如果按ACB的顺序来猜歌,分别用A,B,C表示猜对歌曲A,B,C歌名的事件,
A,B,C相互独立; ( =0)=()=0.2,
( =1000)=(A)=0.8×0.4=0.32,
( =3000)= ( C)=0.8×0.4×0.4=0.128,
( =6000)=( CB)=0.8×0.4×0.6=0.192.
X的分布列如下表所示:
X 0 1000 3000 6000
P 0.2 0.32 0.288 0.192
按由易到难的顺序来猜歌,获得的公益基金的均值最大
猜歌顺序 E(X)/元 猜歌顺序 E(X)/元
ABC 2336 BCA 2112
ACB 2144 CAB 1904
BAC 2256 CBA 1872
例4.分析:决策目标为总损失(投入费用与设备损失之和)越小越好,根据题意,各种方案在不同状态下的总损失如表所示:
天气状况
大洪水 小洪水 没有洪水
概率 0.01 0.25 0.74
总损失/元 方案1 3800 3800 3800
方案2 62000 2000 2000
方案3 60000 10000 0
方案2和方案3的总损失都是随机变量,可以采用期望总损失最小的方案。
解:设方案1、方案2、方案3的总损失分别为X1,X2,X3.
采用方案1,无论有无洪水,都损失3800元.因此,P(X1=3800)=1.
采用方案2,遇到大洪水时,总损失为2000+6000=62000元;没有大洪水时,
总损失为2000元,因此,P(X2=62 000)=0.01,P(X2=2000)=0.99.
采用方案3,P(X3=60 000)=0.01,P(X3=10000)=0.25,P(X3=0)=0.74.
于是,E(X1)=3800,
E(X2)=62 000×0.01+2 000×0.99=2 600,
E(X3)=60 000×0.01+10 000×0.25+0×0.74=3 100.
因此,从期望损失最小的角度,应采取方案2.
达标检测
1.C [E(X)=(-1)×+0×+1×=-.]
2.解析:X的可能取值为3,2,1,0,P(X=3)=0.6;
P(X=2)=0.4×0.6=0.24;
P(X=1)=0.42×0.6=0.096;
P(X=0)=0.43=0.064.
所以E(X)=3×0.6+2×0.24+1×0.096+0×0.064=2.376.
答案:C
3.解析:因为+t+=1,所以t=.
E(ξ)=1×+2×+3×.
E(η)=E(3ξ+2)=3E(ξ)+2=3×+2=.
答案:
4.解析:当l的斜率k=±2时,直线方程为±2x-y+1=0,此时d1=;k=±时,直线方程为±x-y+1=0,此时d2=;k=±时,直线方程为±x-y+1=0,此时d3=;k=0时,直线方程为y-1=0,此时d4=1.由等可能性事件的概率可得分布列为
X 1
P
所以E(X)=+1×.
答案:
5.解:(1)随机变量ξ的可能取值是2,3,4,5,6,
当ξ=4时,其发生的概率最大.
因为P(ξ=2)=,
P(ξ=3)=,
P(ξ=4)=,
P(ξ=5)=,
P(ξ=6)=.
故当ξ=4时满足题意.
(2)E(ξ)=2×+3×+4×+5×+6×.
17.3.2 离散型随机变量的方差
学习目标
1.通过实例,理解取有限个值的离散型随机变量的方差、标准差的概念和意义.
2.会求离散型随机变量的方差、标准差.
3.会利用离散型随机变量的方差、标准差解决一些实际问题.
重点难点
重点:理解离散型随机变量的方差、标准差的概念及其求解
难点:利用离散型随机变量的方差、标准差解决一些实际问题.
知识梳理
1.离散型随机变量取值的方差
一般地,若离散型随机变量X的概率分布列为:
X x1 x2 … xi … xn
P p1 p2 … pi … pn
则称
为随机变量X的方差,有时也记为Var(X).
称为随机变量X的标准差。
2、离散型随机变量ξ的期望与方差的性质
名词 数学期望 方差
定义 E(ξ)=ξ1p1+ξ2p2+…+ξnpn D(ξ)=[ξ1-E(ξ)]2p1+[ξ2-E(ξ)]2p2+…+[ξn-E(ξ)]2pn
性质 (1)E(a)=a(a为常数) (2)E(aξ)=aE(ξ)(a≠0) (3)E(aξ+b)=aE(ξ)+b(a,b为常数,且a≠0) (1)D(a)=0(a为常数) (2)D(aξ)=a2D(ξ)(a≠0) (3)D(aξ+b)=a2D(ξ)(a,b为常数,且a≠0)
数学 意义 E(ξ)是一个常数,它反映了随机变量取值的平均水平,亦称均值 D(ξ)是一个常数,它反映了随机变量取值的稳定与波动、集中与离散的程度
学习过程
问题探究
随机变量的均值是一个重要的数字特征,它反映了随机变量取值的平均水平或分布的“集中趋势” .因为随机变量的取值围绕其均值波动,而随机变量的均值无法反映波动幅度的大小,所以我们还需要寻找反映随机变量取值波动大小的数字特征.
探究1:从两名同学中挑出一名代表班级参加射击比赛。根据以往的成绩记录,甲、乙两名同学击中目标靶的环数X和Y的分布列如下表1和表2所示:如何评价这两名同学的射击水平?
探究2:怎样定量到留离散型随机变量取值的离散程度
问题1.某人射击10次,所得环数分别是:1,1,1,1,2,2,2,3,3,4;则所得的平均环数是多少?
问题2.某人射击10次,所得环数分别是:1,1,1,1,2,2,2,3,3,4;则这组数据的方差是多少?
问题3:方差的计算可以简化吗?
问题4:离散型随机变量X加上一个常数,方差会有怎样变化?离散型随机变量X乘以一个常数,方差又有怎样的变化?它们和期望的性质有什么不同?
二、典例解析
例1:抛掷一枚质地均匀的骰子,求掷出的点数X的方差。
方差的计算方法
方差的计算需要一定的运算能力,在随机变量X2的均值比较好计算的情况下,运用关系式D(X)=E(X2)-[E(X)]2不失为一种比较实用的方法.另外注意方差性质的应用,如D(aX+b)=a2D(X)(a≠0).
跟踪训练1 已知η的分布列为
(1)求η的方差及标准差;
(2)设Y=2η-E(η),求D(Y).
η 0 10 20 50 60
P
例2:投资A、B两种股票,每股收益的分布列分别如表1和表二所示:
收益X/元 -1 0 2
概率 0.1 0.3 0.6
表1
收益X/元 0 1 2
概率 0.3 0.4 0.3
表2
(1)投资哪种股票的期望收益大?
(2)投资哪种股票的风险较高?
利用均值和方差的意义解决实际问题的步骤
1.比较均值.离散型随机变量的均值反映了离散型随机变量取值的平均水平,因此,在实际决策问题中,需先计算均值,看一下谁的平均水平高.
2.在均值相等或接近的情况下计算方差.方差反映了离散型随机变量取值的稳定与波动、集中与离散的程度.通过计算方差,分析一下谁的水平发挥相对稳定.
3.下结论.依据均值和方差做出结论.
跟踪训练2. A、B两个投资项目的利润率分别为随机变量X1和X2,根据市场分析, X1和X2的分布列分别为
X1 2% 8% 12% X2 5% 10%
P 0.2 0.5 0.3 P 0.8 0.2
求:(1)在A、B两个项目上各投资100万元, Y1和Y2分别表示投资项目A和B所获得的利润,求方差D(Y1)和D(Y2);
(2)根据得到的结论,对于投资者有什么建议?
达标检测
1.给出下列四个命题:
①离散型随机变量X的均值E(X)反映了X取值的平均值;
②离散型随机变量X的方差D(X)反映了X取值的平均水平;
③离散型随机变量X的均值E(X)反映了X取值的平均水平;
④离散型随机变量X的方差D(X)反映了X取值偏离于均值的平均程度.
则正确命题应该是( )
A.①④ B.②③ C.①② D.③④
2.把下面X的分布列填写完整:并完成问题
其中p∈(0,1),则E(X)=________,D(X)=________.
X 0 1
P P
3.已知离散型随机变量X的分布列如下表.若E(X)=0,D(X)=1,a= ,b= .
X -1 0 1 2
P a b c
4.甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相等,而两个保护区内每个季度发现违反保护条例的事件次数的分布列分别如下,
甲保护区:
X 0 1 2 3
P 0.3 0.3 0.2 0.2
乙保护区:
Y 0 1 2
P 0.1 0.5 0.4
试评定这两个保护区的管理水平.
参考答案
知识梳理
学习过程
问题探究
探究1: E(X)= 8 ;E(Y)=8
因为两个均值相等,所以均值不能区分这两名同学的射击水平。
表1
X 6 7 8 9 10
P 0.09 0.24 0.32 0.28 0.07
表2
X 6 7 8 9 10
P 0.07 0.22 0.38 0.3 0.03
射击水平除了要考虑击中环数的均值外,还要考虑稳定性,即击中环数的离散程度,图一和图二分别是X和Y的概率分布图:
发现乙同学的射击成绩更集中于8环,即乙同学的设计成绩更稳定。
探究2:我们知道,样本方差可以度量一组样本数据的离散程度,它是通过计算所有数据与样本均值的“偏差平方的平均值”来实现的,一个自然的想法是,随机变量的离散程度能否用可能取值与均值的“偏差平方的平均值”来度量呢
问题1.
X 1 2 3 4
P
问题2.
反映这组数据相对于平均值的集中程度的量
因此,问题1中两名同学射击成绩的方差和标准差来刻画它们成绩的稳定性。两名同学射击成绩的方差和标准差分别为:
因为D(Y)问题3:
问题4: 离散型随机变量X加上一个常数b,仅仅使X的值产生一个平移,不改变X与其均值的离散程度,方差保持不变,即D(X+b)= D(X)
而离散型随机变量X乘以一个常数a,其方差变为原方差的a2倍,即D(aX)=a2D(X)
因此,D(aX+b)=a2D(X).
二、典例解析
例1:
跟踪训练1 解:(1)∵E(η)=0×+10×+20×+50×+60×=16,
D(η)=(0-16)2×+(10-16)2×+(20-16)2×+(50-16)2×
+(60-16)2×=384,
∴=8.
(2)∵Y=2η-E(η),∴D(Y)=D(2η-E(η))=22D(η)=4×384=1 536.
例2: 解:(1)股票A和股票B投资收益的期望分别为
E(X)=(-1)x0.1+0x0.3+2x0.6=1.1,
E(Y)=0x0.3+1x0.4+2x0.3=1.
因为E(X)>E(Y),所以投资股票A的期望收益较大。
(2)股票A和股票B投资收益的方差分别为
D(X)=(-1)2x0.1+02x0.3+22x0.6-1.12=1.29,
D(Y)=02x0.3+12x0.4+22x0.3-12=0.6.
因为E(X)和E(Y)相差不大,且D(X)>D(Y),所以资股票A比投资股票B的风险高。
跟踪训练2. 解:(1)题目可知,投资项目A和B所获得的利润Y1和Y2的分布列为:
Y1 2 8 12 Y2 5 10
P 0.2 0.5 0.3 P 0.8 0.2
所以;
;
解:(2) 由(1)可知,说明投资A项目比投资B项目期望收益要高;
同时,说明投资A项目比投资B项目的实际收益相对于期望收益的平均波动要更大.
因此,对于追求稳定的投资者,投资B项目更合适;而对于更看重利润并且愿意为了高利润承担风险的投资者,投资A项目更合适.
达标检测
1.D
2.解析:而由已知分布列的性质有p+x=1,x=1-p
E(X)=0×(1-p)+1×p=p,
∴D(X)=(0-p)2(1-p)+(1-p)2p=p(1-p).
答案:1-p; p; p(1-p)
3.解析:由题知a+b+c=,-a+c+=0,12×a+12×c+22×=1,
解得a=,b=.
答案:
4.解:甲保护区违规次数X的数学期望和方差为
E(X)=0×0.3+1×0.3+2×0.2+3×0.2=1.3,
D(X)=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2+(3-1.3)2×0.2=1.21.
乙保护区的违规次数Y的数学期望和方差为
E(Y)=0×0.1+1×0.5+2×0.4=1.3,
D(Y)=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4=0.41.
因为E(X)=E(Y),D(X)>D(Y),所以两个保护区内每个季度发生的违规事件的平均次数相同,但甲保护区的违规事件次数相对分散和波动,乙保护区内的违规事件次数更加集中和稳定,所以乙保护区的管理水平比甲高.
1