§7.3 离散型随机变量的数字特征
7.3.1 离散型随机变量的均值
学习目标 1.通过实例理解离散型随机变量均值的概念,能计算简单离散型随机变量的均值.2.理解离散型随机变量均值的性质.3.掌握两点分布的均值.4.会利用离散型随机变量的均值,解决一些相关的实际问题.
知识点一 离散型随机变量的均值
1.离散型随机变量的均值的概念
一般地,若离散型随机变量X的分布列为
X x1 x2 … xi … xn
P p1 p2 … pi … pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn=ipi为随机变量X的均值或数学期望.
2.离散型随机变量的均值的意义
均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
3.离散型随机变量的均值的性质
若Y=aX+b,其中a,b均是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
证明如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y ax1+b ax2+b … axi+b … axn+b
P p1 p2 … pi … pn
于是有E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
思考 离散型随机变量的均值与样本平均值之间的关系如何?
答案 (1)区别:随机变量的均值是一个常数,它不依赖于样本的抽取,而样本平均值是一个随机变量,它随样本抽取的不同而变化.
(2)联系:对于简单的随机样本,随着样本容量的增加,样本平均值越来越接近于总体的均值.
知识点二 两点分布的均值
如果随机变量X服从两点分布,那么E(X)=0×(1-p)+1×p=p.
1.随机变量X的均值E(X)是个变量,其随X的变化而变化.( × )
2.随机变量的均值反映了样本的平均水平.( × )
3.若随机变量X的均值E(X)=2,则E(2X)=4.( √ )
4.若随机变量X服从两点分布,则E(X)=P(X=1).( √ )
一、利用定义求离散型随机变量的均值
例1 袋中有4只红球,3只黑球,现从袋中随机取出4只球,设取到一只红球得2分,取到一只黑球得1分,试求得分X的均值.
解 取出4只球颜色及得分分布情况是4红得8分,3红1黑得7分,2红2黑得6分,1红3黑得5分,因此,X的可能取值为5,6,7,8,
P(X=5)==,
P(X=6)==,
P(X=7)==,
P(X=8)==,
故X的分布列为
X 5 6 7 8
P
∴E(X)=5×+6×+7×+8×=.
反思感悟 求随机变量X的均值的方法和步骤
(1)理解随机变量X的意义,写出X所有可能的取值.
(2)求出X取每个值的概率P(X=k).
(3)写出X的分布列.
(4)利用均值的定义求E(X).
跟踪训练1 某卫视综艺节目中有一个环节叫“超级猜猜猜”,规则如下:在这一环节中嘉宾需要猜三道题目,若三道题目中猜对一道题目可得1分,若猜对两道题目可得3分,要是三道题目完全猜对可得6分,若三道题目全部猜错,则扣掉4分.如果嘉宾猜对这三道题目的概率分别为,,,且三道题目之间相互独立.求某嘉宾在该“猜题”环节中所得分数的分布列与均值.
解 根据题意,设X表示“该嘉宾所得分数”,则X的可能取值为-4,1,3,6.
∴P(X=-4)=××=,
P(X=1)=××+××+××=,
P(X=3)=××+××+××=,
P(X=6)=××==.
∴X的分布列为
X -4 1 3 6
P
∴E(X)=(-4)×+1×+3×+6×=.
二、离散型随机变量均值的性质
例2 已知随机变量X的分布列为
X -2 -1 0 1 2
P m
若Y=-2X,则E(Y)=________.
答案
解析 由随机变量分布列的性质,得
+++m+=1,解得m=,
∴E(X)=(-2)×+(-1)×+0×+1×+2×=-.
由Y=-2X,得E(Y)=-2E(X),
即E(Y)=-2×=.
延伸探究
本例条件不变,若ξ=aX+3,且E(ξ)=-,求a的值.
解 E(ξ)=E(aX+3)=aE(X)+3=-a+3=-,
所以a=15.
反思感悟 求线性关系的随机变量η=aξ+b的均值方法
(1)定义法:先列出η的分布列,再求均值.
(2)性质法:直接套用公式,E(η)=E(aξ+b)=aE(ξ)+b,求解即可.
跟踪训练2 已知随机变量ξ和η,其中η=12ξ+7,且E(η)=34,若ξ的分布列如下表,则m的值为( )
ξ 1 2 3 4
P m n
A. B. C. D.
答案 A
解析 因为η=12ξ+7,
则E(η)=12E(ξ)+7,
即E(η)=12×+7=34.
所以2m+3n=,①
又+m+n+=1,所以m+n=,②
由①②可解得m=.
三、均值的实际应用
例3 随机抽取某厂的某种产品200件,经质检,其中有一等品126件、二等品50件、三等品20件、次品4件.已知生产1件一、二、三等品获得的利润分别为6万元、2万元、1万元,而1件次品亏损2万元,设1件产品的利润(单位:万元)为X.
(1)求X的分布列;
(2)求1件产品的平均利润(即X的均值);
(3)经技术革新后,仍有四个等级的产品,但次品率降为1%,一等品率提高为70%.若此时要求1件产品的平均利润不小于4.73万元,则三等品率最多是多少?
解 (1)X的所有可能取值有6,2,1,-2,
P(X=6)==0.63,P(X=2)==0.25,
P(X=1)==0.1,P(X=-2)==0.02.
故X的分布列为
X 6 2 1 -2
P 0.63 0.25 0.1 0.02
(2)E(X)=6×0.63+2×0.25+1×0.1+(-2)×0.02=4.34(万元).
(3)设技术革新后的三等品率为x,则此时1件产品的平均利润为E(X)=6×0.7+2×(1-0.7-0.01-x)+1×x+(-2)×0.01=4.76-x(0≤x≤0.29),
依题意,E(X)≥4.73,即4.76-x≥4.73,
解得x≤0.03,所以三等品率最多为3%.
反思感悟 解答概率模型的三个步骤
(1)建模:即把实际问题概率模型化.
(2)解模:确定分布列,计算随机变量的均值.
(3)回归:利用所得数据,对实际问题作出判断.
跟踪训练3 受轿车在保修期内维修费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现故障的时间有关,某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年,现从该厂已售出的两种品牌轿车中随机抽取50辆,统计数据如下:
品牌 甲 乙
首次出现故障 时间x(年) 0
2 02
轿车数量(辆) 2 3 45 5 45
每辆利润(万元) 1 2 3 1.8 2.9
将频率视为概率,解答下列问题:
(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保修期内的概率;
(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X1,生产一辆乙品牌轿车的利润为X2,分别求X1,X2的分布列;
(3)该厂预计今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌轿车,若从经济效益的角度考虑,你认为应该生产哪种品牌的轿车?说明理由.
解 (1)设“甲品牌轿车首次出现故障发生在保修期内”为事件A,则P(A)==.
(2)依题意得,X1的分布列为
X1 1 2 3
P
X2的分布列为
X2 1.8 2.9
P
(3)由(2)得E(X1)=1×+2×+3×=2.86(万元).
E(X2)=1.8×+2.9×=2.79(万元).
∵E(X1)>E(X2),∴应生产甲品牌轿车.
1.已知离散型随机变量X的分布列为
X 1 2 3
P
则X的均值E(X)等于( )
A. B.2 C. D.3
答案 A
解析 E(X)=1×+2×+3×=.
2.抛掷一枚硬币,规定正面向上得1分,反面向上得-1分,则得分X的均值为( )
A.0 B. C.1 D.-1
答案 A
解析 因为P(X=1)=,P(X=-1)=,所以由均值的定义得E(X)=1×+(-1)×=0.
3.设ξ的分布列为
ξ 1 2 3 4
P
又设η=2ξ+5,则E(η)等于( )
A. B. C. D.
答案 D
解析 E(ξ)=1×+2×+3×+4×=,
E(η)=E(2ξ+5)=2E(ξ)+5=2×+5=.
4.若随机变量Y=aX+3,且E(Y)=,E(X)=-,则a=________.
答案 2
解析 ∵E(X)=-,E(Y)=,Y=aX+3,
∴aE(X)+3=,解得a=2.
5.某人进行一项试验,若试验成功,则停止试验,若试验失败,再重新试验一次,若试验3次均失败,则放弃试验.若此人每次试验成功的概率均为,则此人试验次数ξ的均值是________.
答案
解析 试验次数ξ的可能取值为1,2,3,
则P(ξ=1)=,
P(ξ=2)=×=,
P(ξ=3)=××=.
所以ξ的分布列为
ξ 1 2 3
P
所以E(ξ)=1×+2×+3×=.
1.知识清单:
(1)离散型随机变量的均值.
(2)离散型随机变量的均值的性质.
(3)两点分布的均值.
2.方法归纳:函数与方程、转化化归.
3.常见误区:不会应用均值对实际问题作出正确分析.
1.某便利店记录了100天某商品的日需求量(单位:件),整理得下表:
日需求量n 14 15 16 18 20
频率 0.1 0.2 0.3 0.2 0.2
试估计该商品日平均需求量为( )
A.16 B.16.2 C.16.6 D.16.8
答案 D
解析 估计该商品日平均需求量为14×0.1+15×0.2+16×0.3+18×0.2+20×0.2=16.8,故选D.
2.(多选)已知某一随机变量X的分布列如下,且E(X)=6.3,则( )
X 4 a 9
P 0.5 0.1 b
A.a=7 B.b=0.4
C.E(aX)=44.1 D.E(bX+a)=2.62
答案 ABC
解析 由题意和分布列的性质得0.5+0.1+b=1,
且E(X)=4×0.5+0.1a+9b=6.3,
解得b=0.4,a=7.
∴E(aX)=aE(X)=7×6.3=44.1,
E(bX+a)=bE(X)+a=0.4×6.3+7=9.52,
故ABC正确.
3.现有一个项目,对该项目每投资10万元,一年后利润是1.2万元,1.18万元,1.17万元的概率分别为,,,随机变量X表示对此项目投资10万元一年后的利润,则X的均值为( )
A.1.18 B.3.55 C.1.23 D.2.38
答案 A
解析 因为X的所有可能取值为1.2,1.18,1.17,
P(X=1.2)=,P(X=1.18)=,P(X=1.17)=,
所以X的分布列为
X 1.2 1.18 1.17
P
所以E(X)=1.2×+1.18×+1.17×=1.18.
4.袋中有10个大小相同的小球,其中记为0号的有4个,记为n号的有n个(n=1,2,3).现从袋中任取一球,X表示所取到球的标号,则E(X)等于( )
A.2 B. C. D.
答案 D
解析 由题意,可知X的所有可能取值为0,1,2,3.
P(X=0)=,P(X=1)=,P(X=2)=,
P(X=3)=.
∴E(X)=0×+1×+2×+3×=.
5.一个课外兴趣小组共有5名成员,其中3名女性成员,2名男性成员,现从中随机选取2名成员进行学习汇报,记选出女性成员的人数为X,则X的均值是( )
A. B. C. D.
答案 A
解析 由题意得,X的所有可能的取值为0,1,2,
P(X=0)==,
P(X=1)===,
P(X=2)==.
∴E(X)=0×+1×+2×=,故A正确.
6.已知E(Y)=6,Y=4X-2,则E(X)=________.
答案 2
解析 ∵Y=4X-2,E(Y)=4E(X)-2,
∴4E(X)-2=6,即E(X)=2.
7.离散型随机变量X的可能取值为1,2,3,4,P(X=k)=ak+b(k=1,2,3,4),E(X)=3,则a=________,b=________.
答案 0
解析 易知E(X)=1×(a+b)+2×(2a+b)+3×(3a+b)+4×(4a+b)=3,
即30a+10b=3.①
又(a+b)+(2a+b)+(3a+b)+(4a+b)=1,
即10a+4b=1,②
由①②,得a=,b=0.
8.某射手射击所得环数X的分布列如下:
X 7 8 9 10
P x 0.1 0.3 y
已知E(X)=8.9,则y的值为________.
答案 0.4
解析 由解得
9.盒中装有5节同牌号的五号电池,其中混有两节废电池.现无放回地每次取一节电池检验,直到取到好电池为止,求抽取次数X的分布列及均值.
解 X的可能取值为1,2,3,
则P(X=1)=,P(X=2)=×=,
P(X=3)=××1=.
所以抽取次数X的分布列为
X 1 2 3
P
所以E(X)=1×+2×+3×=.
10.春节期间,小王用私家车送4位朋友到三个旅游景点去游玩,每位朋友在每一个景点下车的概率均为,用ξ表示4位朋友在第三个景点下车的人数,求:
(1)随机变量ξ的分布列;
(2)随机变量ξ的均值.
解 (1)ξ的所有可能值为0,1,2,3,4.
则P(ξ=0)=4=,P(ξ=1)==,
P(ξ=2)==,P(ξ=3)==,
P(ξ=4)=4=.
从而ξ的分布列为
ξ 0 1 2 3 4
P
(2)由(1)得ξ的均值为
E(ξ)=0×+1×+2×+3×+4×=.
11.某船队若出海后天气好,可获得5 000元;若出海后天气坏,将损失2 000元.根据预测知天气好的概率为0.6,则出海的期望效益是( )
A.2 000元 B.2 200元
C.2 400元 D.2 600元
答案 B
解析 出海的期望效益E(X)=5 000×0.6+(1-0.6)×(-2 000)=3 000-800=2 200(元).
12.若X是一个随机变量,则E(X-E(X))的值为( )
A.无法确定 B.0 C.E(X) D.2E(X)
答案 B
解析 ∵E(aX+b)=aE(X)+b,而E(X)为常数,
∴E(X-E(X))=E(X)-E(X)=0.
13.若p为非负实数,随机变量ξ的分布列为
ξ 0 1 2
P -p p
则E(ξ)的最大值为( )
A.1 B. C. D.2
答案 B
解析 由p≥0,-p≥0,得0≤p≤,则E(ξ)=p+1≤,故选B.
14.甲、乙、丙三人参加某次招聘会,甲应聘成功的概率为,乙、丙应聘成功的概率均为(0答案 2
解析 依题意,得甲、乙、丙三人都应聘成功的概率是××=,解得t=2,
所以乙应聘成功的概率为,则ξ的所有可能的取值为0,1,2,
P(ξ=2)=×=,
P(ξ=1)=×+×=,
P(ξ=0)=×=,
则E(ξ)=2×+1×+0×=.
15.(多选)体育课的排球发球项目考试的规则是:每位学生最多可发球3次,一旦发球成功,则停止发球,否则一直发到3次为止.设某学生一次发球成功的概率为p(p≠0),发球次数为X,若X的均值E(X)>1.75,则p的取值可以为( )
A. B. C. D.
答案 AB
解析 根据题意,X的所有的可能取值为1,2,3,且
P(X=1)=p,
P(X=2)=p(1-p),
P(X=3)=(1-p)2,
则E(X)=p+2p(1-p)+3(1-p)2=p2-3p+3,
依题意有E(X)>1.75,则p2-3p+3>1.75,
解得p>或p<,
结合p的实际意义,可得0结合选项可知AB正确.
16.某牛奶店每天以每盒3元的价格从牛奶厂购进若干盒鲜牛奶,然后以每盒5元的价格出售,如果当天卖不完,剩下的牛奶作为垃圾回收处理.
(1)若牛奶店一天购进50盒鲜牛奶,求当天的利润x(单位:元)关于当天需求量n(单位:盒,n∈N*)的函数解析式;
(2)牛奶店老板记录了某100天鲜牛奶的日需求量(单位:盒),整理得下表:
日需求量 48 49 50 51 52 53 54
频数 10 20 16 16 15 13 10
以这100天记录的各需求量的频率作为各需求量发生的概率.
①若牛奶店一天购进50盒鲜牛奶,X表示当天的利润(单位:元),求X的分布列及均值;
②若牛奶店计划一天购进50盒或51盒鲜牛奶,从统计学角度分析,你认为应购进50盒还是51盒?请说明理由.
解 (1)当n<50时,y=5n-50×3=5n-150,
当n≥50时,y=50×(5-3)=100,
∴y=(n∈N*).
(2)①由(1)可知,n=48时,X=90,当n=49时,X=95,当n≥50时,X=100.
∴X的可能取值为90,95,100.
P(X=90)==,
P(X=95)==,
P(X=100)==.
∴X的分布列为
X 90 95 100
P
∴E(X)=×90+×95+×100=98.
②由①知当购进50盒时,E(X)=98.
当购进51盒时,y=(n∈N*),
设Y表示当天的利润,∴当n=48时,Y=87,当n=49时,Y=92,当n=50时,Y=97,当n≥51时,Y=102,
∴P(Y=87)=,
P(Y=92)=,
P(Y=97)==,
P(Y=102)==,
∴E(Y)=×87+×92+×97+×102==97.7.
∵98>97.7,∴每天购进50盒比较合理.