第七章 随机变量及其分布
第七章 随机变量及其分布
7.3离散型随机变量的数字特征
7.3离散型随机变量的数字特征
知识梳理
知识梳理
知识点一 离散型随机变量的均值
离散型随机变量的均值的概念
一般地,若 X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn=ipi为随机变量X的均值
离散型随机变量的均值的意义
均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
离散型随机变量的均值的性质
若Y=aX+b,其中a,b均是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
证明如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是有E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
离散型随机变量的均值与样本平均值之间的关系
均值是随机变量可能取值关于取值概率的加权平均数,它综合随机变量的取值和取值的概率,反映随机变量取值的平均水平.
若Y=aX+b,其中a,b是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
(1)区别:随机变量的均值是一个常数,不依赖于样本的抽取,样本平均值是一个随机变量,它随样本抽取的不同而变化.
(2)联系:对于简单的随机样本,随着样本容量的增加,样本平均值越来越接近于总体的均值.
知识点二离散型随机变量的方差、标准差
设离散型随机变量X的分布列如表所示.
X
x1
x2
…
xn
P
p1
p2
…
pn
我们用X所有可能取值xi与E(X)的偏差的平方(x1-E(X))2,(x2-E(X))2,…,(xn-E(X))2,关于取值概率的加权平均,来度量随机变量X取值与其均值E(X)的偏离程度.我们称D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=(xi-E(X))2pi为随机变量X的方差,有时也记为Var(X),并称为随机变量X的标准差,记为σ(X).
离散型随机变量方差的性质
1.设a,b为常数,则D(aX+b)=a2D(X).
2.D(c)=0(其中c为常数).
题型探究
题型探究
例1.某小微企业生产一种如下图所示的电路子模块,要求三个不同位置1、2、3接入三种不同类型的电子元件,且备选电子元件为A、B、C型,它们正常工作的概率分别为0.9、0.8、0.7.假设接入三个位置的元件能否正常工作相互独立.当且仅当1号位元件正常工作,同时2号位与3号位元件中至少有一件正常工作时,电路子模块才能正常工作.
(1)共可组装出多少种不同的电路子模块?
(2)求电路子模块能正常工作的概率最大值;
(3)若以每件5元、3元、2元的价格分别购进A、B、C型元件各1000件,组装成1000套电路子模块出售,设每套子模块组装费为20元.每套子模块的售价为150元,但每售出1套不能正常工作子模块,除退还购买款外,还将支付购买款的3倍作为赔偿金.求生产销售1000套电路子模块的最大期望利润.
【答案】(1)6;(2)false;(3)27600元.
【详解】
(1)电子元件为A、B、C设接入三个位置共有false种不同的子模块;
(2)根据1号位放入A、B、C三种元件,共有三种情况,记其正常工作为A、B、C事件,
可得:false,
false,
false,
则false,
所以1号位接false型电子元件时,子模块正常工作的概率最大为false;
(3)若要最大利润,选择正常工作的概率最大的电路子模块,
应把A型元件接入1号位,此时false,
设1000套子模块中能正常工作的套数为X,利润为Y,
则false,
则false,
所以false,
false,
故生产销售1000套电路子模块的最大期望利润为27600元.
例2.2021年4月17日,江苏园博会正式向公众开放.昔日废弃采矿区化茧成蝶,变身成了"世界级山地花园群”.园博园的核心景区苏韵荟谷以流水串联,再现了江苏13个地市历史名园的芳华,行走其间,仿佛穿游在千年历史长河中,吸引众多游客前来打卡某旅行社开发了江苏园博园一-日游线路,考虑成本与防疫要求,每团人数限定为不少于35人,不多于40人除去成本,旅行社盈利100元/人.已知该旅行社已经发出的10个旅行团的游客人数如下表所示∶
序号
1
2
3
4
5
游客人数
39
35
38
38
36
序号
6
7
8
9
10
游客人数
39
40
37
40
38
(1)该旅行社计划从这10个团队中随机抽取3个团队的游客,就服务满意度进行回访,求这3个团队人数不全相同的概率;
(2)预计暑假期间发团200个,将盈利总额记为X(单位∶万元),用上表中的频率估计概率,求X的数学期望.
【答案】(1)false;(2)false(万元).
【详解】
解:
游客人数
35
36
37
38
39
40
次数统计
1
1
1
3
2
2
频率
false
false
false
false
false
false
(注∶上述表格不一定要出现,只要在解题中说明各种人数出现次数就可以)
(1)设这3个团队人数不全相同为事件A
false
故这3个团队人数不全相同的概率是false
(2)X的可能取值为70,72,74,76,78,80.
X的分布列为
X
70
72
74
76
78
80
P
false
false
false
false
false
false
false(万元).
例3.“云课堂”是基于云计算技术的一种高效?便捷?实时互动的远程教学课堂形式使用者只需要通过互联网界面,进行简单的操作,可快速高效地与全球各地学生?教师家长等不同用户同步分享语音?视频及数据文件随着计算机虚拟技术的不断成熟和虚拟技术操作更接近于大众化,虚拟课堂在各大院校以及企业大学中的应用更广泛?更灵活?智能,对现今教育体制改革和职业人才培养起到很大的推动作用某大学采取线上“云课堂”和线下面授的形式授课.现为调查学生成绩获得优秀与否与每天“云课堂”学习时长是否有关,随机抽取学生样本50人进行学习时长统计,并按学生每天“云课堂”学习时长是否超过6小时分为两类,得到如下false列联表.
每天“云课堂”学习时长超过6小时
每天“云课堂”学习时长不超过6小时
合计
优秀
5
不优秀
10
合计
50
已知在50人中随机抽取一人,是优秀且每天“云课堂”学习时长超过6小时的概率为0.4.
(1)请将上面的列联表补充完整(不用写计算过程).
(2)是否有99.5%的把握认为学生成绩获得优秀与否与每天“云课堂”学习时长有关?
(3)该校通过“云课堂”学习的学生,在期末测试时被要求现场完成答题,每答对一道题积2分,答错积0分,每人有3次答题机会(假设每个人都答完3道题).已知甲同学每道题答对的概率为false,3道题之间答对与否互不影响,设甲同学期末测试得分为false,求false的数学期望.
附:false,其中false.
参考数据:
false
0.15
0.10
0.05
0.025
0.010
0.005
0.001
false
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表答案见解析;(2)有99.5%的把握认为学生成绩获得优秀与否与每天“云课堂”学习时长有关;(3)false.
【详解】
(1)完成false列联表如下
每天“云课堂”学习时长超过6小时
每天“云课堂”学习时长不超过6小时
合计
优秀
20
5
25
不优秀
10
15
25
合计
30
20
50
(2)false,
所以有99.5%的把握认为学生成绩获得优秀与否与每天“云课堂”学习时长有关.
(3)甲同学期末测试得分false的可能取值为0,2,4,6,
则false,
false,
false,
false,
所以随机变量false的分布列为
false
0
2
4
6
false
false
false
false
false
所以false.
例4.国际比赛赛制常见的有两种,一种是单败制,一种是双败制.单败制即每场比赛的失败者直接淘汰,常见的有false等等.false表示双方进行一局比赛,获胜者晋级.false表示双方最多进行三局比赛,若连胜两局,则直接晋级;若前两局两人各胜一局,则需要进行第三局决胜负.现在false四人进行乒乓球比赛,比赛赛制采用单败制,A与B一组,C与D一组,第一轮两组分别进行false,胜者晋级,败者淘汰;第二轮由上轮的胜者进行false,胜者为冠军.已知A与false比赛,A的胜率分别为false;B与false比赛,B的胜率分别false;C与D比赛,C的胜率为false.任意两局比赛之间均相互独立.
(1)在C进入第二轮的前提下,求A最终获得冠军的概率;
(2)记A参加比赛获胜的局数为X,求X的分布列与数学期望.
【答案】(1)false;(2)分布列见解析,false.
【详解】
解:(1)false进入第二轮的概率为false,
false与false比赛,false获胜,false与false比赛,false获胜,且false与false比赛,false获胜,
其概率为false,
故在false进入第二轮的前提下,false最终获得冠军的概率false.
(2)false参加比赛获胜的局数false的取值有0,1,2,3.
false,
false,
false,
false.
false的分布列为:
false
0
1
2
3
false
false
false
false
false
false.
例5.某企业有甲?乙两条生产同种产品的生产线,据调查统计,100次生产该产品所用时间的频数分布表如下:
所用的时间(单位:天)
10
11
12
13
甲生产线的频数
10
20
10
10
乙生产线的频数
5
20
20
5
假设订单false约定交货时间为11天,订单false约定交货时间为12天(将频率视为概率,当天完成即可交货).
(1)为最大可能在约定时间交货,判断订单false和订单false应如何选择各自的生产线(订单false互不影响);
(2)已知甲?乙生产线每次的生产成本均为3万元,若生产时间超过11天,生产成本将每天增加5000元,求这100次生产产品分别在甲?乙两条生产线的平均成本.
【答案】(1)订单false选择甲生产线,订单false选择乙生产线;(2)甲生产线的平均成本为false万元,乙生产线的平均成本为false万元.
【详解】
(1)频率分布表如下:
所用的时间(单位:天)
10
11
12
13
甲生产线的频率
false
false
false
false
乙生产线的频率
false
false
false
false
设false分别表示订单false选择甲?乙生产线在约定时间交货;false分别表示订单false选择甲?乙生产线在约定时间交货.
则false
false,
false,
false,
所以订单false选择甲生产线,订单false选择乙生产线.
(2)记false为甲生产线的生产成本的取值,false为甲生产线的生产成本的取值,
由题意可得,false可能取的值为false,false,false;false可能取的值为false,false,false;
由(1)可知false,false,false,
false,false,false,
甲生产线的平均成本为false万元,
乙生产线的平均成本为false万元.
课后小练
课后小练
1.某奶茶店推出一款新品奶茶,每杯成本4元,售价6元.如果当天卖不完,剩下的奶茶只能倒掉.奶茶店记录了60天这款新品奶茶的日需求量,整理得下表:
日需求量杯数
20
25
30
35
40
45
50
天数
5
5
10
15
10
10
5
以60天记录的各需求量的频率作为各需求量发生的概率.
(1)从这60天中任取2天,求这2天的日需求量至少有一天为35的概率;
(2)①若奶茶店一天准备了35杯这款新品奶茶,用 ξ 表示当天销售这款新品奶茶的利润(单位:元),求 ξ 的分布列和数学期望;
②假设奶茶店每天准备的这款新品奶茶倍数都是5的倍数,有顾客建议店主每天准备40杯这款新品奶茶,你认为店主应该接受这个建议吗?请说明理由.
2.为了解华人社区对接种新冠疫苗的态度,美中亚裔健康协会日前通过社交媒体,进行了小规模的社区调查,结果显示,多达73.4%的华人受访者最担心接种疫苗后会有副作用.其实任何一种疫苗都有一定的副作用,接种新型冠状病毒疫苗后也是有一定副作用的,这跟个人的体质有关系,有的人会出现副作用,而有的人不会出现副作用.在接种新冠疫苗的副作用中,有发热、疲乏、头痛等表现.为了了解接种某种疫苗后是否会出现疲乏症状的副作用,某组织随机抽取了某地200人进行调查,得到统计数据如下:
无疲乏症状
有疲乏症状
总计
未接种疫苗
100
20
120
接种疫苗
x
y
n
总计
160
m
200
(1)求 2×2 列联表中的数据 x , y , m , n 的值,并确定能否有85%的把握认为有疲乏症状与接种此种疫苗有关.
(2)从接种疫苗的 n 人中按是否有疲乏症状,采用分层抽样的方法抽出8人,再从8人中随机抽取3人做进一步调查.若初始总分为10分,抽到的3人中,每有一人有疲乏症状减1分,每有一人没有疲乏症状加2分,设得分结果总和为 X ,求 X 的分布列和数学期望.
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
3.自“新冠肺炎”爆发以来,中国科研团队一直在积极地研发“新冠疫苗”,在科研人员不懈努力下,我国公民率先在2020年年末开始可以使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权,研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验.
(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现,除2号、3号和7号白兔仍然感染了新冠病毒,其他白兔未被感染,现从这10只白兔中随机抽取4只进行研究,将仍被感染的白兔只数记作 X ,求 X 的分布列和数学期望.
(2)科研人员在另一个实验中发现,疫苗可多次连续注射,白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响,相互独立,试问,若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗能否保证有效率达到96%,如若可以请说明理由,若不可以,请问每支疫苗的有效率至少要达到多少才能满足以上要求.
4.某公司开发了一款手机应用软件,为了解用户对这款软件的满意度,推出该软件3个月后,从使用该软件的用户中随机抽查了1000名,将所得的满意度的分数分成7组: [30,40),[40,50),???,[90,100] ,整理得到如下频率分布直方图.根据所得的满意度的分数,将用户的满意度分为两个等级:
满意度的分数
[30,60)
[60,100]
满意度的等级
不满意
满意
(1)从使用该软件的用户中随机抽取1人,估计其满意度的等级为“满意”的概率;
(2)用频率估计概率,从使用该软件的所有用户中随机抽取2人,以X表示这2人中满意度的等级为“满意”的人数,求X的分布列和数学期望.
5.甲、乙、丙三人参加学校“元旦嘉年华”竞答游戏,活动的规则为:甲、乙、丙三人先分别坐在圆桌的 A , B , C 三点,第一轮从甲开始通过掷骰子决定甲的竞答对手,如果点数是奇数,则按逆时针选择乙,如果是偶数,则按顺时针选丙,下一轮由上一轮掷骰子选中的对手继续通过掷骰子决定竟答对手,如果点数是奇数按逆时针选对手,点数是偶数按顺时针选对手,已知每场竞答甲对乙、甲对丙、乙对丙获胜的概率分别为 23 , 13 , 12 且甲、乙、丙之间竞答互不影响,各轮游戏亦互不影响,比赛中某选手累计获胜场数达到 2 场,游戏结束,该选手为晋级选手.
(1)求比赛进行了3场且甲晋级的概率;
(2)当比赛进行了 3 场后结束,记甲获胜的场数为 X ,求 X 的分布列与数学期望.
答案解析
【答案】
(1)由题意得,从60天中任取2天的日需求量至少有一天为35的概率为:
P=1?C452C602=2659 ;
(2)①由题意可得:
如果当天只卖出20杯,则利润 ξ=20×2?15×4=?20 元, P(ξ=?20)=112 ;
如果当天只卖出25杯,则利润 ξ=25×2?10×4=10 元, P(ξ=10)=112 ;
如果当天只卖出30杯,则利润 ξ=30×2?5×4=40 元, P(ξ=40)=16 ;
如果当天卖出35杯,则利润 ξ=35×2=70 元, P(ξ=70)=23 .
所以 ξ 的分布列为:
ξ
-20
10
40
70
P
112
112
16
23
则 E(ξ)=?20×112+10×112+40×16+70×23=1052 (元).
②若店主每天准备40杯这款新品奶茶,
如果当天只卖出20杯,则利润 ξ=20×2?20×4=?40 元, P(ξ=?40)=112 ;
如果当天只卖出25杯,则利润 ξ=25×2?15×4=?10 元, P(ξ=?10)=112 ;
如果当天只卖出30杯,则利润 ξ=30×2?10×4=20 元, P(ξ=20)=16 ;
如果当天卖出35杯,则利润 ξ=35×2?5×4=50 元, P(ξ=50)=14 ;
如果当天需求大于等于40杯,则利润 ξ=40×2=80 , P(ξ=80)=512 .
所以 ξ 的数学期望为
E(ξ)=?40×112+(?10)×112+20×16+50×14+80×512=45 (元),
因为 45<1052 ,所以每天准备40杯这款新品奶茶的利润较少,则不应该接受这个建议.
【解析】
?(1)从这60天中任取2天,则这2天的日需求量至少有一天为35杯的概率 P=1?C452C602=2659? ;
(2)①由题意可得:若当天只卖出20杯,则利润 ξ=20×2?15×4=?20?元;同理可得若当天只卖出25杯、30杯、35杯的利润,即可得出 ξ 的分布列与 E(ξ);
②若店主每天准备40杯这款新品奶茶,若当天需求20杯,可得利润 ξ=20×2?20×4=?40?元, P(ξ=?40)=112? ;同理可得若当天只卖出25杯、30杯、35杯、40杯的利润,即可得出ξ 的分布列与 E(ξ) , 即可得出结论.
2.【答案】
(1)解:由题意得: m=200?160=40 , y=m?20=20 ,
x=160?100=60 , n=x+y=60+20=80 ,
因为 K2=200×(100×20?20×60)2160×40×120×80=2512≈2.083>2.072 .
所以有85%的把握认为有疲乏症状与接种此种疫苗有关.
(2)解:从接种疫苗的 n 人中按是否有疲乏症状,采用分层抽样的方法抽出8人,可知8人中无疲乏症状的有6人,有疲乏症状的有2人,再从8人中随机抽取3人,当这3人中恰有2人有疲乏症状时, X=10 ;当这3人中恰有1人有疲乏症状时, X=13 ;当这3人中没有人有疲乏症状时, X=16 .
因为 P(X=10)=C22C61C83=328 ; P(X=13)=C21C62C83=1528 ; P(X=16)=C20C63C83=514 .
所以 X 的分布列如下:
X
10
13
16
P
328
1528
514
期望 E(X)=10×328+13×1528+16×514=554 .
【解析】
(1)由2×2列联表中的数据求出x,y,m,n的值,得出K2≈2.083>2.072,即可得出结论;
(2)随机变量X所有可能取的值为10,13,16,求出对应的概率,得到分布列,然后求解期望即可.
3.【答案】
(1)解:因为 X 可取 0,1,2,3 ,所以 P(X=k)=C3k·C74?kC104,k=0,1,2,3
所以 P(x=0)=C30·C74C104=16 , P(x=1)=C31·C73C104=12
P(x=2)=C32·C72C104=310 , P(x=3)=C33·C71C104=130 .
所以 X 的分布列如下:
X
0
1
2
3
P
16
12
310
130
E(x)=0×16+1×12+2×310+3×130=1.2 ;
(2)解:因为实验一中未被感染新冠病毒的白兔的频率为0.7,
所以注射一次疫苗的有效率为0.7,
又因为每次注射的疫苗对白兔是否有效相互独立,
所以一只白兔注射两次疫苗的有效率为: 1?(1?0.7)2=91%<96% ,所以无法保证,
设每支疫苗有效率至少达到 t 才能满足要求,
则 1?(1?t)2=96% ,解得 t=80%
所以每支疫苗的有效率至少要达到80%才能满足以上要求.
【解析】
(1)先分析出?X 的可能可取值,然后根据超几何分布模型求解 ?X 取不同值时的概率,由此可求得的分布列,并根据分布列可计算出数学期望;
(2)根据已知条件先分析出注射一次疫苗的有效率,然后计算注射两次疫苗的有效率,并与 96%?作比较,得到结果为无法保证后先假设疫苗的有效率,利用1减去两次疫苗都无效的概率等于 96% ,由此解出结果。
4.【答案】 (1)解:由频率分布直方图可知满意度的分数 [30,60) 的频率为 (0.005+0.01+0.025)×10=0.4 ,满意度的分数 [60,100] 的频率为 (0.03+0.015+0.01+0.005)×10=0.6 ,故从使用该软件的用户中随机抽取1人,其满意度的等级为“满意”的概率为 0.6
(2)解:依题意可知 X?B(2,35) ,则 X 的可能取值为 0 、 1 、 2 ,
所以 P(X=0)=C20(1?35)2=425 , P(X=1)=C21?35?(1?35)=1225 , P(X=2)=(35)2=925
所以 X 的分布列为:
X
0
1
2
P
425
1225
925
所以 E(X)=2×35=65
【解析】
(1) 根据频率分布直方图,求出样本[60,100]的频率,即可得到结果。 (2)X的所有可能取值,再由n次独立重复试验的概率公式求出概率,得到分布列,然后求解期望即可.
5.【答案】
(1)解:甲赢两场,分下面三种情况
①第一场甲胜,第二场无甲,第三场甲胜
概率为: 12×23×12×12×13+12×13×12×12×23=118 ;
②第一场甲输,二三场均胜
概率为: 12×13×12×23×(12×23+12×13)+12×23×12×13×(12×23+12×13)=118 ;
③第一场甲胜,第二场输,第三场胜
概率为: 12×23×12×13×(12×23+12×13)+12×13×12×23×(12×23+12×13)=118 ;
由互斥事件的概率加法公式可知:比赛进行了 3 场且甲晋级的概率为: 118+118+118=16 .
(2)解:依题意 X 的所有可能取值为0,1,2
由(1)知 P(X=2)=16 ,
当比赛进行了 3 场后结束,甲获胜的场数为 X=0 时,
分两种情况:
3场比赛中甲参加了1场,输了,概率为: 12×13×12×12×12+12×23×12×12×12=116
3场比赛中甲参加了2场,都输了,概率为: 12×13×12×12×12×23+12×23×12×12×12×13=136
3场比赛甲都参加且都输掉是不可能的,否则两场比赛打不到3场.
所以 P(X=0)=116+136=13144 ,
故 P(X=1)=1?P(X=0)?P(X=2)=1?13144?16=107144 ,
故 X 的分布列为
X
0
1
2
P
13144
107144
16
则 E(X)=0×13144+1×107144+2×16=155144 .
【解析】
(1)利用已知条件结合独立事件乘法求概率公式结合互斥事件加法求概率公式,进而求出 比赛进行了3场且甲晋级的概率。
(2)利用已知条件求出随机变量X可能的取值, 由(1)知 P(X=2)=16 , 再利用独立事件乘法求概率公式结合互斥事件加法求概率公式,进而求出随机变量X的分布列,再利用随机变量X的分布列结合数学期望公式,进而求出随机变量X的数学期望。