专题06 离散型随机变量及其分布列、数字特征 学案 (原卷版+解析版)

文档属性

名称 专题06 离散型随机变量及其分布列、数字特征 学案 (原卷版+解析版)
格式 zip
文件大小 912.5KB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2024-04-07 11:08:28

文档简介

06 离散型随机变量及其分布列、数字特征
知识点1 随机变量
(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.
(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.
(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.
知识点2 离散型随机变量的分布列的定义
(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,xi,…,xn,我们称X取每一个值xi的概率P=pi,i=1,2,…,n
为X的概率分布列,简称分布列.
(2)表示方法:①表格;②概率分布图.
知识点3 离散型随机变量的分布列的性质
(1)pi≥0,i=1,2,…,n;
(2)p1+p2+…+pn=1.
知识点4 离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列如下表所示,
X x1 x2 … xn
P p1 p2 … pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn=为随机变量X的均值或数学期望,数学期望简称期望.
(2)方差:称D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=pi为随机变量X的方差,有时也记为Var(X),并称为随机变量X的标准差,记为σ(X).
(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E(X)的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.
知识点5 均值与方差的性质
若Y=aX+b,其中X是随机变量,a,b是常数,随机变量X的均值是E(X),方差是D(X).
则E(Y)=E(aX+b)=aE(X)+b;D(Y)=D=a2D(X).(a,b为常数).
知识点6 分布列性质的两个作用
(1)利用分布列中各事件概率之和为1可求参数的值.
(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.
知识点7 均值与方差的四个常用性质
(1)E(k)=k,D(k)=0,其中k为常数.
(2)E(X1+X2)=E(X1)+E(X2).
(3)D(X)=E(X2)-(E(X))2.
(4)若X1,X2相互独立,则E(X1X2)=E(X1)·E(X2).
考点1 离散型随机变量分布列的性质
【例1】设随机变量X的分布列为P=ak(k=1,2,3,4,5).
(1)求a的值;
(2)求P;
(3)求P.
【答案】(1)由分布列的性质,得
P+P+P+P+P(X=1)=a+2a+3a+4a+5a=1,所以a=.
(2)P=P+P+P(X=1)=3×+4×+5×=.
(3)P=P+P+P=++=.
【总结】离散型随机变量分布列性质的应用
(1)利用“总概率之和为1”可以求相关参数的取值范围或值;
(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;
(3)可以根据性质判断所得分布列结果是否正确.
【变式1-1】设随机变量X的分布列为P=,k=1,2,3,C为常数,则P=__________.
【答案】
【解析】随机变量X的分布列为P=,k=1,2,3,
∴++=1,即=1,解得C=,
∴P=P+P==.
【变式1-2】设离散型随机变量X的分布列为
X 0 1 2 3 4
P 0.2 0.1 0.1 0.3 m
(1)求随机变量Y=2X+1的分布列;
(2)求随机变量η=|X-1|的分布列;
(3)求随机变量ξ=X2的分布列.
【解析】(1)由分布列的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.
首先列表为:
X 0 1 2 3 4
2X+1 1 3 5 7 9
从而Y=2X+1的分布列为:
Y 1 3 5 7 9
P 0.2 0.1 0.1 0.3 0.3
(2)列表为:
X 0 1 2 3 4
|X-1| 1 0 1 2 3
∴P(η=0)=P(X=1)=0.1,
P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,
P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.
故η=|X-1|的分布列为:
η 0 1 2 3
P 0.1 0.3 0.3 0.3
(3)首先列表为:
X 0 1 2 3 4
X2 0 1 4 9 16
从而ξ=X2的分布列为:
ξ 0 1 4 9 16
P 0.2 0.1 0.1 0.3 0.3
【变式1-3】设随机变量X的分布列如下:
X 1 2 3 4 5
P p
则p为(  )
A. B. C. D.
【答案】C
【解析】由分布列的性质知,++++p=1,∴p=1-=.
【变式1-4】设X是一个离散型随机变量,其分布列为
X -1 0 1
P 1-q q-q2
则q等于(  )
A.1 B.或-
C.1+ D.
【答案】D
【解析】由离散型随机变量分布列的性质得解得q=.
【变式1-5】(多选)设随机变量ξ的分布列为P=ak(k=1,2,3,4,5),则(  )
A.a= B.P=
C.P= D.P(ξ=1)=
【答案】AB
【解析】对于选项A,∵随机变量ξ的分布列为P=ak(k=1,2,3,4,5),
∴P+P+P+P+P(ξ=1)=a+2a+3a+4a+5a=15a=1,解得a=,故A正确;
对于B,易知P=P=3×=,故B正确;
对于C,易知P=P+P=+2×=,故C错误;
对于D,易知P(ξ=1)=5×=,故D错误.
【变式1-6】设X是一个离散型随机变量,其分布列为
X 0 1
P 9a2-a 3-8a
则常数a的值为(  )
A. B.
C.或 D.-或-
【答案】A
【解析】由分布列的性质可知解得a=.
【变式1-7】离散型随机变量X的概率分布列为P(X=n)=(n=1,2,3,4),其中a是常数,则P的值为(  )
A. B. C. D.
【答案】D
【解析】因为P(X=n)=(n=1,2,3,4),所以+++=1,所以a=,
所以P=P(X=1)+P(X=2)=×+×=.
【变式1-8】若随机变量X的分布列如下表,则mn的最大值是(  )
X 0 2 4
P m 0.5 n
A. B.
C. D.
【答案】A
【解析】由分布列的性质,得m+n=,m≥0,n≥0,所以mn≤2=,当且仅当m=n=时,等号成立.
【变式1-9】随机变量X的分布列如下:
X -1 0 1
P a b c
其中a,b,c成等差数列,则P(|X|=1)=______,公差d的取值范围是______.
【答案】 
【解析】因为a,b,c成等差数列,所以2b=a+c.
又a+b+c=1,所以b=,所以P(|X|=1)=a+c=.
又a=-d,c=+d,根据分布列的性质,得0≤-d≤,0≤+d≤,所以-≤d≤.
考点2 求离散型随机变量的分布列
【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.
(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;
(2)已知甲对阵其余7名选手获胜的概率均为,解决以下问题:
①求甲恰在对阵三场后被淘汰的概率;
②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.
【分析】(1)先求出8人平均分成四组的方法数,再求出甲,乙,丙都不分在同一组的方法数,从而可求得答案;
(2)①甲恰在对阵三场后淘汰,有两种情况:“胜,败,败”和“败,胜,败”,然后利用互斥事件的概率公式求解即可;
②由题意可得ξ∈,然后求出各自对应的概率,从而可得ξ的分布列.
【解析】(1)8人平均分成四组,共有种方法,
其中甲,乙,丙都不分在同一组的方法数为A,所以P==.
(2)①甲恰在对阵三场后淘汰,这三场的结果依次是“胜,败,败”或“败,胜,败”,
故所求的概率为××+××=.
②若甲在第一轮获胜,ξ∈.
当ξ=3时,表示甲在接下来的两场对阵都败,即P=×=.
当ξ=4时,有两种情况:
(ⅰ)甲在接下来的3场比赛都胜,其概率为××=;
(ⅱ)甲4场对阵后被淘汰,表示甲在接下来的3场对阵1胜1败,且第4场败,
概率为C12·××=,所以P=+=.
当ξ=5时,有两种情况:
(ⅰ)甲在接下来的2场对阵都胜,第4场败,概率为××=;
(ⅱ)甲在接下来的2场对阵1胜1败,第4场胜,第5场败,
概率为C12·×××=;所以P=+=.
当ξ=6时,有两种情况:
(ⅰ)甲第2场胜,在接下来的3场对阵为“败,胜,胜”,其概率为××=;
(ⅱ)甲第2场败,在接下来的4场对阵为“胜,胜,胜,败”,
其概率为××=;所以P=+=.
当ξ=7时,甲在接下来的5场对阵为“败,胜,胜,胜,胜”,即P=×=.
所以ξ的分布列为:
ξ 3 4 5 6 7
P
【总结】离散型随机变量分布列的求解步骤
【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.
(1)求该出租车公司的司机进行“爱心送考”的人均次数;
(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X,求X的分布列.
【解析】(1)由统计图得200名司机中送考1次的有20人,送考2次的有100人,送考3次的有80人,
∴该出租车公司的司机进行“爱心送考”的人均次数为=2.3.
(2)从该公司任选两名司机,
记“这两人中一人送考1次,另一人送考2次”为事件A,
“这两人中一人送考2次,另一人送考3次”为事件B,
“这两人中一人送考1次,另一人送考3次”为事件C,
“这两人送考次数相同”为事件D.
由题意知X的所有可能取值为0,1,2,则
P(X=0)=P(D)==,
P(X=1)=P(A)+P(B)=+=.
P(X=2)=P(C)==.
∴X的分布列为:
X 0 1 2
P
【变式2-2】(多选)设离散型随机变量X的分布列为
X 0 1 2 3 4
P q 0.4 0.1 0.2 0.2
若离散型随机变量Y满足Y=2X+1,则下列结果正确的有(  )
A.q=0.1
B.E(X)=2,D(X)=1.4
C.E(X)=2,D(X)=1.8
D.E(Y)=5,D(Y)=7.2
【答案】ACD
【解析】因为q+0.4+0.1+0.2+0.2=1,所以q=0.1,故A正确;
由已知可得E(X)=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,
D(X)=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,故C正确;
因为Y=2X+1,所以E(Y)=2E(X)+1=5,D(Y)=4D(X)=7.2,故D正确.
考点3 求离散型随机变量的均值与方差
【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E(ξ),方差D(ξ).
【解析】(1)两人所付费用相同,相同的费用可能为0,40,80元,
两人都付0元的概率为P1=×=,
两人都付40元的概率为P2=×=,
两人都付80元的概率为
P3=×=.
则两人所付费用相同的概率为P=P1+P2+P3=++=.
(2)ξ可能取值为0,40,80,120,160,
则P(ξ=0)=×=,
P(ξ=40)=×+×=,
P(ξ=80)=×+×+×=,
P(ξ=120)=×+×=,
P(ξ=160)=×=.
所以,随机变量ξ的分布列为
ξ 0 40 80 120 160
P
∴E(ξ)=0×+40×+80×+120×+160×=80,
D(ξ)=(0-80)2×+(40-80)2×+(80-80)2×+(120-80)2×+(160-80)2×=.
【总结】
求离散型随机变量ξ的均值与方差的步骤
(1)理解ξ的意义,写出ξ全部的可能取值;
(2)求ξ取每个值的概率;
(3)写出ξ的分布列;
(4)由均值的定义求E(ξ),由方差的定义求D(ξ).
【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:
男士 女士
戴口罩 不戴口罩 戴口罩 不戴口罩
甲地 40 20 30 10
乙地 10 30 45 15
假设某人是否戴口罩互相独立
(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.
(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X的分布列和期望.
(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.
【解析】(1)设“去甲地的男士带口罩”为事件M,则P(M)==,
设“去甲地的人戴口罩”为事件N,则P(N)==,
(2)设“男士带口罩”为事件A,则P(A)==,
设“女士带口罩”为事件B,则P(B)==,
所有男士中选1人,从所有女士中选2人,戴口罩人数X=0,1,2,3,
P(X=0)=××=,
P(X=1)=××+××+××=,
P(X=2)=××+××+××=,
P(X=3)=××=
分布列为:
X 0 1 2 3
P
E(X)=0×+1×+2×+3×=2
(3)E(ξ)=0×+1×=,D(ξ)=(0-)2×+(1-)2×=,
E(η)=0×+1×=,D(η)=(0-)2×+(1-)2×=.
100名男士中有50人戴口罩,50人不戴口罩,
100名女士中有75人戴口罩,25人不戴口罩,
从数据分布可看出来女士戴口罩的集中程度要好于男士,所以其方差偏小.
【变式3-2】已知X的分布列为
X -1 0 1
P
设Y=2X+3,则E(Y)的值为(   )
A. B.4
C.-1 D.1
【答案】A
【解析】∵E(X)=-+=-,∴E(Y)=E(2X+3)=2E(X)+3=-+3=.
【变式3-3】已知离散型随机变量X的分布列为
X 0 1 2
P 0.5 1-2q q2
则常数q=________.
【答案】1-
【解析】由分布列的性质得0.5+1-2q+q2=1,解得q=1-或q=1+(舍去).
【变式3-4】设随机变量X的分布列为P=a×,k=1,2,3,则a的值为__________.
【答案】
【解析】因为随机变量X的分布列为P=a·,k=1,2,3,
所以根据分布列的性质有a·+a·+a·=1,
所以a·=a×=1,所以a=.
【变式3-5】已知随机变量X的分布列如下:
X -1 0 1
P
若Y=2X+3,则E(Y)的值为________.
【答案】
【解析】E(X)=-+=-,则E(Y)=E(2X+3)=2E(X)+3=-+3=.
【变式3-6】若随机变量X满足P(X=c)=1,其中c为常数,则D(X)的值为________.
【答案】0
【解析】因为P(X=c)=1,所以E(X)=c×1=c,所以D(X)=(c-c)2×1=0.
【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X表示取出的数字的最小数,则随机变量X的均值E(X)等于(  )
A. B. C. D.
【答案】A
【解析】由题意知,X的可能取值为1,2,3,而随机取3个数的取法有C种,
当X=1时,取法有C种,即P(X=1)==;
当X=2时,取法有C种,即P(X=2)==;
当X=3时,取法有C种,即P(X=3)==;∴E(X)=1×+2×+3×=.
【变式3-8】已知随机变量X,Y满足Y=2X+1,且随机变量X的分布列如下:
X 0 1 2
P a
则随机变量Y的方差D(Y)等于(  )
A. B.
C. D.
【答案】B
【解析】由分布列的性质,得a=1--=,所以E(X)=0×+1×+2×=,
所以D(X)=2×+2×+2×=,又Y=2X+1,所以D(Y)=4D(X)=.
【变式3-9】已知m,n为正常数,离散型随机变量X的分布列如表:
X -1 0 1
P m n
若随机变量X的均值E(X)=,则mn=________,P(X≤0)=________.
【答案】 
【解析】由题意知解得所以mn=,P(X≤0)=m+=.
【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.
表1
购买实物商品(元) (0,100) [100,500) [500,1 000)
积分 2 4 6
概率
表2
购买虚拟商品(元) (0,20) [20,50) [50,100) [100,200)
积分 1 2 3 4
概率
(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;
(2)求小张一个月积分不低于8分的概率;
(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X的分布列与均值.
【解析】(1)小张一个月购买实物商品不低于100元的概率为+=,
购买虚拟商品不低于100元的概率为,因此所求概率为×=.
(2)根据条件,积分不低于8分有两种情况:
①购买实物商品积分为6分,购买虚拟商品的积分为2,3,4分;
②购买实物商品积分为4分,购买虚拟商品的积分为4分,
故小张一个月积分不低于8分的概率为×+×=.
(3)由条件可知X的可能取值为3,4,5.P(X=3)==,P(X=4)=P(X=5)==,
即X的分布列如下:
X 3 4 5
P
E(X)=3×+4×+5×=.
考点4 均值与方差在决策中的作用
【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:
方案一:交纳延保金5 000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1 000元;
方案二:交纳延保金6 230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t元;
制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:
维修次数 0 1 2 3
机器台数 20 40 80 60
以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X表示2台机器超过保修期后5年内共需维修的次数.
(1)求X的分布列;
(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t定在什么范围?
【分析】(1)由题设描述确定2台机器超过保修期后5年内共需维修的次数的可能值,并确定对应的基本事件,进而求各可能值的概率,写出分布列.
(2)根据(1)所得分布列,由各方案的费用与维修次数的关系写出费用的分布列,并求期望,通过期望值的大小关系求参数的范围.
【解析】(1)由题意得,X=0,1,2,3,4,5,6,
P=×=,
P=××2=,
P=××2+×=,
P=××2+××2=,
P=××2+×=,
P=××2=,
P=×=,
∴X的分布列为
X 0 1 2 3 4 5 6
P
(2)选择方案一:所需费用为Y1元,则X≤2时,Y1=5 000,X=3时,Y1=6 000;X=4时,Y1=7 000;X=5时,Y5=8 000,X=6时,Y1=9 000,
∴Y1的分布列为
Y1 5 000 6 000 7 000 8 000 9 000
P
E=5 000×+6 000×+7 000×+8 000×+9 000×=6 860,
选择方案二:所需费用为Y2元,则X≤4时,Y2=6 230;X=5时,Y2=6 230+t;X=6时,Y2=6 230+2t,则Y2的分布列为
Y2 6 230 6 230+t 6 230+2t
P
E=6 230×+×+×=6 230+,
要使选择方案二对客户更合算,则E∴6 230+<6 860,解得t<1 500,即t的取值范围为.
【总结】利用均值、方差进行决策的2个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直 播销售用户
不常使用直 播销售用户
合计
(2)某投资公司在2021年年初准备将1 000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为,,;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为,,.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
α 0.15 0.10 0.050 0.025 0.010
xα 2.072 2.706 3.841 5.024 6.635
其中,χ2=,n=a+b+c+d.
【解析】(1)由图1知,“年轻人”占比为45.5%+34.5%=80%,即有200×80%=160(人),
“非年轻人”有200-160=40(人),
由图2知,“经常使用直播销售用户”占比为30.1%+19.2%+10.7%=60%,
即有200×60%=120(人),“不常使用直播销售用户” 有200-120=80(人).
“经常使用直播销售用户的年轻人”有120×=100(人),“经常使用直播销售用户的非年轻人”有120-100=20(人).
∴补全的列联表如下:
年轻人 非年轻人 合计
经常使用直 播销售用户 100 20 120
不常使用直 播销售用户 60 20 80
合计 160 40 200
于是a=100,b=20,c=60,d=20.
∴χ2==≈2.083>2.072,
即有85%的把握认为经常使用网络直播销售与年龄有关.
(2)若按方案一,设获利X1万元,则X1可取的值为300,-150,0,X1的分布列为:
X1 300 -150 0
p
E=300×+(-150)×+0×=180(万元),
D=(300-180)2×+(-150-180)2×+(0-180)2×=1202×+3302×+1802×=35 100
若按方案二,设获利X2万元,则X2可取的值为500,-300,0,X2的分布列为:
X2 500 -300 0
p
E=500×+(-300)×+0×=210(万元),
D=(500-210)2×+(-300-210)2×+(0-210)2×=2902×+5102×+2102×=132 900
∵E由方案二的均值要比方案一的均值大,从获利角度来看方案二更大,故选方案二.
由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.
【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.
(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.
【解析】(1)由已知可得,X的所有可能取值为0,4,10,
则P(X=0)=1-0.8=0.2,
P(X=4)=0.8×(1-0.7)=0.24,
P(X=10)=0.8×0.7=0.56,
所以X的分布列为
X 0 4 10
P 0.2 0.24 0.56
(2)小明应选择先进行定点投篮考核,理由如下:
由(1)可知小明先进行定点投篮考核,累计得分的均值为E(X)=0×0.2+4×0.24+10×0.56=6.56,
若小明先进行三步上篮考核,记Y为小明的累计得分,
则Y的所有可能取值为0,6,10,
P(Y=0)=1-0.7=0.3,
P(Y=6)=0.7×(1-0.8)=0.14,
P(Y=10)=0.7×0.8=0.56,
则Y的均值为E(Y)=0×0.3+6×0.14+10×0.56=6.44,
因为E(X)>E(Y),所以为使累计得分的均值最大,小明应选择先进行定点投篮考核.
【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k合1检测法”,即将k个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.
(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;
②已知10人分成一组,分10组,两名感染患者在同一组的概率为,定义随机变量X为总检测次数,求检测次数X的分布列和均值E(X);
(2)若采用“5合1检测法”,检测次数Y的均值为E(Y),试比较E(X)和E(Y)的大小(直接写出结果).
【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的一组每个人进行检测,需要10次,
所以总检测次数为20.
②由题意,X可以取20,30,
P(X=20)=,P(X=30)=1-=,
则X的分布列为
X 20 30
P
所以E(X)=20×+30×=.
(2)由题意,Y可以取25,30,
两名感染者在同一组的概率为P1==,不在同一组的概率为P1=,
则E(Y)=25×+30×=>E(X).
【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A,B两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A级时,产品为一等品;第三工序的加工结果为A级,且第一、第二工序至少有一道工序加工结果为B级时,产品为二等品;其余均为三等品.每一道工序加工结果为A级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:
表一
工序 第一工序 第二工序 第三工序
概率 0.5 0.75 0.8
表二
等级 一等品 二等品 三等品
利润 23 8 5
(1)用η表示一件产品的利润,求η的分布列和均值;
(2)因第一工序加工结果为A级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x(0≤x≤4)万元(即每件产品利润相应减少x万元)时,第一工序加工结果为A级的概率增加x.问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.
【解析】(1)由题意可知,η的所有可能取值为23,8,5,
产品为一等品的概率为0.5×0.75×0.8=0.3,
产品为二等品的概率为(1-0.5×0.75)×0.8=0.5,
产品为三等品的概率为1-0.3-0.5=0.2,
所以η的分布列为
η 23 8 5
P 0.3 0.5 0.2
E(η)=23×0.3+8×0.5+5×0.2=11.9.
(2)改良方案对一件产品的利润的均值不会产生影响,理由如下:
在改良过程中,每件产品检测成本增加x(0≤x≤4)万元,第一工序加工结果为A级的概率增加x,
设改良后一件产品的利润为ξ,则ξ的所有可能取值为23-x,8-x,5-x,
所以一等品的概率为×0.75×0.8=0.3+,
二等品的概率为×0.8=0.5-,
三等品的概率为1--=0.2,
所以E(ξ)=(23-x)+(8-x)+0.2×(5-x)
=6.9-0.3x+x-x2+4-0.5x-x+x2+1-0.2x=11.9,
因为E(ξ)=E(η),
所以改良方案对一件产品的利润的均值不会产生影响.
1.(多选)设离散型随机变量X的分布列如下表:
X 1 2 3 4 5
P m 0.1 0.2 n 0.3
若离散型随机变量Y=-3X+1,且E=3,则(   )
A.m=0.1 B.n=0.1
C.E=-8 D.D=-7.8
【答案】BC
【解析】由E=1×m+2×0.1+3×0.2+4×n+5×0.3=3得m+4n=0.7,又由m+0.1+0.2+n+0.3=1得m+n=0.4,从而得m=0.3,n=0.1,故A选项错误,B选项正确;
E=-3E+1=-8,故C选项正确;
因为D=0.3×+0.1×+0.1×+0.3×=2.6,所以D=D=23.4,故D选项错误.
2.已知随机变量ξ的分布列如下表,D表示ξ的方差,则D=___________.
ξ 0 1 2
p a 1-2a
【答案】2
【解析】由题意可得:a+1-2a+=1,解得a=,
ξ 0 1 2
p
所以E(ξ)=0×+1×+2×=1,D(ξ)=(0-1)2+×(1-1)2+×(2-1)2=,
D(2ξ+1)=22D(ξ)=2.
3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:
时间(分钟) 10~20 20~30 30~40 40~50 50~60
莲石路 的频率 0.1 0.2 0.3 0.2 0.2
阜石路 的频率 0 0.1 0.4 0.4 0.1
若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)
(1)甲、乙两人应如何选择各自的路径?
(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.
【解析】(1)Ai表示事件“甲选择路径Li时,40分钟内赶到火车站”,B1表示事件“乙选择路径Li时,50分钟内赶到火车站”,i=1,2,
用频率估计相应的概率,则有
P=0.1+0.2+0.3=0.6,P=0.1+0.4=0.5,
P>P,所以甲应选择路径L1;
P=0.1+0.2+0.3+0.2=0.8,P=0.1+0.4+0.4=0.9,
P(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,
由(1)知P=0.6,P=0.9,且A,B相互独立,X的取值是0,1,2,
P=P=0.1×0.4=0.04,
P=P=0.4×0.9+0.6×0.1=0.42,
P=P=0.9×0.6=0.54,
所以X的分布列为:
X 0 1 2
P 0.04 0.42 0.54
E(X)=0×0.04+1×0.42+2×0.54=1.5.
4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,an表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=+++...+,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.
(1)直接写出X的可能取值,并求X的分布列和数学期望;
(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.
【解析】(1)X的可能取值为0,2,4,6,8
P(X=0)==,
P(X=2)==,
P(X=4)==,
P(X=6)==,
P(X=8)==,所以X的分布列为
X 0 2 4 6 8
P
从而X的数学期望E(X)=0×+2×+4×+6×+8×=5.
(2)记“在相继进行的三轮测试中都有X≤2”为事件A,“在某轮测试中有X≤2”为事件B,则P(B)=P(X=0)+P(X=2)=+=,
又各轮测试相互独立,P(A)=P(BBB)=P(B)P(B)P(B)=××=,
因为P(A)表示仅凭随机猜测得到较低偏离程度的结果的概率,而P(A)=≈0.0046,
该可能性非常小,
所以我们可以认为该品酒师确实有较好的酒味鉴别能力,不是靠随机猜测,故这种测试合理.
5.设0X 0 1-a 1+a 2
P b c
则当b在内增大时,(   )
A.D(X)增大 B.D(X)减小
C.D(X)先减小再增大 D.D(X)先增大再减小
【答案】D
【解析】由分布列的性质可得+b+c+=1,∴c=-b,
E(X)=0×+b++2×=1-2ab+,
D(X)=×+×b+×+×
=-4a2b2+2a2b++=-4a2+,
因为0当b∈时,D(X)随着b的增大而减小.
6.某花店每天以每枝4元的价格从农场购进若干枝玫瑰花,然后以每枝8元的价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理.
(1)若花店一天购进15枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式;
(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表∶
日需求量n 13 14 15 16 17 18 19
频数 10 30 20 14 12 8 6
以100天记录的各需求量的频率作为各需求量发生的概率.
(ⅰ)若花店一天购进15枝玫瑰花,X表示当天的利润(单位:元),求X的分布列,数学期望及方差;
(ⅱ)若花店计划一天购进15枝或16枝玫瑰花,你认为应购进15枝还是16枝?请说明理由.
【解析】(1)当n≥15时,y=15×(8-4)=60,
当n≤14时,y=(8-4)n-4(15-n)=8n-60,得y=n∈N.
(2)(ⅰ)X可取44,52,60,P(X=44)=0.1,P(X=52)=0.3,P(X=60)=0.6,
X的分布列为
X 44 52 60
P 0.1 0.3 0.6
E(X)=44×0.1+52×0.3+60×0.6=56,
D(X)=(44-56)2×0.1+(52-56)2×0.3+(60-56)2×0.6=28.8.
(ⅱ)花店一天购进16枝玫瑰花,Y表示当天的利润(单位:元),
那么Y的分布列为
Y 40 48 56 64
P 0.1 0.3 0.2 0.4
购进16枝时,当天的利润的期望为E(Y)=40×0.1+48×0.3+56×0.2+64×0.4=55.2,
因为56>55.2,所以应购进15枝.
7.茂名市是著名的水果之乡,“三高农业”蓬勃发展,荔枝、三华李、香蕉、龙眼等“岭南佳果”驰名中外,某商铺推出一款以新鲜水果为原料的加工产品,成本为每份10元,然后以每份20元的价格出售.如果当天卖不完,剩下的作垃圾处理.
(1)若商铺一天准备170份这种产品,求当天的利润y(单位:元)关于当天需求量n份,的函数解析式.
(2)商铺记录了100天这种产品的日需求量(单位:份),整理得下图:
若商铺计划一天准备170份或180份这种产品,用X表示准备170份的利润,Y表示准备180份的利润,你认为应准备哪个数量更合理?请说明理由.(以100天记录的各需求量的频率作为各需求量发生的概率)
【解析】(1)当n≥170时,y=170×(20-10)=1 700,
当n<170时,y=20n-1 700,
所以y=(n∈N).
(2)若准备170份,则X的可能取值为1 100,1 300,1 500,1 700,
则P(X=1 100)=0.1,P(X=1 300)=0.2,P(X=1 500)=0.2,P(X=1 700)=0.5,
故X的分布列如下:
X 1 100 1 300 1 500 1 700
P 0.1 0.2 0.2 0.5
则X的数学期望为E(X)=1 100×0.1+1 300×0.2+1 500×0.2+1 700×0.5=1 520;
若准备180份,则Y的可能取值为1 000,1 200,1 400,1 600,1 800,
则P(Y=1 000)=0.1,P(Y=1 200)=0.2,P(Y=1 400)=0.2,P(Y=1 600)=0.14,P(Y=1 800)=0.36
故Y的分布列如下:
Y 1 000 1 200 1 400 1 600 1 800
P 0.1 0.2 0.2 0.14 0.36
则Y的数学期望为E(Y)=1 000×0.1+1 200×0.2+1 400×0.2+1 600×0.14+1 800×0.36=1 492.
因为E(X)>E(Y),所以该商铺应该准备170份.06 离散型随机变量及其分布列、数字特征
知识点1 随机变量
(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.
(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.
(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.
知识点2 离散型随机变量的分布列的定义
(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,xi,…,xn,我们称X取每一个值xi的概率P=pi,i=1,2,…,n
为X的概率分布列,简称分布列.
(2)表示方法:①表格;②概率分布图.
知识点3 离散型随机变量的分布列的性质
(1)pi≥0,i=1,2,…,n;
(2)p1+p2+…+pn=1.
知识点4 离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列如下表所示,
X x1 x2 … xn
P p1 p2 … pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn=为随机变量X的均值或数学期望,数学期望简称期望.
(2)方差:称D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=pi为随机变量X的方差,有时也记为Var(X),并称为随机变量X的标准差,记为σ(X).
(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E(X)的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.
知识点5 均值与方差的性质
若Y=aX+b,其中X是随机变量,a,b是常数,随机变量X的均值是E(X),方差是D(X).
则E(Y)=E(aX+b)=aE(X)+b;D(Y)=D=a2D(X).(a,b为常数).
知识点6 分布列性质的两个作用
(1)利用分布列中各事件概率之和为1可求参数的值.
(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.
知识点7 均值与方差的四个常用性质
(1)E(k)=k,D(k)=0,其中k为常数.
(2)E(X1+X2)=E(X1)+E(X2).
(3)D(X)=E(X2)-(E(X))2.
(4)若X1,X2相互独立,则E(X1X2)=E(X1)·E(X2).
考点1 离散型随机变量分布列的性质
【例1】设随机变量X的分布列为P=ak(k=1,2,3,4,5).
(1)求a的值;
(2)求P;
(3)求P.
【总结】离散型随机变量分布列性质的应用
(1)利用“总概率之和为1”可以求相关参数的取值范围或值;
(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;
(3)可以根据性质判断所得分布列结果是否正确.
【变式1-1】设随机变量X的分布列为P=,k=1,2,3,C为常数,则P=__________.
【变式1-2】设离散型随机变量X的分布列为
X 0 1 2 3 4
P 0.2 0.1 0.1 0.3 m
(1)求随机变量Y=2X+1的分布列;
(2)求随机变量η=|X-1|的分布列;
(3)求随机变量ξ=X2的分布列.
【变式1-3】设随机变量X的分布列如下:
X 1 2 3 4 5
P p
则p为(  )
A. B. C. D.
【变式1-4】设X是一个离散型随机变量,其分布列为
X -1 0 1
P 1-q q-q2
则q等于(  )
A.1 B.或-
C.1+ D.
【变式1-5】(多选)设随机变量ξ的分布列为P=ak(k=1,2,3,4,5),则(  )
A.a= B.P=
C.P= D.P(ξ=1)=
【变式1-6】设X是一个离散型随机变量,其分布列为
X 0 1
P 9a2-a 3-8a
则常数a的值为(  )
A. B.
C.或 D.-或-
【变式1-7】离散型随机变量X的概率分布列为P(X=n)=(n=1,2,3,4),其中a是常数,则P的值为(  )
A. B. C. D.
【变式1-8】若随机变量X的分布列如下表,则mn的最大值是(  )
X 0 2 4
P m 0.5 n
A. B.
C. D.
【变式1-9】随机变量X的分布列如下:
X -1 0 1
P a b c
其中a,b,c成等差数列,则P(|X|=1)=______,公差d的取值范围是______.
考点2 求离散型随机变量的分布列
【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.
(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;
(2)已知甲对阵其余7名选手获胜的概率均为,解决以下问题:
①求甲恰在对阵三场后被淘汰的概率;
②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.
【总结】离散型随机变量分布列的求解步骤
【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.
(1)求该出租车公司的司机进行“爱心送考”的人均次数;
(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X,求X的分布列.
【变式2-2】(多选)设离散型随机变量X的分布列为
X 0 1 2 3 4
P q 0.4 0.1 0.2 0.2
若离散型随机变量Y满足Y=2X+1,则下列结果正确的有(  )
A.q=0.1
B.E(X)=2,D(X)=1.4
C.E(X)=2,D(X)=1.8
D.E(Y)=5,D(Y)=7.2
考点3 求离散型随机变量的均值与方差
【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E(ξ),方差D(ξ).
【总结】
求离散型随机变量ξ的均值与方差的步骤
(1)理解ξ的意义,写出ξ全部的可能取值;
(2)求ξ取每个值的概率;
(3)写出ξ的分布列;
(4)由均值的定义求E(ξ),由方差的定义求D(ξ).
【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:
男士 女士
戴口罩 不戴口罩 戴口罩 不戴口罩
甲地 40 20 30 10
乙地 10 30 45 15
假设某人是否戴口罩互相独立
(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.
(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X的分布列和期望.
(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.
【变式3-2】已知X的分布列为
X -1 0 1
P
设Y=2X+3,则E(Y)的值为(   )
A. B.4
C.-1 D.1
【变式3-3】已知离散型随机变量X的分布列为
X 0 1 2
P 0.5 1-2q q2
则常数q=________.
【变式3-4】设随机变量X的分布列为P=a×,k=1,2,3,则a的值为__________.
【变式3-5】已知随机变量X的分布列如下:
X -1 0 1
P
若Y=2X+3,则E(Y)的值为________.
【变式3-6】若随机变量X满足P(X=c)=1,其中c为常数,则D(X)的值为________.
【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X表示取出的数字的最小数,则随机变量X的均值E(X)等于(  )
A. B. C. D.
【变式3-8】已知随机变量X,Y满足Y=2X+1,且随机变量X的分布列如下:
X 0 1 2
P a
则随机变量Y的方差D(Y)等于(  )
A. B.
C. D.
【变式3-9】已知m,n为正常数,离散型随机变量X的分布列如表:
X -1 0 1
P m n
若随机变量X的均值E(X)=,则mn=________,P(X≤0)=________.
【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.
表1
购买实物商品(元) (0,100) [100,500) [500,1 000)
积分 2 4 6
概率
表2
购买虚拟商品(元) (0,20) [20,50) [50,100) [100,200)
积分 1 2 3 4
概率
(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;
(2)求小张一个月积分不低于8分的概率;
(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X的分布列与均值.
考点4 均值与方差在决策中的作用
【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:
方案一:交纳延保金5 000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1 000元;
方案二:交纳延保金6 230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t元;
制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:
维修次数 0 1 2 3
机器台数 20 40 80 60
以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X表示2台机器超过保修期后5年内共需维修的次数.
(1)求X的分布列;
(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t定在什么范围?
【总结】利用均值、方差进行决策的2个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直 播销售用户
不常使用直 播销售用户
合计
(2)某投资公司在2021年年初准备将1 000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为,,;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为,,.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
α 0.15 0.10 0.050 0.025 0.010
xα 2.072 2.706 3.841 5.024 6.635
其中,χ2=,n=a+b+c+d.
【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.
(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.
【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k合1检测法”,即将k个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.
(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;
②已知10人分成一组,分10组,两名感染患者在同一组的概率为,定义随机变量X为总检测次数,求检测次数X的分布列和均值E(X);
(2)若采用“5合1检测法”,检测次数Y的均值为E(Y),试比较E(X)和E(Y)的大小(直接写出结果).
【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A,B两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A级时,产品为一等品;第三工序的加工结果为A级,且第一、第二工序至少有一道工序加工结果为B级时,产品为二等品;其余均为三等品.每一道工序加工结果为A级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:
表一
工序 第一工序 第二工序 第三工序
概率 0.5 0.75 0.8
表二
等级 一等品 二等品 三等品
利润 23 8 5
(1)用η表示一件产品的利润,求η的分布列和均值;
(2)因第一工序加工结果为A级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x(0≤x≤4)万元(即每件产品利润相应减少x万元)时,第一工序加工结果为A级的概率增加x.问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.
1.(多选)设离散型随机变量X的分布列如下表:
X 1 2 3 4 5
P m 0.1 0.2 n 0.3
若离散型随机变量Y=-3X+1,且E=3,则(   )
A.m=0.1 B.n=0.1
C.E=-8 D.D=-7.8
【答案】BC
【解析】由E=1×m+2×0.1+3×0.2+4×n+5×0.3=3得m+4n=0.7,又由m+0.1+0.2+n+0.3=1得m+n=0.4,从而得m=0.3,n=0.1,故A选项错误,B选项正确;
E=-3E+1=-8,故C选项正确;
因为D=0.3×+0.1×+0.1×+0.3×=2.6,所以D=D=23.4,故D选项错误.
2.已知随机变量ξ的分布列如下表,D表示ξ的方差,则D=___________.
ξ 0 1 2
p a 1-2a
【答案】2
【解析】由题意可得:a+1-2a+=1,解得a=,
ξ 0 1 2
p
所以E(ξ)=0×+1×+2×=1,D(ξ)=(0-1)2+×(1-1)2+×(2-1)2=,
D(2ξ+1)=22D(ξ)=2.
3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:
时间(分钟) 10~20 20~30 30~40 40~50 50~60
莲石路 的频率 0.1 0.2 0.3 0.2 0.2
阜石路 的频率 0 0.1 0.4 0.4 0.1
若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)
(1)甲、乙两人应如何选择各自的路径?
(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.
【解析】(1)Ai表示事件“甲选择路径Li时,40分钟内赶到火车站”,B1表示事件“乙选择路径Li时,50分钟内赶到火车站”,i=1,2,
用频率估计相应的概率,则有
P=0.1+0.2+0.3=0.6,P=0.1+0.4=0.5,
P>P,所以甲应选择路径L1;
P=0.1+0.2+0.3+0.2=0.8,P=0.1+0.4+0.4=0.9,
P(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,
由(1)知P=0.6,P=0.9,且A,B相互独立,X的取值是0,1,2,
P=P=0.1×0.4=0.04,
P=P=0.4×0.9+0.6×0.1=0.42,
P=P=0.9×0.6=0.54,
所以X的分布列为:
X 0 1 2
P 0.04 0.42 0.54
E(X)=0×0.04+1×0.42+2×0.54=1.5.
4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,an表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=+++...+,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.
(1)直接写出X的可能取值,并求X的分布列和数学期望;
(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.
【解析】(1)X的可能取值为0,2,4,6,8
P(X=0)==,
P(X=2)==,
P(X=4)==,
P(X=6)==,
P(X=8)==,所以X的分布列为
X 0 2 4 6 8
P
从而X的数学期望E(X)=0×+2×+4×+6×+8×=5.
(2)记“在相继进行的三轮测试中都有X≤2”为事件A,“在某轮测试中有X≤2”为事件B,则P(B)=P(X=0)+P(X=2)=+=,
又各轮测试相互独立,P(A)=P(BBB)=P(B)P(B)P(B)=××=,
因为P(A)表示仅凭随机猜测得到较低偏离程度的结果的概率,而P(A)=≈0.0046,
该可能性非常小,
所以我们可以认为该品酒师确实有较好的酒味鉴别能力,不是靠随机猜测,故这种测试合理.
5.设0X 0 1-a 1+a 2
P b c
则当b在内增大时,(   )
A.D(X)增大 B.D(X)减小
C.D(X)先减小再增大 D.D(X)先增大再减小
【答案】D
【解析】由分布列的性质可得+b+c+=1,∴c=-b,
E(X)=0×+b++2×=1-2ab+,
D(X)=×+×b+×+×
=-4a2b2+2a2b++=-4a2+,
因为0当b∈时,D(X)随着b的增大而减小.
6.某花店每天以每枝4元的价格从农场购进若干枝玫瑰花,然后以每枝8元的价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理.
(1)若花店一天购进15枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式;
(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表∶
日需求量n 13 14 15 16 17 18 19
频数 10 30 20 14 12 8 6
以100天记录的各需求量的频率作为各需求量发生的概率.
(ⅰ)若花店一天购进15枝玫瑰花,X表示当天的利润(单位:元),求X的分布列,数学期望及方差;
(ⅱ)若花店计划一天购进15枝或16枝玫瑰花,你认为应购进15枝还是16枝?请说明理由.
【解析】(1)当n≥15时,y=15×(8-4)=60,
当n≤14时,y=(8-4)n-4(15-n)=8n-60,得y=n∈N.
(2)(ⅰ)X可取44,52,60,P(X=44)=0.1,P(X=52)=0.3,P(X=60)=0.6,
X的分布列为
X 44 52 60
P 0.1 0.3 0.6
E(X)=44×0.1+52×0.3+60×0.6=56,
D(X)=(44-56)2×0.1+(52-56)2×0.3+(60-56)2×0.6=28.8.
(ⅱ)花店一天购进16枝玫瑰花,Y表示当天的利润(单位:元),
那么Y的分布列为
Y 40 48 56 64
P 0.1 0.3 0.2 0.4
购进16枝时,当天的利润的期望为E(Y)=40×0.1+48×0.3+56×0.2+64×0.4=55.2,
因为56>55.2,所以应购进15枝.
7.茂名市是著名的水果之乡,“三高农业”蓬勃发展,荔枝、三华李、香蕉、龙眼等“岭南佳果”驰名中外,某商铺推出一款以新鲜水果为原料的加工产品,成本为每份10元,然后以每份20元的价格出售.如果当天卖不完,剩下的作垃圾处理.
(1)若商铺一天准备170份这种产品,求当天的利润y(单位:元)关于当天需求量n份,的函数解析式.
(2)商铺记录了100天这种产品的日需求量(单位:份),整理得下图:
若商铺计划一天准备170份或180份这种产品,用X表示准备170份的利润,Y表示准备180份的利润,你认为应准备哪个数量更合理?请说明理由.(以100天记录的各需求量的频率作为各需求量发生的概率)
【解析】(1)当n≥170时,y=170×(20-10)=1 700,
当n<170时,y=20n-1 700,
所以y=(n∈N).
(2)若准备170份,则X的可能取值为1 100,1 300,1 500,1 700,
则P(X=1 100)=0.1,P(X=1 300)=0.2,P(X=1 500)=0.2,P(X=1 700)=0.5,
故X的分布列如下:
X 1 100 1 300 1 500 1 700
P 0.1 0.2 0.2 0.5
则X的数学期望为E(X)=1 100×0.1+1 300×0.2+1 500×0.2+1 700×0.5=1 520;
若准备180份,则Y的可能取值为1 000,1 200,1 400,1 600,1 800,
则P(Y=1 000)=0.1,P(Y=1 200)=0.2,P(Y=1 400)=0.2,P(Y=1 600)=0.14,P(Y=1 800)=0.36
故Y的分布列如下:
Y 1 000 1 200 1 400 1 600 1 800
P 0.1 0.2 0.2 0.14 0.36
则Y的数学期望为E(Y)=1 000×0.1+1 200×0.2+1 400×0.2+1 600×0.14+1 800×0.36=1 492.
因为E(X)>E(Y),所以该商铺应该准备170份.