第七章 随机变量及其分布
第七章 随机变量及其分布
知识点一概率乘法公式
由条件概率的定义,任意两个事件A与B ,若P(A)>0,则false,我们称上式为概率的乘法公式.
知识点二全概率公式
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B?Ω,有P(B)=(Ai)P(B|Ai),我们称该公式为全概率公式.
知识点三贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B?Ω,P(B)>0,有P(Ai|B)==,i=1,2,…,n.
知识点四离散型随机变量的分布列及其性质
1.定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,xn,我们称X取每一个值xi的概率P(X=xi)=pi,i=1,2,3,…,n为X的概率分布列,简称分布列.
2.分布列的性质
(1)pi≥0,i=1,2,…,n.
(2)p1+p2+…+pn=1.
知识点五离散型随机变量的均值与样本平均值之间的关系
均值是随机变量可能取值关于取值概率的加权平均数,它综合随机变量的取值和取值的概率,反映随机变量取值的平均水平.
若Y=aX+b,其中a,b是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
(1)区别:随机变量的均值是一个常数,不依赖于样本的抽取,样本平均值是一个随机变量,它随样本抽取的不同而变化.
(2)联系:对于简单的随机样本,随着样本容量的增加,样本平均值越来越接近于总体的均值.
知识点六 二项分布的均值与方差
二项分布的均值与方差
(1)二项分布的均值:在n次独立重复试验中,若X~B(n,p),则E(X )=np.
二项分布的方差:若离散型随机变量X从二项分布,即X~B(n,p),则D(X)=np(1-p).
知识点七 超几何分布的均值
设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN , 则p是N件产品的次品率,而是抽取的 n件产品的次品率,则E( Xn )=p,即E(X)=np.
知识点八 正态曲线的性质:
①曲线位于轴上方,与轴不相交;
②曲线是单峰的,它关于直线对称;
③曲线在时达到峰值;
④当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.
⑤曲线与轴之间的面积为1;
⑥决定曲线的位置和对称性;
当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿轴平移。
⑦确定曲线的形状;
当一定时,曲线的形状由确定。越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散。
题型探究
题型探究
例1.某大学为了解学生对false两本数学图书的喜好程度,从这两本数学图书都阅读过的生中随机抽取了false人,分别对这两本图书进行评分反馈,满分为false分,得到的相应数据整理如下表:
分数
false
false
false
false
false
false图书频数
false
false
false
false
false
false图书频数
false
false
false
false
false
学生对图书的“评价指数”如下表:
分数
false
false
false
评价指数
false
false
3
(1)从false两本图书都阅读过的学生中任选false人,试估计其对false图书“评价指数”为false的概率;
(2)从对false图书“评价指数”为false的学生中任选false人进一步访谈,设false为false人中评分在false内的人数,求随机变量false的分布列及数学期望;
(3)试估计学生更喜好false哪一本图书,并简述理由.
【答案】(1)false;(2)分布列见解析,false;(3)false图书,理由见解析.
【详解】
(1)由频数分布表可知:对false图书评分的学生中,“评价指数”为false的学生所占的频率为false,
false从false两本图书都阅读过的学生中任选false人,估计其对false图书“评价指数”为false的概率为false.
(2)由题意得:false的所有可能取值为false,
则false,false,false,
false的分布列为:
false
false
false
false
false
false
false
false
false的数学期望为false.
(3)设学生对false图书的“评价指数”为false,对false图书的“评价指数”为false.
从阅读过两本图书的学生中任取一位,估计false的分布列为:
false
false
false
false
false
false
false
false
所以false;
估计false的分布列为:
false
false
false
false
false
false
false
false
false;
false,false学生更喜好图书false.
例2.自从开始实施生活垃圾分类,这一举措对改善环境污染起到了积极的作用,但其是一个需要长期落实的过程,只有坚持落实,才能持续减少对环境的污染.为了解垃圾分类的落实情况,现某市从人口数量在两万人左右的320个社区中随机抽取50个社区,对这50个社区某天产生的垃圾量(单位:吨)行了调查,得到如下频数分布表,并将产生的垃圾量在28吨/天及以上的社区确定为“超标”社区:
垃圾量false
false
false
false
false
false
false
false
false
频数
4
6
7
9
11
6
4
3
(以区间中点值作为该组产生的垃圾量)
(1)通过频数分布表估算出这50个社区这一天产生的垃圾量的平均值;
(2)市政府决定从样本中的“超标”社区中选取4个检验分类成果,经统计,垃圾量不超过30吨/天时可回收率为28%,垃圾量在30吨/天及以上时可回收率为25%.记false为选取社区回收资源量(单位:吨),求false的分布列和数学期望(结果精确到0.01).
【答案】(1)23.64吨;(2)分布列见解析;期望为false.
【详解】
解:(1)根据频数分布表得:
false,
所以这50个社区这一天产生的垃圾量的平均值为23.64吨.
(2)由频数分布表知,有7个“超标”社区,其中4个社区一天产生的垃圾量为29吨,回收资源量为false吨;3个社区一天产生的垃圾量为31吨,回收资源量为false吨,所以false可能的取值32.48,32.11,31.74,31.27,
且false;false;
false;false.
所以false的分布列为
false
32.48
32.11
31.74
31.37
false
false
false
false
false
所以false.
例3.2020年,新冠病毒席卷全球,给世界各国带来了巨大的灾难面对疫情,我们伟大的祖国以人民生命至上为最高政策出发点,统筹全国力量,上下一心,进行了一场艰苦的疫情狙击战,控制住了疫情的蔓延并迅速开展相关研究工作.某医疗科学小组为了了解患有重大基础疾病(如,糖尿病、高血压…)是否与更容易感染新冠病毒有关,他们对疫情中心的人群进行了抽样调查,对其中50人的血液样本进行检验,数据如下表:
感染新冠病毒
未感染新冠病毒
合计
不患有重大基础疾病
15
患有重大基础疾病
25
合计
30
(1)请填写false列联表,并判断是否有99%的把握认为患有重大基础疾病更容易感染新冠病毒;
(2)在抽样调查过程中,发现某样本小组5人中有1人感染新冠病毒,需要通过化验血液来确定感染者,血液化验结果呈阳性即为感染者,呈阴性即未感染.下面是两种化验方法:
方法一:逐一检验,直到检出感染者为止;
方法二:先取3人血液样本,混合在一起检验,如呈阳性则逐一检验,直到检出感染者为止;如呈阴性,则检验剩余2人中任意1人的血液样本.
①求方法一的化验次数大于方法二的化验次数的概率;
②用X表示方法二中化验的次数,求X的数学期望.
falsefalse
0.050
0.010
0.001
false
3.841
6.635
10.828
附:false,其中false.
【答案】(1)填表见解析;有;(2)①false;②false(次).
【详解】
解:(1)列联表完成如下图
感染新冠病毒
未感染新冠病毒
合计
不患有重大基础疾病
10
15
25
患有重大基础疾病
20
5
25
合计
30
20
50
∴false
所以有99%的把握认为患重大基础疾病更容易感染新冠病毒.
(2)记false表示依方法一需化验i次,false表示依方法二需化验j次,
A表示方法一的化验次数大于方法二的化验次数,
依题意知false与false相互独立.
①false,false,false,false
false,false
由于false
所以false
即false
②false的可能取值为2,3.
false,false
所以false(次)
例4.“T2钻石联赛”是世界乒联推出一种新型乒乓球赛事,其赛制如下:采用七局四胜制,比赛过程中可能出现两种模式:“常规模式”和“FAST5模式”.在前24分钟内进行的常规模式中,每小局比赛均为11分制,率先拿满11分的选手赢得该局;如果两名球员在24分钟内都没有人赢得4局比赛,那么将进入“FAST5”模式,“FAST5”模式为5分制的小局比赛,率先拿满5分的选手赢得该局.24分钟计时后开始的所有小局均采用“FAST5”模式.某位选手率先在7局比赛中拿下4局,比赛结束.现有甲、乙两位选手进行比赛,经统计分析甲、乙之间以往比赛数据发现,24分钟内甲、乙可以完整打满2局或3局,且在11分制比赛中,每局甲获胜的概率为false,乙获胜的概率为false;在“FAST5”模式,每局比赛双方获胜的概率都为false,每局比赛结果相互独立.
(Ⅰ)求4局比赛决出胜负的概率;
(Ⅱ)设在24分钟内,甲、乙比赛了3局,比赛结束时,甲乙总共进行的局数记为false,求false的分布列及数学期望.
【答案】(Ⅰ)见解析;(Ⅱ)分布列见解析,false.
【详解】
(Ⅰ)设前24分钟比赛甲胜出分别为false,乙胜出分别为false,在“FAST5”模式每局比赛甲获胜为false,4局比赛决出胜负记为事件false.
若24分钟内甲、乙打满2局,则false;
若24分钟内甲、乙打满3局,则
false;
(Ⅱ)false的可能取值为4、5、6、7
false;
false;
false
false;
false
false;
所以,随机变量false的概率分别列为:
false
4
5
6
7
false
false
false
false
false
false的数学期望为false.
例5.某电子公司新开发一电子产品,该电子产品的一个系统G有2n﹣1个电子元件组成,各个电子元件能正常工作的概率均为p,且每个电子元件能否正常工作相互独立.若系统中有超过一半的电子元件正常工作,则系统G可以正常工作,否则就需维修.
(1)当false时,若该电子产品由3个系统G组成,每个系统的维修所需费用为500元,设false为该电子产品需要维修的系统所需的总费用,求false的分布列与数学期望;
(2)为提高系统G正常工作的概率,在系统内增加两个功能完全一样的电子元件,每个新元件正常工作的概率均为p,且新增元件后有超过一半的电子元件正常工作,则系统C可以正常工作,问p满足什么条件时,可以提高整个系统G的正常工作概率?
【答案】(1)分布列见解析,数学期望为750;(2)false.
【详解】
(1)当false时,一个系统有3个电子元件,则一个系统需要维修的概率为false,设false为该电子产品需要维修的系统个数,则false,false,
∴false,
∴false的分布列为:
false
0
500
1000
1500
P
false
false
false
false
∴false.
(2)记false个元件组成的系统正常工作的概率为false.
false个元件中有false个正常工作的概率为false,
因此系统工常工作的概率false.
在false个元件组成的系统中增加两个元件得到false个元件组成的系统,则新系统正常工作可分为下列情形:
(a)原系统中至少false个元件正常工作,概率为false;
(b)原系统中恰有false个元件正常工作,且新增的两个元件至少有1个正常工作,
概率为false;
(c)原系统中恰有false个元件正常工作,且新增的两个元件均正常工作,
概率为false.
所以false,
因此,
false
false ,
故当false时,false单调增加,增加两个元件后,能提高系统的可靠性.
例6.第13届女排世界杯于2019年9月14日在日本举行,共有12支参赛队伍.本次比赛启用了新的排球用球MIKSA-V200W ,已知这种球的质量指标ξ (单位:g )服从正态分布N (270,false ).比赛赛制采取单循环方式,即每支球队进行11场比赛(采取5局3胜制),最后靠积分选出最后冠军积分规则如下:比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.已知第10轮中国队对抗塞尔维亚队,设每局比赛中国队取胜的概率为p(0
(1)如果比赛准备了1000个排球,估计质量指标在(260,265]内的排球个数(计算结果取整数).
(2)第10轮比赛中,记中国队3:1取胜的概率为false.
(i)求出f(p)的最大值点false;
(ii)若以false作为p的值记第10轮比赛中,中国队所得积分为X,求X的分布列.
参考数据:ζ ~N(u,false),则p(μ-σ【答案】(1)140;(2)(i)false;(ii)分布列见解析.
【详解】
(1)因为ξ服从正态分布N (270,false ),所以false,
所以质量指标在(260,265]内的排球个数为false个;
(2)(i)false,false
令false,得false,
当false时,false,false在false上单调递增;
当false时,false,false在false上单调递减;
所以false的最大值点false;
(ii)false的可能取值为0,1,2,3.
false;false;
false;false;
所以false的分布列为
false
0
1
2
3
P
false
false
false
false
课后小练
课后小练
1.某省参加2021年普通高考统考报名的所有考生均可选考英语口试科目,考生自愿参加,不作为统一要求.考生卷面成绩采用百分制.某市从参加高三英语口语考试的1000名学生中随机抽取100名学生,将其英语口试成绩(均为整数)分成六组false,false…false后得到如下部分频率分布直方图,已知第二组false与第三组false的频数之和等于第四组false的频数.
(1)求频率分布直方图中未画出矩形的总面积;
(2)预估该市本次参加高三英语口语考试的1000名学生中成绩处于false的人数;
(3)用分层抽样的方法在高分(不低于80分)段的学生中抽取一个容量为12的样本,将该样本看成一个总体,再从中任取3人,记这3人中成绩低于90分的人数为false,求随机变量false的分布列及数学期望.
2.某小微企业生产一种如下图所示的电路子模块,要求三个不同位置1、2、3接入三种不同类型的电子元件,且备选电子元件为A、B、C型,它们正常工作的概率分别为0.9、0.8、0.7.假设接入三个位置的元件能否正常工作相互独立.当且仅当1号位元件正常工作,同时2号位与3号位元件中至少有一件正常工作时,电路子模块才能正常工作.
(1)共可组装出多少种不同的电路子模块?
(2)求电路子模块能正常工作的概率最大值;
(3)若以每件5元、3元、2元的价格分别购进A、B、C型元件各1000件,组装成1000套电路子模块出售,设每套子模块组装费为20元.每套子模块的售价为150元,但每售出1套不能正常工作子模块,除退还购买款外,还将支付购买款的3倍作为赔偿金.求生产销售1000套电路子模块的最大期望利润.
3.随着时代发展和社会进步,教师职业越来越受青睐,考取教师资格证成为不少人的就业规划之一.当前,中小学教师资格考试分笔试和面试两部分.已知某市2020年共有10000名考生参加了中小学教师资格考试的笔试,现从中随机抽取100人的笔试成绩(满分视为100分)作为样本,整理得到如下频数分布表:
笔试成绩false
false
false
false
false
false
false
人数
5
10
25
30
20
10
(1)假定笔试成绩不低于90分为优秀,若从上述样本中笔试成绩不低于80分的考生里随机抽取2人,求至少有1人笔试成绩为优秀的概率;
(2)由频数分布表可认为该市全体考生的笔试成绩false近似服从正态分布false,其中false近似为100名样本考生笔试成绩的平均值(同一组中的数据用该组区间的中点值代替),false,据此估计该市全体考生中笔试成绩不低于85.9的人数(结果四舍五入精确到个位)
(3)考生甲为提升综合素养报名参加了某拓展知识竞赛,该竞赛要回答3道题,前两题是哲学知识,每道题答对得3分,答错得0分;最后一题是心理学知识,答对得4分,答错得0分.已知考生甲答对前两题的概率都是false,答对最后一题的概率为false,且每道题答对与否相互独立,求考生甲的总得分false的分布列及数学期望.
(参考数据:false;若false,则false,false,false.)
4.《健康中国行动(2019—2030年)》包括15个专项行动,其中全民健身行动提出鼓励公众每周进行3次以上?每次30分钟以上中等强度运动,或者累计150分钟中等强度或75分钟高强度身体活动,日常生活中要尽量多动,达到每天6千步~10千步的身体活动量,某高校从该校教职工中随机抽取了若干名,统计他们的日均步行数(均在2千步~14千步之间),得到的数据如下表:
日均步行数/千步
false
false
false
false
false
false
人数
12
24
false
24
false
9
频率
0.08
0.16
0.4
0.16
false
0.06
(1)求false,false,false的值;
(2)“每天运动一小时,健康工作五十年”,学校为了鼓励教职工积极参与锻炼,决定对日均步行数不低于false千步的教职工进行奖励,为了使全校30%的教职工得到奖励,试估计false的值;
(3)在第(2)问的条件下,以频率作为概率,从该校得到奖励的教职工中随机抽取3人,设这3人中日均步行数不低于10千步的人数为false,求false的分布列和数学期望.
5.某病毒在进入人体后有潜伏期,患者在潜伏期内无任何症状,但已具传染性.假设一位病毒携带者在潜伏期内每天有n位密接者,每位密接者被感染的概率为p,
(1)若false,false,求一天内被一位病毒携带者直接感染人数X的分布列和均值:
(2)某定点医院为筛查某些人员是否感染此病毒,需要检测血液样本是否为阳性,有以下两种检验方式:
①逐份检验,即k份血液样本需要检验k次;
②混合检验,即将k份(false且false)血液样本分别取样混合在一起检验,若检验结果为阴性,则这k份血液样本全为阴性,因而这k份血液样本只要检验一次就够了:如果检验结果为阳性,为了明确这k份血液样本究竞哪份为阳性,就要对k份血液样本再逐份检验,此时这k份血液样本的检验次数为k+1次.
假设样本的检验结果相互独立,且每份样本检验结果是阳性的概率为false,为使混合检验需要的检验的总次数false的期望值比逐份检验的总次数false的期望值更少,求k的取值范围.
参考数据:false,false,false,false,false.
参考答案
1.(1)0.45;(2)150名;(3)分布列见解析,false.
【详解】
(1)因为分数在false内的频率为false,
因为矩形的面积等于falsefalse组距=频率,
所以频率分布直方图中未画出部分矩形的总面积为0.45.
(2)设第三组false与第四组false的频率分别为false,false.
因为第二组false与第三组false的频数之和等于第四组false的频数.
所以第二组false与第三组false的频率之和等于第四组false的频率.
所以false,解得false
所以成绩处于第三组false之间的频率为0.15.
所以预估该市本次参加高三英语口语考试的000名学生中成绩处于false的人数为false(名).
(3)由题意,false分数段的人数为false(人),false分数段的人数为false(人).
因为用分层抽样的方法在高分段的学生中抽取一个容量为12的样本,所以需在false分数段内抽取10人;在false分数段内抽取2人;
设“从样本中任取3人,3人中成绩少于90分”的人数为false,则false的所有可能取值是1,2,3.
false,false,false.
所以随机变量false的分布列为
false
1
2
3
false
false
false
false
所以随机变量false的数学期望为false.
2.(1)6;(2)false;(3)27600元.
【详解】
(1)电子元件为A、B、C设接入三个位置共有false种不同的子模块;
(2)根据1号位放入A、B、C三种元件,共有三种情况,记其正常工作为A、B、C事件,
可得:false,
false,
false,
则false,
所以1号位接false型电子元件时,子模块正常工作的概率最大为false;
(3)若要最大利润,选择正常工作的概率最大的电路子模块,
应把A型元件接入1号位,此时false,
设1000套子模块中能正常工作的套数为X,利润为Y,
则false,
则false,
所以false,
false,
故生产销售1000套电路子模块的最大期望利润为27600元.
3.(1)false;(2)false人;(3)分布列见解析;期望为false.
【详解】
(1)由已知,样本中笔试成绩不低于80分的考生共30人,其中成绩优秀10人.
∴false.
(2)有表格数据知,false,又false,即false,
∴false,
由此可估计该市全体考生笔试成绩不低于85.9分的人数为false人.
(3)考生甲的总得分false的所有可能取值为0,3,4,6,7,10.
false,false,
false,false,
false,false,
false的分布列为:
false
0
3
4
6
7
10
false
false
false
false
false
false
false
false.
4.(1)false,false,false;(2)false;(3)分布列答案见解析,数学期望:false.
【详解】
解:(1)由题可得,false,解得false.
false.
易知false,∴false.
(2)由题意知,日均步行数在false内的频率为false,
日均步行数在false内的频率为false,
则false,
解得false.
所以当false时,全校30%的教职工能够得到奖励.
(3)由题意知该校得到奖励的教职工在全校教职工中所占的比例为0.3,所以日均步行数不低于10千步的教职工在得到奖励的教职工中所占的比例为false,
所以false,false,false,
所以false的分布列为
false
0
1
2
3
false
false
false
false
false
数学期望false.
5.(1)答案见解析;(2)false且k∈N*.
【详解】
(1)若n=3,p=false,依题意可知X服从二项分布,即X~B(3,false),
从而false,i=0,1,2,3.
随机变量X的分布列为:
X
0
1
2
3
P
false
false
false
false
随机变量X的均值为false.
(2)由题意知ζ的所有可能取值为1,false,且false,false,
∴false,
又∵E(η)=k,依题意E(ζ)<E(η),即:k+1-k(1-p)k<k,∴false<(1-p)k,
∵p=1-false,∴false<(false)k,∴lnk>falsek.
设false,则false,所以false时,false,false时,false,
所以f(x)在(0,3)上单调递增,在(3,+∞)上单调递减,
由于f(1)=false<0,f(2)=ln2-false>0,
f(4)=ln4-false=0.0530>0,f(5)=ln5-false=-0.0573<0,
故k的取值范围为false且k∈N*.