第七章 随机变量及其分布
第七章 随机变量及其分布
7.3离散型随机变量的数字特征
7.3离散型随机变量的数字特征
知识梳理
知识梳理
知识点一 离散型随机变量的均值
离散型随机变量的均值的概念
一般地,若 X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn=ipi为随机变量X的均值
离散型随机变量的均值的性质
若Y=aX+b,其中a,b均是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
证明如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是有E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
离散型随机变量的均值与样本平均值之间的关系
均值是随机变量可能取值关于________概率的加权平均数,它综合随机变量的取值和取值的概率,反映随机变量取值的________水平.
若Y=aX+b,其中a,b是________(X是随机变量),则Y也是________变量,且有E(aX+b)=aE(X)+b.
如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
(1)区别:随机变量的________是一个常数,不依赖于样本的抽取,样本平均值是一个随机变量,它随样本抽取的________而________.
(2)联系:对于简单的随机样本,随着样本容量的________,样本平均值越来越接近于________的均值.
知识点二离散型随机变量的方差、标准差
设离散型随机变量X的分布列如表所示.
X
x1
x2
…
xn
P
p1
p2
…
pn
我们用X所有可能取值xi与E(X)的偏差的平方(x1-E(X))2,(x2-E(X))2,…,(xn-E(X))2,关于取值概率的加权平均,来度量随机变量X取值与其均值E(X)的偏离程度.我们称D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=(xi-E(X))2pi为随机变量X的方差,有时也记为Var(X),并称为随机变量X的标准差,记为σ(X).
离散型随机变量方差的性质
1.设a,b为常数,则________________
2.D(c)=0(其中c为常数).
课后小练
课后小练
1.某大学为了解学生对false两本数学图书的喜好程度,从这两本数学图书都阅读过的生中随机抽取了false人,分别对这两本图书进行评分反馈,满分为false分,得到的相应数据整理如下表:
分数
false
false
false
false
false
false图书频数
false
false
false
false
false
false图书频数
false
false
false
false
false
学生对图书的“评价指数”如下表:
分数
false
false
false
评价指数
false
false
3
(1)从false两本图书都阅读过的学生中任选false人,试估计其对false图书“评价指数”为false的概率;
(2)从对false图书“评价指数”为false的学生中任选false人进一步访谈,设false为false人中评分在false内的人数,求随机变量false的分布列及数学期望;
(3)试估计学生更喜好false哪一本图书,并简述理由.
2.三阶魔方为false的正方体结构,由26个色块组成.常规竞速玩法是将魔方打乱﹐然后在最短的时间内复原.
(1)某魔方爱好者进行一段时间的魔方还原训练,每天魔方还原的平均速度false(秒)与训练天数false(天)有关,经统计得到如下数据:
false(天)
1
2
3
4
5
6
7
false(秒)
99
99
45
32
30
24
21
现用false,作为回归方程类型,请利用表中数据,求出该回归方程,并预测该魔方爱好者经过长期训练后最终每天魔方还原的平均速度false约为多少秒(精确到1秒);
(2)现有一个复原好的三阶魔方,白面朝上,只可以扭动最外侧的六个表面.某人按规定将魔方随机扭动两次,每次均顺时针转动false,记顶面白色色块的个数为false,求false的分布列及数学期望false.
参考数据(其中false).
参考公式:
false
false
false
184.5
0.37
0.55
对于一组数据false,false,…,false其回归直线false的斜率和截距的最小二乘法估计公式分别为false,false.
3.2020年5月27日,中央文明办明确规定,在2020年全国文明城市测评指标中不将马路市场?流动商贩列为文明城市测评考核内容.6月1日上午,国务院总理李克强在山东烟台考察时表示,地摊经济?小店经济是就业岗位的重要来源,是人间的烟火,和“高大上”一样,是中国的生机.其中套圈游戏凭借其趣味性和挑战性深受广大市民的欢迎,现有甲?乙两人进行套圈比赛,要求他们站在定点A,B两点处进行套圈,已知甲在A,B两点的命中率均为false,乙在A点的命中率为false,在B点的命中率为false,且他们每次套圈互不影响.
(1)若甲在A处套圈4次,求甲至少命中2次的概率;
(2)若甲和乙每人在A,B两点各套圈一次,且在A点命中计2分,在B点命中计3分,未命中则计0分,设甲的得分为false,乙的得分为false,写出false和false的分布列和期望;
(3)在(2)的条件下,若false,求false的取值范围
4.某市为了解游客对某景区的满意程度,市文旅委随机对景区的1000名游客进行问卷调查(满分100分),这1000名游客的评分分别落在区间false,false,false,false,false,false内,游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示,视频率为概率.
(1)求频率分布直方图中false的值,规定评分不低于80分为非常满意,60~80分为基本满意,低于60分为不满意,记游客非常满意的概率为false.市文旅委对部分游客进行了继续去旅游的意愿调查,若“不再去旅游”记1分,“继续去旅游”记2分,假设每位游客有继续旅游意愿的概率均为false,且这次调查得分恰为false分的概率为false,求false;
(2)用分层抽样的方法,从这1000名游客中抽取5人,组成咨询小组.若从该小组中抽取2人进行咨询.记2人中非常满意人数为false,求false的分布列和数学期望false.
5.某空调商家,对一次性购买两台空调的客户推出两种质保期两年内的保维修方案:
方案一:交纳质保金300元,在质保的两年内两条空调共可免费维修2次,超过2次每次收取维修费200元.
方案二:交纳质保金400元,在质保的两年内两台空调共可免费维修3次,超过3次每次收取维修费200元.
小李准备一次性购买两台这种空调,现需决策在购买时应购买哪种质保方案,为此搜集并整理了100台这种空调质保期内两年内维修的次数,统计得下表:
维修次数
0
1
2
3
空调台数
20
30
30
20
用以上100台空调维修次数的频率代替一台机器维修次数发生的概率.
(1)求购买这样的两台空调在质保期的两年内维修次数超过2次的概率;
(2)请问小李选择哪种质保方案更合算.
6.某社区为丰富居民的业余文化生活,打算在周一到周五连续为该社区居民举行“社区音乐会”,每晚举行一场,但若遇到风雨天气,则暂停举行.根据气象部门的天气预报得知,在周一到周五这五天的晚上,前三天每天出现风雨天气的概率均为false,后两天每天出现风雨天气的概率均为false,每天晚上是否出现风雨天气相互独立.已知前两天的晚上均出现风雨天气的概率为false,且这五天至少有一天晚上出现风雨天气的概率为false.
(1)求该社区能举行4场音乐会的概率;
(2)求该社区举行音乐会场数X的数学期望.
7.2020年,新冠病毒席卷全球,给世界各国带来了巨大的灾难面对疫情,我们伟大的祖国以人民生命至上为最高政策出发点,统筹全国力量,上下一心,进行了一场艰苦的疫情狙击战,控制住了疫情的蔓延并迅速开展相关研究工作.某医疗科学小组为了了解患有重大基础疾病(如,糖尿病、高血压…)是否与更容易感染新冠病毒有关,他们对疫情中心的人群进行了抽样调查,对其中50人的血液样本进行检验,数据如下表:
感染新冠病毒
未感染新冠病毒
合计
不患有重大基础疾病
15
患有重大基础疾病
25
合计
30
(1)请填写false列联表,并判断是否有99%的把握认为患有重大基础疾病更容易感染新冠病毒;
(2)在抽样调查过程中,发现某样本小组5人中有1人感染新冠病毒,需要通过化验血液来确定感染者,血液化验结果呈阳性即为感染者,呈阴性即未感染.下面是两种化验方法:
方法一:逐一检验,直到检出感染者为止;
方法二:先取3人血液样本,混合在一起检验,如呈阳性则逐一检验,直到检出感染者为止;如呈阴性,则检验剩余2人中任意1人的血液样本.
①求方法一的化验次数大于方法二的化验次数的概率;
②用X表示方法二中化验的次数,求X的数学期望.
falsefalse
0.050
0.010
0.001
false
3.841
6.635
10.828
附:false,其中false.
参考答案
1.(1)false;(2)分布列见解析,false;(3)false图书,理由见解析.
【详解】
(1)由频数分布表可知:对false图书评分的学生中,“评价指数”为false的学生所占的频率为false,
false从false两本图书都阅读过的学生中任选false人,估计其对false图书“评价指数”为false的概率为false.
(2)由题意得:false的所有可能取值为false,
则false,false,false,
false的分布列为:
false
false
false
false
false
false
false
false
false的数学期望为false.
(3)设学生对false图书的“评价指数”为false,对false图书的“评价指数”为false.
从阅读过两本图书的学生中任取一位,估计false的分布列为:
false
false
false
false
false
false
false
false
所以false;
估计false的分布列为:
false
false
false
false
false
false
false
false
false;
false,false学生更喜好图书false.
2.(1)false,13秒;(2)分布列见解析,false.
【详解】
(1)由题意可知:false,
false,
所以false,
因此false关于false的回归方程为false,
所以最终每天魔方还原的平均速度false约为13秒.
(2)由题意可知:false的可能取值为3,4,6,9,
false,false,
false,
false,
所以false的分布列为
false
3
4
6
9
false
false
false
false
false
所以数学期望为false.
3.(1)false;(2)分布列答案见解析,false;(3)false.
【详解】
解:(1)设“甲至少命中2次”为事件false,则false,
故甲至少命中2次的概率为false.
(2)由题意知,false,
false
false,
false
false
false
false的分布列为
false
0
2
3
5
false
false
false
false
false
false的分布列为
false
0
2
3
5
false
false
false
false
false
false
(3)false,
false,即false
false的取值范围是false
4.(1)false;(2)分布列见解析;期望为false.
【详解】
解:(1)由频率分布直方图可得,false,解得false,
游客满意的概率false,由题意可知调查的人数为2人或3人或4人,
若调查的人数为2人,则false,
若调查的人数为3人,则false,
若调查的人数为4人,则false.
(2)由(1)可得非常满意有5×0.4=2人,故false的所有可能取值为0,1,2,
false,
所以false的分布列为:
false
0
1
2
false
false
false
false
数学期望false.
5.(1)false;(2)方案二.
【详解】
(1)由题意,根据100台这种空调质保期内两年内维修次数的统计表,
可得两台空调在质保期的两年内维修次数超过2次的概率为:
false
(2)方案一的维修费用期望为:false元,
维修总费用为:false元,
方案二的维修费用期望为:false元
维修总费用为:false元,
故方案二更合算.
6.(1)false;(2)false.
【详解】
(1)依题意false.
所以该社区能举行4场音乐会的概率为:
false.
(2)false的可能取值为false,
false,
falsefalse,
falsefalse
false,
falsefalse
false,
false,false,
所以false的分布列为:
false
false
false
false
3
false
false
false
false
false
false
false
false
false
false.
7.(1)填表见解析;有;(2)①false;②false(次).
【详解】
解:(1)列联表完成如下图
感染新冠病毒
未感染新冠病毒
合计
不患有重大基础疾病
10
15
25
患有重大基础疾病
20
5
25
合计
30
20
50
∴false
所以有99%的把握认为患重大基础疾病更容易感染新冠病毒.
(2)记false表示依方法一需化验i次,false表示依方法二需化验j次,
A表示方法一的化验次数大于方法二的化验次数,
依题意知false与false相互独立.
①false,false,false,false
false,false
由于false
所以false
即false
②false的可能取值为2,3.
false,false
所以false(次)