第七章 随机变量及其分布
第七章 随机变量及其分布
7.2离散型随机变量及其分布列
7.2离散型随机变量及其分布列
知识梳理
知识梳理
知识点一 随机变量的概念、表示及特征
概念:一般地,对于随机试验样本空间Ω中的每个样本点ω都有唯一的________X(ω)与之对应,我们称X为________变量.
表示:用大写英文字母表示随机变量,如X,Y,Z;用小写英文字母表示随机变量的取值,如x,y,z.
特征:随机试验中,每个样本点都有________的一个实数与之对应,随机变量有如下特征:
(1)取值依赖于________点.
(2)所有可能取值是________的.
知识点二 随机变量与函数有什么联系和区别?
共同点:随机变量和函数都是一种________
区别: 随机变量把试验的结果映为________,函数把实数映为________
联系:试验结果的范围相当于函数的定义域,随机变量的取值范围相当与________的值域;
注意:所有随机变量的取值范围的集合叫做随机变量的值域.
知识点三随机变量的分类:
1)离散型随机变量:
对于随机变量可能取的值,如果可以一一列出,这样的随机变量叫做________________________.
2)连续型随机变量:
随机变量可以取某一区间内的________值,这样的随机变量叫做连续型随机变量.
知识点四离散型随机变量的分布列及其性质
1.定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,xn,我们称X取每一个值xi的概率P(X=xi)=pi,i=1,2,3,…,n为X的概率分布列,简称分布列.
2.分布列的性质
(1)pi≥0,i=1,2,…,n.
(2)p1+p2+…+pn=1.
课后小练
课后小练
1.2021年初,新冠肺炎疫情形势又加严峻.为减少疫情传播风险,各地就春节期间新冠肺炎疫情防控工作发出了温馨提示,比如:提倡在外工作的双峰籍人员就地过节、返双人员请提前3天向目的地所在村(社区)或单位报备、对来自国外、高风险地区等人员要及时上报疫情防控指挥部等等.某社区严格把控进入小区的人员,对所有进入的人员都要进行体温测量,为了测温更快捷方便,使用电子体温计测量体温,但使用电子体温计测量体温可能会产生误差;对同一人而言,如果用电子体温计与水银体温计测温结果相同,我们认为电子体温计“测温准确”;否则,我们认为电子体温计“测温失误”.在进入社区的人中随机抽取了15人用两种体温计进行体温检测,数据如下:
序号
电子体温计
水银体温计
序号
电子体温计
水银体温计
测温(℃)
测温(℃)
测温(℃)
测温(℃)
01
37.0
36.8
9
36.3
36.6
02
36.3
36.3
10
36.7
36.7
03
36.5
36.7
11
37.0
37.0
04
36.5
36.5
12
35.8
35.5
05
36.9
36.6
13
35.2
35.3
06
36.4
36.4
14
36.8
36.9
07
36.2
36.2
15
35.9
36.1
08
36.3
36.4
(1)医学上通常认为,人的体温在不低于37.3℃且不高于38℃时处于“低热”状态,该社区某一天用电子体温计测温的结果显示,有3人的体温都是37.3℃,由表中的数据估计这3个人中至少有1人处于“低热”状态的概率;
(2)从该社区中任意抽查3人用智能体温计测量体温,设随机变量X为使用智能体温计“测温准确”的人数,求X的分布列.
2.根据党的十九大规划的“扶贫同扶志、扶智相结合”精准扶贫、精准脱贫路径,中国儿童少年基金会为了丰富留守儿童的课余文化生活,培养良好的阅读习惯,在农村留守儿童聚居地区捐建“小候鸟爱心图书角”.2021年寒假某村组织开展“小候鸟爱心图书角读书活动”,号召全村少年儿童积极读书,养成良好的阅读习惯.根据统计全村少年儿童中,平均每天阅读1小时以下约占19.7%、1-2小时约占30.3%、3-4小时约占27.5%、5小时以上约占22.5%.
(1)将平均每天阅读5小时以上认为是“特别喜欢”阅读,在活动现场随机抽取30名少年儿童进行阅读情况调查,调查发现:
父或母喜欢阅读
父母均不喜欢阅读
总计
少年儿童“特别喜欢”阅读
7
1
8
少年儿童“非特别喜欢”阅读
5
17
22
总计
12
18
30
请根据所给数据判断,能否在犯错误的概率不超过0.005的条件下认为“特别喜欢”阅读与父或母喜欢阅读有关?
(2)活动规定,每天平均阅读时长达3个小时的少年儿童,给予两次抽奖机会,否则只有一次抽奖机会,各次抽奖相互独立.中奖情况如下表
抽中奖品
价值100元的图书购书券
价值50元的图书购书券
中奖概率
false
false
从全村少年儿童中随机选择一名少年儿童来抽奖,设该少年儿童共获得元图书购书券,求的分布列和期望.
false
false
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
false
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
3.2020年爆发人群广泛感染的新型冠状病毒是一种可以借助飞沫和接触传播的变异病毒.某市防疫部门为尽快筛查出新冠病毒感染者,将高风险地区及重点人群按照false单样检测,中风险地区可以按照false混样检测,低风险地区可以按照false混样检测.单样检测即为逐份检测,混样检测是将false份或false份样本分别取样后混合在一起检测.若检测结果为阴性,则全为阴性,若检测结果为阳性,就要同时对这几份样本进行单独逐一检测,假设在接受核酸检测样本中,每份样本的检测结果是阳性还是阴性都是相互独立的,且中风险地区每份样本是阳性结果的概率均为false.
(1)现有该市中风险地区false的false份核酸检测样本要进行false混样检测,求检测总次数为false次的概率.
(2)现有该市中风险地区false的false份核酸检测样本,已随机平均分为三组,要采用false混样检测,设检测总次数为false,求false的分布列和数学期望.
4.第五代移动通信技术(英语:false或false,简称false或false技术)是最新一代蜂窝移动通信技术,也是继falsefalse、false和false系统之后的延伸.false的性能目标是高数据速率减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接.某大学为了解学生对“false”相关知识的了解程度,随机抽取false名学生参与测试,并将得分绘制成如下频数分布表:
得分
false
false
false
false
false
false
false
男性人数
false
false
false
false
false
false
false
女性人数
false
false
false
false
false
false
false
(1)将学生对“false”的了解程度分为“比较了解”(得分不低于false分)和“不太了解”(得分低于false分)两类,完成false列联表,并判断是否有false的把握认为“学生对“false”的了解程度”与“性别”有关?
不太了解
比较了解
合计
男性
女性
合计
(2)以这false名学生中“比较了解”的频率作为该校学生“比较了解”的概率.现从该校学生中,有放回的抽取false次,每次抽取false名学生,设抽到“比较了解”的学生的人数为false,求false的分布列和数学期望.
附:false(false).
临界值表:
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
5.为了研究学生的数学核心素养与抽象能力(指标false)、推理能力(指标false)、建模能力(指标false)的相关性,将它们各自量化为1、2、3三个等级,再用综合指标false的值评定学生的数学核心素养,若false,则数学核心素养为一级;若false,则数学核心素养为二级;若false,则数学核心素养为三级,为了了解某校学生的数学核心素养,调查人员随机访问了某校10名学生,得到如下数据:
学生编号
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
(1)在这10名学生中任取两人,求这两人的建模能力指标相同条件下综合指标值也相同的概率;
(2)在这10名学生中任取三人,其中数学核心素养等级是一级的学生人数记为false,求随机变量false的分布列及其数学期望.
6.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.
某读书APP抽样调查了非一线城市M和一线城市N各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.
(1)请填写以下false列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?
活跃用户
不活跃用户
合计
城市M
城市N
合计
(2)以频率估计概率,从城市M中任选2名用户,从城市N中任选1名用户,设这3名用户中活跃用户的人数为false,求false的分布列和数学期望.
(3)该读书APP还统计了2018年4个季度的用户使用时长y(单位:百万小时),发现y与季度(false)线性相关,得到回归直线为false,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(false)该读书APP用户使用时长约为多少百万小时.
附:false,其中false.
false
0.025
0.010
0.005
0.001
false
5.024
6.635
7.879
10.828
7.某超市采购了一批袋装的进口牛肉干进行销售,共1000袋,每袋成本为30元,销售价格为50元,经过科学测定,每袋牛肉干变质的概率为false,且各袋牛肉干是否变质相互独立.依据消费者权益保护法的规定:超市出售变质食品的,消费者可以要求超市退一赔三.为了保护消费者权益,针对购买到变质牛肉干的消费者,超市除退货外,并对每袋牛肉干以销售价格的三倍现金赔付,且把变质牛肉干做废物处理,不再进行销售.
(1)若销售完这批牛肉干后得到的利润为X,且false,求p的取值范围;
(2)已知false,若超市聘请兼职员工来检查这批牛肉干是否变质,超市需要支付兼职员工工资5000元,这样检查到的变质牛肉干直接当废物处理,就不会流入到消费者手中.请以超市获取的利润为决策依据,判断超市是否需要聘请兼职员工来检验这批牛肉干是否变质?
参考答案
1.(1)false;(2)分布列见解析.
【详解】
(1)设这3人中至少有1人处于“低热”状态的事件为A,其对立事件为3人都处于“低热”状态,
由表中15人的体温数据知,用电子体温计的测温结果高于其真实体温的序号为01,05,12,共计3种情况,
从社区任意抽查1人,用电子体温计的测温结果高于其真实体温的频率为false,
由此估计从社区任意抽查1人,用电子体温计的测温结果高于其真实体温的概率也为false,
所以这3人中至少有1人处于“低热”状态的概率为:false;
(2)随机变量X的所有可能取值为false,
由表中数据可知,用电子体温计与水银体温计测温结果相同的序号是:02,04,06,07,10,11,共有6种情况,
所以用电子体温计测量该社区1人“测温准确”的频率为false,估计其概率为false,
所以false,false,
false,false,
故X的分布列为:
X
0
1
2
3
P
false
false
false
false
2.(1)能;(2)分布列见解析,100.
【详解】
(1)∵false,
故能在犯错误的概率不超过0.005的条件下认为“特别喜欢”阅读与父或母喜欢阅读有关.
(2)根据题意:false可取50,100,150,200,
false;
false;
false;
false,
则false的分布列如下:
false
50
100
150
200
false
false
false
false
false
false的期望为false.
3.(Ⅰ)false; (Ⅱ)分布列见解析,false.
【详解】
(1)设“检测总次数为false次”为事件false,
false,
false检测总次数为false次的概率为false.
(2)false的所有可能取值为false,
设false,false为三个小组中出现阳性的小组数,
则false,false,
false,
false
false
false
所以,随机变量false的分布列为:
false
false
false
false
false
false
false
false
false
false
false
false
4.(1)表格见解析,有false的把握;(2)分布列见解析,false.
【详解】
(1)由题意得列联表如下:
不太了解
比较了解
合计
男性
false
false
false
女性
false
false
false
合计
false
false
false
false.
因为false,
所以有false的把握认为学生对“false”的了解程度与性别有关;
(2)由题意抽取的false名学生中“比较了解”的频率为false,
故抽取该校false名学生对“false”技术“比较了解”的概率为false,
false,false,false,1,2,3,
即false的分布列如下
false
false
false
false
false
false
false
false
false
false
所以false.
5.(1)false;(2)见解析
【详解】
false
false
false
false
false
false
false
false
false
false
x
2
3
3
1
2
2
2
2
2
2
y
2
2
3
2
3
3
2
3
1
2
z
3
3
3
2
2
3
2
3
1
2
w
7
8
9
5
7
8
6
8
4
6
(1)由题可知:建模能力一级的学生是false;建模能力二级的学生是false;建模能力三级的学生是false.
记“所取的两人的建模能力指标相同”为事件false,记“所取的两人的综合指标值相同”为事件false.
则 false
(2)由题可知,数学核心素养一级的学生为: false,非一级的学生为余下4人
false的所有可能取值为0,1,2,3.
false
false随机变量false的分布列为:
false
0
1
2
3
false
false
false
false
false
false false false
6.(1)见解析;(2)见解析;(3) false百万小时
【详解】
(1)由已知可得以下false列联表:
活跃用户
不活跃用户
合计
城市M
60
40
100
城市N
80
20
100
合计
140
60
200
计算false ,
所以有99.5%的把握认为用户是否活跃与所在城市有关.
(2)由统计数据可知,城市M中活跃用户占false,城市N中活跃用户占false,
设从M城市中任选的2名用户中活跃用户数为false,则false
设从N城市中任选的1名用户中活跃用户数为false,则false服从两点分布,其中false.
故false,
false;
false;
false;
false.
故所求false的分布列为
false
0
1
2
3
false
false
false
false
false
false.
(3)由已知可得false,又false,
可得false,所以false,所以false.
以false代入可得false(百万小时),
即2019年第一季度该读书APP用户使用时长约为false百万小时.
7.(1)false;(2)由false,以超市获取的利润为决策依据,故超市需要聘请兼职员工来检验这批牛肉干是否变质.
【详解】
(1)令Y表示这1000袋牛肉干中变质牛肉干的数量.
由题意有false,则false,
故false.
由false,有false,解得:false.
故当false时,p的取值范围为false.
(2)
当false时,由(1)知,false.
设需要赔付给消费者的费用为Z元,有false.
由false,以超市获取的利润为决策依据,故超市需要聘请兼职员工来检验这批牛肉干是否变质.