第七章 随机变量及其分布
第七章 随机变量及其分布
7.5正态分布
7.5正态分布
知识梳理
知识梳理
知识点1.正态分布
定义:对于任何实数随机变量满足:,则随机变量服从正态分布。记为________________
正态分布的期望与方差
若,,则的期望与方差分别为:,________________。
知识点2.正态曲线:
正态曲线:
沿着横轴方向水平________能改变对称轴的位置,曲线的形状没有改变,所得的曲线依然是正态曲线false函数,其中false,false为参数.
显然对于任意x∈R,false,它的图象在x轴的上方,可以证明x轴和曲线之间的区域的面积为________,称false为正态密度函数,称它的图象为正态曲线.若随机变量X的概率密度函数为false,称随机变量X服从正态分布,记为X~false,当=0,=1时,称随机变量X服从标准正态分布.
正态曲线的性质:
①曲线位于轴上方,与轴不________;
②曲线是________的,它关于直线对称;
③曲线在时达到峰值;
④当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为________线,向它无限靠近.
⑤曲线与轴之间的面积为1;
⑥决定曲线的位置和________性;
当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿轴________。
⑦确定曲线的形状;
当一定时,曲线的形状由确定。越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散。
正态曲线的特点
1.对?x∈R,f(x)>0,它的图象在x轴的________方.
2.曲线与x轴之间的面积为________.
3.曲线是单峰的,它关于直线________对称.
4.曲线在x=μ处达到峰值.
5.当|x|无限增大时,曲线无限接近________轴.
6.当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图①.
7.当μ一定时,曲线的形状由σ确定,σ较小时曲线“瘦高”,表示随机变量X的分布比较集中;σ较大时,曲线“矮胖”,表示随机变量X的分布比较分散
正态总体在三个特殊区间内取值的概率值及3σ原则
P(μ-σ≤X≤μ+σ)≈0.682 7;
P(μ-2σ≤X≤μ+2σ)≈0.954 5;
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
尽管正态变量的取值范围是(-∞,+∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ,μ+3σ]内,而在此区间以外取值的概率大约只有0.002 7,通常认为这种情况在一次试验中几乎不可能发生.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
课后小练
课后小练
1.已知某高校共有false名学生,其图书馆阅览室共有false个座位,假设学生是否去自习是相互独立的,且每个学生在每天的晚自习时间去阅览室自习的概率均为false.
(1)将每天的晚自习时间去阅览室自习的学生人数记为false,求false的期望和方差;
(2)18世纪30年代,数学家棣莫弗发现,如果随机变量false服从二项分布false,那么当false比较大时,可视为false服从正态分布false.任意正态分布都可变换为标准正态分布(false且false的正态分布),如果随机变量false,那么令false,则可以证明false.当false时,对于任意实数false,记false.已知下表为标准正态分布表(节选),该表用于查询标准正态分布对应的概率值.例如当false时,由于false,则先在表的最左列找到数字false(位于第三行),然后在表的最上行找到数字false(位于第八列),则表中位于第三行第八列的数字false便是false的值.
(i)求在晚自习时间阅览室座位不够用的概率;
(ii)若要使在晚自习时间阅览室座位够用的概率高于false,则至少需要添加多少个座位?
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
false
2.已知某生产线的生产设备在正常运行的情况下,生产的零件尺寸false(单位:false)服从正态分布false.
(1)从该生产线生产的零件中随机抽取false个,求至少有一个尺寸小于false的概率;
(2)为了保证生产线正常运行,需要对生产设备进行维护,包括日常维护和故障维修,假设该生产设备使用期限为四年,每一年为一个维护周期,每个周期内日常维护费为false元,若生产设备能连续运行,则不会产生故障维修费;若生产设备不能连续运行,则除了日常维护费外,还会产生一次故障维修费.已知故障维修费第一次为false元,此后每增加一次则故障维修费增加false元.假设每个维护周期互相独立,每个周期内设备不能连续运行的概率为false.求该生产设备运行的四年内生产维护费用总和false的分布列与数学期望.
参考数据:若false,则false,false,false,false.
3.“学习强国”学习平台是由中共中央宣传部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员?面向全社会的互联网学习平台.该平台学习采取积分制管理,内容丰富多彩,涉及政治?经济?文化?社会?生态,表现形式有图片?文字?视频?考试?答题?互动等,让人们的生活充实而有质量.某市为了了解教职工在“学习强国”平台的学习情况,从该市教职工中随机抽取了200人,统计了他们在“学习强国”中获得的积分(单位:千分)并将样本数据分成false,false,false,false,false,false六组,绘制成如图所示的频率分布直方图.
(1)以样本估计总体,该市教职工在“学习强国”获得的积分近似服从正态分布false,其中false近似为样本的平均数(同一组中的数据用该组区间的中点值作代表),取false.若该市恰有1万名教职工,试估计这些教职工中积分false位于区间false内的人数.
(2)若以该市样本的频率估计邻市的概率(邻市对教职工学习“学习强国”的要求与该市相同,教职工的人数也与该市教职工的人数相当),若从邻市教职工中随机抽取20人,设积分在3千分至9千分内的教职工人数为false,求false的期望false.
参考数据:若随机变量false服从正态分布false,则false,false,false.
4.某机构为研究考生物理成绩与数学成绩之间的关系,从一次考试中随机抽取false名考生的数据,统计如下表:
数学成绩false
false
false
false
false
false
false
false
false
false
false
false
物理成绩false
false
false
false
false
false
false
false
false
false
false
false
(1)由表中数据可知,有一位考生因物理缺考导致数据出现异常,剔除该组数据后发现,考生物理成绩false与数学成绩false之间具有线性相关关系,请根据这false组数据建立false关于false的回归直线方程,并估计缺考考生如果参加物理考试可能取得的成绩;
(2)已知参加该次考试的false名考生的物理成绩服从正态分布false,用剔除异常数据后的样本平均值作为false的估计值,用剔除异常数据后的样本标准差作为false的估计值,估计物理成绩不低于false分的人数false的期望.
附:参考数据:
false
false
false
false
false
false
false
false
false
false
false
false
上表中的false;表示样本中第false名考生的数学成绩,false;表示样本中第false名考生的物理成绩,false.参考公式:①对于一组数据:false,其方差:false.②对于一组数据false,其回归直线false的斜率和截距的最小二乘估计分别为:false,false.③若随机变量false服从false,则false,false,false.
5.某乒乓球教练为了解某同学近期的训练效果,随机记录了该同学false局接球训练成绩,每局训练时教练连续发false个球,该同学每接球成功得false分,否则不得分,且每局训练结果相互独立,得到如图所示的频率分布直方图.
(1)同一组数据用该区间的中点值作代表,
①求该同学false局接球训练成绩的样本平均数false;
②若该同学的接球训练成绩false近似地服从正态分布false,其中false近似为样本平均数false,求false的值;
(2)为了提高该同学的训练兴趣,教练与他进行比赛.一局比赛中教练连续发false个球,该同学得分达到false分为获胜,否则教练获胜.若有人获胜达false局,则比赛结束,记比赛的局数为false.以频率分布直方图中该同学获胜的频率作为概率,求false.
参考数据:若随机变量false,则false,false,false.
6.2020年新冠疫情以来,医用口罩成为防疫的必需品.根据国家质量监督检验标准,过滤率是生产医用口罩的重要参考标准,对于直径小于5微米的颗粒的过滤率必须大于90%.为了监控某条医用口罩生产线的生产过程,检验员每天从该生产线上随机抽取10个医用口置,检测其过滤率,依据长期生产经验,可以认为这条生产线正常状态下生产的医用口罩的过滤率false服从正态分布false.假设生产状态正常,生产出的每个口罩彼此独立.记false表示一天内抽取10个口罩中过滤率小于或等于false的数量.
(1)求false的概率;
(2)求false的数学期望false;
(3)一天内抽检的口罩中,如果出现了过滤率false小于false的口罩,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需要对当天的生产过程进行检查维修,试问这种监控生产过程的方法合理吗?
附:若随机变量false,则false,false,false,false.
参考答案
1.(1)随机变量false的期望是1000,方差是900;(2)(i)0.5793;(ii)阅览室至少还要增加22个座位.
【详解】
(1)由题意得:随机变量X服从二项分布,其中n=10000,p=0.1,
则false,
所以随机变量false的期望是1000,方差是900;
(2)(i)由于(1)中的二项分布n值较大,所以可以认为随机变量X服从正态分布,
由(1)知false,则false,
false,
由标准正态分布的性质可知 false,
所以 false,
所以false,
故在晚自习时间阅览室座位不够用的概率是0.5793;
(ii)查表可得:false,则false,
即false,
而false,
故座位数至少要1016个,
由于1016-994=22,则阅览室至少还要增加22个座位.
2.(1)false;(2)分布列见解析;期望为false.
【详解】
(1)因为false,
则false,false,false,
所以false,
所以从该生产线生产的零件中随机抽取false个,至少有一个尺寸小于false的概率为:
false.
(2)由题意可得false的所有可能取值为false,false,false,false,false,
false,
false,
false,
false,
false,
所以false的分布列为:
false
false
false
false
false
false
false
false
false
false
false
false
数学期望false.
3.(1)人数约为8186;(2)false.
【详解】
(1)由题意知样本的平均数为falsefalsefalsefalsefalse,∴false.又∵false,
∴false
false
false.又false,
∴估计这些教职工中积分false位于区间false内的人数约为8186.
(2)该市样本在false内的频率为false,则false,
∴false的期望false.
4.(1)false,物理成绩为false;(2)false.
【详解】
(1)设根据剔除后数据建立的false关于false的回归直线方程为false,
剔除异常数据后的数学平均分为false,
剔除异常数据后的物理平均分为false,
则false,
则false,
所以所求回归直线方程为false.
又物理缺考考生的数学成绩为false,
所以估计其可能取得的物理成绩为false.
(2)由题意知false,
因为false,
所以false,
所以参加该次考试的false名考生的物理成绩服从正态分布false,
则物理成绩不低于false分的概率为false,
由题意可知false,
所以物理成绩不低于false分的人数false的期望
false.
5.(1)①false;②false;(2)false.
【详解】
(1)①由频率分布直方图可得false;
②可知false,false,则false,false,
所以,false
false;
(2)由频率分布直方图可知,在一局中,该同学得分达到false分的概率为false,
由题意可知,随机变量false的可能取值有false、false、false,
false,false,
false,
所以,随机变量false的分布列如下表所示:
false
false
false
false
false
false
false
false
因此,false.
6.(1)false;(2)false;(3)这种监控生产过程的方法合理.
【详解】
(1)抽取口罩中过滤率在false内的概率false,
所以false,
所以false,
故false
(2)由题意可知false,所以false.
(3)如果按照正常状态生产,由(1)中计算可知,一只口罩过滤率小于或等于false的概率false,一天内抽取的10只口覃中,出现过滤率小于或等于false的概率false,发生的概率非常小,属于小概率事件.所以一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程中可能出现了异常情况,需要对当天的生产过程进行检查维修.可见这种监控生产过程的方法合理.