正态分布
【学习目标】
了解正态分布曲线的特点及曲线所表示的意义。
了解正态曲线与正态分布的性质。
【要点梳理】
要点诠释:
要点一、概率密度曲线与概率密度函数
1.概念:
对于连续型随机变量/,位于/轴上方,/落在任一区间(a,b]内的概率等于它与/轴、直线/与直线/所围成的曲边梯形的面积(如图阴影部分),这条概率曲线叫做/的概率密度曲线,以其作为图象的函数/叫做/的概率密度函数。
/
2、性质:
①概率密度函数所取的每个值均是非负的。
②夹于概率密度的曲线与/轴之间的“平面图形”的面积为1
③/的值等于由直线/,/与概率密度曲线、/轴所围成的“平面图形”的面积。
要点二、正态分布
1.正态变量的概率密度函数
正态变量的概率密度函数表达式为:/,(/)
其中x是随机变量的取值;μ为正态变量的期望;/是正态变量的标准差.
2.正态分布
(1)定义
如果对于任何实数/随机变量/满足:/,
则称随机变量/服从正态分布。记为/。
(2)正态分布的期望与方差
若/,则/的期望与方差分别为:/,/。
要点诠释:
(1)正态分布由参数/和/确定。
参数/是均值,它是反映随机变量取值的平均水平的特征数,可用样本的均值去估计。/是
标准差,它是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计。
(2)经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.
在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.
要点三、正态曲线及其性质:
1. 正态曲线
如果随机变量X的概率密度函数为/,其中实数/和/为参数(/),则称函数/的图象为正态分布密度曲线,简称正态曲线。
///
2.正态曲线的性质:
①曲线位于/轴上方,与/轴不相交;
②曲线是单峰的,它关于直线/对称;
③曲线在/时达到峰值/;
④当/时,曲线上升;当/时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.
⑤曲线与/轴之间的面积为1;
⑥/决定曲线的位置和对称性;
当/一定时,曲线的对称轴位置由/确定;如下图所示,曲线随着/的变化而沿/轴平移。
/
⑦/确定曲线的形状;
当/一定时,曲线的形状由/确定。/越小,曲线越“高瘦”,表示总体的分布越集中;/越大,曲线越“矮胖”,表示总体的分布越分散。如下图所示。
/
要点诠释:
性质①说明了函数具有值域(函数值为正)及函数的渐近线(x轴).性质②并且说明了函数具有对称性;性质③说明了函数在x=/时取最值;性质⑦说明/越大,总体分布越分散,/越小,总体分布越集中.
要点四、求正态分布在给定区间上的概率
随机变量取值的概率与面积的关系
若随机变量ξ服从正态分布/,那么对于任意实数a、b(a<b),当随机变量ξ在区间(a,b]上取值时,其取值的概率与正态曲线与直线x=a,x=b以及x轴所围成的图形的面积相等.如图(1)中的阴影部分的面积就是随机变量孝在区间(a,b]上取值的概率.
/
一般地,当随机变量在区间(-∞,a)上取值时,其取值的概率是正态曲线在x=a左侧以及x轴围成图形的面积,如图(2).随机变量在(a,+∞)上取值的概率是正态曲线在x=a右侧以及x轴围成图形的面积,如图(3).
根据以上概率与面积的关系,在有关概率的计算中,可借助与面积的关系进行求解.
2、正态分布在三个特殊区间的概率值:
/;
/;
/。
上述结果可用下图表示:
/
要点诠释:
若随机变量/服从正态分布/,则/落在/内的概率约为0.997,落在/之外的概率约为0.003,一般称后者为小概率事件,并认为在一次试验中,小概率事件几乎不可能发生。
一般的,服从于正态分布/的随机变量/通常只取/之间的值,简称为/原则。
3、求正态分布在给定区间上的概率方法
(1)数形结合,利用正态曲线的对称性及曲线与/轴之间面积为1。
①正态曲线关于直线/对称,与/对称的区间上的概率相等。
例如/;
②/;
③若/,则/。
(2)利用正态分布在三个特殊区间内取值的概率:
①/;
②/;
③/。
【典型例题】
类型一、正态分布的概率密度函数
例1. 下列函数是正态密度函数的是( ).
A.//,/(/)都是实数
B./ C./ D./
【思路点拨】本题可对照正态密度函数的标准形式判断.
【解析】 正态密度函数为:/,
其中指数部分的/应与系数的分母处的/保持一致,系数为正数且指数为负数.
选项A有两处错误,分别是/错为/,指数错为正数.选项C,从系数可得/=2,而从指数处可得/,显然不符.选项D中指数为正,错误.所以正确答案为B.
【总结升华】注意函数/的形式特点是解题的关键.
举一反三:
【变式1】设一正态总体,它的概率密度曲线是函数/的图象,则这个正态总体的均值与方差分别是( )
A.10与8 B.10与4 C.8与10 D.2与10
【答案】在该正态分布中,/=10,/=2,则E(X)=10,D(X)=/=4,故选B。。
【变式2】.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ /
(1)/
(2)/
(3)/
【答案】(1) 0,1 (2) 1,2 (3) -1,0.5
【变式3】正态总体为/1概率密度函数/是 ( )
A.奇函数 B.偶函数 C.非奇非偶函数 D.既是奇函数又是偶函数
【答案】B。因为所以选B。
【变式4】一台机床生产一种尺寸为10 mm的零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm):10.2,10.1,10,9.8,9.9,10.3,9.7,10,9.9,10.1.如果机床生产零件的尺寸X服从正态分布,求正态分布的概率密度函数式.
【答案】求正态分布的概率密度函数式,只要求出参数/和/即可,而/即样本均值,/即样本标准差.
依题意得/,
/
/.
即/,/.所以X的概率密度函数为/.
类型二、正态曲线
例2. 如图所示,是一个正态曲线,试根据该图像写出其正态分布的概率密度函数的解析式,求出总体随机变量的期望和方差.
【思路点拨】 由正态曲线的图像可知,该曲线的对称轴为x=20,最大值为/,因此,μ=20,由/可求得/的值.
【解析】 从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是/,所以μ=20.
由/,解得/.
于是概率密度函数的解析式是/,x∈(-∞,+∞).总体随机变量的期望是μ=20,方差是/.
【总结升华】 利用图像求正态密度函数的解析式,应抓住图像的实质性两点:一是对称轴x=μ,一是最值/.这两点确定以后,相应参数纵/、/便确定了,代入P(x)中便可求出相应的解析式.
举一反三:
【变式1】 关于正态密度曲线性质的叙述:
①曲线关于直线x=/对称,整条曲线在x轴上方;
②曲线对应的正态总体概率密度函数是偶函数;
③曲线在x=/时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低;
④曲线的对称位置由/确定,曲线的形状由/确定,/越大曲线越“矮胖”,反之,曲线越“高瘦”.
其中叙述正确的有( ).
A.①②③ B.①③④ C.②③④ D.①②③④
【答案】 B
根据曲线关于直线x=/对称,只有当/=0时函数才是偶函数,故②错.利用排除法选B.
【变式2】如图,两个正态分布曲线图:
1为/,2为/,
则/ /,/ /(填大于,小于)
【答案】<,>。解析:由正态密度曲线图象的特征知。
【变式3】如图是三个正态分布X~N(0,0.25),Y~N(0,1),Z~N(0,4)的密度曲线,则三个随机变量X,Y,Z对应曲线分别是图中的________、________、________。
/
【答案】①②③。
【变式4】已知正态总体落在区间/的概率是0.5,那么相应的正态曲线在/ 时达到最高点。
【答案】0.2。
由于正态曲线关于直线/对称,由题意知/。
类型三、正态分布的计算
例3.已知随机变量ξ服从正态分布N(2,σ2),P(ξ≤4)=0.84,则P(ξ≤0)=( )
A.0.16 B.0.32
C.0.68 D.0.84
【思路点拨】可画出正态曲线,利用正态曲线的对称性解决。
【解析】∵P(ξ≤4)=0.84,μ=2,∴P(ξ≤0)=P(ξ≥4)
=1-0.84=0.16,故选A.
【总结升华】本题利用了正态密度曲线的性质求概率,其中应注意对称性的运用。
举一反三:
【变式1】(1)/,/和/的值各是多少?(2)/,/和/的值各是多少?
【答案】
(1)比照/(/),/时,/=0,/=1。
(2)比照/(/),/时,/=-1/,所以 /=-1,/=3。
【变式2】在某次测量中,测量结果/服从正态分布//,若/在(0,1)内取值的概率为0.4,则/在(0,2)内取值的概率为________。
【答案】0.8
/服从正态分布/,
∴在(0,1)与(1,2)内取值的概率相同,均为0.4。
/在(0,2)内取值的概率为0.4+0.4=0.8。
【变式3】设随机变量X~N(0,1),
(1)P(-a<X<0)=P(0<X<a)(a>0);
(2)P(X<0)=0.5;
(3)已知P(|X|<1)=0.6826,则P(X<-1)=0.1587;
(4)已知P(|X|<2)=0.9544,则P(X<2)=0.9772;
(5)已知P(|X|<3)=0.9974,则P(X>-3)=0.9987。
其中正确的有( )
A.2个 B.3个 C.4个 D.5个
【答案】D;均正确,充分利用正态曲线的对称性及其意义。
例4. 设ξ~N(1,22),试求:
(1)P(-1<ξ≤3);
(2)P(3<ξ≤5);
(3)P(ξ≥5).
【思路点拨】 要求随机变量ξ在某一范围内的概率,只需借助于正态密度曲线的图像性质以及课本中所给的数据进行转化求值.
【解析】 ∵ξ~N(1,22),∴/=1,/=2,
(1)P(-1<ξ≤3)=P(1-2<ξ≤1+2)=P(/<ξ≤/)=0.683.
(2)∵P(3<ξ≤5)=P(-3<ξ≤-1),
∴P(3<ξ≤5)
/
/
/
/.
(3)∵P(ξ≥5)=P(ξ≤-3),
∴//
//.
【总结升华】 在求随机变量ξ在某一范围内的概率时,可以首先把随机变量ξ的取值转化到区间/、/以及/,然后利用在/上的概率约为0.683,在/上的概率约为0.954,在/上的概率约为0.997.
举一反三:
【变式1】/,求/。
【答案】/时,/=2,/=5,/,/,
∴/
【变式2】(2018春 潮州期末)设随机变量ξ~N(0,1),若P(ξ≥1)=p,则p(-<ξ<0)=( )
A.1-p B.p C. D.
【答案】 D
∵随机变量ξ服从标准正态分布N(0,1),
∴正态曲线关于x=0对称,
∵P(ξ≥1)=p,
∴,
∴,
故选D。
【变式3】设/。
(1)求P(-1</≤1);(2)求P(0</≤2)。
【答案】
(1)/时,/,/,
∴/。
(2)/,/,正态曲线/关于直线x=0对称,
∴/。
类型四、正态分布的应用
例5. 某年级的一次数学测验成绩近似服从正态分布N(70,102),如果规定低于60分为不及格,那么
(1)成绩不及格的人数占多少?
(2)成绩在80~90分内的学生占多少?
【思路点拨】 本题考查正态密度曲线对称性及正态变量在三个特殊区间的概率取值规律.因为正态密度曲线关于直线x=μ对称,故本题可利用对称性及特殊值求解.
【解析】(1)设学生的得分情况为随机变量X,
则X~N(70,102),其中/=70,/=10.
成绩在60~80分之间的学生人数的概率为
P(70-10<X<70+10)=0.683,
∴不及格的人数占 /×(1-0.683)=0.1585.
(2)P(70-20<X<70+20)=0.954,
∴成绩在80~90分内的学生占
/[P(50<X<90)-P(60<X<80)]=0.1355.
【总结升华】 本题利用了正态密度曲线的性质求概率,其中应注意对称性的运用及正态变量在三个特殊区间的概率取值规律.
举一反三:
【变式1】工厂制造的某机械零件尺寸X服从正态分布N/,问在一次正常的试验中,取1 000个零件时,不属于区间(3,5)这个尺寸范围的零件大约有多少个?
【答案】∵X~N/,∴μ=4,σ=/.
∴不属于区间(3,5)的概率为
P(X≤3)+P(X≥5)=1-P(3=1-P(4-1=1-P(μ-3σ=1-0.997 =0.003
∴1 000×0.003=3(个),
即不属于区间(3,5)这个尺寸范围的零件大约有3个.
【变式2】(2018 青岛二模)某班有50名同学,一次数学考试的成绩X服从正态分布N(100,102),已知P(100≤X≤110)=0.34,估计该班学生数学成绩在120分以上的有________人。
【答案】 8
∵考试的成绩ξ服从正态分布N(110,102)。
∴考试成绩ξ关于ξ=110对称,
∵P(100≤ξ≤110)=0.34,
∴,
∴该班数学成绩在120分以上的人数为0.16×50=8。
故答案为:8。
【变式3】在某次数学考试中,考生的成绩X服从一个正态分布,即X~N(90,100)。
(1)试求考试成绩X位于区间(70,110)内的概率是多少?
(2)若这次考试共有2000名考生,试估计考试成绩在(80,100)之间的考生大约有多少人?
【答案】∵X~N(90,100),∴/,/。
(1)/-2/=90-2×10=70,/+2/=90+2×10=110,
又∵正态分布/在区间/内取值的概率是0.954,
∴考试成绩X位于区间(70,110)内的概率约为0.954。
(2)∴/-/=90-10=80,/+/=90+10=100。
又∵正态分布/在区间/内取值的概率为0.683,
∴考试成绩X位于区间(80,100)内的概率约是0.683,
∴这2000名考生中,成绩在(80,100)内的人数大约为2000×0.683≈1366(人)。
【巩固练习】
一、选择题
1.正态分布密度函数为/,x∈R,则其标准差为( ).
A.1 B.2 C.4 D.8
2.正态分布有两个参数/与/,( )相应的正态曲线的形状越扁平。
A./越大 B./越小 C./越大 D./越小
3.设随机变量/且P(ξ≤C)=P(ξ>C),则C为( )
A.0 B./ C.-/ D./
4.设两个正态分布N(μ1,/)(σ1>0)和N(μ2,/)(σ2>0)的密度函数图象如图所示,则有
( )
/
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
5.(2018 蚌埠二模)已知随机变量ξ服从正态分布N(1,σ2),P(ξ≤-1)=0.012,则P(1<ξ<3)=( )
A.0.488 B.0.494 C.0.502 D.0.512
6. 已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.682 6,则P(X>4)=( )
A.0.158 8 B.0.158 7
C.0.158 6 D.0.158 5
7.在正态分布N(0,(/)2)中,数值落在(-∞,-1)∪(1,+∞)内的概率为( )
A.0.097 B.0.046
C.0.03 D.0.002 6
8.某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是 ( )
A 32 B 16 C 8 D 20
二、填空题
9. (2018 石家庄校级模拟)已知随机变量X服从正态分布N(μ,σ2),且P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-σ<X≤μ+σ)=0.6826,若μ=4,σ=1,则P(5<X<6)=________.
10.已知正态分布总体落在区间(0.2,+∞)的概率为0.5,那么相应的正态曲线φμ,σ(x)在x=________时达到最高点.
11.在某项测量中,测量结果ξ服从正态分布N(1,σ2)(σ>0).若ξ在(0,1)内取值的概率为0.4,则ξ在(0,2)内取值的概率为________.
12.商场经营的某种包装大米的质量(单位:kg)服从正态分布X~N(10,0.12),任选一袋这种大米,质量在9.8~10.2 kg的概率是________.
三、解答题
13.设X~N(10,1).
(1)证明:P(1(2)设P(X≤2)=a,求P(1014.(2018 新课标Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
/
(Ⅰ)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中数据用该组区间的中点值作代表);
(Ⅱ)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
(i)利用该正态分布,求P(187.8<Z<212.2);
(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.
附:≈12.2.
若Z-N(μ,σ2)则P(μ-σ<Z<μ+σ)=0.6826,P(μ-2σ<Z<μ+2σ)=0.9544.
15.(2018 福安市校级模拟)某市在2018年2月份的高三期末考试中对数学成绩数据统计显示,全市10000名学生的成绩服从正态分布N(120,25),现某校随机抽取了50名学生的数学成绩分析,结果这50名同学的成绩全部介于80分到140分之间。现将结果按如下方式分为6组,第一组[85,95),第二组[95,105),…,第六组[135,145],得到如图所示的频率分布直方图。
/
(1)试估计该校数学的平均成绩;
(2)这50名学生中成绩在125分(含125分)以上的同学中任意抽取3人,该3人在全市前13名的人数记为X,求X的分布列和期望。
附:若X~N(μ,σ2),则P(μ-3σ>X>μ+3σ)=0.9974。
【答案与解析】
1.【答案】B
【解析】由正态分布密度函数公式可得。
2. 【答案】C。
【解析】由正态密度曲线图象的特征知。
3.【答案】D
【解析】正态分布中,落在数学期望/两边的概率相等。由此可知答案为D。
4. 【答案】A
【解析】由图可知,μ2>μ1,且σ2>σ1.
5. 【答案】A
【解析】随机变量ξ服从正态分布N(1,σ2),
∴曲线关于x=1对称,
∵P(ξ≤-1)=0.012,
∴P(ξ>3)=0.012,
∴P(-1≤ξ≤3)=1-2P(ξ>3)=1-0.024-0.976,
∴
故选A。
6. 【答案】B
【解析】由正态曲线性质知,其图象关于x=3对称,
∴P(X>4)=0.5-/P(2≤X≤4)=0.5-/×0.682 6=0.158 7.故选B.
7. 【答案】D
【解析】∵μ=0,σ=/,∴P(x<-1或x>1)=1-P(-1≤x≤1)
=1-P(μ-3σ≤x≤μ+3σ)=1-0.997 4=0.002 6.
8. 【答案】B
【解析】:数学成绩是X~N(80,102),
/。
9. 【答案】0.1359
【解析】∵随机变量X服从正态分布N(μ,σ2),P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-σ<X≤μ+σ)=0.6826,μ=4,σ=1,
∴P(2<X≤6)=0.9544,P(3<X≤5)=0.6826,
∴P(2<X≤6-P(3<X≤5)=0.9544-0.6826=0.2718,
∴
故答案为:0.1359
10. 【答案】0.2
【解析】∵P(X>0.2)=0.5,∴P(X≤0.2)=0.5,
即x=0.2是正态曲线的对称轴.
∴当x=0.2时,φμ,σ(x)达到最高点.
11. 【答案】0.8
【解析】∵ξ服从正态分布(1,σ2),
∴ξ在(0,1)与(1,2)内取值的概率相同均为0.4.
∴ξ在(0,2)内取值概率为0.4+0.4=0.8.
12. 【答案】0.954
【解析】P(813. 【解析】
(1)因为X~N(10,1),所以正态曲线,φμ,σ(x)关于直线x=10对称,而区间[1,2]和[18,19]关于直线x=10对称,所以/=/,
即P(1/
(2)P(1014. 【解析】
【解析】(Ⅰ)抽取产品的质量指标值的样本平均数和样本方差s2分别为:
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(Ⅱ)(i)由(Ⅰ)知Z~N(200,150),从而P(187.8<Z<212.2)=P(200-12.2<Z<200+12.2)=0.6826;
(ii)由(i)知一件产品的质量指标值位于区间(187.8,212.2)的概率为0.6826,
依题意知X~B(100,0.6826),所以EX=100×0.6826=68.26.
15.【解析】
(1)由频率分布直方图可知[120,130)的频率为1-(0.01×10+0.024×10+0.03×10+0.016×10+0.008×10)=0.12
所以估计该校全体学生的数学平均成绩约为90×0.1+100×0.24+110×0.3+120×0.16+130×0.12+140×0.08=112
(2)由于根据正态分布:P(120-3×5>X<120+3×5)=0.9974
故,即0.0013×10000=13
所以前13名的成绩全部都在135以上
根据频率分布直方图可知这50人中成绩在135以上(包括135分)的有50×0.08=4人,而在[125,145)的学生有50×(0.12+0.08)=10
所以X的取值为0,1,2,3。
所以,,,;
所以X的分布列为
/
数学期望值为