§7.5 正态分布
学习目标 1.利用实际问题的频率分布直方图,了解正态分布曲线的特点及曲线所表示的意义.2.了解变量落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]内的概率大小.3.会用正态分布去解决实际问题.
知识点一 正态曲线与正态分布
1.我们称f(x)=,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称其图象为正态分布密度曲线,简称正态曲线.
2.若随机变量X的概率密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).特别地,当μ=0,σ=1时,称随机变量X服从标准正态分布.
3.若X~N(μ,σ2),如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
思考1 正态曲线f(x)=,x∈R中的参数μ,σ有何意义?
答案 μ可取任意实数,表示平均水平的特征数,E(X)=μ;σ>0表示标准差,D(X)=σ2.一个正态密度函数由μ,σ唯一确定,π和e为常数,x为自变量,x∈R.
思考2 若随机变量X~N(μ,σ2),则X是离散型随机变量吗?
答案 若X~N(μ,σ2),则X不是离散型随机变量,由正态分布的定义:P(a
知识点二 正态曲线的特点
1.对 x∈R,f(x)>0,它的图象在x轴的上方.
2.曲线与x轴之间的面积为1.
3.曲线是单峰的,它关于直线x=μ对称.
4.曲线在x=μ处达到峰值.
5.当|x|无限增大时,曲线无限接近x轴.
6.当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图①.
7.当μ一定时,曲线的形状由σ确定,σ较小时曲线“瘦高”,表示随机变量X的分布比较集中;σ较大时,曲线“矮胖”,表示随机变量X的分布比较分散,如图②.
知识点三 正态总体在三个特殊区间内取值的概率值及3σ原则
P(μ-σ≤X≤μ+σ)≈0.682 7;
P(μ-2σ≤X≤μ+2σ)≈0.954 5;
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
尽管正态变量的取值范围是(-∞,+∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ,μ+3σ]内,而在此区间以外取值的概率大约只有0.002 7,通常认为这种情况在一次试验中几乎不可能发生.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
1.正态曲线中参数μ,σ的意义分别是样本的均值与方差.( × )
2.正态曲线是单峰的,其与x轴围成的面积是随参数μ,σ的变化而变化的.( × )
3.正态曲线可以关于y轴对称.( √ )
4.若X~N(μ,σ2),则P(X<μ)=.( √ )
一、正态曲线
例1 (1)已知随机变量服从正态分布,其正态曲线如图所示,则总体的均值μ= ,方差σ2= .
(2)(多选)一次教学质量检测中,甲、乙、丙三科考试成绩的正态分布密度曲线如图所示,下列说法中不正确的是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都比甲小,比丙大
D.甲、乙、丙总体的平均数不相同
答案 (1)20 2 (2)BCD
解析 (1)从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是,所以μ=20,=,解得σ=,因此总体的均值μ=20,方差σ2=()2=2.
(2)由题中图象可知三科总体的平均数(均值)相等,由正态分布密度曲线的性质,可知σ越大,正态曲线越“矮胖”,σ越小,正态曲线越“瘦高”,故三科总体的标准差从小到大依次为甲、乙、丙.
反思感悟 利用正态曲线的特点求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此特点结合图象求出μ.
(2)正态曲线在x=μ处达到峰值,由此特点结合图象可求出σ.
跟踪训练1 (多选)下面给出的关于正态曲线的4个叙述中,正确的有( )
A.曲线在x轴上方,且与x轴不相交
B.当x>μ时,曲线下降,当x<μ时,曲线上升
C.当μ一定时,σ越小,总体分布越分散,σ越大,总体分布越集中
D.曲线关于直线x=μ对称,且当x=μ时,位于最高点
答案 ABD
解析 只有C错误,因为当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,总体分布越集中;σ越大,曲线越“矮胖”,总体分布越分散.
二、利用正态分布求概率
例2 设ξ~N(1,22),试求:
(1)P(-1≤ξ≤3);
(2)P(3≤ξ≤5).
解 ∵ξ~N(1,22),∴μ=1,σ=2,
(1)P(-1≤ξ≤3)=P(1-2≤ξ≤1+2)
=P(μ-σ≤ξ≤μ+σ)≈0.682 7;
(2)∵P(3≤ξ≤5)=P(-3≤ξ≤-1),
∴P(3≤ξ≤5)=[P(-3≤ξ≤5)-P(-1≤ξ≤3)]
=[P(1-4≤ξ≤1+4)-P(1-2≤ξ≤1+2)]
=[P(μ-2σ≤ξ≤μ+2σ)-P(μ-σ≤ξ≤μ+σ)]
≈(0.954 5-0.682 7)=0.135 9.
延伸探究
若本例条件不变,求P(ξ>5).
解 P(ξ>5)=P(ξ<-3)=[1-P(-3≤ξ≤5)]
=[1-P(1-4≤ξ≤1+4)]
=[1-P(μ-2σ≤ξ≤μ+2σ)]
≈(1-0.954 5)=0.022 75.
反思感悟 利用正态分布的对称性求概率
由于正态曲线是关于直线x=μ对称的,且概率的和为1,故关于直线x=μ对称的区间上概率相等.
跟踪训练2 已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于( )
A.0.6 B.0.4 C.0.3 D.0.2
答案 C
解析 ∵随机变量ξ服从正态分布N(2,σ2),
∴μ=2,对称轴是ξ=2.
∵P(ξ<4)=0.8,∴P(ξ≥4)=P(ξ≤0)=0.2,
∴P(0<ξ<4)=0.6,
∴P(0<ξ<2)=0.3.故选C.
三、正态分布的应用
例3 有一种精密零件,其尺寸X(单位:mm)服从正态分布N(20,4).若这批零件共有5 000个,试求:
(1)这批零件中尺寸在18~22 mm间的零件所占的百分比;
(2)若规定尺寸在24~26 mm间的零件不合格,则这批零件中不合格的零件大约有多少个?
解 (1)∵X~N(20,4),∴μ=20,σ=2,∴μ-σ=18,
μ+σ=22,
于是尺寸在18~22 mm间的零件所占的百分比大约是68.27%.
(2)∵μ-3σ=14,μ+3σ=26,μ-2σ=16,μ+2σ=24,
∴尺寸在24~26 mm间的零件所占的百分比大约是=2.14%.
∴尺寸在24~26 mm间的零件大约有5 000×2.14%=107(个).
反思感悟 求正态变量X在某区间内取值的概率的基本方法
(1)根据题目中给出的条件确定μ与σ的值.
(2)将待求问题向[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]这三个区间进行转化.
(3)利用X在上述区间的概率、正态曲线的对称性和曲线与x轴之间的面积为1求出最后结果.
跟踪训练3 在某次大型考试中,某班同学的成绩服从正态分布N(80,52),现在已知该班同学中成绩在80~85分的有17人,该班成绩在90分以上的同学有多少人?
解 ∵成绩服从正态分布N(80,52),
∴μ=80,σ=5,则μ-σ=75,μ+σ=85.
∴成绩在[75,85]内的同学占全班同学的68.27%,成绩在[80,85]内的同学占全班同学的34.135%.
设该班有x名同学,则x×34.135%=17,解得x≈50.
∵μ-2σ=80-10=70,μ+2σ=80+10=90,
∴成绩在[70,90]内的同学占全班同学的95.45%,成绩在90分以上的同学占全班同学的2.275%.
即有50×2.275%≈1(人),即成绩在90分以上的仅有1人.
根据对称性求正态曲线在某个区间内取值的概率
典例 已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(-2≤ξ≤2)等于( )
A.0.477 B.0.954 C.0.628 D.0.977
答案 B
解析 画出正态曲线如图所示,结合图象知,P(-2≤ξ≤2)=1-P(ξ>2)-P(ξ<-2)=1-2×0.023=0.954.
[素养提升] 借助图象较直观的分析出P(ξ>2)与P(-2≤ξ≤2)概率的关系,提升了学生的直观想象素养.
1.设有一正态总体,它的正态曲线是函数f(x)的图象,且f(x)=,则这个正态总体的均值与标准差分别是( )
A.10与8 B.10与2
C.8与10 D.2与10
答案 B
解析 由正态密度函数的定义可知,总体的均值μ=10,方差σ2=4,即σ=2.
2.正态分布N(0,1)在区间(-2,-1)和(1,2)上取值的概率为P1,P2,则二者大小关系为( )
A.P1=P2 B.P1P2 D.不确定
答案 A
解析 根据正态曲线的特点,图象关于x=0对称,可得在区间(-2,-1)和(1,2)上取值的概率P1,P2相等.
3.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈68.27%,P(μ-2σ≤ξ≤μ+2σ)≈95.45%)
A.4.56% B.13.59%
C.27.18% D.31.74%
答案 B
解析 P(3<ξ<6)=[P(-6<ξ<6)-P(-3<ξ<3)]≈(95.45%-68.27%)=13.59%.故选B.
4.设随机变量ξ服从正态分布N(2,9),若P(ξ>c+1)=P(ξ答案 2
解析 ∵ξ~N(2,9),
又P(ξ>c+1)=P(ξ∴=2,∴c=2.
5.在某项测量中,测量结果X服从正态分布N(1,σ2)(σ>0).若X在(0,1)内取值的概率为0.4,则X在(0,2)内取值的概率为 .
答案 0.8
解析 如图,易得P(0故P(01.知识清单:
(1)正态曲线及其特点.
(2)正态分布.
(3)正态分布的应用,3σ原则.
2.方法归纳:转化化归、数形结合.
3.常见误区:概率区间转化不等价.
1.关于正态分布N(μ,σ2),下列说法正确的是( )
A.随机变量落在区间长度为3σ的区间之外是一个小概率事件
B.随机变量落在区间长度为6σ的区间之外是一个小概率事件
C.随机变量落在[-3σ,3σ]之外是一个小概率事件
D.随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件
答案 D
解析 ∵P(μ-3σ≤X≤μ+3σ)≈0.997 3,∴P(X>μ+3σ或X<μ-3σ)=1-P(μ-3σ≤X≤μ+3σ)≈1-0.997 3=0.002 7,∴随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件.
2.(多选)已知三个正态密度函数φi(x)=(x∈R,i=1,2,3)的图象如图所示,则下列结论正确的是( )
A.σ1=σ2 B.μ1>μ2
C.μ1=μ2 D.σ2<σ3
答案 AD
解析 由图可知μ2=μ3>μ1,σ1=σ2<σ3,故AD正确.
3.已知随机变量ξ服从正态分布N(2,σ2)(σ>0),P(ξ<4)=0.84,则P(ξ≤0)等于( )
A.0.16 B.0.32
C.0.68 D.0.84
答案 A
解析 ∵随机变量ξ服从正态分布N(2,σ2),∴μ=2,
∵P(ξ<4)=0.84,
∴P(ξ≥4)=1-0.84=0.16,
∴P(ξ≤0)=P(ξ≥4)=0.16.
4.若随机变量X服从正态分布,其正态曲线上的最高点的坐标是,则该随机变量的方差等于( )
A.10 B.100 C. D.
答案 C
解析 由正态分布密度曲线上的最高点为知=,∴D(X)=σ2=.
5.如图所示是当σ取三个不同值σ1,σ2,σ3的三种正态曲线N(0,σ2)的图象,那么σ1,σ2,σ3的大小关系是( )
A.σ1>1>σ2>σ3>0 B.0<σ1<σ2<1<σ3
C.σ1>σ2>1>σ3>0 D.0<σ1<σ2=1<σ3
答案 D
解析 当μ=0,σ=1时,正态曲线f(x)=在x=0处取最大值,故σ2=1.由正态曲线的性质,当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,反之越“矮胖”.故选D.
6.已知随机变量X服从正态分布N(a,4),且P(X≤1)=0.5,则实数a的值为 .
答案 1
解析 ∵X服从正态分布N(a,4),
∴正态曲线关于直线x=a对称,
又P(X≤1)=0.5,故a=1.
7.已知随机变量X~N(2,σ2),如图所示,若P(X答案 0.36
解析 ∵随机变量X~N(2,σ2),∴μ=2,由正态分布图象的对称性可得曲线关于直线x=2对称,∴P(X>4-a)=P(X4-a)=1-2P(X8.已知X~N(4,σ2),且P(2答案 2 0.84
解析 ∵X~N(4,σ2),∴μ=4.
∵P(2∴∴σ=2.
∴P(|X-2|<4)=P(-2=P(-2=[P(-2=P(-29.已知随机变量X~N(3,σ2),且P(2≤X≤4)=0.68,求P(X>4)的值.
解 ∵随机变量X~N(3,σ2),
∴正态曲线关于直线x=3对称,
又P(2≤X≤4)=0.68,可得P(X>4)=×[1-P(2≤X≤4)]=×(1-0.68)=0.16.
10.一投资者在两个投资方案中选择一个,这两个投资方案的利润X(万元)分别服从正态分布N(8,32)和N(7,12),投资者要求“利润超过5万元”的概率尽量大,那么他应该选择哪一个方案?
解 对于第一个方案有X~N(8,32),其中μ=8,σ=3,P(X>5)=+P(5对于第二个方案有X~N(7,12),其中μ=7,σ=1,
P(X>5)=≈0.977 25,
显然第二个方案“利润超过5万元”的概率比较大,故他应该选择第二个方案.
11.在某市2020年3月份的高三线上质量检测考试中,学生的数学成绩服从正态分布N(98,100).已知参加本次考试的全市学生有9 455人,如果某学生在这次考试中的数学成绩是108分,那么他的数学成绩大约排在全市第( )
A.1 500名 B.1 700名 C.4 500名 D.8 000名
答案 A
解析 因为学生的数学成绩X服从正态分布N(98,100),所以P(X>108)=[1-P(88≤X≤108)]=[1-P(μ-σ≤X≤μ+σ)]≈×(1-0.682 7)=0.158 65.所以0.158 65×9 455≈1 500.
12.一批电阻的电阻值X(单位:Ω)服从正态分布N(1 000,52),现从甲、乙两箱出厂的成品中各随机抽取一个电阻,测得电阻值分别为1 011 Ω和982 Ω,可以认为( )
A.甲、乙两箱电阻均可出厂
B.甲、乙两箱电阻均不可出厂
C.甲箱电阻可出厂,乙箱电阻不可出厂
D.甲箱电阻不可出厂,乙箱电阻可出厂
答案 C
解析 ∵X~N(1 000,52),∴μ=1 000,σ=5,
∴μ-3σ=1 000-3×5=985,
μ+3σ=1 000+3×5=1 015.
∵1 011∈(985,1 015),982 (985,1 015),
∴甲箱电阻可出厂,乙箱电阻不可出厂.
13.某工厂生产一种螺栓,在正常情况下,螺栓的直径X(单位:mm)服从正态分布X~N(100,1).现加工10个螺栓的尺寸(单位:mm)如下:101.7,100.3,99.6,102.4,98.2,103.2,101.1,98.8,100.4,100.0.X~N(μ,σ2),有P(μ-2σ≤X≤μ+2σ)≈0.954,P(μ-3σ≤X≤μ+3σ)≈0.997.根据行业标准,概率低于0.003视为小概率事件,工人随机将其中的8个交与质检员检验,则质检员认为设备需检修的概率为( )
A. B. C. D.
答案 B
解析 10个螺栓的尺寸,只有103.2不在区间[97,103]内,∴工人随机将其中的8个交与质检员检验,质检员认为设备需检修的概率为=,故选B.
14.已知随机变量X~N(2,22),且aX+b(a>0)服从标准正态分布N(0,1),则a= ,b= .
答案 -1
解析 ∵随机变量X~N(2,22),
∴E(X)=2,D(X)=22=4.
∴E(aX+b)=aE(X)+b=2a+b=0,
D(aX+b)=a2D(X)=4a2=1,
又a>0,∴a=,b=-1.
15.(多选)设X~N(μ1,σ),Y~N(μ2,σ),这两个正态分布密度曲线如图所示.下列结论中错误的是( )
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.对任意正数t,P(X≤t)>P(Y≤t)
D.对任意正数t,P(X>t)>P(Y>t)
答案 ABD
解析 由题图可知μ1<0<μ2,σ1<σ2,
∴P(Y≥μ2)P(X≤σ2)>P(X≤σ1),故B错;
当t为任意正数时,由题图可知P(X≤t)>P(Y≤t),
而P(X≤t)=1-P(X>t),P(Y≤t)=1-P(Y>t),
∴P(X>t)
t),故C正确,D错.
16.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入力争早日脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:
(1)根据频率分布直方图,估计50位农民的年平均收入(单位:千元)(同一组数据用该组数据区间的中点值表示);
(2)由频率分布直方图,可以认为该贫困地区农民收入X服从正态分布N(μ,σ2),其中μ近似为年平均收入,σ2近似为样本方差s2,经计算得s2=6.92,利用该正态分布,求:
①在扶贫攻坚工作中,若使该地区约有84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?
②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1 000位农民.若每位农民的年收入互相独立,记这1 000位农民中的年收入高于12.14千元的人数为ξ,求E(ξ).
附参考数据:≈2.63,
若随机变量X服从正态分布N(μ,σ2),则
P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解 =12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.40(千元),
故估计50位农民的年平均收入为17.40千元.
(2)由题意知X~N(17.40,6.92),
①P(X>μ-σ)=0.5+≈0.841 4,
所以μ-σ=17.40-2.63=14.77时,满足题意,
即最低年收入大约为14.77千元.
②由P(X>12.14)=P(X>μ-2σ)=0.5+≈0.977 3,
每个农民的年收入高于12.14千元的事件的概率为0.977 3,
则ξ~B(1 000,p),其中p=0.977 3,
所以E(ξ)=1 000×0.977 3=977.3.