2.4 正态分布
知识
1.正态曲线
我们把函数______________,(其中是样本均值,是样本标准差)的图象称为正态分布密度曲线,简称正态曲线.正态曲线呈钟形,即中间高,两边低.
2.正态分布
随机变量落在区间的概率为______________,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值.
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
3.正态曲线的性质
(1)曲线位于轴上方,与轴不相交;
(2)曲线是单峰的,它关于直线______________对称;
(3)曲线在处达到峰值(最大值);
(4)曲线与轴之间的面积为1;
(5)当一定时,曲线的位置由确定,曲线随着的变化而沿轴平移;
(6)当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中,越大,曲线越“矮胖”,表示总体的分布越分散.
4.正态分布的原则
若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大.
特别地,有;;.
由,知正态总体几乎总取值于区间______________之内.而在此区间以外取值的概率只有,通常认为这种情况在一次试验中几乎不可能发生.在实际应用中,通常认为服从于正态分布的随机变量只取之间的值,并简称之为原则.
知识参考答案:
1. 2.
3. 4.
重点
重点
正态曲线的性质,与正态分布有关的概率问题
难点
原则的理解及运用
易错
求解概率时对正态曲线的性质理解不透彻从而导致错误
重点 利用正态曲线的对称性求概率
对于正态分布,由直线是正态曲线的对称轴可知:
(1)对任意的,有;
(2);
(3).
已知随机变量服从正态分布,,则
A. B.
C. D.
【答案】A
【解析】由,可知其正态曲线如下图所示,对称轴为直线,
则.故选A.
【名师点睛】利用正态曲线的对称性求概率是正态分布的基本题型,也是高考考查的重点.解题的关键是利用对称轴确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时,可借助图形判断.
若随机变量服从正态分布,已知,则
A. B.
C. D.
【答案】C
【名师点睛】针对的正态分布,求某区间上的取值概率时常利用如下两个公式:
①;
②.
难点 由特殊区间求概率
解决此类问题一定要把握服从的随机变量在三个特殊区间的取值概率,将所求概率向,;转化,然后利用特定值求出相应概率.同时,要充分利用正态曲线的对称性和曲线与轴之间的面积为1这些特殊性质.
为了了解某地区高三男生的身体发育状况,抽查了该地区1000名年龄在17岁至19岁的高三男生的体重情况,抽查结果表明他们的体重(单位:kg)服从正态分布,且正态分布密度曲线如下图所示.若体重大于58 kg小于等于62kg属于正常情况,则这1000名男生中属于正常情况的人数约为
A. B.
C. D.
【答案】D
【解析】由题意,可知,,故,
从而属于正常情况的人数是.故选D.
难点 利用原则做决策
某设备在正常运行时,产品的质量服从正态分布,其参数为g,,为了检验设备运行是否正常,质量检查员需要随机地抽取产品,测量其质量.当检验员随机地抽取一个产品,测得其质量为g时,他立即要求停止生产,检查设备.他的决定是否有道理呢?
【答案】见解析.
【解析】如果设备正常运行,产品质量服从正态分布,根据原则可知,
产品质量在和之间的概率为,
而质量超出这个范围的概率只有,这是一个几乎不可能出现的事件.
但是检验员随机抽取的产品为g,这说明设备的运行极可能不正常,
因此检验员的决定是有道理的.
【名师点睛】若随机变量服从正态分布,由此做假设检验时,按如下步骤进行:
①确定一次试验中的取值是否落入范围;
②作出判断,如果,则接受统计假设,如果,则拒绝统计假设.
基础训练
1.正态分布密度函数为φμ,σ(x)=,x∈(-∞,+∞),则总体的平均数和标准差分别是
A.0和8 B.0和4
C.0和2 D.0和
2.某次市教学质量检测,甲、乙、丙三科考试成绩的分布可视为正态分布,如图所示,则下列说法中正确的一个是
A.乙科总体的标准差及平均数不相同 B.甲、乙、丙三科的总体的平均数不相同
C.丙科总体的平均数最小 D.甲科总体的标准差最小
3.若随机变量ξ的密度函数为,ξ在(-2,-1)和(1,2)内取值的概率分别为p1、p2,则p1、p2的关系为
A.p1>p2 B.p1<p2
C.p1=p2 D.不确定
4.设随机变量ξ服从正态分布N(0,1),P(ξ>1)=p,则P(-1<ξ<0)=
A.p B.1-p
C.1-2p D.-p
5.随机变量X~N(μ,σ2),则Y=aX+b服从
A.N(aμ,σ2) B.N(0,1)
C.N(,) D.N(aμ+b,a2σ2)
6.已知随机变量服从正态分布,若,则
A. B.
C. D.
7.如果随机变量ξ服从N(μ,σ),且E(ξ)=3,D(ξ)=1,那么μ=______________,σ=______________.
8.已知X~N(1.4,0.052),则X落在区间(1.35,1.45)中的概率为________________.
9.某砖瓦厂生产的砖的“抗断强度”X服从正态分布N(30,0.82),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的“抗断强度”为27.5kg/cm2,你认为该厂这一天生产的这批砖是否合格?为什么?
10.已知某地农民工年均收入ξ服从正态分布,其密度函数图象如图.
(1)写出此地农民工年均收入的概率密度曲线函数式;
(2)求此地农民工年均收入在8000~8500之间的人数百分比.
能力提升
11.随机变量ξ~N(2,100),若ξ落在区间(-∞,k)和(k,+∞)内的概率是相等的,则
A.2 B.10
C. D.可以是任意实数
12.以φ(x)表示标准正态总体在区间(-∞,x)内取值的概率,若随机变量ξ服从正态分布(μ,σ2),则概率P(|ξ-μ|<σ)=
A.φ(μ+σ)-φ(μ-σ) B.φ(1)-φ(-1)
C. D.2φ(μ+σ)
13.若随机变量,则有如下结论:,,.已知某年级有600名同学,一次数学考试的成绩服从正态分布,平均分为110,方差为100,理论上说在120分到130分之间的学生人数约为
A.68 B.70
C.82 D.90
14.若随机变量X的概率密度函数是,则=________________.
15.某人乘车从A地到B地,所需时间(分钟)服从正态分布N(30,100),求此人在40分钟至50分钟到达目的地的概率.
16.已知随机变量服从正态分布,其正态曲线在上是增函数,在上为减函数,且.
(1)求参数,的值;
(2)求的值.
真题练习
17.(2019湖北模拟)设,,这两个正态分布密度曲线如图所示.下列结论中正确的是
A. B.
C.对任意正数, D.对任意正数,
18.(2019山东模拟)已知某批零件的长度误差(单位:毫米)服从正态分布,从中随机取一件,其长度误差落在区间内的概率为
(附:若随机变量服从正态分布,则,)
A. B.
C. D.
19.(2018新课标全国Ⅰ理)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:
(1)求这500件产品质量指标值的样本平均值和样本方差(同一组的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标服从正态分布,其中近似为样本平均数,近似为样本方差.
①利用该正态分布,求;
②某用户从该企业购买了100件这种产品,记表示这100件产品中质量指标值位于区间的产品件数.利用①的结果,求.
附:.若,则,.
20.(2019四川模拟)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求及的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,其中为抽取的第个零件的尺寸,.
用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计和(精确到0.01).
附:若随机变量服从正态分布,则,
,.
参考答案
1.【答案】C
【解析】根据正态分布密度曲线知μ=0,σ=2.故选C.
2.【答案】D
【解析】由图象知甲、乙、丙三科的平均分一样,但标准差不同,σ甲<σ乙<σ丙.故选D.
3.【答案】C
【解析】由题意知,μ=0,σ=1,所以曲线关于x=0对称,所以p1=p2.故选C.
4.【答案】D
【解析】由于随机变量服从正态分布N(0,1),由标准正态分布图象可得
P(-1<ξ<1)=1-2P(ξ>1)=1-2p.故P(-1<ξ<0)=P(-1<ξ<1)=-p.故选D.
5.【答案】D
【解析】由X~N(μ,σ2)知E(X)=μ,D(X)=σ2,
∴E(aX+b)=aE(X)+b=aμ+b,D(aX+b)=a2D(X)=(aσ)2,从而Y~N(aμ+b,a2σ2).故选D.
7.【答案】3 1
【解析】∵ξ~N(μ,σ),∴E(ξ)=μ=3,D(ξ)=σ2=1,∴σ=1.
8.【答案】0.6826
【解析】因为μ=1.4,σ=0.05,
所以X落在区间(1.35,1.45)中的概率为P(1.4-0.059.【答案】见解析.
【解析】由于在一次试验中X落在区间(μ-3σ,μ+3σ)内的概率约99.7%,
故X几乎必然落在上述区间内.
把μ=30,σ=0.8代入,得μ-3σ=30-3×0.8=27.6,μ+3σ=30+3×0.8=32.4,
即(μ-3σ,μ+3σ)=(27.6,32.4),
而27.5?(27.6,32.4),所以认为这批砖不合格.
10.【答案】(1);(2)34.13%.
11.【答案】A
【解析】由于ξ的取值落在(-∞,k)和(k,+∞)内的概率是相等的,所以正态曲线在直线x=k的左侧和右侧与x轴围成的面积应该相等,于是正态曲线关于直线x=k对称,即μ=k,而μ=2,∴k=2.故选A.
12.【答案】B
【解析】设,则P(|ξ-μ|<σ)=P(|η|<1)=φ(1)-φ(-1).故选B.
13.【答案】C
【解析】由题意,这600名同学的数学成绩服从正态分布,
,
故120分到130分之间的人数约为,故选C.
14.【答案】-5
【解析】由概率密度函数解析式可知其图象的对称轴是直线x=-2,可得μ=-2,
即E(X)=-2,因此E(2X-1)=2E(X)-1=-5.
15.【答案】0.1359.
【解析】∵,
∴.
∴.
又,
∴.
∴.
∴
.
∵,,
∴.
因此,此人在40分钟至50分钟到达目的地的概率是0.1359.
16.【答案】(1),;(2).
【解析】(1)因为正态曲线在上是增函数,在上为减函数,
所以正态曲线关于直线对称,所以.
又,结合可知.
(2)因为,且,
所以,
所以.
又,
所以.
17.【答案】C
【解析】由正态分布密度曲线的性质可知,,的密度曲线分别关于,对称,因此结合所给图象可得且的密度曲线较的密度曲线“瘦高”,所以,所以对任意正数,.故选C.
18.【答案】B
【解析】用表示零件的长度,根据正态曲线的性质可得.故选B.
19.【答案】(1);(2)①;②.
【解析】(1)抽取产品的质量指标值的样本平均值和样本方差分别为
,
.
(2)①由(1)知,服从正态分布,
从而.
②由①可知,一件产品的质量指标值位于区间的概率为,
依题意知,
所以.
20.【答案】(1),;(2)(ⅰ)见解析,(ⅱ)的估计值为10.02,的估计值为.
【思路分析】(1)根据题设条件知一个零件的尺寸在之内的概率为0.9974,则零件的尺寸在之外的概率为0.0026,而,进而可以求出的数学期望;(2)(i)判断监控生产过程的方法的合理性,重点是考虑一天内抽取的16个零件中,出现尺寸在之外的零件的概率是大还是小,若小即合理;(ii)根据题设条件算出的估计值和的估计值,剔除之外的数据9.22,算出剩下数据的平均数,即为的估计值,剔除之外的数据9.22,剩下数据的样本方差,即为的估计值.
【解析】(1)抽取的一个零件的尺寸在之内的概率为0.9974,
从而零件的尺寸在之外的概率为0.0026,故.
因此.
的数学期望为.
(2)(i)如果生产状态正常,一个零件尺寸在之外的概率只有0.0026,
一天内抽取的16个零件中,出现尺寸在之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
【名师点睛】数学期望是离散型随机变量中重要的数学概念,反映随机变量取值的平均水平.求解离散型随机变量的分布列、数学期望时,首先要分清事件的构成与性质,确定离散型随机变量的所有取值,然后根据概率类型选择公式,计算每个变量取每个值的概率,列出对应的分布列,最后求出数学期望.正态分布是一种重要的分布,之前考过一次,尤其是正态分布的原则.