7.5 正态分布
学习目标
1.通过误差模型,了解服从正态分布的随机变量;
2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特点;
3.了解正态分布的均值、方差及其含义;
4.了解3σ原则,会求随机变量在特殊区间内的概率.
重点难点
重点:认识分布曲线的特点及曲线所表示的意义.了解3σ原则.
难点:.会求随机变量在特殊区间内的概率.
知识梳理
1.正态分布的定义
对任意的x∈R,f(x)>0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布(normal dis-tribution),记为X~N(u,σ2).特别地,当u=0, σ=1时,称随机变量X服从标准正态分布.
2.由X的密度函数及图像可以发现,正态曲线有以下特点:
(1)曲线在x轴的上方,与x轴不相交.
(2)曲线是单峰的,它关于直线x=μ对称.
(3)曲线在x=μ处达到峰值 (最高点)
(4)当|X|无限增大时,曲线无限接近x轴.
(5)X轴与正态曲线所夹面积恒等于1 .
3. 正态分布的期望和方差
参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的
离散程度。
(1) 当σ一定时,曲线随着μ的变化而沿x轴平移;
(2)当μ一定时,曲线的形状由σ确定 .
σ越大,曲线越“矮胖”,表示总体的分布越分散;
σ越小,曲线越“瘦高”,表示总体的分布越集中.
4.
44. 正态分布的3σ原则
特别地,尽管正态变量的取值范围是( ∞,+∞),但在一次试验中, 的取值几乎总落在区间[ 3 , +3 ]内,而在此区间外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中,通常认为服从于正态分布 ( , 2)的随机变量 只取[ 3 , +3 ]中的值,这在统计学中称为3 原则.
①P(μ- σ ≤ X≤ μ+σ)0.682 7;②P(μ-2σ ≤ X≤μ+2σ)0.954 5;③P(μ-3σ ≤ X≤μ+3σ)0.997 3.
1、把一个正态曲线a沿着横轴方向向右移动2个单位,得到新的一条曲线b。下列说法中不正确的是( )
A.曲线b仍然是正态曲线;
B.曲线a和曲线b的最高点的纵坐标相等;
C.以曲线b为概率密度曲线的总体的期望比以曲线a为概率密度曲线的总体的期望大2;
D.以曲线b为概率密度曲线的总体的方差比以曲线a为概率密度曲线的总体的方差大2。
学习过程
问题探究
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量,不是离散的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续性随机变量,下面我们看一个具体问题.
探究1:自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控的因素,任意抽取一袋食盐,它的质量与标准质量之间或多 或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中, 随机抽取了100袋食盐,获得误差X (单位:g)的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
(1).如何描述这100个样本误差数据的分布
(2).如何构建适当的概率模型刻画误差X的分布
可用频率分布直方图描述这组误差数据的分布,如右图.所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
观察图形,误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,规率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如右图所示。
根据频率与概率的关系,可用以用上图中的钟型曲线来描述袋装食盐质量误差的概率分布.任意抽取一袋盐,误差落在[-2,-1]内的概率,可以用图中黄色阴影部分的面积表示.
问题1:由函数知识可知,图中的钟形曲线是一个函数,那么,这个函数是否存在解析式呢?
正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.在现实生活中,很多随机变量都服从或近似服从正态分布
例如,某些物理量的测量误差某一地区同年龄人群的身高、体重、肺活量等一定条件下生长的小麦的株高、穗长、单位面积产量自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容)某地每年7月的平均气温、平均湿度、降水量等
探究2:观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
其中μ∈R,>0为参数.
探究3:观察正态曲线、相应的密度函数及概率的性质,你能发现正态曲线的哪些特点?
二、典例解析
例1:李明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4;假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38 min可用,李明应选择哪种交通工具 如果某天只有34 min可用,又应该选择哪种交通工具 请说明理由.
例2. 假设某地区高二学生的身高服从正态分布,且均值为170(单位:cm,下同),标准差为10.在该地区任意抽取一名高二学生,求这名学生的身高:
(1)不高于170的概率;
(2)在区间[160,180]内的概率;
(3)不高于180的概率.
服从正态分布的随机变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与x轴之间面积为1.
(2)注意概率值的求解转化:
①P(X
②P(X≤μ-a)=P(X≥μ+a);
(3)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)的值.
③若b<μ,则P(X跟踪训练1.某厂包装食盐的生产线,正常情况下生产出来的食盐质量服从正态分布(单位:).该生产线上的检测员某天随机抽取了两包食盐,称得
其质量均大于大于.
(1)求正常情况下,任意抽取一包食盐,质量大于的概率约为多少;
(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停产检修,检测员的判断是否合理?请说明理由.
达标检测
1.下列函数是正态分布密度函数的是( )
A.f(x)=,μ,σ(σ>0)都是实数 B.f(x)=
C.f(x)= D.f(x)=
2.在某项测量中,测量结果ξ服从正态分布N(0,σ2).若ξ在(-∞,-1)内取值的概率为0.1,则ξ在(0,1)内取值的概率为( )
A.0.8 B.0.4 C.0.2 D.0.1
3.某县农民月均收入服从N(500,202)的正态分布,则此县农民月均收入在500元到520元间人数的百分比约为 .
4.某种零件的尺寸ξ(单位:cm)服从正态分布N(3,12),则不属于区间[1,5]这个尺寸范围
的零件数约占总数的 .
5. 设在一次数学考试中,某班学生的分数X~N(110,202),且知试卷满分150分,这个班的学生共54人,求这个班在这次数学考试中及格(即90分及90分以上)的人数和130分以上的人数.
课堂小结
参考答案
知识梳理
答案:D
学习过程
问题探究
探究1: 可用频率分布直方图描述这组误差数据的分布,如右图.所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
观察图形,误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,规率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如右图所示。
根据频率与概率的关系,可用以用上图中的钟型曲线来描述袋装食盐质量误差的概率分布.任意抽取一袋盐,误差落在[-2,-1]内的概率,可以用图中黄色阴影部分的面积表示.
问题1:正态分布的定义
对任意的x∈R,f(x)>0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布(normal dis-tribution),记为X~N(u,σ2).特别地,当u=0, σ=1时,称随机变量X服从标准正态分布.
探究2:由X的密度函数及图像可以发现,正态曲线有以下特点:
(1)曲线在x轴的上方,与x轴不相交.
(2)曲线是单峰的,它关于直线x=μ对称.
(3)曲线在x=μ处达到峰值 (最高点)
(4)当|X|无限增大时,曲线无限接近x轴.
(5)X轴与正态曲线所夹面积恒等于1 .
探究3:
(1) 当σ一定时,曲线随着μ的变化而沿x轴平移;
(2)当μ一定时,曲线的形状由σ确定 .
σ越大,曲线越“矮胖”,表示总体的分布越分散;
σ越小,曲线越“瘦高”,表示总体的分布越集中.
正态分布的期望和方差
参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的
离散程度。
二、典例解析
例1:分析:对于第(1)问,正态分布由参数μ和σ 完全确定,根据正态分布参数的意义可以分别用样本均值和样本标准差来估计.对于第(3)问,这是一个概率决策问题,首先要明确决策的准则,在给定的时间内选择不迟到概率大的交通工具;然后结合图形,相据概率的表示,比较概率的大小,作出判断
解:(1)随机变量X的样本均值为30,样本标准差为6;
随机变量Y的样本均值为34,样本标准差为2.
用样本均值估计参数μ.用样本标准差估计参数σ,可以得到X~N(30,6),Y~N(34,2).
(2)X和Y的分布密度曲线如图所示,
(3)应选择在给定时间内不迟到的概率大的交通工具.
由图可知,Y的密度曲线X的密度曲线P(X≤38)P(X ≤ 34)>P(Y ≤ 34).
所以,如果有38min可用,那么骑自行车不迟到的概率大,应选择骑自行车;
如果只有34min可用,那么坐公交车不迟到的概率大,应选择坐公交车,
例2.解:设该学生的身高为X,由题意可知X~N(170 ,102 ).
(1)P(X≤170 )=50%,
(2)因为均值为170,标准差为10,而160=170-10,180=170+10,所以
P(160≤X≤ 180 ) =P(|X –170|≤10) ≈68.3%,
(3)由(2)以及正态曲线的对称性可知
P(170≤X≤ 180 )= P(160≤X≤ 180 ) ≈ 68.3%=34.15%,
由概率加法公式可知P(X≤ 180 )= P(X≤ 170 )+ P(170≤X≤ 180 )
≈ 50%+34.15%=84.15%.
服从正态分布的随机变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与x轴之间面积为1.
(2)注意概率值的求解转化:
①P(X②P(X≤μ-a)=P(X≥μ+a);
(3)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)的值.
③若b<μ,则P(X跟踪训练1.解:设正常情况下,该生产线上包装出来的白糖质量为,由题意可知.
(1)由于,所以根据正态分布的对称性与“原则”可知
.
(2)检测员的判断是合理的. 因为如果生产线不出现异常的话,由(1)可知,随机抽取两包检查,质量都小于的概率约为,
几乎为零,但这样的事件竟然发生了,所以有理由认为生产线出现异常,检测员的判断是合理的.
达标检测
1.解析:对照正态分布密度函数:f(x)=(x∈R),注意指数中的σ和系数的分母中的σ要一致,以及指数部分是一个负数.
答案:B
2.解析:∵ξ服从正态分布N(0,σ2),∴曲线的对称轴是直线x=0.
∵P(ξ<-1)=0.1,∴P(ξ>1)=0.1.
∴ξ在区间(0,1)内取值的概率为0.5-0.1=0.4,故选B.
答案:B
3.解析:因为月收入服从正态分布N(500,202),
所以μ=500,σ=20,μ-σ=480,μ+σ=520.
所以月均收入在[480,520]范围内的概率为0.683.
由图像的对称性可知,此县农民月均收入在500到520元间人数的百分比约为34.15%.
答案:34.15%
4.解析:零件尺寸属于区间[μ-2σ,μ+2σ],
即零件尺寸在[1,5]内取值的概率约为95.4%,
故零件尺寸不属于区间[1,5]内的概率为1-95.4%=4.6%.
答案:4.6%
5.解:μ=110,σ=20,P(X≥90)=P(X-110≥-20)=P(X-μ≥-σ),
∵P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)
≈2P(X-μ<-σ)+0.683=1,
∴P(X-μ<-σ)=0.158 5.
∴P(X≥90)=1-P(X-μ<-σ)=1-0.158 5=0.841 5.
∴54×0.841 5≈45(人),即及格人数约为45人.
∵P(X>130)=P(X-110>20)=P(X-μ>σ),
∴P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)≈0.683+2P(X-μ>σ)=1,
∴P(X-μ>σ)=0.158 5,
即P(X>130)=0.158 5.
∴54×0.158 5≈9(人),
即130分以上的人数约为9人.
1