(共33张PPT)
7.5 正态分布
问题引入
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
离散型随机变量的概率分布规律用分布列描述,(两点分布、超几何分布、二项分布等)
连续型随机变量的概率分布规律用什么来描述?
人的身高、体重、肺活量;电视机的寿命;小麦的株高、穗长、单位面积产量;零件的尺寸;某地每年7月的平均气温、降水量;居民的月均用水量……
复习回顾
1、回顾样本的频率分布与总体分布的关系:
由于总体分布通常不易知道,我们往往是用样本的频率分布(即频率分布直方图)去估计总体分布。
一般样本容量越大,这种估计就越精确。
2、从100个产品尺寸的频率分布直方图可以看出,当样本容量无限大,分组的组距无限缩小时,这个频率直方图就会无限接近于一条光滑曲线----总体密度曲线。
问题引入 25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42
25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43
25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36
25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44
25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37
25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39
25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37
25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46
25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32
25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35
25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40
25.37 25.33 25.40 25.35 25.41 25.37 25.47 25.39
25.42 25.47 25.38 25.39
问题引入
总体密度曲线(钟形曲线)
频率分布折线 图无限接近于 一条光滑曲线.
总体密度曲线 与x轴围成的 面积为 1 .
新知探索
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图所示.
根据频率与概率的关系,可用图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.例如,任意抽取一袋食盐,误差落在内的概率,可用图中黄色阴影部分的面积表示.
光滑的钟形曲线
新知探索
由函数知识知,图中的钟形曲线是一个函数.那么,这个函数是否存在解析式呢?
答案是肯定的.在数学家的不懈努力下,找到了刻画随机误差分布的解析式:,.其中,为参数.
新知探索
1
e , x ,
2 2
x 2
,
2
x
正态函数
总体密度曲线(钟形曲线)
正态曲线
新知探索
y
-3
μ= -1
σ=0.5
-2 -1 0 1 2 x -3 -2 -1 0 1 2 3 x
μ=0
σ=1
0
y
-3 -2 -1
1 2 3 4 x
μ=1
σ=2
曲线在x轴的上方,与x轴不相交.
曲线是单峰的,它关于直线x=μ对称.
曲线在x=μ处达到峰值(最高点)
曲线与x轴之间的面积为1.
1
σ 2π
1
e
2 2
2 y
( x )2
(x)
, x ( , )
时,函数值为最大.
(2)f (x) 的值域为
时f (x)为增函数.
时f (x)为减函数.
x
y
-
3 -2 -1 0 1 2 3
μ=
0
σ=1
标准
正态曲线
正态总体的函数(正态函数)表示式:
2
1
2
2
( x )2
f (x) e
.
, x ( , )
(1)当x =μ
1
(0, ]
2
(4)当x∈(-∞,μ]
当x∈(μ,+∞)
(3) f (x) 的图象关于 x =μ 对称.
2
e 2 , x R.
f (x)
x
1
2
标准正态函数:
1
2
μ=0,
正态曲线的性质
新知探索
如图所示.若随机变量的概率分布密度函数为,则称随机变量服从正态分布,记为.
若,则如图所示,取值不超过的概率为图中区域的面积,而为区域的面积.
参数μ反映了正态分布的集中位置,
参数σ反映了随机变量的分布相对于均值的离散程度.
新知探索
正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.在现实生活中,很多随机变量都服从或近似服从正态分布.例如,某些物理量的测量误差,某一地区同年龄人群的身高、体重、肺活量等,一定条件下生长的小麦的株高、穗长、单位面积产量,自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容),某地每年7月的平均气温、平均湿度、降水量等,一般都近似服从正态分布.
新知探索
由的密度函数及图象可以发现,正态曲线还有以下特点:
(1)曲线是单峰的,它关于直线对称;
(2)曲线在处达到峰值;
(3)当无限增大时,曲线无限接近轴.
思考1:观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
新知探索
我们知道,函数的图象可由的图象平移得到.因此,在参数取固定值时,正态曲线的位置由确定,且随着的变化而沿轴平移,如图所示.
思考2:一个正态分布由参数和完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?
新知探索
当取定值时,因为正态曲线的峰值与成反比,而且对任意的,正态曲线与轴之间的区域面积总为1.因此,当较小时,峰值高,正态曲线“瘦高”,表示随机变量的分布比较集中;当较大时,峰值低,正态曲线“矮胖”,表示随机变量的分布较分散,如图所示.
观察两个图象可以发现,参数反映了正态分布的集中位置,反映了随机变量的分布相对于均值的离散程度.实际上,我们有:
若,则.
新知探索
[例1] 如图所示是一个正态曲线,试根据该图象写出其正态密度函数的解析式,求出总体随机变量的数学期望和方差.
例析
例析
方法技巧:
利用正态曲线的特点求参数,
1.正态曲线是单峰的,它关于直线对称,由此性质结合图象求.
2.正态曲线在处达到峰值,由此性质结合图象可求.
3.由的大小区分曲线的胖瘦.
新知探索
假定,可以证明:对给定的,是一个与有关的定值.特别地,
上述结果可用图表示.
新知探索
由此看到,尽管正态变量的取值范围是,但在一次试验中,的取值几乎总是落在区间内,而在此区间以外取值的概率大约只有,通常认为这种情况几乎不可能发生.
在实际应用中,通常认为服从于正态分布的随机变量只取
中的值,这在统计学中称为原则.
P87-1.设随机变量X~N(0,1),则X的密度函数为_______________,
P(X≤0)=_________,P(|X|≤1)=________,
P(X<1)=_________,P(X>1)=________.(精确到0.0001.)
0.5
0.6827
0.8414
0.1586
方法:把普通的待求区间向(μ σ,μ+σ),(μ 2σ,μ+2σ),(μ 3σ,μ+3σ)这三个区间进行转化,然后利用3个特殊概率、0.5、1等求出相应概率.
练习
√
例析
(2)已知随机变量X服从正态分布N(1,σ2),且P(X<2)=0.6,则P(0A.0.1 B.0.2 C.0.3 D.0.4
解析:(2)由X~N(1,σ2),且P(X<2)=0.6,
则有P(1根据正态分布的对称性可知P(0√
例析
练习
P87-2.某市高二年级男生的身高X(单位:cm)近似服从正态分布N(170,5 ),随机选择一名本市高二年级的男生,求下列事件的概率:
(1)P(165(2)P(X≤165)=__________
(3)P(X>175)=__________
0.6827
0.15865
0.15865
P87-4.袋装食盐标准质量为400g,规定误差的绝对值不超过4g就认为合格.假设误差服从正态分布,随机抽取100袋食盐,误差的样本均值为0,样本方差为4,请你估计这批袋装食盐的合格率.
练习
练习.(1)已知随机变量,且,则( ).
A.0.6 B.0.4 C.0.3 D.0.2
答案:C.
解(1):∵随机变量服从正态分布,∴,对称轴是.
∵,∴
∴,
∴
练习
练习.(2)设随机变量,若.
①求的值;②求.
解(2):①由可知,密度函数关于直线对称(如图所示).
∵,
故有,∴.
②
练习
方法技巧:
正态变量在某个区间内取值概率的求解策略
1.充分利用正态曲线的对称性和曲线与轴之间面积为1.
2.注意概率值的求解转化:
①;②;
③若,则.
3.熟记,,的值.
4.求解时,可画出图象,结合图形解答.
练习
变.在某项测量中,测量结果,求正态总体在内取值的概率.
解:由题意得,,
所以.
又因为正态曲线关于对称,
所以.
课堂小结
1.连续型随机变量:
大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
2.正态曲线的定义:
若其中为参数,我们称为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.
课堂小结
3.正态曲线的特点:
(1)曲线是单峰的,它关于直线对称;
(2)曲线在处达到峰值;
(3)当无限增大时,曲线无限接近轴.
4.正态分布的定义:
若随机变量的概率分布密度函数为,则称随机变量服从正态分布,记为.特别地,当,时,称随机变量服从标准正态分布.
课堂小结
5.正态分布的特征:
(1)当一定时,正态曲线的位置由确定,且随着的变化而沿轴平移,参数反映了正态分布的集中位置.
(2)当一定时,正态曲线的形状由确定,越小,正态曲线越“瘦高”,表示随机
变量的分布越集中;越大,正态曲线越“矮胖”,表示随机变量的分布越分散.
反映了随机变量的分布相对于均值的离散程度.
6.原则:
通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
作业
(1)整理本节课的题型;
(2)课本P87的练习1——3题;
(3)课本P87的习题7.5的第1——4题.