(共23张PPT)
7.5 正态分布
2.二项分布:
3.超几何分布:
1.两点分布:
知识回顾
小明上学途中等公交车的时间X;
实验中测量某零件尺寸的误差Y;
郴州市5月份的降雨量Z;
某电器的使用寿命 ;
...
你还能举出几个这样的例子吗?
生活中还有许多随机变量不是离散型的随机变量,例如:
连续型随机变量:如果随机变量X的所有取值不可以逐个列举出来,而是充满某个区间甚至整个实轴,但取一点的概率为0。我们称这类变量为连续型随机变量。
情境导入
思考:连续型随机变量会服从什么分布呢?
(1)如何描述这100个样本误差数据的分布?
(2)如何构建适当的概率模型刻画误差X的分布?
频率分布直方图
问题1 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位: g) 的观测值如下:
新知探究
追问1 随着样本数据量越来越大,让分组越来越多,组距越来越小,频率分布直方图的轮廓会发生什么变化?
n=9
n=50
n=107
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.
新知探究
若数据无限增多且组距无限缩小,那么频率分布直方图的的轮廓形成一条光滑钟形的曲线,我们称此曲线为概率密度曲线.
概率密度曲线
新知探究
问题2:任意抽取一袋食盐如何根据概率密度函数计算误差[-2,-1]内的概率?
可用图中褐色阴影部分的面积表示
新知探究
曲线与水平轴之间的区域的面积为1
追问2 根据函数知识,这个钟形曲线它是函数吗?
如果是,那么,这个函数是否存在解析式呢?
在数学家的不懈努力下,找到了以下刻画随机误差分布的解析式:
其中 为参数.
称为正态密度函数
标准差
数学期望
概念生成
其中实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,称
的图象称为正态密度曲线,简称正态曲线
正态密度函数
若随机变量X的概率分布密度函数为 则称随机变量X服从正态分布,记作: ;特别地,当μ=0,σ=1时,随机变量X服从标准正态分布。
概念生成
追问3 正态分布曲线是如何刻画随机变量的概率分布的呢?
若X~N(μ,σ2),则如右图所示,
X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
面积即为概率!
新知探究
由X的密度函数及图象可以发现,正态曲线还有以下特点:
(1) 曲线是单峰的,它关于直线x=μ对称;
具有两头低、中间高、左右对称的基本特征
(2) 曲线在x=μ处达到峰值(最高点) ;
(3) 正态曲线在x轴上方,两侧与x轴无限接近而不相交;
(4) x轴和曲线之间的区域的面积为1.
频率
组距
o
钟型曲线
x=μ
问题3 观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
新知探究
3
1
2
σ=0.5
μ=-1
μ=0
μ=1
当参数σ固定时,正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移,
故μ称为位置参数
规律:左“-”右“+”
问题4 一个正态分布由参数μ和σ完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征
新知探究
μ的意义:
反映总体随机变量取值的集中位置,即为均值.
μ=0
=0.5
=1
=2
σ越大,曲线越“矮胖”,
表示总体的分布越分散;
σ越小,曲线越“瘦高”,
表示总体的分布越集中.
新知探究
问题4 一个正态分布由参数μ和σ完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征
σ的意义:
反映随机变量的分布相对于均值μ的离散程度,即为标准差
(1) 曲线在x轴的上方,与x轴不相交;
(3) 曲线与x轴之间的面积为1;
(4) 当μ一定时,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.
正态曲线的性质:
(5) 参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
在实际问题中,参数μ, σ可以分别用样本均值和样本标准差来估计,故有
(2) 曲线是单峰的,它关于直线x=μ对称,且在x=μ处取得最大值 ;
小结归纳
0
1
2
-1
-2
x
y
-3
3
4
μ=1
0.5
1-a
a
1-a
1-2a
1. 若X~N(2, 32),则E(X)=______,D(X)=_______.
2
9
3
2
2. X~N(μ, σ2),若E(X)=3, σ(X)=2,则μ=______, σ=______.
3.若X~N(1, σ2),且P(X<0)=a,则
(1) P(X>1)=_______;
(2) P(X>0)=______;
(3) P(X>2)=______;
(4) P(X<2)=______;
(5) P(0(6) P(00.5-a
关键:画出正态曲线的简图
课堂练习
例1 李明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4;假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38 min可用,李明应选择哪种交通工具 如果某天只有34
min可用,又应该选择哪种交通工具 请说明理由.
例题讲解
2. 设随机变量X~N(0, 22),随机变量Y~N(0, 32),画出分布密度曲线草图,并指出P(X≤-2)与P(X≤2)的关系,以及P( |X|≤1)与P( |Y|≤1)之间的大小关系.
O
1
-1
x
y
σ=3
σ=2
2
-2
课堂练习
假设X~N(μ, σ2),可以证明: 对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.
特殊区间的概率
由图可知,但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
新知探究
1. 设随机变量X~N(0, 1),
则X的密度函数为___________________,P(X≤0)=_____ ,
P( |X|≤1)=________, P(X≤1)=________, P(X>1)=________ (精确到0.0001.)
0.5
0.6827
0.84135
0.15865
O
1
-1
x
y
μ=0
课堂练习
例2 设在一次数学考试中,某班学生的分数X~N(110,202),且知试卷满分150分,这个班的学生共54人,求这个班在这次数学考试中及格(即90分以上)的人数和130分以上的人数.
例题讲解
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2). 特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
1. 正态分布:
正态密度函数:
2.特殊区间的概率:
课堂小结
正态分布是应用最广泛的一种连续型分布.
正态分布在十九世纪前叶由德国高斯加以推广,所以通常称为高斯分布.
德莫佛
法国德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.
正态分布:
在某次数学考试中,考生的成绩X服从正态分布X~N(90,100).
(1).求考试成绩X位于区间(70,110)上的概率是多少
(2).若此次考试共有2000名考生,试估计考试成绩在(80,100)间的考生大约有多少人
课后作业