(共21张PPT)
7.5 正态分布
1.通过误差模型,了解服从正态分布的随机变量.
2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特征.
3.了解正态分布的均值、方差及其含义,会用正态分布去解决实际问题.
情境:在某城市一个红绿灯的路口,红灯持续40s,绿灯持续60s,交替循环.小明骑车来到这个路口,求他遇到绿灯的概率.
A
B
C
0
40
100
用随机变量的观点描述如下:样本空间为Ω={x|0≤x≤100},定义随机变量
T为小明来到路口的时刻,则T是一个连续型随机变量,它的取值充满[0,100].
连续型随机变量:取值往往充满某个区间甚至整个实轴,但取一点的概率为0.
知识点一:正态分布
问题:自动流水线包装的食盐,每袋标准质量为400g.由于各种不可控的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位:g)的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
(1)如何描述这100个样本误差数据的分布
(2)如何构建适当的概率模型刻画误差X的分布
可用频率分布直方图描述这组误差数据的分布.
观察图形可知:误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
当样本数据量越大,分组变多,组距变小,图像接近一条钟形曲线.
可用上图的钟形曲线来描述袋装食盐质量误差的概率分布.
例如,任意抽取一袋食盐,误差落在[-2,-1]内的概率,可用图中黄色阴影部分的面积表示.
钟型曲线如何表示?
正态密度曲线(简称正态曲线)
正态密度函数
②x轴和曲线之间的区域的面积为1.
①对 x∈R,f(x)>0,它的图象在x轴上方;
相应的函数解析式为:
其中μ∈R,σ>0为参数
概念生成
若随机变量X的概率分布密度函数为f (x),则
称随机变量X 服从正态分布,记为X~N(μ,σ2).
特别地,当μ=0,σ=1时,称随机变量X服从
标准正态分布,即X~N(0,1).
若X~N(μ,σ2),则如上图所示,X取值不超过x的概率P(X ≤ x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
3.一定条件下生长的小麦
株高
穗长
单位面积产量
各种产品的质量指标
零件的尺寸
1.正常生产条件下
纤维的纤度
电容器的电容量
电子管的使用寿命等
4.某地每年七月份
平均气温
平均湿度
降雨量等
在现实生活中
随机变量
服从或近似服从
正态分布
体重
2.长度测量的误差
某一地区同年龄人群
身高
肺活量
例如
知识点二:正态密度函数的性质
思考:观察下列正态曲线及相应的密度函数,你能发现正态曲线的哪些特征?
具有两头低、中间高、左右对称的基本特征.
0
1
2
-1
-2
x
y
-3
μ= -1
σ=0.5
0
1
2
-1
-2
x
y
-3
3
μ=0
σ=1
0
1
2
-1
-2
x
y
-3
3
4
μ=1
σ=2
其中μ∈R,σ>0为参数
0
1
2
-1
-2
x
y
-3
μ= -1
σ=0.5
0
1
2
-1
-2
x
y
-3
3
μ=0
σ=1
-3
0
1
2
-1
-2
x
y
3
4
μ=1
σ=2
(1)对称性:曲线是单峰的,它关于直线x=μ对称.
(3)当|x|无限增大时,曲线无限接近x轴.
其中μ∈R,σ>0为参数
当x∈(-∞,μ]时,为增函数;当x∈[μ,+∞)时,为减函数.
(2)最值:
,值域为
曲线在x=μ处达到峰值
思考:一个正态分布由参数μ和σ完全确定,这两个参数对正态曲线的形状有何影响 它们反映正态分布的哪些特征
(1)当参数σ取定值时
μ3= -1
μ1=0
μ2=1
x
y
若σ固定, 图像位置随μ值的变化而沿x轴平移
σ=1
知识点三:参数μ,σ的含义及对正态曲线的形状的影响
为位置参数
2 =0.5
1 =1
3=2
μ=0
x
y
(2)当参数μ取定值时
若μ固定,σ大时, 曲线“矮而胖”,表示总体的分布越分散;
σ小时, 曲线“瘦而高”,表示总体的分布越集中.
为形状参数
正态分布的期望和方差
μ=-1
μ=0
μ=1
σ=1
μ=0
=0.5
=1
=2
μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
若X~N(μ,σ2),则E(X)=μ,D(X)=σ2
例1 李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30min,样本方差为36;骑自行车平均用时34min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38min可用,李明应选择哪种交通工具 如果某天只有34min
可用,又应该选择哪种交通工具 请说明理由.
解:(1)随机变量X的样本均值为30,样本标准差为6;随机变量Y的样本均值为34,样本标准差为2.用样本均值估计参数μ,用样本标准差估计参数σ,可得
X~N(30,6),Y~N(34,2).
(2)X和Y的分布密度曲线如图所示,
(3)应选择在给定时间内不迟到的概率大的交通工具.
由图可知,Y的密度曲线X的密度曲线
P(X≤38)
P(Y ≤ 34).
所以,如果有38min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
正态分布的3σ原则:
①P(μ- σ ≤ X≤ μ+σ)0.6827;
②P(μ-2σ ≤ X≤μ+2σ)0.9545;
③P(μ-3σ ≤ X≤μ+3σ)0.9973.
在实际应用中,通常认为服从于正态分布X~N(μ,σ2)的随机变量X只取
[μ-3σ , μ+3σ]中的值,这在统计学中称为3σ原则.
假设X~N(μ,σ2),可以证明:对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.特别的
例2 在某次数学考试中,考生的成绩X服从正态分布X~N(90,100).
(1)求考试成绩X位于区间(70,110)上的概率是多少
(2)若此次考试共有2000名考生,试估计考试成绩在(80,100)间的考生大约有多少人
解:(1)依题意,X~N(90,100),
即考试成绩在(80,100)间的概率为0.6827.
考试成绩在(80,100)间的考生大约有
框图结构
误差分析
应用
概率的计算
密度曲线的特征
三倍标准差原则
正态密度函数
分布参数的意义
正态密度曲线