(共21张PPT)
立德·勤学·求实·志远
7.5 正态分布
第七章 随机变量及其分布
前面我们已经学习了离散型随机变量及其分布列,有哪些比较经典的分布列?
复习回顾
1. 二项分布
若X ~ B(n, p),则
E(X)= , D(X)= .
np
np(1-p)
2.超几何分布及其分布列
M
N-M
记为X~H(N,n, M).
E(X)=np (其中),D(X)=np(1-p)
学习目标
刻画的是____随机变量的概率分布,如何刻画?
正态分布
是什么?有什么用?怎么用?
情境引入
问题(课本83页):自动流水线包装的食盐,每袋标准质量为.由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用表示这种误差.检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差(单位:)的观测值如下:
不是,是连续型随机变量
新知探究
问题1:根据样本数据及生活经验,此问题中的随机变量
是离散型随机变量吗?
问题2:生活中还有哪些连续型随机变量的例子?
问题3:随机抽取一袋食盐,质量误差刚好是-0.1的概率是多少?
随机变量可以取某区间内的一切值
在生产中,在正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度,电容器的电容量,电子管的使用寿命等);
在测量中,长度测量误差,某一地区同年龄人群的身高、体重、肺活量等;
在生物学中,一定条件下生长的小麦的株高、穗长、单位面积产量等;
在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等;
连续型随机变量的特征是在某一个区间内,任取一点的概率均为0,所以我们更多的是研究其在某个区间内的概率大小
所求概率为0
新知探究
问题4:如何研究连续型随机变量在某个区间内的概率大小呢?比如我们近似得到食盐的质量误差在[0,2](单位:g)的概率呢?在前面的统计章节中有没有学过相关知识?
问题5:如何描述这100个样本误差数据的分布
频率分布直方图
面积即为概率
新知探究
问题5:如何描述这100个样本误差数据的分布
可用频率分布直方图描述这组误差数据的分布.如图(1)
观察图形可知:误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
其中每个小矩形的面积表示误差落在
相应区间内的频率,
所有小矩形的面积之和为1.
n=1000
?
新知探究
追问:增加样本容量,细化分组,缩小组距,频率分布直方图的轮廓会如何变化?
钟形曲线
钟形曲线
中间高,两边低,左右对称
面积
存在. 刻画随机误差分布的解析式为
问题6:钟形曲线有何特征 在某区间[a,b]内的概率可用什么来代替?
频率 / 组距
X
a
0
0.15
0.05
0.10
0.20
b
问题7:由函数知识可知,钟形曲线是一个函数,那么这个函数是否存在解析式呢?
f (x)
x
正态密度函数
正态密度函数
频率 / 组距
X
a
0
0.15
0.05
0.10
0.20
b
f (x)
x
法国 棣莫弗
德国 高斯
1733年
二项概率计算公式
正态密度函数首次露面
1777-1855年
“误差分布”理论,
正态分布
也称高斯分布
概念生成
正态分布
若随机变量X的概率分布密度函数为正态密度函数f(x),
则称随机变量X服从正态分布.
正态密度曲线
简称“正态曲线”
其中μ∈R,σ>0为参数.
特别地,当μ=0, σ=1时,
称随机变量X服从标准正态分布.
y
0
1
2
-1
-2
x
-3
3
μ=0
σ=1
100个数据(食盐质量误差)
100个数据的频率分布直方图轮廓
n(n>>100)个数据的频率分布直方图轮廓
接近一条光滑的钟型曲线
正态密度曲线
问题8:如何构建适当的概率模型刻画误差的分布
正态分布
追问2 正态分布曲线是如何刻画随机变量的概率分布的呢?
若X~N(μ,σ2),则如右图所示,
面积即为概率!
f (x)
x
μ
a
A
B
x
b
O
?
?
正态曲线的特点
其中μ∈R,σ>0为参数.
形
直观感受
数
①曲线在x轴的上方,x轴为渐近线
②曲线是单峰的,它关于直线x=μ对称
③曲线在x=μ处取得最大值
曲线与x轴间的区域面积为1
④
证明
一个正态分布由参数μ和σ完全确定,这两个参数对正态曲线的形状有何影响 它们反映正态分布的哪些特征
1
σ=0.5
3
2
μ=-1
μ=0
μ=1
μ为位置参数
反映了正态分布的集中位置,
可以用均值来估计.
故有E(X)=μ.
探究
μ=0
=0.5
=1
=2
为形状参数
反映了随机变量的分布相对于均值μ的离散程度,可以用标准差来估计,故有D(X)=σ2.
σ越大,曲线越“矮胖”,
表示总体的分布越分散;
σ越小,曲线越“瘦高”,
表示总体的分布越集中.
归纳小结
其中μ∈R,σ>0为参数.
①曲线在x轴的上方,x轴为渐近线
②曲线是单峰的,它关于直线x=μ对称
③曲线在x=μ处取得最大值
曲线与x轴间的区域面积为1,
④
2.性质:
⑤为位置参数,为形状参数,
E(X)=μ,D(X)=σ2.
小试牛刀
思考:利用正态分布计算概率,关键步骤是什么?
确定参数 ,画出图形并标出对应区间
频率 / 组距
X
-2
0
2
典例分析
P86-例.李明上学有时坐公交车, 有时骑单车, 他各记录了50次坐公交车和骑单车所花的时间, 经数据分析得到: 坐公交车平均用时30min, 样本方差为36; 骑单车平均用时34min, 样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38min可用,李明应选择哪种交通工具 如果某天只有34min可用,又应该选择哪种交通工具 请说明理由.
正态分布中特殊区间的概率
假设X~N(μ, σ2),可以证明: 对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
几乎不可能发生
归纳小结
其中μ∈R,σ>0为参数.
E(X)=μ,D(X)=σ2.
正态分布
正态曲线及性质
数形结合
概率计算
A. 0.6827 B. 0.8186 C. 0.8413 D. 0.9545
当堂测试
2024广州市二模
A. 0.6827
2. 已知一批沙糖桔的果实横径(单位:mm)服从正态分布N(45,52),其中果实横径落在[40,55]的沙糖桔为优质品,则这批沙糖桔的优质品率约为( )