(共18张PPT)
选修三《第七章 随机变量及其分布》
7.5正态分布
离散型随机变量的概率分布规律用分布列描述,
(两点分布、超几何分布、二项分布等)
连续型随机变量的概率分布规律用什么来描述?
人的身高、体重、肺活量;电视机的寿命;小麦的株高、穗长、单位面积产量;零件的尺寸;某地每年7月的平均气温、降水量;居民的月均用水量……
它们的取值往往充满某个区间甚至整个实轴
问题:自动流水线包装的食盐,每袋标准质量为400g.由于各种不可控的因素,任意抽取一袋食盐的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用X表示这种误差,则X是一个连续型随机变量.检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位:g)的观测值如下:
(1)如何描述这100个样本误差数据的分布?
(1)如何描述这100个样本误差数据的分布?
可用频率分布直方图描述这组误差数据的分布,如图所示.
其中每个小矩形的面积表示误差落在相应区间内的频率,
观察图形可知:误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.
频率分布折线图
光滑的钟形曲线
可用图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.例如,任意抽取一袋食盐,误差落在[-2,-1]内的概率,可用图中黄色阴影部分的面积表示.
(2)如何构建适当的概率模型刻画误差X的分布?
(3)由函数知识知,右图中的钟形曲线是一个函数.
那么,这个函数是否存在解析式呢?
100个数据(食盐质量误差)
100个数据的频率分布直方图轮廓
n(n>>100)个数据的频率分布直方图轮廓
接近一条光滑的钟型曲线
正态密度曲线
新知1:正态密度函数
新知2:正态密度曲线
(σ越小,峰值越高,曲线越高瘦,X的分布越集中)
新知3:正态分布
参数μ反映了正态分布的集中位置,
参数σ反映了随机变量的分布相对于均值的离散程度.
在实际问题中,参数μ和σ可以分别用样本均值和样本标准差去估计.
巩固:正态曲线
1.如图所示,是一个正态曲线.试根据该图象写出其正态分布的概率密度函数的解析式,求出总体随机变量的均值和方差.
巩固:正态密度函数
P86-例.李明上学有时坐公交车, 有时骑单车, 他各记录了50次坐公交车和骑单车所花的时间, 经数据分析得到: 坐公交车平均用时30min, 样本方差为36; 骑单车平均用时34min, 样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
解:(1)随机变量X的样本均值为30,样本标准差为6,
随机变量Y的样本均值为34,样本标准差为2,
用样本均值估计参数μ,用样本标准差估计参数σ,
可得X~N(30,62),Y~N(34,22).
巩固:正态密度函数
P86-例.李明上学有时坐公交车, 有时骑单车, 他各记录了50次坐公交车和骑单车所花的时间, 经数据分析得到: 坐公交车平均用时30min, 样本方差为36; 骑单车平均用时34min, 样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(3)如果某天有38 min可用,李明应选择哪种交通工具
如果某天只有34 min可用,又应该选择哪种交通工具 请说明理由.
解:(1)X~N(30,62),Y~N(34,22).
若有38 min可用,则骑单车不迟到的概率大,应选择骑单车;
若只有34 min可用,则坐公交车不迟到的概率大,应选择坐公交车.
(3)应选择在给定时间内不迟到的概率大的交通工具.
由图知,P(X≤38)
P(Y≤34).
正态分布的应用
正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.
在现实生活中,很多随机变量都服从或近似服从正态分布.例如,某些物理量的测量误差,某一地区同年龄人群的身高、体重、肺活量等,一定条件下生长的小麦的株高、穗长、单位面积产量,自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容),某地每年7月的平均气温、平均湿度、降水量等,一般都近似服从正态分布.
新知4:3σ原则
假定,可证:
对给定的,是一个与有关的定值.
特别地,
3 原则:在实际应用中,通常认为服从正态分布N( , 2)的随机变量X只取( -3 , +3 )之间的值.
尽管正态变量X的取值范围是R,但X的取值几乎总是落在区间[ -3 , +3 ]内;取值落在此区间以外的概率大约只有0.0027,为小概率事件,通常认为这种情况几乎不可能发生.
巩固:正态曲线和3σ原则
P87-1.设随机变量X~N(0,1),则X的密度函数为_______________,
P(X≤0)=_________,P(|X|≤1)=________,
P(X<1)=_________,P(X>1)=________.(精确到0.0001.)
0.5
0.6827
0.8414
0.1586
方法:把普通的待求区间向(μ σ,μ+σ),(μ 2σ,μ+2σ),(μ 3σ,μ+3σ)这三个区间进行转化,然后利用3个特殊概率、0.5、1等求出相应概率.
巩固:正态曲线和3σ原则
P87-2.某市高二年级男生的身高X(单位:cm)近似服从正态分布N(170,5 ),随机选择一名本市高二年级的男生,求下列事件的概率:
(1)P(165(2)P(X≤165)=__________
(3)P(X>175)=__________
0.6827
0.15865
0.15865
P87-4.袋装食盐标准质量为400g,规定误差的绝对值不超过4g就认为合格.假设误差服从正态分布,随机抽取100袋食盐,误差的样本均值为0,样本方差为4,请你估计这批袋装食盐的合格率.
巩固:正态曲线和3σ原则
练习.在某次数学考试中,考生的成绩X服从一个正态分布N(90,100),若这次考试共有2000名考生,试估计考试成绩在[80,100]间的考生大约有________人.
析:2000×0.6827=1365
P91-12.某城市高中数学统考,假设考试成绩服从正态分布N(75,8 ).如果按照16%、34%、34%、16%的比例将考试成绩分为A、B、C、D四个等级,试确定各等级的分数线(精确到1).
1365
析:X<67定为D级,
67≤X<75定为C级,
75≤X<83定为B级,
X≥83定为A级.
END