(共35张PPT)
第7章《随机变量及其分布》人教A版2019选择性必修第三册7.5 正态分布1. 通过误差模型,了解服从正态分布的随机变量;
2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特点;
3.了解正态分布的均值、方差及其含义;
4.了解3σ原则,会求随机变量在特殊区间内的概率.
学习目标
高斯是一个伟大的数学家,一生中的重要贡献不胜枚举.德国的10马克纸币上印有高斯的头像和正态分布的曲线,这就传达了一个信息:在高斯的科学贡献中,对人类文明影响最大的是正态分布.
那么,什么是正态分布?正态分布的曲线有什么特征?
环节一:创设情境,引入课题
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量(continuous random variable).下面我们看一个具体问题.
问题 自动流水线包装的食盐,每袋标准质量为400 g.由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用X表示这种误差,则X是一个连续型随机变量,检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位:g)的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6. 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
(1)如何描述这100个样本误差数据的分布?
(2)如何构建适当的概率模型刻画误差X的分布?
根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布,如图7.5-1所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图7.5-2所示.
根据频率与概率的关系,可用图7.5-3中的钟形曲线(曲线与水平轴之间的面积为1)来描述袋装食盐质量误差的概率分布,例如,任意抽取一袋食盐,误差落在[-2, -1]内的概率,可用图中黄色阴影部分的面积表示.
环节二:观察分析,感知概念
由函数知识可知,图7.5-3中的钟形曲线是一个函数.那么,这个函数是否存在解析式呢?
答案是肯定的,在数学家的不懈努力下,找到了以下刻画随机误差分布的解析式:
环节三:抽象概括,形成概念
早在1734年,法国数学家棣莫弗(A.DeMoivre,1667-1754)在研究二项概率的近似计算时,已提出了正态密度函数的形式,但当时只是作为一个数学表达式.直到徳国数学家高斯(C.F.Gauss,1777-1855)提出“正态误差”的理论后,正态密度函数才取得“概率分布”的身份.因此,人们也称正态分布为高斯分布.
正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.在现实生活中,很多随机变量都服从或近似服从正态分布,例如,某些物理量的测量误差,某一地区同年龄人群的身高、体重、肺活量等,一定条件下生长的小麦的株高、穗长、单位面积产量,自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容),某地每年7月的平均气温、平均湿度、降水量等,一般都近似服从正态分布.
观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
由X的密度函数及图象可以发现,正态曲线还有以下特点:
环节四:辨析理解,深化概念
例 李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38 min可用,李明应选择哪种交通工具?如果某天只有34 min可用,又应该选择哪种交通工具?请说明理由.
环节五:课堂练习,巩固运用
分析:对于第(1)问,正态分布由参数μ和σ完全确定,根据正态分布参数的意义,可以分别用样本均值和样本标准差来估计,对于第(3)问,这是一个概率决策问题,首先要明确决策的准则,在给定的时间内选择不迟到概率大的交通工具;然后结合图形,根据概率的表示,比较概率的大小,作出判断.
(2)X和Y的分布密度曲线如图7.5-7所示.
所以,如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
变式训练.江先生朝九晚五上班, 上班通常乘坐公交车加步行或乘坐地铁加步行. 江先生从家到公交站或地铁站都要步行5分钟. 公交车多且路程近一些, 但乘坐公交车经常拥堵, 所需时间(单位:分钟)服从正态分布N(33, 42), 下车后从公交车站步行到单位要12分钟; 乘坐地铁畅通, 但线路长且乘客多, 所需时间(单位:分钟)服从正态分布N(44, 22) ,下地铁后从地铁站步行到单位要5分钟. 下列说法:①若8: 00出门,则乘坐公交车不会迟到;②若8: 02出门,则乘坐地铁上班不迟到的可能性更大;③若8: 06出门,则乘坐公交车不迟到的可能性更大;④若8: 12出门,则乘坐地铁几乎不可能上班不迟到.从统计的角度认为以上说法中所有合理的序号是 .
③④
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2). 特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
1. 正态分布:
正态密度函数:
2.特殊区间的概率:
环节六:归纳总结,反思提升
(1)曲线在x轴的上方,与x轴不相交.
(2)曲线是单峰的,它关于直线x=μ对称.
3、正态曲线的性质
(4)曲线与x轴之间的面积为1
(3)曲线在x=μ处达到峰值(最高点)
(6)当μ一定时,曲线的形状由σ确定 .
σ越大,曲线越矮胖,表示总体的分布越分散;
σ越小,曲线越瘦高,表示总体的分布越集中.
(5)当 x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.
σ=0.5
0
1
2
-1
-2
x
y
-3
3
X=μ
σ=1
σ=2
4.正态分布的 原则
环节七:目标检测,作业布置
完成教材:
第87页习题7.5
第1,2,3,4题.
练习 第87页
0.5
0.6826
0.8413
0.1587
3.举出两个服从正态分布的随机变量的例子.
(1)某地区16岁男孩的身高分布可以近似看成服从正态分布;
(2)某厂生产的某种型号的灯泡的使用寿命的分布可以近似看成服从正态分布.
习题7.5(第87页)
4.袋装食盐标准质量为400 g,规定误差的绝对值不超过4 g就认为合格.假设误差服从正态分布,随机抽取100袋食盐,误差的样本均值为0,样本方差为4.请你估计这批袋装食盐的合格率.