7.5 正态分布
教材分析
本节课选自《2019人教A版高中数学选择性必修第三册》,第七章《随机变量及其分布列》,本节课主本节课主要学习正态分布
本节课是前面学习了离散型随机变量,离散型随机变量的取值是可列的。而连续型随机变量,连续型随机变量是在某个区间内可取任何值。其重要的代表——正态分布。
《正态分布》该节内容通过研究频率分布直方图、频率分布折线图、总体密度曲线,引出拟合的函数式,进而得到正态分布的概念,然后,分析正态曲线的特点和性质,最后研究了它的应用——随机变量落在某个区间的概率。正态分布是描述随机现象的一种最常见的分布,在现实生活中有非常广泛的应用。
教学目标与核心素养
课程目标 学科素养
A. 通过误差模型,了解服从正态分布的随机变量; 2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特点; 3.了解正态分布的均值、方差及其含义; 4.了解3σ原则,会求随机变量在特殊区间内的概率. 1.数学抽象:正态分布曲线的特点 2.逻辑推理:正态分布的概念 3.数学运算:求随机变量在特殊区间内的概率 4.数学建模:模型化思想
重点难点
重点:认识分布曲线的特点及曲线所表示的意义.了解3σ原则.
难点:.会求随机变量在特殊区间内的概率.
课前准备
多媒体
教学过程
教学过程 教学设计意图 核心素养目标
探究新知 现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量,不是离散的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续性随机变量,下面我们看一个具体问题. 探究1:自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控的因素,任意抽取一袋食盐,它的质量与标准质量之间或多 或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中, 随机抽取了100袋食盐,获得误差X (单位:g)的观测值如下: -0.6-1.4-0.7 3.3-2.9-5.21.4 0.1 4.4 0.9-2.6-3.4-0.7-3.2-1.7 2.9 0.6 1.7 2.9 1.2 0.5-3.7 2.7 1.1-3.0-2.6-1.9 1.7 2.6 0.4 2.6-2.0-0.2 1.8-0.7-1.3-0.5-1.3 0.2-2.1 2.4 -1.5-0.4 3.8-0.11.5 0.3-1.8 0.0 2.5 3.5-4.2-1.0-0.2 0.10.9 1.12.2 0.9-0.6-4.4-1.1 3.9-1.0-0.61.7 0.3-2.4-0.1-1.7-0.5-0.8 1.7 1.4 4.4 1.2-1.8-3.1-2.1-1.6 2.2 0.34.8-0.8-3.5-2.7 3.8 1.4-3.5-0.9-2.2 -0.7-1.3 1.5-1.5 -2.2 1.0 1.3 1.7-0.9
(1).如何描述这100个样本误差数据的分布 (2).如何构建适当的概率模型刻画误差X的分布 可用频率分布直方图描述这组误差数据的分布,如右图.所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1. 观察图形,误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁. 随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,规率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如右图所示。 根据频率与概率的关系,可用以用上图中的钟型曲线来描述袋装食盐质量误差的概率分布.任意抽取一袋盐,误差落在[-2,-1]内的概率,可以用图中黄色阴影部分的面积表示. 问题1:由函数知识可知,图中的钟形曲线是一个函数,那么,这个函数是否存在解析式呢? 对任意的x∈R,f(x)>0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布(normal dis-tribution),记为X~N(u,σ2).特别地,当u=0, σ=1时,称随机变量X服从标准正态分布. 正态分布的定义 正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.在现实生活中,很多随机变量都服从或近似服从正态分布 例如,某些物理量的测量误差某一地区同年龄人群的身高、体重、肺活量等一定条件下生长的小麦的株高、穗长、单位面积产量自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容)某地每年7月的平均气温、平均湿度、降水量等 探究2:观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点? 其中μ∈R,>0为参数. 由X的密度函数及图像可以发现,正态曲线有以下特点: (1)曲线在x轴的上方,与x轴不相交. (2)曲线是单峰的,它关于直线x=μ对称. (3)曲线在x=μ处达到峰值 (最高点) (4)当|X|无限增大时,曲线无限接近x轴. (5)X轴与正态曲线所夹面积恒等于1 . 探究3:观察正态曲线、相应的密度函数及概率的性质,你能发现正态曲线的哪些特点? (1) 当σ一定时,曲线随着μ的变化而沿x轴平移; (2)当μ一定时,曲线的形状由σ确定 . σ越大,曲线越“矮胖”,表示总体的分布越分散; σ越小,曲线越“瘦高”,表示总体的分布越集中. 正态分布的期望和方差 参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的 离散程度。 概念辨析 1、把一个正态曲线a沿着横轴方向向右移动2个单位,得到新的一条曲线b。下列说法中不正确的是( ) A.曲线b仍然是正态曲线; B.曲线a和曲线b的最高点的纵坐标相等; C.以曲线b为概率密度曲线的总体的期望比以曲线a为概率密度曲线的总体的期望大2; D.以曲线b为概率密度曲线的总体的方差比以曲线a为概率密度曲线的总体的方差大2。 答案:D 二、典例解析 例1:李明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4;假设坐公交车用时X和骑自行车用时Y都服从正态分布. (1)估计X,Y的分布中的参数; (2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线; (3)如果某天有38 min可用,李明应选择哪种交通工具 如果某天只有34 min可用,又应该选择哪种交通工具 请说明理由. 分析:对于第(1)问,正态分布由参数μ和σ 完全确定,根据正态分布参数的意义可以分别用样本均值和样本标准差来估计.对于第(3)问,这是一个概率决策问题,首先要明确决策的准则,在给定的时间内选择不迟到概率大的交通工具;然后结合图形,相据概率的表示,比较概率的大小,作出判断 解:(1)随机变量X的样本均值为30,样本标准差为6; 随机变量Y的样本均值为34,样本标准差为2. 用样本均值估计参数μ.用样本标准差估计参数σ,可以得到X~N(30,6),Y~N(34,2). (2)X和Y的分布密度曲线如图所示, (3)应选择在给定时间内不迟到的概率大的交通工具. 由图可知,Y的密度曲线X的密度曲线P(X≤38)
P(Y ≤ 34). 所以,如果有38min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34min可用,那么坐公交车不迟到的概率大,应选择坐公交车, 正态分布的3σ原则 [ 3 , +3 ]中的值,这在统计学中称为3 原则. ①P(μ- σ ≤ X≤ μ+σ)0.682 7; ②P(μ-2σ ≤ X≤μ+2σ)0.954 5; ③P(μ-3σ ≤ X≤μ+3σ)0.997 3. 特别地,尽管正态变量的取值范围是( ∞,+∞),但在一次试验中, 的取值几乎总落在区间[ 3 , +3 ]内,而在此区间外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生. 在实际应用中,通常认为服从于正态分布 ( , 2)的随机变量 只取 例2. 假设某地区高二学生的身高服从正态分布,且均值为170(单位:cm,下同),标准差为10.在该地区任意抽取一名高二学生,求这名学生的身高: (1)不高于170的概率; (2)在区间[160,180]内的概率; (3)不高于180的概率. 解:设该学生的身高为X,由题意可知X~N(170 ,102 ). (1)P(X≤170 )=50%, (2)因为均值为170,标准差为10,而160=170-10,180=170+10,所以 P(160≤X≤ 180 ) =P(|X –170|≤10) ≈68.3%, (3)由(2)以及正态曲线的对称性可知 P(170≤X≤ 180 )= P(160≤X≤ 180 ) ≈ 68.3%=34.15%, 由概率加法公式可知P(X≤ 180 )= P(X≤ 170 )+ P(170≤X≤ 180 ) ≈ 50%+34.15%=84.15%. 服从正态分布的随机变量在某个区间内取值概率的求解策略 (1)充分利用正态曲线的对称性和曲线与x轴之间面积为1. (2)注意概率值的求解转化: ①P(X三、达标检测 1.下列函数是正态分布密度函数的是( ) A.f(x)=,μ,σ(σ>0)都是实数 B.f(x)= C.f(x)= D.f(x)= 解析:对照正态分布密度函数:f(x)=(x∈R),注意指数中的σ和系数的分母中的σ要一致,以及指数部分是一个负数. 答案:B 2.在某项测量中,测量结果ξ服从正态分布N(0,σ2).若ξ在(-∞,-1)内取值的概率为0.1,则ξ在(0,1)内取值的概率为( ) A.0.8 B.0.4 C.0.2 D.0.1 解析:∵ξ服从正态分布N(0,σ2),∴曲线的对称轴是直线x=0. ∵P(ξ<-1)=0.1,∴P(ξ>1)=0.1. ∴ξ在区间(0,1)内取值的概率为0.5-0.1=0.4,故选B. 答案:B 3.某县农民月均收入服从N(500,202)的正态分布,则此县农民月均收入在500元到520元间人数的百分比约为 . 解析:因为月收入服从正态分布N(500,202), 所以μ=500,σ=20,μ-σ=480,μ+σ=520. 所以月均收入在[480,520]范围内的概率为0.683. 由图像的对称性可知,此县农民月均收入在500到520元间人数的百分比约为34.15%. 答案:34.15% 4.某种零件的尺寸ξ(单位:cm)服从正态分布N(3,12),则不属于区间[1,5]这个尺寸范围 的零件数约占总数的 . 解析:零件尺寸属于区间[μ-2σ,μ+2σ], 即零件尺寸在[1,5]内取值的概率约为95.4%, 故零件尺寸不属于区间[1,5]内的概率为1-95.4%=4.6%. 答案:4.6% 5. 设在一次数学考试中,某班学生的分数X~N(110,202),且知试卷满分150分,这个班的学生共54人,求这个班在这次数学考试中及格(即90分及90分以上)的人数和130分以上的人数. 解:μ=110,σ=20,P(X≥90)=P(X-110≥-20)=P(X-μ≥-σ), ∵P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ) ≈2P(X-μ<-σ)+0.683=1, ∴P(X-μ<-σ)=0.158 5. ∴P(X≥90)=1-P(X-μ<-σ)=1-0.158 5=0.841 5. ∴54×0.841 5≈45(人),即及格人数约为45人. ∵P(X>130)=P(X-110>20)=P(X-μ>σ), ∴P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)≈0.683+2P(X-μ>σ)=1, ∴P(X-μ>σ)=0.158 5, 即P(X>130)=0.158 5. ∴54×0.158 5≈9(人), 即130分以上的人数约为9人. 通过练习巩固本节所学知识,通过学生解决问题,发展学生的数学运算、逻辑推理、直观想象、数学建模的核心素养。
四、小结 五、课时练 通过总结,让学生进一步巩固本节所学内容,提高概括能力。
教学反思
课后通过对教学过程的反思与研究, 才能不断完善教学设计中的不足, 才能提升教材分析的能力和课堂教学实效.
1. 多元展示, 多方评价. 在教学过程中我借问题牵引,保证了课堂教学的顺利实施;而在整个过程中,我对学生所作练习、疑问及时解析评价;学生之间、小组之间的互相评价补充,使学生共享成果分享喜悦,坚定了学好数学的信念,实现了预期目标.
2. 创造性的使用教材. 有别于教材,我在教学中,让学生考察了分别考察了两类题型之后再引导学生进行归纳, 这样更贴近学生的认知水平, 学生课后反馈,效果较为理想.
1