7.5 正 态 分 布
1. 通过误差模型,了解服从正态分布的随机变量.
2. 通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特征.
3. 了解正态分布的均值、方差及其含义.
活动一 背景引入
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0. 我们称这类随机变量为连续型随机变量.
问题:自动流水线包装的食盐,每袋标准质量为400 g.由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用X表示这种误差,则X是一个连续型随机变量.检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位:g)的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
思考1
如何描述这100个样本误差数据的分布?
思考2
如果数据无限增多且组距无限缩小,那么频率直方图有什么特征?
活动二 了解正态密度曲线和正态分布的概念
1. 正态密度曲线:
函数f(x)=,x∈R,其中μ∈R,σ>0为参数,我们称f(x)的图象为正态密度曲线,简称正态曲线.
2. 正态密度曲线图象有如下特征:
(1) 曲线位于x轴的上方,以x轴为渐近线;
(2) 曲线是单峰的,它关于直线x=μ对称;
(3) 曲线在x=μ处达到峰值;
(4) 曲线与x轴之间的面积为1;
(5) 当σ一定时,正态曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
(6) 当μ一定时,曲线的形状由σ确定,σ越大,曲线越扁平,总体的分布越分散;σ越小,曲线越尖陡,总体的分布越集中,如图乙所示.
甲 乙
3. 正态分布
(1) 若随机变量X的概率分布密度函数
为f(x)=,x∈R,其中μ∈R,σ>0为参数,则称随机变量X服从正态分布.
(2) 正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2).若随机变量X服从正态分布,则记为X~N(μ,σ2).
4. 3σ原则
(1) 正态总体在三个特殊区间内取值的概率值:
①P(μ-σ≤X≤μ+σ)≈0.682 7;
②P(μ-2σ≤X≤μ+2σ)≈0.954 5;
③P(μ-3σ≤X≤μ+3σ)≈0.997 3.
(2) 通常服从正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]之间的值.
5. μ与σ2的含义
μ就是随机变量的均值,σ2就是随机变量的方差.
6. 标准正态分布
当μ=0,σ=1时,将正态分布N(0,1)称为标准正态分布.
活动三 正态分布的应用
例1 在某次高三教学质量检测中,甲、乙、丙三科考试成绩的统计图如图所示(由于人数众多,成绩分布的统计图可视为正态分布),则由如图曲线可得下列说法中正确的是( )
A. 甲科总体的标准差最小
B. 丙科总体的平均数最小
C. 乙科总体的标准差及平均数都居中
D. 甲、乙、丙的总体的平均数不相同
例2 李明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1) 估计X,Y的分布中的参数;
(2) 根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3) 如果某天有38 min可用,李明应选择哪种交通工具?如果某天只有34 min可用,又应该选择哪种交通工具?请说明理由.
解答正态分布的实际应用题,其关键是如何转化,同时应熟练掌握正态分布在[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率,在此过程中用到归纳思想和数形结合思想.
1. (2024眉山期末)某种生态鱼在某个池塘一年的生长量X(单位:g)服从正态分布N(300,25),则P(285
参考数据:①P(μ-σA. 0.818 6 B. 0.84 C. 0.878 5 D. 0.975 9
2. (2024浙江期中)某医院对该院历年来新生儿体重情况进行统计,发现新生儿体重X服从正态分布N(3.5,σ2),若P(X>t)=0.3,则P(X>7-t)的值为( )
A. 0.2 B. 0.7 C. 0.8 D. 0.9
3. (多选)已知在数学测验中,某校学生的成绩服从正态分布N(110,81),其中90分为及格线,则下列结论中正确的有(附:随机变量ξ服从正态分布N(μ,σ2),则P(μ-2σ≤ξ≤μ+2σ)≈0.954 5)( )
A. 该校学生成绩的期望为110 B. 该校学生成绩的标准差为9
C. 该校学生成绩的标准差为81 D. 该校学生成绩及格率超过95%
4. 已知随机变量X服从正态分布N(a,4),且P(X≤1)=0.5,则实数a的值为________.
5. (2024湖北模拟预测)面试是求职者进入职场的一个重要关口,也是机构招聘员工的重要环节.某科技企业招聘员工,首先要进行笔试,笔试达标者才能进入面试.面试环节要求应聘者回答3个问题,第一题考查对公司的了解,答对得1分,答错不得分;第二题和第三题均考查专业知识,每道题答对得2分,答错不得分.
(1) 根据近几年的数据统计,应聘者的笔试得分X服从正态分布N(60,100),要求满足X≥70为达标,现有1 000人参加应聘,求进入面试环节的人数(结果四舍五入保留整数);
(2) 某进入面试的应聘者第一题答对的概率为,后两题答对的概率均为,每道题是否答对互不影响,求该应聘者的面试成绩Y的分布列与数学期望.
附:若X~N(μ,σ2)(σ>0),则P(μ-σ7.5 正 态 分 布
【活动方案】
思考1:可用频率分布直方图描述这组误差数据的分布.
思考2:接近一条光滑的钟形曲线.
例1 A 由图象可知三科总体的平均数(均值)相等,由正态密度曲线的性质可知σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡,故三科总体的标准差从小到大依次为甲、乙、丙.
例2 (1) 随机变量X的样本均值为30,样本标准差为6;随机变量Y的样本均值为34,样本标准差为2.用样本均值估计参数μ,用样本标准差估计参数σ,可以得到X~N(30,62),Y~N(34,22).
(2) X和Y的分布密度曲线如图所示.
(3) 应选择在给定时间内不迟到的概率大的交通工具.由上图可知,P(X≤38)P(Y≤34),所以如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
【检测反馈】
1. B 因为μ=300,σ=5,所以P(2952. B 因为X~N(3.5,σ2),所以正态曲线关于直线X=3.5对称,且=3.5,所以P(X>t)=P(X<7-t)=0.3,所以P(X>7-t)=1-P(X<7-t)=1-0.3=0.7.
3. ABD 因为该校学生的成绩服从正态分布N(110,81),则μ=110,方差为σ2=81,标准差为σ=9,故A,B正确,C错误;因为μ-2σ=110-2×9=92,P(ξ≥90)>P(ξ≥92)=P(ξ≥μ-2σ)=+P(μ-2σ≤ξ≤μ+2σ)≈+×0.954 5=0.977 25>0.95,所以该校学生成绩及格率超过95%,故D正确.故选ABD.
4. 1 因为X服从正态分布N(a,4),所以正态曲线关于直线x=a对称.又P(X≤1)=0.5,所以a=1.
5. (1) 因为X服从正态分布N(60,100),
所以μ=60,σ=10.
因为70=μ+σ,所以P(X≥70)≈=0.158 5,
所以1 000×0.158 5=158.5≈159(人).
故进入面试环节的人数约为159.
(2) 由题意,得Y的可能取值为0,1,2,3,4,5,
则P(Y=0)=×=;
P(Y=1)=×=;
P(Y=2)=×C××=;
P(Y=3)=×C××=;
P(Y=4)=×=;
P(Y=5)=×=.
所以Y的分布列为
Y 0 1 2 3 4 5
P
所以E(Y)=0×+1×+2×+3×+4×+5×==.