8.3 正 态 分 布
1. 通过误差模型,了解服从正态分布的随机变量.
2. 通过具体实例,借助频率直方图了解正态分布的特征.
3. 了解正态分布的“3σ”原则.
活动一 背景引入
前面讨论的二项分布、超几何分布是刻画离散型随机变量分布的数学模型,在实际应用中,还有许多随机变量可以取某一区间中的一切值.这类随机变量就是连续型随机变量.例如,在必修“统计”一章中给出的金属棒长度的样本数据如下:
6.02 6.01 6.04 5.94 5.97 5.96
5.98 6.01 5.98 6.02 6.00 6.03
6.07 5.97 6.01 6.00 6.03 5.95
6.00 6.00 6.05 5.93 6.02 5.99
6.00 5.95 6.00 5.97 5.96 5.97
6.03 6.01 6.00 5.99 6.04 6.00
6.02 5.99 6.03 5.98
你能确定测量一次,其测量的结果在区间(5.97,6.03)上的概率吗?
要解决这样的问题,就要了解随机试验所得数据的分布规律.为此,将这组数据以0.02为组距进行分组,可得频率直方图.
思考1
以上频率直方图有什么特征?如果数据无限增多且组距无限缩小,那么频率直方图的折线有什么特征?
活动二 了解正态密度曲线和正态分布的概念
思考2
函数f(x)=,x∈R的图象如图所示.试确定函数f(x)的解析式.
1. 正态密度曲线
(1) 正态密度曲线的定义:
函数P(x)=,x∈R,其中实数μ,σ(σ>0)为参数,我们称P(x)的图象为正态密度曲线.
(2) 正态密度曲线图象有如下特征:
①曲线位于x轴上方,以x轴为渐近线;
②当x<μ时,曲线上升;当x>μ时,曲线下降;它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的区域面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图1所示;
⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越扁平,总体的分布越分散;σ越小,曲线越尖陡,总体的分布越集中,如图2所示.
图1 图2
2. 正态分布
设X是一个随机变量,若对任给区间(a,b],P(a3. 3σ原则
(1) ①P(μ-σ②P(μ-2σ③P(μ-3σ(2) 通常服从正态分布N(μ,σ2)的随机变量X只取(μ-3σ,μ+3σ)之间的值.
4. μ与σ2的含义
μ就是随机变量X的均值,σ2就是随机变量X的方差.
5. 标准正态分布
将正态分布N(0,1)称为标准正态分布.
活动三 正态分布的应用
例1 某次高三教学质量检测中,甲、乙、丙三科考试成绩的直方图如图所示(由于人数众多,成绩分布的直方图可视为正态分布),则下列说法中正确的是( )
A. 甲科总体的标准差最小
B. 丙科总体的平均数最小
C. 乙科总体的标准差及平均数都居中
D. 甲、乙、丙的总体的平均数不相同
例2 已知随机变量Z~N(0,1),查标准正态分布表,求:
(1) P(Z≤1.52); (2) P(Z>1.52);
(3) P(0.57<Z≤2.3); (4) P(Z≤-1.49).
例3 某批待出口的水果罐头,每罐净重X(单位:g)服从正态分布N(184,2.52),求:
(1) 随机抽取1罐,其净重超过184.5 g的概率;
(2) 随机抽取1罐,其净重在179 g与189 g之间的概率.
当X~N(μ,σ2)(μ≠0或σ2≠1)时,Z=服从标准正态分布.
有一种精密零件,其尺寸X(单位:mm)服从正态分布N(20,4).若这批零件共有5 000个,试求:
(1) 这批零件中尺寸在18~22 mm间的零件所占的百分比;
(2) 若规定尺寸在24~26 mm间的零件不合格,则这批零件中不合格的零件大约有多少个?
解答正态分布的实际应用题,其关键是如何转化,同时应熟练掌握正态分布在(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)三个区间内的概率,在此过程中用到归纳思想和数形结合思想.
1. (2024大连月考)对甲、乙两地小学生假期一天中的读书情况进行统计,已知小学生的读书时间均符合正态分布,其中甲地小学生读书的时间为X(单位:h),X~N(2,4),对应的曲线为C1,乙地小学生读书的时间为Y(单位:h),Y~N(3,),对应的曲线为C2,则下列图象中正确的是( )
A B C D
2. (2024烟台月考)随机变量X服从正态分布X~N(2,σ2).若P(2≤X<4)=0.3,则P(X<0)等于( )
A. 0.2 B. 0.3 C. 0.4 D. 0.6
3. (多选)4月23日为世界读书日,已知某高校学生每周阅读时间X服从正态分布N(9,4),则下列结论中正确的是(附:X~N(μ,σ2),P(μ-σA. 该校学生每周平均阅读时间为9 h
B. 该校学生每周阅读时间的标准差为4
C. 该校学生每周阅读时间不超过3 h的人数约占0.15%
D. 若该校有10 000名学生,则每周阅读时间在3~5 h的人数约为215
4. (2024济南一模)已知随机变量X~N(1,22),则D(2X+1)的值为________.
5. (2024江苏月考)法国数学家庞加莱是个喜欢吃面包的人,他每天都会到同一家面包店购买一个面包.该面包店的面包师声称自己所出售的面包的平均质量是1 000 g,上下浮动不超过50 g.这句话用数学语言来表达就是:每个面包的质量服从期望为1 000 g,标准差为50 g的正态分布.已知如下结论:若X~N(μ,σ2),从X的取值中随机抽取k(k∈N*,k≥2)个数据,记这k个数据的平均值为Y,则随机变量Y~N(μ,).利用该结论解决下面问题.
(1) 假设面包师的说法是真实的,随机购买25个面包,记随机购买25个面包的平均值为Y,求P(Y≤980);
(2) 庞加莱每天都会将买来的面包称重并记录,25天后,得到的数据都落在区间(950,1 050)内,并计算25个面包的平均质量为978.72 g.庞加莱通过分析举报了该面包师,从概率角度说明庞加莱举报该面包师的理由.
附:①若随机变量η服从正态分布N(μ,σ2),则P(μ-σ≤η≤μ+σ)≈0.682 7,P(μ-2σ≤η≤μ+2σ)≈0.954 5,P(μ-3σ≤η≤μ+3σ)≈0.997 3;②通常把发生概率小于0.05的事件称为小概率事件,小概率事件基本不会发生.
8.3 正 态 分 布
【活动方案】
思考1:这个直方图大体呈中间高、两边低、左右大致对称的特点.如果增加更多的测量数据,那么这种趋势会更加明显.可以设想,如果数据无限增多且组距无限缩小,那么频率直方图上的折线将趋于一条光滑的曲线,我们将此曲线称为概率密度曲线.
思考2:由图可知,该曲线关于直线x=72对称,最大值为.
由函数表达式可知,函数图象的对称轴为直线 x=μ,
所以μ=72,所以=,解得σ=10,
所以f(x)=(x∈R).
例1 A 由图可知三科总体的平均数相等,故B,C,D错误;由正态密度曲线的性质,可知σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡,故三科总体的标准差从小到大依次为甲、乙、丙,故A正确.
例2 (1) P(Z≤1.52)=0.935 7(图1).
(2) P(Z>1.52)=1-P(Z≤1.52)=1-0.935 7=0.064 3(图1).
(3) P(0.57<Z≤2.3)=P(Z≤2.3)-P(Z≤0.57)=0.989 3-0.715 7=0.273 6(图2).
(4) P(Z≤-1.49)=P(Z≥1.49)=1-P(Z≤1.49)=1-0.931 9=0.068 1(图3).
图1 图2 图3
例3 (1) P(X>184.5)=P(>)=P(Z>0.2)=1-P(Z≤0.2)=1-0.579 3=0.420 7,
故随机抽1罐,其净重超过184.5 g的概率是 0.420 7.
(2) P(179<X≤189)
=P(<≤)
=P(-2<Z≤2)=P(Z≤2)-P(Z≤-2)
=P(Z≤2)-P(Z≥2)
=P(Z≤2)-[1-P(Z≤2)]
=2P(Z≤2)-1
=2×0.977 2-1
=0.954 4,
故随机抽取1罐,其净重在179 g与189 g之间的概率为0.954 4.
跟踪训练 (1) 因为X~N(20,4),
所以μ=20,σ=2,
所以μ-σ=18,μ+σ=22,
所以尺寸在18~22 mm间的零件所占的百分比约是68.3%.
(2) 因为μ-3σ=14,μ+3σ=26,μ-2σ=16,μ+2σ=24,所以尺寸在14~26 mm之间的零件所占的百分比约是99.7%,尺寸在16~24 mm之间的零件所占的百分比约是95.4%,
所以尺寸在24~26 mm间的零件所占的百分比约是=2.15%,
所以尺寸在24~26 mm间的零件大约有5 000×2.15%≈108(个).
【检测反馈】
1. C 因为X~N(2,4),Y~N(3,),所以曲线C2的对称轴为x=3,C1的对称轴为x=2,又4>,所以C2的形状偏瘦一些.排除A,B,D.故选C.
2. A 由随机变量X服从正态分布X~N(2,σ2),得μ=2.又P(2≤X<4)=0.3,则P(X<0)=P(X>4)=0.5-P(2≤X<4)=0.5-0.3=0.2.
3. ACD 对于A,因为E(X)=9,所以该校学生每周平均阅读时间为9 h,故A正确;对于B,因为D(X)=4,所以该校学生每周阅读时间的标准差为2,故B错误;对于C,因为P(74. 16 由X~N(1,22),得D(X)=22=4,则D(2X+1)=4D(X)=16.
5. (1) 因为=100,所以Y~N(1 000,102).
又因为P(μ-2σ≤η≤μ+2σ)≈0.954 5,
所以P(η≤μ-2σ)≈=0.022 75.
因为980=1 000-2×10,
所以P(Y≤980)=P(η≤μ-2σ)=0.022 75.
(2) 由(1)知,P(Y≤980)=P(η≤μ-2σ)=0.022 75.
又这25个面包的平均质量为978.72 g,
因为978.72<980,而0.022 75<0.05,为小概率事件,小概率事件基本不会发生,这就是庞加莱举报该面包师的理由.