(共44张PPT)
7.5 正态分布
第七章
2022
内容索引
01
02
03
自主预习 新知导学
合作探究 释疑解惑
随堂练习
课标定位素养阐释
1.了解正态曲线和正态分布的意义.
2.理解正态曲线的性质.
3.明确正态分布中参数μ,σ的意义及其对正态曲线形状的影响.
4.了解3σ原则,会用正态分布解决实际问题.
5.培养数学建模的核心素养以及利用数形结合思想思考问题的能力.
自主预习 新知导学
正态分布
【问题思考】
(3)由服从正态分布的随机变量X的密度函数及图象可以发现,正态曲线还有以下特点:
③当|x|无限增大时,正态曲线无限接近x轴.
(4)参数μ,σ对正态曲线形状的影响
①在参数σ取固定值时,正态曲线的位置由μ确定,且随着μ的变化而沿 x轴平移.
②当μ取定值时,因为正态曲线的峰值 与σ成反比,而且对任意的σ>0,正态曲线与x轴之间的区域的面积总为1.因此,当σ较小时,峰值高,正态曲线“ 瘦高 ”,表示随机变量X的分布比较集中;当σ较大时,峰值低,正态曲线
“ 矮胖 ”,表示随机变量X的分布比较分散.
参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
(5)若X~N(μ,σ2),则E(X)= μ ,D(X)= σ2 .
(6)假设X~N(μ,σ2),可以证明:对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.特别地,
P(μ-σ≤X≤μ+σ)≈ 0.682 7 ,
P(μ-2σ≤X≤μ+2σ)≈ 0.954 5 ,
P(μ-3σ≤X≤μ+3σ)≈ 0.997 3 .
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取区间
[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
3.做一做:(1)已知X~N(0,1),则X在区间(-∞,-2)内取值的概率约为( )
A.0.954 B.0.046 C.0.977 D.0.023
(2)已知随机变量ξ服从正态分布N(4,σ2),若P(ξ>8)=0.4,则P(ξ<0)= .
解析:(1)因为X~N(0,1),所以X在区间(-∞,-2)和(2,+∞)内取值的概率相等.又知X在区间[-2,2]内取值的概率约为0.954 5,所以X在区间(-∞,-2)内取值的概率
(2)因为随机变量ξ服从正态分布N(4,σ2),μ=4,且P(ξ>8)=0.4,所以P(ξ<0)=P(ξ>8)=0.4.
答案:(1)D (2)0.4
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)正态密度函数解析式中参数μ,σ的意义分别是样本的均值与方差.( × )
(2)服从正态分布的随机变量是连续型随机变量.( √ )
(3)正态曲线是一条钟形曲线.( √ )
(4)正态曲线关于y轴对称.( × )
合作探究 释疑解惑
探究一
正态曲线及性质
【例1】 (1)一个正态曲线图象如图所示,则随机变量X的样本均值μ= ,样本方差σ2= .
(2)某正态密度函数是偶函数,而且该函数的最大值为 ,则随机变量X落在区间(0,2)内的概率为 .
答案:(1)20 2 (2)0.477 25
利用正态曲线的性质求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象求μ.
(2)正态曲线在x=μ处达到峰值 ,由此性质结合图象求σ.
探究二
利用正态分布的性质求概率
【例2】 (1)已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(-2<ξ<2)=( )
A.0.477 B.0.625 C.0.954 D.0.977
(2)随机变量ξ服从正态分布N(1,4),若P(2<ξ<3)=a,
则P(ξ<-1)+P(1<ξ<2)=( )
解析:(1)因为随机变量ξ服从正态分布N(0,σ2),
所以正态曲线关于直线x=0对称.
又因为P(ξ>2)=0.023,所以P(ξ<-2)=0.023.
所以P(-2<ξ<2)=1-P(ξ>2)-P(ξ<-2)=1-2×0.023=0.954.
(2)因为随机变量ξ服从正态分布N(1,4),所以正态曲线关于直线x=1对称,
答案:(1)C (2)B
1.把例2(1)改为:随机变量ξ服从正态分布N(1,σ2),P(ξ<4)=0.84,
则P(ξ<-2)= .
解析:因为随机变量ξ服从正态分布N(1,σ2),所以μ=1,即正态曲线关于直线x=1对称.
所以P(ξ<-2)=P(ξ>4)=1-P(ξ<4)=0.16.
答案:0.16
2.把例2(1)改为:随机变量ξ~N(0,1),若P(ξ>1)=p,则P(-1<ξ<0)= .
解析:因为随机变量ξ~N(0,1),
所以正态曲线关于直线x=0对称.
又因为P(ξ>1)=p,所以P(ξ<-1)=p,
正态分布的随机变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与x轴之间的区域的面积为1.
(2)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)的值.
(3)注意概率值的求解转化:
①P(X
②P(X≤μ-a)=P(X≥μ+a);
【变式训练2】 (1)已知随机变量X~N(2,σ2),若P(x则P(a≤X<4-a)= .
解析:由正态分布图象的对称性可得P(a≤X<4-a)=1-2P(X答案:0.36
(2)若X~N(1,22),求:
①P(-1≤X≤3);
②P(3≤X≤5).
解:因为X~N(1,22),所以μ=1,σ=2.
①P(-1≤X≤3)=P(1-2≤X≤1+2)=P(μ-σ≤X≤μ+σ)≈0.682 7.
②因为P(3≤X≤5)=P(-3≤X<-1),
探究三
正态分布的实际应用
【例3】 在某次数学考试中,考生的成绩ξ服从正态分布N(90,100).
(1)求考试成绩ξ落在区间(70,110)内的概率;
(2)若这次考试共有2 000名考生参加,试估计考试成绩落在区间(80,100)内的考生人数.
解:因为ξ~N(90,100),所以μ=90,σ=10.
(1)由μ=90,σ=10,得μ-2σ=90-2×10=70,μ+2σ=90+2×10=110.
由于正态变量在区间(μ-2σ,μ+2σ)内取值的概率约是0.954 5,故考试成绩ξ落在区间(70,110)内的概率约是0.954 5.
(2)由μ=90,σ=10,得μ-σ=80,μ+σ=100.由于正态变量在区间(μ-σ,μ+σ)内取值的概率约是0.682 7,故考试成绩ξ落在区间(80,100)内的概率约是0.682 7.这次考试共有2 000名考生,则估计考试成绩落在区间(80,100)内的考生有2 000×0.682 7≈1 365(人).
正态曲线的应用及求解策略
解答此类题目的关键在于首先将待求问题的正态变量的取值范围向(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)这三个区间进行转化,然后利用上述区间的概率求出相应的概率,在此过程中依然会用到化归思想及数形结合思想.
【变式训练3】 某年级的一次信息技术测验成绩近似服从正态分布N(70,102),如果规定低于60分为不及格,求:
(1)成绩不及格的学生人数占总人数的比例;
(2)成绩在80~90分的学生人数占总人数的比例.
数学建模
正态分布与统计知识的综合应用
【典例】 某市对在今年1月份的高三期末考试中的数学成绩数据统计显示,全市10 000名学生的成绩近似服从正态分布N(120,52),现某校随机抽取了50名学生的数学成绩分析,结果这50名学生的成绩全部介于85分到145分之间,现将结果按如下方式分为6组:第一组[85,95),第二组[95,105),…,第六组[135,145],得到的频率分布直方图,如图所示.
(1)试由样本频率分布直方图估计该校学生数学成绩的平均分数(同一组数据用该组区间的中点值作代表);
(2)若从这50名学生中成绩在125分(含125分)以上的随机抽取3人,这3人在全市前13名的人数记为X,求X的分布列和数学期望.
附:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解:(1)由频率分布直方图可知数学成绩落在区间[125,135)内的频率为
1-(0.01×10+0.024×10+0.03×10+0.016×10+0.008×10)=0.12,
所以估计该校全体学生的数学成绩的平均分数为90×0.1+100×0.24+110×0.3+120×0.16+130×0.12+140×0.08=112.
即全市前13名的数学成绩全部在135分以上.
根据频率分布直方图可知这50人中成绩在135分以上(包括135分)的有50×0.08=4人,而在125分以上(包括125分)的有50×(0.12+0.08)=10人.
所以X的可能取值为0,1,2,3,且X服从超几何分布,其中N=10,M=4,n=3.
所以X的分布列为
求解此类问题的关键是先对题设信息适当分析,再借助正态分布曲线的对称性解题.求解时,为增加解题的直观性,可画草图辅助求解.
【变式训练】 全民健身倡导全民做到每天参加一次以上的体育健身活动,旨在全面提高国民体质和健康水平.某市的体育部门对某小区的4 000人进行了“运动参与度”统计评分,得到的频率分布直方图如图所示.
(1)求这4 000人的“运动参与度”的平均得分 (同一组数据用该组区间的中点值作代表);
(2)由频率分布直方图可认为这4 000人的“运动参与度”的得分z服从正态分布N(μ,σ2),其中μ,σ2分别取平均得分 和方差s2,那么这4 000人中“运动参与度”得分超过84.81分的估计有多少人
解:(1)由题意知
中点 45 55 65 75 85 95
频率 0.1 0.15 0.2 0.3 0.15 0.1
(2)由题意知,z~N(μ,σ2),其中μ= =70.5,σ2=s2=204.75,σ≈14.31,所以z~N(70.5,14.312).
而P(μ-σ≤z≤μ+σ)=P(56.19≤z≤84.81)≈0.682 7,故
因此这4 000人中“运动参与度”得分超过84.81分的估计有
0.158 65×4 000=634.6≈635(人).
(3)全市所有人的“运动参与度”得分不超过84.81分的概率为
1-0.158 65=0.841 35.
由题意知,ξ~B(4,0.841 35),
所以P(ξ≤3)=1-P(ξ=4)=1- C 4 4 ×0.841 354≈1-0.501=0.499.
随堂练习
1.已知随机变量ξ服从正态分布N(3,σ2),则P(ξ<3)等于( )
答案:D
2.已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)≈0.682 7,则P(X>4)≈( )
A.0.158 8 B.0.158 7
C.0.158 6 D.0.158 5
解析:因为X~N(3,1),
答案:B
A.95.45% B.99.73%
C.4.56% D.0.27%
答案:B
4.若随机变量ξ~N(10,σ2),P(9≤ξ≤11)=0.4,则P(ξ>11)= .
解析:由题意知,正态曲线以x=μ=10为对称轴.
因为P(9≤ξ≤11)=0.4,所以P(ξ>11)= [1-P(9≤ξ≤11)]=0.3.
答案:0.3
5.设在一次数学考试中,某班学生的分数X~N(110,202),且试卷满分是150分,这个班的学生共54人,求这个班的学生在这次数学考试中及格(即90分以上)的人数和130分以上的人数.
解:由X~N(110,202),知μ=110,σ=20,
从而P(110-20≤X≤110+20)≈0.682 7.
所以P(X>130)≈ (1-0.682 7)≈0.158 7,
P(X>90)≈0.682 7+0.158 7=0.841 4.
故及格的人数为54×0.841 4≈45(人),
130分以上的人数为54×0.158 7≈9(人).
本 课 结 束7.5 正态分布
A组
1.设随机变量X服从正态分布,且正态密度函数为f(x)=,则( )
A.μ=2,σ=3 B.μ=3,σ=2
C.μ=2,σ= D.μ=3,σ=
解析:由f(x)=,得μ=2,σ=.
答案:C
2.若随机变量X的密度函数为f(x)=,X在区间(-2,-1)和(1,2)内取值的概率分别为p1,p2,则p1,p2的关系为( )
A.p1>p2 B.p1C.p1=p2 D.不确定
解析:由正态密度函数的解析式知,μ=0,σ=1,所以正态曲线关于直线x=0对称.所以p1=p2.
答案:C
3.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)=( )
A.0.6 B.0.4
C.0.3 D.0.2
解析:由P(ξ<4)=0.8,知P(ξ≥4)=P(ξ≤0)=0.2,故P(0<ξ<2)=×(1-0.2×2)=0.3.
答案:C
4.已知X~N(0,σ2),且P(-2≤X≤0)=0.4,则P(X>2)等于( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:因为P(X>2)+P(0≤X≤2)+P(-2≤X≤0)+P(X<-2)=1,P(X>2)=P(X<-2),
P(0≤X≤2)=P(-2≤X≤0),
所以P(X>2)=[1-2P(-2≤X≤0)]=0.1.
答案:A
5.工人加工机器零件的尺寸在正常情况下服从正态分布N(μ,σ2).在一次正常的测验中,随机取出10 000个零件,不属于[μ-3σ,μ+3σ]这个尺寸范围的零件个数可能为( )
A.70 B.100
C.27 D.60
解析:正态变量的取值落在区间[μ-3σ,μ+3σ]内的概率约是0.997 3,则不落在区间[μ-3σ,μ+3σ]内的概率约是0.002 7.因此随机取出10 000个零件,不属于这个尺寸范围的零件个数可能是27.
答案:C
6.为了解某地区高三男生的身体发育状况,抽查了该地区1 000名年龄在17.5岁至19岁的高三男生的体重(单位:kg)数据,抽查结果表明他们的体重X服从正态分布N(μ,22),且正态密度曲线如图所示.若体重大于58.5 kg小于等于62.5 kg属于正常情况,则这1 000名男生中体重属于正常情况的人数是( )
A.997 B.954
C.819 D.683
解析:由题意及题图可知μ=60.5,σ=2,故P(58.5答案:D
7.已知一次考试共有60名考生参加,考生的成绩X~N(110,25).据此估计,大约应有57名考生的分数在区间 ( )
A.(90,110]内 B.(95,125]内
C.(100,120]内 D.(105,115]内
解析:=0.95,故可得大约应有57人的分数在区间(μ-2σ,μ+2σ]内,即在区间(110-2×5,110+2×5]内.
答案:C
8.(多选题)下列说法中正确的是( )
A.设随机变量X服从二项分布B,则P(X=3)=
B.已知随机变量X服从正态分布N(2,σ2),且P(X<4)=0.9,则P(0C.已知随机变量X~N(0,σ2),若P(|X|<2)=a,则P(X>2)的值为
D.E(2X+3)=2E(X)+3;D(2X+3)=2D(X)+3
解析:设随机变量X服从二项分布B,则P(X=3)=,故A正确;
∵随机变量X服从正态分布N(2,σ2),
∴正态曲线的对称轴是x=2.
∵P(X<4)=0.9,
∴P(X≥4)=P(X≤0)=0.1,
∴P(2已知随机变量X~N(0,σ2),若P(|X|<2)=a,
则P(X>2)=(1-P(|X|<2))=,故C错误;
E(2X+3)=2E(X)+3;D(2X+3)=4D(X),
故D错误.
综上,选AB.
答案:AB
9.如果正态变量的取值落在区间(-3,-1)内的概率和落在区间(3,5)内的概率相等,那么正态变量的数学期望为 .
解析:由题意知,正态曲线关于直线x=1对称,即μ=1,
所以正态变量的数学期望为1.
答案:1
10.据抽样统计,在某市的公务员考试中,考生的综合得分X服从正态分布N(60,102),考生共10 000人,若一考生的综合得分为80分,则该考生在这次公务员考试中的名次大约是第 名.
解析:依题意,P(60-20≤X≤60+20)≈0.954 5,
则P(X>80)≈(1-0.954 5)≈0.022 8.
故成绩高于80分的考生人数约为10 000×0.022 8=228(人).
所以该考生在这次公务员考试中的名次大约是第229名.
答案:229
11.在一次测试中,测试结果X服从正态分布N(2,σ2),若X在区间(0,2)内取值的概率为0.2,求:
(1)X在区间(0,4)内取值的概率;
(2)P(X>4).
解:(1)由X~N(2,σ2),知对称轴x=2,作出正态曲线大致如图所示.
因为P(0所以P(0(2)P(X>4)=[1-P(012.已知公司职工年均收入X服从正态分布,其正态密度曲线如图所示.
(1)写出该公司职工年均收入的正态密度函数的解析式;
(2)求该公司职工年均收入在80 000~85 000元之间的人数所占的百分比.
解:设该公司职工年均收入X~N(μ,σ2),
由题图可知μ=80 000,σ=5 000.
(1)该公司职工年均收入的正态密度函数解析式为
f(x)=.
(2)因为P(75 000≤X≤85 000)=P(80 000-5 000≤X≤80 000+5 000)≈0.682 7,
所以P(80 000≤X≤85 000)=P(75 000≤X≤85 000)≈0.341 4.
即该公司职工年均收入在80 000~85 000元之间的人数所占的百分比约为34.14%.
B组
1.设某地区某一年龄段的儿童的身高服从均值为135 cm,方差为100的正态分布,令ξ表示从中随机抽取的一名儿童的身高,则下列概率中最大的是( )
A.P(120<ξ<130)
B.P(125<ξ<135)
C.P(130<ξ<140)
D.P(135<ξ<145)
解析:由题意知ξ~N(135,100),因此在长度都是10的区间上,概率最大的应该是在对称轴两侧关于对称轴对称的区间.故选C.
答案:C
2.已知随机变量X服从正态分布N(0,1),若P(X≤-1.96)=0.025,则P(|X|<1.96)等于( )
A.0.025 B.0.050
C.0.950 D.0.975
解析:由随机变量X服从正态分布N(0,1),
知P(X≥1.96)=P(X≤-1.96)=0.025.
所以P(|X|<1.96)=P(-1.96答案:C
3.已知某批零件的长度公差(单位:mm)服从正态分布N(0,42),从中随机取出一件,则其长度公差落在区间[4,8]内的概率为( )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈0.954 5.)
A.4.56% B.13.59%
C.27.18% D.31.74%
解析:由题意知正态曲线关于直线x=0对称,且P(-4≤X≤4)≈0.682 7,P(-8≤X≤8)≈0.954 5,故P(4≤X≤8)≈(0.954 5-0.682 7)=0.135 9.故选B.
答案:B
4.已知随机变量X服从正态分布N(100,4),若P(m≤X≤104)=0.135 9,则m等于( )
(附:P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)=0.954 5.)
A.100 B.101
C.102 D.103
解析:∵随机变量X服从正态分布N(100,4),
∴P(98≤X≤102)≈0.682 7,P(96≤X≤104)≈0.954 5.
∴P(102≤X≤104)=(0.954 5-0.682 7)=0.135 9.
又P(m≤X≤104)=0.135 9,∴m=102.
答案:C
5.在某市高二下学期期中考试中,理科学生的数学成绩X~N(90,σ2),已知P(70A.0.85 B.0.70
C.0.50 D.0.15
解析:∵X~N(90,σ2),
∴μ=90.
又P(70∴P(90≤X<110)=0.35.
∴P(X≥110)=(1-0.70)=0.15,
从而P(X<110)=1-0.15=0.85.
∴他的数学成绩小于110分的概率为0.85.
答案:A
6.若一批灯泡的使用时间X(单位:h)服从正态分布N(10 000,4002),则这批灯泡的使用时间在区间[9 200,10 800]内的概率约是 .
解析:由已知得μ=10 000,σ=400,
所以P(9 200≤X≤10 800)=P(10 000-2×400≤X≤10 000+2×400)≈0.954 5.
答案:0.954 5
7.某校的一次数学考试有600人参加,已知学生的考试成绩X~N(100,a2),试卷满分150分,统计结果显示考试成绩在80分到120分之间的人数约为总人数的,则此次数学考试中成绩不低于120分的学生约有 人.
解析:因为成绩X~N(100,a2),所以其正态曲线关于直线x=100对称.
又考试成绩在80分到120分之间的人数约为总人数的,所以考试成绩在120分以上的人数约为总人数的.
所以此次数学考试中成绩不低于120分的学生约有×600=120(人).
答案:120
8.某品牌摄像头的使用寿命ξ(单位:年)服从正态分布,且使用寿命不少于2年的概率为0.8,使用寿命不少于6年的概率为0.2.某校在大门口同时安装了两个该品牌的摄像头,则在4年内这两个摄像头都能正常工作的概率为 .
解析:∵P(ξ≥2)=0.8,P(ξ≥6)=0.2,
∴P(ξ<2)=P(ξ≥6)=0.2.
∴正态曲线的对称轴为直线x=4.
∴P(ξ≥4)=,
即每个摄像头在4年内能正常工作的概率为.
∴两个该品牌的摄像头在4年内都能正常工作的概率约为.
答案:
9.一投资者要在两个投资方案中选择一个,这两个方案的利润ξ1,ξ2(单位:万元)分别服从正态分布N(8,32)和N(3,22),投资者要求“利润超过5万元”的概率尽量大,那么他应选择哪个方案
解:由题意知,只需求出两个方案中“利润超过5万元”的概率较大者即为应选择的方案.对于第一个方案ξ1~N(8,32),则μ1=8,σ1=3.于是P(8-3≤ξ1≤8+3)=P(5≤ξ1≤11)≈0.682 7.
所以P(ξ1≤5)=[1-P(5≤ξ1≤11)]≈(1-0.682 7)=0.158 65.
所以P(ξ1>5)≈1-0.158 65=0.841 35.
对于第二个方案ξ2~N(3,22),则μ2=3,σ2=2.
于是P(3-2≤ξ2≤3+2)=P(1≤ξ2≤5)≈0.682 7,
所以P(ξ2>5)=[1-P(1≤ξ2≤5)]≈(1-0.682 7)=0.158 65.
由于P(ξ1>5)>P(ξ2>5),故应选择第一个方案.
10.已知某种零件的尺寸X(单位:mm)服从正态分布,若正态曲线在区间(0,80)内单调递增,在区间(80,+∞)内单调递减,且f(80)=.
(1)求正态密度函数的解析式;
(2)估计尺寸在72~88 mm之间的零件大约占总数的百分比.
解:(1)因为正态曲线在区间(0,80)内单调递增,在区间(80,+∞)内单调递减,所以正态曲线关于直线x=80对称,且在x=80处达到峰值.所以μ=80.
又,所以σ=8.
故正态密度函数的解析式为f(x)=.
(2)由μ=80,σ=8,得μ-σ=80-8=72,μ+σ=80+8=88.所以零件的尺寸X的取值落在区间[72,88]内的概率约为0.682 7.故尺寸在72~88 mm之间的零件大约占总数的68.27%.