(共87张PPT)
7.5 正态分布
探究点一 正态曲线及其特点
探究点二 利用正态分布求概率
探究点三 正态分布的实际应用
【学习目标】
1.利用实际问题的频率分布直方图,了解正态曲线的特征和正态曲线
所表示的意义.
2.会根据正态曲线的性质求随机变量在某一区间的概率.
知识点一 连续型随机变量与正态分布
1.连续型随机变量
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题
中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整
个实轴,但取一点的概率为0,我们称这类随机变量为____________
_____.
连续型随机变量
2.正态曲线定义
函数,,其中,为参数,称 为正
态密度函数,称它的图象为______________,简称__________.
正态密度曲线
正态曲线
3.正态分布定义
若随机变量的概率分布密度函数为,则称随机变量 服从正态
分布,记为.特别地,当,时,称随机变量
服从______________.
标准正态分布
4.正态分布的图形表示
若,则如图所示, 取值不
超过的概率 为图中区域___的
面积,而_____________为区域 的面积.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)正态曲线可以关于 轴对称.( )
√
(2)正态分布是由它的均值 和标准差 唯一决定的. ( )
√
(3)服从正态分布的随机变量是连续型随机变量.( )
√
知识点二 正态分布的特点
1.正态密度函数,,, 的图象有
以下特点:
(1)曲线位于轴______,与 轴不相交;
(2)曲线是单峰的,它关于直线______对称;
(3)曲线在______处达到峰值 ;
(4)曲线与 轴之间的区域的面积总为___;
上方
1
(5)当 一定时,曲线的位置由 确定,曲线随着 的变化而沿
_____平移(如图①);
轴
①
②
(6)当 一定时,曲线的形状由 确定,
越小,曲线越“瘦高”,表示随机变量的分布越
______, 越大,曲线越“矮胖”,表示随机变
量的分布越______(如图②).
集中
分散
2.正态分布的均值与方差
若,则___, ____.
注:参数 反映了正态分布的集中位置, 反映了随机变量的分布相对
于均值 的离散程度.
3. 原则
正态分布在三个特殊区间内取值的概率:
________,
________,
________.
上述结果可用如图表示:
通常认为服从于正态分布的随机变量 只取______________
中的值,并简称为 原则.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)正态密度函数中参数 , 的意义分别是样本的均值与方
差.( )
√
(2)正态曲线是单峰的,其与轴之间的区域的面积是随参数 ,
的变化而变化的.( )
×
[解析] 正态曲线是单峰的,其与 轴之间的区域的面积是1,不随参
数 , 的变化而变化.
(3)关于正态分布,随机变量落在区间长度为 的区间
之外是一个小概率事件.( )
×
[解析] 因为,所以
或 ,所以随机变量落在 之外是一个小概率事件.
探究点一 正态曲线及其特点
例1(1) 函数, 的图象可能为( )
A. B. C. D.
[解析] 函数图象的对称轴为直线 ,因此排除B,D;
正态曲线位于 轴上方,因此排除C.故选A.
√
(2)已知随机变量 服从正态分布,其正态曲
线如图所示,则的样本均值 ____,样本方差
___.
20
2
[解析] 从给出的正态曲线可知,该正态曲线关
于直线对称,最高点的纵坐标是 ,
所以,,解得 ,
因此样本均值,样本方差 .
变式 如图分别是甲、乙、丙三种品牌手表日走时误差分布的正态密
度曲线,则下列说法不正确的是( )
A.三种品牌的手表日走时误差的均值相等
B.三种品牌的手表日走时误差的均值从大到
小依次为甲、乙、丙
C.三种品牌的手表日走时误差的方差从小到
大依次为甲、乙、丙
D.三种品牌手表中甲品牌的质量最好
√
[解析] 由题可知,三种品牌的手表日走时误差的均值相等,三种品
牌手表日走时误差的方差从小到大依次为甲、乙、丙,三种品牌手
表中甲品牌的质量最好.故选B.
[素养小结]
利用正态曲线的特点求参数 ,
(1)正态曲线是单峰的,它关于直线 对称,由此性质结合图
象求 .
(2)正态密度函数在 处取得最大值 ,由此性质结合图象
可求 .
(3)由 的大小区分曲线的胖瘦.
探究点二 利用正态分布求概率
例2 设 ,试求:
解:因为,所以, .
.
(1) ;
(2) ;
解: 因为 ,所以
(3) .
解: .
变式(1) 已知随机变量,且 ,则
( )
A.0.6 B.0.4 C.0.3 D.0.2
[解析] 随机变量服从正态分布 ,,
又 ,
,
, .
√
(2)设随机变量,若
①求 的值;
解:由可知,的概率分布密度曲线关于直线 对称
(如图所示).
,
, .
②求 .
解:由题知, ,
则 .
[素养小结]
服从正态分布的变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与 轴之间的区域的面积为1.
(2)注意概率值的求解转化:
① ;
② ;
③若 ,则 .
(3)熟记, ,
的值.
(4)求解时,可画出概率分布密度函数的图象,结合图象解答.
探究点三 正态分布的实际应用
例3 假设某厂包装食盐的生产线在正常情况下生产出来的食盐质量
(单位:服从正态分布 ,该生产线上的检测员某天随机抽
取了两包食盐,称得其质量均大于 .
(1)求正常情况下,任意抽取一包食盐,质量大于 的概率.
解:设正常情况下,该生产线上生产出来的食盐质量为 ,由题意可
知 .
由于,所以根据正态曲线的对称性与“ 原则”可
知 .
(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停
产检测.检测员的判断是否合理?请说明理由.
解:检测员的判断是合理的.
如果生产线不出现异常,那么由(1)可知,随机抽取两包检查,
质量都大于 的概率约为 ,
几乎为零,但这样的事件竟然发生了,所以有理由认为生产线出现
了异常,检测员的判断是合理的.
变式 某冰上项目组计划招收一批 岁的青少年参加集训,共有
20 000名青少年报名参加测试,其测试成绩 (满分100分)服从正
态分布 ,成绩在90分及以上者可以进入集训队,已知成绩
在80分及以上的人数为455,请你通过以上信息,推断进入集训队的
人数约为( )
A.18 B.22 C.27 D.30
√
[解析] 由成绩在80分及以上的人数为455,可得成绩在80分及以上的
占比为 ,则成绩在40分到80分的占比为
,
又由题可得 ,所以,所以 ,
,可得
,所以 ,
则进入集训队的人数约为 .故选C.
[素养小结]
正态曲线的应用及求解方法
(1)利用转化的思想方法,把普通的待求的区间问题向
,, 这三个区间进行转
化,然后利用上述区间的概率求出相应概率.
(2)解答正态分布的实际应用题,其关键是如何转化,同时应熟练
掌握服从正态分布的随机变量的取值在 ,
, 三个区间内的概率.在此过程中用
到归纳思想和数形结合思想.
钟型的分布曲线不但形状优雅,其对应的密度函数写成数学表
达式也非常具有数学的美感.其标准化后的概率密度函数更加的简洁
漂亮,两个最重要的数学常量 和 都出现在了公式之中.它也属于
的最美丽的数学公式之一.正态分布是自然界中最常见的一种
分布,许多现象都近似地服从正态分布,如长度测量误差、正常生
产条件下各种产品的质量指标值等.
正态分布又通常被称为高斯分布,在科学领域,冠名权那是一
个很高的荣誉.早期德国的10马克的纸币上印有高斯的头像和正态密
度曲线.正态分布被冠名高斯分布,我们也容易认为是高斯发现了正
态分布,其实不然,不过高斯对于正态分布的历史地位的确立是起
到了决定性的作用.
1.正态曲线的特性:
①集中性:正态曲线的高峰位于正中央,即平均数所在的位置.
②对称性:正态曲线以平均数为中心,左右对称,曲线两端永远不
与横轴相交.
③均匀变动性:正态曲线由平均数所在处开始,分别向左右两侧逐
渐均匀下降.
2.在服从正态分布的随机变量满足的公式中, 是反映随机变量
取值的平均水平的特征数,可以用样本的均值去估计; 是衡量随
机变量 总体波动大小的特征数,可以用样本的标准差去估计.
3.正态分布的特征
(1)当 一定时,曲线的位置由 确定,曲线随着 的变化而沿
轴平移,参数 反映了正态分布的集中位置.
(2)当 一定时,曲线的形状由 确定, 越小,曲线越“瘦高”,
表示总体的分布越集中; 越大,曲线越“矮胖”,表示总体的分布
越分散. 反映了随机变量的分布相对于均值 的离散程度.
1.正态分布是自然界中常见的一种分布,在实际应用中主要包括测量
误差,考试成绩,人体的身高、体重,某农作物的产量,工厂产品
的尺寸(直径、长度、宽度、高度)等.
2.依据 原则来判断生产出现了问题: 原则是依据
.也就是说,产品数据在
之外的可能性约为 ,如果某种产品数据在
之外,这说明生产中出现了问题,应及时查找原因.
例1 某工厂生产的袋装食盐的质量(单位: 服从正态分布
.检验员根据质量将产品分为合格品和不合格品,其中
的食盐为合格品,其他为不合格品,要使不合格率小
于,则 的最大值为___.(附:若 ,则
2
[解析] 由正态分布性质可知,要使不合格率小于 ,则合格率
不低于,
由 ,得
,
由题意可知,
解得,故 的最大值为2.
例2 某工厂为检验车间一生产线工作是否正常,
现从生产线中随机抽取一批零件样本,测量它
们的尺寸(单位: 并绘成频率分布直方图,
如图所示,根据长期生产经验,可以认为这条
生产线正常状态下生产的零件尺寸服从正态分布,其中 近似
为零件样本平均数, 近似为零件样本方差 .
(1)求这批零件样本的和 的值(同一组中
的数据用该组区间的中点值作代表);
解: ,
.
(2)假设生产状态正常,求 ;
附:;若 ,则 ,
, .
解:由(1)知, ,从而
,
,
.
(3)若从生产线中任取一零件,测量其尺寸为,根据 原则
判断该生产线工作是否正常.
解: ,
, ,
,
根据 原则判断该生产线工作不正常.
3.正态分布综合问题
例3 甲企业生产线上生产的零件尺寸的误差 服从正态分布
,规定的零件为优等品, 的
零件为合格品.
(1)从该生产线上随机抽取100个零件,估计抽到合格品但非优等
品的个数(精确到整数).
附:若随机变量,则 ,
,
.
解:依题意得,, ,所以一个零件为合格品的概率为
,
一个零件为优等品的概率为
,
所以一个零件为合格品但非优等品的概率为
,
所以从该生产线上随机抽取100个零件,估计抽到合格品但非优等品
的个数为 .
(2)乙企业拟向甲企业购买这批零件,先对该批零件进行质量抽检,
检测的方案是:从这批零件中任取2个进行检测,若这2个零件都是
优等品,则通过检测;若这2个零件中恰有1个为优等品,1个为合格
品但非优等品,则再从这批零件中任取1个进行检测,若为优等品,
则通过检测;其余情况都不通过检测.求这批零件通过检测时,检测
了2个零件的概率(精确到 .
解:设从这批零件中任取2个进行检测,2个零件中有2个优等品为事
件,恰有1个优等品,1个合格品但非优等品为事件 ,从这批零件
中任取1个检测是优等品为事件,这批零件通过检测为事件 ,
则,且与互斥,所以 ,
所以这批零件通过检测时,检测了2个零件的概率为
,
故这批零件通过检测时,检测了2个零件的概率约为0.61.
练习册
一、选择题
1.已知随机变量,若 ,则
( )
A.0.025 B.0.050 C.0.950 D.0.975
[解析] 随机变量,, 相应的正态曲线关于 轴
对称,
.
√
2.甲、乙两类水果的质量(单位: )分别服
从正态分布, ,其正态密度
曲线如图所示,则下列说法错误的是( )
A.甲类水果的平均质量为
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数
√
[解析] 由题图可知,甲图象关于直线
对称,乙图象关于直线 对
称,, ,故A中说法正确,
C中说法正确;
甲图象比乙图象更“高瘦”, 甲类水果的质量比乙类水果的质量更
集中于平均值左右,故B中说法正确;
乙图象对应的函数的最大值为 ,即, ,
故D中说法错误.故选D.
3.设随机变量,若 ,则( )
A., B.,
C., D.,
[解析] 因为随机变量,且 ,所以由
对称性知,
由正态分布知方差 ,故选A.
√
4.某市为弘扬我国优秀的传统文化,组织全市10万中小学生参加网络
古诗词知识答题比赛,总分为100分,经过分析比赛成绩,发现成绩
(单位:分)服从正态分布 ,则比赛成绩大于90分的学生
人数约为( )
A.2275 B.3173 C.3415 D.455
[解析] 依题意知,,,所以 ,则
,所以比赛成绩大于90分
的学生人数约为 ,故选A.
√
5.某工厂生产的零件外直径(单位:)服从正态分布 ,
今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分
别为和 ,则可认为( )
A.上午生产情况异常,下午生产情况正常
B.上午生产情况正常,下午生产情况异常
C.上、下午生产情况均正常
D.上、下午生产情况均异常
√
[解析] 根据正态分布的性质,零件外直径落在区间
内的概率约为,所以零件外直径落在 内为正常值,
否则为异常值,
因为 ,所以上午生产情况正常,
因为 ,所以下午生产情况异常.故选B.
6.[2024·河南南阳高二期末]为了检测自动包装线生产的罐装咖啡,
检验员每天从生产线上随机抽取 罐咖啡,并测量其质量
(单位: ).由于存在各种不可控制的因素,任意抽取的1罐咖啡的
质量与标准质量之间存在一定的误差.已知这条包装线在正常状态下,
每罐咖啡的质量服从正态分布.假设生产状态正常,记 表示
每天抽取的罐咖啡中质量在之外的罐数,若 的数
学期望,则 的最小值为( )
附:若随机变量服从正态分布 ,则
.
A.10 B.11 C.12 D.13
[解析] 因为 ,
,所以 ,所以
,解得,
因为,所以 的最小值为11.故选B.
√
7.高铁是当代中国重要的一类交通基础设施,乘坐高铁已经成为人们
喜爱的一种出行方式,已知某市市郊乘车前往高铁站有①②两条路
线可走,路线①穿过市区,路程较短但交通易拥堵,所需时间
(单位:分钟)服从正态分布 ;路线②走环城公路,路程
长,但意外阻塞较少,所需时间 (单位:分钟)服从正态分布
.若住同一地方的甲、乙两人分别有70分钟与64分钟可用,
要使两人按时到达车站的可能性更大,则甲、乙选择的路线分别是
( )
A.①② B.②① C.①① D.②②
√
[解析] 对于甲,有70分钟可用,选路线①按时到达车站的概率为
,
选路线②按时到达车站的概率为
,
因为 ,
所以 ,所以甲应选路线②;
对于乙,有64分钟可用,选路线①按时到达车站的概率为
,
选路线②按时到达车站的概率为
,
因为 ,所以
,所以乙应选路线①.故选B.
8.(多选题)已知三个正态密度函数
的图象如
图所示,则下列结论正确的是( )
A. B.
C. D.
[解析] 正态密度曲线关于直线 对称,且 越大曲线越靠右
边, 越小曲线越瘦高,,.故选 .
√
√
9.(多选题)[2024·河南创新发展联盟高二期中] 已知随机变量
,随机变量,若, ,则
下列结论正确的是( )
A.
B.
C.若,则
D.若,则
√
√
[解析] 因为, ,
所以, ,故A错误,B
正确;
因为 ,所以
,所以
,故C错误;
因为,所以 ,所以
,故D正确.故选 .
二、填空题
10.已知随机变量,则 ___.
8
[解析] 因为随机变量,所以 ,所以
.
11.已知 ,如图是其分布密度曲线,则
表示图中阴影部分面积的式子可以为
___________________________(写出一个即可).
(答案不唯一)
[解析] 因为正态曲线的对称轴为轴,所以曲线在 轴左、右两侧与
轴之间的区域面积均为 ,故表示题图中阴影部分面积的式子可以
为 .
12.某校统计了高三年级全体学生利用假期参加社会实践活动的时间
(单位:小时).根据统计发现近似服从正态分布 ,且
.该校高三年级学生利用假期参加社会实践活动的
时间在 内的人数为1600,则估计该校高三年级的学生人数为
______.
2000
[解析] 因为近似服从正态分布 ,所以
,
故 ,故估计该校
高三年级的学生人数为 .
三、解答题
13.某市高二年级某次考试的物理成绩近似服从正态分布 ,
规定:分数高于80分为优秀.
(1)估计物理成绩优秀的人数占总人数的比例;
参考数据:若,则 ,
,
.
解:设学生的物理成绩为随机变量 ,
则,所以, ,
所以 ,
则 ,所以估计物理成绩优秀的
人数占总人数的比例约为 .
(2)若该市有40 000名高二年级的学生,估计全市物理成绩在
内的学生人数.
参考数据:若,则 ,
,
.
解:由题意得 ,
,
即, ,
所以
,
所以 .
又 ,
所以估计全市物理成绩在 内的学生人数为32 744.
14.李明上学有时坐公交车,有时骑自行车,他记录了100次坐公交车
和骑自行车所花的时间,经数据分析得到,坐公交车平均用时32分
钟,样本方差为36;骑自行车平均用时34分钟,样本方差为4.假设坐
公交车用时(单位:分钟)服从正态分布 ,骑自行车用时
(单位:分钟)服从正态分布,其中, 分别为样本平
均数,, 分别为样本方差.
(1)如果某天有38分钟可用,李明应选择哪种交通工具?并说明理由.
附:若随机变量服从正态分布 ,则
,
,
.
解:由题意可知,,, .
;
.
因为 ,所以坐公交车用时超过38分钟的可能性更
大,故李明应选择骑自行车.
(2)春天到来,李明选择骑自行车上学,每天都上课前38分钟从家
出发,则在100天的上学时间里不迟到的天数大约为多少天?
(四舍五入,保留整数)
解:由(1)可得 ,
设在100天的上学时间里不迟到的天数为 ,
则,
可得 ,所以不迟到的天数大约为98.
15.某校高二学生一次数学诊断的考试成绩 (单位:分)服从正态
分布,从中抽取一名同学的数学成绩,记为 ,记“
”为事件,“”为事件,则在事件 发生的条
件下,事件 发生的概率约为_____.(结果保留两位有效数字)
0.28
[解析] 由题意可知,,事件为“ ”,
因为 , ,所以
, ,
得 .
16.[2024·青岛二中高二期中] 某物流公司专营从甲地到乙地的货运业
务,现统计了最近400天内每天可配送的货物量,按照可配送货物量
(单位:箱)分成了以下几组:,,, ,
,, ,并绘制了如图所示的频率分布直方图.
(1)由频率分布直方图可以认为,该物流
公司每日的可配送货物量(单位:箱)服
从正态分布,经计算得,
.
①利用该正态分布,求 ;
附:,若 ,则
,
.
解:由题意知,其中, ,
所以 .
②利用该正态分布,估计该物流公司2000天内每日的可配送货物量
在区间 内的天数(结果保留整数).
解:估计该物流公司2000天内每日的可配送货物量在区间
内的天数为 .
(2)该物流公司负责人根据每日的可配送货物量为装卸员工制定了
两种不同的工作奖励方案.
方案一:利用该频率分布直方图获取相关概率(将图中的频率视为
概率),采用直接发放奖金的方式奖励员工,按每日的可配送货物
量划分为三级:当时,奖励60元;当 时,奖励
80元;当 时,奖励120元.
方案二:利用正态分布获取相关概率,采用抽奖的方式奖励员工,
其中每日的可配送货物量不低于 时有两次抽奖机会,每日的可配
送货物量低于 时只有一次抽奖机会,每次抽奖的奖金及对应的概
率如下表:
奖金(元) 50 100
概率
小张为该公司装卸货物的一名员工,试从员工所得奖金的数学期望
角度分析,小张选择哪种奖励方案对他更有利.
解: 对于方案一,设小张每日可获得的奖金为元,则 的可能取
值为60,80,120,其对应的概率分别为,, ,
故 .
对于方案二,易知 ,
设小张每日可获得的奖金为元,则 的所有可能取值为50,100,
150,200,且 ,
,
, ,
所以 .
因为 ,
所以从数学期望的角度看,小张选择方案二更有利.7.5 正态分布
【课前预习】
知识点一
1.连续型随机变量
2.正态密度曲线 正态曲线
3.标准正态分布
4.A P(a≤X≤b)
诊断分析
(1)√ (2)√ (3)√
知识点二
1.(1)上方 (2)x=μ (3)x=μ (4)1 (5)x轴
(6)集中 分散
2.μ σ2 3.0.682 7 0.954 5 0.997 3 [μ-3σ,μ+3σ]
诊断分析
(1)√ (2)× (3)× [解析] (2)正态曲线是单峰的,其与x轴之间的区域的面积是1,不随参数μ,σ的变化而变化.
(3)因为P(μ-3σ≤X≤μ+3σ)≈0.997 3,所以P(X>μ+3σ或X<μ-3σ)=1-P(μ-3σ≤X≤μ+3σ)≈1-0.997 3=0.002 7,所以随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件.
【课中探究】
例1 (1)A (2)20 2 [解析] (1)函数f(x)图象的对称轴为直线x=μ<0,因此排除B,D;正态曲线位于x轴上方,因此排除C.故选A.
(2)从给出的正态曲线可知,该正态曲线关于直线x=20对称,最高点的纵坐标是,所以μ=20,=,解得σ=,因此样本均值μ=20,样本方差σ2=()2=2.
变式 B [解析] 由题可知,三种品牌的手表日走时误差的均值相等,三种品牌手表日走时误差的方差从小到大依次为甲、乙、丙,三种品牌手表中甲品牌的质量最好.故选B.
例2 解:因为X~N(1,22),所以μ=1,σ=2.
(1)P(-1
(2)因为P(3(3)P(X≥5)=P(X≤-3)=[1-P(-3变式 (1)C [解析] ∵随机变量X服从正态分布N(2,σ2),∴μ=2,又P(X<4)=0.8,∴P(X≥4)=P(X≤0)=0.2,∴P(0(2)解:①由X~N(2,9)可知,X的概率分布密度曲线关于直线x=2对称(如图所示).
∵P(X>c+1)=P(X∴2-(c-1)=(c+1)-2,∴c=2.
②由题知μ=2,σ=3,
则P(-4≤X≤8)=P(2-2×3≤X≤2+2×3)≈0.954 5.
例3 解:(1)设正常情况下,该生产线上生产出来的食盐质量为X g,由题意可知X~N(500,52).
由于515=500+3×5,所以根据正态曲线的对称性与“3σ原则”可知P(X>515)=[1-P(500-3×5≤X≤500+3×5)]≈×(1-0.997 3)=0.001 35.
(2)检测员的判断是合理的.如果生产线不出现异常,那么由(1)可知,随机抽取两包检查,质量都大于515 g的概率约为0.001 35×0.001 35=1.822 5×10-6,几乎为零,但这样的事件竟然发生了,所以有理由认为生产线出现了异常,检测员的判断是合理的.
变式 C [解析] 由成绩在80分及以上的人数为455,可得成绩在80分及以上的占比为×100%,则成绩在40分到80分的占比为×100%=0.954 5×100%=95.45%,又由题可得μ=60,所以σ=10,所以P(40≤X≤80)=0.954 5,P(30≤X≤90)≈0.997 3,可得P(80≤X≤90)≈×(0.997 3-0.954 5)=0.021 4,所以P(X≥90)≈0.022 75-0.021 4=0.001 35,则进入集训队的人数约为20 000×0.001 35=27.故选C.7.5 正态分布
1.C [解析] ∵随机变量X~N(0,1),∴μ=0,∴相应的正态曲线关于y轴对称,∴P(|X|<1.96)=1-2P(X≤-1.96)=1-2×0.025=0.950.
2.D [解析] 由题图可知,甲图象关于直线x=0.4对称,乙图象关于直线x=0.8对称,∴μ1=0.4,μ2=0.8,故A中说法正确,C中说法正确;∵甲图象比乙图象更“高瘦”,∴甲类水果的质量比乙类水果的质量更集中于平均值左右,故B中说法正确;∵乙图象对应的函数的最大值为1.99,即=1.99,∴σ2≠1.99,故D中说法错误.故选D.
3.A [解析] 因为随机变量X~N(μ,7),且P(X<2)=P(X>6),所以由对称性知μ==4,由正态分布X~N(μ,7)知方差D(X)=7,故选A.
4.A [解析] 依题意知,μ=82,σ=4,所以P(74≤X≤90)≈0.954 5,则P(X≥90)≈(1-0.954 5)×=0.022 75,所以比赛成绩大于90分的学生人数约为100 000×0.022 75=2275,故选A.
5.B [解析] 根据正态分布的性质,零件外直径落在区间[μ-3σ,μ+3σ]内的概率约为0.997 3,所以零件外直径落在[9.7,10.3]内为正常值,否则为异常值,因为9.82∈[9.7,10.3],所以上午生产情况正常,因为10.31 [9.7,10.3],所以下午生产情况异常.故选B.
6.B [解析] 因为P(μ-3σ0.027,解得k>10,因为k∈N*,所以k的最小值为11.故选B.
7.B [解析] 对于甲,有70分钟可用,选路线①按时到达车站的概率为P(X≤70)=P(X≤50)+P(50≤X≤70)=0.5+,选路线②按时到达车站的概率为P(Y≤70)>P(Y≤68)=P(Y≤60)+P(60≤Y≤68)=0.5+,因为P(50-20≤X≤50+20)=P(60-8≤Y≤60+8),所以P(Y≤70)>P(Y≤68)=P(X≤70),所以甲应选路线②;对于乙,有64分钟可用,选路线①按时到达车站的概率为P(X≤64)>P(X≤60)=P(X≤50)+P(50≤X≤60)= 0.5+,选路线②按时到达车站的概率为P(Y≤64)=P(Y≤60)+P(60≤Y≤64)=0.5+,因为P(50-10≤X≤50+10)=P(60-4≤Y≤60+4),所以P(X≤64)>P(X≤60)=P(Y≤64),所以乙应选路线①.故选B.
8.BD [解析] ∵正态密度曲线关于直线x=μ对称,且μ越大曲线越靠右边,σ越小曲线越瘦高,∴μ1<μ2=μ3,σ1=σ2<σ3.故选BD.
9.BD [解析] 因为μ=E(Y)=16×=8,σ===2,所以P(X≤8)=0.5,P(4≤X≤8)+P(X≥12)=0.5,故A错误,B正确;因为P(X≥12)=P(X≥μ+2σ)=m,所以P(8≤X≤12)=P(μ≤X≤μ+2σ)=0.5-m,所以P(4≤X≤8)=P(8≤X≤12)=0.5-m,故C错误;因为P(X≤2a-1)=P(X≥2-a),所以2a-1+2-a=16,所以a=15,故D正确.故选BD.
10.8 [解析] 因为随机变量X~N(1,2),所以D(X)=2,所以D(2X+3)=22D(X)=4×2=8.
11.P(X≤t)-(答案不唯一) [解析] 因为正态曲线的对称轴为y轴,所以曲线在y轴左、右两侧与x轴之间的区域面积均为,故表示题图中阴影部分面积的式子可以为P(X≤t)-.
12.2000 [解析] 因为X近似服从正态分布N(30,σ2),所以P(X>50)=P(X<10)=1-P(X≥10)=0.10,故P(10≤X≤50)=1-P(X<10)-P(X>50)=0.8,故估计该校高三年级的学生人数为=2000.
13.解:(1)设学生的物理成绩为随机变量X,
则X~N(60,100),所以μ=60,σ=10,
所以P(40≤X≤80)=P(μ-2σ≤X≤μ+2σ)≈0.954 5,
则P(X>80)=≈0.022 75,所以估计物理成绩优秀的人数占总人数的比例约为2.275%.
(2)由题意得P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,
即P(50≤X≤70)≈0.682 7,P(40≤X≤80)≈0.954 5,
所以P(50≤X≤60)=P(50≤X≤70)≈×0.682 7=0.341 35,P(60≤X≤80)=P(40≤X≤80)≈×0.954 5=0.477 25,
所以P(50≤X≤80)=P(50≤X≤60)+P(60≤X≤80)≈0.341 35+0.477 25=0.818 6.
又40 000×0.818 6=32 744,
所以估计全市物理成绩在[50,80]内的学生人数为32 744.
14.解:(1)由题意可知μ1=32,σ1=6,μ2=34,σ2=2.
P(X>38)=-P(26≤X≤38)≈-×0.682 7=0.158 65;P(Y>38)=-P(30≤Y≤38)≈-×0.954 5=0.022 75.因为0.158 65>0.022 75,所以坐公交车用时超过38分钟的可能性更大,故李明应选择骑自行车.
(2)由(1)可得P(Y≤38)=1-P(Y>38)≈0.977 25,设在100天的上学时间里不迟到的天数为Z,
则Z~B(100,0.977 25),可得E(Z)=100×0.977 25≈98,所以不迟到的天数大约为98.
15.0.28 [解析] 由题意可知μ=110,σ=10,事件AB为“90=0.135 9,P(A)=P(9016.解:(1)①由题意知T~N(100,150),其中μ=100,σ=≈12.2,
所以P(75.6≤T≤136.6)=P(100-2×12.2≤T≤100+3×12.2)≈=0.975 9.
②估计该物流公司2000天内每日的可配送货物量在区间[75.6,136.6]内的天数为2000×0.975 9≈1952.
(2)对于方案一,设小张每日可获得的奖金为X元,则X的可能取值为60,80,120,其对应的概率分别为0.33,0.57,0.10,
故E(X)=60×0.33+80×0.57+120×0.10=77.4.
对于方案二,易知P(T<μ)=P(T≥μ)=,
设小张每日可获得的奖金为Y元,则Y的所有可能取值为50,100,150,200,且P(Y=50)=×=,P(Y=100)=×+××=,P(Y=150)=2×××=,P(Y=200)=××=,
所以E(Y)=50×+100×+150×+200×=90.
因为E(Y)>E(X),
所以从数学期望的角度看,小张选择方案二更有利.7.5 正态分布
【学习目标】
1.利用实际问题的频率分布直方图,了解正态曲线的特征和正态曲线所表示的意义.
2.会根据正态曲线的性质求随机变量在某一区间的概率.
◆ 知识点一 连续型随机变量与正态分布
1.连续型随机变量
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为 .
2.正态曲线定义
函数f(x)=,x∈R,其中μ∈R,σ>0为参数,称f(x)为正态密度函数,称它的图象为 ,简称 .
3.正态分布定义
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).
特别地,当μ=0,σ=1时,称随机变量X服从 .
4.正态分布的图形表示
若X~N(μ,σ2),则如图所示,X取值不超过x的概率P(X≤x)为图中区域 的面积,而 为区域B的面积.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)正态曲线可以关于y轴对称. ( )
(2)正态分布是由它的均值μ和标准差σ唯一决定的. ( )
(3)服从正态分布的随机变量是连续型随机变量.( )
◆ 知识点二 正态分布的特点
1.正态密度函数f(x)=,x∈R,μ∈R,σ>0的图象有以下特点:
(1)曲线位于x轴 ,与x轴不相交;
(2)曲线是单峰的,它关于直线 对称;
(3)曲线在 处达到峰值;
(4)曲线与x轴之间的区域的面积总为 ;
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿 平移(如图①);
①
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示随机变量的分布越 ,σ越大,曲线越“矮胖”,表示随机变量的分布越 (如图②).
②
2.正态分布的均值与方差
若X~N(μ,σ2),则E(X)= ,D(X)= .
注:参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
3.3σ原则
正态分布在三个特殊区间内取值的概率:
P(μ-σ≤X≤μ+σ)≈ ,
P(μ-2σ≤X≤μ+2σ)≈ ,
P(μ-3σ≤X≤μ+3σ)≈ .
上述结果可用如图表示:
通常认为服从于正态分布N(μ,σ2)的随机变量X只取 中的值,并简称为3σ原则.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)正态密度函数f(x)中参数μ,σ2的意义分别是样本的均值与方差. ( )
(2)正态曲线是单峰的,其与x轴之间的区域的面积是随参数μ,σ的变化而变化的. ( )
(3)关于正态分布N(μ,σ2),随机变量落在区间长度为3σ的区间之外是一个小概率事件. ( )
◆ 探究点一 正态曲线及其特点
例1 (1)函数f(x)=,μ<0的图象可能为 ( )
A B C D
(2)已知随机变量X服从正态分布,其正态曲线如图所示,则X的样本均值μ= ,样本方差σ2= .
变式 如图分别是甲、乙、丙三种品牌手表日走时误差分布的正态密度曲线,则下列说法不正确的是 ( )
A.三种品牌的手表日走时误差的均值相等
B.三种品牌的手表日走时误差的均值从大到小依次为甲、乙、丙
C.三种品牌的手表日走时误差的方差从小到大依次为甲、乙、丙
D.三种品牌手表中甲品牌的质量最好
[素养小结]
利用正态曲线的特点求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象求μ.
(2)正态密度函数在x=μ处取得最大值,由此性质结合图象可求σ.
(3)由σ的大小区分曲线的胖瘦.
◆ 探究点二 利用正态分布求概率
例2 设X~N(1,22),试求:
(1)P(-1(2)P(3(3)P(X≥5).
变式 (1)已知随机变量X~N(2,σ2),且P(X<4)=0.8,则P(0A.0.6 B.0.4
C.0.3 D.0.2
(2)设随机变量X~N(2,9),若P(X>c+1)=P(X①求c的值;
②求P(-4≤X≤8).
[素养小结]
服从正态分布的变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和曲线与x轴之间的区域的面积为1.
(2)注意概率值的求解转化:
①P(X②P(X<μ-a)=P(X>μ+a);
③若b<μ,则P(X<μ-b)=.
(3)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)的值.
(4)求解时,可画出概率分布密度函数的图象,结合图象解答.
◆ 探究点三 正态分布的实际应用
例3 假设某厂包装食盐的生产线在正常情况下生产出来的食盐质量(单位:g)服从正态分布N(500,52),该生产线上的检测员某天随机抽取了两包食盐,称得其质量均大于515 g.
(1)求正常情况下,任意抽取一包食盐,质量大于515 g的概率.
(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停产检测.检测员的判断是否合理 请说明理由.
变式 某冰上项目组计划招收一批10~15岁的青少年参加集训,共有20 000名青少年报名参加测试,其测试成绩X(满分100分)服从正态分布N(60,σ2),成绩在90分及以上者可以进入集训队,已知成绩在80分及以上的人数为455,请你通过以上信息,推断进入集训队的人数约为 ( )
A.18 B.22 C.27 D.30
[素养小结]
正态曲线的应用及求解方法
(1)利用转化的思想方法,把普通的待求的区间问题向[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]这三个区间进行转化,然后利用上述区间的概率求出相应概率.
(2)解答正态分布的实际应用题,其关键是如何转化,同时应熟练掌握服从正态分布的随机变量的取值在[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率.在此过程中用到归纳思想和数形结合思想.7.5 正态分布
一、选择题
1.已知随机变量X~N(0,1),若P(X≤-1.96)=0.025,则P(|X|<1.96)= ( )
A.0.025 B.0.050
C.0.950 D.0.975
2.甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,),N(μ2,),其正态密度曲线如图所示,则下列说法错误的是 ( )
A.甲类水果的平均质量为0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
3.设随机变量X~N(μ,7),若P(X<2)=P(X>6),则 ( )
A.μ=4,D(X)=7 B.μ=8,D(X)=7
C.μ=4,D(X)= D.μ=8,D(X)=
4.某市为弘扬我国优秀的传统文化,组织全市10万中小学生参加网络古诗词知识答题比赛,总分为100分,经过分析比赛成绩,发现成绩X(单位:分)服从正态分布N(82,16),则比赛成绩大于90分的学生人数约为 ( )
A.2275 B.3173
C.3415 D.455
5.某工厂生产的零件外直径(单位:cm)服从正态分布N(10,0.12),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为9.82 cm和10.31 cm,则可认为 ( )
A.上午生产情况异常,下午生产情况正常
B.上午生产情况正常,下午生产情况异常
C.上、下午生产情况均正常
D.上、下午生产情况均异常
6.[2024·河南南阳高二期末] 为了检测自动包装线生产的罐装咖啡,检验员每天从生产线上随机抽取k(k∈N*)罐咖啡,并测量其质量(单位:g).由于存在各种不可控制的因素,任意抽取的1罐咖啡的质量与标准质量之间存在一定的误差.已知这条包装线在正常状态下,每罐咖啡的质量服从正态分布N(μ,σ2).假设生产状态正常,记X表示每天抽取的k罐咖啡中质量在(μ-3σ,μ+3σ)之外的罐数,若X的数学期望E(X)>0.027,则k的最小值为 ( )
附:若随机变量X服从正态分布N(μ,σ2),则P(μ-3σA.10 B.11
C.12 D.13
7.高铁是当代中国重要的一类交通基础设施,乘坐高铁已经成为人们喜爱的一种出行方式,已知某市市郊乘车前往高铁站有①②两条路线可走,路线①穿过市区,路程较短但交通易拥堵,所需时间X(单位:分钟)服从正态分布N(50,100);路线②走环城公路,路程长,但意外阻塞较少,所需时间Y(单位:分钟)服从正态分布N(60,16).若住同一地方的甲、乙两人分别有70分钟与64分钟可用,要使两人按时到达车站的可能性更大,则甲、乙选择的路线分别是 ( )
A.①② B.②① C.①① D.②②
8.(多选题)已知三个正态密度函数fi(x)=·(x∈R,i=1,2,3)的图象如图所示,则下列结论正确的是 ( )
A.σ1=σ2=σ3 B.σ2<σ3 C.μ1=μ2>μ3 D.μ1<μ2=μ3
9.(多选题)[2024·河南创新发展联盟高二期中] 已知随机变量X~N(μ,σ2),随机变量Y~B,若μ=E(Y),σ=,则下列结论正确的是 ( )
A.σ=4
B.P(4≤X≤8)+P(X≥12)=0.5
C.若P(X≥12)=m,则P(4≤X≤8)=1-2m
D.若P(X≤2a-1)=P(X≥2-a),则a=15
二、填空题
10.已知随机变量X~N(1,2),则D(2X+3)= .
11.已知X~N(0,1),如图是其分布密度曲线,则表示图中阴影部分面积的式子可以为 (写出一个即可).
12.某校统计了高三年级全体学生利用假期参加社会实践活动的时间X(单位:小时).根据统计发现X近似服从正态分布N(30,σ2),且P(X≥10)=0.90.该校高三年级学生利用假期参加社会实践活动的时间在[10,50]内的人数为1600,则估计该校高三年级的学生人数为 .
三、解答题
13.某市高二年级某次考试的物理成绩近似服从正态分布N(60,100),规定:分数高于80分为优秀.
(1)估计物理成绩优秀的人数占总人数的比例;
(2)若该市有40 000名高二年级的学生,估计全市物理成绩在[50,80]内的学生人数.
参考数据:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
14.李明上学有时坐公交车,有时骑自行车,他记录了100次坐公交车和骑自行车所花的时间,经数据分析得到,坐公交车平均用时32分钟,样本方差为36;骑自行车平均用时34分钟,样本方差为4.假设坐公交车用时X(单位:分钟)服从正态分布N(μ1,),骑自行车用时Y(单位:分钟)服从正态分布N(μ2,),其中μ1,μ2分别为样本平均数,,分别为样本方差.
(1)如果某天有38分钟可用,李明应选择哪种交通工具 并说明理由.
(2)春天到来,李明选择骑自行车上学,每天都上课前38分钟从家出发,则在100天的上学时间里不迟到的天数大约为多少天 (四舍五入,保留整数)
附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
15.某校高二学生一次数学诊断的考试成绩X(单位:分)服从正态分布N(110,102),从中抽取一名同学的数学成绩,记为Y,记“9016.[2024·青岛二中高二期中] 某物流公司专营从甲地到乙地的货运业务,现统计了最近400天内每天可配送的货物量,按照可配送货物量T(单位:箱)分成了以下几组:[65,75),[75,85),[85,95),[95,105),[105,115),[115,125),[125,135],并绘制了如图所示的频率分布直方图.
(1)由频率分布直方图可以认为,该物流公司每日的可配送货物量T(单位:箱)服从正态分布N(μ,σ2),经计算得μ=100,σ2=150.
①利用该正态分布,求P(75.6≤T≤136.6);
②利用该正态分布,估计该物流公司2000天内每日的可配送货物量在区间[75.6,136.6]内的天数(结果保留整数).
(2)该物流公司负责人根据每日的可配送货物量为装卸员工制定了两种不同的工作奖励方案.
方案一:利用该频率分布直方图获取相关概率(将图中的频率视为概率),采用直接发放奖金的方式奖励员工,按每日的可配送货物量划分为三级:当T<95时,奖励60元;当95≤T<115时,奖励80元;当T≥115时,奖励120元.方案二:利用正态分布获取相关概率,采用抽奖的方式奖励员工,其中每日的可配送货物量不低于μ时有两次抽奖机会,每日的可配送货物量低于μ时只有一次抽奖机会,每次抽奖的奖金及对应的概率如下表:
奖金(元) 50 100
概率
小张为该公司装卸货物的一名员工,试从员工所得奖金的数学期望角度分析,小张选择哪种奖励方案对他更有利.
附:≈12.2,若Z~N(μ,σ2),则P(μ-2σ≤Z≤μ+2σ)≈0.954 5,P(μ-3σ≤Z≤μ+3σ)≈0.997 3.