第05讲 正态分布
课程标准 学习目标
1.通过误差模型,了解服从正态分布的随机变量. 2.通过具体实例,借助频率直方图的几何直观,了解正态分布的特征. 3.了解正态分布的均值、方差及其含义. 1.理解正态分布概念. 2.掌握正态分布的定义,会利用正态分布解决实际问题. 3.了解正态分布与标准正态分布的转换,能利用标准正态分布表求得标准正态分布在某一区间内取值的概率.
知识点01 正态曲线
1.定义:函数φ(x)的解析式中含有μ和σ两个参数,其中:μE(X),即X的均值;σ,即X的标准差.一般地,φ(x)对应的图像称为正态曲线(也因形状之故而被称为“钟形曲线”,φ(x)也常常记为φμ,σ(x)).
2.性质
(1)正态曲线关于xμ对称(即μ决定正态曲线对称轴的位置),具有中间高、两边低的特点;
(2)正态曲线与x轴所围成的图形的面积为1;
(3)σ决定正态曲线的“胖瘦”:σ越大,说明标准差越大,数据的集中程度越弱,所以曲线越“胖”;σ越小,说明标准差越小,数据的集中程度越强,所以曲线越“瘦”.
【解读】(1)正态曲线位于x轴上方,与x轴不相交;
(2)曲线在xμ时处于最高点,并由此处向左右两边延伸时,曲线逐渐降低,其图像“中间高,两边低”;
(3)当σ一定时,曲线随着μ的变化而沿x轴平移;
(4)正态曲线完全由变量μ和σ确定,参数μ是反映随机变量的平均水平的特征数,所以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
【即学即练1】
(1)若f(x)e,x∈R,则f(x)( )
A.有最大值,也有最小值
B.有最大值,但无最小值
C.无最大值,也无最小值
D.有最小值,但无最大值
(2)正态分布密度函数为φμ,σ(x)e,x∈(-∞,+∞),则总体的均值和标准差分别是( )
A.0和8 B.0和4
C.0和2 D.0和
知识点02 正态分布
1.定义及表示:一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的面积,则称X服从参数为μ和σ的正态分布,记作X~N(μ,σ2),此时φμ,σ(x)称为X的概率密度函数.更进一步的研究表明,此时μ是X的均值,而σ是X的标准差,σ2是X的方差.
【解读】参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
2.正态分布的几个常用数据:如果X~N(μ,σ2),那么
P(X≤μ)P(X≥μ)70%,
P(|X-μ|≤σ)P(μ-σ≤X≤μ+σ)≈68.3%,
P(|X-μ|≤2σ)P(μ-2σ≤X≤μ+2σ)≈95.4%,
P(|X-μ|≤3σ)P(μ-3σ≤X≤μ+3σ)≈99.7%.
【解读】式子中X的取值是否包括端点不影响概率的值.一般考试时会给出相关数据,做题目时以题目给出的数据为准.
3.3σ原则
由P(|X-μ|≤3σ)P(μ-3σ≤X≤μ+3σ)≈99.7%可知,X约有99.7%的可能会落在距均值3个标准差的范围之内,也就是说只有约0.3%的可能会落入这一范围之外(这样的事件可看成小概率事件),这一结论通常称为正态分布的“3σ原则”.
【解读】对小概率事件的理解:
(1)小概率事件是针对“一次试验”来说的,如果试验次数多了,该事件当然是很有可能发生的;
(2)当我们运用“小概率事件几乎不可能发生”的原理进行推断时,也有0.3%犯错的可能.
【即学即练2】关于正态分布N(μ,σ2),下列说法正确的是________.(填序号)
①随机变量落在区间长度为3σ的区间之外是一个小概率事件;
②随机变量落在区间长度为6σ的区间之外是一个小概率事件;
③随机变量落在[-3σ,3σ]之外是一个小概率事件;
④随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件.
知识点03 标准正态分布
1.定义:μ0且σ1的正态分布称为标准正态分布,其在正态分布中扮演着核心角色,这是因为如果Y~N(μ,σ2),那么令X,则可以证明X~N(0,1),即任意正态分布通过变换都可化为标准正态分布.
2.标准正态分布下的概率分布:如果X~N(0,1),那么对于任意a,通常记Φ(a)P(X
3.性质:根据正态曲线的对称性,可以知道Φ(a)具有性质Φ(-a)+Φ(a)1.
【即学即练3】若随机变量X~N(0,1),则P(x<0)________.
题型01 正态密度函数
【典例1】函数(其中)的图象可能为( )
A. B.
C. D.
【变式1】已知正态分布密度函数,,则分别是( )
A.0和4 B.0和2 C.0和8 D.0和
【变式2】设随机变量,则X的密度函数为( )
A. B.
C. D.
【变式3】设随机变量,X的正态密度函数为,则 .
题型02 正态密度曲线的性质
【典例2】(24-25高二上·黑龙江哈尔滨·期中)某市高中数学统考中,甲、乙、丙三所学校的数学成绩分别服从正态分布,,,其正态分布的密度曲线如图所示,则( )
A. B.
C. D.
【变式1】已知三个正态密度函数(,)的图像如图所示,则( )
A., B.,
C., D.,
【变式2】设,,这两个正态分布密度曲线如图所示.下列结论中正确的是( )
A. B.
C.对任意正数, D.对任意正数,
【变式3】如图分别是甲 乙 丙三种品牌手表日走时误差分布的正态分布密度曲线,则下列说法不正确的是( )
A.三种品牌的手表日走时误差的均值相等
B.
C.三种品牌的手表日走时误差的方差从小到大依次为甲 乙 丙
D.三种品牌手表中甲品牌的质量最好
题型03 求指定区间上的概率
【典例3】(24-25高二上·黑龙江哈尔滨·阶段练习)已知随机变量服从正态分布,则( )
A.0.1 B.0.2 C.0.3 D.0.4
【变式1】(23-24高二下·江苏南通·阶段练习)已知随机变量,,那么的值为( )
A. B.
C. D.
【变式3】(24-25高二上·广东东莞·阶段练习)已知随机变量服从正态分布,且,则 .(精确到小数点后第五位)
题型04 求特定区间上的概率
【典例4】(23-24高二下·山东聊城·期中)商场出售的袋装大米,每袋净重X(单位:kg)服从正态分布.随机抽取1袋,其净重在9.95kg与10.10kg之间的概率为( )
(注:若,,,)
A.0.8185 B.0.84 C.0.954 D.0.9755
【变式1】(23-24高二下·山西长治·期末)已知,则 .
附:若,则,.
【变式2】(23-24高二下·河南安阳·期中)某次高三统考共有12000名学生参加,若本次考试的数学成绩服从正态分布,已知数学成绩在70分到130分之间的人数约为总人数的,则此次考试中数学成绩不低于130分的学生人数约为( )
A.2400 B.1200 C.1000 D.800
【变式3】(23-24高二下·福建三明·期末)现实世界中的很多随机变量服从正态分布,例如反复测量某一个物理量,其测量误差通常被认为服从正态分布.若某物理量做次测量,测量结果的误差,要控制的概率不大于0.0027,至少要测量的次数为( )
(参考数据:
A.288 B.188 C.72 D.12
【变式4】(23-24高二下·广东江门·期末)某校高二级学生参加期末调研考试的数学成绩X服从正态分布,将考试成绩从高到低,按照16%,34%,34%,16%的比例分为A,B,C,D四个等级.若小明的数学成绩为105分,则属于等级( )
(附:,,)
A.A B.B C.C D.D
题型05 根据正态曲线的对称性求参数
【典例5】(23-24高二下·湖南湘西·期末)(多选)已知随机变量X服从正态分布,且,则( )
A. B.
C. D.
【变式1】(23-24高二下·辽宁大连·期末)已知随机变量服从正态分布,若,则 .
【变式2】(24-25高三上·江苏镇江·开学考试)随机变量服从若
则下列选项一定正确的是( )
A. B.
C. D.
【变式3】(23-24高二下·广东珠海·阶段练习)已知随机变量,若,则的值为 .
题型06 标准正态分布问题
【典例6】(23-24高二下·黑龙江哈尔滨·期末)某省计划在高考中对政治、地理、化学、生物四门选考科目进行赋分制度计分,即将每门选考科目的考生原始成绩从高到低划分为A、B、C、D、E共5个等级,参照正态分布原则,确定各等级人数所占比例分别为10%,35%,35%,18%,2%,选考科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩,依照等比例转换原则,分别转换到,,、、五个分数区间,得到考生的赋分等级成绩,如果该省某次高考模拟考试政治科目的原始成绩,若一名学生想取得A等的赋分等级,则他的原始分数最低为 分.(分数保留整数)
附:①若,,则;②当时,.
【变式1】(23-24高二下·江苏淮安·期末)随机变量,,若,则 .
【变式2】随机变量服从正态分布,随机变量服从标准正态分布,若,则 .(用字母表示)
【变式3】(2024·江苏宿迁·一模)(多选)设随机变量,其中,下列说法正确的是( )
A.变量的方差为1,均值为0 B.
C.函数在上是单调增函数 D.
题型07 正态分布的实际应用
【典例7】(23-24高二下·内蒙古通辽·阶段练习)全面建设社会主义现代化国家,最艰巨最繁重的任务仍然在农村,强国必先强农,农强方能国强.某市为了解当地农村经济情况,随机抽取该地2000户农户家庭年收入X(单位:万元)进行调查,并绘制得到如图所示的频率分布直方图.
(1)求这2000户农户家庭年收入的样本平均数和样本方差(同一组的数据用该组区间的中点值代表);
(2)由直方图可认为农户家庭年收入X近似服从正态分布,其中μ近似为样本平均数近似为样本方差.
①估计这2000户农户家庭年收入超过9.06万元的户数?(结果保留整数)
②如果用该地区农户家庭年收入的情况来估计全市农户家庭年收入的情况,现从全市农户家庭中随机抽取4户,记年收入不超过9.06万元的农户家庭数为ξ,求.(结果精确到0.001)
附:①;②若,则③
【变式1】(23-24高二下·安徽蚌埠·期末)书籍是精神世界的入口,阅读让精神世界闪光,阅读逐渐成为许多人的一种生活习惯,每年4月23日为世界读书日.某市某中学为了了解高一年级学生的阅读情况,从高一年级全部1000名学生中随机抽取100名学生,调查他们每周的阅读时间(单位:小时)并进行统计,得到样本的频率分布直方图如图所示.
由频率分布直方图可以认为该校高一学生每周阅读时间服从正态分布,其中可以近似为100名学生的每周阅读时间的平均值(同组数据用该组数据区间的中点值表示),.
(1)试估计高一全体学生中每周阅读时间不高于6.8小时的人数(四舍五入取整);
(2)若从高一全体学生中随机抽取5名学生进行座谈,设选出的5人中每周阅读时间在10.6小时以上的学生人数为Y,求随机变量Y的分布列,数学期望与方差.
参考数据:若随机变量服从正态分布,则,,.
【变式2】(23-24高三下·山东菏泽·阶段练习)襄阳市某中学一研究性学习小组为了了解襄阳市民每年旅游消费支出费用单位:千元,寒假期间对游览某签约景区的名襄阳市游客进行随机问卷调查,并把数据整理成如下表所示的频数分布表:
组别 支出费用
频数
(1)从样本中随机抽取两位市民的旅游支出数据,求两人旅游支出均不低于元的概率
(2)若襄阳市民的旅游支出费用近似服从正态分布,近似为样本平均数同一组中的数据用该组区间的中间值代表,近似为样本标准差,并已求得,利用所得正态分布模型解决以下问题:
(i)假定襄阳市常住人口为万人,试估计襄阳市有多少市民每年旅游费用支出在元以上
(ii)若在襄阳市随机抽取位市民,设其中旅游费用在元以上的人数为,求随机变量的分布列和均值.
附:若∽,则,,.
【变式3】某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考.根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布.
(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人.甲市学生的成绩为76分,试估计学生在甲市的大致名次;
(2)在该省本次模拟考试的参考学生中随机抽取40人,记表示在本次考试中化学成绩在之外的人数,求的概率及的数学期望.
参考数据:
参考公式:若,有,
题型08 3σ原则的应用
【典例8】某工厂一台设备生产一种特定零件,工厂为了解该设备的生产情况,随机抽检了该设备在一个生产周期中的100件产品的关键指标(单位:),经统计得到下面的频率分布直方图:
(1)由频率分布直方图估计抽检样本关键指标的平均数和方差.(用每组的中点代表该组的均值)
(2)已知这台设备正常状态下生产零件的关键指标服从正态分布,用直方图的平均数估计值作为的估计值,用直方图的标准差估计值作为估计值.
(i)为了监控该设备的生产过程,每个生产周期中都要随机抽测10个零件的关键指标,如果关键指标出现了之外的零件,就认为生产过程可能出现了异常,需停止生产并检查设备.下面是某个生产周期中抽测的10个零件的关键指标:
0.8 1.2 0.95 1.01 1.23 1.12 1.33 0.97 1.21 0.83
利用和判断该生产周期是否需停止生产并检查设备.
(ⅱ)若设备状态正常,记表示一个生产周期内抽取的10个零件关键指标在之外的零件个数,求及的数学期望.
参考数据:若随机变量服从正态分布,则,
【变式1】假设某厂包装食盐的生产线,正常情况下生产出来的食盐质量服从正态分布(单位:),该生产线上的检测员某天随机抽取了两包食盐,称得其质量均大于.
(1)求正常情况下,任意抽取一包食盐,质量大于的概率为多少;
(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停产检修,检测员的判断是否合理?请说明理由.
【变式2】某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.
(1)若甲第一关通过的概率为,第二关通过的概率为,求甲可以进入第三关的概率;
(2)已知该闯关活动累计得分服从正态分布,且满分为470分,现要根据得分给共2700名参加者中得分前400名发放奖励.
①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;
②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.
附:若随机变量,则;;.
【变式3】(23-24高二下·重庆·期末)国家对化学元素镓()相关物项实施出口管制.镓在高端半导体领域有着非常重要的作用,其应用前景十分广阔.某镓合金研制单位为了让镓合金中的镓元素含量百分比稳定在一定范围内,由质检员每天17次随机抽取并检测镓元素在镓合金材料中的含量百分比.设表示一天的17次检测得到的镓含量(单位:)的监测数据,并记监测数据的平均数,标准差.设表示镓合金中镓含量(单位:),且,当为正整数时,令,根据表中的和值解答:
1 2 3 4
0.6827 0.9545 0.9973 0.9999
0.0015 0.4531 0.9551 0.9983
(1)记表示一天中抽取17次的镓含量的次数,求及的数学期望;
(2)当一天中至少1次监测镓含量,就认为该天研制情况异常,须对研制过程作改进.已知某天监测数据的最小值为17,最大值为21,经计算得.若用该天监测数据得的和分别估计为和且,利用估计判断该天的研制过程是否必须作改进?
(3)若去掉一天中的监测结果,设余下的数据标准差为,请用数据表示.
一、单选题
1.(23-24高二下·山东威海·期末)已知随机变量,设随机变量,则( )
A. B.
C. D.
2.(23-24高二下·辽宁沈阳·期中)若随机变量服从正态分布,且,则( )
A. B. C. D.
3.(23-24高二下·山东聊城·期末)设随机变量,,这两个正态分布密度曲线如图所示,则( )
A. B.
C. D.
4.(23-24高二下·河南濮阳·期末)已知随机变量,则( )
参考数据:若随机变量服从正态分布,则.
A.0.97725 B.0.84135 C.0.7786 D.0.34135
5.(23-24高二下·广西·期中)若,且,则( )
A. B. C. D.
6.(23-24高二下·云南保山·阶段练习)某工厂5月份生产7000个灯泡,实验得知灯泡使用寿命(单位:小时)服从正态分布,已知,则工厂该月生产灯泡寿命在800小时及其以上的个数约为( )
A.4400 B.4700 C.4800 D.4900
7.(23-24高二下·吉林长春·阶段练习)某校高二年级男生的身高(单位:cm)近似服从正态分布,若X的值在内的概率约为0.84,则n的值约为( )
参考数据:①;②;③
A.3 B.4 C.5 D.6
8.(23-24高二下·重庆·期末)某次高二质量抽测中,学生的数学成绩服从正态分布.已知参加本次考试的学生约有10000人,如果小明在这次考试中数学成绩为120分,则小明的数学成绩在本次抽测的名次大约是( )
附:若,则,
A.第228名 B.第455名 C.第1587名 D.第3173名
二、多选题
9.(23-24高二下·山西大同·期中)“70米跑”是《国家学生体质健康标准》测试项目中的一项,某地区高三男生的“70米跑”测试成绩(单位:秒)服从正态分布,且.从该地区高三男生的“70米跑”测试成绩中随机抽取5个,其中成绩在内的个数记,则下列说法正确的有( )
A. B.
C. D.
10.(23-24高二下·贵州安顺·期末)已知随机变量服从正态分布,定义函数为取值不超过的概率,即,则下列说法正确的有( )
A. B.
C.在上是增函数 D.,使得
11.(23-24高二下·陕西咸阳·期末)甲、乙两类水果的质量(单位:kg)分别服从正态分布、,其正态分布的密度曲线如图所示,则下列说法正确的是( )
A.甲类水果的平均质量
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从正态分布的参数
三、填空题
12.(23-24高二下·浙江宁波·期中)已知随机变量X服从二项分布,且随机变量Y服从正态分布.若,则 .
13.(23-24高二下·河北承德·阶段练习)设随机变量X服从正态分布,即,若,则 .
14.(23-24高二下·广东佛山·期末)某厂家生产的产品质量指标服从正态分布.质量指标介于162至180之间的产品为良品,为使这种产品的良品率达到99.73%,则需调整生产工艺,使得至多为 .(若,则)
四、解答题
15.(23-24高二下·山西长治·期中)某种香梨的重量(单位:)服从正态分布,将该种香梨按照其重量及对应的售价进行分拣,分为4类依次记为.已知,售价最高,为10元;,售价为8元;,售价为6元;其余的为,售价为5元.
(1)任选1个香梨,求其重量大于的概率;
(2)以表示香梨的售价(单位:元),写出的分布列,并估计该种香梨售价的平均值.
附:若,则,,.
16.(23-24高二下·青海海东·阶段练习)某公司采购了一批零件,为了检测这批零件是否合格,从中随机抽测了120个零件的长度(单位:分米),按数据分成,,,,,这6组,得到如下的频数分布表:
分组
频数 5 15 40 40 15 5
以这120个零件的长度在各组的频率作为整批零件的长度在各组的概率.
(1)若从这批零件中随机抽取3个,记X为抽取的零件的长度在中的个数,求X的分布列和数学期望;
(2)若变量S满足,且,则称变量S满足近似于正态分布的概率分布,如果这批零件的长度Y(单位:分米)满足近似于正态分布的概率分布,则认为这批零件是合格的,将顺利被签收,否则,公司将拒绝签收,试问该批零件能否被签收?
17.(23-24高二下·陕西西安·期末)某新能源汽车制造企业为了了解产品质量﹐对现有的一条新能源零部件产品生产线进行抽样调查.该企业质检人员从该条生产线所生产的新能源零部件产品中随机抽取了1000件.检测产品的某项质量指标值,根据检测数据整理得到如图所示的频率分布直方图,其分组为,,,,,,.
(1)从质量指标值在内的两组检测产品中,采用分层抽样的方法随机抽取5件,现从这5件中随机抽取2件作为样品展示,求抽取的2件产品不在同一组的概率.
(2)若该项质量指标值X近似服从正态分布,近似为样本平均数(同一组中的数据用该组区间的中间值代表),近似为样本标准差s,并已求得,利用所得正态分布模型解决以下问题:
①该项质量指标值低于30或高于92为不合格,若该生产线生产100万件零部件,试估计有多少件零部件不合格;
②若从该生产线上随机抽取3件零部件,设其中该项质量指标值不低于的零部件个数为Y,求随机变量Y的分布列与数学期望.
参考数据:,,.
18.(2024·陕西商洛·模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道.2023年11月某地脐橙开始采摘上市,一脐橙基地随机抽查了100个购物群的销售情况,各购物群销售脐橙的情况如下:
脐橙数量/盒
购物群数量/个 12 18 32 18
(1)求实数的值.并用组中值(每组的中点值)估计这100个购物群销售脐橙总量的平均数;
(2)假设所有购物群销售脐橙的数量,其中为(1)中的平均数,.若该脐橙基地参与销售的购物群约有1000个,销售的脐橙在(单位:盒)内的群为“级群”,销售数量小于2580盒的购物群为“级群”,销售数量不小于616盒的购物群为“特级群”,该脐橙基地对每个“特级群”奖励800元,每个“级群”奖励100,对“级群”不奖励,则该脐橙基地大约需要准备多少奖金?(群的个数按四舍五入取整数)
附:若,则,,.
19.材料一:2018年,全国逾半省份将从秋季入学的高一年级开始实行新的学业水平考试和高考制度.所有省级行政区域均突破文理界限,由学生跨文理选科,均设 置“”的考试科目.前一个“3”为必考科目,为统一高考科目语文、数学、外语.除个别省级行政区域仍执行教育部委托的分省命题任务外,绝大部分省级行政区域均由教育部考试中心统一命题;后一个“3”为高中学业水平考试(简称“学考”)选考科目,由各省级行政区域自主命题.材料二:2019年4月,河北、辽宁、江苏、福建、湖北、湖南、广东、重庆等8省市发布高考综合改革实施方案,方案决定从2018年秋季入学的高中一年级学生开始实施高考综合改革.考生总成绩由全国统一高考的语文、数学、外语3个科目成绩和考生选择的3科普通高中学业水平选择性考试科目成绩组成,满分为770分.即通常所说的“”模式,所谓“”,即“3”是三门主科,分别是语文、数学、外语,这三门科目是必选的.“1”指的是要在物理、历史里选一门,按原始分计入成绩.“2”指考生要在生物、化学、思想政治、地理4门中选择2门.但是这几门科目不以原始分计入成绩,而是等级赋分.等级赋分指的是把考生的原始成绩根据人数的比例分为、、、、五个等级,五个等级分别对应着相应的分数区间,然后再用公式换算,转换得出分数.
(1)若按照“”模式选科,求选出的六科中含有“语文,数学,外语,物理,化学”的概率.
(2)某教育部门为了调查学生语数外三科成绩与选科之间的关系,现从当地不同层次的学校中抽取高一学生2700名参加语数外的网络测试,满分470分,并给前400名颁发荣誉证书,假设该次网络测试成绩服从正态分布,且满分为470分;
①考生甲得知他的成绩为270分,考试后不久了解到如下情况:“此次测试平均成绩为171分,351分以上共有57人”,问甲能否获得荣誉证书,请说明理由;
②考生丙得知他的实际成绩为430分,而考生乙告诉考生丙:“这次测试平均成绩为201分,351分以上共有57人”,请结合统计学知识帮助丙同学辨别乙同学 信息的真伪.
附:;;.
21世纪教育网(www.21cnjy.com)第05讲 正态分布
课程标准 学习目标
1.通过误差模型,了解服从正态分布的随机变量. 2.通过具体实例,借助频率直方图的几何直观,了解正态分布的特征. 3.了解正态分布的均值、方差及其含义. 1.理解正态分布概念. 2.掌握正态分布的定义,会利用正态分布解决实际问题. 3.了解正态分布与标准正态分布的转换,能利用标准正态分布表求得标准正态分布在某一区间内取值的概率.
知识点01 正态曲线
1.定义:函数φ(x)的解析式中含有μ和σ两个参数,其中:μE(X),即X的均值;σ,即X的标准差.一般地,φ(x)对应的图像称为正态曲线(也因形状之故而被称为“钟形曲线”,φ(x)也常常记为φμ,σ(x)).
2.性质
(1)正态曲线关于xμ对称(即μ决定正态曲线对称轴的位置),具有中间高、两边低的特点;
(2)正态曲线与x轴所围成的图形的面积为1;
(3)σ决定正态曲线的“胖瘦”:σ越大,说明标准差越大,数据的集中程度越弱,所以曲线越“胖”;σ越小,说明标准差越小,数据的集中程度越强,所以曲线越“瘦”.
【解读】(1)正态曲线位于x轴上方,与x轴不相交;
(2)曲线在xμ时处于最高点,并由此处向左右两边延伸时,曲线逐渐降低,其图像“中间高,两边低”;
(3)当σ一定时,曲线随着μ的变化而沿x轴平移;
(4)正态曲线完全由变量μ和σ确定,参数μ是反映随机变量的平均水平的特征数,所以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
【即学即练1】
(1)若f(x)e,x∈R,则f(x)( )
A.有最大值,也有最小值
B.有最大值,但无最小值
C.无最大值,也无最小值
D.有最小值,但无最大值
【答案】C
【解析】当x1时,f(x)有最大值f(1).无最小值.
(2)正态分布密度函数为φμ,σ(x)e,x∈(-∞,+∞),则总体的均值和标准差分别是( )
A.0和8 B.0和4
C.0和2 D.0和
【答案】D
【解析】由条件可知μ0,σ2.
知识点02 正态分布
1.定义及表示:一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的面积,则称X服从参数为μ和σ的正态分布,记作X~N(μ,σ2),此时φμ,σ(x)称为X的概率密度函数.更进一步的研究表明,此时μ是X的均值,而σ是X的标准差,σ2是X的方差.
【解读】参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
2.正态分布的几个常用数据:如果X~N(μ,σ2),那么
P(X≤μ)P(X≥μ)70%,
P(|X-μ|≤σ)P(μ-σ≤X≤μ+σ)≈68.3%,
P(|X-μ|≤2σ)P(μ-2σ≤X≤μ+2σ)≈95.4%,
P(|X-μ|≤3σ)P(μ-3σ≤X≤μ+3σ)≈99.7%.
【解读】式子中X的取值是否包括端点不影响概率的值.一般考试时会给出相关数据,做题目时以题目给出的数据为准.
3.3σ原则
由P(|X-μ|≤3σ)P(μ-3σ≤X≤μ+3σ)≈99.7%可知,X约有99.7%的可能会落在距均值3个标准差的范围之内,也就是说只有约0.3%的可能会落入这一范围之外(这样的事件可看成小概率事件),这一结论通常称为正态分布的“3σ原则”.
【解读】对小概率事件的理解:
(1)小概率事件是针对“一次试验”来说的,如果试验次数多了,该事件当然是很有可能发生的;
(2)当我们运用“小概率事件几乎不可能发生”的原理进行推断时,也有0.3%犯错的可能.
【即学即练2】关于正态分布N(μ,σ2),下列说法正确的是________.(填序号)
①随机变量落在区间长度为3σ的区间之外是一个小概率事件;
②随机变量落在区间长度为6σ的区间之外是一个小概率事件;
③随机变量落在[-3σ,3σ]之外是一个小概率事件;
④随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件.
【答案】④
【解析】∵P(μ-3σ≤X≤μ+3σ)0.997,∴P(X>μ+3σ或X<μ-3σ)1-P(μ-3σ≤X≤μ+3σ)1-0.997 0.003,∴随机变量落在[μ-3σ,μ+3σ]之外是一个小概率事件.
知识点03 标准正态分布
1.定义:μ0且σ1的正态分布称为标准正态分布,其在正态分布中扮演着核心角色,这是因为如果Y~N(μ,σ2),那么令X,则可以证明X~N(0,1),即任意正态分布通过变换都可化为标准正态分布.
2.标准正态分布下的概率分布:如果X~N(0,1),那么对于任意a,通常记Φ(a)P(X3.性质:根据正态曲线的对称性,可以知道Φ(a)具有性质Φ(-a)+Φ(a)1.
【即学即练3】若随机变量X~N(0,1),则P(x<0)________.
【答案】
【解析】 由标准正态曲线关于y轴对称可知P(x<0).
题型01 正态密度函数
【典例1】函数(其中)的图象可能为( )
A. B.
C. D.
【答案】A
【分析】函数图象的对称轴为直线,由判断各选项..
【详解】函数图象的对称轴为直线,因为,所以排除B,D;
又正态曲线位于x轴上方,因此排除C,所以A正确.
.
【变式1】已知正态分布密度函数,,则分别是( )
A.0和4 B.0和2 C.0和8 D.0和
【答案】C
【分析】
将化为正态密度函数的定义形式,即可求出.
【详解】,
.
.
【变式2】设随机变量,则X的密度函数为( )
A. B.
C. D.
【答案】A
【分析】根据正态分布的定义可求得,从而可求X的密度函数.
【详解】因为,所以,即,
所以X的密度函数为A.
【变式3】设随机变量,X的正态密度函数为,则 .
【答案】0
【分析】由正态密度函数结构直接可得.
【详解】由正态密度函数结构特征可知,.
故答案为:0
题型02 正态密度曲线的性质
【典例2】(24-25高二上·黑龙江哈尔滨·期中)某市高中数学统考中,甲、乙、丙三所学校的数学成绩分别服从正态分布,,,其正态分布的密度曲线如图所示,则( )
A. B.
C. D.
【答案】A
【分析】根据给定的曲线,利用正态分布的密度曲线的特征判断即得.
【详解】观察曲线知,.
【变式1】已知三个正态密度函数(,)的图像如图所示,则( )
A., B.,
C., D.,
【答案】D
【分析】由正态分布的图像中对称轴位置比较均值大小,图像胖瘦判断标准差的大小.
【详解】由题图中的对称轴知:,
与(一样)瘦高,而胖矮,
所以.
【变式2】设,,这两个正态分布密度曲线如图所示.下列结论中正确的是( )
A. B.
C.对任意正数, D.对任意正数,
【答案】D
【分析】由正态密度曲线的性质结合图像可得,可判断AB,由密度曲线与横轴所围成的图形的面积的意义可判断CD.
【详解】A选项:、的密度曲线分别关于、对称,
因此结合所给图像可得,所以,故A错误;
B选项:又的密度曲线较的密度曲线“瘦高”,
所以,所以,故B错误;
CD选项:由密度曲线与横轴所围成的图形的面积的意义可知:
对任意正数,.,故C正确,D错误.
.
【变式3】如图分别是甲 乙 丙三种品牌手表日走时误差分布的正态分布密度曲线,则下列说法不正确的是( )
A.三种品牌的手表日走时误差的均值相等
B.
C.三种品牌的手表日走时误差的方差从小到大依次为甲 乙 丙
D.三种品牌手表中甲品牌的质量最好
【答案】C
【分析】根据三种品牌手表误差的正态分布曲线的图象,结合正态分布曲线的性质,逐项判定,即可求解.
【详解】根据正态分布曲线的性质和图象可得,三种品牌的手表日走时的误差对应的正态分布曲线的对称轴都是轴,所以三种品牌的手表日走时误差的均值相等,所以A正确;
乙品牌对应点的正态分布曲线在区间之间与围成的面积与丙品牌对应点的正态分布曲线在区间之间与围成的面积相等,所以B不正确;
由正态分布曲线的形状,可得,所以三种品牌的手表日走时误差的方差从小到大依次为甲 乙 丙,所以C正确;
由,可得甲种品牌手表的最稳定,质量最好,所以D正确.
.
题型03 求指定区间上的概率
【典例3】(24-25高二上·黑龙江哈尔滨·阶段练习)已知随机变量服从正态分布,则( )
A.0.1 B.0.2 C.0.3 D.0.4
【答案】C
【分析】根据正态分布的对称性即可求解.
【详解】由于服从正态分布,则,
故.
【变式1】(23-24高二下·江苏南通·阶段练习)已知随机变量,,那么的值为( )
A. B.
C. D.
【答案】A
【分析】根据已知条件得出,且有,进而根据对称性求得即可.
【详解】已知随机变量,,
则,,
根据正态密度曲线的对称性得出
.
【变式3】(24-25高二上·广东东莞·阶段练习)已知随机变量服从正态分布,且,则 .(精确到小数点后第五位)
【答案】0.15865
【分析】根据正态分布的对称性结合题意求解即可.
【详解】由于服从正态分布,所以正态曲线的对称轴为直线,
所以,
故.
故答案为:0.15865.
题型04 求特定区间上的概率
【典例4】(23-24高二下·山东聊城·期中)商场出售的袋装大米,每袋净重X(单位:kg)服从正态分布.随机抽取1袋,其净重在9.95kg与10.10kg之间的概率为( )
(注:若,,,)
A.0.8185 B.0.84 C.0.954 D.0.9755
【答案】A
【分析】根据题意,由正态分布的对称性以及代入计算,即可求解.
【详解】由题意可知,,可得,
则净重在9.95kg与10.10kg之间的概率为,
由正态分布的对称性可知,
.
【变式1】(23-24高二下·山西长治·期末)已知,则 .
附:若,则,.
【答案】
【分析】根据已知条件,利用正态曲线的对称性,即可求得答案.
【详解】,
.
故答案为:
【变式2】(23-24高二下·河南安阳·期中)某次高三统考共有12000名学生参加,若本次考试的数学成绩服从正态分布,已知数学成绩在70分到130分之间的人数约为总人数的,则此次考试中数学成绩不低于130分的学生人数约为( )
A.2400 B.1200 C.1000 D.800
【答案】C
【分析】利用正态分布的对称性求出即可计算得解.
【详解】依题意,,,
因此,
所以此次考试中数学成绩不低于130分的学生人数约为.
【变式3】(23-24高二下·福建三明·期末)现实世界中的很多随机变量服从正态分布,例如反复测量某一个物理量,其测量误差通常被认为服从正态分布.若某物理量做次测量,测量结果的误差,要控制的概率不大于0.0027,至少要测量的次数为( )
(参考数据:
A.288 B.188 C.72 D.12
【答案】D
【分析】根据题意得,可得,然后根据正态分布的概率求法可求得结果.
【详解】因为,所以,
根据题意得,则,
即,
因为,所以,
所以,所以,解得,
所以至少要测量的次数为72次,
【变式4】(23-24高二下·广东江门·期末)某校高二级学生参加期末调研考试的数学成绩X服从正态分布,将考试成绩从高到低,按照16%,34%,34%,16%的比例分为A,B,C,D四个等级.若小明的数学成绩为105分,则属于等级( )
(附:,,)
A.A B.B C.C D.D
【答案】A
【分析】根据正态分布的性质即可求解.
【详解】数学测试成绩服从正态分布,则,,
由于等级的概率之和为,
所以
,而即
故为A等级,为B等级,为C等级, 为D等级,
故105分为A等级.
.
题型05 根据正态曲线的对称性求参数
【典例5】(23-24高二下·湖南湘西·期末)(多选)已知随机变量X服从正态分布,且,则( )
A. B.
C. D.
【答案】AD
【分析】根据正态分布曲线的对称性即可求解.
【详解】随机变量X服从正态分布,
所以正态分布的对称轴为 ,
根据对称性可知:,得,A正确,B错误;
则,C错误,D正确.
D
【变式1】(23-24高二下·辽宁大连·期末)已知随机变量服从正态分布,若,则 .
【答案】
【分析】利用正态曲线的特点即可求解.
【详解】由题意可知,正态曲线关于直线对称,
又因为,
所以,解得.
故答案为:.
【变式2】(24-25高三上·江苏镇江·开学考试)随机变量服从若
则下列选项一定正确的是( )
A. B.
C. D.
【答案】D
【分析】由正态分布的性质逐项判定即可.
【详解】因为
由正态分布的对称性,可得,正态分布方差无法判断,
,,
所以ABD错误.
故选::C
【变式3】(23-24高二下·广东珠海·阶段练习)已知随机变量,若,则的值为 .
【答案】/
【分析】由条件结合正态分布的性质可得,,再结合条件可求结论.
【详解】因为,,
所以,
所以,
所以,
故答案为:.
题型06 标准正态分布问题
【典例6】(23-24高二下·黑龙江哈尔滨·期末)某省计划在高考中对政治、地理、化学、生物四门选考科目进行赋分制度计分,即将每门选考科目的考生原始成绩从高到低划分为A、B、C、D、E共5个等级,参照正态分布原则,确定各等级人数所占比例分别为10%,35%,35%,18%,2%,选考科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩,依照等比例转换原则,分别转换到,,、、五个分数区间,得到考生的赋分等级成绩,如果该省某次高考模拟考试政治科目的原始成绩,若一名学生想取得A等的赋分等级,则他的原始分数最低为 分.(分数保留整数)
附:①若,,则;②当时,.
【答案】71
【分析】设A等级的原始分最低为,由原始成绩,令,则,即可求解.
【详解】由题意知:从高到低,即A等级人数所占比例为,
若A等级的原始分最低为,又原始成绩,
,令,则,
又,所以,
即,可得分,
则他的原始分数最低为71.
故答案为:71.
【变式1】(23-24高二下·江苏淮安·期末)随机变量,,若,则 .
【答案】/
【分析】分析可知,结合正态分布的对称性运算求解.
【详解】因为,可知,
若,
可得,
所以.
故答案为:.
【变式2】随机变量服从正态分布,随机变量服从标准正态分布,若,则 .(用字母表示)
【答案】
【分析】根据随机变量服从标准正态分布,得到,再结合随机变量服从正态分布可得答案.
【详解】随机变量服从标准正态分布,根据对称性可知,
因为,所以,即,
随机变量服从正态分布,根据对称性可知,
,则,即.
故答案为:.
【变式3】(2024·江苏宿迁·一模)(多选)设随机变量,其中,下列说法正确的是( )
A.变量的方差为1,均值为0 B.
C.函数在上是单调增函数 D.
【答案】ACD
【分析】由正态分布的表示可判断A;由正态曲线及可判断B,根据正态曲线的性质可判断C,根据正态曲线的对称性可判断D.
【详解】随机变量,则A正确;
,则B错误;
随机变量,结合正态曲线易得函数在上是单调增函数,则C正确;
正态分布的曲线关于对称,,则D正确,
CD.
题型07 正态分布的实际应用
【典例7】(23-24高二下·内蒙古通辽·阶段练习)全面建设社会主义现代化国家,最艰巨最繁重的任务仍然在农村,强国必先强农,农强方能国强.某市为了解当地农村经济情况,随机抽取该地2000户农户家庭年收入X(单位:万元)进行调查,并绘制得到如图所示的频率分布直方图.
(1)求这2000户农户家庭年收入的样本平均数和样本方差(同一组的数据用该组区间的中点值代表);
(2)由直方图可认为农户家庭年收入X近似服从正态分布,其中μ近似为样本平均数近似为样本方差.
①估计这2000户农户家庭年收入超过9.06万元的户数?(结果保留整数)
②如果用该地区农户家庭年收入的情况来估计全市农户家庭年收入的情况,现从全市农户家庭中随机抽取4户,记年收入不超过9.06万元的农户家庭数为ξ,求.(结果精确到0.001)
附:①;②若,则③
【答案】(1),;
(2)①317户;②0.499.
【分析】(1)利用频率分布直方图求平均数和方差的计算公式求解即可.
(2)①根据正态分布的对称性得出,进而得出所求户数;②年收入不超过万元的农户家庭数服从二项分布,根据二项分布的概率公式求解即可.
【详解】(1)这2000户农户家庭年收入的样本平均数
;
这2000户农户家庭年收入的样本方差
.
(2)①由(1)知,,,农户家庭年收入近似服从正态分布,
所以,
而,
所以这2000户农户家庭年收入超过万元的户数约为317.
②年收入不超过万元的农户家庭数服从二项分布,
所以.
【变式1】(23-24高二下·安徽蚌埠·期末)书籍是精神世界的入口,阅读让精神世界闪光,阅读逐渐成为许多人的一种生活习惯,每年4月23日为世界读书日.某市某中学为了了解高一年级学生的阅读情况,从高一年级全部1000名学生中随机抽取100名学生,调查他们每周的阅读时间(单位:小时)并进行统计,得到样本的频率分布直方图如图所示.
由频率分布直方图可以认为该校高一学生每周阅读时间服从正态分布,其中可以近似为100名学生的每周阅读时间的平均值(同组数据用该组数据区间的中点值表示),.
(1)试估计高一全体学生中每周阅读时间不高于6.8小时的人数(四舍五入取整);
(2)若从高一全体学生中随机抽取5名学生进行座谈,设选出的5人中每周阅读时间在10.6小时以上的学生人数为Y,求随机变量Y的分布列,数学期望与方差.
参考数据:若随机变量服从正态分布,则,,.
【答案】(1)159人
(2)分布列见解析,,.
【分析】(1)利用正态分布相关知识即可求解;
(2)因为,所以每周阅读时间在10.6小时以上的概率为,可得,然后求出对应的概率即可得解.
【详解】(1)样本中100名学生每周阅读时间的均值为:
,
即,又,所以,
所以,
所以全年级学生中每周阅读时间不高于6.8小时的人数大约为:(人)
(2)因为,所以每周阅读时间在10.6小时以上的概率为,可得,
故,,,
,,,
随机变量Y的分布列为:
0 1 2 3 4 5
故,.
【变式2】(23-24高三下·山东菏泽·阶段练习)襄阳市某中学一研究性学习小组为了了解襄阳市民每年旅游消费支出费用单位:千元,寒假期间对游览某签约景区的名襄阳市游客进行随机问卷调查,并把数据整理成如下表所示的频数分布表:
组别 支出费用
频数
(1)从样本中随机抽取两位市民的旅游支出数据,求两人旅游支出均不低于元的概率
(2)若襄阳市民的旅游支出费用近似服从正态分布,近似为样本平均数同一组中的数据用该组区间的中间值代表,近似为样本标准差,并已求得,利用所得正态分布模型解决以下问题:
(i)假定襄阳市常住人口为万人,试估计襄阳市有多少市民每年旅游费用支出在元以上
(ii)若在襄阳市随机抽取位市民,设其中旅游费用在元以上的人数为,求随机变量的分布列和均值.
附:若∽,则,,.
【答案】(1)
(2)(i)11.375万;(ii)分布列见解析,
【分析】(1)根据题意可得旅游支出不低于元的有人,结合古典概型概率公式即可求解;
(2) (i) 根据题意可得,,结合正态曲线的对称性即可求解;(ii)根据题意可得所有可能取值为结合二项分布求概率和均值即可求解.
【详解】(1)样本中总共人,其中旅游支出不低于元的有人,
所以从中随机抽取两位市民的旅游支出数据,
两人旅游支出均不低于元的概率为;
(2)(i)计算,
所以,,服从正态分布,
,
万,
估计襄阳市有万市民每年旅游费用支出在元以上;
(ii)由(i)知,,则,
的所有可能取值为
, ,
, ;
所以随机变量的分布列为:
均值为
【变式3】某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考.根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布.
(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人.甲市学生的成绩为76分,试估计学生在甲市的大致名次;
(2)在该省本次模拟考试的参考学生中随机抽取40人,记表示在本次考试中化学成绩在之外的人数,求的概率及的数学期望.
参考数据:
参考公式:若,有,
【答案】(1)1587名
(2)0.0989;期望为
【分析】(1)由本次模拟考试成绩都近似服从正态分布,,87分以上共有228人,结合原则,求得,再由甲市学生在该次考试中成绩为76分,且求解;
(2)由随机变量服从二项分布,即求解.
【详解】(1)解:已知本次模拟考试成绩都近似服从正态分布,
由题意可得.
即,解得.
甲市学生在该次考试中成绩为76分,且,
又,即.
学生在甲市本次考试的大致名次为1587名.
(2)在本次考试中,抽取1名化学成绩在之内的概率为0.9974.
抽取1名化学成绩在之外的概率为0.0026.
随机变量服从二项分布,即.
.
的数学期望为.
题型08 3σ原则的应用
【典例8】某工厂一台设备生产一种特定零件,工厂为了解该设备的生产情况,随机抽检了该设备在一个生产周期中的100件产品的关键指标(单位:),经统计得到下面的频率分布直方图:
(1)由频率分布直方图估计抽检样本关键指标的平均数和方差.(用每组的中点代表该组的均值)
(2)已知这台设备正常状态下生产零件的关键指标服从正态分布,用直方图的平均数估计值作为的估计值,用直方图的标准差估计值作为估计值.
(i)为了监控该设备的生产过程,每个生产周期中都要随机抽测10个零件的关键指标,如果关键指标出现了之外的零件,就认为生产过程可能出现了异常,需停止生产并检查设备.下面是某个生产周期中抽测的10个零件的关键指标:
0.8 1.2 0.95 1.01 1.23 1.12 1.33 0.97 1.21 0.83
利用和判断该生产周期是否需停止生产并检查设备.
(ⅱ)若设备状态正常,记表示一个生产周期内抽取的10个零件关键指标在之外的零件个数,求及的数学期望.
参考数据:若随机变量服从正态分布,则,
【答案】(1)
(2)(i)需停止生产并检查设备;(ii),
【分析】(1)根据频率分布直方图结合平均数的计算公式,即可求得,继而结合方差的计算公式求得;
(2)(i)根据,,确定,,判断抽查的零件关键指标有无在之外的情况,即可得结论;(ii)求出抽测一个零件关键指标在之外的概率,确定,根据二项分布的概率公式以及期望公式,即可求得答案.
【详解】(1)由频率分布直方图,得.
.
(2)(i)由(1)可知,,
所以,,
显然抽查中的零件指标,故需停止生产并检查设备.
(ii)抽测一个零件关键指标在之内的概率为,
所以抽测一个零件关键指标在之外的概率为,
故,所以,
X的数学期望.
【变式1】假设某厂包装食盐的生产线,正常情况下生产出来的食盐质量服从正态分布(单位:),该生产线上的检测员某天随机抽取了两包食盐,称得其质量均大于.
(1)求正常情况下,任意抽取一包食盐,质量大于的概率为多少;
(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停产检修,检测员的判断是否合理?请说明理由.
【答案】(1)
(2)检测员的判断是合理的,理由见解析
【分析】(1)由正常情况下生产出来的食盐质量服从正态分布(单位:g),要求得 正常情况下,任意抽取一包食盐,质量大于的概率, 化为 的形式, 然后求解即可;
(2)由(1)可知正常情况下,任意抽取一包食盐,质量大于的概率为,可求得随机抽取两包检查,质量都大于的概率几乎为零, 即可判定检测员的判断是合理的.
【详解】(1)设正常情况下,该生产线上包装出来的食盐质量为,由题意可知.
由于,所以根据正态分布的对称性与“原则”可知,
.
(2)检测员的判断是合理的.因为如果生产线不出现异常的话,由(1)可知,随机抽取两包检查,质量都大于的概率约为:
,
几乎为零,但这样的事件竟然发生了,所以有理由认为生产线出现了异常,检测员的判断是合理的.
【变式2】某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.
(1)若甲第一关通过的概率为,第二关通过的概率为,求甲可以进入第三关的概率;
(2)已知该闯关活动累计得分服从正态分布,且满分为470分,现要根据得分给共2700名参加者中得分前400名发放奖励.
①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;
②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.
附:若随机变量,则;;.
【答案】(1)
(2)①能,理由见解析②假
【分析】(1)设为第次通过第一关,为第次通过第二关,计算即可;
(2)①由,且,计算,求出前400名参赛者的最低得分,与甲的得分比较即可;
②假设乙所说为真,由计算,求出,利用小概率事件即可得出结论.
【详解】(1)设:第i次通过第一关,:第i次通过第二关,甲可以进入第三关的概率为,由题意知
.
(2)设此次闯关活动的分数记为.①由题意可知,因为,且,
所以,则;而,
且,
所以前400名参赛者的最低得分高于,而甲的得分为270分,所以甲能够获得奖励;
②假设乙所说为真,则,
,
而,所以,从而,
而,
所以为小概率事件,即丙的分数为430分是小概率事件,可认为其一般不可能发生,但却又发生了,所以可认为乙所说为假.
【变式3】(23-24高二下·重庆·期末)国家对化学元素镓()相关物项实施出口管制.镓在高端半导体领域有着非常重要的作用,其应用前景十分广阔.某镓合金研制单位为了让镓合金中的镓元素含量百分比稳定在一定范围内,由质检员每天17次随机抽取并检测镓元素在镓合金材料中的含量百分比.设表示一天的17次检测得到的镓含量(单位:)的监测数据,并记监测数据的平均数,标准差.设表示镓合金中镓含量(单位:),且,当为正整数时,令,根据表中的和值解答:
1 2 3 4
0.6827 0.9545 0.9973 0.9999
0.0015 0.4531 0.9551 0.9983
(1)记表示一天中抽取17次的镓含量的次数,求及的数学期望;
(2)当一天中至少1次监测镓含量,就认为该天研制情况异常,须对研制过程作改进.已知某天监测数据的最小值为17,最大值为21,经计算得.若用该天监测数据得的和分别估计为和且,利用估计判断该天的研制过程是否必须作改进?
(3)若去掉一天中的监测结果,设余下的数据标准差为,请用数据表示.
【答案】(1)0.0449;0.0459
(2)必须作改进;
(3).
【分析】(1)根据正态分布求解的概率,以及的概率,再利用对立事件求,再根据二项分布求期望;
(2)由可知,,即可作出判断;
(3)根据平均数公式和标准差公式,化简求解.
【详解】(1)由题意得1次监测镓含量的概率为0.9973,
镓含量的概率为0.0027
,
;
(2)由估计得,
,发现最小值,
该天至少1次监测镓含量中,故必须作改进;
(3)设余下的数据的平均数,则,
即.
一、单选题
1.(23-24高二下·山东威海·期末)已知随机变量,设随机变量,则( )
A. B.
C. D.
【答案】A
【分析】直接由均值、方差的性质即可求解.
【详解】对于随机变量而言:它的,注意到,
所以对于随机变量而言:它的,
所以.
.
2.(23-24高二下·辽宁沈阳·期中)若随机变量服从正态分布,且,则( )
A. B. C. D.
【答案】A
【分析】根据条件,利用正态分布的对称性得到,即可求解.
【详解】因为服从正态分布,且,
所以,
.
3.(23-24高二下·山东聊城·期末)设随机变量,,这两个正态分布密度曲线如图所示,则( )
A. B.
C. D.
【答案】A
【分析】由密度曲线结合正态分布性质求解即可.
【详解】的密度曲线的对称轴在的密度曲线的对称轴的左边,即.
的密度曲线较为分散, 的密度曲线较为集中,即,故AB错误;
因为,所以C错误;
因为,所以D正确;
4.(23-24高二下·河南濮阳·期末)已知随机变量,则( )
参考数据:若随机变量服从正态分布,则.
A.0.97725 B.0.84135 C.0.7786 D.0.34135
【答案】C
【分析】利用正态分布的性质及区间概率值,即可求得指定区间概率.
【详解】由已知得随机变量,可得,
由对称性可知,,
又由正态分布的性质可知: ,
所以,
.
5.(23-24高二下·广西·期中)若,且,则( )
A. B. C. D.
【答案】A
【分析】根据正态分布性质计算即可.
【详解】因为,
所以,σ的值不确定.
.
6.(23-24高二下·云南保山·阶段练习)某工厂5月份生产7000个灯泡,实验得知灯泡使用寿命(单位:小时)服从正态分布,已知,则工厂该月生产灯泡寿命在800小时及其以上的个数约为( )
A.4400 B.4700 C.4800 D.4900
【答案】C
【分析】由已知,可得,则,则可求得该月生产灯泡寿命在800小时及其以上的个数.
【详解】因为灯泡使用寿命(单位:小时)服从正态分布,且,
所以,
所以,
则工厂该月生产灯泡寿命在800小时及其以上的个数约为
个,
.
7.(23-24高二下·吉林长春·阶段练习)某校高二年级男生的身高(单位:cm)近似服从正态分布,若X的值在内的概率约为0.84,则n的值约为( )
参考数据:①;②;③
A.3 B.4 C.5 D.6
【答案】A
【分析】利用正态分布的对称性与原则即可得解.
【详解】因为,所以,,
因为①,
而,,
所以②,
对比①②两式可知且,则,
所以,解得.
.
8.(23-24高二下·重庆·期末)某次高二质量抽测中,学生的数学成绩服从正态分布.已知参加本次考试的学生约有10000人,如果小明在这次考试中数学成绩为120分,则小明的数学成绩在本次抽测的名次大约是( )
附:若,则,
A.第228名 B.第455名 C.第1587名 D.第3173名
【答案】A
【分析】借助正态分布定义及正态曲线的性质计算可得,即可得解.
【详解】由,,,
则,故,
,
故小明的数学成绩在本次抽测的名次大约是第228名.
.
二、多选题
9.(23-24高二下·山西大同·期中)“70米跑”是《国家学生体质健康标准》测试项目中的一项,某地区高三男生的“70米跑”测试成绩(单位:秒)服从正态分布,且.从该地区高三男生的“70米跑”测试成绩中随机抽取5个,其中成绩在内的个数记,则下列说法正确的有( )
A. B.
C. D.
【答案】ACD
【分析】A选项,由正态分布的对称性可求,进而计算可判断A;B选项,可求得;由正态分布曲线的性质可得判断B;C选项,,进而求得判断C;D选项,由二项分布计算出,利用对立事件概率公式求出判断D.
【详解】A选项,由正态分布的对称性可知:,
故,A正确;
B选项,由,可得,
由正态分布曲线可得,故B不正确;
C选项,因为,所以,故C正确;
D选项,因为,所以,
所以,故D正确.
CD.
10.(23-24高二下·贵州安顺·期末)已知随机变量服从正态分布,定义函数为取值不超过的概率,即,则下列说法正确的有( )
A. B.
C.在上是增函数 D.,使得
【答案】ABC
【分析】由正态分布可求得,可判断A;结合正态分布的性质计算可得,可判断B;易得在上是增函数,可判断C;当时,,,可判断D.
【详解】对于A:因为,所以,故A正确;
对于B:因为,
所以,故B正确;
对于C:当增大时,也增大,
所以在上是增函数,故C正确;
对于D:因为,,
当时,,所以,
又,所以,所以;
当时,,则,
又,所以不不成立,故D错误;
BC.
11.(23-24高二下·陕西咸阳·期末)甲、乙两类水果的质量(单位:kg)分别服从正态分布、,其正态分布的密度曲线如图所示,则下列说法正确的是( )
A.甲类水果的平均质量
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从正态分布的参数
【答案】ABC
【分析】利用正态分布的性质,逐一进行判断即可.
【详解】由图象可知,甲图象关于直线对称,乙图象关于直线对称,
所以,故A,C正确;
因为甲图象比乙图象更“高瘦”,所以甲类水果的质量比乙类水果的质量更集中于平均值左右,故B正确;
因为乙图象的最大值为,即,所以,故D错误;
BC.
三、填空题
12.(23-24高二下·浙江宁波·期中)已知随机变量X服从二项分布,且随机变量Y服从正态分布.若,则 .
【答案】/
【分析】先由二项分布的均值公式求出,从而得,进而由概率之和为1和正态分布的对称性即可求解.
【详解】因为随机变量X服从二项分布,
所以,故,
又随机变量Y服从正态分布,所以,
所以.
故答案为:.
13.(23-24高二下·河北承德·阶段练习)设随机变量X服从正态分布,即,若,则 .
【答案】1
【分析】根据题意结合正态分布的对称性分析求解.
【详解】随机变量X服从正态分布且,
则由对称性得,所以.
故答案为:1.
14.(23-24高二下·广东佛山·期末)某厂家生产的产品质量指标服从正态分布.质量指标介于162至180之间的产品为良品,为使这种产品的良品率达到99.73%,则需调整生产工艺,使得至多为 .(若,则)
【答案】3
【分析】根据题意结合正态分布的性质可得,,从而出的最大值.
【详解】因为产品质量指标服从正态分布,,
且质量指标介于162至180之间的产品为良品,良品率达到99.73%,
所以,,
解得,
所以至多为3,
故答案为:3
四、解答题
15.(23-24高二下·山西长治·期中)某种香梨的重量(单位:)服从正态分布,将该种香梨按照其重量及对应的售价进行分拣,分为4类依次记为.已知,售价最高,为10元;,售价为8元;,售价为6元;其余的为,售价为5元.
(1)任选1个香梨,求其重量大于的概率;
(2)以表示香梨的售价(单位:元),写出的分布列,并估计该种香梨售价的平均值.
附:若,则,,.
【答案】(1)
(2)分布列见解析,元
【分析】(1)依题意,根据正态分布的性质求出,即可得解;
(2)依题意的所有可能取值为,,,,根据正态曲线的性质求出所对应的概率,即可求出分布列与数学期望.
【详解】(1)因为,所以,,
所以,
即任选1个香梨,其重量大于的概率约为;
(2)由题意可知,的所有可能取值为,,,,
则,
,
,
,
所以的分布列为:
10 8 6 5
所以,
即估计该种香梨售价的平均值为元.
16.(23-24高二下·青海海东·阶段练习)某公司采购了一批零件,为了检测这批零件是否合格,从中随机抽测了120个零件的长度(单位:分米),按数据分成,,,,,这6组,得到如下的频数分布表:
分组
频数 5 15 40 40 15 5
以这120个零件的长度在各组的频率作为整批零件的长度在各组的概率.
(1)若从这批零件中随机抽取3个,记X为抽取的零件的长度在中的个数,求X的分布列和数学期望;
(2)若变量S满足,且,则称变量S满足近似于正态分布的概率分布,如果这批零件的长度Y(单位:分米)满足近似于正态分布的概率分布,则认为这批零件是合格的,将顺利被签收,否则,公司将拒绝签收,试问该批零件能否被签收?
【答案】(1)分布列见解析,
(2)能
【分析】(1)写出随机变量的可能取值,并求解每个值的概率,即可求解;
(2)求出与的概率,即可求解.
【详解】(1)从这批零件中随机选取1件,长度在的概率’
随机变量X的可能取值为0,1,2,3,
则,,
,,
所以随机变量X的分布列为
X 0 1 2 3
P
所以;
(2)由题意知,,
,
,
因为,,
所以这批零件的长度满足近似于正态分布的概率分布,
所以认为这批零件是合格的,将顺利被该公司签收.
17.(23-24高二下·陕西西安·期末)某新能源汽车制造企业为了了解产品质量﹐对现有的一条新能源零部件产品生产线进行抽样调查.该企业质检人员从该条生产线所生产的新能源零部件产品中随机抽取了1000件.检测产品的某项质量指标值,根据检测数据整理得到如图所示的频率分布直方图,其分组为,,,,,,.
(1)从质量指标值在内的两组检测产品中,采用分层抽样的方法随机抽取5件,现从这5件中随机抽取2件作为样品展示,求抽取的2件产品不在同一组的概率.
(2)若该项质量指标值X近似服从正态分布,近似为样本平均数(同一组中的数据用该组区间的中间值代表),近似为样本标准差s,并已求得,利用所得正态分布模型解决以下问题:
①该项质量指标值低于30或高于92为不合格,若该生产线生产100万件零部件,试估计有多少件零部件不合格;
②若从该生产线上随机抽取3件零部件,设其中该项质量指标值不低于的零部件个数为Y,求随机变量Y的分布列与数学期望.
参考数据:,,.
【答案】(1)
(2)①4.55万件;②分布列见解析,
【分析】(1)利用概率公式即可求解.
(2)先求出平均数,写出正态分布,利用正态分布即可求解;先求出的概率,然后根据二项分布,即可求解.
【详解】(1)采用分层抽样的方法随机抽取的5件中,在内的有3件,在内的有2件.
记“抽取的2件产品不在同一组”为事件A,则.
(2)①因为,
所以,且;
所以或或,
所以若该生产线生产100万件零部件,则估计有万件零部件不合格.
②因为,所以,所以Y可以取0,1,2,3,
,,
,,
所以Y的分布列为
Y 0 1 2 3
P
故.
18.(2024·陕西商洛·模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道.2023年11月某地脐橙开始采摘上市,一脐橙基地随机抽查了100个购物群的销售情况,各购物群销售脐橙的情况如下:
脐橙数量/盒
购物群数量/个 12 18 32 18
(1)求实数的值.并用组中值(每组的中点值)估计这100个购物群销售脐橙总量的平均数;
(2)假设所有购物群销售脐橙的数量,其中为(1)中的平均数,.若该脐橙基地参与销售的购物群约有1000个,销售的脐橙在(单位:盒)内的群为“级群”,销售数量小于2580盒的购物群为“级群”,销售数量不小于616盒的购物群为“特级群”,该脐橙基地对每个“特级群”奖励800元,每个“级群”奖励100,对“级群”不奖励,则该脐橙基地大约需要准备多少奖金?(群的个数按四舍五入取整数)
附:若,则,,.
【答案】(1)20;平均数为376
(2)奖金约为95700元
【分析】(1)利用频数之和等于样本总数易得值,利用与频数分布表有关的平均数公式计算即得;
(2)由题意,结合(1)的结果易得的值,根据“级群”, “特级群”的范围,利用正态分布曲线的对称性,求出对应的概率,再计算出需准备的奖金即可.
【详解】(1)由题意得,,解得.
则这100个购物群销售脐橙总量的平均数为.
(2)由题意,则,
故
,
故“级群”约有个;
,
故“特级群”约有个;
则依题意,需要资金为元,即该脐橙基地大约需要准备95700元.
19.材料一:2018年,全国逾半省份将从秋季入学的高一年级开始实行新的学业水平考试和高考制度.所有省级行政区域均突破文理界限,由学生跨文理选科,均设 置“”的考试科目.前一个“3”为必考科目,为统一高考科目语文、数学、外语.除个别省级行政区域仍执行教育部委托的分省命题任务外,绝大部分省级行政区域均由教育部考试中心统一命题;后一个“3”为高中学业水平考试(简称“学考”)选考科目,由各省级行政区域自主命题.材料二:2019年4月,河北、辽宁、江苏、福建、湖北、湖南、广东、重庆等8省市发布高考综合改革实施方案,方案决定从2018年秋季入学的高中一年级学生开始实施高考综合改革.考生总成绩由全国统一高考的语文、数学、外语3个科目成绩和考生选择的3科普通高中学业水平选择性考试科目成绩组成,满分为770分.即通常所说的“”模式,所谓“”,即“3”是三门主科,分别是语文、数学、外语,这三门科目是必选的.“1”指的是要在物理、历史里选一门,按原始分计入成绩.“2”指考生要在生物、化学、思想政治、地理4门中选择2门.但是这几门科目不以原始分计入成绩,而是等级赋分.等级赋分指的是把考生的原始成绩根据人数的比例分为、、、、五个等级,五个等级分别对应着相应的分数区间,然后再用公式换算,转换得出分数.
(1)若按照“”模式选科,求选出的六科中含有“语文,数学,外语,物理,化学”的概率.
(2)某教育部门为了调查学生语数外三科成绩与选科之间的关系,现从当地不同层次的学校中抽取高一学生2700名参加语数外的网络测试,满分470分,并给前400名颁发荣誉证书,假设该次网络测试成绩服从正态分布,且满分为470分;
①考生甲得知他的成绩为270分,考试后不久了解到如下情况:“此次测试平均成绩为171分,351分以上共有57人”,问甲能否获得荣誉证书,请说明理由;
②考生丙得知他的实际成绩为430分,而考生乙告诉考生丙:“这次测试平均成绩为201分,351分以上共有57人”,请结合统计学知识帮助丙同学辨别乙同学 信息的真伪.
附:;;.
【答案】(1);(2)①甲同学能够获得荣誉证书;②乙同学所说为假.
【解析】(1)已经选出五科,再从剩余三个科目中选1个科目的方法为;计算出从物理、历史里选一门,生物、化学、思想政治、地理4门中选择2门的总方案数,即可得其概率.
(2)①由题意可知,而,结合原则即可求得的值.结合获奖概率,并求得,比较后可求得获奖的最低成绩.即可由甲的成绩得知甲能否获得荣誉证书.
②假设乙所说为真,求得,进而求得的值.从而确定的值,即可确定的概率.比较后即可知该事件为小概率事件,而丙已经有这个成绩,因而可判断乙所说为假.
【详解】(1)设事件A:选出的六科中含有“语文,数学,外语,物理,化学”;
则从剩余生物、思想政治、地理三个科目中选择一个有.
从物理、历史里选一门,生物、化学、思想政治、地理4门中选择2门的方案有种,
所以.
(2)设此次网络测试的成绩记为.
①由题意可知,
因为,且,
所以;
而,
且,
所以前400名学生成绩的最低分高于,
而考生甲的成绩为270分,所以甲同学能够获得荣誉证书.
②假设考生乙所说为真,则,
,
而,所以,
从而,
而,
所以为小概率事件,即丙同学的成绩为430分是小概率事件,可认为其不可能发生,但却又发生了,所以可认为乙同学所说为假.
【点睛】本题考查了古典概型概率求法,由组合数求法求概率,结合原则求概率值,并由原则判断事件真伪,综合性强,属于难题.
21世纪教育网(www.21cnjy.com)