7.4 二项分布与超几何分布 讲义-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(Word含答案)

文档属性

名称 7.4 二项分布与超几何分布 讲义-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(Word含答案)
格式 docx
文件大小 442.4KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-08-08 17:25:33

图片预览

文档简介

第七章 随机变量及其分布
第七章 随机变量及其分布
7.4二项分布与超几何分布
7.4二项分布与超几何分布
知识梳理
知识梳理
知识点一n重伯努利试验及其特征
1.n重伯努利试验的概念
将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.
2.n重伯努利试验的共同特征
(1)同一个伯努利试验重复做n次.
(2)各次试验的结果相互独立.
思考 在相同条件下,有放回地抽样试验是n重伯努利试验吗?
答案 是.其满足n重伯努利试验的共同特征.
知识点二:二项分布
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0 P(X=k)=Cpk(1-p)n-k,k=0,1,2,…,n.
称随机变量X服从二项分布,记作X~B(n,p).
知识点三 二项分布的均值与方差
二项分布的均值与方差
(1)二项分布的均值:在n次独立重复试验中,若X~B(n,p),则E(X )=np.
二项分布的方差:若离散型随机变量X从二项分布,即X~B(n,p),则D(X)=np(1-p).
知识点四 超几何分布
定义:一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
P(X=k)=,k=m,m+1,m+2,…,r.
其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.
如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
超几何分布的均值
设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN , 则p是N件产品的次品率,而是抽取的 n件产品的次品率,则E( Xn )=p,即E(X)=np.
题型探究
题型探究
例1.2021年某省开始的“3+1+2”模式新高考方案中,对化学?生物?地理和政治等四门选考科目,制定了计算转换分false(即记入高考总分的分数)的“等级转换赋分规则''(详见附1和附2),具体的转换步骤为:①原始分false等级转换;②原始分等级内等比例转换赋分.某校的一次年级模拟考试中,政治?化学两选考科目的原始分分布如下表:
等级
false
false
false
false
false
比例
约false
约false
约false
约false
约false
政治学科各等级对应的原始分区间
false
false
false
false
false
化学学科各等级对应的原始分区间
false
false
false
false
false
现从政治?化学两学科中分别随机抽取了20个原始分成绩数据如下:
政治
化学
个位数
十位数
个位数
98766540
6
479
98654210
7
012345799
862
8
13469
4
9
358
(1)该校的甲同学选考政治学科,其原始分为86分,乙同学选考化学学科,其原始分为93分.基于高考实测的转换赋分模拟,试分别计算甲乙同学的转换分,并从公平性的角度谈谈你对新高考这种“等级转换赋分法''的看法.
(2)若从该校化学学科等级为false?false的学生中,随机抽取3人,设这3人转换分不低于90分的有false人,求false的分布列和数学期望.
附1:等级转换的等级人数占比与各等级的转换分赋分区间.
等级
false
false
false
false
false
原始分从高到低排序的等级人数占比
约false
约false
约false
约false
约false
转换分false的赋分区间
false
false
false
false
false
附false计算转换分false的等比例转换赋分公式:false(其中:false,分别表示原始分false对应等级的原始分区间下限和上限;false分别表示原始分对应等级的转换分赋分区间下限和上限.false的计算结果按四舍五入取整)
【答案】(1)甲乙两位同学的转换分都为90分;答案见解析;(2)分布列见解析;期望为false.
【详解】
(1)甲同学选考政治学科原始分为86分,
根据等比例转换赋分公式:false得false.
乙同学选考化学学科原始分为93分,
根据等比例转换赋分公式:false得false,
故甲乙两位同学的转换分都为90分.
从公平性的角度谈谈你对新高考这种“等级转换赋分法”的看法:
①从已知可得甲乙同学原始分都排第三,转换后都是90分,因此高考这种“等级转换赋分法”具有公平性与合理性.
②甲同学与乙同学原始分差7分,但转换后都是90分,高考这种“等级转换赋分法”对尖子生不利.
(2)该校化学学科原始分为93分时,根据等比例转换赋分公式:false,
得false,即原始分低于93分的转换分低于90分,
所以转换分不低于90分的有3人,低于90分的有5人,false的所有取值有false,
false
false
false的分布列为:
false
0
1
2
3
false
false
false
false
false
false
例2.《健康中国行动(2019—2030年)》包括15个专项行动,其中全民健身行动提出鼓励公众每周进行3次以上?每次30分钟以上中等强度运动,或者累计150分钟中等强度或75分钟高强度身体活动,日常生活中要尽量多动,达到每天6千步~10千步的身体活动量,某高校从该校教职工中随机抽取了若干名,统计他们的日均步行数(均在2千步~14千步之间),得到的数据如下表:
日均步行数/千步
false
false
false
false
false
false
人数
12
24
false
24
false
9
频率
0.08
0.16
0.4
0.16
false
0.06
(1)求false,false,false的值;
(2)“每天运动一小时,健康工作五十年”,学校为了鼓励教职工积极参与锻炼,决定对日均步行数不低于false千步的教职工进行奖励,为了使全校30%的教职工得到奖励,试估计false的值;
(3)在第(2)问的条件下,以频率作为概率,从该校得到奖励的教职工中随机抽取3人,设这3人中日均步行数不低于10千步的人数为false,求false的分布列和数学期望.
【答案】(1)false,false,false;(2)false;(3)分布列答案见解析,数学期望:false.
【详解】
解:(1)由题可得,false,解得false.
false.
易知false,∴false.
(2)由题意知,日均步行数在false内的频率为false,
日均步行数在false内的频率为false,
则false,
解得false.
所以当false时,全校30%的教职工能够得到奖励.
(3)由题意知该校得到奖励的教职工在全校教职工中所占的比例为0.3,所以日均步行数不低于10千步的教职工在得到奖励的教职工中所占的比例为false,
所以false,false,false,
所以false的分布列为
false
0
1
2
3
false
false
false
false
false
数学期望false.
例3.某中学高一(1)班在接种了“新冠疫苗”之后,举行了“疫情防控,接种疫苗”知识竞赛.这次竞赛前false名同学成绩的茎叶图如图所示,已知前false名女生的平均得分为false分.
(1)①求茎叶图中false的值;
②如果在竞赛成绩高于false分且按男生和女生分层抽样抽取false人,再从这false人中任选false人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,求这false人中有女生的概率;
(2)如果在竞赛成绩高于false分的学生中任选false人参加学校座谈会,用false表示false人中成绩超过false分的人数,求false的分布列和期望.
【答案】(1)①false;②false;(2)分布列见解析,期望为false.
【详解】
(1)①由茎叶图可知,前false名女生的平均得分为false,
解得false;
②竞赛成绩高于false分的女生有false人,男生有false人,
按男生和女生分层抽样抽取false人,则样本中的男生人数为false,女生人数为false,
记事件false从false人中任选false人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,这false人中有女生,
则false;
(2)竞赛成绩高于false分的学生共有false人,成绩高于false分的学生共有false人,
由题意可知,随机变量false的可能取值有false、false、false、false,
则false,false,
false,false,
所以,随机变量false的分布列如下表所示:
false
false
false
false
false
false
false
false
false
false
因此,false.
例4.某食品厂为了检查一条自动包装流水线的生产情况,对该流水线上的产品进行简单随机抽样,获得数据如下表:
分组区间(单位:克)
false
false
false
false
false
产品件数
3
4
7
5
1
包装质量在false克的产品为一等品,其余为二等品
(1)估计从该流水线任取一件产品为一等品的概率;
(2)从上述抽取的样本产品中任取2件,设X为一等品的产品数量,求X的分布列;
(3)从该流水线上任取2件产品,设Y为一等品的产品数量,求Y的分布列;试比较期望false与则望false的大小.(结论不要求证明)
【答案】(1)false;(2)分布列见解析;(3)分布列见解析,false
【详解】
解:(1)样本中一共有false件产品,包装质量在false克的产品有false件,故从该流水线任取一件产品为一等品的概率false
(2)依题意false的可能取值为false、false、false;
false,false,false
故false的分布列为:
false
false
false
false
false
false
false
false
(3)由(2)可得false
依题意false,则false的可能取值为false,false,false
false,false,false
故false的分布列为:
false
false
false
false
false
false
false
false
所以false
所以false
例5.某商城玩具柜台元旦期间促销,购买甲、乙系列的盲盒,并且集齐所有的产品就可以赠送元旦礼品.而每个甲系列盲盒可以开出玩偶false,false,false中的一个,每个乙系列盲盒可以开出玩偶false,false中的一个.
(1)记事件false:一次性购买false个甲系列盲盒后集齐false,false,false玩偶;事件false:一次性购买false个乙系列盲盒后集齐false,false玩偶;求概率false及false;
(2)礼品店限量出售甲、乙两个系列的盲盒,每个消费者每天只有一次购买机会,且购买时,只能选择其中一个系列的一个盲盒.通过统计发现:第一次购买盲盒的消费者购买甲系列的概率为false,购买乙系列的概率为false;而前一次购买甲系列的消费者下一次购买甲系列的概率为false,购买乙系列的概率为false;前一次购买乙系列的消费者下一次购买甲系列的概率为false,购买乙系列的概率为false;如此往复,记某人第false次购买甲系列的概率为false.
①false;
②若每天购买盲盒的人数约为100,且这100人都已购买过很多次这两个系列的盲盒,试估计该礼品店每天应准备甲、乙两个系列的盲盒各多少个.
【答案】(1)false,false;(2)①false;②应准备甲系列盲盒40个,乙系列盲盒60个.
【详解】
解:(1)由题意基本事件共有:false种情况,
其中集齐false,false,false玩偶的个数可以分三类情况,
false,false, false玩偶中,每个均有出现两次,共false种;
false,false, false玩偶中,一个出现一次,一个出现两次,一个出现三次,共false种;
false,false, false玩偶中,两个出现一次,另一个出现四次,共false种;
故false.
根据题意,先考虑一次性购买false个乙系列盲盒没有集齐false,false玩偶的概率,即false,
所以false.
(2)①由题意可知:false,当false时,false,
∴false,
所以false是以false为首项,false为公比的等比数列,
∴false,
②因为每天购买盲盒的100人都已购买过很多次,
所以,对于每一个人来说,某天来购买盲盒时,可以看作n趋向无穷大,
所以购买甲系列的概率近似于false,假设用false表示一天中购买甲系列盲盒的人数,则false,
所以false,即购买甲系列的人数的期望为40,
所以礼品店应准备甲系列盲盒40个,乙系列盲盒60个.
课后小练
课后小练
1.在某学校某次射箭比赛中,随机抽取了100名学员的成绩(单位:环),并把所得数据制成了如下所示的频数分布表;
成绩分组
[4,5)
[5,6)
[6,7)
[7,8)
[8,9)
[9,10]
频数
5
18
28
26
17
6
[附:若 Z?N(μ,σ2) ,则 P(μ?σ(1)求抽取的样本平均数 x (同一组中的数据用该组区间的中点值作代表);
(2)已知这次比赛共有2000名学员参加,如果近似地认为这次成绩Z服从正态分布 N(μ,σ2) (其中 μ 近似为样本平均数 x,σ2 近似为样本方差 s2=1.61 ),且规定8.27环是合格线,那么在这2000名学员中,合格的有多少人?
(3)已知样本中成绩在[9,10]的6名学员中,有4名男生和2名女生,现从中任选3人代表学校参加全国比赛,记选出的男生人数为 ξ, ,求 ξ 的分布列与期望 Eξ .
2.某公司招聘员工,分初试和面试两个阶段,初试通过方可进入面试.受新冠疫情影响,初试采取线上考核的形式,共考核 A 、 B 、 C 三项技能,其中 A 必须过关, B 、 C 至少有一项过关才能进入面试.现有甲、乙、丙三位应聘者报名并参加初试,三人能否通过初试互不影响,每个人三项考核的过关率均相同,各项技能过关率如下表,且每一项考核能否过关相互独立.
考核技能
A
B
C
过关率
23
12
12
(Ⅰ)求甲应聘者能进入面试的概率;
(Ⅱ)用 X 表示三位应聘者中能进面试的人数,求 X 的分布列及期望 EX .
3.据相关部门统计,随着电商网购的快速普及,快递包装业近年来实现了超过50%的高速年均增长,针对这种大好形式,某化工厂引进了一条年产量为1000万个包装胶带的生产线.已知该包装胶带的质量以某项指标值 k 为衡量标准.为估算其经济效益,该化工厂先进行了试生产,并从中随机抽取了1000个包装胶带,统计了每个包装胶带的质量指标值k,并分成以下5组,其统计结果及产品等级划分如下表所示:
质量指标 k
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
产品等级
A 级
B 级
C 级
D 级
废品
频数
160
300
400
100
40
试利用该样本的频率分布估计总体的概率分布,并解决下列问题(注:每组数据取区间的中点值).
参考数据:若随机变量 Z?N(μ,σ2) ,则 P(μ?σ(1)由频数分布表可认为,该包装胶带的质量指标值 k 近似地服从正态分布 N(μ,σ2) ,其中 μ 近似为样本平均数 x , σ 近似为样本的标准差 s ,并已求得 s≈10.03 .记 X 表示某天从生产线上随机抽取的30个包装胶带中质量指标值 k 在区间 (50.54,80.63] 之外的包装胶带个数,求 P(X=1) 及 X 的数学期望(精确到0.001);
(2)已知每个包装胶带的质量指标值 k 与利润 y (单位:元)的关系如下表所示: (t∈(1,4)) .
质量指标 k
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
利润 y
5t
3t
2t
t
?5et
假定该化工厂所生产的包装胶带都能销售出去,且这一年的总投资为5000万元(含引进生产线、兴建厂房等等一切费用在内),问:该化工厂能否在一年之内通过生产包装胶带收回投资?试说明理由.
4.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:
潜伏期
(单位:天)
[0,2]
(2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,14]
人数
85
205
310
250
130
15
5
附:
P(K2≥k0)
0.05
0.025
0.010
k0
3.841
5.024
6.635
K2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d) 其中 n=a+b+c+d .
(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.请将列联表补充完整,并根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关;
潜伏期≤6天
潜伏期>6天
总计
50岁以上(含50岁)
100
50岁以下
55
总计
200
(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,设潜伏期超过6天的人数为 X ,则 X 的期望是多少?
5.某制造企业根据长期检测结果,发现生产产品的一项质量指标值服从正态分布 N(μ,σ2) ,并把质量指标值在 (μ?σ,μ+σ) 内的产品称为优等品,质量指标值在 (μ+σ,μ+2σ) 内的产品称为一等品,其余范围内的产品作为废品处理.优等品与一等品统称为正品,现从该企业生产的产品中随机抽取1000件,测得产品质量指标值的样本数据统计如下图:
(1)根据频率分布直方图,求样本平均数 x ;
(2)根据大量的产品检测数据,得出样本数据的方差的近似值为100,用样本平均数 x 作为 μ 的近似值,用样本标准差s作为 σ 的估计值,求该厂生产的产品为正品的概率;
参考数据:若随机变量 ξ 服从正态分布 N(μ,σ2) ,则: P(μ?σ<ξ≤μ+σ)≈0.6827 , P(μ?2σ<ξ≤μ+2σ)≈0.9545 , P(μ?3σ<ξ≤μ+3σ)≈0.9973 .
(3)假如企业包装时要求把3件优等品5件一等品装在同一个箱子甲,质检员每次从箱子中随机取出3件产品进行检验,记取出3件产品中优等品的件数为X,求X的分布列以及数学期望.
答案解析
1.【答案】 (1)解:由所得数据列成的频数分布表,得样本平均数 x=4.5×0.05+5.5×0.18+6.5×0.28+7.5×0.26+8.5×0.17+9.5×0.06=7 .
(2)解:由(1)知 Z?N(7,1.61) ,∴ P(Z≥8.27)=1?0.68272=0.15865 ,
∴在这2000名学员中,合格的有: 2000×0.15865≈317 人.
(3)解:由已知得 ξ 的可能取值为1,2,3
P(ξ=1)=C41C22C63=15 , P(ξ=2)=C42C21C63=35 , P(ξ=3)=C43C20C63=15 ,
∴ ξ 的分布列为:
ξ
I
2
3
P
15
35
15
Eξ=1×15+2×35+3×15=2 (人).
【解析】
?(1)由所得数据列成的频数分布表,利用平均数公式即可求出抽取的样本平均数;
(2)根据正态分布的性质即可合格的人数;
(3)ξ?的可能取值为1,2,3 分别求出对应的概率,即可求解分布列和期望.
2.【答案】 解:(Ⅰ)甲应聘者这三项考核分别记为事件 A , B , C ,且事件 A , B , C 相互独立,则甲应聘者能进入面试的概率
P(ABC)+P(ABC)+P(ABC)=23?12?12+23?12?12+23?12?12=12 .
(Ⅱ)由题知, X 的所有可能取值为0,1,2,3,且 X~B(3,12) .
P(X=0)=C30(12)3=18 ; P(X=1)=C31(12)(12)2=38 ;
P(X=2)=C32(12)2(12)=38 ; P(X=3)=C33(12)3(12)0=18 ,
分布列为:
X
0
1
2
3
P
18
38
38
18
∵ X~B(3,12) , EX=3?12=32
【解析】
(1)利用已知条件将甲应聘者这三项考核分别记为事件 A , B , C ,且事件 A , B , C 相互独立, 再利用独立事件乘法概率公式结合互斥事件加法概率公式,进而求出甲应聘者能进入面试的概率。
(2) 由题知,求出随机变量 X 的所有可能取值,再结合二项分布求概率公式,进而求出随机变量X的分布列,再利用随机变量X的分布列结合数学期望公式,进而求出随机变量X的数学期望。
3.【答案】
(1)解:由题意可得
中间值
55
65
75
85
95
概率
0.16
0.3
0.4
0.1
0.04
则样本平均数 x=55×0.16+65×0.3+75×0.4+85×0.1+95×0.04=70.6 ,
∴(μ?2σ,μ+σ]=(70.6?20.06.70.6+10.03]=(50.54.80.63] ,
而 P(μ?2σ从而质量指标值 k 在区间 (50.54,80.63] 之外的概率为0.1814,
则 P(X=1)=C3010.818629×0.1814≈30×0.0030×0.1814≡0.016326≈0.016 ,
X的数学期望为 E(X)=30×0.1814=5.442
(2)解:由题意可得该包装胶带的质量指标值 k 与对应的概率如下表所述 (1质量指标 k
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
利润 y
5t
3t
2t
t
?5et
P
0.16
0.3
0.4
0.1
0.04
故每个包装胶带的利润 y=5t×0.16+3t×0.3+2t×0.4+t×0.1?0.2et=?0.2et+2.6t ,
则 y'=?0.2et+2.6=?0.2(et?13) ,令 y'=0 ,可得 t=ln13 ,
故当 t∈(1,ln13) 时,则 y'>0 ,当 t∈(ln13,4) 时, y'<0 .
所以当 t=ln13=2.6 时, y 取得最大值,
ymax=?0.2eln13+2.6×ln13≈?2.6+2.6×2.6=4.16 (元),
由已知可得改生产线的年产量为 1000 万个,
故该生产线的年盈利的最大值为 4.16×1000=4160 (万元),
而 4160 万元 <5000 万元,故该化工厂不能在一年之内通过销售包装胶带收回投资
【解析】
计算出样本的平均数,可得出 (μ?2σ,μ+σ]=(50.54.80.63] ,利用 3σ 原则可求得 P(μ?2σ(2)求得每个包装胶带的利润 y 关于 t 的函数关系式,利用导数求得 y 的最大值,由此可求得该生产线的年盈利的最大值,进而可得出结论.
4.【答案】
(1)解:根据题意,补充完整的列联表如下:
潜伏期<6天
潜伏期≥6天
总计
50岁以上(含50岁)
65
35
100
50岁以下
55
45
100
总计
120
80
200
则 K2=(65×45?55×35)2120×80×100×100=2512≈2.083 ,
经查表,得 K2≈2.083<3.841 ,
所以,没有95%的把握认为潜伏期与年龄有关.
(2)解:由题可知,该地区每1名患者潜伏期超过6天发生的概率为 4001000=25 ,
设调查的20名患者中潜伏期超过6天的人数为 X ,则 X 服从二项分布:
X?B(20,25) , P(X=k)=C20k(25)k(35)20?k , k=0,1,2,???,20 ,
则 E(X)=20×25=8 ,所以, X 的期望为 E(X)=8 .
【解析】
从已知数据知潜伏期有 (0,6] 的有600人,超过6天的有400人,由分层抽样按比例可得潜伏期不超过6天的抽样人数及超过6天的抽样人数,由此可填写列联表,计算 K2 后可得结论;
(2)由题可知,该地区每1名患者潜伏期超过6天发生的概率为 4001000=25 ,设调查的20名患者中潜伏期超过6天的人数为 X ,则 X 服从二项分布: X?B(20,25) ,由二项分布的期望公式可直接得期望.
5.【答案】
(1)解:由频率分布直方图可知,
x=0.010×10×46+562+0.020×10×56+662+0.045×10×66+762
+0.020×10×76+862+0.005×10×86+962=70 .
(2)解:由题意可知,样本方差 s2=100 ,故 σ≈s2=10 ,
所以质量指标值 Y?N(70,102) ,
该厂生产的产品为正品的概率
P=P(60=12(0.6827+0.9545)=0.8186 .
(3)解:X的可能取值为0,1,2,3,则
P(X=0)=C30C53C83=528 , P(X=1)=C31C52C83=1528 ,
P(X=2)=C32C51C83=1556 , P(X=3)=C33C50C83=156 .
所以X的分布列为
X
0
1
2
3
P
528
1528
1556
156
数学期望 E(X)=0×528+1×1528+2×1556+3×156=98 .
【解析】
根据频率分布直方图直接计算平均数;
由条件可知 μ=70 , σ=10 ,并根据数据计算正品的概率;
(3)由条件可知优等品的件数 X=0,1,2,3 ,根据超几何分布的概率公式计算概率,列出分布列和计算数学期望.