名称 | (新高考)2021高考数学 二轮复习 3 核心热点突破 专题四 概率与统计 课件+练习(7份) | | |
格式 | zip | ||
文件大小 | 12.5MB | ||
资源类型 | 教案 | ||
版本资源 | 通用版 | ||
科目 | 数学 | ||
更新时间 | 2020-12-25 10:56:44 |
某厂现有4个标准水量的A级水池,分别取样、检测.多个污水样本检测时,
既可以逐个化验,又可以将若干个样本混合在一起化验.混合样本中只要有样本不达标,混合样本的化验结果必不达标.若混合样本不达标,则该组中各个样本必须再逐个化验;若混合样本达标,则原水池的污水可直接排放.
现有以下四种方案:
方案一:逐个化验;
方案二:平均分成两组化验;
方案三:三个样本混在一起化验,剩下的一个单独化验;
方案四:四个样本混在一起化验.
若化验次数的期望值越小,则方案越“优”.
(1)若p=,求2个A级水样本混合化验结果不达标的概率;
(2)①若p=,现有4个A级水样本需要化验,请问:方案一、二、四中哪个最“优”?
②若“方案三”比“方案四”更“优”,求p的取值范围.
解 (1)因为该混合样本达标的概率是=,
所以根据对立事件可知,混合样本化验结果不达标的概率为1-=.
(2)①方案一:逐个化验,化验次数为4.
方案二:由(1)知,每组两个样本化验时,若达标则化验次数为1,概率为;若不达标则化验次数为3,概率为.
故将方案二的化验次数记为ξ2,ξ2的所有可能取值为2,4,6.P(ξ2=2)=×=,P(ξ2=4)=C××=,P(ξ2=6)=×=,其分布列如下:
ξ2
2
4
6
P
所以方案二的期望
E(ξ2)=2×+4×+6×==.
方案四:混在一起化验,记化验次数为ξ4,P(ξ4=1)==,P(ξ4=5)=1-=,ξ4的所有可能取值为1,5.其分布列如下:
ξ4
1
5
P
所以方案四的期望E(ξ4)=1×+5×=.
比较可得E(ξ4)
其分布列如下:
η3
2
5
P
p3
1-p3
E(η3)=2p3+5(1-p3)=5-3p3.
方案四:设化验次数为η4,η4的所有可能取值为1,5,
其分布列如下:
η4
1
5
P
p4
1-p4
E(η4)=p4+5(1-p4)=5-4p4.
由题意得E(η3)
故所求p的取值范围为.INCLUDEPICTURE"专题四.tif"
第1讲 统计与统计案例
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
真
题
感
悟
1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数
B.平均数
C.方差
D.极差
解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.
答案 A
2.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi=1,则下面四种情形中,对应样本的标准差最大的一组是( )
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
解析 X的可能取值为1,2,3,4,四种情形的数学期望E(X)=1×p1+2×p2+3×p3+4×p4都为2.5,方差D(X)=[1-E(X)]2×p1+[2-E(X)]2×p2+[3-E(X)]2×p3+[4-E(X)]2×p4,标准差为.
A选项的方差D(X)=0.65;B选项的方差D(X)=1.85;C选项的方差D(X)=1.05;D选项的方差D(X)=1.45.
可知选项B的情形对应样本的标准差最大.故选B.
答案 B
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10
B.18
C.20
D.36
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.
答案 B
4.(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1
200,
(xi-)2=80,
(yi-)2=9
000,
(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
解 (1)由已知得样本平均数=yi=60,从而该地区这种野生动物数量的估计值为60×200=12
000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r===≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考
点
整
合
1.抽样方法
抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn).
(4)方差与标准差.
s2=[(x1-)2+(x2-)2+…+(xn-)2],
s=.
3.直方图的两个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
4.回归分析与独立性检验
(1)回归直线=x+经过样本点的中心(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.
(2)独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
n
则K2=(其中n=a+b+c+d为样本容量).
热点一 抽样方法
【例1】
(1)总体由编号为01,02,…,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为( )
附:第6行至第9行的随机数表
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
3211 4919 7306 4916 7677 8733 9974 6732
2635 7900 3370 9160 1620 3882 7757 4950
A.3
B.19
C.38
D.20
(2)(2020·百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生1
800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1
800名学生中抽取一个容量为72的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为( )
A.800
B.750
C.700
D.650
解析 (1)由题意知,编号为01~50的个体才是需要的个体.由随机数表依次可得41,48,28,19,16,20,……故第4个个体的编号为19.故选B.
(2)设从高三年级抽取的学生人数为2x人,则从高二、高一年级抽取的人数分别为2x-2,2x-4.
由题意可得2x+(2x-2)+(2x-4)=72,∴x=13.
设我校高三年级的学生人数为N,且高三抽取26人,
由分层抽样,得=,∴N=650(人).
答案 (1)B (2)D
探究提高 解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.
【训练1】
(1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第6列的数字开始,由左到右依次选取两个数字,则选出来的第5个个体的编号为________.
附:第1行至第2行的随机数表
21
16
65
08 90
34
20
76 43
81
26
34 91
64
17
50 71
59
45
06
91
27
35
36 80
72
74
67 21
33
50
25 83
12
02
76 11
87
05
26
(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
解析 (1)从随机数表的第1行第6列的数字开始,按规则得到的编号依次为50,89,03,42,07,64,38,12,63,49,16,41,75,07,15,94,50,……其中编号在01至20之间的依次为03,07,12,16,07,15,……按照编号重复的删除后一个的原则,可知选出来的第5个个体的编号为15.
(2)因为样本容量n=60,总体容量N=200+400+300+100=1
000,所以抽取比例为==.
因此应从丙种型号的产品中抽取300×=18(件).
答案 (1)15 (2)18
热点二 用样本估计总体
角度1 数字特征与统计图表的应用
【例2】
(1)(2020·衡水检测)甲、乙两名同学高三以来6次数学模拟考试的成绩统计如下图,甲、乙两组数据的平均数分别为甲、乙,标准差分别为s甲、s乙,则( )
A.甲<乙,s甲<s乙
B.甲<乙,s甲>s乙
C.甲>乙,s甲<s乙
D.甲>乙,s甲>s乙
(2)2020年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为( )
A.2
750,200
B.2
750,110
C.1
120,110
D.1
120,200
解析 (1)由统计图知,甲同学的总体成绩要好于乙同学的成绩,且乙同学的成绩波动较大,甲同学成绩较稳定.∴甲>乙,且s甲<s乙.
(2)学生总数为15
500+5
000+7
500=28
000人,由于抽取4%的学生进行调查,则抽取的样本容量为28
000×4%=1
120(人).故高中生应抽取的人数为
5
000×4%=200(人),而高中生中参与“家务劳动”的比率为0.55,故高中生中参与“家务劳动”的人数为200×0.55=110(人).
答案 (1)C (2)C
角度2 用样本的频率分布估计总体分布
【例3】
(2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解 (1)由已知得0.70=a+0.20+0.15,
故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.
2.在例3中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
【训练2】
(1)(2020·新高考海南卷)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A.这11天复工指数和复产指数均逐日增加
B.这11天期间,复产指数增量大于复工指数的增量
C.第3天至第11天复工复产指数均超过80%
D.第9天至第11天复产指数增量大于复工指数的增量
解析 由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;故选C、D.
答案 CD
(2)(2019·全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80]
企业数
2
24
53
14
7
①分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
②求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.
解 ①根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
所以用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
②100个企业的产值增长率平均数为
=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029
6,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
热点三 回归分析在实际问题中的应用
【例4】
如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
探究提高 1.求回归直线方程的关键及实际应用
(1)关键:正确理解,的计算公式和准确地计算.
(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
2.相关系数
(1)当r>0时,表明两个变量正相关;当r<0时,两个变量负相关.
(2)当|r|>0.75时,认为两个变量具有较强的线性相关关系.
【训练3】
(1)(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10
℃至40
℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln
x
(2)(2020·百强名校领军考试)已知变量x,y的关系可以用模型y=cekx拟合,设z=ln
y,其变换后得到一组数据如下:
x
16
17
18
19
z
50
34
41
31
由上表可得线性回归方程=-4x+,则c=( )
A.-4
B.e-4
C.109
D.e109
解析 (1)由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D.
(2)由数据表知=17.5,=39.
∵样本点中心(,)在回归直线上,
∴=39+4×17.5=109.
又z=ln
y=ln(cekx)=kx+ln
c,
∴ln
c==109,则c=e109.
答案 (1)D (2)D
热点四 独立性检验
【例5】
(2020·新高考山东、海南卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=,
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表:
SO2PM2.5
[0,150]
(150,475]
[0,75]
64
16
(75,115]
10
10
(3)根据(2)的列联表得
K2的观测值k=≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
探究提高 1.独立性检验的一般步骤
(1)根据样本数据列成2×2列联表;
(2)根据公式K2=,计算K2的值;
(3)查表比较K2与临界值的大小关系,作统计判断.
2.K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
【训练4】
某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:K2=.
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
解 (1)由调查数据,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)K2的观测值k=≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
A级 巩固提升
一、选择题
1.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.故选C.
法二 用Venn图表示阅读过《西游记》和《红楼梦》的人数之间的关系如图:
易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.
答案 C
2.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01
B.0.1
C.1
D.10
解析 10x1,10x2,…,10xn的方差为102×0.01=1.故选C.
答案 C
3.给出如下列联表
患心脏病
患其他病
总计
高血压
20
10
30
非高血压
30
50
80
总计
50
60
110
P(K2≥10.828)≈0.001,P(K2≥6.635)≈0.010,参照公式k=,得到的正确结论是( )
A.有99%以上的把握认为“高血压与患心脏病无关”
B.有99%以上的把握认为“高血压与患心脏病有关”
C.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”
D.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”
解析 由列联表中的数据可得K2的观测值
k=≈7.486>6.635,
根据参考数据
P(K2≥6.635)≈0.01,P(K2≥10.828)≈0.001,
所以有1-0.01=99%的把握认为高血压与患心脏病有关,即有99%以上的把握认为高血压与患心脏病有关.
答案 B
4.(多选题)(2020·济南调研)某企业对本企业1
644名职工关于复工的态度进行调查,调查结果如图所示,下列结论成立的是( )
疫情防控期间某企业复工职工调查
A.x=0.384
B.从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178
C.不到80名职工倾向于继续申请休假
D.倾向于复工后在家办公或在公司办公的职工超过986名
解析 由图表知x%=1-5.1%-17.8%-42.3%,得x=34.8,则A错.在家办公的人员占17.8%,B正确.由1
644×5.1%>1644×5%=82.2>80,∴超过80名职工倾向于休假,故C错误.又1
644×(17.8%+42.3%)≈988,所以超过986名职工倾向于在家办公或在公司办公,D正确.综上可知,正确的结论为BD.
答案 BD
5.(多选题)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论正确的是( )
A.得分在[40,60)之间的共有40人
B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5
C.估计得分的众数为55
D.这100名参赛者得分的中位数为65
解析 根据频率和为1,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,
得分在[40,60)的频率是0.40,估计得分在[40,60)的有100×0.40=40(人),A正确;
得分在[60,80)的频率为0.5,可得从这100名参赛者中随机选取一人,
得分在[60,80)的概率为0.5,B正确;
根据频率分布直方图知,最高的小矩形对应的底边中点为=55,即估计得分的众数为55,C正确;
由0.05+0.35=0.4<0.5,知中位数位于[60,70)内,所以中位数的估计值为60+≈63.3.
答案 ABC
二、填空题
6.(2020·深圳调研)为了响应中央号召,某日深圳环保局随机抽查了本市市区汽车尾气排放污染物x(单位:ppm)与当天私家车路上行驶的时间y(单位:小时)之间的关系,从某主干路随机抽取10辆私家车,根据测量数据的散点图可以看出x与y之间具有线性相关关系,其回归直线方程为=0.3x-0.4,若该10辆车中有一辆私家车的尾气排放污染物为6(单位:ppm),据此估计该私家车行驶的时间为________小时.
解析 由=0.3x-0.4,取x=6,得=0.3×6-0.4=1.4,∴估计该私家车行驶的时间为1.4小时.
答案 1.4
7.(2020·济宁联考)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m,中位数为n,则m-n=________.
解析 第一块小矩形的面积S1=0.3,第二块小矩形的面积S2=0.4,故n=2
000+=3
000;又第四、五块小矩形的面积均为S=0.06,故a=[1-(0.3+0.4+0.06×2)]=0.000
09,所以m=1
000×0.3+3
000×0.4+5
000×0.18+(7
000+9
000)×0.06=3
360,故m-n=360.
答案 360
8.(2002·中原名校联考)“关注夕阳、爱老敬老”——某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x年(2013年是第一年)与捐赠的现金y(万元)的对应数据,由此表中的数据得到了y关于x的线性回归方程=mx+0.35,则预测2021年捐赠的现金大约是________万元.
x
3
4
5
6
y
2.5
3
4
4.5
解析 由已知,得==4.5,==3.5,所以样本中心点的坐标为(4.5,3.5),代入=mx+0.35中,得3.5=4.5m+0.35,解得m=0.7,所以=0.7x+0.35.取x=9,得=0.7×9+0.35=6.65,故预测2021年捐赠的现金大约是6.65万元.
答案 6.65
三、解答题
9.(2020·济南联考)2019年10月1日是中华人民共和国成立70周年纪念日.70年砥砺奋进,70年波澜壮阔,感染、激励着一代又一代华夏儿女,为祖国的繁荣昌盛努力拼搏,奋发图强.为进一步对学生进行爱国教育,某校社会实践活动小组,在老师的指导下,从学校随机抽取四个班级160名同学对这次国庆阅兵受到激励情况进行调查研究,记录的情况如下图:
(1)如果从这160人中随机选取1人,此人非常受激励的概率和此人是很受激励的女同学的概率都是,求a,b,c的值;
(2)根据“非常受激励”与“很受激励”两种情况进行研究,判断是否有95%的把握认为受激励程度与性别有关.
附:参考数据
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
解 (1)由题意知==,且a+b+c=120.
解之得a=20,b=60,c=40.
(2)由题意可得2×2列联表:
非常受激励
很受激励
合计
男
20
60
80
女
20
40
60
合计
40
100
140
∴K2的观测值k=
=≈1.17.
由于1.17<3.841,
∴没有95%的把握认为受激励程度与性别有关.
10.某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7]
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6]
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35
m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).
解 (1)所求的频率分布直方图如下:
(2)由题可知使用节水龙头后50天的用水量在[0.3,0.4)的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于0.35
m3的频数为1+5+13+5=24,其频率为=0.48.
因此,估计该家庭使用节水龙头后,日用水量小于0.35
m3的概率为0.48.
(3)该家庭未使用节水龙头50天的日用水量的平均数为
1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48(m3).
该家庭使用了节水龙头后50天的日用水量的平均数为
2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35(m3).
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
B级 能力突破
11.(多选题)(2020·海南质检)刘女士的网店经营坚果类食品,2019年各月份的收入、支出(单位:百元)情况的统计如图所示,下列说法中正确的是( )
A.4至5月份的收入的变化率与11至12月份的收入的变化率相同
B.支出最高值与支出最低值的比是5∶1
C.第三季度平均收入为5
000元
D.利润最高的月份是3月份和10月份
解析 对于A,4至5月份的收入的变化率为=-20,11至12月份收入的变化率为=-20,故相同,A正确.
对于B,支出最高值是2月份60百元,支出最低值是5月份的10百元,故支出最高值与支出最低值的比是6∶1,故B错误.
对于C,第三季度的7,8,9月每个月的收入分别为40百元,50百元,60百元,故第三季度的平均收入为=50(百元),故C正确.
对于D,利润最高的月份是3月份和10月份都是30百元,故D正确.
答案 ACD
12.(2020·西安模拟)某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
月份代码t
1
2
3
4
5
6
7
销售量y(万件)
y1
y2
y3
y4
y5
y6
y7
但其中数据污损不清,经查证yi=9.32,tiyi=40.17,=0.55.
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈2.646,相关系数r=,当|r|>0.75时认为两个变量有很强的线性相关关系,回归方程=t+中斜率和截距的最小二乘估计公式分别为=,=-.
解 (1)由统计表中的数据和附注中的参考数据得
=4,
(ti-)2=28,=0.55,
则
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
∴r=≈≈0.99,
因为0.99>0.75,
所以销售量y与月份代码t有很强的线性相关关系.
(2)由=≈1.331及(1)得==≈0.103.
=-≈1.331-0.103×4≈0.92,
所以y关于t的回归方程为=0.10t+0.92.
(3)当t=8时,代入回归方程得=0.10×8+0.92=1.72(万件),
第8个月的毛利润为z=10×1.72-≈17.2-2×1.414=14.372(万元).
由14.372<15,预测第8个月的毛利润不能突破15万元.第2讲 概率、随机变量及其分布列
高考定位 1.随机事件的概率、古典概型的考查多以选择或填空的形式命题,中低档难度;2.概率模型多考查独立重复试验、相互独立事件、互斥事件及对立事件等;对离散型随机变量的分布列及期望的考查是重点中的“热点”.随着新一轮课程改革,“数据分析、数据建模”将会不断加大考查力度.
真
题
感
悟
1.(2020·全国Ⅰ卷)设O为正方形ABCD的中心,在O,A,B,C,D中任取3点,则取到的3点共线的概率为( )
A.
B.
C.
D.
解析 从O,A,B,C,D这5个点中任取3点,取法有{O,A,B},{O,A,C},{O,A,D},{O,B,C},{O,B,D},{O,C,D},{A,B,C},{A,B,D},{A,C,D},{B,C,D},共10种,其中取到的3点共线的只有{O,A,C},{O,B,D}这2种取法,所以所求概率为=或eq
\f(2,C)=.故选A.
答案 A
2.(多选题)(2020·新高考山东卷)信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为1,2,…,n,且P(X=i)=pi>0(i=1,2,…,n),pi=1,定义X的信息熵H(X)=-pilog2pi.( )
A.若n=1,则H(X)=0
B.若n=2,则H(X)随着p1的增大而增大
C.若pi=(i=1,2,…,n),则H(X)随着n的增大而增大
D.若n=2m,随机变量Y所有可能的取值为1,2,…,m,且P(
Y=j)=pj+
p2m+1-j(j=1,2,…,m),则H(X)≤H(Y)
解析 对于A,当n=1时,p1=1,H(X)=-1×log21=0,故A正确;对于B,当n=2时,有p1+p2=1,此时,若p1=或都有H(X)=-,故B错误;对于C,当pi=(i=1,2,…,n)时,H(X)=-
log2=-n×log2=log2n,显然H(X)随n的增大而增大,故C正确;对于D,法一 当n=2m时,
H(X)=-(p1log2p1+p2log2p2+…+p2m-1log2p2m-1+p2mlog2p2m)
=-
,
H(Y)=-
,
由于p1log2p1+p2mlog2p2m=log2(p·p)<log2=log2(p1+p2m)p1+p2m=(p1+p2m)log2(p1+p2m),同理可证p2log2p2+p2m-1log2p2m-1<(p2+p2m-1)log2(p2+p2m-1),…,pmlog2pm+pm+1log2pm+1<(pm+pm+1)log2(pm+pm+1),所以H(X)>H(Y),故D错误.
法二(特值法) 令m=1,则n=2,p1=,p2=.
P(Y=1)=1,H(Y)=-log21=0,
H(X)=->0,
∴H(X)>H(Y),故D错误.
答案 AC
3.(2020·浙江卷)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为ξ,则P(ξ=0)=________;E(ξ)=________.
解析 ξ=0表示停止取球时没有取到黄球,
所以P(ξ=0)=+×=.
随机变量ξ的所有可能取值为0,1,2,
则P(ξ=1)=×+××+××=,
P(ξ=2)=××+××+××+××=,
所以E(ξ)=0×+1×+2×=1.
答案 1
4.(2020·全国Ⅰ卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:
累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.
经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为.
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
解 (1)甲连胜四场的概率为.
(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.
比赛四场结束,共有三种情况:
甲连胜四场的概率为;乙连胜四场的概率为;
丙上场后连胜三场的概率为.
所以需要进行第五场比赛的概率为1---=.
(3)丙最终获胜,有两种情况:
比赛四场结束且丙最终获胜的概率为;
比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为,,.
因此丙最终获胜的概率为+++=.
考
点
整
合
1.概率模型公式及相关结论
(1)古典概型的概率公式.
P(A)==.
(2)条件概率.
在A发生的条件下B发生的概率:P(B|A)==.
(3)相互独立事件同时发生的概率:若A,B相互独立,则P(AB)=P(A)·P(B).
(4)若事件A,B互斥,则P(A∪B)=P(A)+P(B),
P()=1-P(A).
2.独立重复试验与二项分布
如果事件A在一次试验中发生的概率是p,那么它在n次独立重复试验中恰好发生k次的概率为Pn(k)=Cpk(1-p)n-k,k=0,1,2,…,n.用X表示事件A在n次独立重复试验中发生的次数,则X服从二项分布,即X~B(n,p)且P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n).
3.超几何分布
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=eq
\f(CC,C),k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N
,此时称随机变量X服从超几何分布.超几何分布的模型是不放回抽样,超几何分布中的参数是M,N,n.
4.离散型随机变量的均值、方差
(1)离散型随机变量ξ的分布列为
ξ
x1
x2
x3
…
xi
…
xn
P
p1
p2
p3
…
pi
…
pn
离散型随机变量ξ的分布列具有两个性质:①pi≥0;
②p1+p2+…+pi+…+pn=1(i=1,2,3,…,n).
(2)E(ξ)=x1p1+x2p2+…+xipi+…+xnpn为随机变量ξ的数学期望或均值.
D(ξ)=(x1-E(ξ))2·p1+(x2-E(ξ))2·p2+…+(xi-E(ξ))2·pi+…+(xn-E(ξ))2·pn叫做随机变量ξ的方差.
(3)数学期望、方差的性质.
①E(aξ+b)=aE(ξ)+b,D(aξ+b)=a2D(ξ).
②X~B(n,p),则E(X)=np,D(X)=np(1-p).
③X服从两点分布,则E(X)=p,D(X)=p(1-p).
热点一 古典概型
【例1】
(1)(2019·全国Ⅰ卷)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“—
—”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是( )
INCLUDEPICTURE"19L2A.TIF"
INCLUDEPICTURE
"19L2A.TIF"
\
MERGEFORMAT
A.
B.
C.
D.
(2)(2020·湖北四地七校联考)根据党中央关于“精准脱贫”的要求,某农业经济部门派4位专家各自在周一、周二两天中任选一天对某县进行调研活动,则周一、周二都有专家参加调研活动的概率为________.
解析 (1)在所有重卦中随机取一重卦,其基本事件总数n=26=64,恰有3个阳爻的基本事件数为C=20.
故在所有重卦中随机取一重卦,该重卦恰有3个阳爻的概率p==.
(2)4位专家各自在周一、周二两天中任选一天对某县进行调研活动,共有24=16种情况.只有周一或周二有专家参加调研活动的情况有2种,所以周一、周二都有专家参加调研活动的情况有16-2=14种,所以周一、周二都有专家参加调研活动的概率p==.
答案 (1)A (2)
探究提高 求古典概型的概率,关键是正确求出基本事件总数和所求事件包含的基本事件总数.常常用到排列、组合的有关知识,计数时要正确分类,做到不重不漏.
【训练1】
(1)(2020·重庆质检)2020年,新型冠状病毒引发的疫情牵动着亿万人的心,八方驰援战疫情,众志成城克时难,社会各界支援湖北共抗新型冠状病毒肺炎,重庆某医院派出3名医生,2名护士支援湖北,现从这5人中任选2人定点支援湖北某医院,则恰有1名医生和1名护士被选中的概率为( )
A.0.7
B.0.4
C.0.6
D.0.3
(2)(2020·济南一模)洛书,古称龟书,是阴阳五行术数之源,被世界公认为组合数学的鼻祖,它是中华民族对人类的伟大贡献之一.在古代传说中有神龟出于洛水,其甲壳上有图(1):“以五居中,五方白圈皆阳数,四隅黑点为阴数”,这就是最早的三阶幻方.按照上述说法,将1到9这九个数字,填在如图(2)的九宫格里,九宫格的中间填5,四个角填偶数,其余位置填奇数.则每一横行、每一竖列以及两条对角线上三个数字的和都等于15的概率是( )
A.
B.
C.
D.
解析 (1)从5人中任选2人定点支援湖北某医院的基本事件总数n=C=10,恰有1名医生和1名护士被选中包含的基本事件个数m=C·C=6,则恰有1名医生和1名护士被选中的概率为P===0.6.
(2)记“将1到9这九个数字,填在题图(2)的九宫格里,九宫格的中间填5,四个角填偶数,其余位置填奇数,则每一横行、每一竖列以及两条对角线上三个数字的和都等于15”为事件A,则题图(2)的九宫格里,九宫格的中间填5,四个角填偶数,其余位置填奇数的不同方法共有A·A=576(种).而事件A所包含的基本事件如图,共有8种.
2
7
6
9
5
1
4
3
8
2
9
4
7
5
3
6
1
8
4
9
2
3
5
7
8
1
6
4
3
8
9
5
1
2
7
6
6
1
8
7
5
3
2
9
4
6
7
2
1
5
9
8
3
4
8
3
4
1
5
9
6
7
2
8
1
6
3
5
7
4
9
2
所以P(A)==.
答案 (1)C (2)C
热点二 条件概率及相互独立事件的概率
【例2】
(1)(2020·广州调研)某大学选拔新生补充进“篮球”“电子竞技”“国学”三个社团,据资料统计,新生通过考核选拔进入这三个社团成功与否相互独立.2019年某新生入学,假设他通过选拔进入该校的“篮球”“电子竞技”“国学”三个社团的概率依次为m,,n.已知这三个社团他都能进入的概率为,至少进入一个社团的概率为,则m+n=( )
A.
B.
C.
D.
(2)(2020·辽宁六校协作体期中)某地区空气质量监测资料表明,一天的空气质量为优良的概率是,连续两天为优良的概率是,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是________.
解析 (1)设该生进入该校的“篮球”“电子竞技”“国学”社团分别为事件A,B,C,
则P(A)=m,P(B)=,P(C)=n.
依题意知P(ABC)=P(A)P(B)P(C)=m××n=,所以mn=.
1-P(
)=1-P()P()P()=1-(1-m)××(1-n)=,
所以(1-m)(1-n)=.
于是(1-m)(1-n)=1-(m+n)+mn=1-(m+n)+=,所以m+n=.
(2)记事件A为“一天的空气质量为优良”,事件B为“随后一天的空气质量也为优良”,则P(AB)=,P(A)=,根据条件概率公式可得P(B|A)===.
答案 (1)C (2)
探究提高 1.求复杂事件的概率,要正确分析复杂事件的构成,看复杂事件是能转化为几个彼此互斥的事件的和事件还是能转化为几个相互独立事件同时发生的积事件,然后用概率公式求解.
2.(1)条件概率的计算,要分清是在谁的条件下的概率,古典概型的条件概率可缩减样本空间优化计算;(2)对于独立重复试验,要牢记公式Pn(k)=Cpk(1-p)n-k,k=0,1,2,…,n,并深刻理解其含义.
【训练2】
(1)某种电路开关闭合后会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯的概率为,两次闭合后都出现红灯的概率为,则在第一次闭合后出现红灯的条件下第二次闭合后也出现红灯的概率为( )
A.
B.
C.
D.
(2)(2020·天津卷)已知甲、乙两球落入盒子的概率分别为和.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为__________;甲、乙两球至少有一个落入盒子的概率为__________.
解析 (1)设“开关第一次闭合后出现红灯”为事件A,“第二次闭合后出现红灯”为事件B,由题意得P(A)=,P(AB)=.由条件概率的定义可得P(B|A)==.故选C.
(2)甲、乙两球都落入盒子的概率P=×=;
事件A:“甲、乙两球至少有一个落入盒子”的对立事件是:“甲、乙两球都不落入盒子”,P()=×=,所以P(A)=1-=.
答案 (1)C (2)
热点三 随机变量的分布列、均值与方差
角度1 超几何分布
【例3】
4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解高三学生课外阅读情况,采用分层抽样的方法从高三某班甲、乙、丙、丁四个小组中随机抽取10名学生参加问卷调查.各组人数统计如下:
小组
甲
乙
丙
丁
人数
9
12
6
3
(1)从参加问卷调查的10名学生中随机抽取两名,求这两名学生来自同一个小组的概率;
(2)在参加问卷调查的10名学生中,从来自甲、丙两个小组的学生中随机抽取两名,用X表示抽得甲组学生的人数,求X的分布列和数学期望.
解 (1)由已知得,问卷调查中,从四个小组中抽取的人数分别为3,4,2,1,
从参加问卷调查的10名学生中随机抽取两名的取法共有C=45种,
这两名学生来自同一小组的取法共有C+C+C=10(种),
所以p==.
(2)由(1)知,在参加问卷调查的10名学生中,来自甲、丙两小组的学生人数分别为3,2.
X的可能取值为0,1,2.
则P(X=k)=eq
\f(C·C,C)(k=0,1,2).
∴P(X=0)=eq
\f(C,C)=,P(X=1)=eq
\f(CC,C)=,
P(X=2)=eq
\f(C,C)=.
则随机变量X的分布列为
X
0
1
2
P
故E(X)=0×+1×+2×=.
探究提高 1.求离散型随机变量的分布列的关键是正确理解随机变量取每一个值所表示的具体事件,然后综合应用各类求概率的公式,求出概率.
2.对于实际问题中的随机变量X,如果能够判定它服从超几何分布H(N,M,n),则其概率可直接利用公式P(X=k)=eq
\f(CC,C)(k=0,1,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N
).
【训练3】
(2020·长沙调研)某市“好运来”超市为了回馈新老顾客,决定在2021年元旦来临之际举行“庆元旦,迎新年”的抽奖派送礼品活动.为设计一套趣味性抽奖送礼品的活动方案,该超市面向该市某高中学生征集活动方案,该中学某班数学兴趣小组提供的方案获得了征用.方案如下:将一个4×4×4的正方体各面均涂上红色,再把它分割成64个相同的小正方体.经过搅拌后,从中任取两个小正方体,记它们的着色面数之和为ξ,记抽奖一次中奖的礼品价值为η.
(1)求P(ξ=3);
(2)凡是元旦当天在该超市购买物品的顾客,均可参加抽奖.记抽取的两个小正方体着色面数之和为6,设为一等奖,获得价值50元的礼品;记抽取的两个小正方体着色面数之和为5,设为二等奖,获得价值30元的礼品;记抽取的两个小正方体着色面数之和为4,设为三等奖,获得价值10元的礼品,其他情况不获奖.求某顾客抽奖一次获得的礼品价值的分布列与数学期望.
解 (1)64个小正方体中,三面着色的有8个,两面着色的有24个,一面着色的有24个,另外8个没有着色,
所以P(ξ=3)=eq
\f(C·C+C·C,C)==.
(2)ξ的所有可能取值为0,1,2,3,4,5,6;η的所有可能取值为50,30,10,0.
P(η=50)=P(ξ=6)=eq
\f(C,C)==,
P(η=30)=P(ξ=5)=eq
\f(C·C,C)==,
P(η=10)=P(ξ=4)=eq
\f(C+C·C,C)==,
P(η=0)=1---=.
所以η的分布列为
η
50
30
10
0
P
所以E(η)=50×+30×+10×+0×=.
角度2 二项分布及其均值与方差
【例4】
(2019·天津卷)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;
(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.
解 (1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率为,
故X~B,从而P(X=k)=C,
k=0,1,2,3.
所以,随机变量X的分布列为
X
0
1
2
3
P
随机变量X的数学期望E(X)=3×=2.
(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B,且M={X=3,Y=1}∪{X=2,Y=0}.
由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,
从而由(1)知
P(M)=P({X=3,Y=1}∪{X=2,Y=0})
=P(X=3,Y=1)+P(X=2,Y=0)
=P(X=3)P(Y=1)+P(X=2)P(Y=0)
=×+×=.
探究提高 1.求随机变量的均值和方差的关键是正确求出随机变量的分布列.
2.对于实际问题中的随机变量X,如果能够断定它服从二项分布B(n,p),则其概率、期望与方差可直接利用公式P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n),E(X)=np,D(X)=np(1-p)求得.
【训练4】
(2020·百校大联考)某省新课改后,某校为预测2020届高三毕业班的本科上线情况,从该校上一届高三(1)班到高三(5)班随机抽取50人,得到各班抽取的人数和其中本科上线人数,并将抽取数据制成下面的条形统计图.
(1)根据条形统计图,估计本届高三学生本科上线率.
(2)已知该省甲市2020届高考考生人数为4万,假设以(1)中的本科上线率作为甲市每个考生本科上线的概率.
①若从甲市随机抽取10名高三学生,求恰有8名学生达到本科线的概率(结果精确到0.01);
②已知该省乙市2020届高考考生人数为3.6万,假设该市每个考生本科上线率均为p(0<p<1),若2020届乙市高考本科上线人数的均值不低于甲市,求p的取值范围.
可能用到的参考数据:取0.364=0.0168,0.164=0.000
7.
解 (1)由条形统计图,估计本届学生本科上线率
P==60%.
(2)①记“恰有8名学生达到本科线”为事件A,由题可知,甲市每个考生本科上线的概率为0.6,则P(A)=C×0.68×(1-0.6)2=C×0.364×0.16=45×0.0168×0.16≈0.12.
②甲、乙两市2020届高考本科上线人数分别记为X,Y,
依题意,可得X~B(40
000,0.6),Y~B(36
000,p).
因为2020届乙市高考本科上线人数的均值不低于甲市,
所以E(Y)≥E(X),即36
000p≥40
000×0.6,解得p≥,
又0<p<1,故p的取值范围为.
热点四 概率与统计的综合问题
【例5】
(2020·九师联盟联考)为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[0,60]的范围内,规定分数在50以上(含50)的作文被评为“优秀作文”,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图,如图所示.其中,a,b,c构成以2为公比的等比数列.
文科生
理科生
合计
获奖
6
不获奖
合计
400
(1)求a,b,c的值;
(2)填写上面2×2列联表,能否在犯错误的概率不超过0.01的情况下认为“获得优秀作文”与“学生的文理科”有关?
(3)将上述调查所得的频率视为概率,现从全市参考学生中,任意抽取2名学生,记“获得优秀作文”的学生人数为X,求X的分布列及数学期望.
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解 (1)由题意,得(a+b+c+0.018+0.022+0.025)×10=1,
而a,b,c构成以2为公比的等比数列,
所以(a+2a+4a+0.018+0.022+0.025)×10=1,解得a=0.005.
则b=0.010,c=0.020.
(2)获得“优秀作文”的人数为400×0.005×10=20.
因为文科生与理科生人数之比为1∶4,所以文科生与理科生人数分别为80,320.
故完成2×2列联表如下:
文科生
理科生
合计
获奖
6
14
20
不获奖
74
306
380
合计
80
320
400
由表中数据可得
K2的观测值k=≈1.316<6.635,
所以不能在犯错误的概率不超过0.01的情况下认为“获得优秀作文”与“学生的文理科”有关.
(3)由表中数据可知,抽到获得“优秀作文”学生的概率为0.005×10=0.05,
将频率视为概率,所以X可取0,1,2,且X~B(2,0.05).
则P(X=k)=C(k=0,1,2).
故X的分布列为
X
0
1
2
P
故X的期望为E(X)=0×+1×+2×=.(或E(X)=2×0.05=0.1).
探究提高 1.本题考查统计与概率的综合应用,意在考查考生的识图能力和数据处理能力.此类问题多涉及相互独立事件、互斥事件的概率,在求解时,要明确基本事件的构成.
2.以统计图表为背景的随机变量分布列求解的关键:
(1)根据频率(数)分布表、频率分布直方图、茎叶图等图表准确求出随机事件的频率,并用之估计相应概率;
(2)出现多个随机变量时,应注意分析随机变量之间的关系,进而由一个随机变量的分布列推出另一个随机变量的分布列.
【训练5】
(2020·石家庄模拟)新高考,取消文理科,实行“3+3”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年),并把调查结果制成下表:
年龄(岁)
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
频数
5
15
10
10
5
5
了解
4
12
6
5
2
1
(1)分别估计中青年和中老年对新高考了解的概率;
(2)请根据上表完成下面2×2列联表,是否有95%的把握判断了解新高考与年龄(中青年、中老年)有关联?
了解新高考
不了解新高考
总计
中青年
中老年
总计
附:K2=.
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
(3)若从年龄在[55,65)的被调查者中随机选取3人进行调查,记选中的3人中了解新高考的人数为X,求X的分布列以及E(X).
解 (1)由题中数据可知,中青年对新高考了解的概率p==,
中老年对新高考了解的概率p==.
(2)2×2列联表如下所示
了解新高考
不了解新高考
总计
中青年
22
8
30
中老年
8
12
20
总计
30
20
50
则K2的观测值k=≈5.556>3.841,
所以有95%的把握判断了解新高考与年龄(中青年、中老年)有关联.
(3)年龄在[55,65)的被调查者共5人,其中了解新高考的有2人,则抽取的3人中了解新高考的人数X可能取值为0,1,2,
则P(X=0)=eq
\f(CC,C)=;P(X=1)=eq
\f(CC,C)==;
P(X=2)=eq
\f(CC,C)=.
所以X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×=.
A级 巩固提升
一、选择题
1.(2020·全国Ⅱ卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1
200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1
600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( )
A.10名
B.18名
C.24名
D.32名
解析 由题意,第二天新增订单数为500+1
600-1
200=900,设需要志愿者x名,则≥0.95,x≥17.1,故需要志愿者18名.
答案 B
2.(2020·新高考山东、海南卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( )
A.62%
B.56%
C.46%
D.42%
解析 记“该中学学生喜欢足球”为事件A,“该中学学生喜欢游泳”为事件B,
则“该中学学生喜欢足球或游泳”为事件A+B,“该中学学生既喜欢足球又喜欢游泳”为事件A·B,
则P(A)=0.6,P(B)=0.82,P(A+B)=0.96,
所以P(A·B)=P(A)+P(B)-P(A+B)=0.6+0.82-0.96=0.46,
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.
答案 C
3.(2019·浙江卷)设0X
0
a
1
P
则当a在(0,1)内增大时( )
A.D(X)增大
B.D(X)减小
C.D(X)先增大后减小
D.D(X)先减小后增大
解析 由题意知E(X)=0×+a×+1×=,
因此,D(X)=×+×+×
=[(-a-1)2+(2a-1)2+(2-a)2]=(6a2-6a+6)
=.
当0当故当a在(0,1)内增大时,D(X)先减小后增大.
答案 D
4.(多选题)(2020·临沂质检)某人参加一次测试,在备选的10道题中,他能答对其中的5道.现从备选的10题中随机抽出3题进行测试,规定至少答对2题才算合格,则下列选项正确的是( )
A.答对0题和答对3题的概率相同,都为
B.答对1题的概率为
C.答对2题的概率为
D.合格的概率为
解析 答对0题和答对3题的概率都为eq
\f(C,C)==,所以A错误;答对1题的概率为eq
\f(CC,C)==,所以B错误;答对2题的概率为eq
\f(CC,C)==,所以C正确;至少答对2题的概率为+=,所以D正确.故选CD.
答案 CD
5.(多选题)(2020·海南模拟)甲、乙、丙3人分别在政治、历史、地理、物理、化学、生物、技术7门学科中任选3门.若甲必选物理,则下列说法正确的是( )
A.甲、乙、丙3人至少有1人选化学与全选化学是对立事件
B.甲的不同选法种数为15
C.已知乙选了物理,则乙选技术的概率是
D.乙、丙2人都选物理的概率是
解析 甲、乙、丙3人至少有1人选化学与全不选化学是对立事件,A错误;由于甲必选物理,因此甲只需从剩下的6门课中选2门即可,有C=15种选法,B正确;由于乙选了物理,因此乙选技术的概率是eq
\f(C,C)=,C错误;乙、丙2人各自选物理的概率均为eq
\f(C,C)=,所以乙、丙2人都选物理的概率是×=,D正确.故选BD.
答案 BD
二、填空题
6.(2020·江苏卷)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是________.
解析 根据题意可得基本事件总数为6×6=36(个).
点数和为5的基本事件有(1,4),(4,1),(2,3),(3,2)共4个.∴出现向上的点数和为5的概率为p==.
答案
7.(2020·东北三校一联)近年来,新能源汽车技术不断推陈出新,新能源汽车不断涌现,在汽车市场上影响力不断增大.动力蓄电池技术作为新能源汽车的核心技术,它的不断成熟也是推动新能源汽车发展的主要动力.假定现在市场上销售的某款新能源汽车,其车载动力蓄电池充放电循环达到2
000次的概率为85%,充放电循环达到2
500次的概率为35%.若某用户的该款新能源汽车已经经过了2
000次充电,那么他的汽车能够充电2
500次的概率为________.
解析 设事件A:充放电循环达到2
000次,事件B:充放电循环达到2
500次,由题意可知P(A)=85%,P(AB)=35%,则P(B|A)===.
答案
8.甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是________.
解析 记事件M为甲队以4∶1获胜,
则甲队共比赛五场,且第五场甲队获胜,前四场甲队胜三场负一场,
所以P(M)=0.6×(0.62×0.52×2+0.6×0.4×0.52×2)=0.18.
答案 0.18
三、解答题
9.(2020·北京卷)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
男生
女生
支持
不支持
支持
不支持
方案一
200人
400人
300人
100人
方案二
350人
250人
150人
250人
假设所有学生对活动方案是否支持相互独立.
(1)分别估计该校男生支持方案一的概率,该校女生支持方案一的概率;
(2)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;
(3)将该校学生支持方案二的概率估计值记为p0,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为p1,试比较p0与p1的大小.(结论不要求证明)
解 (1)设该校男生支持方案一为事件A,该校女生支持方案一为事件B,
则P(A)==,P(B)==.
(2)设这3人中恰有2人支持方案一为事件C,则事件C包含2名男生支持方案一和1名男生1名女生支持方案一两种情况,
所以P(C)=C××+C×××=.
(3)p0==,设该校总人数为n,由题表知:男、女生支持方案二的概率分别为=,=,∴一年级支持方案二的约为500×+300×=404,∴除一年级外支持方案二的概率为p1==<,∴p0>p1.
10.(2020·江南十校联考)某省食品药品监管局对16个大学食堂的“进货渠道合格性”和“食品安全”进行量化评估,满分为10分,大部分大学食堂的评分在7~10分之间,以下表格记录了它们的评分情况:
分数段
[0,7)
[7,8)
[8,9)
[9,10]
食堂个数
1
3
8
4
(1)现从16个大学食堂中随机抽取3个,求至多有1个大学食堂的评分不低于9分的概率;
(2)以这16个大学食堂的评分数据评估全国的大学食堂的评分情况,若从全国的大学食堂中任选3个,记X表示抽到评分不低于9分的食堂个数,求X的分布列及数学期望.
解 (1)设Ai(i=0,1,2,3)表示“所抽取的3个大学食堂中有i个大学食堂评分不低于9分”,“至多有1个大学食堂评分不低于9分”记为事件A,
则P(A)=P(A0)+P(A1)=eq
\f(C,C)+eq
\f(CC,C)=.
(2)由表格数据知,从这16个大学食堂中任选1个,评分不低于9分的概率为=.
由题意知X~B,P(X=i)=C,i=0,1,2,3.
所以X的分布列为
X
0
1
2
3
P
数学期望E(X)=3×=.
B级 能力突破
11.为了解学生课外使用手机的情况,某学校收集了本校500名学生2020年10月课余使用手机的总时间(单位:小时)的情况.从中随机抽取了50名学生,将数据进行整理,得到如图所示的频率分布直方图.已知这50名学生中,恰有3名女生课余使用手机的总时间在[10,12],现在从课余使用手机总时间在[10,12]的样本对应的学生中随机抽取3名,则至少抽到2名女生的概率为( )
A.
B.
C.
D.
解析 ∵这50名学生中,恰有3名女生的课余使用手机总时间在[10,12],课余使用手机总时间在[10,12]的学生共有50×0.08×2=8(名),∴从课余使用手机总时间在[10,12]的学生中随机抽取3人,基本事件总数n=C=56,至少抽到2名女生包含的基本事件个数m=C+CC=16,则至少抽到2名女生的概率为p===.
答案 C
12.(2020·衡水中学检测)2020年“双十一”当天,某购物平台的销售业绩高达
2
135亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系,现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.9,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为140次.
(1)请完成下表,并判断是否可以在犯错误概率不超过0.5%的前提下,认为商品好评与服务好评有关?
对服务好评
对服务不满意
总计
对商品好评
140
对商品不满意
10
总计
200
(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全好评的次数为X.
①求随机变量X的分布列;
②求X的数学期望和方差.
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解 (1)由题意可得关于商品和服务评价的2×2列联表:
对服务好评
对服务不满意
总计
对商品好评
140
40
180
对商品不满意
10
10
20
总计
150
50
200
则K2的观测值k=≈7.407.
由于7.407<7.879,则不可以在犯错误概率不超过0.5%的前提下,认为商品好评与服务好评有关.
(2)①每次购物时,对商品和服务都好评的概率为,
由题意得X~B,P(X=k)=C,k=0,1,2,3,
故X的分布列为
X
0
1
2
3
P
②E(X)=3×=,D(X)=3××=.(共20张PPT)
规范答题示范课——概率与统计解答题
[破题之道] 概率与统计问题需要从数据中获取有用的信息,通过数据的筛选、分析构建相关模型特别是从图表、直方图、茎叶图中获取信息,利用图表信息进行数据分析.
解题的关键是“辨”——辨析、辨型,求解要抓住几点:
(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立、独立等;
(2)理清事件以什么形式发生,如同时发生、至少有几个发生、至多有几个发生、恰有几个发生等;
(3)明确抽取方式,是放回还是不放回、抽取有无顺序等;
(4)准确选择排列组合的方法来计算基本事件发生数和事件总数,或根据概率计算公式和性质来计算事件的概率;
【典例示范】
(12分)(2019·全国Ⅰ卷)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列.
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
②求p4,并根据p4的值解释这种试验方案的合理性.
规范解答 (1)X的所有可能取值为-1,0,1.1分
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)(1-β),
P(X=1)=α(1-β),3分
所以X的分布列为
X
-1
0
1
P
(1-α)β
αβ+(1-α)(1-β)
α(1-β)
4分
(2)①证明 由(1)得a=0.4,b=0.5,c=0.1,
因此pi=0.4pi-1+0.5pi+0.1pi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1),
则pi+1-pi=4(pi-pi-1).6分
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列.8分
[高考状元满分心得]
?写全得分步骤:对于解题过程中是得分点的步骤,有则给分,无则没分,所以对于得分点步骤一定要写全.如第(1)问中,写出随机变量X的可能取值,第(2)问中说明{pi+1-pi}的公比,首项,利用p4的值说明最后的结论合理性等.
?写明得分关键:对于解题过程中的关键点,有则给分,无则没分,所以在答题时一定要写清得分关键点,如第(1)问分布列必须用表格表示,第(2)问中pi+1-pi=4(pi-pi-1)的关系式及条件p1-p0=p1≠0,否则都会导致扣分.
?正确计算是得满分的关键:如第(2)问中累加求p8与p1的关系,由p8求p1,p4的值,若出错,会每次扣去1分.
[满分体验]
1.(2020·西安模拟)某生物研究小组准备探究某地区蜻蜓的翼长分布规律,据统计该地区蜻蜓有A,B两种,且这两种的个体数量大致相等.记A种蜻蜓和B种蜻蜓的翼长(单位:mm)分别为随机变量X,Y,其中X服从正态分布N(45,25),Y服从正态分布N(55,25).
(3)在(2)的条件下,从该地区的蜻蜓中随机捕捉3只,记这3只中翼长在区间[42.2,57.8]的个数为W,求W的分布列及数学期望(分布列写出计算表达式即可).
注:若X~N(μ,σ2),则P(μ-0.64σ≤X≤μ+0.64σ)≈0.477
3,P(μ-σ≤X≤μ+σ)≈0.682
7,P(μ-2σ≤X≤μ+2σ)≈0.954
6.
解 (1)记这只蜻蜓的翼长为t.
因为A种蜻蜓和B种蜻蜓的个体数量大致相等,所以这只蜻蜓是A种还是B种的可能性是相等的.
(2)由于两种蜻蜓的个体数量相等,X,Y的方差也相等,
(3)设蜻蜓的翼长为T,则P(42.2≤T≤57.8)=P(μ-σ≤T≤μ+σ)=0.682
7.
因此W的分布列为
E(W)=3×0.682
7=2.048
1.
2.(2019·北京卷)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:
支付金额(元)
支付方式
(0,1
000]
(1
000,2
000]
大于2
000
仅使用A
18人
9人
3人
仅使用B
10人
14人
1人
(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;
(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1
000元的人数,求X的分布列和数学期望;
(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2
000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2
000元的人数有变化?说明理由.
解 (1)由题意知,样本中仅使用A的学生有18+9+3=30(人),仅使用B的学生有10+14+1=25(人),A,B两种支付方式都不使用的学生有5人,
故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).
(2)X的所有可能值为0,1,2.记事件C为“从样本仅使用A的学生中随机抽取1人,该学生上个月的支付金额大于1
000元”,事件D为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于1
000元”.
所以X的分布列为
X
0
1
2
P
0.24
0.52
0.24
故X的数学期望E(X)=0×0.24+1×0.52+2×0.24=1.
(3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额都大于2
000元”.
假设样本仅使用A的学生中,本月支付金额大于2
000元的人数没有变化.
答案示例1:可以认为有变化.理由如下:
P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2
000元的人数发生了变化,所以可以认为有变化.
答案示例2:无法确定有没有变化.理由如下:
事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.规范答题示范课——概率与统计解答题
[破题之道] 概率与统计问题需要从数据中获取有用的信息,通过数据的筛选、分析构建相关模型特别是从图表、直方图、茎叶图中获取信息,利用图表信息进行数据分析.
解题的关键是“辨”——辨析、辨型,求解要抓住几点:
(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立、独立等;
(2)理清事件以什么形式发生,如同时发生、至少有几个发生、至多有几个发生、恰有几个发生等;
(3)明确抽取方式,是放回还是不放回、抽取有无顺序等;
(4)准确选择排列组合的方法来计算基本事件发生数和事件总数,或根据概率计算公式和性质来计算事件的概率;
(5)确定随机变量取值并求其对应的概率,写出分布列后再求均值、方差;
(6)会套用求,K2的公式,再作进一步求值与分析.
【典例示范】
(12分)(2019·全国Ⅰ卷)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列.
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
②求p4,并根据p4的值解释这种试验方案的合理性.
规范解答 (1)X的所有可能取值为-1,0,1.1分
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)(1-β),
P(X=1)=α(1-β),3分
所以X的分布列为
X
-1
0
1
P
(1-α)β
αβ+(1-α)(1-β)
α(1-β)
4分
(2)①证明 由(1)得a=0.4,b=0.5,c=0.1,
因此pi=0.4pi-1+0.5pi+0.1pi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1),
则pi+1-pi=4(pi-pi-1).6分
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列.8分
②由①得p8=p8-p7+p7-p6+…+p1-p0+p0
=(p8-p7)+(p7-p6)+…+(p1-p0)+p0=p1.9分
由于p8=1,故p1=,10分
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)+p0
=p1=.11分
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003
9,此时得出错误结论的概率非常小,说明这种试验方案合理.12分
[高考状元满分心得]
?写全得分步骤:对于解题过程中是得分点的步骤,有则给分,无则没分,所以对于得分点步骤一定要写全.如第(1)问中,写出随机变量X的可能取值,第(2)问中说明{pi+1-pi}的公比,首项,利用p4的值说明最后的结论合理性等.
?写明得分关键:对于解题过程中的关键点,有则给分,无则没分,所以在答题时一定要写清得分关键点,如第(1)问分布列必须用表格表示,第(2)问中pi+1-pi=4(pi-pi-1)的关系式及条件p1-p0=p1≠0,否则都会导致扣分.
?正确计算是得满分的关键:如第(2)问中累加求p8与p1的关系,由p8求p1,p4的值,若出错,会每次扣去1分.
[满分体验]
1.(2020·西安模拟)某生物研究小组准备探究某地区蜻蜓的翼长分布规律,据统计该地区蜻蜓有A,B两种,且这两种的个体数量大致相等.记A种蜻蜓和B种蜻蜓的翼长(单位:mm)分别为随机变量X,Y,其中X服从正态分布N(45,25),Y服从正态分布N(55,25).
(1)从该地区的蜻蜓中随机捕捉一只,求这只蜻蜓的翼长在区间[45,55]的概率;
(2)记该地区蜻蜓的翼长为随机变量Z,若用正态分布N(μ0,σ)来近似描述Z的分布,请你根据(1)中的结果,求参数μ0和σ0的值(精确到0.1);
(3)在(2)的条件下,从该地区的蜻蜓中随机捕捉3只,记这3只中翼长在区间[42.2,57.8]的个数为W,求W的分布列及数学期望(分布列写出计算表达式即可).
注:若X~N(μ,σ2),则P(μ-0.64σ≤X≤μ+0.64σ)≈0.477
3,P(μ-σ≤X≤μ+σ)≈0.682
7,P(μ-2σ≤X≤μ+2σ)≈0.954
6.
解 (1)记这只蜻蜓的翼长为t.
因为A种蜻蜓和B种蜻蜓的个体数量大致相等,所以这只蜻蜓是A种还是B种的可能性是相等的.
所以P(45≤t≤55)=×P(45≤X≤55)+×P(45≤Y≤55)
=×P(45≤X≤45+2×5)+×P(55-2×5≤Y≤55)
=×+×=0.477
3.
(2)由于两种蜻蜓的个体数量相等,X,Y的方差也相等,
根据正态曲线的对称性,可知μ0==50.0.
由(1)可知45=μ0-0.64σ0,55=μ0+0.64σ0,得σ0=≈7.8.
(3)设蜻蜓的翼长为T,则P(42.2≤T≤57.8)=P(μ-σ≤T≤μ+σ)=0.682
7.
由题有W~B(3,0.682
7),所以P(W=k)=C×0.682
7k×0.317
33-k.
因此W的分布列为
W
0
1
2
3
P
C×0.317
33
C×0.682
71×0.317
32
C×0.682
72×0.317
31
C×0.682
73
E(W)=3×0.682
7=2.048
1.
2.(2019·北京卷)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:
支付金额(元)支付方式
(0,1
000]
(1
000,2
000]
大于2
000
仅使用A
18人
9人
3人
仅使用B
10人
14人
1人
(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;
(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1
000元的人数,求X的分布列和数学期望;
(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2
000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2
000元的人数有变化?说明理由.
解 (1)由题意知,样本中仅使用A的学生有18+9+3=30(人),仅使用B的学生有10+14+1=25(人),A,B两种支付方式都不使用的学生有5人,
故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).
所以从全校学生中随机抽取1人,该学生上个月A,B两种支付方式都使用的概率估计为=0.4.
(2)X的所有可能值为0,1,2.
记事件C为“从样本仅使用A的学生中随机抽取1人,该学生上个月的支付金额大于1
000元”,事件D为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于1
000元”.
由题设知,事件C,D相互独立,且P(C)==0.4,P(D)==0.6,
所以P(X=2)=P(CD)=P(C)P(D)=0.24,
P(X=1)=P(C∪D)=P(C)P()+P()P(D)
=0.4×(1-0.6)+(1-0.4)×0.6=0.52,
P(X=0)=P(
)=P()P()=0.24.
所以X的分布列为
X
0
1
2
P
0.24
0.52
0.24
故X的数学期望E(X)=0×0.24+1×0.52+2×0.24=1.
(3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额都大于2
000元”.
假设样本仅使用A的学生中,本月支付金额大于2
000元的人数没有变化.
则由上个月的样本数据得P(E)=eq
\f(1,C)=.
答案示例1:可以认为有变化.理由如下:
P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2
000元的人数发生了变化,所以可以认为有变化.
答案示例2:无法确定有没有变化.理由如下:
事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.