第4课时 概率、统计的综合问题
[考试要求] 1.能从实际生活背景中构建概率模型,并会用统计思维看待和处理实际问题.2.能灵活运用概率、统计、数列、函数、导数等知识解决综合问题,实现知识间的融合.
考点一 以统计图表为载体的概率、统计问题
[典例1] (2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图.
(1)估计该地区这种疾病患者的平均年龄;(同一组中的数据用该组区间的中点值作代表)
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%,从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1)
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
该类问题常常借助图形或表格,将文字、图表、数据等融为一体,考查考生的直观想象能力和数学建模素养,求解的关键是立足题干提取信息,结合统计的相关知识进行数据分析或结合概率模型求解相应概率.
[跟进训练]
1. AI技术驱动的自然语言处理工具引领了人工智能的新一轮创新浪潮.某数学兴趣小组为了解使用此类工具人群中年龄与是否喜欢该程序的关系,从某社区使用过该程序的人群中随机抽取了200名居民进行调查,并依据年龄样本数据绘制了如下频率分布直方图.
(1)根据频率分布直方图,估计年龄样本数据的75%分位数:
(2)将年龄不超过(1)中75%分位数的居民视为青年居民,否则视为非青年居民.
①完成下列2×2列联表,根据小概率值α=0.05的独立性检验,能否认为年龄与是否喜欢该程序有关联?
单位:人
对该程序的态度 年龄 合计
青年 非青年
喜欢 20
不喜欢 60
合计 200
②按照等比例分配分层随机抽样的方式从样本中随机抽取8名居民.若从选定的这8名居民中随机抽取4名居民做进一步调查,求这4名居民中至少有3人为青年居民的概率.
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
考点二 概率、统计与数列的综合问题
[典例2] (2023·新高考Ⅰ卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.求:
(1)第2次投篮的人是乙的概率;
(2)第i次投篮的人是甲的概率;
(3)已知:若随机变量Xi服从两点分布,且P(Xi=1)=1-P(Xi=0)=qi,i=1,2,…,n,则=.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
解答此类问题的关键是借助概率知识(如相互独立事件的概率公式、条件概率的公式等)建立Pn+1与Pn的递推关系,然后利用数列知识(一般是构造法)求解.
[跟进训练]
2.甲、乙两位乒乓球爱好者进行一次对抗赛,第一个球的发球权通过掷硬币确定,从第二个球开始,上一个球谁赢谁发球.由以往数据可知,甲发球甲赢的概率为,乙发球甲赢的概率为.
(1)求第1个球甲赢的概率p1;
(2)求第n个球甲赢的概率pn;
(3)定义第n个球甲赢的期望En=npn,求
_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
考点三 概率、统计与函数的交汇问题
[典例3] (15分)根据社会人口学研究发现,一个家庭有X个孩子的概率模型为
X 1 2 3 0
P α α(1-p) α(1-p)2
其中α>0,0<p<1.每个孩子的性别是男孩还是女孩的概率均为且相互独立,事件Ai表示一个家庭有i个孩子(i=0,1,2,3),事件B表示一个家庭的男孩比女孩多(例如:一个家庭恰有一个男孩,则该家庭男孩多).
(1)若p=,求α及P(B);
(2)为了调控未来人口结构,其中参数p受到各种因素的影响(例如生育保险的增加,教育、医疗福利的增加等).
①若希望P(X=2)增大,如何调控p的值?
②是否存在p的值使得E(X)=?请说明理由.
【规范解答】 (1)由题意得+α+α(1-p)+α(1-p)2=1,p=,解得α=.1分
又因为P(B|A1)=,P(B|A2)==,
····················4分
所以P(B)===(i=1,2,3).···6分
(2)①由已知
变形整理得,=p2-3p++3. ······························8分
可设f (p)=p2-3p++3,0<p<1,
所以f ′(p)=.·········································9分
设g(p)=2p3-3p2-1,
即g′(p)=6p2-6p=6p(p-1)<0,
故g(p)在(0,1)上单调递减,
因为g(0)=-1,所以g(p)<0,所以f ′(p)<0,
故f (p)在(0,1)上单调递减,所以增加p的取值,会减小,α增大,即P(X=2)增大.························································10分
②假设存在p使E(X)=+2α+3α(1-p)=,·····················11分
又因为=p2-3p++3,
将上述两等式相乘,化简整理得:
5p3-6p2+2=0,············································12分
设h(p)=5p3-6p2+2,0<p<1,
即h′(p)=15p2-12p=3p(5p-4).······························13分
所以h(p)在上单调递减,在上单调递增,故h(p)min=h=>0.
所以不存在p,使得E(X)=.·································15分
该类问题常以实际生活中的概率、统计知识为背景,将概率、统计与函数建模融合在一起,充分借助函数的性质研究相关问题的最值,可能涉及函数的单调性、导数等知识,求解时注意合理转化.
[跟进训练]
3.(2024·郑州调研)某篮球队为提高队员训练的积极性,进行小组投篮游戏,每个小组由两名队员组成,队员甲与队员乙组成一个小组.游戏规则如下:每个小组的两名队员在每轮游戏中分别投篮两次,每小组投进的次数之和不少于3的称为“神投小组”,已知甲、乙两名队员投进篮球的概率分别为p1,p2.
(1)若p1=,p2=,求他们在第一轮游戏中获得“神投小组”称号的概率;
(2)已知p1+p2=,则
①p1,p2取何值时能使得甲、乙两名队员在一轮游戏中获得“神投小组”称号的概率最大?并求出此时的最大概率;
②在第①问的前提下,若甲、乙两名队员想要获得297次“神投小组”的称号,则他们平均要进行多少轮游戏?
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
第4课时 概率、统计的综合问题
考点一
典例1 解:(1)该地区这种疾病患者的平均年龄=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)设A={一人患这种疾病的年龄在区间[20,70)},则P(A)=1-P()=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.
(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式,
得P(C|B)==
=0.001 437 5≈0.001 4.
跟进训练
1.解:(1)由频率分布直方图可知,
年龄在40岁以下的居民所占比例为10×=0.65,
年龄在50岁以下的居民所占比例为0.65+10×0.020=0.85,
所以75%分位数位于[40,50)内,
由40+10×=45,
所以样本数据的75%分位数为45.
(2)①由题知,2×2列联表为
单位:人
对该程序的态度 年龄 合计
青年 非青年
喜欢 90 20 110
不喜欢 60 30 90
合计 150 50 200
零假设为H0:年龄与是否喜欢该程序无关.
根据列联表中的数据,可得
χ2=≈6.061>3.841=x0.05.
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为年龄与是否喜欢该程序有关,以此推断的错误概率不大于0.05.
②按照分层随机抽样,青年居民应抽取8×=6(人),非青年居民应抽取2人.
设从中随机抽取的4名居民中为青年居民的人数为X,
P==,
P==,
所以P=P+P=,
所以这4名居民中至少有3人为青年居民的概率为.
考点二
典例2 解:(1)记“第2次投篮的人是乙”为事件A,“第1次投篮的人是甲”为事件B,则A=BA+A,
所以P(A)=P(BA+)=0.5×(1-0.6)+0.5×0.8=0.6.
(2)设第i次投篮的人是甲的概率为pi,由题意可知,p1=,pi+1=pi×0.6+(1-pi)×(1-0.8),即pi+1=0.4pi+0.2=pi+,
所以pi+1-=,
又p1-==,所以数列是以为首项,为公比的等比数列,
所以pi-=,
所以pi=.
(3)设第i次投篮时甲投篮的次数为Xi,则Xi的可能取值为0或1,当Xi=0时,表示第i次投篮的人是乙,当Xi=1时,表示第i次投篮的人是甲,所以P(Xi=1)=pi,P(Xi=0)=1-pi,所以E(Xi)=pi.
Y=X1+X2+X3+…+Xn,
则E(Y)=E(X1+X2+X3+…+Xn)=p1+p2+p3+…+pn,由(2)知,pi=,
所以E(Y)=p1+p2+p3+…+pn= == .
跟进训练
2.解:(1)设第1个球的发球人为甲为事件A0,第1个球的发球人为乙为事件B0,第1个球甲赢为事件A1,由题知,P(A0)=P(B0)=,P(A1|A0)=,P(A1|B0)=,
由全概率公式知,p1=P(A1)=P(A0)P(A1|A0)+P(B0)P(A1|B0)==,
∴第1个球甲赢的概率p1=.
(2)设事件An:第n个球甲赢,事件Bn:第n个球乙赢,
由题知,当n≥2时,P(An|An-1)=,P(An|Bn-1)=,P(Bn-1)=1-pn-1,p1=,
由全概率公式知,当n≥2时,pn=P(An)=P(An|An-1)P(An-1)+P(An|Bn-1)P(Bn-1)=pn-1+(1-pn-1)=pn-1+,
∴pn-=,
∵p1-==,
∴数列是首项为,公比为的等比数列,
∴pn-=,
∴pn=+.
(3)由(2)知,En=npn=+.
设数列的前n项和为Tn,
则Tn=++…+,①
∴Tn=++…++,②
①-②得,Tn=+…+-
==-,
∴Tn=,
易知数列的前n项和为,
考点三
跟进训练
3.解:(1)每个小组投进的次数之和不少于3的称为“神投小组”,
则可能的情况有①甲投中一次,乙投中两次;②甲投中两次,乙投中一次;③甲投中两次,乙投中两次.
∵p1=,p2=,
∴他们在第一轮游戏中获得“神投小组”称号的概率为=.
(2)①由题意得他们在一轮游戏中获得“神投小组”称号的概率为
P==.
∵p1+p2=,∴P=.
又0≤p1≤1,0≤p2≤1,p1+p2=,
∴≤p1≤1.
令m=p1p2=+p1=-+,
则m∈,
∴P=f (m)=-3m2+m
=-3+.
∵P=-3m2+m在 上单调递增,
∴Pmax=f=,
此时p1=p2=.
②他们小组在n轮游戏中获得“神投小组”称号的次数ξ满足ξ~B,
∵np=297,则n==625,
∴平均要进行625轮游戏.
6 / 6(共91张PPT)
第十章
统计与成对数据的统计分析
第4课时 概率、统计的综合问题
[考试要求] 1.能从实际生活背景中构建概率模型,并会用统计思维看待和处理实际问题.
2.能灵活运用概率、统计、数列、函数、导数等知识解决综合问题,实现知识间的融合.
考点一 以统计图表为载体的概率、统计问题
[典例1] (2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图.
典例精研·核心考点
(1)估计该地区这种疾病患者的平均年龄;(同一组中的数据用该组区间的中点值作代表)
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%,从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1)
解:(1)该地区这种疾病患者的平均年龄=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)设A={一人患这种疾病的年龄在区间[20,70)},则P(A)=1-P()=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.
(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式,
得P(C|B)===0.001 437 5≈0.001 4.
名师点评 该类问题常常借助图形或表格,将文字、图表、数据等融为一体,考查考生的直观想象能力和数学建模素养,求解的关键是立足题干提取信息,结合统计的相关知识进行数据分析或结合概率模型求解相应概率.
[跟进训练]
1.AI技术驱动的自然语言处理工具引领了人工智能的新一轮创新浪潮.某数学兴趣小组为了解使用此类工具人群中年龄与是否喜欢该程序的关系,从某社区使用过该程序的人群中随机抽取了200名居民进行调查,并依据年龄样本数据绘制了
如下频率分布直方图.
(1)根据频率分布直方图,估计年龄样本数据的75%分位数:
(2)将年龄不超过(1)中75%分位数的居民视为青年居民,否则视为非青年居民.
①完成下列2×2列联表,根据小概率值α=0.05的独立性检验,能否认为年龄与是否喜欢该程序有关联?
单位:人
对该程序的态度 年龄 合计
青年 非青年
喜欢 20
不喜欢 60
合计 200
②按照等比例分配分层随机抽样的方式从样本中随机抽取8名居民.若从选定的这8名居民中随机抽取4名居民做进一步调查,求这4名居民中至少有3人为青年居民的概率.
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
解:(1)由频率分布直方图可知,
年龄在40岁以下的居民所占比例为10×=0.65,
年龄在50岁以下的居民所占比例为0.65+10×0.020=0.85,
所以75%分位数位于[40,50)内,
由40+10×=45,
所以样本数据的75%分位数为45.
(2)①由题知,2×2列联表为
单位:人
对该程序的态度 年龄 合计
青年 非青年
喜欢 90 20 110
不喜欢 60 30 90
合计 150 50 200
零假设为H0:年龄与是否喜欢该程序无关.
根据列联表中的数据,可得
χ2=≈6.061>3.841=x0.05.
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为年龄与是否喜欢该程序有关,以此推断的错误概率不大于0.05.
②按照分层随机抽样,青年居民应抽取8×=6(人),非青年居民应抽取2人.
设从中随机抽取的4名居民中为青年居民的人数为X,
P==,
P==,
所以P=P+P=,
所以这4名居民中至少有3人为青年居民的概率为.
【教用·备选题】
某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数 [0,5) [5,10) [10,15) [15,20) [20,25) [25,30]
人数 4 15 33 31 11 6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布N(μ,σ2),其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3 000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在[15,30]的学生中有30名男生,天数在[0,15)的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动不低于15天的学生授予“运动达人”称号.请填写下面列联表:
单位:人
性别 活动天数 合计
[0,15) [15,30]
男生
女生
合计
依据小概率值α=0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
参考数据:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
解:(1)由频数分布表知
μ=×(4×2.5+15×7.5+33×12.5+31×17.5+11×22.5+6×27.5)=14.9,
则X~N(14.9,6.12),
∵P(μ-σ≤X≤μ+σ)≈0.682 7,
∴P(X>21)=P(X>14.9+6.1)
≈=0.158 65,
∴3 000×0.158 65=475.95≈476,
∴参加“每天锻炼1小时”活动超过21天的人数约为476.
(2)由频数分布表知,锻炼活动的天数在[0,15)的人数为4+15+33=52,
∵参加“每天锻炼1小时”活动的天数在[0,15)的学生中有20名男生,
∴参加“每天锻炼1小时”活动的天数在[0,15)的学生中女生人数为52-20=32.
由频数分布表知,锻炼活动的天数在[15,30]的人数为31+11+6=48,
∵参加“每天锻炼1小时”活动的天数在[15,30]的学生中有30名男生,
∴参加“每天锻炼1小时”活动的天数在[15,30]的学生中女生人数为48-30=18.
列联表如下:
单位:人
性别 活动天数 合计
[0,15) [15,30]
男生 20 30 50
女生 32 18 50
合计 52 48 100
零假设为H0:学生性别与获得“运动达人”称号无关,
χ2=≈5.769>3.841,
依据α=0.05的独立性检验,我们推断H0不成立,
即可以认为学生性别与获得“运动达人”称号有关,以此推断犯错误的概率不大于0.05.
根据列联表中的数据得到,男生、女生中活动天数不低于15天的频率分别为=0.6和=0.36,可见男生中获得“运动达人”称号的频率是女生中获得“运动达人”称号频率的≈1.67倍,于是依据频率稳定与概率的原理,我们可以认为男生获得“运动达人”的概率大于女生,即男生更容易获得“运动达人”称号.
考点二 概率、统计与数列的综合问题
[典例2] (2023·新高考Ⅰ卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.求:
(1)第2次投篮的人是乙的概率;
(2)第i次投篮的人是甲的概率;
(3)已知:若随机变量Xi服从两点分布,且P(Xi=1)=1-P(Xi=0)=qi,i=1,2,…,n,则 .记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).
=
解:(1)记“第2次投篮的人是乙”为事件A,“第1次投篮的人是甲”为事件B,则A=BA+A,
所以P(A)=P(BA+)=0.5×(1-0.6)+0.5×0.8=0.6.
(2)设第i次投篮的人是甲的概率为pi,由题意可知,p1=,pi+1=pi×0.6+(1-pi)×(1-0.8),即pi+1=0.4pi+0.2=pi+,
所以pi+1-=,
又p1-==,所以数列是以为首项,为公比的等比数列,
所以pi-=,
所以pi=.
(3)设第i次投篮时甲投篮的次数为Xi,则Xi的可能取值为0或1,当Xi=0时,表示第i次投篮的人是乙,当Xi=1时,表示第i次投篮的人是甲,所以P(Xi=1)=pi,P(Xi=0)=1-pi,所以E(Xi)=pi.
Y=X1+X2+X3+…+Xn,
则E(Y)=E(X1+X2+X3+…+Xn)=p1+p2+p3+…+pn,由(2)知,pi=,
所以E(Y)=p1+p2+p3+…+pn= == .
名师点评 解答此类问题的关键是借助概率知识(如相互独立事件的概率公式、条件概率的公式等)建立Pn+1与Pn的递推关系,然后利用数列知识(一般是构造法)求解.
[跟进训练]
2.甲、乙两位乒乓球爱好者进行一次对抗赛,第一个球的发球权通过掷硬币确定,从第二个球开始,上一个球谁赢谁发球.由以往数据可知,甲发球甲赢的概率为,乙发球甲赢的概率为.
(1)求第1个球甲赢的概率p1;
(2)求第n个球甲赢的概率pn;
(3)定义第n个球甲赢的期望En=npn,求
解:(1)设第1个球的发球人为甲为事件A0,第1个球的发球人为乙为事件B0,第1个球甲赢为事件A1,由题知,P(A0)=P(B0)=,P(A1|A0)=,P(A1|B0)=,
由全概率公式知,p1=P(A1)=P(A0)P(A1|A0)+P(B0)P(A1|B0)==,
∴第1个球甲赢的概率p1=.
(2)设事件An:第n个球甲赢,事件Bn:第n个球乙赢,
由题知,当n≥2时,P(An|An-1)=,P(An|Bn-1)=,P(Bn-1)=1-pn-1,p1=,
由全概率公式知,当n≥2时,pn=P(An)=P(An|An-1)P(An-1)+P(An|Bn-1)P(Bn-1)=pn-1+(1-pn-1)=pn-1+,
∴pn-=,
∵p1-==,
∴数列是首项为,公比为的等比数列,
∴pn-=,
∴pn=+.
(3)由(2)知,En=npn=+.
设数列的前n项和为Tn,
则Tn=++…+,①
∴Tn=++…++,②
①-②得,Tn=+…+-==-,
∴Tn=,
易知数列的前n项和为,
【教用·备选题】
1.(2019·全国Ⅰ卷)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未
治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
②求p4,并根据p4的值解释这种试验方案的合理性.
解:(1)由题意可知X所有可能的取值为-1,0,1.
P=β,
P=αβ+,
P=α.
则X的分布列为
X -1 0 1
P β αβ+ α
(2)∵α=0.5,β=0.8,
∴a=0.5×0.8=0.4,b=0.5×0.8+0.5×0.2=0.5,c=0.5×0.2=0.1.
①证明:∵pi=api-1+bpi+cpi+1(i=1,2,…,7),
即pi=0.4pi-1+0.5pi+0.1pi+1(i=1,2,…,7),
整理可得:5pi=4pi-1+pi+1,
∴pi+1-pi=4,
又∵p1-p0=p1≠0,
∴是以p1为首项,4为公比的等比数列.
②由①知:pi+1-pi=·4i=p1·4i,
∴p8-p7=p1·47,p7-p6==p1·40.
作和可得:p8-p0=p1·=p1=p1=1,∴p1=,
∴p4=p4-p0=p1·=p1===.
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理.
2.踢毽子在我国流传很广,有着悠久的历史,是一项传统民间体育活动.某次体育课上,甲、乙、丙、丁四人一起踢毽子.毽子在四人中传递,先从甲开始,甲传给乙、丙、丁的概率均为;当乙接到毽子时,乙传给甲、丙、丁的概率分别为;当丙接到毽子时,丙传给甲、乙、丁的概率分别为;当丁接到毽子时,丁传给甲、乙、丙的概率分别为.假设毽子一直没有掉地上,经过n次传毽子后,毽子被甲、乙、丙、丁接到的概率分别为an,bn,cn,dn,已知a1=0.
(1)记丁在前2次传毽子中,接到毽子的次数为X,求X的分布列;
(2)证明为等比数列,并判断经过150次传毽子后甲接到毽子的概率与的大小.
解:(1)X的所有可能取值为0,1,
P(X=0)=2×=,
P(X=1)=+2×=,
所以X的分布列为
X 0 1
P
(2)证明:当n≥2且n∈N*时,
an=bn-1+cn-1+dn-1.
bn=an-1+cn-1+dn-1,
cn=an-1+bn-1+dn-1,
dn=an-1+bn-1+cn-1,
所以bn+cn+dn=an-1+(bn-1+cn-1+dn-1)=an-1+2an,
因为an=bn-1+cn-1+dn-1,所以3an+1=bn+cn+dn,
所以3an+1=2an+an-1,所以3an+1+an=3an+an-1,
因为a1=0,a2=,所以3an+an-1=1,
所以=-.
所以是首项为-,公比q=-的等比数列,
所以an-=-,
即an=-+,
所以a150=-+=+>,
故经过150次传毽子后甲接到毽子的概率大于.
考点三 概率、统计与函数的交汇问题
[典例3] (15分)根据社会人口学研究发现,一个家庭有X个孩子的概率模型为
X 1 2 3 0
P α α(1-p) α(1-p)2
其中α>0,0<p<1.每个孩子的性别是男孩还是女孩的概率均为且相互独立,事件Ai表示一个家庭有i个孩子(i=0,1,2,3),事件B表示一个家庭的男孩比女孩多(例如:一个家庭恰有一个男孩,则该家庭男孩多).
(1)若p=,求α及P(B);
(2)为了调控未来人口结构,其中参数p受到各种因素的影响(例如生育保险的增加,教育、医疗福利的增加等).
①若希望P(X=2)增大,如何调控p的值?
②是否存在p的值使得E(X)=?请说明理由.
【规范解答】 (1)由题意得+α+α(1-p)+α(1-p)2=1,p=,解得α=. ····················· 1分
又因为P(B|A1)=,P(B|A2)==,
·····4分
所以P(B)=
==(i=1,
2,3). ····················· 6分
(2)①由已知
变形整理得,=p2-3p++3.·············8分
可设f (p)=p2-3p++3,0<p<1,
所以f ′(p)=. ·················9分
设g(p)=2p3-3p2-1,
即g′(p)=6p2-6p=6p(p-1)<0,
故g(p)在(0,1)上单调递减,
因为g(0)=-1,所以g(p)<0,所以f ′(p)<0,
故f (p)在(0,1)上单调递减,所以增加p的取值,会减小,α增大,即P(X=2)增大. ···················10分
②假设存在p使E(X)=+2α+3α(1-p)=,········11分
又因为=p2-3p++3,
将上述两等式相乘,化简整理得:
5p3-6p2+2=0,···················12分
设h(p)=5p3-6p2+2,0<p<1,
即h′(p)=15p2-12p=3p(5p-4). ············13分
所以h(p)在上单调递减,在上单调递增,故h(p)min=h=>0.
所以不存在p,使得E(X)=.··············15分
名师点评 该类问题常以实际生活中的概率、统计知识为背景,将概率、统计与函数建模融合在一起,充分借助函数的性质研究相关问题的最值,可能涉及函数的单调性、导数等知识,求解时注意合理转化.
[跟进训练]
3.(2024·郑州调研)某篮球队为提高队员训练的积极性,进行小组投篮游戏,每个小组由两名队员组成,队员甲与队员乙组成一个小组.游戏规则如下:每个小组的两名队员在每轮游戏中分别投篮两次,每小组投进的次数之和不少于3的称为“神投小组”,已知甲、乙两名队员投进篮球的概率分别为p1,p2.
(1)若p1=,p2=,求他们在第一轮游戏中获得“神投小组”称号的概率;
(2)已知p1+p2=,则
①p1,p2取何值时能使得甲、乙两名队员在一轮游戏中获得“神投小组”称号的概率最大?并求出此时的最大概率;
②在第①问的前提下,若甲、乙两名队员想要获得297次“神投小组”的称号,则他们平均要进行多少轮游戏?
解:(1)每个小组投进的次数之和不少于3的称为“神投小组”,
则可能的情况有①甲投中一次,乙投中两次;②甲投中两次,乙投中一次;③甲投中两次,乙投中两次.
∵p1=,p2=,
∴他们在第一轮游戏中获得“神投小组”称号的概率为=.
(2)①由题意得他们在一轮游戏中获得“神投小组”称号的概率为
P==.
∵p1+p2=,∴P=.
又0≤p1≤1,0≤p2≤1,p1+p2=,
∴≤p1≤1.
令m=p1p2=+p1=-+,
则m∈,
∴P=f (m)=-3m2+m=-3+.
∵P=-3m2+m在 上单调递增,
∴Pmax=f =,
此时p1=p2=.
②他们小组在n轮游戏中获得“神投小组”称号的次数ξ满足ξ~B,
∵np=297,则n==625,
∴平均要进行625轮游戏.
【教用·备选题】
(2021·新高考Ⅱ卷)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3).
(1)已知p0=0.4,p1=0.3,p2=0.2,p3=0.1,求E(X);
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1时,p<1;
(3)根据你的理解说明第(2)问结论的实际含义.
解:(1)E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.
(2)法一(常规求导):
p0+p1x+p2x2+p3x3-x=0,x>0,
令f (x)=p0+p1x+p2x2+p3x3-x,
f ′(x)=p1+2p2x+3p3x2-1,
令g(x)=f ′(x),则g′(x)=2p2+6p3x>0,
∴f ′(x)在(0,+∞)上单调递增,
当E(X)=p1+2p2+3p3≤1时,注意到x∈(0,1]时,f ′(x)≤f ′(1)=p1+2p2+3p3-1≤0,∴f (x)在(0,1]上单调递减,注意到f (1)=0,∴x=1,即p=1.
当E(X)=p1+2p2+3p3>1时,注意到f ′(0)=p1-1<0,
f ′(1)=p1+2p2+3p3-1>0,
∴存在唯一的x0∈(0,1)使f ′(x0)=0,且当0<x<x0时,f ′(x)<0,f (x)单调递减;
当x0<x<1时,f ′(x)>0,f (x)单调递增,
注意到f (0)=p0>0,f (1)=0,
∴f (x0)<f (1)=0.
∴f (x)在(0,x0)上有一个零点x1,另一个零点为1,∴p=x1<1.
法二(巧妙因式分解):
由题意知p0+p1+p2+p3=1,E(X)=p1+2p2+3p3,
由p0+p1x+p2x2+p3x3=x p0+p2x2+p3x3-(1-p1)x=0,
∴p0+p2x2+p3x3-(p0+p2+p3)x=0 p0(1-x)+p2x(x-1)+p3x(x-1)(x+1)=0,
(x-1)[p3x2+(p2+p3)x-p0]=0,
令f (x)=p3x2+(p2+p3)x-p0,f (x)图象的对称轴为直线x=-<0,
注意到f (0)=-p0<0,f (1)=2p3+p2-p0=p1+2p2+3p3-1=E(X)-1,
当E(X)≤1时,f (1)≤0,f (x)=0的正实根x0≥1,原方程的最小正实根p=1,
当E(X)>1时,f (1)>0,f (x)=0的正实根x0<1,原方程的最小正实根p=x0<1.
(3)当1个微生物个体繁殖下一代的期望小于等于1时,这种微生物经过多代繁殖后临近灭绝;当1个微生物个体繁殖下一代的期望大于1时,这种微生物经过多代繁殖后还有继续繁殖的可能.
1.为调查我校学生的用电情况,学校后勤部门抽取了100间学生宿舍在某月的用电量,发现每间宿舍的用电量都在50 kW·h到350 kW·h之间,将其分组为[50,100),[100,150),[150,200),[200,250),[250,300),[300,350],得到如图所示的频率分布直方图.
课后作业(六十六) 概率、统计的综合问题
2
4
3
题号
1
2
4
3
题号
1
(1)为降低能源损耗,节约用电,规定:当每间宿舍的月用电量不超过200 kW·h时,按每千瓦时0.5元收取费用;当每间宿舍的月用电量超过200 kW·h时,超过部分按每千瓦时1元收取费用.用t(单位: kW·h)表示某宿舍的月用电量,用y(单位:元)表示该宿舍的月用电费用,求y与t之间的函数关系式;
(2)在抽取的100间学生宿舍中,月用电量在区间[200,250)内的学生宿舍有多少间?
2
4
3
题号
1
解:(1)根据题意,得
当50≤t≤200时,月用电费用为y=0.5t;
当t>200时,月用电费用为y=200×0.5+(t-200)×1=t-100.
综上,宿舍的月用电费用为
y=
2
4
3
题号
1
(2)因为月用电量在[200,250)内的频率为50x=1-(0.006 0+0.003 6+0.002 4+0.002 4+0.001 2)×50=1-0.015 6×50=0.22,所以月用电量在[200,250)内的宿舍有100×0.22=22(间).
2
3
题号
1
4
2.(2025·浙江温州期末)现有标号依次为1,2,…,n的n个盒子,标号为1号的盒子里有2个红球和2个白球,其余盒子里都是1个红球和1个白球.现从1号盒子里取出2个球放入2号盒子,再从2号盒子里取出2个球放入3号盒子,……,依次进行到从n-1号盒子里取出2个球放入n号盒子为止.
(1)当n=2时,求2号盒子里有2个红球的概率;
(2)当n=3时,求3号盒子里的红球的个数ξ的分布列;
(3)记n号盒子中红球的个数为Xn,求Xn的期望E.
2
3
题号
1
4
解:(1)由题可知2号盒子里有2个红球的概率为P==.
(2)由题可知ξ可取1,2,3,
P==,
P==,
P=1-P-P=,
所以3号盒子里的红球的个数ξ的分布列为
ξ 1 2 3
P
2
3
题号
1
4
(3)记an-1为第n号盒子有三个红球和一个白球的概率,则a1=,bn-1为第n号盒子有两个红球和两个白球的概率,则b1=,b2=,
则第n号盒子有一个红球和三个白球的概率为1-an-1-bn-1,且bn-1=bn-2+an-2+,
化简得bn-1=bn-2+(n≥3),
2
3
题号
1
4
得bn-1-=(n≥3),又b1-=,
而b2-=,则数列为等比数列,首项为b1-=,公比为,所以bn=,
又由an-1=bn-2+an-2(n≥3),所以an=an-1+bn-1(n≥2),即an=an-1+(n≥2),an-= (n≥2),而a1-=0,所以an=.
因此E=3×an-1+2×bn-1+1×=2an-1+bn-1+1=2.
2
3
题号
4
1
3.近年来毕业旅行的热度明显上升.对于远程旅行,飞机和高铁是两种主要的出行方式.某平台对2020~2024年毕业季毕业生购买飞机票的数量y(单位:万张)进行了统计,得到如下相关数据:
年份 2020 2021 2022 2023 2024
年份代码t 1 2 3 4 5
y/万张 30 36 51 60 78
2
3
题号
4
1
(1)分析上述统计表可知y与t有较强的线性相关关系,求y关于t的经验回归方程.
(2)通过调查发现女性比男性更愿意选择坐高铁出行.某平台随机抽查某天在该平台(只出售飞机票和高铁票)购票的400名毕业生(每人只购一张票)作为样本,其中女性购买高铁票的有N名,购买飞机票的有90名,男性购买高铁票的有40名.
2
3
题号
4
1
①当N=190时,将样本中购买飞机票的男性人数与样本中购买飞机票的总人数的比例作为概率,用样本估计总体,结合(1)的结果估计2026年毕业季在该平台购买飞机票的毕业生中的男性人数(四舍五入保留整数);
②用样本的频率估计概率.设女性毕业生中购买飞机票的概率为p,从所有女性毕业生中随机抽出5名,记恰好有3名女性购买飞机票的概率为f,当f取得最大值时,求N的值.
2
3
题号
4
1
参考公式:经验回归直线=+x中斜率和截距的最小二乘估计
公式分别为
,=-.
2
3
题号
4
1
解:(1)由题意得==51,
2
3
题号
4
1
==51-12×3=15,
所以y关于t的经验回归方程为=12t+15.
==12,
2
3
题号
4
1
(2)①由题意知,400名毕业生中男性有400-190-90=120(名),
故样本中购买飞机票的男性有120-40=80(名),
样本中购买飞机票的毕业生中,男性所占比例为=,
所以估计一名购买飞机票的毕业生为男性的概率为.
因为2026年对应的年份代码t=7,所以=12×7+15=99,
因此估计2026年毕业季在该平台购买飞机票的毕业生中男性的人数为×990 000≈465 882.
2
3
题号
4
1
②由题意知,p=,0≤N≤270,N∈N,则当N=0时,p取得最大值1,当N=270时,p取得最小值,即p∈,
且f=p3=10p3.
设函数g=10x3,x∈,
则g′(x)=30x2+20x3=10x2.
当x∈时,g′>0,g单调递增,当x∈时,g′<0,g单调递减.故当x=时,g取得最大值.
由上可知,当p=时,f取得最大值,此时=,得N=60.故N的值为60.
2
4
3
题号
1
4.为了拓宽学生的知识面,提高学生对航空航天科技的兴趣,培养学生良好的科学素养,某校组织学生参加航空航天科普知识答题竞赛,每位参赛学生答题若干次,答题赋分方法如下:第1次答题,答对得20分,答错得10分;从第2次答题开始,答对则获得上一次答题得分的两倍,答错得10分.学生甲参加答题竞赛,每次答对的概率为,各次答题结果互不影响.
(1)求甲前3次答题得分之和为40分的概率;
(2)记甲第i次答题所得分数Xi(i∈N*)的数学期望为E(Xi).
①写出E(Xi-1)与E(Xi)满足的等量关系式;
②若E(Xi)>100,求i的最小值.
2
4
3
题号
1
解:(1)甲前3次答题得分之和为40分的事件A是:甲前3次答题中仅答对一次,
所以甲前3次答题得分之和为40分的概率P(A)==.
(2)①甲第1次答题得20分,10分的概率分别为,则E(X1)=20×+10×=,
甲第2次答题得40分,20分,10分的概率分别为,
2
4
3
题号
1
则E(X2)=40×+20×+10×=,显然E(X2)=2+10×=E(X1)+,
当i≥2,i∈N*时,甲第i-1次答题所得分数Xi-1的数学期望为E(Xi-1),
因此第i次答对题所得分数为2E(Xi-1),答错题所得分数为10分,其概率分别为,
于是甲第i次答题所得分数Xi的数学期望为E(Xi)=2E(Xi-1)×+10×=E(Xi-1)+,
2
4
3
题号
1
所以E(Xi-1)与E(Xi)满足的等量关系式是E(Xi)=E(Xi-1)+,i≥2,i∈N*,且E(X1)=.
②由①知,E(X1)=,当i≥2,i∈N*时,E(Xi)+5=[E(Xi-1)+5],而E(X1)+5=,
因此数列{E(Xi)+5}是以为首项,为公比的等比数列,E(Xi)+5==15×,
2
4
3
题号
1
于是E(Xi)=15×-5,由15×-5>100,得>7,显然数列是递增数列,
而=<7,=>7,则有正整数imin=5,
所以i的最小值是5.
谢 谢!课后作业(六十六) 概率、统计的综合问题
1.为调查我校学生的用电情况,学校后勤部门抽取了100间学生宿舍在某月的用电量,发现每间宿舍的用电量都在50 kW·h到350 kW·h之间,将其分组为[50,100),[100,150),[150,200),[200,250),[250,300),[300,350],得到如图所示的频率分布直方图.
(1)为降低能源损耗,节约用电,规定:当每间宿舍的月用电量不超过200 kW·h时,按每千瓦时0.5元收取费用;当每间宿舍的月用电量超过200 kW·h时,超过部分按每千瓦时1元收取费用.用t(单位: kW·h)表示某宿舍的月用电量,用y(单位:元)表示该宿舍的月用电费用,求y与t之间的函数关系式;
(2)在抽取的100间学生宿舍中,月用电量在区间[200,250)内的学生宿舍有多少间?
2.(2025·浙江温州期末)现有标号依次为1,2,…,n的n个盒子,标号为1号的盒子里有2个红球和2个白球,其余盒子里都是1个红球和1个白球.现从1号盒子里取出2个球放入2号盒子,再从2号盒子里取出2个球放入3号盒子,……,依次进行到从n-1号盒子里取出2个球放入n号盒子为止.
(1)当n=2时,求2号盒子里有2个红球的概率;
(2)当n=3时,求3号盒子里的红球的个数ξ的分布列;
(3)记n号盒子中红球的个数为Xn,求Xn的期望E.
3.近年来毕业旅行的热度明显上升.对于远程旅行,飞机和高铁是两种主要的出行方式.某平台对2020~2024年毕业季毕业生购买飞机票的数量y(单位:万张)进行了统计,得到如下相关数据:
年份 2020 2021 2022 2023 2024
年份代码t 1 2 3 4 5
y/万张 30 36 51 60 78
(1)分析上述统计表可知y与t有较强的线性相关关系,求y关于t的经验回归方程.
(2)通过调查发现女性比男性更愿意选择坐高铁出行.某平台随机抽查某天在该平台(只出售飞机票和高铁票)购票的400名毕业生(每人只购一张票)作为样本,其中女性购买高铁票的有N名,购买飞机票的有90名,男性购买高铁票的有40名.
①当N=190时,将样本中购买飞机票的男性人数与样本中购买飞机票的总人数的比例作为概率,用样本估计总体,结合(1)的结果估计2026年毕业季在该平台购买飞机票的毕业生中的男性人数(四舍五入保留整数);
②用样本的频率估计概率.设女性毕业生中购买飞机票的概率为p,从所有女性毕业生中随机抽出5名,记恰好有3名女性购买飞机票的概率为f,当f取得最大值时,求N的值.
参考公式:经验回归直线=+x中斜率和截距的最小二乘估计公式分别为,=-.
4.为了拓宽学生的知识面,提高学生对航空航天科技的兴趣,培养学生良好的科学素养,某校组织学生参加航空航天科普知识答题竞赛,每位参赛学生答题若干次,答题赋分方法如下:第1次答题,答对得20分,答错得10分;从第2次答题开始,答对则获得上一次答题得分的两倍,答错得10分.学生甲参加答题竞赛,每次答对的概率为,各次答题结果互不影响.
(1)求甲前3次答题得分之和为40分的概率;
(2)记甲第i次答题所得分数Xi(i∈N*)的数学期望为E(Xi).
①写出E(Xi-1)与E(Xi)满足的等量关系式;
②若E(Xi)>100,求i的最小值.
课后作业(六十六)
[A组 在基础中考查学科功底]
1.解:(1)根据题意,得
当50≤t≤200时,月用电费用为y=0.5t;
当t>200时,月用电费用为y=200×0.5+(t-200)×1=t-100.
综上,宿舍的月用电费用为
y=
(2)因为月用电量在[200,250)内的频率为50x=1-(0.006 0+0.003 6+0.002 4+0.002 4+0.001 2)×50=1-0.015 6×50=0.22,所以月用电量在[200,250)内的宿舍有100×0.22=22(间).
2.解:(1)由题可知2号盒子里有2个红球的概率为P==.
(2)由题可知ξ可取1,2,3,
P==,
P==,
P=1-P-P=,
所以3号盒子里的红球的个数ξ的分布列为
ξ 1 2 3
P
(3)记an-1为第n号盒子有三个红球和一个白球的概率,则a1=,bn-1为第n号盒子有两个红球和两个白球的概率,则b1=,b2=,
则第n号盒子有一个红球和三个白球的概率为1-an-1-bn-1,且bn-1=bn-2+an-2+,
化简得bn-1=bn-2+(n≥3),
得bn-1-=(n≥3),又b1-=,
而b2-=,则数列为等比数列,首项为b1-=,公比为,所以bn=,
又由an-1=bn-2+an-2(n≥3),所以an=an-1+bn-1(n≥2),即an=an-1+(n≥2),an-= (n≥2),而a1-=0,所以an=.
因此E=3×an-1+2×bn-1+1×=2an-1+bn-1+1=2.
[B组 在综合中考查关键能力]
3.解:(1)由题意得==51,
==12,
==51-12×3=15,
所以y关于t的经验回归方程为=12t+15.
(2)①由题意知,400名毕业生中男性有400-190-90=120(名),
故样本中购买飞机票的男性有120-40=80(名),
样本中购买飞机票的毕业生中,男性所占比例为=,
所以估计一名购买飞机票的毕业生为男性的概率为.
因为2026年对应的年份代码t=7,所以=12×7+15=99,
因此估计2026年毕业季在该平台购买飞机票的毕业生中男性的人数为×990 000≈465 882.
②由题意知,p=,0≤N≤270,N∈N,则当N=0时,p取得最大值1,当N=270时,p取得最小值,即p∈,
且f=p3=10p3.
设函数g=10x3,x∈,
则g′(x)=30x2+20x3=10x2.
当x∈时,g′>0,g单调递增,当x∈时,g′<0,g单调递减.故当x=时,g取得最大值.
由上可知,当p=时,f取得最大值,此时=,得N=60.故N的值为60.
4.解:(1)甲前3次答题得分之和为40分的事件A是:甲前3次答题中仅答对一次,
所以甲前3次答题得分之和为40分的概率P(A)==.
(2)①甲第1次答题得20分,10分的概率分别为,则E(X1)=20×+10×=,
甲第2次答题得40分,20分,10分的概率分别为,
则E(X2)=40×+20×+10×=,显然E(X2)=2+10×=E(X1)+,
当i≥2,i∈N*时,甲第i-1次答题所得分数Xi-1的数学期望为E(Xi-1),
因此第i次答对题所得分数为2E(Xi-1),答错题所得分数为10分,其概率分别为,
于是甲第i次答题所得分数Xi的数学期望为E(Xi)=2E(Xi-1)×+10×=E(Xi-1)+,
所以E(Xi-1)与E(Xi)满足的等量关系式是E(Xi)=E(Xi-1)+,i≥2,i∈N*,且E(X1)=.
②由①知,E(X1)=,当i≥2,i∈N*时,E(Xi)+5=[E(Xi-1)+5],而E(X1)+5=,
因此数列{E(Xi)+5}是以为首项,为公比的等比数列,E(Xi)+5==15×,
于是E(Xi)=15×-5,由15×-5>100,得>7,显然数列是递增数列,
而=<7,=>7,则有正整数imin=5,
所以i的最小值是5.
1 / 3