章末复习课
一、条件概率与全概率公式
1.求条件概率有两种方法:一种是基于样本空间Ω,先计算P(A)和P(AB),再利用P(B|A)=求解;另一种是缩小样本空间,即以A为样本空间计算AB的概率.
2.掌握条件概率与全概率运算,重点提升逻辑推理和数学运算的核心素养.
例1 甲、乙、丙三人同时对飞机进行射击,三人击中的概率分别为0.4,0.5,0.7.飞机被一人击中而击落的概率为0.2,被两人击中而击落的概率为0.6,若三人都击中,飞机必定被击落,求飞机被击落的概率.
解 设B=“飞机被击落”,Ai=“飞机被i人击中”,i=1,2,3,则B=A1B+A2B+A3B,
依题意,P(B|A1)=0.2,P(B|A2)=0.6,P(B|A3)=1.
由全概率公式P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3),
为求P(Ai),设Hi=“飞机被第i人击中”,i=1,2,3,可求得:
P(A1)=P(H123+1H23+12H3),
P(A2)=P(H1H23+H12H3+1H2H3),
P(A3)=P(H1H2H3),
将数据代入计算得
P(A1)=0.36,P(A2)=0.41,P(A3)=0.14,
于是P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=0.36×0.2+0.41×0.6+0.14×1=0.458.
即飞机被击落的概率为0.458.
(学生)反思感悟 条件概率的计算要注意以下几点
(1)明白是在谁的条件下,计算谁的概率.
(2)明确P(A),P(B|A)以及P(AB)三者间的关系,实现三者间的互化.
(3)理解全概率公式P(A)=(Bi)P(A|Bi)中化整为零的计算思想.
跟踪训练1 抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是( )
A.
B.
C.
D.
答案 B
解析 记事件A=“红色骰子的点数为4或6”,事件B=“两颗骰子的点数之积大于20”.
P(A)==,P(AB)==,
∴P(B|A)===.
二、n次独立重复试验及二项分布
1.独立重复试验是相互独立事件概率的延伸,其试验结果出现的次数X~B(n,p),即P(X=k)=Cpk(1-p)n-k.
2.学习该部分知识重点提升数学建模及数学运算的核心素养.
例2 在一次抗洪抢险中,准备用射击的办法引爆从上游漂流而下的一个巨大汽油罐,已知只有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击是相互独立的,且命中的概率都是.
(1)求油灌被引爆的概率;
(2)如果引爆或子弹打光则停止射击,设射击次数为ξ,求ξ不小于4的概率.
解 (1)油罐引爆的对立事件为油罐没有引爆,没有引爆的可能情况是射击5次只击中一次或一次也没有击中,故该事件的概率为
P=C××4+5,
所以所求的概率为
1-P=1-=.
(2)当ξ=4时,记事件为A,
则P(A)=P(ξ=4)=C××2×=,
当ξ=5时,意味着前4次射击只击中一次或一次也未击中,记为事件B.
则P(B)=P(ξ=5)=C××3+4=,
所以所求概率为
P(A∪B)=P(A)+P(B)=+=.
反思感悟 与二项分布有关的问题关键是二项分布的判定,可从以下几个方面判定
(1)每次试验中,事件发生的概率是相同的.
(2)各次试验中的事件是相互独立的.
(3)每次试验只有两种结果:事件要么发生,要么不发生.
(4)随机变量是这n次独立重复试验中某事件发生的次数.
跟踪训练2 一家医药研究所从中草药中提取并合成了甲、乙两种抗“H病毒”的药物,经试验,服用甲、乙两种药物痊愈的概率分别为,,现已进入药物临床试用阶段,每个试用组由4位该病毒的感染者组成,其中2人试用甲种抗病毒药物,2人试用乙种抗病毒药物,如果试用组中,甲种抗病毒药物治愈人数超过乙种抗病毒药物的治愈人数,那么称该组为“甲类组”.
(1)求一个试用组为“甲类组”的概率;
(2)观察3个试用组,用η表示这3个试用组中“甲类组”的个数,求η的分布列和均值.
解 (1)设Ai表示事件“一个试用组中,服用甲种抗病毒药物有效的有i人”,i=0,1,2,Bj表示事件“一个试用组中,服用乙种抗病毒药物有效的有j人”,j=0,1,2,
依题意有P(A1)=2××=,
P(A2)=×=,
P(B0)=×=,
P(B1)=2××=,
故一个试用组为“甲类组”的概率为P=P(B0A1)+P(B0A2)+P(B1A2)=×+×+×=.
(2)η的可能取值为0,1,2,3,且η~B,
则P(η=0)=C3=,
P(η=1)=C××2=,
P(η=2)=C2=,
P(η=3)=C3=,
故η的分布列为
η
0
1
2
3
P
∵η~B,∴E(η)=3×=.
三、离散型随机变量的均值与方差
1.均值和方差都是随机变量的重要的数字特征,方差是建立在均值的基础之上,它表明了随机变量所取的值相对于它的均值的集中与离散程度,二者的联系密切,在现实生产生活中的应用比较广泛.
2.掌握均值和方差的计算,重点提升逻辑推理和数据分析的核心素养.
例3 某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为,中奖可以获得2分;方案乙的中奖率为,中奖可以得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.
(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X,求X≤3的概率;
(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的均值较大?
解 (1)由已知得,小明中奖的概率为,小红中奖的概率为,两人中奖与否互不影响,记“这2人的累计得分X≤3”的事件为A,则A事件的对立事件为“X=5”.
∵P(X=5)=×=,
∴P(A)=1-P(X=5)=,
∴这两人的累计得分X≤3的概率为.
(2)设小明、小红都选择方案甲抽奖中奖的次数为X1,都选择方案乙抽奖中奖的次数为X2,则这两人选择方案甲抽奖累计得分的均值为E(2X1),选择方案乙抽奖累计得分的均值为E(3X2),
由已知,X1~B,X2~B,
∴E(X1)=2×=,E(X2)=2×=.
∴E(2X1)=2E(X1)=,E(3X2)=3E(X2)=.
E(2X1)>E(3X2),他们都选择方案甲进行抽奖时,累计得分的均值最大.
反思感悟 求离散型随机变量X的均值与方差的步骤
(1)理解X的意义,写出X可能的全部取值;
(2)求X取每个值的概率或求出函数P(X=k);
(3)写出X的分布列;
(4)由分布列和均值的定义求出E(X);
(5)由方差的定义,求D(X),若X~B(n,p),则可直接利用公式求,E(X)=np,D(X)=np(1-p).
跟踪训练3 一次同时投掷两枚相同的正方体骰子(骰子质地均匀,且各面分别刻有1,2,2,3,3,3六个数字).
(1)设随机变量η表示一次掷得的点数和,求η的分布列;
(2)若连续投掷10次,设随机变量ξ表示一次掷得的点数和大于5的次数,求E(ξ),D(ξ).
解 (1)由已知,随机变量η的取值为2,3,4,5,6.设掷一个正方体骰子所得点数为η0,
则η0的分布列为
η0
1
2
3
P
所以P(η=2)=×=,
P(η=3)=2××=,
P(η=4)=2××+×=,
P(η=5)=2××=,
P(η=6)=×=.
故η的分布列为
η
2
3
4
5
6
P
(2)由已知,满足条件的一次投掷的点数和取值为6,设某次发生的概率为p,由(1)知,p=.
因为随机变量ξ~B,
所以E(ξ)=np=10×=,
D(ξ)=np(1-p)=10××=.
四、正态分布
1.正态分布是连续型随机变量X的一种分布,其在概率和统计中占有重要地位,尤其统计学中的3σ原则在生产生活中有广泛的应用.
2.熟记正态分布的特征及应用3σ原则解决实际问题是本章的两个重点,在学习中提升直观想象、数据分析的素养.
例4 在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似地服从正态分布N(70,100).已知成绩在90分以上的学生有12人.
(1)试问此次参赛学生的总数约为多少人?
(2)若成绩在80分以上为优,试问此次竞赛成绩为优的学生约为多少人?
解 (1)设参赛学生的成绩为X,因为X~N(70,100),
所以μ=70,σ=10.
则P(X>90)=P(X<50)=[1-P(50≤X≤90)]
=[1-P(μ-2σ≤X≤μ+2σ)]≈×(1-0.954)
=0.023,
12÷0.023≈522(人).
因此,此次参赛学生的总数约为522人.
(2)由P(X>80)=P(X<60)=[1-P(60≤X≤80)]
=[1-P(μ-σ≤X≤μ+σ)]≈×(1-0.683)
=0.158
5,
522×0.158
5≈83(人).
因此,此次竞赛成绩为优的学生约为83人.
反思感悟 正态曲线的应用及求解策略
(1)正态曲线是轴对称图形,常借助其对称性解题.
(2)正态分布的概率问题常借助[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率值求解.
(3)注意正态曲线与频率分布直方图的结合.
跟踪训练4 为提高城市居民生活幸福感,某城市公交公司大力确保公交车的准点率,减少居民乘车候车时间,为此,该公司对某站台乘客的候车时间进行统计.乘客候车时间受公交车准点率、交通拥堵情况、节假日人流量增大等情况影响.在公交车准点率正常、交通拥堵情况正常、非节假日的情况下,乘客候车时间随机变量X满足正态分布N(μ,σ2).在公交车准点率正常、交通拥堵情况正常、非节假日的情况下,调查了大量乘客的候车时间,经过统计得到如图所示的频率分布直方图.
(1)在直方图各组中,以该组区间的中点值代表该组的各个值,试估计μ,σ2的值;
(2)在统计学中,发生概率低于千分之三的事件叫小概率事件,一般认为,在正常情况下,一次试验中,小概率事件是不能发生的.在交通拥堵情况正常、非节假日的某天,随机调查了该站的10名乘客的候车时间,发现其中有3名乘客候车时间超过15分钟,试判断该天公交车准点率是否正常,说明理由.
(参考数据:≈4.38,≈4.63,≈5.16,0.841
57≈0.298
8,0.841
56≈0.355
1,
0.158
53≈0.004
0,0.158
54≈0.000
6,P(μ-σ≤X≤μ+σ)≈0.683,P(μ-2σ≤X≤μ+2σ)≈0.954,P(μ-3σ≤X≤μ+3σ)≈0.997.)
解 (1)μ=0.1×2+0.2×6+0.4×10+0.2×14+0.1×18=10,
σ2=s2=2×(82×0.1+42×0.2)+(10-10)2×0.4=19.2.
(2)μ+σ=10+4.38=14.38,
设“3名乘客候车时间超过15分钟”的事件为A,
P(X>14.38)=≈0.158
5,
P(A)=C×(0.158
5)3×(0.841
5)7≈0.143>0.003,
准点率正常.
五、变量的相关性
1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.
2.在学习该部分知识时,体会直观想象和数学运算的素养.
例5 (1)下列两个变量具有相关关系且不是函数关系的是( )
A.圆的半径与面积
B.匀速行驶的车辆的行驶距离与时间
C.庄稼的产量与施肥量
D.人的身高与视力
答案 C
解析 对于A,圆的半径与面积是确定的关系,是函数关系;对于B,匀速行驶的车辆的行驶距离与时间是确定的关系,是函数关系;对于C,庄稼的产量与施肥量在一定范围内有相关关系,不是函数关系;对于D,人的身高与视力,不具有相关关系,也不是函数关系.故选C.
(2)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为________.
答案 -1
解析 方法一 =1.5,=1,=22,=56,
iyi=-20,
相关系数r==-1.
方法二 观察四个点,发现其在一条单调递减的直线上,故y与x的相关系数为-1.
(学生)反思感悟 变量相关性的判断的两种方法
(1)散点图法:直观形象.
(2)公式法:可用公式精确计算,需注意特殊情形的相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.
跟踪训练5 (1)已知变量x和y满足关系y=-2x+1,变量y与z正相关,下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
答案 C
解析 根据题意,变量x和y满足关系y=-2x+1,其比例系数为-2<0,所以x与y负相关;又由变量y与z正相关,则x与z负相关.故选C.
(2)如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则( )
A.r1=r2
B.r1C.r1>r2
D.无法判定
答案 C
解析 根据A,B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,∴相关系数为r1应最接近1,B组数据分散在一条直线附近,也成正相关,相关系数为r2,且满足r2r2,故选C.
六、一元线性回归模型及其应用
1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.
2.主要培养数学建模和数据分析的素养.
例6 一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
人数xi
10
15
20
25
30
35
40
件数yi
4
7
12
15
20
23
27
其中i=1,2,3,4,5,6,7.
(1)以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;
(2)求回归直线方程(结果保留到小数点后两位);
(3)预测进店人数为80时商品销售的件数(结果保留整数).
参考公式:回归直线方程=x+,
=,=-.
解 (1)由表中数据,画出7个数据点,
可得散点图如图所示.
(2)∵iyi=3
245,=25,≈15.429,
=5
075,72=4
375.
∴=≈0.778,
=-
≈-4.02.
∴回归直线方程是=0.78x-4.02.
(3)进店人数为80时,商品销售的件数=0.78×80-4.02≈58(件).
反思感悟 解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求回归直线方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归直线方程.
(3)实际应用.依据求得的回归直线方程解决实际问题.
跟踪训练6 某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:
房屋面积/m2
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求回归直线方程;
(3)根据(2)的结果,估计当房屋面积为150
m2时的销售价格.
解 (1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.
(2)由(1)知y与x具有线性相关关系,可设其回归直线方程为=x+,依据题中的数据,可得出
=i=109,
(xi-)2=1
570,
=i=23.2,
(xi-)(yi-)=308,
∴==≈0.196
2,
=-
≈23.2-0.196
2×109=1.814
2.
故所求回归直线方程为=0.196
2x+1.814
2.
(3)由(2)知当x=150时,销售价格的估计值为=0.196
2×150+1.814
2=31.244
2(万元).
故当房屋面积为150
m2时,估计销售价格是31.244
2万元.
七、非线性回归方程
1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.
2.体现数学建模的优劣,提升数据分析的素养.
例7 某公司为确定下一年度投入产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)
(yi-)
(wi-)
(yi-)
46.6
563
6.8
289.8
1.6
1
469
108.8
注:表中wi=,=i.
(1)根据散点图判断,=+x与=+
哪一个适宜作为年销售量y关于年宣传费x的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y之间的关系为z=0.2y-x,根据(2)的结果回答下列问题:
(ⅰ)当年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的估计值最大?
解 (1)由散点图可以判断,=+
适宜作为年销售量y关于年宣传费x的回归方程模型.
(2)令w=,先建立y关于w的回归直线方程.由于===68,=-
=563-68×6.8=100.6,所以y关于w的回归直线方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)(ⅰ)由(2)知,当x=49时,年销售量y的估计值=100.6+68=576.6,年利润z的估计值=576.6×0.2-49=66.32.
(ⅱ)根据(2)的结果知,年利润z的估计值=0.2×(100.6+68)-x=-x+13.6+20.12,所以当==6.8,即x=46.24时,取得最大值.
故当年宣传费为46.24千元时,年利润的估计值最大.
反思感悟 非线性回归方程的求解策略
(1)本例中,y与x不是线性相关关系,但通过wi=,转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.
(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.
跟踪训练7 电容器充电达到某电压值时作为时间t的计算原点,此后电容器串联一电阻放电,测定各时间的电压值(U)所得数据见下表:
t(h)
0
1
2
3
4
5
6
7
8
…
U(V)
100
75
55
40
30
20
15
10
5
…
设U与t之间具有近似关系U≈U0e-αt(U0,α为常数,e≈2.718
28…),求U对t的回归方程.
解 对U≈U0e-αt两边取自然对数,
得ln
U≈ln
U0-αt.
令z=ln
U,=ln
U0,=-α,则≈+t.
将U的各观测数据代入z=ln
U,求得:
t
0
1
2
3
4
5
6
7
8
…
z
4.605
4.317
4.007
3.689
3.401
2.996
2.708
2.303
1.609
…
≈-0.355
3,
≈4.714,
所以=4.714-0.355
3t,
即ln
U=4.714-0.355
3t,
所以U=e4.714-0.355
3t.
故所求回归方程为U=e4.714-0.355
3t.
八、独立性检验
1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.
2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
例8 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:
是否愿意提供志愿者服务
性别
愿意
不愿意
男生
20
10
女生
10
20
(1)用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?
(2)能否有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
α=P(χ2≥k)
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
χ2=,其中n=a+b+c+d.
解 (1)由题意,男生抽取6×=4(人).
(2)由表格数据可得,χ2=≈6.667>6.635,
所以有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关.
反思感悟 独立性检验问题的求解策略
通过公式χ2=先计算χ2,再与临界值表作比较,最后得出结论.
跟踪训练8 考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:
种子灭菌
种子未灭菌
总计
黑穗病
26
184
210
无黑穗病
50
200
250
总计
76
384
460
试分析能否有95%的把握认为种子灭菌与小麦发生黑穗病有关?
解 由列联表的数据可求
χ2=≈4.804>3.841,
所以有95%的把握认为种子灭菌与小麦发生黑穗病有关系.
1.(2018·全国Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p等于( )
A.0.7
B.0.6
C.0.4
D.0.3
答案 B
解析 由题意可知,10位成员中使用移动支付的人数X服从二项分布,即X~B(10,p),所以D(X)=10p(1-p)=2.4,所以p=0.4或0.6.
又因为P(X=4)<P(X=6),
所以Cp4(1-p)6<Cp6(1-p)4,所以p>0.5,
所以p=0.6.
2.(2017·全国Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=________.
答案 1.96
解析 由题意,得X~B(100,0.02),
∴D(X)=100×0.02×(1-0.02)=1.96.
3.(2020·全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln
x
答案 D
解析 由散点图可以看出,点大致分布在对数型函数的图象附近.
4.(2020·全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质
量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:K2=,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解 (1)由频数分布表可知,该市一天的空气质量等级为1的概率为=0.43;
空气质量等级为2的概率为=0.27;
空气质量等级为3的概率为=0.21;
空气质量等级为4的概率为=0.09.
(2)由频数分布表可知,一天中到该公园锻炼的平均人次的估计值为=350.
(3)2×2列联表如下:
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
K2=≈5.820>3.841,
所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.(共91张PPT)
内
容
索
引
知识网络
考点突破
真题体验
1
知识网络
PART
ONE
2
考点突破
PART
TWO
一、条件概率与全概率公式
1.求条件概率有两种方法:一种是基于样本空间Ω,先计算P(A)和P(AB),再利用P(B|A)=
求解;另一种是缩小样本空间,即以A为样本空间计算AB的概率.
2.掌握条件概率与全概率运算,重点提升逻辑推理和数学运算的核心素养.
例1 甲、乙、丙三人同时对飞机进行射击,三人击中的概率分别为0.4,0.5,0.7.飞机被一人击中而击落的概率为0.2,被两人击中而击落的概率为0.6,若三人都击中,飞机必定被击落,求飞机被击落的概率.
解 设B=“飞机被击落”,Ai=“飞机被i人击中”,i=1,2,3,则B=A1B+A2B+A3B,
依题意,P(B|A1)=0.2,P(B|A2)=0.6,P(B|A3)=1.
由全概率公式P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3),
为求P(Ai),设Hi=“飞机被第i人击中”,i=1,2,3,可求得:
P(A3)=P(H1H2H3),
将数据代入计算得
P(A1)=0.36,P(A2)=0.41,P(A3)=0.14,
于是P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=0.36×0.2+0.41×0.6+0.14×1=0.458.
即飞机被击落的概率为0.458.
反思感悟
条件概率的计算要注意以下几点
(1)明白是在谁的条件下,计算谁的概率.
(2)明确P(A),P(B|A)以及P(AB)三者间的关系,实现三者间的互化.
(3)理解全概率公式P(A)=
(Bi)P(A|Bi)中化整为零的计算思想.
跟踪训练1 抛掷红、黄两颗骰子,当红色骰子的点数为4或6时,两颗骰子的点数之积大于20的概率是
√
解析 记事件A=“红色骰子的点数为4或6”,事件B=“两颗骰子的点数之积大于20”.
二、n次独立重复试验及二项分布
1.独立重复试验是相互独立事件概率的延伸,其试验结果出现的次数X~B(n,p),即P(X=k)=Cpk(1-p)n-k.
2.学习该部分知识重点提升数学建模及数学运算的核心素养.
例2 在一次抗洪抢险中,准备用射击的办法引爆从上游漂流而下的一个巨大汽油罐,已知只有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击是相互独立的,且命中的概率都是
.
(1)求油灌被引爆的概率;
解 油罐引爆的对立事件为油罐没有引爆,没有引爆的可能情况是射击5次只击中一次或一次也没有击中,故该事件的概率为
所以所求的概率为
(2)如果引爆或子弹打光则停止射击,设射击次数为ξ,求ξ不小于4的概率.
解 当ξ=4时,记事件为A,
当ξ=5时,意味着前4次射击只击中一次或一次也未击中,记为事件B.
所以所求概率为
反思感悟
与二项分布有关的问题关键是二项分布的判定,可从以下几个方面判定
(1)每次试验中,事件发生的概率是相同的.
(2)各次试验中的事件是相互独立的.
(3)每次试验只有两种结果:事件要么发生,要么不发生.
(4)随机变量是这n次独立重复试验中某事件发生的次数.
跟踪训练2 一家医药研究所从中草药中提取并合成了甲、乙两种抗“H病毒”的药物,经试验,服用甲、乙两种药物痊愈的概率分别为
现已进入药物临床试用阶段,每个试用组由4位该病毒的感染者组成,其中2人试用甲种抗病毒药物,2人试用乙种抗病毒药物,如果试用组中,甲种抗病毒药物治愈人数超过乙种抗病毒药物的治愈人数,那么称该组为“甲类组”.
(1)求一个试用组为“甲类组”的概率;
解 设Ai表示事件“一个试用组中,服用甲种抗病毒药物有效的有i人”,i=0,1,2,Bj表示事件“一个试用组中,服用乙种抗病毒药物有效的有j人”,j=0,1,2,
故一个试用组为“甲类组”的概率为
(2)观察3个试用组,用η表示这3个试用组中“甲类组”的个数,求η的分布列和均值.
故η的分布列为
三、离散型随机变量的均值与方差
1.均值和方差都是随机变量的重要的数字特征,方差是建立在均值的基础之上,它表明了随机变量所取的值相对于它的均值的集中与离散程度,二者的联系密切,在现实生产生活中的应用比较广泛.
2.掌握均值和方差的计算,重点提升逻辑推理和数据分析的核心素养.
例3 某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为
,中奖可以获得2分;方案乙的中奖率为
,中奖可以得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.
(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X,求X≤3的概率;
(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的均值较大?
解 设小明、小红都选择方案甲抽奖中奖的次数为X1,都选择方案乙抽奖中奖的次数为X2,则这两人选择方案甲抽奖累计得分的均值为E(2X1),选择方案乙抽奖累计得分的均值为E(3X2),
E(2X1)>E(3X2),他们都选择方案甲进行抽奖时,累计得分的均值最大.
反思感悟
求离散型随机变量X的均值与方差的步骤
(1)理解X的意义,写出X可能的全部取值;
(2)求X取每个值的概率或求出函数P(X=k);
(3)写出X的分布列;
(4)由分布列和均值的定义求出E(X);
(5)由方差的定义,求D(X),若X~B(n,p),则可直接利用公式求,E(X)=np,D(X)=np(1-p).
跟踪训练3 一次同时投掷两枚相同的正方体骰子(骰子质地均匀,且各面分别刻有1,2,2,3,3,3六个数字).
(1)设随机变量η表示一次掷得的点数和,求η的分布列;
解 由已知,随机变量η的取值为2,3,4,5,6.设掷一个正方体骰子所得点数为η0,则η0的分布列为
故η的分布列为
(2)若连续投掷10次,设随机变量ξ表示一次掷得的点数和大于5的次数,求E(ξ),D(ξ).
解 由已知,满足条件的一次投掷的点数和取值为6,设某次发生的概率为p,
四、正态分布
1.正态分布是连续型随机变量X的一种分布,其在概率和统计中占有重要地位,尤其统计学中的3σ原则在生产生活中有广泛的应用.
2.熟记正态分布的特征及应用3σ原则解决实际问题是本章的两个重点,在学习中提升直观想象、数据分析的素养.
例4 在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似地服从正态分布N(70,100).已知成绩在90分以上的学生有12人.
(1)试问此次参赛学生的总数约为多少人?
解 设参赛学生的成绩为X,因为X~N(70,100),
所以μ=70,σ=10.
12÷0.023≈522(人).
因此,此次参赛学生的总数约为522人.
(2)若成绩在80分以上为优,试问此次竞赛成绩为优的学生约为多少人?
522×0.158
5≈83(人).
因此,此次竞赛成绩为优的学生约为83人.
反思感悟
正态曲线的应用及求解策略
(1)正态曲线是轴对称图形,常借助其对称性解题.
(2)正态分布的概率问题常借助[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率值求解.
(3)注意正态曲线与频率分布直方图的结合.
跟踪训练4 为提高城市居民生活幸福感,某城市公交公司大力确保公交车的准点率,减少居民乘车候车时间,为此,该公司对某站台乘客的候车时间进行统计.乘客候车时间受公交车准点率、交通拥堵情况、节假日人流量增大等情况影响.在公交车准点率正常、交通拥堵情况正常、非节假日的情况下,乘客候车时间随机变量X满足正态分布N(μ,σ2).在公交车准点率正常、交通拥堵情况正常、非节假日的情况下,调查了大量乘客的候车时间,经过统计得到如图所示的频率分布直方图.
(1)在直方图各组中,以该组区间的中点
值代表该组的各个值,试估计μ,σ2的值;
解 μ=0.1×2+0.2×6+0.4×10+0.2×14+0.1×18=10,
σ2=s2=2×(82×0.1+42×0.2)+(10-10)2×0.4=19.2.
(2)在统计学中,发生概率低于千分之三的事件叫小概率事件,一般认为,在正常情况下,一次试验中,小概率事件是不能发生的.在交通拥堵情况正常、非节假日的某天,随机调查了该站的10名乘客的候车时间,发现其中有3名乘客候车时间超过15分钟,试判断该天公交车准点率是否正常,说明理由.
解 μ+σ=10+4.38=14.38,
设“3名乘客候车时间超过15分钟”的事件为A,
五、变量的相关性
1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.
2.在学习该部分知识时,体会直观想象和数学运算的素养.
例5 (1)下列两个变量具有相关关系且不是函数关系的是
A.圆的半径与面积
B.匀速行驶的车辆的行驶距离与时间
C.庄稼的产量与施肥量
D.人的身高与视力
解析 对于A,圆的半径与面积是确定的关系,是函数关系;
对于B,匀速行驶的车辆的行驶距离与时间是确定的关系,是函数关系;
对于C,庄稼的产量与施肥量在一定范围内有相关关系,不是函数关系;
对于D,人的身高与视力,不具有相关关系,也不是函数关系.故选C.
√
(2)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为______.
-1
方法二 观察四个点,发现其在一条单调递减的直线上,故y与x的相关系数为-1.
反思感悟
变量相关性的判断的两种方法
(1)散点图法:直观形象.
(2)公式法:可用公式精确计算,需注意特殊情形的相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.
跟踪训练5 (1)已知变量x和y满足关系y=-2x+1,变量y与z正相关,下列结论中正确的是
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析 根据题意,变量x和y满足关系y=-2x+1,其比例系数为-2<0,所以x与y负相关;又由变量y与z正相关,则x与z负相关.故选C.
√
(2)如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则
A.r1=r2
B.r1C.r1>r2
D.无法判定
解析 根据A,B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,∴相关系数为r1应最接近1,B组数据分散在一条直线附近,也成正相关,相关系数为r2,且满足r2r2,故选C.
√
六、一元线性回归模型及其应用
1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.
2.主要培养数学建模和数据分析的素养.
例6 一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
?
其中i=1,2,3,4,5,6,7.
(1)以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;
人数xi
10
15
20
25
30
35
40
件数yi
4
7
12
15
20
23
27
解 由表中数据,画出7个数据点,
可得散点图如图所示.
(2)求回归直线方程(结果保留到小数点后两位);
人数xi
10
15
20
25
30
35
40
件数yi
4
7
12
15
20
23
27
反思感悟
解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求回归直线方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归直线方程.
(3)实际应用.依据求得的回归直线方程解决实际问题.
跟踪训练6 某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:
?
(1)画出数据对应的散点图;
房屋面积/m2
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
解 设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.
(2)求回归直线方程;
房屋面积/m2
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
(3)根据(2)的结果,估计当房屋面积为150
m2时的销售价格.
房屋面积/m2
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
故当房屋面积为150
m2时,估计销售价格是31.244
2万元.
七、非线性回归方程
1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.
2.体现数学建模的优劣,提升数据分析的素养.
例7 某公司为确定下一年度投入产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y之间的关系为z=0.2y-x,根据(2)的结果回答下列问题:
(ⅰ)当年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的估计值最大?
故当年宣传费为46.24千元时,年利润的估计值最大.
反思感悟
非线性回归方程的求解策略
(1)本例中,y与x不是线性相关关系,但通过wi=
,转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.
(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.
跟踪训练7 电容器充电达到某电压值时作为时间t的计算原点,此后电容器串联一电阻放电,测定各时间的电压值(U)所得数据见下表:
?
设U与t之间具有近似关系U≈U0e-αt(U0,α为常数,e≈2.718
28…),求U对t的回归方程.
t(h)
0
1
2
3
4
5
6
7
8
…
U(V)
100
75
55
40
30
20
15
10
5
…
解 对U≈U0e-αt两边取自然对数,得ln
U≈ln
U0-αt.
将U的各观测数据代入z=ln
U,求得:
t
0
1
2
3
4
5
6
7
8
…
z
4.605
4.317
4.007
3.689
3.401
2.996
2.708
2.303
1.609
…
即ln
U=4.714-0.355
3t,所以U=e4.714-0.355
3t.
故所求回归方程为U=e4.714-0.355
3t.
八、独立性检验
1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.
2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
例8 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:
?
(1)用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?
是否愿意提供
志愿者服务
?
性别
愿意
不愿意
男生
20
10
女生
10
20
(2)能否有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
α=P(χ2≥k)
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
所以有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关.
反思感悟
跟踪训练8 考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:
?
试分析能否有95%的把握认为种子灭菌与小麦发生黑穗病有关?
?
种子灭菌
种子未灭菌
总计
黑穗病
26
184
210
无黑穗病
50
200
250
总计
76
384
460
所以有95%的把握认为种子灭菌与小麦发生黑穗病有关系.
3
真题体验
PART
THREE
解析 由题意可知,10位成员中使用移动支付的人数X服从二项分布,
即X~B(10,p),所以D(X)=10p(1-p)=2.4,所以p=0.4或0.6.
又因为P(X=4)<P(X=6),
所以p=0.6.
1
2
3
4
1.(2018·全国Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p等于
A.0.7
B.0.6
C.0.4
D.0.3
√
1
2
3
4
解析 由题意,得X~B(100,0.02),
∴D(X)=100×0.02×(1-0.02)=1.96.
2.(2017·全国Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=______.
1.96
3.(2020·全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln
x
1
2
3
4
√
解析 由散点图可以看出,点大致分布在对数型函数的图象附近.
4.(2020·全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
?
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
1
2
3
4
锻炼人次
?
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
1
2
3
4
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
1
2
3
4
锻炼人次
?
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
1
2
3
4
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
1
2
3
4
?
人次≤400
人次>400
空气质量好
?
?
空气质量不好
?
?
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
1
2
3
4
解 2×2列联表如下:
?
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.