本章总结提升
【知识辨析】
1.√ 2.× 3.√ 4.①√ ②√ ③√ 5.√ 6.×
【素养提升】
题型一
例1 解:设事件A1:锄草机是甲厂生产的,事件A2:锄草机是乙厂生产的,事件A3:锄草机是丙厂生产的,事件B:买到一台次品锄草机.
由题意知P(A1)=0.25,P(A2)=0.35,P(A3)=0.4,P(B|A1)=0.05,P(B|A2)=0.04,P(B|A3)=0.02.
由全概率公式得P(B)=P(Ai)P(B|Ai)=0.034 5,
由贝叶斯公式知P(A1|B)==≈0.362 3,
同理可得P(A2|B)≈0.405 8,P(A3|B)≈0.231 9.
因为0.405 8>0.362 3>0.231 9,所以该次品锄草机由乙厂生产的可能性较大.
变式 解:(1)设事件Ai为“任取的1箱为第i箱零件”,i=1,2,3,事件Bj为“第j次取到的是一等品”,j=1,2.
由题意知P(A1)=P(A2)=P(A3)=,P(B1|A1)==,P(B1|A2)==,P(B1|A3)==,
由全概率公式得P(B1)=P(Ai)P(B1|Ai)=×=.
(2)由题意知P(B1B2|A1)==,
P(B1B2|A2)==,
P(B1B2|A3)==,
由全概率公式得P(B1B2)=P(Ai)P(B1B2|Ai)=×≈0.22.
题型二
例2 解:(1)记“甲学校获得冠军”为事件A,则P(A)=0.5×0.4×(1-0.8)+0.5×(1-0.4)×0.8+(1-0.5)×0.4×0.8+0.5×0.4×0.8=0.6,故甲学校获得冠军的概率是0.6.
(2)X的取值范围为{0,10,20,30},则P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×(1-0.8)+0.5×(1-0.4)×0.8+(1-0.5)×0.4×0.8=0.44,P(X=20)=0.5×(1-0.4)×(1-0.8)+(1-0.5)×(1-0.4)×0.8+(1-0.5)×0.4×(1-0.8)=0.34,P(X=30)=(1-0.5)×(1-0.4)×(1-0.8)=0.06.
所以X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
所以E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
变式 解:(1)依题意知=,所以b=3.
因为30+20+15+12+10+a+3=100,所以a=10.
(2)由题得X的取值范围为{0,10,20,30,40},
则P(X=0)==0.03,P(X=10)==0.2,
P(X=20)==0.5,P(X=30)==0.12,
P(X=40)==0.15.
所以X的分布列为
X 0 10 20 30 40
P 0.03 0.2 0.5 0.12 0.15
所以E(X)=0×0.03+10×0.2+20×0.5+30×0.12+40×0.15=21.6.
题型三
例3 解:(1)由题可知,10×(0.006+0.024+0.040+0.015+m+0.006)=1,解得m=0.009.
估计这100名学生成绩的中位数为60+10×=65.
(2)因为[70,80),[80,90),[90,100]这三组的频率分别为0.15,0.09,0.06,所以从成绩在[70,80),[80,90),[90,100]的三组中抽取的人数分别为5,3,2,所以在这10人中成绩在[80,90)的有3人,所以X的取值范围为{0,1,2,3},
则P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==.
所以X的分布列为
X 0 1 2 3
P
方法一:所以E(X)=0×+1×+2×+3×=.
方法二:因为X服从参数为10,3,3的超几何分布,所以E(X)==.
变式 解:(1)由题意得,应抽取B品牌店×20=6(家),
应抽取C品牌店×20=4(家).
(2)方法一:由题意可知X的取值范围为{60,80,90,96},
P(X=60)===,P(X=80)===,P(X=90)===,P(X=96)===.
所以X的分布列为
X 60 80 90 96
P
所以E(X)=60×+80×+90×+96×=.
方法二:设Y为取到白球的个数,则Y~H(10,3,4),Y的取值范围为{0,1,2,3},
则P(Y=0)===,
P(Y=1)===,
P(Y=2)===,
P(Y=3)===.
所以Y的分布列为
Y 0 1 2 3
P
所以X的分布列为
X 60 80 90 96
P
所以E(X)=60×+80×+90×+96×=.
题型四
例4 (1)D [解析] 因为X~B,所以D(X)=n××=n=,解得n=6,所以P(X=2)=××=.故选D.
(2)解:①由题知χ2==≈0.075,因为1-90%=10%,P(χ2≥2.706)=0.1,且0.075<2.706,
所以没有90%的把握认为是否选考物理与性别有关.
②从选取的100名学生中任选1名,该同学选考物理的概率P==.
③X的取值范围为{0,1,2,3},记被抽取女生选考物理为事件A,则P(A)==,即X~B,
所以P(X=0)==,
P(X=1)=××==,
P(X=2)=××==,
P(X=3)==.
所以X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=2.
变式 解:(1)由题知X~B(3,0.9),X的取值范围为{0,1,2,3},则P(X=0)=×0.90×(1-0.9)3=0.001,
P(X=1)=×0.91×(1-0.9)2=0.027,
P(X=2)=×0.92×(1-0.9)1=0.243,
P(X=3)=×0.93×(1-0.9)0=0.729.
所以X的分布列为
X 0 1 2 3
P 0.001 0.027 0.243 0.729
(2)要使得计算机网络不会断掉,则X≥1,
所以所求概率为P(X≥1)=1-P(X<1)=1-P(X=0)=1-0.001=0.999.
题型五
例5 (1)ABD (2)32 (3) [解析] (1)由图象知μ1<μ2,所以P(Y≥μ1)>P(Y≥μ2),故A中说法不正确;X的正态曲线比较“瘦”,Y的正态曲线比较“胖”,所以σ1<σ2,所以P(X≤σ2)>P(X≤σ1),故B中说法不正确;由题图可知,对任意正数t,都有P(X≤t)≥P(Y≤t),故C中说法正确,D中说法不正确.故选ABD.
(2)根据正态曲线的对称性知,要使测量结果ξn在[9.5,10.5]内的概率不小于95.4%,则[μ-2σ,μ+2σ] [9.5,10.5],因为μ=10,σ=,所以0.5≥2,解得n≥32,所以至少要测量32次.
(3)因为随机变量ξ服从正态分布N(2,σ2),P(2≤ξ≤3)=,所以P(1≤ξ≤3)=2×=,所以P(ξ<1)=×[1-P(1≤ξ≤3)]=×=.
例6 解:(1)由题意知,用统计方法得到样本数据的平均数μ=14,标准差σ=2.
由频率分布直方图得P(μ-σ≤X<μ+σ)=P(12≤X<16)=(0.29+0.11)×2=0.8=80%>68.3%,
P(μ-2σ≤X<μ+2σ)=P(10≤X<18)=0.8+(0.04+0.03)×2=0.94=94%<95.4%,
P(μ-3σ≤X<μ+3σ)=P(8≤X<20)=0.94+(0.015+0.005)×2=0.98=98%<99.7%,
只满足一个不等式,所以该生产线需要检修.
(2)由(1)知P(μ-2σ≤X<μ+2σ)=0.94=,
所以任取1件产品,该产品是次品的概率p=0.06=,
所以任取2件产品得到的次品数Y的取值范围为{0,1,2},
则P(Y=0)=×=,
P(Y=1)=××=,
P(Y=2)=×=.
所以Y的分布列为
Y 0 1 2
P
所以E(Y)=0×+1×+2×=.
变式1 (1)D (2)0.14 [解析] (1)对于A,σ2为数据的方差,所以σ越小,数据在μ=10附近越集中,所以该物理量一次测量结果落在(9.9,10.1)内的概率越大,故A中结论正确;对于B,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10的概率为0.5,故B中结论正确;对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C中结论正确;对于D,因为该物理量一次测量结果落在(9.9,10)内的概率与落在(10.2,10.3)内的概率不相等,所以该物理量一次测量结果落在(9.9,10.2)内的概率与落在(10,10.3)内的概率不相等,故D中结论错误.故选D.
(2)P(X>2.5)===0.14.
变式2 解:(1)设事件A为“抽取的3名教师中恰有2名教师是‘研修先进个人’”.
由题知样本中学习时长不低于80小时的人数为3,时长低于80小时的人数为7,则P(A)==,所以这3名教师中恰有2名教师是“研修先进个人”的概率为.
(2)①由样本数据知,
μ==60.
因为P(X≥50)=P(X≥μ-σ)=+≈0.841 5,0.841 5×1000≈842,
所以估计学习时长不低于50小时的教师人数约为842.
②每名教师的学习时长在[50,70]内的概率为P(μ-σ≤X≤μ+σ)≈0.683,
由题意可知ξ~B(n,0.683),则P(ξ=10)=×0.68310×0.317n-10.
设f(n)=×0.68310×0.317n-10(n≥10),则==.
令>1,可得n<,
所以当10≤n≤13时,f(n+1)>f(n),
令<1,可得n>,
所以当n≥14时,f(n+1)故当n=14时,f(n)最大,即使P(ξ=10)最大的n的值为14.
题型六
例7 解:(1)设选取的10棵这种树木平均一棵的根部横截面积为 m2,平均一棵的材积量为 m3,则==0.06,==0.39,故估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2)xiyi-10 =0.247 4-10×0.06×0.39=0.013 4,-10=0.038-10×0.062=0.002,
-10=1.615 8-10×0.392=0.094 8,
则样本相关系数r==≈≈0.97.
(3)设该林区所有这种树木的根部横截面积总和为X m2,总材积量为Y m3,则=,故Y=X=X,令X=186,则Y=×186=1209,
故该林区这种树木的总材积量的估计值为1209 m3.
例8 解:(1)由y=aebx(a>0),得ln y=ln a+bx(a>0),
令t=ln y,则t =ln a+bx(a>0).
=×(70+80+90+100+110+120+130+140)=105,
=ln yi≈×22.48=2.81,
所以=≈=≈0.021≈0.02,ln =-≈2.81-0.021×105=0.605≈0.61,所以=0.61+0.02x,所以y关于x的回归方程为y=e0.61+0.02x.
(2)由表可知,从第1组到第8组的真菌y(单位:百万个)与细菌x(单位:百万个)的数值之比依次为
≈0.11,=0.125,≈0.14,=0.15,≈0.16,=0.175,≈0.21,≈0.28,
故样本中数值之比位于(0.13,0.20)内的有4组.
X的取值范围为{0,1,2,3,4},
则P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)==,所以X的分布列为
X 0 1 2 3 4
P
所以E(X)=0×+1×+2×+3×+4×=2.
变式1 解:(1)由表中数据可得=3,=90,(xi-)2=10,=434,(xi-)(yi-)=64,
所以r==≈0.97,
因为|r|>0.75,所以y与x的线性相关程度较高.
(2)===6.4,
则=-=90-6.4×3=70.8,
所以y关于x的回归直线方程为=6.4x+70.8.
令x=6,得=6.4×6+70.8=109.2,
所以预测2024年该新能源汽车企业的销售量为109.2万辆.
变式2 解:(1)根据散点图判断,模型②y=b+a的拟合效果更好.
(2)令x=,则y=b+a=bx+a,因为≈17.2,所以≈2.457,
所以=≈≈21.4,所以=-≈38.9-21.4×2.457≈-13.7,所以=21.4x-13.7,即=21.4-13.7.
当m=100时,=21.4×-13.7=200.3,
故预测当对该产品科技升级的投入为100万元时,科技升级的直接收益约为200.3万元.
题型七
例9 解:(1)由题知χ2==24>6.635,所以有99%的把握认为是否患该疾病与卫生习惯是否良好有关.
(2)(i)证明:由题知R=·=·=·=·=·=·.
(ii)由调查数据可知P(A|B)==,P(A|)==,则P(|B)=1-P(A|B)=,P(|)=,
所以R=×=6.
变式 解:(1)由频率分布表可知,“足球迷”对应的频率为0.2+0.05=0.25,
所以在抽取的200人中“足球迷”有200×0.25=50(人).
故2×2列联表如下:
非足球迷 足球迷 总计
女 70 10 80
男 80 40 120
总计 150 50 200
因为χ2==≈11.111>10.828,所以有99.9%的把握认为该地的电视观众是否为“足球迷”与性别有关.
(2)样本中为“足球迷”的观众有50人,男、女人数之比为4∶1,故用分层抽样的方法从中抽出5人,男性观众有4人,女性观众有1人,从这5人中再随机抽取3人,这3人都是男性观众的概率为==.本章总结提升
判断下列说法是否正确.(请在括号中填写“√”或“×”)
1.离散型随机变量的各个可能值表示的事件是彼此互斥的. ( )
2.离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于1. ( )
3.已知离散型随机变量X的概率分布为P(X=i)=(i=1,2,3,4),则P(24.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,…,n),用最小二乘法得到的回归直线方程为=0.85x-85.71,则:
①y与x正相关; ( )
②回归直线一定过点(,); ( )
③若该大学某女生的身高增加1 cm,则其体重约增加0.85 kg.( )
5.两个随机事件X,Y之间的关系越密切,由观测数据计算得到的χ2的值越大. ( )
6.由独立性检验判断出有99%的把握认为物理成绩优秀与数学成绩优秀有关,若某人数学成绩优秀,则他有99%的可能物理成绩也优秀. ( )
◆ 题型一 条件概率与全概率公式
[类型总述] 求条件概率有两种方法:利用P(B|A)=求解;以A为样本空间计算AB的概率.
例1 [2023·湖北恩施高二期中] 某品牌锄草机由甲、乙、丙三个工厂生产,其中甲厂占25%,乙厂占35%,丙厂占40%,且各厂的次品率分别为5%,4%,2%.如果某人已经买到一台次品锄草机,那么该次品锄草机由哪个工厂生产的可能性较大
变式 假设有3箱同种型号的零件,里面装有零件的个数分别为50,30,40,其中一等品的个数分别为20,12,24,现任取其中1箱,从中不放回地先后取出2个零件,试求:
(1)先取出的零件是一等品的概率;
(2)两次取出的零件均为一等品的概率的估计值(结果保留两位有效数字).
◆ 题型二 离散型随机变量的分布列和数学期望
[类型总述] (1)求离散型随机变量的分布列;(2)求离散型随机变量的数学期望和方差;(3)利用数学期望和方差解决实际应用问题.
例2 甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与数学期望.
变式 [2023·北京一六一中学高二期末] 某校为了鼓励学生热心公益,服务社会,成立了“慈善义工社”.本学期该校“慈善义工社”为学生提供了4次参加公益活动的机会,学生可通过网络平台报名并参加该活动.活动结束后,为了解学生实际参加这4次活动的情况,从全校4000名学生中随机抽取100名学生进行调查,数据统计如下表,其中“√表示参加,“×”表示未参加.
学生人数 第1次 第2次 第3次 第4次
30 × × √ √
20 × √ × √
15 √ √ √ √
12 √ √ √ ×
10 × √ × ×
a √ × × ×
b × × × ×
根据表中数据估计,该校4000名学生中约有120名学生这4次活动均未参加.
(1)求a,b的值.
(2)若学生每次参加公益活动可获得10个公益积分,从该校任选一名学生,记该学生在本学期获得的公益积分为X,以频率作为概率,求X的分布列和数学期望.
◆ 题型三 超几何分布问题
[类型总述] (1)超几何分布的概念;(2)数学期望与频率分布直方图相交汇.
例3 [2023·长沙明达中学高二月考] 某校进行数学测试,为了方便统计,现将该校学生这次数学测试的成绩转化为百分制,从中随机抽取了100名学生的成绩,经统计,这批学生的成绩全部介于40分至100分之间,将数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,制成如图所示的频率分布直方图.
(1)求频率分布直方图中m的值,并估计这100名学生成绩的中位数;
(2)在这100名学生中用分层抽样的方法从成绩在[70,80),[80,90),[90,100]的三组中抽取了10人,再从这10人中随机抽取3人,记X为3人中成绩在[80,90)的人数,求X的分布列和数学期望.
变式 “过桥米线”是云南滇南地区特有的一种小吃.在云南某地区“过桥米线”有A,B,C三种品牌的店,其中A品牌店50家,B品牌店30家,C品牌店20家.
(1)为了加强对食品卫生的监督管理工作,该地区的食品安全管理局决定按品牌对这100家“过桥米线”品牌店采用分层抽样的方法进行抽样调查,被调查的店共有20家,则B,C品牌的店各应抽取多少家
(2)为了吸引顾客,A品牌店的所有门店举办优惠活动:在一个盒子中装有质地、大小完全相同的4个白球和6个红球,顾客可以一次性从盒中抽取3个球.若是3个红球,则打六折;若是2个红球,1个白球,则打八折;若是1个红球,2个白球,则打九折;若是3个白球,则打九六折.小张在A品牌某门店点了价值100元的食品,并参与了优惠活动,设他实际需要支付的费用为X元,求X的分布列与数学期望.
◆ 题型四 二项分布的问题
[类型总述] (1)二项分布的概念;(2)服从二项分布的随机变量的分布列、数学期望和方差.
例4 (1)设X为随机变量,且X~B,若随机变量X的方差D(X)=,则P(X=2)= ( )
A. B. C. D.
(2)某校为了研究该校高一学生是否选考物理与性别的关系,随机选取了100名学生进行调查,所得2×2列联表如下.
男生 女生 总计
选考物理 36 32 68
不选考物理 16 16 32
总计 52 48 100
①从独立性检验的角度分析,能否有90%的把握认为是否选考物理与性别有关
②从选取的100名学生中任选1名,求该同学选考物理的概率.
③将上述调查所得频率视为概率,现从该校所有高一女生(该校高一女生很多)中随机抽取3人,记被抽取的女生中选考物理的人数为X,求X的分布列及数学期望.
变式 [2023·福建宁德高二期末] 为了增加系统的可靠性,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络的服务器采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉,如果三台设备各自能正常工作的概率都为0.9,它们之间相互不影响,设能正常工作的设备数为X.
(1)写出X的分布列;
(2)求出计算机网络不会断掉的概率.
◆ 题型五 正态分布及其应用
[类型总述] (1)正态分布的直接应用;(2)利用正态分布的性质求概率.
例5 (1)(多选题)设X~N(μ1,),Y~N(μ2,),其正态曲线如图所示,则下列说法中不正确的是 ( )
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.对任意正数t,都有P(X≤t)≥P(Y≤t)
D.对任意正数t,都有P(X≥t)≥P(Y≥t)
(2)[2023·广东珠海四中高二月考] 对一个物理量进行n次测量,并以测量结果的平均值作为该物理量的最后结果,已知测量结果ξn服从正态分布N(n∈N*),为使测量结果ξn在[9.5,10.5]内的概率不小于95.4%,则至少测量 次.(参考数据:若X~N(μ,σ2),则P(|X-μ|≤2σ)≈95.4%)
(3)已知随机变量ξ服从正态分布N(2,σ2),若P(2≤ξ≤3)=,则P(ξ<1)= .
例6 某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品测量产品数据,用统计方法得到样本的平均数μ=14,标准差σ=2,绘制如图所示的频率分布直方图,以频率作为概率.
(1)从该生产线加工的产品中任意抽取一件,记其数据为X,依据以下不等式评判.(P表示对应事件的概率)
①P(μ-σ≤X<μ+σ)≥68.3%;
②P(μ-2σ≤X<μ+2σ)≥95.4%;
③P(μ-3σ≤X<μ+3σ)≥99.7%.
评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修,否则需检修生产线,试判断该生产线是否需要检修.
(2)将数据不在[μ-2σ,μ+2σ)内的产品视为次品,从该生产线加工的产品(产品很多)中任意抽取2件,将次品数记为Y,求Y的分布列与数学期望E(Y).
变式1 (1) 某物理量的测量结果服从正态分布N(10,σ2),则下列结论中不正确的是 ( )
A.σ越小,该物理量一次测量结果落在(9.9,10.1)内的概率越大
B.该物理量一次测量结果大于10的概率为0.5
C.该物理量一次测量结果小于9.99的概率与大于10.01的概率相等
D.该物理量一次测量结果落在(9.9,10.2)内的概率与落在(10,10.3)内的概率相等
(2)随机变量X服从正态分布N(2,σ2),且P(22.5)= .
变式2 某市共有教师1000名,为了解老师们的寒假研修情况,评选“研修先进个人”,现随机抽取了10名教师利用“学习APP”学习的时长(单位:小时):35,43,90,83,50,45,82,75,62,35.时长不低于80小时的教师评为“研修先进个人”.
(1)现从该样本中随机抽取3名教师,求这3名教师中恰有2名教师是“研修先进个人”的概率.
(2)若该市所有教师的学习时长X近似服从正态分布N(μ,σ2),其中σ=10,μ为抽取的10名教师学习时长的平均数.
①试估计学习时长不低于50小时的教师人数(结果取整数);
②若从该市随机抽取的n名教师中恰有ξ名教师的学习时长在[50,70]内,则n为何值时P(ξ=10)的值最大
附:若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.683,P(μ-2σ≤X≤μ+2σ)≈0.954,P(μ-3σ≤X≤μ+3σ)≈0.997.
◆ 题型六 回归分析
[类型总述] (1)利用最小二乘法求回归直线方程;(2)相关系数.
例7 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本 号i 1 2 3 4 5 6 7 8 9 10 总和
根部 横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积 量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
例8 土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌分解途径为主导的土壤,氮和能量转化比较缓慢,有利于有机质存储和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组数据,如下表所示:
编号i 1 2 3 4 5 6 7 8
细菌xi/ 百万个 70 80 90 100 110 120 130 140
真菌yi/ 百万个 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0
其散点图如图所示,散点大致分布在指数型函数y=aebx(a>0)的图象附近.
(1)求y关于x的回归方程(系数精确到0.01).
(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.若该实验小组从8组数据中任选4组,记真菌y(单位:百万个)与细菌x(单位:百万个)的数值之比位于区间(0.13,0.20)内的组数为X,求X的分布列与数学期望.
附:在=x+中,=,=-.
xiln yi≈2449.43,ln yi≈22.48,=92 400,≈0.021.
变式1 随着人们生活水平的提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受人们喜爱.某新能源汽车销售企业在2019年至2023年的销售量y(单位:万辆)的数据如下表:
年份 2019年 2020年 2021年 2022年 2023年
年份代号x 1 2 3 4 5
销售量 y(万辆) 75 84 93 98 100
(1)请用相关系数判断y与x的线性相关程度(若0.3≤|r|≤0.75,则线性相关程度一般,若|r|>0.75,则线性相关程度较高,计算r时精确到小数点后两位);
(2)求出y关于x的回归直线方程,并预测2024年该新能源汽车企业的销售量为多少
参考数据:=434,(xi-)(yi-)=64,≈65.879.
附:相关系数r=,在=x+中,=,= -.
变式2 某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入m(单位:万元)与科技升级直接收益y(单位:万元)的数据统计如下表所示:
序号 1 2 3 4 5 6 7
m 2 3 4 6 8 10 13
y 13 22 31 42 50 56 58
其散点图如图所示,给出y关于m的两个回归模型:①y=dm+c;②y=b+a.
(1)根据散点图,你认为哪个模型的拟合效果更好
(2)根据(1)中的结论,求出y关于m的回归方程,并预测对该产品科技升级的投入为100万元时的直接收益(回归方程系数保留一位小数).
附:≈17.2,mi=46,·yi≈749,≈38.9.在=+x中,=,=-x.
◆ 题型七 独立性检验
[类型总述] (1)结合公式χ2=,利用独立性检验的思想考查两个随机事件之间是否有关系;(2)独立性检验与条件概率相交汇.
例9 一医疗团队为研究某地的一种地方性疾病与当地居民卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的人群中随机调查了100人(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为是否患该疾病与卫生习惯是否良好有关
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(i)证明:R=·;
(ii)利用该调查数据,给出P(A|B),P(A|)的估计值,并利用(i)的结果给出R的估计值.
附:χ2=.
α=P(χ2≥k) 0.05 0.01 0.001
k 3.841 6.635 10.828
变式 某体育频道为了解某地电视观众对卡塔尔世界杯的收看情况,随机抽取了该地200名观众进行调查,下表是根据所有调查结果制作的观众日均收看世界杯时间(单位:小时)的频率分布表:
日均收看世界 杯时间(小时) [0.5, 1] (1, 1.5] (1.5, 2] (2, 2.5] (2.5, 3] (3, 3.5]
频率 0.1 0.18 0.22 0.25 0.2 0.05
把日均收看世界杯的时间高于2.5小时的观众称为“足球迷”.
(1)根据已知条件完成下面的2×2列联表,并判断能否有99.9%的把握认为该地的电视观众是否为“足球迷”与性别有关;
非足球迷 足球迷 总计
女 70
男 40
总计
(2)从样本中为“足球迷”的观众中,先按性别用分层抽样的方法抽出5人,再从这5人中随机抽取3人进行交流,求这3人都是男性观众的概率.
附:χ2=,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828(共75张PPT)
本章总结提升
题型一 条件概率与全概率公式
题型二 离散型随机变量的分布列和数学期望
题型三 超几何分布问题
题型四 二项分布的问题
题型五 正态分布及其应用
题型六 回归分析
题型七 独立性检验
判断下列说法是否正确.(请在括号中填写“√”或“×”)
1.离散型随机变量的各个可能值表示的事件是彼此互斥的.( )
√
2.离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于1.( )
×
3.已知离散型随机变量的概率分布为 ,则
.( )
√
4.设某大学的女生体重(单位:与身高(单位: 具有线性相关关系,根据
样本数据 ,用最小二乘法得到的回归直线方程为
,则:
①与 正相关;( )
√
②回归直线一定过点 ;( )
√
③若该大学某女生的身高增加,则其体重约增加 .( )
√
5.两个随机事件,之间的关系越密切,由观测数据计算得到的 的值越大.( )
√
6.由独立性检验判断出有 的把握认为物理成绩优秀与数学成绩优秀有关,若
某人数学成绩优秀,则他有 的可能物理成绩也优秀.( )
×
题型一 条件概率与全概率公式
[类型总述] 求条件概率有两种方法:利用求解;以 为样本空
间计算 的概率.
例1 [2023·湖北恩施高二期中] 某品牌锄草机由甲、乙、丙三个工厂生产,其
中甲厂占,乙厂占,丙厂占,且各厂的次品率分别为, ,
.如果某人已经买到一台次品锄草机,那么该次品锄草机由哪个工厂生产的可
能性较大?
解:设事件锄草机是甲厂生产的,事件 锄草机是乙厂生产的,事件
锄草机是丙厂生产的,事件 买到一台次品锄草机.
由题意知,,, ,
, .
由全概率公式得 ,
由贝叶斯公式知 ,
同理可得, .
因为 ,所以该次品锄草机由乙厂生产的可能性较大.
变式 假设有3箱同种型号的零件,里面装有零件的个数分别为50,30,40,
其中一等品的个数分别为20,12,24,现任取其中1箱,从中不放回地先后取出
2个零件,试求:
(1)先取出的零件是一等品的概率;
解:设事件为“任取的1箱为第箱零件”,,2,3,事件为“第 次取到的是
一等品”, ,2.
由题意知,, ,
,
由全概率公式得 .
(2)两次取出的零件均为一等品的概率的估计值(结果保留两位有效数字).
解:由题意知 ,
,
,
由全概率公式得 .
题型二 离散型随机变量的分布列和数学期望
[类型总述](1)求离散型随机变量的分布列;(2)求离散型随机变量的数学
期望和方差;(3)利用数学期望和方差解决实际应用问题.
例2 甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,
负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知
甲学校在三个项目中获胜的概率分别为,, ,各项目的比赛结果相互
独立.
(1)求甲学校获得冠军的概率;
解:记“甲学校获得冠军”为事件 ,则
,故甲学校获得冠军的概率是0.6.
(2)用表示乙学校的总得分,求 的分布列与数学期望.
解:的取值范围为,10,20,,则 ,
,
,
.
所以 的分布列为
0 10 20 30
0.16 0.44 0.34 0.06
所以 .
变式 [2023·北京一六一中学高二期末] 某校为了鼓励学生热心公益,服务社
会,成立了“慈善义工社”.本学期该校“慈善义工社”为学生提供了4次参加公益活
动的机会,学生可通过网络平台报名并参加该活动.活动结束后,为了解学生实
际参加这4次活动的情况,从全校4000名学生中随机抽取100名学生进行调查,
数据统计如下表,其中“√表示参加,“×”表示未参加.
学生人数 第1次 第2次 第3次 第4次
30 × × √ √
20 × √ × √
15 √ √ √ √
12 √ √ √ ×
10 × √ × ×
√ × × ×
× × × ×
根据表中数据估计,该校4000名学生中约有120名学生这4次活动均未参加.
(1)求, 的值.
解:依题意知,所以 .
因为,所以 .
(2)若学生每次参加公益活动可获得10个公益积分,从该校任选一名学生,记
该学生在本学期获得的公益积分为,以频率作为概率,求 的分布列和数学期望.
解:由题得的取值范围为 ,
则, ,
, ,
.
所以 的分布列为
0 10 20 30 40
0.03 0.2 0.5 0.12 0.15
所以 .
题型三 超几何分布问题
[类型总述](1)超几何分布的概念;(2)数学期望与频率分布直方图相交汇.
例3 [2023·长沙明达中学高二月考] 某校进
行数学测试,为了方便统计,现将该校学生
这次数学测试的成绩转化为百分制,从中随
机抽取了100名学生的成绩,经统计,这批学
生的成绩全部介于40分至100分之间,将数据
按照 ,,,
分成6组,制成如图所示的频率分布直方图.
(1)求频率分布直方图中 的值,并估计这100名学生成绩的中位数;
解:由题可知, ,解得
.
估计这100名学生成绩的中位数为 .
(2)在这100名学生中用分层抽样的方法从成绩在, 的
三组中抽取了10人,再从这10人中随机抽取3人,记为3人中成绩在 的
人数,求 的分布列和数学期望.
解:因为,这三组的频率分别为,, ,所以从
成绩在, 的三组中抽取的人数分别为5,3,2,所以在这10
人中成绩在的有3人,所以的取值范围为 ,
则,, ,
.
所以 的分布列为
0 1 2 3
方法一:所以 .
方法二:因为服从参数为10,3,3的超几何分布,所以 .
变式 “过桥米线”是云南滇南地区特有的一种小吃.在云南某地区“过桥米线”有
,,三种品牌的店,其中品牌店50家,品牌店30家, 品牌店20家.
(1)为了加强对食品卫生的监督管理工作,该地区的食品安全管理局决定按品
牌对这100家“过桥米线”品牌店采用分层抽样的方法进行抽样调查,被调查的店
共有20家,则, 品牌的店各应抽取多少家?
解:由题意得,应抽取品牌店 (家),
应抽取品牌店 (家).
(2)为了吸引顾客, 品牌店的所有门店举办优惠活动:在一个盒子中装有质
地、大小完全相同的4个白球和6个红球,顾客可以一次性从盒中抽取3个球.若
是3个红球,则打六折;若是2个红球,1个白球,则打八折;若是1个红球,2个
白球,则打九折;若是3个白球,则打九六折.小张在 品牌某门店点了价值100
元的食品,并参与了优惠活动,设他实际需要支付的费用为元,求 的分布列
与数学期望.
解:方法一:由题意可知的取值范围为 ,
, ,
, .
所以 的分布列为
60 80 90 96
所以 .
方法二:设为取到白球的个数,则,的取值范围为 ,1,2, ,
则 , ,
, .
所以 的分布列为
0 1 2 3
所以 的分布列为
60 80 90 96
所以 .
题型四 二项分布的问题
[类型总述](1)二项分布的概念;(2)服从二项分布的随机变量的分布列、
数学期望和方差.
例4(1) 设为随机变量,且,若随机变量的方差 ,则
( )
D
A. B. C. D.
[解析] 因为,所以,解得 ,所以
.故选D.
(2)某校为了研究该校高一学生是否选考物理与性别的关系,随机选取了100
名学生进行调查,所得 列联表如下.
男生 女生 总计
选考物理 36 32 68
不选考物理 16 16 32
总计 52 48 100
①从独立性检验的角度分析,能否有 的把握认为是否选考物理与性别有关?
解:由题知,因为 ,
,且 ,
所以没有 的把握认为是否选考物理与性别有关.
②从选取的100名学生中任选1名,求该同学选考物理的概率.
解:从选取的100名学生中任选1名,该同学选考物理的概率 .
③将上述调查所得频率视为概率,现从该校所有高一女生(该校高一女生很多)中
随机抽取3人,记被抽取的女生中选考物理的人数为,求 的分布列及数学期望.
解:的取值范围为,1,2,,记被抽取女生选考物理为事件 ,则
,即 ,
所以 , ,
, .
所以 的分布列为
0 1 2 3
所以 .
变式 [2023·福建宁德高二期末] 为了增加系统的可靠性,人们经常使用“备用
冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络的服
务器采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台
设备中,只要有一台能正常工作,计算机网络就不会断掉,如果三台设备各自
能正常工作的概率都为,它们之间相互不影响,设能正常工作的设备数为 .
(1)写出 的分布列;
解:由题知,的取值范围为,1,2, ,则
,
,
,
.
所以 的分布列为
0 1 2 3
0.001 0.027 0.243 0.729
(2)求出计算机网络不会断掉的概率.
解:要使得计算机网络不会断掉,则 ,
所以所求概率为 .
题型五 正态分布及其应用
[类型总述](1)正态分布的直接应用;(2)利用正态分布的性质求概率.
例5(1) (多选题)设 ,
,其正态曲线如图所示,则下列
说法中不正确的是( )
ABD
A.
B.
C.对任意正数,都有
D.对任意正数,都有
[解析] 由图象知,所以,故A中说法不正确;
的正态曲线比较“瘦”,的正态曲线比较“胖”,所以 ,所以
,故B中说法不正确;
由题图可知,对任意正数 ,都有,故C中说法正确,D中说
法不正确.故选 .
(2)[2023·广东珠海四中高二月考] 对一个物理量进行 次测量,并以测量结
果的平均值作为该物理量的最后结果,已知测量结果 服从正态分布
,为使测量结果在内的概率不小于 ,则
至少测量____次.(参考数据:若,则 )
32
[解析] 根据正态曲线的对称性知,要使测量结果在 内的概率不小于
,则,因为,,所以 ,
解得 ,所以至少要测量32次.
(3)已知随机变量 服从正态分布,若 ,则
__.
[解析] 因为随机变量 服从正态分布, ,所以
,所以 .
例6 某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行
检测,现从该生产线上随机抽取100件产品测量产品数据,用统计方法得到样本
的平均数,标准差 ,绘制如图所示的频率分布直方图,以频率作为
概率.
(1)从该生产线加工的产品中任意抽取一件,记其数据为 ,依据以下不等式
评判. 表示对应事件的概率)
① ;
② ;
③ .
评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修,否则
需检修生产线,试判断该生产线是否需要检修.
解:由题意知,用统计方法得到样本数据的平均数,标准差 .
由频率分布直方图得
,
,
,
只满足一个不等式,所以该生产线需要检修.
(2)将数据不在 内的产品视为次品,从该生产线加工的产品
(产品很多)中任意抽取2件,将次品数记为,求的分布列与数学期望 .
解:由(1)知 ,
所以任取1件产品,该产品是次品的概率 ,
所以任取2件产品得到的次品数的取值范围为 ,
则 ,
,
.
所以 的分布列为
0 1 2
所以 .
变式1(1) 某物理量的测量结果服从正态分布 ,则下列结论中不正
确的是( )
D
A. 越小,该物理量一次测量结果落在 内的概率越大
B.该物理量一次测量结果大于10的概率为0.5
C.该物理量一次测量结果小于9.99的概率与大于10.01的概率相等
D.该物理量一次测量结果落在内的概率与落在 内的概率相等
[解析] 对于A,为数据的方差,所以 越小,数据在 附近越集中,所
以该物理量一次测量结果落在 内的概率越大,故A中结论正确;
对于B,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10的概率
为 ,故B中结论正确;
对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概
率与小于9.99的概率相等,故C中结论正确;
对于D,因为该物理量一次测量结果落在内的概率与落在 内的
概率不相等,所以该物理量一次测量结果落在内的概率与落在
内的概率不相等,故D中结论错误.故选D.
(2)随机变量服从正态分布,且 ,则
_____.
0.14
[解析] .
变式2 某市共有教师1000名,为了解老师们的寒假研修情况,评选“研修先进
个人”,现随机抽取了10名教师利用“学习”学习的时长(单位:小时) ,
43,90,83,50,45,82,75,62,35.时长不低于80小时的教师评为“研修先进
个人”.
(1)现从该样本中随机抽取3名教师,求这3名教师中恰有2名教师是“研修先进
个人”的概率.
解:设事件 为“抽取的3名教师中恰有2名教师是‘研修先进个人’”.
由题知样本中学习时长不低于80小时的人数为3,时长低于80小时的人数为7,
则 ,所以这3名教师中恰有2名教师是“研修先进个人”的概率为
.
(2)若该市所有教师的学习时长近似服从正态分布,其中,
为抽取的10名教师学习时长的平均数.
①试估计学习时长不低于50小时的教师人数(结果取整数);
解: 由样本数据知,
.
因为 ,
,
所以估计学习时长不低于50小时的教师人数约为842.
②若从该市随机抽取的名教师中恰有 名教师的学习时长在内,则 为
何值时 的值最大?
附:若随机变量,则 ,
, .
解: 每名教师的学习时长在内的概率为 ,
由题意可知,则 .
设 ,则
.
令,可得 ,
所以当时, ,
令,可得 ,
所以当时, .
故当时,最大,即使最大的 的值为14.
题型六 回归分析
[类型总述](1)利用最小二乘法求回归直线方程;(2)相关系数.
例7 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某
种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积
(单位:和材积量(单位: ,得到如下数据:
1 2 3 4 5 6 7 8 9 10 总和
0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得,, .
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
解:设选取的10棵这种树木平均一棵的根部横截面积为 ,平均一棵的材积
量为,则, ,故估计该林区这种树木平均一棵
的根部横截面积为,平均一棵的材积量为 .
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到 .
解: ,
,
,
则样本相关系数 .
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根
部横截面积总和为 .已知树木的材积量与其根部横截面积近似成正
比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数, .
解:设该林区所有这种树木的根部横截面积总和为,总材积量为 ,则
,故,令,则 ,
故该林区这种树木的总材积量的估计值为 .
例8 土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同
的土壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途
径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率
高,有利于养分供应,以真菌分解途径为主导的土壤,氮和能量转化比较缓慢,
有利于有机质存储和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统
计了8组数据,如下表所示:
1 2 3 4 5 6 7 8
70 80 90 100 110 120 130 140
8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0
其散点图如图所示,散点大致分布在指数型函数 的图象附近.
(1)求关于的回归方程(系数精确到 .
解:由,得 ,
令,则 .
,
,
所以 ,
,所以 ,所
以关于的回归方程为 .
(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮
循环.若该实验小组从8组数据中任选4组,记真菌(单位:百万个)与细菌
(单位:百万个)的数值之比位于区间内的组数为,求 的分布列
与数学期望.
附:在中,, .
,,, .
解:由表可知,从第1组到第8组的真菌(单位:百万个)与细菌 (单位:百
万个)的数值之比依次为
,,,,, ,
, ,
故样本中数值之比位于 内的有4组.
X的取值范围为 ,
则, ,
, ,
,所以 的分布列为
0 1 2 3 4
所以 .
变式1 随着人们生活水平的提高,汽车普遍进入千家万户,尤其在近几年,
新能源汽车涌入市场,越来越受人们喜爱.某新能源汽车销售企业在2019年至
2023年的销售量 (单位:万辆)的数据如下表:
年份 2019年 2020年 2021年 2022年 2023年
1 2 3 4 5
75 84 93 98 100
(1)请用相关系数判断与的线性相关程度(若 ,则线性相关
程度一般,若,则线性相关程度较高,计算 时精确到小数点后两位);
解:由表中数据可得,,, ,
,
所以 ,
因为,所以与 的线性相关程度较高.
(2)求出关于 的回归直线方程,并预测2024年该新能源汽车企业的销售量为
多少?
参考数据:,, .
附:相关系数,在中, ,
.
解: ,
则 ,
所以关于的回归直线方程为 .
令,得 ,
所以预测2024年该新能源汽车企业的销售量为109.2万辆.
变式2 某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升
级投入(单位:万元)与科技升级直接收益 (单位:万元)的数据统计如下
表所示:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
其散点图如图所示,给出关于的两个回归模型:; .
(1)根据散点图,你认为哪个模型的拟合效果更好?
解:根据散点图判断,模型 的拟合效果更好.
(2)根据(1)中的结论,求出关于 的回归方程,并预测对该产品科技升级
的投入为100万元时的直接收益(回归方程系数保留一位小数).
附:,,,.在
中,, .
解:令,则,因为 ,所以
,
所以 ,所以
,所以 ,即
.
当时, ,
故预测当对该产品科技升级的投入为100万元时,科技升级的直接收益约为
200.3万元.
题型七 独立性检验
[类型总述](1)结合公式 ,利用独立性检验的思想考
查两个随机事件之间是否有关系;(2)独立性检验与条件概率相交汇.
例9 一医疗团队为研究某地的一种地方性疾病与当地居民卫生习惯(卫生习惯
分为良好和不够良好两类)的关系,在已患该疾病的人群中随机调查了100人
(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),
得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有 的把握认为是否患该疾病与卫生习惯是否良好有关
解:由题知,所以有 的把握认为是否
患该疾病与卫生习惯是否良好有关.
(2)从该地的人群中任选一人,表示事件“选到的人卫生习惯不够良好”,
表示事件“选到的人患有该疾病”,与 的比值是卫生习惯不够良好对患
该疾病风险程度的一项度量指标,记该指标为 .
(ⅰ)证明: ;
证明:由题知
.
(ⅱ)利用该调查数据,给出,的估计值,并利用的结果给出 的估
计值.
附: .
0.05 0.01 0.001
3.841 6.635 10.828
解: 由调查数据可知, ,则
, ,
所以 .
变式 某体育频道为了解某地电视观众对卡塔尔世界杯的收看情况,随机抽取
了该地200名观众进行调查,下表是根据所有调查结果制作的观众日均收看世界
杯时间(单位:小时)的频率分布表:
日均收看世界杯时间 (小时)
频率 0.1 0.18 0.22 0.25 0.2 0.05
把日均收看世界杯的时间高于2.5小时的观众称为“足球迷”.
(1)根据已知条件完成下面的列联表,并判断能否有 的把握认为该
地的电视观众是否为“足球迷”与性别有关;
非足球迷 足球迷 总计
女 70
男 40
总计
解:由频率分布表可知,“足球迷”对应的频率为 ,
所以在抽取的200人中“足球迷”有 (人).
故 列联表如下:
非足球迷 足球迷 总计
女 70 10 80
男 80 40 120
总计 150 50 200
因为,所以有 的把握认
为该地的电视观众是否为“足球迷”与性别有关.
(2)从样本中为“足球迷”的观众中,先按性别用分层抽样的方法抽出5人,再
从这5人中随机抽取3人进行交流,求这3人都是男性观众的概率.
附:,其中 .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:样本中为“足球迷”的观众有50人,男、女人数之比为 ,故用分层抽样的
方法从中抽出5人,男性观众有4人,女性观众有1人,从这5人中再随机抽取3人,
这3人都是男性观众的概率为 .