本章复习提升
易混易错练
易错点1 对条件概率问题理解不清致错
1.某一电子集成块由a,b,c三个元件并联构成,三个元件是否有故障相互独立.已知至少有一个元件正常工作时该集成块就能正常运行.若每个元件能正常工作的概率均为,则在该集成块能够正常工作的情况下,有且仅有一个元件出现故障的概率为( )
A.
2.从装有a个红球和b个蓝球的袋中(a,b均不小于2),每次不放回地随机摸出一球.记“第一次摸球时摸到红球”为事件A1,“第一次摸球时摸到蓝球”为事件A2;“第二次摸球时摸到红球”为事件B1,“第二次摸球时摸到蓝球”为事件B2,则下列说法错误的是( )
A.P(B1)=
B.P(B1|A1)+P(B2|A1)=1
C.P(B1)+P(B2)=1
D.P(B2|A1)+P(B1|A2)=1
易错点2 弄错离散型随机变量的可能取值致错
3.在一次对抗赛的某一轮中有3个抢答题,甲、乙两队进行抢答,比赛规定:对于每一个题,没有抢到题的队伍得0分,抢到题并回答正确的得1分,抢到题但回答错误的扣1分(即得-1分).若每个抢答题都有队伍抢答,X是甲队在该轮比赛获胜时的得分(分数高者胜),则X的所有可能取值是 .
4.甲、乙两学校进行体育比赛,比赛共设两个项目,每个项目胜方得5分,负方得0分,平局各得2分.两个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在两个项目中获胜的概率分别为0.4,0.6,甲学校在两个项目中平局的概率分别为0.1,0.2.各项目的比赛结果相互独立.
(1)求甲学校两场比赛后获得冠军的概率;
(2)用X表示甲学校两场比赛的总得分,求X的分布列及数学期望EX.
易错点3 混淆二项分布与超几何分布致错
5.某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本测出它们的质量(单位:克),质量的分组区间为[490,495],(495,500],(500,505],(505,510],(510,515],由此得到样本的频率分布直方图,如图所示.
(1)根据频率分布直方图,求质量超过505克的产品件数;
(2)在上述抽取的40件产品中任取2件,设X为质量超过505克的产品件数,求X的分布列及数学期望;
(3)用频率估计概率,从流水线上任取5件产品,设Y为质量超过505克的产品件数,求Y的分布列、数学期望与方差.
易错点4 对正态分布中的参数理解不准确致错
6.已知随机变量X服从正态分布N(1,2),则E(3X+4)与D(3X+4)的值分别为( )
A.13,18 B.13,6 C.7,18 D.7,6
7.某袋装加碘食盐的质量X(单位:克)服从正态分布N(500,4),某超市在进货前要在厂家随机抽检这种食盐100袋,则质量在(498,504)内的袋数约为( )
附:若X~N(μ,σ2),则P(μ-σA.82 B.80 C.84 D.86
易错点5 选错回归模型致错
8.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,…,10)数据进行分析,建立了两个函数模型:y=α+βx2,y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数,令ui=,vi=ln yi(i=1,2,…,10),经计算得如下数据:
=26 =215 =680 =5.36
=100 =22 500 ) =260 =4
=4 )=18
(1)从相关系数的角度分析,哪一个模型拟合程度更好
(2)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)
(3)若希望2024年盈利额y为800亿元,请预测2024年的研发资金投入额x为多少亿元.(结果精确到0.01)
参考数据:ln 2≈0.693,ln 5≈1.609.
参考公式:相关系数r=.
回归直线方程中,.
易错点6 用错公式致错
9.为了调查高中学生参加课外兴趣活动选篮球和舞蹈是否与性别有关,现随机调查了30名学生,得到如下2×2列联表:
篮球 舞蹈 总计
男 13 7 20
女 2 8 10
总计 15 15 30
则在犯错误的概率不超过 的前提下,认为选择舞蹈与性别有关.
附: χ2=,其中n=a+b+c+d.
P(χ2≥k) 0.05 0.025 0.010
k 3.841 5.024 6.635
10.近年来,随着社会对教育的重视,家庭的平均教育支出增长较快,某机构随机调查了某市2015—2021年的家庭教育支出(单位:万元),得到如下折线图.(附:年份代码1~7分别对应2015—2021年)
经计算得
(1)用线性回归模型拟合y与t的关系,求出相关系数rty(精确到0.01),并说明y与t相关性的强弱;
(2)建立y关于t的回归直线方程;
(3)若2023年该市某家庭总支出为10万元,预测2023年该家庭的教育支出.
附:①相关系数rty=;相关系数|rty|>0.8时,认为y与t是高度相关的,即相关性很强.
②在回归直线方程中,.
思想方法练
一、函数与方程思想在概率与统计中的应用
1.已知随机变量X~B(n,p),E(X)=2,D(X)=,则P(X≥2)=( )
A.
C.
2.已知随机变量X的分布列如下表.当a在(-1,1)内增大时,方差D(X)的变化为( )
X -1 a 1
P
A.增大 B.减小
C.先增大再减小 D.先减小再增大
二、数形结合思想在概率与统计中的应用
3.(多选题)某校数学兴趣小组用在某座山上测得的海拔高度x(单位:千米)与气压y(单位:千帕)的六组数据(xi,yi)(i=1,2,…,6)绘制成如下散点图,分析研究发现点B不符合实际,删除点B后重新进行回归分析,则下列说法正确的是( )
A.删除点B后,x与y是正相关关系
B.删除点B后,相关系数r的绝对值更接近于1
C.删除点B后,相关系数r的值变小
D.删除点B后,两变量x与y相关性变强
4.在如图所示的正方形中随机投掷20 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度函数图象的一部分)的点的个数的估计值为( )
附:若X~N(μ,σ2),则P(μ-σA.4 772 B.6 826
C.3 413 D.9 544
三、分类讨论思想在概率与统计中的应用
5.为了发展农村经济,某乡镇政府根据当地的地理优势计划从A,B,C三种经济作物中选取两种进行种植推广.通过调研得到当地村民愿意种植A,B,C三种经济作物的概率分别为,若从当地村民中随机选取4人进行交流,则其中至少有2人愿意种植A作物,且至少有1人愿意种植B作物的概率为( )
A. C.
6.某银行柜台设有一个服务窗口,假设顾客办理业务所需的时间(分钟)相互独立,且都是整数,对以往顾客办理业务所需的时间进行统计,结果如下:
办理业务所需 的时间/分钟 1 2 3 4 5
频率 0.1 0.4 0.3 0.1 0.1
用频率估计概率,且从第一个顾客开始办理业务时计时.
(1)估计第三个顾客恰好等待4分钟开始办理业务的概率;
(2)用X表示至第2分钟末已办理完业务的顾客人数,求X的分布列及数学期望.
四、转化与化归思想在概率与统计中的应用
7.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据并绘制成散点图.光照时长为x(单位:小时),大棚蔬菜产量为y(单位:千斤/亩),记w=ln x.
(1)根据散点图判断,y=a+bx与y=c+dln x哪一个适宜作为大棚蔬菜产量y关于光照时长x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(结果保留小数点后两位);
(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为e2小时时,大棚蔬菜的产量为多少千斤/亩.
参考数据:
290 102.4 52 4 870
540.28 137 1 578.2 272.1
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程中,.
答案与分层梯度式解析
本章复习提升
易混易错练
1.A 2.D 6.C 7.A
1.A 记事件A为该集成块能够正常工作,事件B为有且仅有一个元件出现故障,
则P(A)=1-P(,
P(AB)=,
所以P(B|A)=.故选A.
易错警示
条件概率问题中常出现的错误有两种:(1)混淆P(A|B)与P(B|A),P(A|B)表示已知事件B发生的条件下,事件A发生的概率,P(B|A)表示已知事件A发生的条件下,事件B发生的概率;(2)混淆P(A|B)与P(AB),P(AB)表示事件A与事件B同时发生的概率.
2.D 由题意可知,P(A1)=,
P(B1|A1)=,
P(B2|A1)=.
所以P(B1|A1)+P(B2|A1)=1,P(B2|A1)+P(B1|A2)=≠1,故B中说法正确,D中说法错误;
因为P(B1)=P(A1)P(B1|A1)+P(A2)P(B1|A2)=··,
P(B2)=P(A1)P(B2|A1)+P(A2)P(B2|A2)=··,
所以P(B1)+P(B2)=1,故A、C中说法正确.故选D.
3.答案 -1,0,1,2,3
解析 X=-1表示:甲队抢到1题且答错,乙队抢到2题且均答错.
X=0表示:甲队没有抢到题,乙队抢到3题且至少答错其中的2题;甲队抢到2题且答对其中的1题,乙队抢到1题且答错.
X=1表示:甲队抢到1题且答对,乙队抢到2题且至少答错其中的1题;甲队抢到3题且答对其中的2题.
X=2表示:甲队抢到2题且均答对.
X=3表示:甲队抢到3题且均答对.
易错警示
本题在随机变量X取值时易漏掉X=-1的情况,致错原因往往是从生活经验出发,以为甲队要获胜肯定至少回答正确一次,没有从问题的背景深入分析.要避免这种错误,可以将事件发生的各种可能一一列出,再针对出现的结果分析随机变量取值的可能性,这样可以做到不重不漏.
4.解析 (1)甲学校获胜分三种情况:胜胜,胜平,平胜,
则甲学校获胜的概率P=0.4×0.6+0.4×0.2+0.1×0.6=0.38.
(2)X的可能取值为0,2,4,5,7,10,
则P(X=0)=(1-0.4-0.1)×(1-0.6-0.2)=0.1,
P(X=2)=0.1×(1-0.6-0.2)+(1-0.4-0.1)×0.2=0.12,
P(X=4)=0.1×0.2=0.02,
P(X=5)=0.4×(1-0.6-0.2)+(1-0.4-0.1)×0.6=0.38,
P(X=7)=0.4×0.2+0.1×0.6=0.14,
P(X=10)=0.4×0.6=0.24,
所以X的分布列为
X 0 2 4 5 7 10
P 0.1 0.12 0.02 0.38 0.14 0.24
所以EX=0×0.1+2×0.12+4×0.02+5×0.38+7×0.14+10×0.24=5.6.
5.解析 (1)由题中频率分布直方图可知,40件产品中质量超过505克的产品有40×(0.05+0.01)×5=12(件).
(2)由题意可知,随机变量X的所有可能取值为0,1,2,
P(X=0)=,
P(X=2)=.
所以X的分布列为
X 0 1 2
P
所以E(X)=0×.
(3)设抽取的产品的质量超过505克的概率为p,易得p=,则Y~B,
P(Y=0)=,
P(Y=1)=,
P(Y=2)=,
P(Y=3)=,
P(Y=4)=,
P(Y=5)=.
所以Y的分布列为
Y 0 1 2 3 4 5
P
E(Y)=5×=1.05.
易错警示
本题第(2)小题易误认为随机变量X~B,从而得到错误的分布列.若将已知条件改为从40件产品中任意抽取1件后放回,再任意抽取1件,则X服从二项分布.第(3)小题相当于从n件产品中任意抽取1件,虽然没有放回,但是是从流水线上抽取的,所以第二次抽取时,又相当于从n件产品中任意抽取1件,所以可以认为是二项分布问题.二项分布的背景是“n次独立重复试验”,而超几何分布的背景是“在含有M件次品的N件产品中任取n件”.
6.C 由题意得E(X)=1,D(X)=2,所以E(3X+4)=3E(X)+4=7,D(3X+4)=32D(X)=18,故选C.
7.A 因为X~N(500,4),所以μ=500,σ=2,
所以498=μ-σ,504=μ+2σ,
故P(498易错警示
在解决与正态分布有关的问题时,要熟记正态曲线的性质,准确应用其性质解题,同时注意分析题目中的条件,在本题中对于X~N(500,4),易错将4作为标准差,而事实上4为方差.
8.解析 (1)设ui和yi的相关系数为r1,xi和vi的相关系数为r2,
则r1=≈0.87,
r2==0.9,
显然r2>r1>0,所以从相关系数的角度分析,模型y=eλx+t的拟合程度更好.
(2)先建立v关于x的回归直线方程,由y=eλx+t得ln y=λx+t,即v=λx+t,
则=0.18,
=5.36-0.18×26=0.68,
所以v关于x的回归直线方程为=0.18x+0.68,
所以y关于x的回归方程为=e0.18x+0.68.
(3)由题意得,800=e0.18x+0.68,即ln 800=0.18x+0.68,因为ln 800=5ln 2+2ln 5≈5×0.693+2×1.609=6.683,
所以6.683=0.18x+0.68,
解得x=33.35.
所以预测2024年的研发资金投入额为33.35亿元.
易错警示
从题中所给出的多个模型中选择一个最合适的模型,常因选择的不是最佳模型而导致错误.选择错误的原因一般有两种:一是根据散点图判断时,由于题中所给散点的个数不多,从而造成错误的判断;二是对数据的分析过于简单,比如仅从变量间的增减进行判断,缺乏线性与非线性、增减快与慢的分析等.
9.答案 2.5%
解析 由题意可得χ2==5.4>5.024,所以在犯错误的概率不超过2.5%的前提下,认为选择舞蹈与性别有关.
易错警示
先根据题意准确写出2×2列联表(有时直接给出),然后利用公式求出χ2的值,最后根据临界值表得出结论,注意χ2的计算公式中a,b,c,d的各项要准确对应,不要弄混.
10.解析 (1)由题意得×(1+2+3+4+5+6+7)=4,
=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
故,
故rty=≈0.88,∵|0.88|>0.8,∴y与t高度相关,即y与t的相关性很强.
(2)根据题意,=4.5,
-18=19,
∴y关于t的回归直线方程为=4.5t+19.
(3)2023年对应的年份代码t=9,
当t=9时,=4.5×9+19=59.5,
故预测2023年该家庭的教育支出为10×59.5%=5.95(万元).
易错警示
求相关系数r与求回归直线方程中的公式很相似,使用时要分清公式结构,不要弄混,计算时要认真、仔细.
思想方法练
1.A 2.D 3.BCD 4.B 5.D
1.A 由题可知所以
根据已知条件列方程组,通过解方程组求得参数.
所以P(X≥2)=P(X=2)+P(X=3)=.故选A.
2.D 根据题意,得E(X)=-1×(a+1),
所以D(X)=,
构造方差关于a的二次函数,通过研究函数的性质来确定方差的变化规律,体现了函数与方程思想的应用.
所以当a∈时,D(X)单调递减;当a∈时,D(X)单调递增.故选D.
3.BCD 由题中的散点图可知,删除点B后,x与y是负相关关系,故A错误;
由于点B较其他点偏离程度大,故删除点B后,回归效果更好,两变量x与y相关性变强,从而相关系数r的绝对值更接近于1,但由于x与y是负相关关系,所以相关系数r的值变小,故B,C,D正确.
故选BCD.
4.B 由题知μ=0,σ=1,
所以P(μ-σ所以落入阴影部分的概率为P(0结合正态曲线分析落入阴影部分的概率,从而解决问题.
思想方法
数形结合思想在本章中的应用:(1)正态分布是一个重要的分布,许多概率分布问题可转化为正态分布问题来解决,通过分析正态曲线,研究随机变量取不同值时概率的变化趋势,借助正态曲线的对称性求相应的概率;(2)根据散点图判断两变量的相关性强弱,并寻找合适的拟合函数.
5.D 选取的4人中,至少有2人愿意种植A作物,且至少有1人愿意种植B作物的情况共有3种:
①有2人愿意种植A作物,愿意种植B,C作物的各有1人;
②有2人愿意种植A作物,有2人愿意种植B作物;
③有3人愿意种植A作物,有1人愿意种植B作物.
根据题意分三种情况进行讨论.
故所求概率P=.故选D.
思想方法
分类讨论思想的实质是将关于整体的问题转化为几部分问题来解决,以便于解题.在概率问题中,会经常遇到事件A是由多个互斥事件构成的情况(如“至少”“至多”型的概率问题),随机变量ξ的某个取值可能对应着若干个试验结果的情形,这时就需要借助分类讨论的思想方法将此类问题分成若干个小问题去解决.
6.解析 设顾客办理业务所需的时间为Y分钟,用频率估计概率,得Y的分布列为
Y 1 2 3 4 5
P 0.1 0.4 0.3 0.1 0.1
(1)记“第三个顾客恰好等待4分钟开始办理业务”为事件A,则事件A对应三种情形:
将事件A发生的可能情形一一分类讨论,再进行整合,体现了分类讨论的数学思想.
①第一个顾客办理业务所需的时间为1分钟,且第二个顾客办理业务所需的时间为3分钟;
②第一个顾客办理业务所需的时间为3分钟,且第二个顾客办理业务所需的时间为1分钟;
③第一个和第二个顾客办理业务所需的时间均为2分钟.
所以P(A)=P(Y=1)P(Y=3)+P(Y=3)P(Y=1)+P(Y=2)P(Y=2)=0.1×0.3+0.3×0.1+0.4×0.4=0.22.
(2)X的所有可能取值为0,1,2.
X=0对应第一个顾客办理业务所需的时间超过2分钟,
所以P(X=0)=P(Y>2)=0.5;
X=1对应第一个顾客办理业务所需的时间为1分钟且第二个顾客办理业务所需的时间超过1分钟,或第一个顾客办理业务所需的时间为2分钟,
所以P(X=1)=P(Y=1)P(Y>1)+P(Y=2)=0.1×0.9+0.4=0.49;
X=2对应两个顾客办理业务所需的时间均为1分钟,
所以P(X=2)=P(Y=1)P(Y=1)=0.1×0.1=0.01.
所以X的分布列为
X 0 1 2
P 0.5 0.49 0.01
所以E(X)=0×0.5+1×0.49+2×0.01=0.51.
思想方法
分类讨论思想在本章中的应用:(1)对随机变量的取值进行分类;(2)对不同情形的发生进行分类;(3)求解随机变量取某一范围内的值的概率时,先分类求该变量取不同值时的概率,再将所得的概率相加.
7.解析 (1)根据题中散点图,可知开始的点在某条直线旁,但后面的点会越来越偏离这条直线,因此y=c+dln x适宜作为大棚蔬菜产量y关于光照时长x的回归方程类型.
(2)因为w=ln x,所以y=c+dln x为y=c+dw,
通过换元将对数型函数模型转化为线性回归模型进行解决.
,
所以≈3.26,
所以≈5.12-3.26×2.6≈-3.36,
所以=3.26w-3.36,即=3.26ln x-3.36.
(3)当x=e2时,=3.26ln e2-3.36=3.16.
故估计大棚蔬菜的产量为3.16千斤/亩.
思想方法
转化与化归思想在本章中的应用主要体现在解决非线性的回归分析问题中,即若两个变量不是线性相关关系,我们常常利用变量间的转换,把非线性回归分析问题转化为线性回归分析问题加以解决.
24