第四章概率与统计综合测试卷
时间:120分钟 满分:150分
一、单选题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.已知4个红球,2个白球,每次随机取1个球,不放回地取两次.在第一次取到红球的条件下,第二次取到白球的概率为( )
A. B. C. D.
2.两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),下列说法错误的是( )
A.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
B.相关系数|r|越接近1,变量x,y相关性越强
C.相关指数R2越小,残差平方和越大,即模型的拟合效果越差
D.若x表示女大学生的身高,y表示体重,则R2≈0.65表示女大学生的身高解释了65%的体重变化
3.已知随机变量X服从二项分布X~B(6,),则P(X=2)=( )
A. B. C. D.
4.甲、乙两人独立完成某一任务的概率分别为,,若甲、乙分别去完成这项任务且相互之间不受影响,则甲完成此任务而乙没有完成此任务的概率为( )
A. B. C. D.
5.一名小学生的年龄和身高的数据如下表.由散点图可知,身高y(单位:cm)与年龄x(单位:岁)之间的回归直线方程为=x+65,预测该学生11岁时的身高约为( )
年龄x 6 7 8 9
身高y 118 126 136 144
A.163 cm B.161.8 cm C.152 cm D.158 cm
6.
在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为( )
附:若X~N(μ,σ2),则P(μ-σA.2 386 B.2 718
C.3 413 D.4 772
7.下列说法中,正确命题的序号是( )
①已知随机变量ξ服从正态分布N(2,δ2),P(ξ<4)=0.84,则P(2<ξ<4)=0.34;
②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,求得回归直线方程为=0.3x+4,则c,k的值分别是e4和0.3;
③若事件A与事件B互斥,则事件A与事件B独立;
④若样本数据x1,x2,…,x10的方差为2,则数据2x1-1,2x2-1,…,2x10-1的方差为16.
A.①④ B.③④ C.②③ D.①②
8.袋中有6个大小相同的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,则下列结论中正确的是( )
①取出的最大号码X服从超几何分布;②取出的黑球个数Y服从超几何分布;③取出2个白球的概率为;④若取出一个黑球记2分,取出一个白球记1分,则总得分最大的概率为.
A.①② B.②④ C.③④ D.①③④
二、多选题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,有选错的得0分,部分选对的得2分.
9.设A,B是两个概率大于0的随机事件,则下列说法正确的是( )
A.若事件A和B是对立事件,则P(A)+P(B)=1
B.若事件A和B是互斥事件,则P(A)+P(B)=1
C.若事件A和B相互独立,则P(A+B)=P(A)+P(B)
D.若事件A和B相互独立,则P(AB)=P(A)P(B)
10.若随机变量X服从两点分布,其中P(X=1)=,E(X)、D(X)分别为随机变量X的均值与方差,则下列结论正确的是( )
A.P(X=0)= B.E(X)= C.E(3X)= D.D(2X)=
11.下列四个表述中,正确的是( )
A.运用最小二乘法求得的回归直线一定经过样本中心(,)
B.在回归直线方程=0.1x+10中,当变量x每增加1个单位时,变量约增加0.1个单位
C.具有相关关系的两个变量x,y的相关系数为r,那么|r|越接近于0,x,y之间的线性相关程度越高
D.在一个2×2列联表中,根据表中数据计算得到χ2的观测值k,若k的值越大,则认为两个变量间有关的把握就越小
12.2021年10月16日,搭载神舟十三号载人飞船的火箭发射升空,这是一件让全国人民关注的大事,因此每天有很多民众通过手机、电视、报纸了解有关新闻,某组织随机选取10人调查民众了解这一新闻的方式,其中喜欢用电视、手机、报纸了解这一新闻的分别有3人、6人、1人,现随机选出2人,则( )
A.有1人喜欢用电视的方式的概率是
B.有2人喜欢用电视的方式的概率是
C.至多有1人喜欢用电视的方式的概率是
D.至少有1人喜欢用手机的方式的概率是
三、填空题:本题共4小题,每小题5分,共20分.
13.一个箱子中有6个大小相同的产品,其中4个正品、2个次品,从中任取3个产品,记其中正品的个数为随机变量X,则X的均值E(X)=________.
14.从分别标有1,2,…,9的9张卡片中不放回地随机抽取2次,每次抽取1张.记事件A为“抽取到的两张卡片上的数字奇偶性相同”,事件B为“两张卡片上的数字均为偶数”,则P(B|A)=________.
15.如下表是降耗技术改造后生产某产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的回归直线方程=0.7+0.3,那么表中m的值为________.
x 3 4 5 6
y 2.9 m 4 4.1
16.如图是一块高尔顿板示意图:在一块木块上钉着若干排互相平行但相互错开的圆柱形小木钉,小木钉之间留有适当的空隙作为通道,前面挡有一块玻璃,将小球从顶端放入,小球在下落过程中,每次碰到小木钉后都等可能地向左或向右落下,最后落入底部的格子中,格子从左到右分别编号为1,2,3,…,6,用X表示小球落入格子的号码,假定底部6个格子足够长,投入160粒小球,则落入3号格的小球大约有________.
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)某校举办了一场主题为“爱诗词、爱祖国”的诗词知识竞赛,从参赛的学生中抽出60人,对这60名学生的成绩(满分100分)进行统计,并按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,得到如图所示的频率分布直方图.
(1)估计参加这次知识竞赛的学生成绩的中位数;
(2)若规定80分以上(含80分)为优秀,用频率估计概率,从参赛学生中随机抽取3人,记其中成绩优秀的人数为ξ,求ξ的分布列.
18.(12分)某商家为了促销,规定每位消费者均可免费参加一次抽奖活动.活动规则如下:在一不透明的纸箱中有9张相同的卡片,其中3张卡片上印有“中”字,3张卡片上印有“国”字,另外3张卡片上印有“红”字.消费者从该纸箱中不放回地随机抽取3张卡片,若抽到的3张卡片上都印有同一个字,则获得一张20元代金券;若抽到的3张卡片中每张卡片上的字都不一样,则获得一张10元代金券;若抽到的3张卡片是其他情况,则不获得任何奖励.
(1)求某位消费者在一次抽奖活动中抽到的3张卡片上都印有“中”字的概率;
(2)记随机变量X为某位消费者在一次抽奖活动中获得代金券的金额数,求X的分布列和数学期望E(X);
(3)该商家规定,消费者若想再次参加该项抽奖活动,则每抽奖一次需支付5元.若你是消费者,请从收益方面来考虑是否愿意再次参加该项抽奖活动,并说明理由.
19.(12分)中国共产党第二十次全国代表大会于2022年10月16日在北京召开,为弘扬中国共产党百年奋斗的光辉历程,某校团委决定举办“中国共产党党史知识”竞赛活动.竞赛共有A和B两类试题,每类试题各10题,其中每答对1道A类试题得10分;每答对1道B类试题得20分,答错都不得分,每位参加竞赛的同学从这两类试题中共抽出3道题回答(每道题抽后不放回).已知小明同学A类试题中有7道题会作答,而他答对各道B类试题的概率均为.
(1)若小明同学在A类试题中只抽1道题作答,求他在这次竞赛中仅答对1道题的概率;
(2)若小明只作答A类试题,设X表示小明答这3道试题的总得分,求X的分布列和期望;
(3)小明应从A类试题中抽取几道试题作答才能使自己得分的数学期望更大?请从得分的数学期望角度给出理由.
20.(12分)某市甲乙两所高中学校高二年级联合举办安全知识竞赛,共两轮,每轮满分为80分.参赛选手为这两所学校高二学生随机抽取的各100名学生.图1和图2分别是甲校和乙校参赛选手第一轮竞赛成绩的频率分布直方图.
(1)若规定成绩在66分以上的学生为优秀,试根据第一轮竞赛的成绩分别估计甲乙这两所学校高二学生的优秀率;
(2)已知第二轮竞赛成绩不低于60分的学生中,甲校增加了15人,乙校不变.根据第二轮竞赛的成绩完成下面2×2列联表.依据小概率值α=0.001的独立性检验,分析甲乙两个学校高二学生这次竞赛的成绩是否有差异.
成绩低于60分人数 成绩不低于60分人数 合计
甲校
乙校
合计
附表及公式:
α=P(χ2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
χ2=,n=a+b+c+d.
21.(12分)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017~2021年中国在线直播用户规模(单位:亿人),其中2017年~2021年对应的代码依次为1~5.
年份代码x 1 2 3 4 5
市场规模y 3.98 4.56 5.04 5.86 6.36
参考数据:=5.16,=1.68,iyi=45.10,其中vi=.
参考公式:对于一组数据(v1,y1),(v2,y2),…,(vn,yn),其回归直线=v+的斜率和截距的最小二乘估计公式分别为=,=-.
(1)由上表数据可知,可用函数模型=+拟合y与x的关系,请建立y关于x的回归方程(,的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X,若P(X=3)=P(X=4),求X的分布列与期望.
22.(12分)2020年1月15日教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),《意见》宣布:2020年起不再组织开展高校自主招生工作,改为实行强基计划.强基计划主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.据悉强基计划的校考由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.已知甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门科目通过的概率均为,该考生报考乙大学,每门科目通过的概率依次为,,m,其中0(1)若m=,分别求出该考生报考甲、乙两所大学在笔试环节恰好通过一门科目的概率;
(2)强基计划规定每名考生只能报考一所试点高校,若以笔试过程中通过科目数的数学期望为依据作出决策,当该考生更希望通过乙大学的笔试时,求m的取值范围.
参考答案与解析
1.答案:B
解析:第一次取到红球后还剩3个红球,2个白球,故第二次取到白球的概率为.故选B.
2.答案:A
解析:对于A:回归直线方程拟合效果的强弱是由相关指数R2或相关系数|r|判定,故不正确;
对于B:根据相关系数|r|越接近1,变量相关性越强,故正确;
对于C:相关指数R2越小,残差平方和越大,效果越差,故正确;
对于D:根据R2的实际意义可得,R2≈0.65表示女大学生的身高解释了65%的体重变化,故正确.故选A.
3.答案:D
解析:P(X=2)=C()2(1-)4=.故选D.
4.答案:A
解析:依题意,甲、乙分别去完成这项任务相互独立,则甲完成此任务而乙没有完成此任务的概率为×(1-)=.故选A.
5.答案:B
解析:由表中数据可知:==7.5,
==131,
因为回归方程=x+65过样本中心(,),所以131=×7.5+65解得=8.8,
将x=11代入=8.8x+65得=161.8.故选B.
6.答案:C
解析:因为曲线C为正态分布N(0,1)的密度曲线,
所以根据正态分布的性质,P(0所以落入阴影部分的点的个数的估计值为
10 000×0.341 3=3 413.故选C.
7.答案:D
解析:对于①,因为ξ~N(2,δ2),P(ξ<4)=0.84,
所以P(2<ξ<4)=0.84-0.5=0.34,故①正确;
对于②,y=cekx两边同时取对数可得ln y=ln c+kx,
则z=ln c+kx,
又因为=0.3x+4,
所以k=0.3,ln c=4,
所以k=0.3,c=e4,故②正确;
对于③,若事件A与事件B互斥,则事件A与事件B不会同时发生,
当事件A与事件B独立,两事件可以同时发生,故③错误;
若样本数据x1,x2,…,x10的方差为2,则数据2x1-1,2x2-1,…,2x10-1的方差为22×2=8,故④错误.
所以正确的为①②.故选D.
8.答案:B
解析:对于①,根据超几何分布的定义,要把总体分为两类,再依次选取,由此可知取出的最大号码X不符合超几何分布的定义,无法用超几何分布的数学模型计算概率,故①错误;
对于②,取出的黑球个数Y符合超几何分布的定义,将黑球视作第一类,白球视作第二类,可以用超几何分布的数学模型计算概率,故②正确;
对于③,取出2个白球的概率为=,故③错误;
对于④,若取出一个黑球记2分,取出一个白球记1分,则取出四个黑球的总得分最大,
∴总得分最大的概率为=,故④正确.故选B.
9.答案:AD
解析:若A,B是对立事件,则事件A,B满足P(A)+P(B)=1,所以A选项正确;
若事件A,B互斥,如:投掷一枚均匀的骰子,设A={向上的点数是1},B={向上的点数是2},则A,B互斥,P(A)+P(B)<1,所以B选项错误;
只有当A和B互斥时,P(A+B)=P(A)+P(B),所以C选项错误;
若A和B相互独立,则P(AB)=P(A)P(B),所以D选项正确.故选AD.
10.答案:AB
解析:根据随机变量X服从两点分布,其中P(X=1)=,∴P(X=0)=,故A正确;
E(X)=0×+1×=,故B正确;
则E(3X)=3E(X)=3×=,故C错误;
D(X)=(0-)2×+(1-)2×=,则D(2X)=4D(X)=4×=1,故D错误.故选AB.
11.答案:AB
解析:A:由样本中心一定在回归直线上,正确;
B:由=0.1x+10,x每增加1个单位则约增加0.1个单位,正确;
C:两个变量x,y的相关系数为r,那么|r|越接近于1,x,y之间的线性相关程度越高,错误;
D:观测值k越大,则认为两个变量间有关的把握就越大,错误.故选AB.
12.答案:AC
解析:设选出的2人中喜欢用电视的方式的人数为X,则X的可能取值为0,1,2,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
A正确,B错误.
这2人中至多有1人喜欢用电视的方式的概率是P(X=0)+P(X=1)=,C正确.
这2人中至少有1人喜欢用手机的方式的概率为+=,D错误.故选AC.
13.答案:2
解析:任取3个产品,记其中正品的个数为随机变量X,则X的可能取值为1,2,3
则P(X=1)===,
P(X=2)===,
P(X=3)===,
则E(X)=1×+2×+3×=2.
14.答案:
解析:P(B|A)====.
15.答案:2.8
解析:由已知中的数据可得:=4.5,=(2.9+m+4+4.1)÷4=,
∵数据中心点(,)一定在回归直线上,
∴=0.7×4.5+0.3,解得m=2.8.
16.答案:50
解析:设A= “向右下落”,则= “向左下落”,且P(A)=P()=,
设Y=X-1,∵小球下落过程中共碰撞5次,
∴Y~B(5,),
∴P(Y=k)=P(X=k+1)=C()k(1-)5-k
=C()5,(k=0,1,2,3,4,5),
∴P(X=3)=C()5=,
故投入160粒小球,则落入3号格的小球大约有160×=50粒.
17.解析:(1)设样本数据的中位数为a,
由0.05+0.15+0.2<0.5,0.05+0.15+0.2+0.3>0.5,知a∈(70,80).
所以0.05+0.15+0.2+(a-70)×0.03=0.5,
解得a=,
故参加这次知识竞赛的学生成绩的中位数约为.
(2)由题意,知样本中80分以上(含80分)的频率为,则从参赛学生中随机抽取1名学生,他的成绩是优秀的概率约为,所以ξ~B(3,).
所以P(ξ=0)=()3=,
P(ξ=1)=C××()2=,
P(ξ=2)=C×()2×=,
P(ξ=3)=()3=.
所以ξ的分布列为
ξ 0 1 2 3
P
18.解析:(1)记“某位消费者在一次抽奖活动中抽到的3张卡片上都印有‘中’字”为事件A,则P(A)==.所以某位消费者在一次抽奖活动中抽到的3张卡片上都印有“中”字的概率是.
(2)随机变量X的所有可能取值为0,10,20,
则P(X=20)==,
P(X=10)==,
P(X=0)=1--=.
所以X的分布列为
X 0 10 20
P
E(X)=0×+10×+20×=.
(3)记随机变量Y为消费者在一次抽奖活动中的收益,则Y=X-5,所以E(Y)=E(X)-5=-<0,因此我不愿意再次参加该项抽奖活动.
19.解析:(1)小明仅答对1题的概率P=×()2+·C··=.
(2)X可能的取值为0,10,20,30,
P(X=0)==,P(X=10)==,
P(X=20)==,P(X=30)==,
所以X的分布列为
X 0 10 20 30
P
所以E(X)=0×+10×+20×+30×=21.
(3)设小明从两类试题中分别抽取n1,n2道试题,回答正确的题数分别为x1,x2,两类试题总得分为y,∵x1服从超几何分布, x2服从二项分布,
∴E(x1)=n1×=0.7n1,E(x2)=n2×=0.4n2,由n1+n2=3,
∴E(y)=10E(x1)+20E(x2)=10×0.7n1+20×0.4n2
=10×0.7n1+20×0.4(3-n1)=24-n1.
∵n1=0,1,2,3,∴当n1=0时E(y)max =24.
即小明全部回答B类试题时,得分的期望值最大为24.
20.解析:(1)根据频率分布直方图,甲校高二学生的优秀率为0.01×10×+0.01×10=0.14;
乙校高二学生的优秀率为0.035×10×+0.025×10=0.39.
(2)第一轮竞赛中成绩不低于60分的学生,
甲校有100×0.01×20=20人,乙校有:100×(0.035×10+0.025×10)=60人;
则第二轮竞赛中成绩不低于60分的学生,甲校有35人,乙校有60人;
故2×2列联表如下所示:
成绩低于
60分人数 成绩不低于
60分人数 合计
甲校 65 35 100
乙校 40 60 100
合计 105 95 200
故可得χ2==≈12.531>10.828,
故在小概率值α=0.001的独立性检验下,甲乙两个学校高二学生这次竞赛的成绩有差异.
21.解析:(1)设v=,则=v+,因为=5.16,=1.68,=i=15,
所以===≈1.98.
把(1.68,5.16)代入=v+,得=5.16-1.98×1.68≈1.83.
即y关于x的回归方程为=1.98+1.83.
(2)由题意知X~B(4,p),P(X=3)=Cp3(1-p)=4p3(1-p),P(X=4)=Cp4=p4,由4p3(1-p)=p4得p=,
所以X的取值依次为0,1,2,3,4,
P(X=0)=C(1-)4=,
P(X=1)=C··(1-)3=,
P(X=2)=C()2(1-)2=,
P(X=3)=C()3(1-)=,
P(X=4)=C()4=,所以X的分布列为
X 0 1 2 3 4
P
E(X)=4×=.
22.解析:(1)设“该考生报考甲大学恰好通过一门笔试科目”为事件A,“该考生报考乙大学恰好通过一门笔试科目”为事件B,
根据题意可得P(A)=C()1()2=,
P(B)=×()2+×××2==.
(2)设该考生报考甲大学通过的科目数为X,报考乙大学通过的科目数为Y,
根据题意可知,X~B(3,),所以E(X)=3×=,
P(Y=0)=×(1-m)=(1-m),
P(Y=1)=×(1-m)+×(1-m)+×m=-m,
P(Y=2)=×(1-m)+×m+×m=+m,
P(Y=3)=×m=m.
则随机变量Y的分布列为
Y 0 1 2 3
P (1-m) -m +m m
E(Y)=-m++m+m=+m,
若该考生更希望通过乙大学的笔试时,有E(Y)>E(X),
所以+m>,又因为0所以m的取值范围是(,1).