2023-2024学年高二数学下学期期末复习之概率初步-成对数据的统计分析(沪教版2020选择性必修,上海专用)
题型1:求条件概率
1.(22-23高二下·上海黄浦·期末)三颗骰子各掷一次,观察掷得的点数.记事件A为“三个点数都不相同”,事件B为“至少出现一个2点”,则 .
【答案】
【分析】先分别计算事件和事件的情况数,在根据条件概率的定义计算.
【解析】根据条件概率的定义,的含义为在事件发生的前提下,事件发生的概率,
事件的情况数为,
对于事件,因为“三个点数都不相同”,则只有一个2点,故有种情况,
所以.
故答案为:.
2.(22-23高二下·上海奉贤·期末)掷一颗骰子并观察出现的点数.已知出现的点数不超过,则出现的点数是奇数的概率是 .
【答案】/
【分析】根据条件概率公式可求出结果.
【解析】记“出现的点数是奇数”,“出现的点数不超过”,
则,,
所以.
故答案为:.
3.(22-23高二下·上海金山·期末)已知,,则 .
【答案】/
【分析】
利用条件概率公式可求得的值.
【解析】因为,由条件概率公式可得.
故答案为:.
题型2:利用全概率公式求概率
4.(22-23高二下·上海浦东新·期末)人群中患肺癌的概率约为0.1%,在人群中有10%是吸烟者,他们患肺癌的概率约为0.5%,则不吸烟者中患肺癌的概率是 .(用分数表示)
【答案】
【分析】设患肺癌为事件A,吸烟为事件B,由题有,即可得答案.
【解析】设患肺癌为事件A,吸烟为事件B,则
,不吸烟者中患肺癌的概率为.
又由全概率公式有,
则,解得.
故答案为:.
5.(21-22高二下·上海闵行·期末)已知某地市场上供应的灯泡中,甲厂产品占70%,乙厂占30%,甲厂产品的合格率是90%,乙厂产品的合格率是80%,则从该地市场上买到一个合格灯泡的概率是 .
【答案】0.87/
【分析】由全概率公式计算.
【解析】记灯光合格中事件,灯泡来自甲厂为事件,灯泡来自乙厂为事件C,
由已知,,,,
所以.
故答案为:.
6.(21-22高二下·上海松江·期末)盒中有个红球,个黑球,今随机地从中取出一个,观察其颜色后放回,并加上同色球个,再从盒中抽取一球,则第二次抽出的是红球的概率是( )
A. B. C. D.
【答案】B
【分析】设事件“第一次抽出的红球”为A,事件“第二次抽出的是红球”为B,则,再利用全概率公式求解.
【解析】解:设事件“第一次抽出的红球”为A,事件“第二次抽出的是红球”为B,
则,
由全概率公式得,
由题意得,
,
所以,
故选:B
题型3:随机变量分布列有关的概率问题
7.(22-23高二下·上海金山·期末)设随机变量X的分布列,则的值为( )
A.1 B. C. D.
【答案】B
【分析】由离散型随机变量的分布列性质求出,然后求解即可.
【解析】因为随机变量X的分布列,
所以,解得:,
.
故选:B.
8.(21-22高二下·上海杨浦·期末)袋中装有大小和质地相同的5个白球,3个黑球.现在依次不放回地摸5个球,则摸出至少3个白球的概率为 .(结果用最简分数表示)
【答案】
【分析】至少摸出3个白球,即摸出白球的数量为3,4,5,根据超几何分布的概率公式进行求解即可.
【解析】由题,不放回地摸5个球,摸出至少3个白球,即白球数量为3,4,5,
则概率为,
故答案为:
9.(21-22高二下·上海杨浦·期末)袋中有大小 质地完全相同8个球,其中黑球5个 红球3个,从中任取3个球,则红球个数不超过1的概率为 .
【答案】
【分析】由题意得,所求为红球1个或没有红球的概率,根据概率公式,即可得答案.
【解析】由题意得,所求为红球1个或没有红球的概率,
所以.
故答案为:
题型4:随机变量分布列的均值与方差
10.(21-22高二下·上海浦东新·期末)在箱子中有个小球,其中有个红球,个白球.从这个球中任取个,记表示白球的个数,则 .
【答案】/0.5
【分析】根据超几何分布的概率公式直接计算.
【解析】由已知得,表示个白球,个红球,
故,
故答案为:.
11.(22-23高二下·上海金山·期末)掷一颗骰子,则掷得点数的期望是 .
【答案】
【分析】掷一颗骰子,设掷得点数为,则的可能取值有:、、、、、,分析可得出,进而可求得的值.
【解析】掷一颗骰子,设掷得点数为,则的可能取值有:、、、、、,
则,
因此,.
故答案为:.
12.(22-23高二下·上海黄浦·期末)已知随机变量X服从二项分布,且,则 .
【答案】/
【分析】根据二项分布的期望公式,求得,得到,结合方差的公式,即可求解.
【解析】由题意知,随机变量服从二项分布,
因为,可得,解得,即,
所以.
故答案为:.
13.(22-23高二下·上海长宁·期末)某科技兴趣小组有5名男生、3名女生,从中任取3名同学参加创新大赛,若随机变量X表示选出的女生人数,则 .
【答案】
【分析】由题意选出女生的人数可能为0,1,2,3,计算出各自对应的概率,代入期望公式即可求解.
【解析】由题意,从5名男生、3名女生中任选3名同学参加活动,
选出女生的人数可能为0,1,2,3,
则.
故答案为:.
14.(22-23高二下·上海浦东新·期末)已知随机变量的分布为,且随机变量,则 .
【答案】29
【分析】
由数学期望和方差的公式求出,,再由方差的的性质即可求出.
【解析】因为随机变量的分布为,
所以,
所以,
所以.
故答案为:29.
15.(21-22高二下·上海浦东新·期末)已知一个随机变量的分布为,若是的等差中项,且,则 .
【答案】
【分析】根据概率的性质、等差中项的性质,以及分布列的均值,方差运算公式求解.
【解析】由题可知,,
所以.
故答案为: .
16.(21-22高二下·上海浦东新·期末)设随机变量X服从二项分布,随机变量Y服从二项分布,若,则 .
【答案】或
【分析】由求得p的值,再根据二项分布的概率计算求得答案.
【解析】由题意得,,解得或 ,
故,
或,
故答案为:或
题型5:正态分布及应用
17.(23-24高二上·上海·期末)若随机变量,,则 .
【答案】0.77/
【分析】根据正态曲线的对称性,即可求得答案.
【解析】由题意知随机变量,,
故,所以,
故答案为:0.77
18.(22-23高二下·上海普陀·期末)已知随机变量X服从正态分布,且,则 .
【答案】
【分析】利用正态曲线的对称性即可求解.
【解析】由正态曲线的对称性可知,,,
所以,.
故答案为:.
19.(22-23高二下·上海浦东新·期末)设随机变量服从正态分布,且,,则 .
【答案】/
【分析】由题意可得,由可求出,而与关于对称,由正态分布的对称性即可求出.
【解析】因为随机变量服从正态分布,且,
所以,又,所以,
所以,而与关于对称,
所以.
故答案为:
20.(22-23高二下·上海崇明·期末)某校高中三年级1600名学生参加了区第二次高考模拟统一考试,已知数学考试成绩X服从正态分布(试卷满分为150分),统计结果显示,数学考试成绩在80分到120分之间的人数约为总人数的,则此次统考中成绩不低于120分的学生人数约为( )
A.200 B.150 C.250 D.100
【答案】A
【分析】根据题意,由正态分布的性质可得,即可得到结果.
【解析】因为数学考试成绩服从正态分布,又,
所以,
则此次统考中成绩不低于120分的学生人数约为.
故选:A
题型6:成对数据的相关分析
21.(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
【答案】C
【分析】根据相关图的特征理解判断.
【解析】条形图:是用宽度相同的条形的高度(或长度)表示数据的频数,故符合题意;
茎叶图:即可以保留原始数据又可以方便记录数据,故符合题意;
散点图:用两组数据构成多个坐标点,通常用于比较跨类别的成对数据,不符合题意;
扇形图:是用整个圆表示总体,用圆内各个扇形的大小表示各个部分占总体的百分数,扇形图可以容易看出各个部分所占总体的比例,故符合题意;
故选:C.
22.(22-23高二下·上海金山·期末)如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
【答案】C
【分析】根据正相关的定义可得出结论.
【解析】因为两种证券在一段时间内收益数据的相关系数为正数,
那么表明两种证券的收益有同向变动的倾向,C对,ABD错.
故选:C.
题型7:一元线性回归分析
23.(21-22高二下·上海浦东新·期末)已知变量y与x线性相关,若,且y与x的线性回归直线的斜率为2,则线性回归方程是 .
【答案】
【分析】设线性回归方程为,根据回归方程的性质,把已知数据代入求得,则线性回归方程可求.
【解析】解:设线性回归方程为,
,,与的线性回归直线的斜率为2,即,
.
关于的线性回归方程为.
故答案为:.
24.(22-23高二下·上海松江·期末)某产品的广告费投入与销售额的统计数据如下表所示(单位:万元):
广告费 4 2 3 5
销售额 49 26 39 54
根据上表建立线性回归方程中的为10,预测广告费为6万元时,销售额约为 万元.
【答案】67
【分析】样本中心代入回归方程,求出,得到回归方程,再由回归方程进行预测.
【解析】,,
把代入回归方程,有,得,
所以线性回归方程为,
当时,有.
故答案为:67
25.(22-23高二下·上海浦东新·期末)给出下列有关线性回归分析的四个命题,其中为真命题的是( )
A.线性回归直线未必过样本数据点的中心;
B.回归直线就是散点图中经过数据点最多的那条直线;
C.当相关系数时,两个变量正相关;
D.如果两个变量的相关性越强,则相关系数r就越接近于1.
【答案】C
【分析】由回归直线的性质逐一分析四个选项得答案.
【解析】线性回归直线必过样本数据点的中心,故A错误;
回归直线一定经过样本点的中心,但不一定经过散点图中的点,故B错误;
当相关系数时,两个变量正相关,故C正确;
如果两个变量的相关性越强,则相关系数的绝对值就越接近于1,故D错误.
故选:C.
26.(22-23高二下·上海奉贤·期中)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【分析】由最小二乘法的定义判断即可.
【解析】根据最小二乘法的求解可知:回归方程是为了使得每个数据与估计值之间的差的平方和最小,
即残差平方和最小.
故选:D
27.(22-23高二下·上海浦东新·期末)近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份 1 2 3 4 5
羊只数量/万只 1.4 0.9 0.75 0.6 0.3
草地植被指数 1.1 4.3 15.6 31.3 49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
【答案】
【分析】根据散点图可知两个量呈负相关,且去掉数据后相关性变强,结合相关系数的概念判断即可.
【解析】根据散点图可知,羊只数量与草地植被指数呈负相关,则相关系数,,
当去掉第一年数据后,数据的线性相关性变强,所以,所以.
故答案为:
题型8:列联表
28.(21-22高二下·上海浦东新·期末)下列是关于出生男婴与女婴调查的列联表
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么 .
【答案】82
【分析】根据列联表,可得方程,解之即可得到结论.
【解析】解:由题意,,,,,
,,,,
故答案为: 82.
29.(22-23高二上·上海虹口·期末)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意 不满意
男顾客 40 10
女顾客 30 20
则有 %的把握认为男、女顾客对该商场服务的评价 (有或无)差异
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】 95 有
【分析】完善列联表,利用公式求得观测值并与临界值比较分析.
【解析】由题意可得:
满意 不满意 总计
男顾客 40 10 50
女顾客 30 20 50
总计 70 30 100
则,
∵,
∴能有%的把握认为男、女顾客对该商场服务的评价有差异.
故答案为:95;有.
题型9:概率初步(续) 成对数据的统计分析综合解答题
30.(23-24高二上·上海·期末)为深入学习贯彻党的二十大精神,推动全市党员干部群众用好“学习强国”学习平台,激发干事创业热情.某单位组织“学习强国”知识竞赛,竞赛共有10道题目,随机抽取3道让参赛者回答,规定至少要答对其中2道才能通过初试.已知小明只能答对其中的6道,试求:
(1)抽到他能答对题目数X的分布及期望;
(2)他能通过初试的概率.
【答案】(1)答案见解析
(2)
【分析】(1)根据离散型分布列的解题步骤,结合数学期望的定义,可得答案;
(2)根据题意,根据概率加法,可得答案.
【解析】(1)由题意可知,
则,,
,,
所以的分布列如下:
.
(2)由题意可知当与时,能通过初试,
则
31.(22-23高二下·上海浦东新·期末)某箱子中装有除颜色外完全相同的5个球,其中3个红球,2个白球.从箱子中每次随机取出1个球,如果取出的是红球,则不放回;如果取出的是白球,则放回,每一次操作,称为一次取球.记两次取球后,箱子中小球的个数为.
(1)求两次取球都是红球的概率;
(2)求的分布、期望和方差.
【答案】(1)
(2)分布列见解析,,
【分析】(1)求出的概率即可;
(2)根据求分布列的步骤求出分布列,根据期望公式、方差性质求解可得结果.
【解析】(1)两次取球都是红球的概率即为;
(2)由题意知的所有可能取值为3,4,5,则
,,,
所以的分布为,,
.
32.(23-24高三上·上海普陀·期末)垃圾分类可以提高垃圾的资源价值和经济价值.某学校在寒假期间安排了“垃圾分类知识普及实践活动”.为了解学生的学习成果,该校对高一、高二年级全体学生进行了相关知识测试,然后从高一、高二各随机抽取了20名学生成绩(百分制),并对数据(成绩)进行了整理、描述和分析.下面给出了整理得相关信息:
高一年级成绩分布表
等级 E D C B A
成绩(分数)
人数 1 2 3 4 10
(1)从高一和高二样本中各抽取一人,这两个人成绩都不低于90分的概率是多少?
(2)分别从高一全体学生中抽取一人,从高二全体学生中抽取2人,这三人中成绩不低于90分的人数记为,用频率估计概率,求的分布列和期望.
【答案】(1)
(2)分布列见解析,
【分析】
(1)先分别求出高一,高二中抽取一人,成绩不低于90分的概率,然后利用概率的乘法公式求解即可;
(2)可取的值为,分别求出其概率即可得分布列,然后根据期望公式求期望即可.
【解析】(1)由已知得从高一的学生中抽取一人,成绩不低于90分的概率是,
从高二的学生中抽取一人,成绩不低于90分的概率是,
则从高一和高二样本中各抽取一人,这两个人成绩都不低于90分的概率是;
(2)可取的值为,
则,
,
,
,
则的分布列为
所以
33.(22-23高二下·上海浦东新·期末)某大学学院共有学生1000人,其中男生640人,女生360人.该学院体育社团为了解学生参与跑步运动的情况,按性别分层抽样,从该学院所有学生中抽取若干人作为样本,对样本中的每位学生在5月份的累计跑步里程进行统计,得到下表.
跑步里程
男生(人数) 12 10 5
女生(人数) 6 6 4 2
(1)求的值,并估计学院学生5月份累计跑步里程在中的男生人数;
(2)从学院样本中5月份累计跑步里程不少于的学生中随机抽取3人,其中男生人数记为,求的分布及期望.
【答案】(1),人.
(2)答案见解析,
【分析】(1)首先求出男女生人数之比,即可得到方程,求出a的值,再由样本求出估计值;
(2)依题意的可能取值为,,,求出所对应的概率,即可得到分布列与数学期望;
【解析】(1)依题意,男女生人数之比为,
所以,解得,
故计学院学生月份跑步里程在中的男生人数为人.
(2)依题意的可能取值为,
所以,,,
所以X的分布列为
所以
34.(21-22高二下·上海普陀·期末)某市为调研本市学生体质情况,采用按性别分层抽样的方法进行调查,得到体质测试样本的统计数据(单位:人)如表:
优秀 良好 及格 不及格
男生 100 200 780 120
女生 120 200 520 120
(1)根据所给数据,完成下面列联表,并据此判断:能否有的把握认为该市学生体质测试是否达标与性别有关.(注:体质测试成绩为优秀 良好或及格则体质达标,否则不达标)
达标 不达标 合计
男生
女生
合计
其中;
(2)体质测试成绩为优秀或良好则称体质测试成绩为优良,以样本数据中男 女生体质测试成绩优良的频率视为该市男 女生体质测试成绩优良的概率,在该市学生中随机选取1名男生,1名女生,设所选2人中体质测试成绩优良人数为,求的分布列,数学期望与方差.
【答案】(1)列联表见解析,没有的把握认为该市学生体质达标与性别有关
(2)分布列见解析,,
【分析】(1)直接列出列联表,计算,由独立性检验的思想求解即可;
(2)写出的可能取值,并求出相应的概率,即可求解
【解析】(1)由题得列联表如下:
达标 不达标 合计
男生 1080 120 1200
女生 840 120 960
合计 1920 240 2160
所以没有的把握认为该市学生体质达标与性别有关.
(2)由题意男生体质测试优良率,女生体质测试优良率.
的所有可能取值为.
所以的分布列为
0 1 2
,
一、填空题
1.(23-24高二上·上海·期末)口袋里放有大小相等的两个红球和一个白球,有放回地每次摸取一个球,数列满足:,如果为数列的前n项和,那么的概率为 .
【答案】
【分析】根据题意可知摸到红球的次数服从二项分布,结合分析可得:共摸球次,只有两次摸到红球,利用二项分布求概率公式求概率即可.
【解析】由题意知每次摸球结果互不影响,摸到红球的概率为,摸到白球的概率为,
由可知,共摸球次,只有两次摸到红球,设摸到红球的次数为,
且,所以只有两次摸到红球的概率为:.
故答案为:
2.(23-24高二上·上海·期末)某校中学生篮球队集训前共有6个篮球,其中3个是新球(即没有用过的球),3个是旧球(即至少用过一次的球).每次训练都从中任意取出2个球,用完后放回.已知第一次训练时用过的球放回后都当作旧球,则第二次训练时恰好取到1个新球的概率为 .
【答案】
【分析】求出第一次取到0个、1个、2个新球的概率,再结合条件概率及全概率公式列式计算即得.
【解析】用表示第一次取到个新球的事件,用表示第二次训练时恰好取到1个新球的事件,
则,且两两互斥,,
,
因此,
所以第二次训练时恰好取到1个新球的概率为.
故答案为:
3.(22-23高二下·上海长宁·期末)从集合中随机取出5个不同的数,设事件A表示“选出的5个数的中位数是6”,事件B表示“选出的5个数的第25百分位数是4”,则 .
【答案】/0.3
【分析】计算对应事件的情况数,再根据条件概率公式,计算即可.
【解析】从集合中随机取出5个不同的数,
设事件表示“选出的5个数的中位数是6”,则2个数比6小,2个数比6大,共种选择,
事件表示“选出的5个数的第25百分位数是4”,即第二个数是4,则1个数比4小,3个数比4大,
事件AB表示“选出的5个数的中位数是6且选出的5个数的第25百分位数是4“,
即第二个数是4,第三个数是6,1个数比4小,2个数比6大,共种选择,
则.
故答案为:.
4.(21-22高二下·上海浦东新·期末)已知随机变量X服从正态分布,,,则的最小值为 .
【答案】25
【分析】由正态分布曲线的对称性求出,再由基本不等式求最值.
【解析】解:随机变量服从正态分布,,
由,得,
又,
,且,,
则.
当且仅当,即,时等号成立.
的最小值为25.
故答案为:25.
5.(22-23高二上·上海虹口·期末)某种电子玩具按下按钮后,会出现红球或绿球.已知按钮第一次按下后,出现红球与绿球的概率都是,从按钮第二次按下起,若前一次出现红球,则下一次出现红球、绿球的概率分别为,,若前一次出现绿球,则下一次出现红球、绿球的概率分别为,,记第次按下按钮后出现红球的概率为,则的通项公式为 .
【答案】,
【分析】根据条件概率分别求出第次出现红球、绿球情况下第n次出现红球的概率,利用全概率公式计算数列的递推公式,再根据递推公式求通项公式.
【解析】设“第次出现红球”,“第次出现绿球”,D=“第n次出现红球”,
则,,,,
由全概率公式得
().
即,,
所以,,
所以数列是首项为,公比为的等比数列,
所以,即,,
故答案为:,
二、单选题
6.(22-23高二下·上海浦东新·期末)经检测一批产品中每件产品的合格率为,现从这批产品中任取5件,设取得合格产品的件数为,则以下选项正确的是( )
A.的可能取值为1,2,3,4,5 B.
C.的概率最大 D.服从超几何分布
【答案】C
【分析】
的可能取值包括0可判断A;可判断B;随机变量,,若取得最大值时,则有,,求出的值可判断C;服从二项分布可判断D.
【解析】对于A,的可能取值为0,1,2,3,4,5,故A错误;
对于B,,故B错误;
对于D,由题意,随机变量,故D不正确;
对于C,随机变量,,
若取得最大值时,则:
,
则,解得,则.
故的概率最大,所以C正确;
故选:C.
7.(23-24高二上·上海·期末)已知,随机变量、相互独立,随机变量的分布为,的分布为,则当在内增大时( )
A.减小,增大 B.减小,减小
C.增大,增大 D.增大,减小
【答案】C
【分析】利用数学期望和方差的性质直接求解.
【解析】由题意可得:,,
所以.
所以当在内增大时,增大.
;.
所以.
所以当在内增大时,增大.
故选:C
8.(21-22高二下·上海浦东新·期末)为了考查某种病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:
感染 未感染 总计
服用 10 40 50
未服用 20 30 50
总计 30 70 100
附:,其中.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
根据以上数据,得到的结论正确的是( )
A.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”
B.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”
C.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”
D.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗无关”
【答案】C
【分析】根据给定的列联表,计算出的观测值,再与临界值比对作答.
【解析】依题意,,
显然有,
所以有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”,选项A,B,D不正确,C正确.
故选:C
三、解答题
9.(23-24高三上·上海普陀·期末)全国新高考数学推行8道单选,4道多选的政策.单选题每题5分,选错不得分,多选题每题完全选对5分,部分选对2分,不选得0分.现有小李和小周参与一场新高考数学题,小李的试卷正常,而小周的试卷选择题是被打乱的,所以他12题均认为是单选题来做.假设两人选对一个单选题的概率都是,且已知这四个多选题都只有两个正确答案.
(1)记小周选择题最终得分为,求的分布列以及数学期望.
(2)假设小李遇到四个多选题时,每个题他只能判断有一个选项是正确的,且小李也只会再选1个选项,假设他选对剩下1个选项的概率是,请你帮小李制定回答4个多选题的策略,使得分最高.
【答案】(1)分布列见解析,
(2)答案见解析
【分析】(1)由题意得到小周做对单选题与多选题的个数服从二项分布,然后设他单选题与多选题分别对了个,由此结合二项分布的概率公式、乘法公式以及期望公式即可得解;
(2)若他不选其他选项肯定能得两分,如果继续选其它选项的话,那么这个题的得分期望是,故只需比较这两个数的大小即可.
【解析】(1)由题意,对于单选题,小周每个单选题做对的概率为,
对于多选题,小周每个多选题做对的概率为,
设小周做对单选题的个数为,做对多选题的个数为,
则,,
所以,,
而小周选择题最终得分为,
所以.
设小周单选题与多选题分别对了个,
则
,
所以的分布列为,
(2)由题意他能判断一个选项正确,先把这个正确选项选上,
如果他不继续选其他选项肯定能得两分,
如果他继续选其它选项的话,设此时他的最终得分为,则的所有可能取值为0,5,
则的分布列为:
0 5
那么这个题的得分期望是,
所以我们只需要比较2和的大小关系即可,
令,解得,此时四个多选题全部选两个选项得分要高,
反之,若,此时四个多选只选他确定的那个选项得分最高.
10.(23-24高二上·上海·期末)年月日至月日在国家会展中心举办中国国际进口博览会期间,为保障展会的顺利进行,有、两家外卖公司负责为部分工作者送餐.两公司某天各自随机抽取名送餐员工,统计公司送餐员工送餐数,得到如图频率分布直方图;统计两公司样本送餐数,得到如图送餐数分布茎叶图,已知两公司样本送餐数平均值相同.
(1)求的值
(2)求、的值
(3)为宣传道路交通安全法,并遵循按劳分配原则,公司决定员工送餐份后,每多送份餐对其进行一次奖励,并制定了两种不同奖励方案:
方案一:奖励现金红包元.
方案二:答两道交通安全题,答对题奖励元,答对题奖励元,答对题奖励元.员工每一道题答题相互独立且每题答对概率为与该员工交通安全重视程度相关).
求下表中的值(用表示);从员工收益角度出发,如何选择方案较优?并说明理由.
附:方案二综合收益满足公式,为该员工被奖励次数.
方案二奖励 元 元 元
概率
【答案】(1)
(2),
(3),答案见解析
【分析】(1)根据两公司样本送餐数平均值相同,可得出关于的等式,解之即可;
(2)在公司中,送餐数在区间和送参数在区间的员工人数之比为,结合频率分布直方图可求得的值,利用所有直方图面积之和为可求得的值;
(3)利用独立重复试验的概率公式求出,并求出、,可得出方案一、二综合收益的期望,比较大小后可得出结论.
【解析】(1)解:因为两公司样本送餐数平均值相同,
则,
则.
(2)解:因为公司中,送餐数在区间和送餐数在区间的员工人数之比为,
则,可得,
由频率分布直方图可知,.
(3)解:由题意知,,,
方案一的综合收益满足,
方案二综合收益满足,
,
由可得,解得,
故当时,方案一较优;
由可得,解得,
故当时,方案一和方案二收益相同;
由可得,解得,
故当时,方案二较优.
11.(22-23高二上·上海徐汇·期末)随着网络的快速发展,电子商务成为新的经济增长点,市场竞争也日趋激烈,除了产品品质外,客服团队良好的服务品质也是电子商务的核心竞争力,衡量一位客服工作能力的重要指标—询单转化率,是指咨询该客服的顾客中成交人数占比,可以看作一位顾客咨询该客服后成交的概率,已知某网店共有10位客服,按询单率分为,两个等级(见表),且视,等级客服的询单转化率分别为对应区间的中点值.
等级
询单转化率
人数
(1)求该网店询单转化率的平均值;
(2)现从这10位客服中任意抽取4位进行培训,求这4人的询单转化率的中位数不低于的概率;
(3)已知该网店日均咨询顾客约为1万人,为保证服务质量,每位客服日接待顾客的数量不超过1300人.在网店的前期经营中,进店咨询的每位顾客由系统等可能地安排给任一位客服接待,为了提升店铺成交量,网店实施改革,经系统调整,进店咨询的每位顾客被任一位A等级客服接待的概率为a,被任一位B等级客服接待的概率为b,若希望改革后经咨询日均成交人数至少比改革前增加300人,则a应该控制在什么范围?
【答案】(1);
(2);
(3).
【分析】(1)由已知分别求出、等级客服的询单转化率,根据平均数公式求出即可;
(2)设A等级客服的人数为,则的可能取值为,对应的询单转化率中位数分别为,进而利用超几何分布求出对应的概率,求出答案;
(3)根据二项分布的期望公式计算出改革前的日均成交人数为7200,然后表示出改革后的日均成交人数,结合每位客服日接待顾客的数量不超过1300人,列出不等式组,即可求出a的取值范围.
【解析】(1)解:由已知可得,等级客服的询单转化率为,等级客服的询单转化率为,所以该网店询单转化率的平均值为.
(2)解:由(1)知:、等级客服的询单转化率分别为.
设抽取4位客服中,等级客服的人数为X,则X的可能取值为0,1,2,3,4.
由题意可得,服从超几何分布.
当时,4人转化率为,中位数为;
当时,4人转化率为,中位数为;
当时,4人转化率为,中位数为;
当时,4人转化率为,中位数为;
当时,4人转化率为,中位数为.
所以,当时,这4人的询单转化率的中位数不低于.
因为,服从超几何分布,所以的分布列为,.
所以.
(3)解:设改革前后等级客服的接待顾客人数分别为.
则改革前,每位进店咨询顾客被等级客服接待的概率为,
所以,则.
因为,等级客服的询单转化率分别为,
所以改革前日均成交人数为;
改革后,每位进店咨询顾客被等级客服接待的概率为,
所以,则,
故改革后日均成交人数为.
由得:,①
因为每位顾客被一位等级客服接待的概率为,又,所以每位顾客被一位等级客服接待的概率为.
又每位客服日接待顾客的数量不超过1300人,所以,
解得:,②
由①②得:,所以应该控制在.2023-2024学年高二数学下学期期末复习之概率初步-成对数据的统计分析(沪教版2020选择性必修,上海专用)
题型1:求条件概率
1.(22-23高二下·上海黄浦·期末)三颗骰子各掷一次,观察掷得的点数.记事件A为“三个点数都不相同”,事件B为“至少出现一个2点”,则 .
2.(22-23高二下·上海奉贤·期末)掷一颗骰子并观察出现的点数.已知出现的点数不超过,则出现的点数是奇数的概率是 .
3.(22-23高二下·上海金山·期末)已知,,则 .
题型2:利用全概率公式求概率
4.(22-23高二下·上海浦东新·期末)人群中患肺癌的概率约为0.1%,在人群中有10%是吸烟者,他们患肺癌的概率约为0.5%,则不吸烟者中患肺癌的概率是 .(用分数表示)
5.(21-22高二下·上海闵行·期末)已知某地市场上供应的灯泡中,甲厂产品占70%,乙厂占30%,甲厂产品的合格率是90%,乙厂产品的合格率是80%,则从该地市场上买到一个合格灯泡的概率是 .
6.(21-22高二下·上海松江·期末)盒中有个红球,个黑球,今随机地从中取出一个,观察其颜色后放回,并加上同色球个,再从盒中抽取一球,则第二次抽出的是红球的概率是( )
A. B. C. D.
题型3:随机变量分布列有关的概率问题
7.(22-23高二下·上海金山·期末)设随机变量X的分布列,则的值为( )
A.1 B. C. D.
8.(21-22高二下·上海杨浦·期末)袋中装有大小和质地相同的5个白球,3个黑球.现在依次不放回地摸5个球,则摸出至少3个白球的概率为 .(结果用最简分数表示)
9.(21-22高二下·上海杨浦·期末)袋中有大小 质地完全相同8个球,其中黑球5个 红球3个,从中任取3个球,则红球个数不超过1的概率为 .
题型4:随机变量分布列的均值与方差
10.(21-22高二下·上海浦东新·期末)在箱子中有个小球,其中有个红球,个白球.从这个球中任取个,记表示白球的个数,则 .
11.(22-23高二下·上海金山·期末)掷一颗骰子,则掷得点数的期望是 .
12.(22-23高二下·上海黄浦·期末)已知随机变量X服从二项分布,且,则 .
13.(22-23高二下·上海长宁·期末)某科技兴趣小组有5名男生、3名女生,从中任取3名同学参加创新大赛,若随机变量X表示选出的女生人数,则 .
14.(22-23高二下·上海浦东新·期末)已知随机变量的分布为,且随机变量,则 .
15.(21-22高二下·上海浦东新·期末)已知一个随机变量的分布为,若是的等差中项,且,则 .
16.(21-22高二下·上海浦东新·期末)设随机变量X服从二项分布,随机变量Y服从二项分布,若,则 .
题型5:正态分布及应用
17.(23-24高二上·上海·期末)若随机变量,,则 .
18.(22-23高二下·上海普陀·期末)已知随机变量X服从正态分布,且,则 .
19.(22-23高二下·上海浦东新·期末)设随机变量服从正态分布,且,,则 .
20.(22-23高二下·上海崇明·期末)某校高中三年级1600名学生参加了区第二次高考模拟统一考试,已知数学考试成绩X服从正态分布(试卷满分为150分),统计结果显示,数学考试成绩在80分到120分之间的人数约为总人数的,则此次统考中成绩不低于120分的学生人数约为( )
A.200 B.150 C.250 D.100
题型6:成对数据的相关分析
21.(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
22.(22-23高二下·上海金山·期末)如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
题型7:一元线性回归分析
23.(21-22高二下·上海浦东新·期末)已知变量y与x线性相关,若,且y与x的线性回归直线的斜率为2,则线性回归方程是 .
24.(22-23高二下·上海松江·期末)某产品的广告费投入与销售额的统计数据如下表所示(单位:万元):
广告费 4 2 3 5
销售额 49 26 39 54
根据上表建立线性回归方程中的为10,预测广告费为6万元时,销售额约为 万元.
25.(22-23高二下·上海浦东新·期末)给出下列有关线性回归分析的四个命题,其中为真命题的是( )
A.线性回归直线未必过样本数据点的中心;
B.回归直线就是散点图中经过数据点最多的那条直线;
C.当相关系数时,两个变量正相关;
D.如果两个变量的相关性越强,则相关系数r就越接近于1.
26.(22-23高二下·上海奉贤·期中)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
27.(22-23高二下·上海浦东新·期末)近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份 1 2 3 4 5
羊只数量/万只 1.4 0.9 0.75 0.6 0.3
草地植被指数 1.1 4.3 15.6 31.3 49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
题型8:列联表
28.(21-22高二下·上海浦东新·期末)下列是关于出生男婴与女婴调查的列联表
晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180
那么 .
29.(22-23高二上·上海虹口·期末)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意 不满意
男顾客 40 10
女顾客 30 20
则有 %的把握认为男、女顾客对该商场服务的评价 (有或无)差异
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
题型9:概率初步(续) 成对数据的统计分析综合解答题
30.(23-24高二上·上海·期末)为深入学习贯彻党的二十大精神,推动全市党员干部群众用好“学习强国”学习平台,激发干事创业热情.某单位组织“学习强国”知识竞赛,竞赛共有10道题目,随机抽取3道让参赛者回答,规定至少要答对其中2道才能通过初试.已知小明只能答对其中的6道,试求:
(1)抽到他能答对题目数X的分布及期望;
(2)他能通过初试的概率.
31.(22-23高二下·上海浦东新·期末)某箱子中装有除颜色外完全相同的5个球,其中3个红球,2个白球.从箱子中每次随机取出1个球,如果取出的是红球,则不放回;如果取出的是白球,则放回,每一次操作,称为一次取球.记两次取球后,箱子中小球的个数为.
(1)求两次取球都是红球的概率;
(2)求的分布、期望和方差.
32.(23-24高三上·上海普陀·期末)垃圾分类可以提高垃圾的资源价值和经济价值.某学校在寒假期间安排了“垃圾分类知识普及实践活动”.为了解学生的学习成果,该校对高一、高二年级全体学生进行了相关知识测试,然后从高一、高二各随机抽取了20名学生成绩(百分制),并对数据(成绩)进行了整理、描述和分析.下面给出了整理得相关信息:
高一年级成绩分布表
等级 E D C B A
成绩(分数)
人数 1 2 3 4 10
(1)从高一和高二样本中各抽取一人,这两个人成绩都不低于90分的概率是多少?
(2)分别从高一全体学生中抽取一人,从高二全体学生中抽取2人,这三人中成绩不低于90分的人数记为,用频率估计概率,求的分布列和期望.
33.(22-23高二下·上海浦东新·期末)某大学学院共有学生1000人,其中男生640人,女生360人.该学院体育社团为了解学生参与跑步运动的情况,按性别分层抽样,从该学院所有学生中抽取若干人作为样本,对样本中的每位学生在5月份的累计跑步里程进行统计,得到下表.
跑步里程
男生(人数) 12 10 5
女生(人数) 6 6 4 2
(1)求的值,并估计学院学生5月份累计跑步里程在中的男生人数;
(2)从学院样本中5月份累计跑步里程不少于的学生中随机抽取3人,其中男生人数记为,求的分布及期望.
34.(21-22高二下·上海普陀·期末)某市为调研本市学生体质情况,采用按性别分层抽样的方法进行调查,得到体质测试样本的统计数据(单位:人)如表:
优秀 良好 及格 不及格
男生 100 200 780 120
女生 120 200 520 120
(1)根据所给数据,完成下面列联表,并据此判断:能否有的把握认为该市学生体质测试是否达标与性别有关.(注:体质测试成绩为优秀 良好或及格则体质达标,否则不达标)
达标 不达标 合计
男生
女生
合计
其中;
(2)体质测试成绩为优秀或良好则称体质测试成绩为优良,以样本数据中男 女生体质测试成绩优良的频率视为该市男 女生体质测试成绩优良的概率,在该市学生中随机选取1名男生,1名女生,设所选2人中体质测试成绩优良人数为,求的分布列,数学期望与方差.
一、填空题
1.(23-24高二上·上海·期末)口袋里放有大小相等的两个红球和一个白球,有放回地每次摸取一个球,数列满足:,如果为数列的前n项和,那么的概率为 .
2.(23-24高二上·上海·期末)某校中学生篮球队集训前共有6个篮球,其中3个是新球(即没有用过的球),3个是旧球(即至少用过一次的球).每次训练都从中任意取出2个球,用完后放回.已知第一次训练时用过的球放回后都当作旧球,则第二次训练时恰好取到1个新球的概率为 .
3.(22-23高二下·上海长宁·期末)从集合中随机取出5个不同的数,设事件A表示“选出的5个数的中位数是6”,事件B表示“选出的5个数的第25百分位数是4”,则 .
4.(21-22高二下·上海浦东新·期末)已知随机变量X服从正态分布,,,则的最小值为 .
5.(22-23高二上·上海虹口·期末)某种电子玩具按下按钮后,会出现红球或绿球.已知按钮第一次按下后,出现红球与绿球的概率都是,从按钮第二次按下起,若前一次出现红球,则下一次出现红球、绿球的概率分别为,,若前一次出现绿球,则下一次出现红球、绿球的概率分别为,,记第次按下按钮后出现红球的概率为,则的通项公式为 .
二、单选题
6.(22-23高二下·上海浦东新·期末)经检测一批产品中每件产品的合格率为,现从这批产品中任取5件,设取得合格产品的件数为,则以下选项正确的是( )
A.的可能取值为1,2,3,4,5 B.
C.的概率最大 D.服从超几何分布
7.(23-24高二上·上海·期末)已知,随机变量、相互独立,随机变量的分布为,的分布为,则当在内增大时( )
A.减小,增大 B.减小,减小
C.增大,增大 D.增大,减小
8.(21-22高二下·上海浦东新·期末)为了考查某种病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:
感染 未感染 总计
服用 10 40 50
未服用 20 30 50
总计 30 70 100
附:,其中.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
根据以上数据,得到的结论正确的是( )
A.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”
B.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”
C.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”
D.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗无关”
三、解答题
9.(23-24高三上·上海普陀·期末)全国新高考数学推行8道单选,4道多选的政策.单选题每题5分,选错不得分,多选题每题完全选对5分,部分选对2分,不选得0分.现有小李和小周参与一场新高考数学题,小李的试卷正常,而小周的试卷选择题是被打乱的,所以他12题均认为是单选题来做.假设两人选对一个单选题的概率都是,且已知这四个多选题都只有两个正确答案.
(1)记小周选择题最终得分为,求的分布列以及数学期望.
(2)假设小李遇到四个多选题时,每个题他只能判断有一个选项是正确的,且小李也只会再选1个选项,假设他选对剩下1个选项的概率是,请你帮小李制定回答4个多选题的策略,使得分最高.
10.(23-24高二上·上海·期末)年月日至月日在国家会展中心举办中国国际进口博览会期间,为保障展会的顺利进行,有、两家外卖公司负责为部分工作者送餐.两公司某天各自随机抽取名送餐员工,统计公司送餐员工送餐数,得到如图频率分布直方图;统计两公司样本送餐数,得到如图送餐数分布茎叶图,已知两公司样本送餐数平均值相同.
(1)求的值
(2)求、的值
(3)为宣传道路交通安全法,并遵循按劳分配原则,公司决定员工送餐份后,每多送份餐对其进行一次奖励,并制定了两种不同奖励方案:
方案一:奖励现金红包元.
方案二:答两道交通安全题,答对题奖励元,答对题奖励元,答对题奖励元.员工每一道题答题相互独立且每题答对概率为与该员工交通安全重视程度相关).
求下表中的值(用表示);从员工收益角度出发,如何选择方案较优?并说明理由.
附:方案二综合收益满足公式,为该员工被奖励次数.
方案二奖励 元 元 元
概率
11.(22-23高二上·上海徐汇·期末)随着网络的快速发展,电子商务成为新的经济增长点,市场竞争也日趋激烈,除了产品品质外,客服团队良好的服务品质也是电子商务的核心竞争力,衡量一位客服工作能力的重要指标—询单转化率,是指咨询该客服的顾客中成交人数占比,可以看作一位顾客咨询该客服后成交的概率,已知某网店共有10位客服,按询单率分为,两个等级(见表),且视,等级客服的询单转化率分别为对应区间的中点值.
等级
询单转化率
人数
(1)求该网店询单转化率的平均值;
(2)现从这10位客服中任意抽取4位进行培训,求这4人的询单转化率的中位数不低于的概率;
(3)已知该网店日均咨询顾客约为1万人,为保证服务质量,每位客服日接待顾客的数量不超过1300人.在网店的前期经营中,进店咨询的每位顾客由系统等可能地安排给任一位客服接待,为了提升店铺成交量,网店实施改革,经系统调整,进店咨询的每位顾客被任一位A等级客服接待的概率为a,被任一位B等级客服接待的概率为b,若希望改革后经咨询日均成交人数至少比改革前增加300人,则a应该控制在什么范围?