概率与统计
目录
【解密高考】总结常考点及应对的策略,精选名校模拟题,讲解通关策略(含押题型)
【题型一】条件概率与全概率公式
【题型二】离散型随机变量及其分布
【题型三】二项分布
【题型四】超几何分布
【题型五】正态分布
【题型六】一元线性、非线性回归模型
【题型七】列联表与独立性检验
【题型八】概率、统计与其他知识的交汇问题
【误区点拨】点拨常见的易错点
易错点:均值、方差的大小比较、最值范围问题
:
1、全国Ⅰ对古典概型每年都会考查,主要考查实际背景的可能事件,通常与互斥事件、对立事件一起考查.在高考中单独命题时,通常以选择题、填空题形式出现,属于中低档题;与统计等知识结合在一起考查时,以解答题形式出现,属中档题.
2、以理解几何概型的概念、概率公式为主,会求一些简单的几何概型的概率,常与平面几何、线性规划、不等式的解集、定积分等知识交汇考查.在高考中多以选择、填空题的形式考查,难度为中档.
3、以理解离散型随机变量及其分布列的概念为主,经常以频率分布直方图为载体,结合频率与概率,考查离散型随机变量、离散型随机变量分布列的求法.在高考中以解答题的形式进行考查,难度多为中档或较难.
:小题中新教材新加的全概率公式和条件概率是重点,当然古典概型和相互独立事件的判断以及正态分布也是需要熟练掌握的。今年还需对冷门的知识点,比如用样本方差估计总体方差、最小二乘法、残差等知识点的掌握和理解。
【题型一】条件概率与全概率公式
【例1】甲、乙、丙、丁、成5人排成一排,在甲和乙相邻的条件下,丙和丁也相邻的概率为( )
A. B. C. D.
【例2】(多选)有三个相同的箱子,分别编号,其中号箱内装有个红球、个白球,号箱内装有个红球、个白球,号箱内装有个红球,这些球除颜色外完全相同.某人等可能从三个箱子中任取一箱并从中摸出一个球,事件表示“取到号箱”,事件表示“摸到红球”,事件表示“摸到白球”,则( )
A. B.
C. D.
【例3】有甲、乙、丙3台车床加工同一型号的零件,加工的次品率分别为、、,加工出来的零件混放在一起.已知甲、乙、丙台车床加工的零件数分别占总数的、、.任取一个零件,如果取到的零件是次品,则它是甲车床加工的概率为( )
A. B. C. D.
【变式1】电商平台人工智能推荐系统是根据用户的喜好为用户推送商品的.某体育用品供应商在甲电商平台推广新品和,在乙电商平台推广新品.已知甲平台向一用户推送的概率为0.7,推送的概率为0.5,同时推送和的概率为0.3;乙平台向该用户推送的概率为0.6,且甲平台的推送结果与乙平台的推送结果互相不受影响.
(1)在甲平台没有向该用户推送的条件下,求它向该用户推送的概率;
(2)求这两个平台至少向该用户推送A、B、C中的一种的概率.
【变式2】小李经常参加健身运动,他周一去健身的概率为,周二去健身的概率为,且小李周一不去健身的条件下周二去的概率是周一去健身的条件下周二去的概率的2倍,则小李周一、周二都去健身的概率为 .
【变式3】甲乙两人进行投篮比赛,要求各投篮2次.已知甲乙两人每次投中的概率分别为,,且每人每次投中与否互不影响.
(1)求“甲第一次未投中,乙两次都投中”的概率;
(2)求“乙获胜”的概率.
【题型二】离散型随机变量及其分布
【例1】(多选)设随机变量的分布列为,(),则( )
A. B.
C. D.
【例2】已知随机变量的分布列如表
-1 0 1
P
若,则( )
A.或 B.或 C. 或 D.
【例3】已知编号为甲、乙、丙的三个袋子中装有除标号外完全相同的小球,其中甲袋内装有两个1号球,一个2号球和一个3号球;乙袋内装有两个1号球,一个3号球;丙袋内装有三个1号球,两个2号球和一个3号球.
(1)从甲袋中一次性摸出2个小球,记随机变量为1号球的个数,求随机变量的分布列和数学期望;
(2)现按照如下规则摸球:连续摸球两次,第一次先从甲袋中随机摸出1个球,若摸出的是1号球放入甲袋,摸出的是2号球放入乙袋,摸出的是3号球放入丙袋;第二次从放入球的袋子中再随机摸出1个球.求第二次摸到的是3号球的概率.
【变式1】设是一个离散型随机变量,其分布列为如下,则 .
【变式2】甲、乙两人各进行3次射击,甲每次击中目标的概率是,乙每次击中目标的概率是,假设两人是否击中目标相互之间没有影响.
(1)求甲恰好比乙多击中目标2次的概率;
(2)设甲击中目标的次数为X,求X的分布列和数学期望.
【题型三】二项分布
【例1】某公司升级了智能客服系统,在测试时,当输入的问题表达清晰时,智能客服的回答被采纳的概率为,当输入的问题表达不清晰时,智能客服的回答被采纳的概率为.已知输入的问题表达不清晰的概率为.
(1)求智能客服的回答被采纳的概率;
(2)在某次测试中输入了3个问题(3个问题相互独立),设表示智能客服的回答被采纳的次数.求的分布列、期望及方差.
【例2】甲、乙两人各进行3次射击,甲每次击中目标的概率是,乙每次击中目标的概率是,假设两人是否击中目标相互之间没有影响.
(1)求甲恰好比乙多击中目标2次的概率;
(2)设甲击中目标的次数为,求的分布列和数学期望.
【变式1】某工厂的生产线上的产品按质量分为:一等品,二等品,三等品.质检员每次从生产线上任取2件产品进行抽检,若抽检出现三等品或2件都是二等品,则需要调整设备,否则不需要调整.已知该工厂某一条生产线上生产的产品每件为一等品,二等品,三等品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.
(1)求在一次抽检后,设备不需要调整的概率;
(2)若质检员一天抽检3次,以表示一天中需要调整设备的次数,求的分布列和数学期望.
【变式2】我们把鱼在水中聚集的比较密的地方叫做鱼窝.某人在一湖中用粘网(也叫挂网)捕鱼,如果找到鱼窝下网,则捕到鱼的概率为;如果找不到鱼窝下网,则捕到鱼的概率为.若这个人能够找到鱼窝的概率为.
(1)求此人能捕到鱼的概率;
(2)此人连续下网次,每次下网捕鱼之间相互独立,若能捕到鱼的次数为,则为何值时,次捕到鱼的概率的值最大
【题型四】超几何分布
【例1】袋中装有12个大小相同的球,其中红球2个,黄球3个,白球7个,从中随机取出3个球.
(1)求取出的3个球中有2个白球的概率;
(2)设X表示取到的红球个数,求X的分布列与数学期望.
【变式1】(多选)从6名女生和8名男生中任选5人去阳光敬老院参加志愿服务,用表示所选5人中女生的人数,用表示所选5人中男生的人数,则下列结论正确的是( )
备注:一般地,若一个随机变量的分布列为,其中,则称.
A. B. C. D.
【变式2】一个不透明的袋子中有10件外观一样的产品,其中有6件正品,4件次品.现进行如下两个试验,试验一:逐个不放回地随机摸出2件产品,记取得次品的件数为,期望方差分别为;试验二: 逐个有放回地随机摸出2件产品,记取到次品的件数为,期望和方差分别为,则下列判断正确的是( )
A. B.
C. D.
【题型五】正态分布
【例1】(多选)若随机变量服从标准正态分布,,则( )
A.
B.
C.
D.
【例2】(多选)小明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30分钟,样本方差为36;骑自行车平均用时34分钟,样本方差为4,假设坐公交车用时和骑自行车用时都服从正态分布,则( )
A.
B.
C.若某天只有34分钟可用,小明应选择骑自行车
D.若某天只有38分钟可用,小明应选择骑自行车
【例3】某校高三学生的模考数学成绩服从正态分布,按照,,,的比例将考试成绩划分为优秀、良好、合格和基本合格四个等级.若小张的数学成绩为分,则他的等级是( )
附:,,.
A.优秀 B.良好 C.合格 D.基本合格
【变式1】已知某机械在生产正常的情况下,生产出的产品的指标参数符合正态分布.现从该机械生产出的所有产品中随机抽取2件,则这2件产品的质量指标分别在)和的概率为( )(运算结果保留小数点后两位)参考数据:若服从正态分布,则,.
A.0.57 B.0.75 C.0.80 D.0.84
【变式2】已知随机变量,且,则的最小值为 .
【变式3】(多选)随机变是服从正态分布,令函数,则下列选项正确的是( )
A. B.是增函数
C.是偶函数 D.的图象关于点中心对称
【题型六】一元线性、非线性回归模型
【例1】某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是 .
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
【例2】众所周知,乒乓球被称为中国的“国球”,是一种世界流行的球类体育项目,包括进攻、对抗和防守.某学校为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7个星期(用x=1表示第1个星期,用x=2表示第二个星期,以此类推)参加活动的累计人数y(人)的统计数据.
x 1 2 3 4 5 6 7
y 6 14 20 37 74 108 203
(1)根据表中数据可以判断y与x大致满足回归模型,试建立y与x的回归方程(精确到0.01);
(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人,其身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.
参考数据:,其中;
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【变式1】(多选)已知变量和变量的一组成对样本数据的散点落在一条直线附近,,,相关系数为,线性回归方程为,则( )
参考公式:,
A.当时,成对样本数据成线性正相关;
B.当越大时,成对样本数据的线性相关程度越强;
C.,时,成对样本数据的相关系数满足;
D.,时,成对样本数据的线性回归方程满足;
【变式2】某健身俱乐部研究会员每周锻炼时长与体重减少量的关系,随机抽取10名会员的数据如下:
会员序号 1 2 3 4 5 6 7 8 9 10 总和
锻炼时长(小时) 3 4 2 5 6 4 5 3 4 4 40
体重减少量(千克) 1.0 1.5 1.0 2.0 2.5 1.8 2.0 1.0 1.6 2.0 16.4
并计算得:
(1)根据表格中的数据,可用一元线性回归模型刻画变量与变量之间的线性相关关系,请用相关系数加以说明;
(2)求经验回归方程(结果精确到 0.01 );
(3)该俱乐部推广了一项激励措施后,发现会员平均每周锻炼时长增加2个小时,实际观测到的平均体重减少量增加了0.8千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.
(参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为,. 参考值:)
【题型七】列联表与独立性检验
【例1】某研究性学习小组针对“使用大绿书的用户是否存在性别差异”,向个人进行调查.用表示所有调查对象构成的集合.以为样本空间建立古典概型,并定义一对分类变量和如下:对于中的每一名学生,,现得到下表:
是大绿书的用户 不是大绿书的用户
男性
女性
若根据的独立性检验认为(其中),则的最小值为 .(参考公式:,其中)
【例2】为了研究某市高三年级学生的性别和身高的关联性,随机抽取了200名高三年级学生,整理数据得到如下列联表,并画出身高的频率分布直方图:
性别 身高 合计
低于 不低于
女 20
男 50
合计 200
(1)根据身高的频率分布直方图,求列联表中的,的值;
(2)依据小概率值的独立性检验,能否认为“高三年级学生的性别”与“身高是否低于”有关联?
(3)将样本频率视为概率,在全市不低于的学生中随机抽取6人,其中不低于的人数记为,求的期望.
附:,
0.050 0.010 0.001
3.841 6.635 10.828
【变式1】下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等.
B.两组数据的标准差相等,则这两组数据的平均数相等.
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强.
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系.
的部分临界值如表:
0.1 0.05 0.025 0.01
2.706 3.841 5.024 6.635
【题型八】概率、统计与其他知识的交汇问题
【例1】数轴上的一个质点从原点出发,每次随机向右或向左移动1个单位长度,其中向右移动的概率为,向左移动的概率为,记质点移动次后所在的位置对应的实数为.
(1)当,时,质点在哪一个位置的可能性最大,并说明理由;
(2)求证:的数学期望.
【例2】(1)数据的平均数为,数据的平均数为,,为常数,如果满足,,…,,证明:.
(2)证明:如果两个事件与独立,那么事件与也独立.
(3)设数据的均值为,方差为,请利用已经学过的方差公式:来证明方差第二公式:;
【变式1】有一项危险任务需要工作人员去完成,每次只进入一人,且每人只进入一次,在规定安全时间内未完成任务则撤出,换下一个人进入,但最多派三人执行任务.现在一共有、、三个人可参加这项任务,他们各自能完成任务的概率分别为,,,且,,互不相等,他们三个人能否完成任务的事件相互独立.
(1),,,如果按照、、的顺序先后进入;
①求任务能被完成的概率;
②求所需派出入员数目的分布列和数学期望;
(2)假定,试分析以怎样的先后顺序派出、、三个人可使所需派出的人员数目的数学期望达到最小,请说明理由.
【变式2】某学校有、两家餐厅,某同学每天都会在这两家餐厅中选择一家餐厅用晚餐.已知该同学第一天随机选择一家餐厅用晚餐,若在前一天选择去餐厅的条件下,后一天继续选择餐厅的概率为;而在前一天选择去餐厅的条件下,后一天继续选择去餐厅的概率为,如此往复.
(1)求该同学第一天和第二天都选择去餐厅用晚餐的概率;
(2)求该同学第二天选择去餐厅用晚餐的概率;
(3)记该同学第天选择去餐厅用晚餐的概率为,求的通项公式.
易错点:均值、方差的大小比较、最值(范围)问题
例1.当前,以大语言模型为代表的人工智能技术正蓬勃发展,而数学理论和方法在这些模型的研发中,发挥着重要作用.例如,当新闻中分别出现“7点钟,一场大火在郊区燃起”和“7点钟,太阳从东方升起”这两个事件的描述时,它们提供的“信息量”是不一样的,前者比后者要大,会吸引人们更多关注.假设通常情况下,它们发生的概率分别是和,用这个量来刻画“信息量”的大小,计算可得前者约为9,后者接近于0.现在假设离散型随机变量的分布列为,,.则称为的信息熵,用来刻画随机变量蕴含的信息量的大小.
(1)若的分布列为,,,求的最大值;
(2)证明:;
(3)若,且为定值,设,证明:.
变式1.不同AI大模型各有千秋,适配领域也各有所长.为了解某高校甲、乙两个学院学生对两款不同AI大模型是否使用,对学生进行简单随机抽样,获得数据如下表:
甲学院 乙学院
使用 不使用 使用 不使用
款 40人 80人 60人 20人
款 70人 50人 30人 50人
假设所有学生对,两款大模型是否使用相互独立,用频率估计概率,
(1)分别估计该校甲学院学生使用款大模型的概率、该校乙学院学生使用款大模型的概率;
(2)从该校甲学院全体学生中随机抽取2人,乙学院全体学生中随机抽取1人,记这3人中使用款大模型的人数为,估计的数学期望;
(3)从该校甲学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,从该校乙学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,比较与的大小,(结论不要求证明).
变式2.2024年新高考Ⅰ卷数学卷面分值进行了调整,其中第9题到第11题为多项选择题,每题分值为6分,若正确选项有2个,选对2个得6分,选对1个得3分,有选错的或不选择得0分;若正确选项有3个,选对3个得6分,选对2个得4分,选对1个得2分,有选错的或不选择得0分.已知甲、乙两位同学各自独立作答第11题,设第11题正确答案是2个选项的概率为.
(1)已知甲同学随机(等可能)选择了2个选项作答,求他既选出正确选项也选出错误选项的概率;
(2)若乙同学在作答第11题时,除确定B,D选项不能同时选择之外没有答题思路,只能随机选择若干选项作答.求乙在答题过程中使得分期望最大的答题方式,并写出得分的最大期望.
21世纪教育网(www.21cnjy.com)概率与统计
目录
【解密高考】总结常考点及应对的策略,精选名校模拟题,讲解通关策略(含押题型)
【题型一】条件概率与全概率公式
【题型二】离散型随机变量及其分布
【题型三】二项分布
【题型四】超几何分布
【题型五】正态分布
【题型六】一元线性、非线性回归模型
【题型七】列联表与独立性检验
【题型八】概率、统计与其他知识的交汇问题
【误区点拨】点拨常见的易错点
易错点:均值、方差的大小比较、最值范围问题
:
1、全国Ⅰ对古典概型每年都会考查,主要考查实际背景的可能事件,通常与互斥事件、对立事件一起考查.在高考中单独命题时,通常以选择题、填空题形式出现,属于中低档题;与统计等知识结合在一起考查时,以解答题形式出现,属中档题.
2、以理解几何概型的概念、概率公式为主,会求一些简单的几何概型的概率,常与平面几何、线性规划、不等式的解集、定积分等知识交汇考查.在高考中多以选择、填空题的形式考查,难度为中档.
3、以理解离散型随机变量及其分布列的概念为主,经常以频率分布直方图为载体,结合频率与概率,考查离散型随机变量、离散型随机变量分布列的求法.在高考中以解答题的形式进行考查,难度多为中档或较难.
:小题中新教材新加的全概率公式和条件概率是重点,当然古典概型和相互独立事件的判断以及正态分布也是需要熟练掌握的。今年还需对冷门的知识点,比如用样本方差估计总体方差、最小二乘法、残差等知识点的掌握和理解。
【题型一】条件概率与全概率公式
【例1】甲、乙、丙、丁、成5人排成一排,在甲和乙相邻的条件下,丙和丁也相邻的概率为( )
A. B. C. D.
【答案】C
【详解】甲、乙、丙、丁、成5人排成一排,甲和乙相邻的情况有:所有排列为:,
甲和乙相邻,丙和丁也相邻的情况有:,
所以在甲和乙相邻的条件下,丙和丁也相邻的概率为,
故选:C
【例2】(多选)有三个相同的箱子,分别编号,其中号箱内装有个红球、个白球,号箱内装有个红球、个白球,号箱内装有个红球,这些球除颜色外完全相同.某人等可能从三个箱子中任取一箱并从中摸出一个球,事件表示“取到号箱”,事件表示“摸到红球”,事件表示“摸到白球”,则( )
A. B.
C. D.
【答案】AD
【分析】对于A,,由条件概率公式,即可求解;对于B,利用事件,事件相互对立和条件概率公式,即可求解;对于C,根据条件,利用全概论公式,即可求解;对于D,利用选项C中结果,再利用贝叶斯公式,即可求解.
【详解】对于选项A,因为,所以选项A正确;
对于选项B,因为事件,事件相互对立,所以,所以选项B不正确;
对于选项C, 由全概率公式知,
所以选项C不正确;
对于选项D,由选项C知
则,所以选项D正确,
故选:AD.
【例3】有甲、乙、丙3台车床加工同一型号的零件,加工的次品率分别为、、,加工出来的零件混放在一起.已知甲、乙、丙台车床加工的零件数分别占总数的、、.任取一个零件,如果取到的零件是次品,则它是甲车床加工的概率为( )
A. B. C. D.
【答案】C
【分析】记事件取到的零件为甲车床加工的,事件取到的零件为乙车床加工的,事件取到的零件为丙车床加工的,事件取到的零件是次品,利用贝叶斯公式可求得的值.
【详解】记事件取到的零件为甲车床加工的,事件取到的零件为乙车床加工的,
事件取到的零件为丙车床加工的,事件取到的零件是次品,
则,,,
,,,
由贝叶斯公式可得.
因此,如果取到的零件是次品,则它是甲车床加工的概率为.
故选:C.
【变式1】电商平台人工智能推荐系统是根据用户的喜好为用户推送商品的.某体育用品供应商在甲电商平台推广新品和,在乙电商平台推广新品.已知甲平台向一用户推送的概率为0.7,推送的概率为0.5,同时推送和的概率为0.3;乙平台向该用户推送的概率为0.6,且甲平台的推送结果与乙平台的推送结果互相不受影响.
(1)在甲平台没有向该用户推送的条件下,求它向该用户推送的概率;
(2)求这两个平台至少向该用户推送A、B、C中的一种的概率.
【答案】(1)
(2)
【分析】(1)设甲平台向该用户推送为事件,推送为事件,则甲平台没有向该用户推送为事件,应用条件概率公式,计算可得结果;
(2)应用对立事件的性质,可以计算这两个平台向该用户不推送A、B、C中任一种的概率,用1减去可得结果.
【详解】(1)解:设甲平台向该用户推送为事件,推送为事件,则甲平台没有向该用户推送为事件,由题设可知:
,,,,
又,所以,
(2)设平台向该用户推送为事件,
则这两个平台向该用户至少推送A、B、C中的一种的概率为:,
因为甲平台的推送结果与乙平台的推送结果互相不受影响,所以,
因为,所以,
即,
所以.
【变式2】小李经常参加健身运动,他周一去健身的概率为,周二去健身的概率为,且小李周一不去健身的条件下周二去的概率是周一去健身的条件下周二去的概率的2倍,则小李周一、周二都去健身的概率为 .
【答案】/
【分析】设“小李周一去健身”为事件A,设“小李周二去健身”为事件B,根据题意利用全概率公式可得,进而结合条件概率公式分析求解.
【详解】设“小李周一去健身”为事件A,设“小李周二去健身”为事件B,
则“小李周一、周二都去健身”为事件,
由题意可知:,,且,
由全概率公式可知:,
即,代入,
可解得,
所以.
故答案为:.
【变式3】甲乙两人进行投篮比赛,要求各投篮2次.已知甲乙两人每次投中的概率分别为,,且每人每次投中与否互不影响.
(1)求“甲第一次未投中,乙两次都投中”的概率;
(2)求“乙获胜”的概率.
【答案】(1)
(2)
【分析】(1)结合随机事件的概率求解即可(2)结合随机事件“乙获胜”分为甲投中次,乙投中1次或者两次,和甲投中1次,乙投中两次两种情况结合全概率公式求解即可.
【详解】(1)设事件“甲第一次未投中,乙两次都投中”为事件
则
(2)谁事件“乙获胜”为事件
则
【题型二】离散型随机变量及其分布
【例1】(多选)设随机变量的分布列为,(),则( )
A. B.
C. D.
【答案】ABC
【分析】由,求出a,根据随机变量均值的定义,结合选项依次判断即可.
【详解】A:由,得,故A正确;
B:,故B正确;
C:由选项A知,,
则
所以,故C正确;
D:由选项A知,,则,故D错误.
故选:ABC
【例2】已知随机变量的分布列如表
-1 0 1
P
若,则( )
A.或 B.或 C. 或 D.
【答案】B
【分析】根据概率之和为1,以及方差的计算公式求解即可.
【详解】由题意得,即①,
,,
又因为,所以②,
联立①,②,解得,所以,
当时,;当时,,
故,解得或.
故选:B.
【例3】已知编号为甲、乙、丙的三个袋子中装有除标号外完全相同的小球,其中甲袋内装有两个1号球,一个2号球和一个3号球;乙袋内装有两个1号球,一个3号球;丙袋内装有三个1号球,两个2号球和一个3号球.
(1)从甲袋中一次性摸出2个小球,记随机变量为1号球的个数,求随机变量的分布列和数学期望;
(2)现按照如下规则摸球:连续摸球两次,第一次先从甲袋中随机摸出1个球,若摸出的是1号球放入甲袋,摸出的是2号球放入乙袋,摸出的是3号球放入丙袋;第二次从放入球的袋子中再随机摸出1个球.求第二次摸到的是3号球的概率.
【答案】(1)分布列见详解;
(2)
【分析】(1)分析可知随机变量的可能取值为0,1,2,结合超几何分布求分布列和期望;
(2)设相应事件,根据题意可得相应概率,利用全概率公式圆求解.
【详解】(1)由题意可知:随机变量的可能取值为0,1,2,则有:
,
可得随机变量的分布列为
0 1 2
所以随机变量的期望.
(2)记第一次从甲袋中随机摸出1个球,摸出的是1、2、3号球分别为事件,
第二次摸到的是3号球为事件B,
则,
所以.
【变式1】设是一个离散型随机变量,其分布列为如下,则 .
【答案】/
【分析】根据随机变量的概率非负不大于,且随机变量取遍所有可能值时相应的概率之和等于,列出方程和不等式,解方程组即可.
【详解】因为随机变量取遍所有可能值时相应的概率之和等于,
所以,
解得或,
又因为随机变量的概率非负不大于,
所以,,
解得,
综上,
故答案为:##.
【变式2】甲、乙两人各进行3次射击,甲每次击中目标的概率是,乙每次击中目标的概率是,假设两人是否击中目标相互之间没有影响.
(1)求甲恰好比乙多击中目标2次的概率;
(2)设甲击中目标的次数为X,求X的分布列和数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)甲恰好比乙多击中目标次,包括甲恰好击中目标次且乙恰击中目标次,甲恰好击中目标次且乙恰击中目标次,根据公式得到结果;
(2)根据题意确定变量的所有可能取值,根据变量对应的概率和独立重复试验的概率公式,写出变量对应的概率,写出分布列,做出期望值.
【详解】(1)设甲恰好比乙多击中目标2次为事件A,甲击中目标2次且乙击中目标0次为事件,甲击中目标3次且乙击中目标1次为事件,
则,
所以甲恰好比乙多击中目标2次的概率为.
(2)由题可知X的所有可能取值为0,1,2,3,
,,
,,
所以X的分布列为
X 0 1 2 3
P
所以.
【题型三】二项分布
【例1】某公司升级了智能客服系统,在测试时,当输入的问题表达清晰时,智能客服的回答被采纳的概率为,当输入的问题表达不清晰时,智能客服的回答被采纳的概率为.已知输入的问题表达不清晰的概率为.
(1)求智能客服的回答被采纳的概率;
(2)在某次测试中输入了3个问题(3个问题相互独立),设表示智能客服的回答被采纳的次数.求的分布列、期望及方差.
【答案】(1);
(2)分布列见解析,期望为,方差为.
【分析】(1)根据给定条件,利用全概率公式求解.
(2)求出的可能值及对应的概率,列出分布列并求出期望的方差.
【详解】(1)设“智能客服的回答被采纳”,“输入的问题表达不清晰”,
依题意,,,
因此,
所以智能客服的回答被采纳的概率为.
(2)依题意,的所有可能取值为0,1,2,3,,
,
,
所以的分布列为:
0 1 2 3
数学期望;.
【例2】甲、乙两人各进行3次射击,甲每次击中目标的概率是,乙每次击中目标的概率是,假设两人是否击中目标相互之间没有影响.
(1)求甲恰好比乙多击中目标2次的概率;
(2)设甲击中目标的次数为,求的分布列和数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)3次射击中甲恰好比乙多击中目标2次,分别为甲击中目标2次且乙击中目标0次与甲击中目标3次且乙击中目标1次,分别求出其概率,再相加即可;
(2)甲的设计过程可看作独立重复试验,所以,根据二项分布即可求解.
【详解】(1)设甲恰好比乙多击中目标2次为事件,甲击中目标2次且乙击中目标0次为事件,甲击中目标3次且乙击中目标1次为事件,
则,
所以甲恰好比乙多击中目标2次的概率为.
(2)由题可知X的所有可能取值为0,1,2,3,且
,
,
所以的分布列为
0 1 2 3
所以.
【变式1】某工厂的生产线上的产品按质量分为:一等品,二等品,三等品.质检员每次从生产线上任取2件产品进行抽检,若抽检出现三等品或2件都是二等品,则需要调整设备,否则不需要调整.已知该工厂某一条生产线上生产的产品每件为一等品,二等品,三等品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.
(1)求在一次抽检后,设备不需要调整的概率;
(2)若质检员一天抽检3次,以表示一天中需要调整设备的次数,求的分布列和数学期望.
【答案】(1);
(2)分布列见解析,.
【分析】(1)应用全概率公式计算求解即可;
(2)先根据对立事件求概率,再结合二项分布分别求出概率及分布列进而得出数学期望即可.
【详解】(1)设表示事件“在一次抽检中抽到的第件产品为一等品”,,
表示事件“在一次抽检中抽到的第件产品为二等品”,,
表示事件“一次抽检后,设备不需要调整”,则.
由已知,
所求的概率为.
(2)依题意有:随机变量的可能取值为,
由(1)知一次抽检后,设备需要调整的概率为,
依题意知,则,
故的分布列为:
0 1 2 3
0.729 0.243 0.027 0.001
所以:.
【变式2】我们把鱼在水中聚集的比较密的地方叫做鱼窝.某人在一湖中用粘网(也叫挂网)捕鱼,如果找到鱼窝下网,则捕到鱼的概率为;如果找不到鱼窝下网,则捕到鱼的概率为.若这个人能够找到鱼窝的概率为.
(1)求此人能捕到鱼的概率;
(2)此人连续下网次,每次下网捕鱼之间相互独立,若能捕到鱼的次数为,则为何值时,次捕到鱼的概率的值最大
【答案】(1)
(2)或
【分析】(1)根据全概率公式直接求解即可;
(2)根据二项分布概率公式可表示出,采用不等式法可求得的范围,结合最大可确定的取值.
【详解】(1)记事件为“此人能补到鱼”,事件为“此人能找到鱼窝”,
则,,,
.
(2)由(1)知:,,
假设当时,次补到鱼的概率最大,
则,解得:,
若的值最大,则,解得:,
又且,或,
即当或时,次补到鱼的概率的值最大.
【题型四】超几何分布
【例1】袋中装有12个大小相同的球,其中红球2个,黄球3个,白球7个,从中随机取出3个球.
(1)求取出的3个球中有2个白球的概率;
(2)设X表示取到的红球个数,求X的分布列与数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)应用超几何分布的概率公式求概率即可.
(2)先分别应用超几何分布的概率公式求出对应概率,再写出分布列,再求数学期望即可.
【详解】(1)所求概率为
(2)X可能的取值为0,1,2.
,
.
故X的分布列为
0 1 2
故.
【变式1】(多选)从6名女生和8名男生中任选5人去阳光敬老院参加志愿服务,用表示所选5人中女生的人数,用表示所选5人中男生的人数,则下列结论正确的是( )
备注:一般地,若一个随机变量的分布列为,其中,则称.
A. B. C. D.
【答案】BCD
【分析】根据超几何分布的概念和性质,逐项判定,即可求解.
【详解】由题意,从6名女生和8名男生中任选5人,
则所选5人中女生的人数和男生的人数Y服从超几何分布,
即,所以选项A错误,选项B正确;
又由超几何分布的均值公式,可得:
,,
所以,
,所以选项C,D正确.
故选:BCD
【变式2】一个不透明的袋子中有10件外观一样的产品,其中有6件正品,4件次品.现进行如下两个试验,试验一:逐个不放回地随机摸出2件产品,记取得次品的件数为,期望方差分别为;试验二: 逐个有放回地随机摸出2件产品,记取到次品的件数为,期望和方差分别为,则下列判断正确的是( )
A. B.
C. D.
【答案】A
【分析】利用超几何分布和二项分布知识分别计算从中随机地无放回摸出2件产品、从中随机地有放回摸出2件产品的期望、方差,再做比较可得答案.
【详解】试验一:从中随机地无放回摸出2件产品,记次品的件数为,
则的可能取值是0,1,2,
则,
,
故随机变量的概率分布列为:
0 1 2
则数学期望为:,
方差为:;
试验二:从中随机地有放回摸出2件产品,则每次摸到次品的概率为,
则,
故,
方差为: ,
所以,
故,.
故选:A.
【题型五】正态分布
【例1】(多选)若随机变量服从标准正态分布,,则( )
A.
B.
C.
D.
【答案】AC
【分析】根据给定条件,利用标准正态分布的性质逐项计算判断.
【详解】对于AB,由,得,A正确,B错误;
对于CD,,则,C正确,D错误.
故选:AC
【例2】(多选)小明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30分钟,样本方差为36;骑自行车平均用时34分钟,样本方差为4,假设坐公交车用时和骑自行车用时都服从正态分布,则( )
A.
B.
C.若某天只有34分钟可用,小明应选择骑自行车
D.若某天只有38分钟可用,小明应选择骑自行车
【答案】BD
【分析】根据正态分布密度曲线的对称性和事件的原则,逐项判断即可.
【详解】由题意:,.
对A:因为,,所以,故A错误;
对B:因为,,所以,故B正确;
对C:因为,,所以,所以只有34分钟可用,小明应选择坐公交,故C错误;
对D:因为,,所以,所以只有38分钟可用,小明应选择骑自行车,故D正确.
故选:BD
【例3】某校高三学生的模考数学成绩服从正态分布,按照,,,的比例将考试成绩划分为优秀、良好、合格和基本合格四个等级.若小张的数学成绩为分,则他的等级是( )
附:,,.
A.优秀 B.良好 C.合格 D.基本合格
【答案】B
【分析】利用正态分布的性质即可求解.
【详解】由题得,,所以,,
,,
因为,,
所以,
根据比例成绩大于分为优秀,
因为,
根据比例成绩在到之间的为良好,
,
根据比例成绩在到之间的为合格,
,
根据比例成绩小于分为基本合格,
因为小张的数学成绩为分,则他的等级是良好.
故选:B.
【变式1】已知某机械在生产正常的情况下,生产出的产品的指标参数符合正态分布.现从该机械生产出的所有产品中随机抽取2件,则这2件产品的质量指标分别在)和的概率为( )(运算结果保留小数点后两位)参考数据:若服从正态分布,则,.
A.0.57 B.0.75 C.0.80 D.0.84
【答案】C
【分析】由正太分布概率计算及概率乘法公式即可求解.
【详解】,
,
故所求概率,
故选:C.
【变式2】已知随机变量,且,则的最小值为 .
【答案】
【分析】由正态分布的对称性求得参数的值,再用基本不等式求出的最小值,即可得到答案.
【详解】由随机变量,则正态分布的曲线的对称轴为.
又因为,所以,解得.
当时,由基本不等式得,.
将两个不等式相加,就有,从而.
而当时,有.
所以的最小值为.
故答案为:.
【变式3】(多选)随机变是服从正态分布,令函数,则下列选项正确的是( )
A. B.是增函数
C.是偶函数 D.的图象关于点中心对称
【答案】AD
【分析】由正态分布可求得,判断A;易得在上是减函数,可判断B;计算,可判断C;证明可判断D.
【详解】对于A,因为,所以,故A正确;
对于B,,当增大时,减少,
所以在上是减函数,故B错误;
对于C,,故C错误;
对于D,若的图象关于点中心对称,则,
因为服从正态分布,所以关于对称,
所以,
则,故D正确.
故选:AD.
【题型六】一元线性、非线性回归模型
【例1】某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是 .
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
【答案】①③④
【分析】回归效果越好,则决定系数越大,相关系数的绝对值越大,残差平方和越小.
【详解】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
故决定系数会变大,更接近于1;残差平方和变小;
相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,即相关系数的值变大,自变量与因变量相关性变强,故①,③,④错误,②正确.
故答案为:①③④.
【例2】众所周知,乒乓球被称为中国的“国球”,是一种世界流行的球类体育项目,包括进攻、对抗和防守.某学校为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7个星期(用x=1表示第1个星期,用x=2表示第二个星期,以此类推)参加活动的累计人数y(人)的统计数据.
x 1 2 3 4 5 6 7
y 6 14 20 37 74 108 203
(1)根据表中数据可以判断y与x大致满足回归模型,试建立y与x的回归方程(精确到0.01);
(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人,其身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.
参考数据:,其中;
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)平均数为167.5,方差为42.6
【分析】(1)利用对数变换将非线性回归模型转化为线性回归模型,再根据给定的参考公式求出线性回归方程的系数,进而得到与的回归方程;
(2)根据分层抽样的性质,利用平均数和方差的计算公式来求解全体学生身高的平均数和方差.
【详解】(1)已知,两边取常用对数可得,
设,,,则回归方程变为.
先计算,,,.
根据参考公式,,将,,,代入可得:
.
.
则,
因为,,所以,则;,则.
所以与的回归方程为.
即
(2)全体学生身高的平均数.
根据方差公式(其中为各层人数,为各层方差,为各层平均数,为总平均数).
将,,,,,,代入可得:
则全体学生身高的平均数为167.5,方差为42.6.
【变式1】(多选)已知变量和变量的一组成对样本数据的散点落在一条直线附近,,,相关系数为,线性回归方程为,则( )
参考公式:,
A.当时,成对样本数据成线性正相关;
B.当越大时,成对样本数据的线性相关程度越强;
C.,时,成对样本数据的相关系数满足;
D.,时,成对样本数据的线性回归方程满足;
【答案】ACD
【分析】根据相关系数的正负、绝对值大小与变量相关性之间关系可知AB正误;根据,,代入相关系数和最小二乘法公式中,可知CD正误.
【详解】对于A,当时,成对样本数据成线性正相关,A正确;
对于B,当越大时,成对样本数据的线性相关程度越强;
当,时,对应的样本数据的线性相关程度更强,B错误;
对于C,当,时,不变且,
,C正确;
对于D,当,时,不变且,
,D正确.
故选:ACD.
【变式2】某健身俱乐部研究会员每周锻炼时长与体重减少量的关系,随机抽取10名会员的数据如下:
会员序号 1 2 3 4 5 6 7 8 9 10 总和
锻炼时长(小时) 3 4 2 5 6 4 5 3 4 4 40
体重减少量(千克) 1.0 1.5 1.0 2.0 2.5 1.8 2.0 1.0 1.6 2.0 16.4
并计算得:
(1)根据表格中的数据,可用一元线性回归模型刻画变量与变量之间的线性相关关系,请用相关系数加以说明;
(2)求经验回归方程(结果精确到 0.01 );
(3)该俱乐部推广了一项激励措施后,发现会员平均每周锻炼时长增加2个小时,实际观测到的平均体重减少量增加了0.8千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.
(参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为,. 参考值:)
【答案】(1)答案见解析
(2);
(3)答案见解析
【分析】(1) 利用相关系数公式直接代入数据求解即可;
(2) 利用公式,先求一次项系数,再利用经过样本中心点,可求出,从而可得回归直线方程;
(3)利用一次项系数可解释会员平均每周锻炼时长增加2个小时,预测平均体重减少量增加0.84千克,与实际效果相当,说明具有参考价价.
【详解】(1)由表可知:
所以= ,
因为与的相关系数接近1,
所以与的线性相关程度很高,可用线性回归模型拟合与的关系.
(2)由题可知: =
,
所以
(3)由(2)可知:根据线性回归方程预测,会员平均每周锻炼时长增加2个小时,
预测平均体重减少量增加0.84千克,与实际增加值0.8千克较为接近,
因此实际结果与预测结果基本一致,说明该回归模型具有参考价值;
造成一定差异的原因可能是由于样本数据过少,
或者造成体重减少的原因还受其他因素影响,
比如睡眠,饮食、锻炼强度以及效果等.
【题型七】列联表与独立性检验
【例1】某研究性学习小组针对“使用大绿书的用户是否存在性别差异”,向个人进行调查.用表示所有调查对象构成的集合.以为样本空间建立古典概型,并定义一对分类变量和如下:对于中的每一名学生,,现得到下表:
是大绿书的用户 不是大绿书的用户
男性
女性
若根据的独立性检验认为(其中),则的最小值为 .(参考公式:,其中)
【答案】3
【分析】根据题意,由的公式代入计算,列出不等式,即可得到结果.
【详解】因为用大绿书APP的用户存在性别差异,
所以,
即,所以的最小值为3.
故答案为:
【例2】为了研究某市高三年级学生的性别和身高的关联性,随机抽取了200名高三年级学生,整理数据得到如下列联表,并画出身高的频率分布直方图:
性别 身高 合计
低于 不低于
女 20
男 50
合计 200
(1)根据身高的频率分布直方图,求列联表中的,的值;
(2)依据小概率值的独立性检验,能否认为“高三年级学生的性别”与“身高是否低于”有关联?
(3)将样本频率视为概率,在全市不低于的学生中随机抽取6人,其中不低于的人数记为,求的期望.
附:,
0.050 0.010 0.001
3.841 6.635 10.828
【答案】(1),
(2)有,过程见解析
(3)
【分析】(1)根据频率分布直方图即可求解频率得解;
(2)计算卡方的值,即可与临界值比较作答;
(3)根据二项分布的期望公式即可求解.
【详解】(1)由图,低于的学生有人,则不低于170cm的学生有人.
从而,;
(2)零假设为:性别与身高没有关联,
计算可得
根据的独立性检验,推断不成立,因此该市高三年级学生的性别与身高是否低于170cm有关联;
(3)样本中抽中不低于175cm的频数为人
样本中抽中不低于175cm的频率为
将样本频率视为概率,在全市不低于170cm的学生中随机抽取6人,
其中不低于175cm的人数记为,则
.
【变式1】下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等.
B.两组数据的标准差相等,则这两组数据的平均数相等.
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强.
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系.
的部分临界值如表:
0.1 0.05 0.025 0.01
2.706 3.841 5.024 6.635
【答案】A
【分析】根据标准差定义可判断A项;通过取反例可排除B项;利用相关系数的概念易排除C项;利用独立性检验的规定,可判断D结论不成立.
【详解】对于A,根据标准差定义,一组数据的标准差时,显然有故A正确;
对于B,两组数据的标准差相等,这两组数据的平均数未必相等,如都为1和都为2的两组数据,它们的标准差均为0,但它们的平均数分别为1和,故B错误;
对于C,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
对于D,,根据独立性检验原理,在犯错误的概率不超过0.025的前提下认为变量有关系,故D错误.
故选:A
【题型八】概率、统计与其他知识的交汇问题
【例1】数轴上的一个质点从原点出发,每次随机向右或向左移动1个单位长度,其中向右移动的概率为,向左移动的概率为,记质点移动次后所在的位置对应的实数为.
(1)当,时,质点在哪一个位置的可能性最大,并说明理由;
(2)求证:的数学期望.
【答案】(1)答案见解析
(2)证明见解析
【分析】(1)结合题意利用二项分布得到,再讨论的取值即可;
(2)利用二项分布计算向右和向左移动的概率,再由期望公式计算期望,然后根据计算结果讨论可得.
【详解】(1)当,时,不妨设质点向右移动次,向左移动次的概率为,此时,而,
所以.
当时,,则随着值的增大而增大;
当时,,则随着值的增大而减小.
当时,取得最大值,故质点所在的位置对应的实数应为4.
(2)若质点移动次中一共向右移动次,则.
所以,.
若质点移动次中一共向左移动次,则.
所以,.
所以,
所以
,
当时,;
当时,.
所以,
即.
【例2】(1)数据的平均数为,数据的平均数为,,为常数,如果满足,,…,,证明:.
(2)证明:如果两个事件与独立,那么事件与也独立.
(3)设数据的均值为,方差为,请利用已经学过的方差公式:来证明方差第二公式:;
【答案】(1)证明见解析;(2)证明见解析;(3)证明见解析
【分析】(1)由,运算求证明;
(2)根据和互斥事件的概率加法公式,得到,再结合证明;
(3)由和证明.
【详解】(1),.
又,,…,,
,
,
,.
(2)因为,
根据互斥事件的概率加法公式,可得,
因为两个事件与独立,所以,
所以
,
所以事件与也独立.
(3)依题意,,
所以,
.
【变式1】有一项危险任务需要工作人员去完成,每次只进入一人,且每人只进入一次,在规定安全时间内未完成任务则撤出,换下一个人进入,但最多派三人执行任务.现在一共有、、三个人可参加这项任务,他们各自能完成任务的概率分别为,,,且,,互不相等,他们三个人能否完成任务的事件相互独立.
(1),,,如果按照、、的顺序先后进入;
①求任务能被完成的概率;
②求所需派出入员数目的分布列和数学期望;
(2)假定,试分析以怎样的先后顺序派出、、三个人可使所需派出的人员数目的数学期望达到最小,请说明理由.
【答案】(1)①;②分布列见解析,数学期望为;
(2)先派A,再派B,最后派C时,派出人员数目X的数学期望达到最小.
【分析】(1)①根据独立性事件乘法公式即可得到答案;
②可取1,2,3,再分别计算出其对应概率,再利用数学期望公式即可得到答案;
(2)首先分析出前两人应从A和B中选,C最后派出,再分类讨论作差比较两种方案即可.
【详解】(1)①设按照A、B、C的顺序先后进入,任务被完成为事件,
则
.
②可取1,2,3,
,,
,
所以其分布列为
X 1 2 3
P
数学期望.
(2)若按照某一指定顺序派人,A、B、C三人各自能完成任务的概率依次为,,,
其中,,是,,的一个排列,
结合(1)②知,
由,得要使X最小,前两人应从A和B中选,C最后派出,
若先派A,再派B,最后派C,则;
若先派B,再派A,最后派C,则,
而,所以先派A,再派B,最后派C时,派出人员数目X的数学期望达到最小.
【点睛】关键点点睛:本题第二问的关键是计算出期望表达式,再分析C最后派出,最后分类讨论并比较大小即可.
【变式2】某学校有、两家餐厅,某同学每天都会在这两家餐厅中选择一家餐厅用晚餐.已知该同学第一天随机选择一家餐厅用晚餐,若在前一天选择去餐厅的条件下,后一天继续选择餐厅的概率为;而在前一天选择去餐厅的条件下,后一天继续选择去餐厅的概率为,如此往复.
(1)求该同学第一天和第二天都选择去餐厅用晚餐的概率;
(2)求该同学第二天选择去餐厅用晚餐的概率;
(3)记该同学第天选择去餐厅用晚餐的概率为,求的通项公式.
【答案】(1)
(2)
(3)
【分析】(1)记事件第天去餐厅,则,,,利用概率的乘法公式可得出的值;
(2)利用对立事件的概率公式可得出的值,再利用全概率公式可求得的值;
(3)利用全概率公式可得出,再利用构造法可求得的通项公式.
【详解】(1)记事件该同学第天去餐厅,则,,,
由概率乘法公式可得.
(2)由对立事件的概率公式可得,
由全概率公式可得.
(3)记事件该同学第天去餐厅,则,
由题意可知,,,
由全概率公式可得,
即,则,
所以,数列是以为首项,公比为的等比数列,
所以,,故.
易错点:均值、方差的大小比较、最值(范围)问题
例1.当前,以大语言模型为代表的人工智能技术正蓬勃发展,而数学理论和方法在这些模型的研发中,发挥着重要作用.例如,当新闻中分别出现“7点钟,一场大火在郊区燃起”和“7点钟,太阳从东方升起”这两个事件的描述时,它们提供的“信息量”是不一样的,前者比后者要大,会吸引人们更多关注.假设通常情况下,它们发生的概率分别是和,用这个量来刻画“信息量”的大小,计算可得前者约为9,后者接近于0.现在假设离散型随机变量的分布列为,,.则称为的信息熵,用来刻画随机变量蕴含的信息量的大小.
(1)若的分布列为,,,求的最大值;
(2)证明:;
(3)若,且为定值,设,证明:.
【答案】(1);
(2)证明见解析;
(3)证明见解析
【分析】(1)写出,再求导即可求出其最值;
(2)转化为证明,再作差放缩即可证明;
(3)根据得到,两边同时求导即可证明.
【详解】(1)由题意知,,其中.
令,则.
所以当时,,所以在上单调递增;
当时,,所以在上单调递减.
所以在时取得最大值,且最大值为.
(2)要证,即证,
因为
(当且仅当,即时等号成立成立),
,
所以.
(3)由题意知,
则,
由,则,
所以,则,即得.
变式1.不同AI大模型各有千秋,适配领域也各有所长.为了解某高校甲、乙两个学院学生对两款不同AI大模型是否使用,对学生进行简单随机抽样,获得数据如下表:
甲学院 乙学院
使用 不使用 使用 不使用
款 40人 80人 60人 20人
款 70人 50人 30人 50人
假设所有学生对,两款大模型是否使用相互独立,用频率估计概率,
(1)分别估计该校甲学院学生使用款大模型的概率、该校乙学院学生使用款大模型的概率;
(2)从该校甲学院全体学生中随机抽取2人,乙学院全体学生中随机抽取1人,记这3人中使用款大模型的人数为,估计的数学期望;
(3)从该校甲学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,从该校乙学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,比较与的大小,(结论不要求证明).
【答案】(1)
(2)
(3)
【分析】(1)利用古典概型结合表格计算即可;
(2)利用离散型随机变量的分布列及期望公式计算即可;
(3)利用二项分布的方差公式计算并比较大小即可.
【详解】(1)由表格可知:该校甲学院学生使用款大模型的概率为,
该校乙学院学生使用款大模型的概率为
(2)由题意可知的可能取值为:,
则,
,
,
,
所以;
(3)同第一问,可知该校甲学院学生使用款大模型的概率为,
该校乙学院学生使用款大模型的概率为,
易知,
由二项分布的方差公式可知,
,则.
变式2.2024年新高考Ⅰ卷数学卷面分值进行了调整,其中第9题到第11题为多项选择题,每题分值为6分,若正确选项有2个,选对2个得6分,选对1个得3分,有选错的或不选择得0分;若正确选项有3个,选对3个得6分,选对2个得4分,选对1个得2分,有选错的或不选择得0分.已知甲、乙两位同学各自独立作答第11题,设第11题正确答案是2个选项的概率为.
(1)已知甲同学随机(等可能)选择了2个选项作答,求他既选出正确选项也选出错误选项的概率;
(2)若乙同学在作答第11题时,除确定B,D选项不能同时选择之外没有答题思路,只能随机选择若干选项作答.求乙在答题过程中使得分期望最大的答题方式,并写出得分的最大期望.
【答案】(1)
(2)乙同学选择双选AC时得分期望最大,最大值为分.
【分析】(1)先设事件为“该题的正确答案是2个选项”,为“甲同学既选出正确选项也选出错误选项”,再求,,再利用全概率公式计算即可;
(2)先计算正确答案是两选项、三选项的概率,再分类讨论乙同学做出的决策:单选,双选,三选,分别求其期望值.
【详解】(1)设事件为“该题的正确答案是2个选项”,则为“该题的正确答案是3个选项”,
即,.
设事件为“甲同学既选出正确选项也选出错误选项”,
则,,
所以,
则他既选出正确选项也选出错误选项的概率为.
(2)由题知选项B,D不能同时选,则乙同学可以选择单选、双选、三选,
正确答案是两选项的可能情况为AB,AD,BC,AC,CD,每种情况出现的概率均为;
正确答案是三选项的可能情况为ABC,ACD,每种情况出现的概率为.
若乙同学做出的决策是:
①单选,则(分),
(分);
②双选,则(分),
(分);
③三选,则(分).
经比较,乙同学选择双选AC时得分期望最大,最大值为分.
21世纪教育网(www.21cnjy.com)