2025年高考数学二轮复习(新高考通用)专题22概率与统计的综合应用与高级分析(讲义)(学生版+解析)

文档属性

名称 2025年高考数学二轮复习(新高考通用)专题22概率与统计的综合应用与高级分析(讲义)(学生版+解析)
格式 zip
文件大小 7.3MB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-03-27 18:53:07

文档简介

专题22 概率与统计的综合应用与高级分析
目录
01考情透视·目标导航 2
02知识导图·思维引航 3
03 知识梳理·方法技巧 4
04 真题研析·精准预测 6
05 核心精讲·题型突破 14
题型一:求概率及随机变量的分布列与期望 14
题型二:超几何分布与二项分布 18
题型三:概率与其它知识的交汇问题 23
题型四:期望与方差的实际应用 29
题型五:正态分布与标准正态分布 35
题型六:统计图表及数字特征 40
题型七:线性回归与非线性回归分析 46
题型八:独立性检验 53
题型九:与体育比赛规则有关的概率问题 62
题型十:决策型问题 68
题型十一:递推型概率命题 74
题型十二:条件概率、全概率公式、贝叶斯公式 82
重难点突破:高等背景下的概统问题 87
概率统计在高考中具有举足轻重的地位,是新高考卷及众多省市高考数学的必考题型。其考查重点涵盖古典概型、相互独立事件的概率计算、条件概率、超几何分布与二项分布、正态分布的应用、统计图表与数字特征的解析、回归分析方法的运用、离散型随机变量的分布列以及期望与方差在实际问题中的应用等方面。
近年来,高考中的概率统计解答题往往紧密联系社会实际,以现实生活场景为命题背景,强调知识的综合运用和实践能力的考察。这要求考生不仅具备收集、整理和分析数据的能力,还能从繁杂的数据中提炼出对解决问题有价值的信息,进而建立数学模型,并运用数学原理和工具来有效解决实际问题。
考点要求 目标要求 考题统计 考情分析
统计图表及数字特征 掌握统计图表绘制,理解数字特征应用 2023年乙卷第17题,12分 2023年II卷第19题,12分 2022年II卷第19题,12分 预测2025年高考数学解答题的可能趋势如下: (1)该题预计将以解答题的压轴题形式呈现,全面考查考生的数学抽象思维、数学建模能力、逻辑推理能力以及数学运算技能这四大核心素养。 (2)题目的热点内容预计将与体育比赛规则相关的概率问题,以及在高等数学背景下的概率统计问题密切相关。
期望与方差 理解期望方差概念,熟练进行计算应用。 2024年II卷第18题,17分 2023年上海卷第19题,14分 2023年I卷第21题,12分 2022年甲卷第19题,12分 2021年I卷第18题,12分
独立性检验 掌握独立性检验,解决分类变量问题。 2023年甲卷第17题,12分 2022年I卷第20题,12分
(一)涉及的概率知识层面
主要考查随机变量的概率分布与数学期望,一定要根据有关概念,判断是等可能事件、互斥事件、相互独立事件还是独立重复试验,以便选择正确的计算方法,进行概率计算及离散型随机变量的分布列和数学期望的计算,也要掌握几种常见常考的概率分布模型:离散型有二项分布、超几何分布,连续型有正态分布.考查运用概率知识解决简单实际问题的能力,
1、离散型随机变量的期望与方差
一般地,若离散型随机变量的分布列为
称为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
称为随机变量的方差,它刻画了随机变量与其均值的偏离程度,其算术平方根为随机变量的标准差.
(1)离散型随机变量的分布列的性质
①;②.
(2)均值与方差的性质
若,其中为常数,则也是随机变量,

(3)分布列的求法
①与排列、组合有关分布列的求法.由排列、组合、概率知识求出概率,再求出分布列.
②与频率分布直方图有关分布列的求法.可由频率估计概率, 再求出分布列.
③与互斥事件有关分布列的求法.弄清互斥事件的关系,利用概率公式求出概率,再列出分布列.
④与独立事件(或独立重复试验)有关分布列的求法.先弄清独立事件的关系,求出各个概率,再列出分布列.
(4)常见的离散型随机变量的概率分布模型
①二项分布; ②超儿何分布.
2、常见的连续型概率分布模型
正态分布.
(二)概率分布与不同知识背景结合考查对实际问题的解决能力
1、与数列结合的实际问题
2、与函数导数结合的实际问题
3、与分段函数求最值、解不等式结合的实际问题
4、与统计结合的实际问题
5、与其他背景结合的实际问题
1.(2024年北京高考数学真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数 0 1 2 3 4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
【解析】(1)设为“随机抽取一单,赔偿不少于2次”,
由题设中的统计数据可得.
(2)(ⅰ)设为赔付金额,则可取,
由题设中的统计数据可得,
,,


故(万元).
(ⅱ)由题设保费的变化为,
故(万元),
从而.
2.(2024年新课标全国Ⅱ卷数学真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
【解析】(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
比赛成绩不少于5分的概率.
(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,


,应该由甲参加第一阶段比赛.
(ii)若甲先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,




记乙先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
同理

因为,则,,
则,
应该由甲参加第一阶段比赛.
3.(2023年北京高考数学真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段 价格变化
第1天到第20天 - + + 0 - - - + + 0 + 0 - - + - + 0 0 +
第21天到第40天 0 + + 0 - - - + + 0 + 0 + - - - + 0 - +
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
【解析】(1)根据表格数据可以看出,天里,有个,也就是有天是上涨的,
根据古典概型的计算公式,农产品价格上涨的概率为:
(2)在这天里,有天上涨,天下跌,天不变,也就是上涨,下跌,不变的概率分别是,,,
于是未来任取天,天上涨,天下跌,天不变的概率是
(3)由于第天处于上涨状态,从前次的次上涨进行分析,上涨后下一次仍上涨的有次,不变的有次,下跌的有次,
因此估计第次不变的概率最大.
4.(2023年高考全国乙卷数学(理)真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【解析】(1),


的值分别为: ,

(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
5.(2023年新课标全国Ⅰ卷数学真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
【解析】(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,
所以,
.
(2)设,依题可知,,则

即,
构造等比数列,
设,解得,则,
又,所以是首项为,公比为的等比数列,
即.
(3)因为,,
所以当时,,
故.
6.(2023年新课标全国Ⅱ卷数学真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【解析】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,

(2)当时,

当时,
,
故,
所以在区间的最小值为.
7.(2022年新高考全国II卷数学真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【解析】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以

(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
8.(2022年高考全国乙卷数学(理)真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【解析】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)

(3)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.
则该林区这种树木的总材积量估计为
题型一:求概率及随机变量的分布列与期望
【典例1-1】蛇年来临之际,某商场计划安排新春抽奖活动,方案如下:1号不透明的盒子中装有标有“吉”“安”“和”字样的小球,2号不透明的盒子中装有标有“祥”“康”“顺”字样的小球,顾客先从1号不透明的盒子中取出1个小球,再从2号不透明的盒子取出1个小球,若这2个球上的字组成“吉祥”“安康”“和顺”中的一个词语,则这位顾客中奖,反之没有中奖,每位顾客只能进行一轮抽奖.已知顾客从不透明的盒子取出标有“吉”“安”“和”“祥”“康”“顺”字样小球的概率均为,且顾客取出小球的结果相互独立.
(1)求顾客中奖的概率;
(2)若小明一家三口参加这个抽奖活动,求小明全家中奖次数的分布列及数学期望.
【解析】(1)顾客取出的2个小球的字样组成“吉祥”的概率为,
顾客取出的2个小球的字样组成“安康”的概率为,
顾客取出的2个小球的字样组成“和顺”的概率为,
综上,顾客中奖的概率为;
(2)设小明全家中奖的次数为,
则,,


,则的分布列为
0 1 2 3
所以.
【典例1-2】随着教育部的“双减政策”落地,为了丰富高中基础年级学生的课余生活,2025年元旦期间,某校师生举行一场惊心动魄的足球比赛;由教师代表队、高一学生代表队和高二学生代表队组成、得分规则为:球队胜一场积3分,平一场积1分,负一场积0分.由教师代表队与高一学生代表队和高二学生代表队的两场比赛.根据前期比赛成绩,教师代表队与高一学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为;由教师代表队与高二学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立.
(1)求教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率;
(2)用表示教师代表队两场比赛获得积分之和,求的分布列与期望.
【解析】(1)设事件“教师代表队与高二学生代表队比赛获得积分为3分”,
事件“教师代表队与高二学生代表队比赛获得积分为1分”,
事件“教师代表队与高二学生代表队比赛获得积分为0分”,
事件“教师代表队与高一学生代表队比赛获得积分为3分”,
事件“教师代表队与高一学生代表队比赛获得积分为1分”,
事件“教师代表队与高一学生代表队比赛获得积分为0分”,
事件“教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分”,
,,,
则,
教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率为.
(2)由题意可知的所有可能取值为0,1,2,3,4,6.
,,
,,
,.
的分布列为
0 1 2 3 4 6

求离散型随机变量的分布列及期望的一般步骤:
(1)根据题中条件确定随机变量的可能取值;
(2)求出随机变量所有可能取值对应的概率,即可得出分布列;
(3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算)
【变式1-1】年末某商场举办购物有奖活动:若购物金额超过1000元,则可以抽奖一次,奖池中有9张卡片,“福”“迎”“春”卡各2张,“蛇”卡3张,每次抽奖者从中随机抽取4张卡片,抽到“蛇”卡获得2分,抽到其他卡均获得1分,最终得7分的人可得120元奖金,最终得4分的人可得60元奖金,其他最终得分的人可得20元奖金.已知小钟获得一次抽奖机会.
(1)求小钟抽到“福”“迎”“春”“蛇”卡各1张的概率;
(2)记小钟的中奖金额为,求的分布列及数学期望.
【解析】(1)由题可得小钟抽到“福”“迎”“春”“蛇”卡各1张的概率为.
(2)由题可知的所有可能取值为20,60,120.
的分布列为
20 60 120
1.为了让高三同学们在紧张的学习之余放松身心,缓解压力,激发同学们的竞争意识,培养积极向上的心态,为高三生活增添一抹别样的色彩,某校高三(1)班利用课余时间开展一次投篮趣味比赛.已知该班甲同学每次投篮相互独立,每次投篮命中的概率为,且次投篮至少命中次的概率为.
(1)求;
(2)若甲同学连续投篮次,每次投进记分,未投进记分,记甲同学的总得分为,求的分布列和数学期望;
(3)若甲同学投篮时出现命中就停止投篮,且最多投篮次,设随机变量为投篮的次数,证明:.
【解析】(1)由题知两次均未投中的概率为,即,解得.
(2)易知甲同学连续投篮次有:次均未命中,恰好命中次,命中次,次全命中,
所以的可能取值为,
又,,
,,
所以的分布列为
.
(3)易知随机变量可能取值为,
又易知,
所以,


所以


又易知,所以.
题型二:超几何分布与二项分布
【典例2-1】高三(1)班有名同学,在某次考试中总成绩在分(含分)以上的有人:甲、乙、丙、丁;在分—分之间的有人:戊、己、庚、辛、壬、癸、子、丑、寅、卯、辰、巳、午、未、申.其中数学成绩超过分的有人:甲、乙、丙、丁、戊、庚、寅、辰、壬、申.
(1)从该班同学中任选一人,求在数学成绩超过分的条件下,总成绩超过分的概率;
(2)从数学成绩超过分的同学中随机抽取人.
①采取不放回抽样方式抽取,记为成绩在分—分之间的同学的个数,求的分布列和期望;
②采取放回抽样方式抽取,记为成绩在分—分之间的同学的个数,求的值.(直接写出结果)
【解析】(1)解法一:记事件所抽取的学生的数学成绩超过分,则,
记事件所抽取的学生的总成绩超过分,则,
所以.
即任取一人,在数学成绩超过分的条件下,总成绩超过分的概率为;
解法二:数学成绩超过分的有人,其中包含总成绩超过分以上的有人,
所以任取一人,在数学成绩超过分的条件下,总成绩超过分的概率为
(2)①名数学成绩超过分的同学包含个总成绩在分之间的,
所以所有可能的取值为:、、、,
,,
,.
所以的分布列为:
.
②名数学成绩超过分的同学包含个总成绩在分之间的,
按可放回抽样的方式随机抽取,则随机变量,所以.
【典例2-2】在某地区进行高中学生每周户外运动调查,随机调查了名高中学生户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
(1)求的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)
(2)为进一步了解这名高中学生户外运动的时间分配,在,两组内的学生中,采用分层抽样的方法抽取了人,现从这人中随机抽取人进行访谈,记在内的人数为,求的分布列和期望;
(3)以频率估计概率,从该地区的高中学生中随机抽取名学生,用“”表示这名学生中恰有名学生户外运动时间在内的概率,当最大时,求的值.
【解析】(1)由已知,解得,
所以平均数为
.
(2)这名高中学生户外运动的时间分配,
在,两组内的学生分别有人,和人;
所以根据分层抽样可知人中在的人数为人,在内的人数为人,
所以随机变量的可能取值有,,
所以,,
则分布列为
期望;
(3)由频率分布直方图可知运动时间在内的频率为,
则,
若为最大值,则,
即,
即,解得,
又,且,则.
超几何分布与二项分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.
一般地,在含有件产品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,其中,且,称为超几何分布列.
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,则.此时称随机变量服从二项分布,记作,并称为成功概率.此时有.
【变式2-1】某校为了解高三学生每天的作业完成时长,在该校高三学生中随机选取了100人,对他们每天完成各科作业的总时长进行了调研,结果如下表所示:
时长(小时)
人数(人) 3 4 33 42 18
用表格中的频率估计概率,且每个学生完成各科作业时互不影响.
(1)从该校高三学生中随机选取1人,估计该生可以在3小时内完成各科作业的概率;
(2)从样本“完成各科作业的总时长在2.5小时内”的学生中随机选取3人,其中共有人可以在2小时内完成各科作业,求的分布列和数学期望;
(3)从该校高三学生(学生人数较多)中随机选取3人,其中共有人可以在3小时内完成各科作业,求.
【解析】(1)设“从该校高三学生中随机选取1人,这个学生可以在3小时内完成各科作业”为事件,
则.
(2)样本中“完成各科作业的总时长在2.5小时内”的学生有(人),其中可以在2小时内完成的有3人,的所有可能取值为0,1,2,3.
,,,,
∴的分布列为:
∴.
(3)由题意得,,
∴.
1.同学们,你们知道排球比赛的规则和积分制吗 其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1 2 3 4 5 6
甲 25 21 27 27 23 25
乙 18 25 25 25 25 17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小(结论不要求证明).
【解析】(1)由表可知:6场比赛甲赢了4场,则甲每局获胜的频率为,
用频率估计概率,所以甲队每局获胜的概率为.
(2)随机变量的所有可能取值为0,1,2,3,
可得:,,
,,
所以的分布列为
0 1 2 3
所以数学期望.
(3)记“甲、乙比赛两场后,两队积分相等”为事件,
设第场甲、乙两队积分分别为,,则,,2,
因两队积分相等,所以,即,则,
而,


所以

因为,所以两队积分相等的概率小于.
题型三:概率与其它知识的交汇问题
【典例3-1】如图,一只蚂蚁从正方体的顶点出发沿棱爬行,记蚂蚁从一个顶点到另一个顶点为一次爬行,每次爬行的方向是随机的,蚂蚁沿正方体上、下底面上的棱爬行的概率为,沿正方体的侧棱爬行的概率为.

(1)若蚂蚁爬行5次,求蚂蚁在下底面顶点的概率;
(2)若蚂蚁爬行5次,记它在顶点出现的次数为,求的分布列与数学期望.
【解析】(1)记蚂蚁爬行次在底面的概率为,则它前一步只有两种情况:在下底面或在上底面,
结合题意易得,,
是等比数列,首项为,公比为,

则,
(2)结合题意易得:,
当时,蚂蚁第3次、第5次都在处,
当时,蚂蚁第3次在处或第5次在处,
设蚂蚁第3次在处的概率为,
设蚂蚁第5次在处的概率为,
设蚂蚁不过点且第3次在的概率为,设蚂蚁不过点且第3次在的概率为,
设蚂蚁不过点且第3次在的概率为,由对称性知,,
,又,
得,


的分布列为:
0 1 2
的数学期望.
【典例3-2】在三维空间中,单位立方体的顶点坐标可用三维坐标表示,其中.而在维空间中,单位立方体的顶点坐标可表示为维坐标,其中.在维空间中,设点,定义维向量,数量积,为坐标原点,即.
(1)在3维空间单位立方体中任取两个不同顶点,求的概率;
(2)在维单位立方体中任取两个不同顶点,记随机变量.
(i)当时,若最大,求的值;
(ii)求的分布列及期望值.
【解析】(1)记“”为事件,
满足题意的两点坐标为,
则.
(2)(i)当随机变量时,坐标与中有个对应的坐标值均为1即,剩下个坐标值满足,此时所对应情况数为种
即,
当时,设,要使得最大,
则,
即,所以;
因此,即,
综上可知,时取最大值.
(ii)由(i)可知,,
故分布列为:
0 1 … …
… …
所以

设,则,
令可知,
设,则,
令可知,,
故.
在知识交汇处设计试题是高考命题的指导思想之一,概率作为高中数学具有实际应用背景的主要内容,除与实际应用问题相交汇,还常与排列组合、函数、数列等知识交汇.求解此类问题要充分理解题意.根据题中已知条件,联系所学知识对已知条件进行转化.这类题型具体来说有两大类:
1、所给问题是以集合、函数、立体几何、数列、向量等知识为载体的概率问题.求解时需要利用相关知识把所给问题转化为概率模型,然后利用概率知识求解.
2、所给问题是概率问题,求解时有时需要把所求概率转化为关于某一变量的函数,然后利用函数、导数知识进行求解;或者把问题转化为与概率变量有关的数列递推关系式,再通过构造特殊数列求通项或求和.
【变式3-1】为提高学生的思想政治觉悟,激发爱国热情,增强国防观念和国家安全意识,某校进行军训打靶竞赛.规则如下:每人共有3次机会,击中靶心得1分,否则得0分、已知甲选手第一枪击中靶心的概率为,且满足:如果第n次射击击中靶心概率为p,那么当第n次击中靶心时,第次击中靶心的概率也为p,否则第次击中靶心的概率为.
(1)求甲选手得分X的分布列及其数学期望;
(2)有如下定义:设X是一个随机变量,x是任意实数,函数,称为X的分布函数,对于任意实数,,有.因此,若已知X的分布函数,我们就知道X落在任一区间上的概率.
(i)写出(1)中甲选手得分X的分布函数(分段函数形式);
(ii)靶子是半径为2的一个圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,假如选手射击都能中靶,以Y表示弹着点与圆心的距离.试求随机变量Y的分布函数.
【解析】(1)甲选手得分X的取值可为0,1,2,3,
,.
,,
所以X的分布列为
X 0 1 2 3
X的数学期望是.
(2)(i)X的分布函数为;
(ii)设随机变量Y的分布函数为,
若,此时;
若,由题意设,
当时,有,又因为,
所以,即,
所以;
若,此时,
综上所述,.
1.在长方体中,已知,从该长方体的八个顶点中,任取两个不同的顶点,用随机变量表示这两点之间的距离.
(1)求随机变量的概率;
(2)求随机变量的分布列.
【解析】(1)如图,
由于从长方体的八个顶点中,任取两个不同的顶点的取法总共有种,
又的情况有两类:
当时,即取矩形,或矩形,或矩形,或矩形的对角线的两个端点,每个矩形有种取法,共有种取法;
当时,取长方体的体对角线的两个端点,共有种取法,
故随机变量的概率是.
(2)依题意,随机变量的所有可能取值为.
当时,即取正方形和正方形的边所对棱的两个端点,共有种取法,则;
当时,即取正方形和正方形的对角线的两个端点,每个正方形有种取法,共有种取法,则;
当时,即取棱长为的棱的两个端点,共有种取法,则;
由(1)知,当时,;当时,.
故随机变量的分布列为
题型四:期望与方差的实际应用
【典例4-1】现有两种投资方案,一年后投资盈亏的情况如下:
方案一:投资股市:
投资结果 获利 不赔不赚 亏损
概率
方案二:购买基金:
投资结果 获利 不赔不赚 亏损
概率
(1)当时,求的值;
(2)若要将万元钱进行投资,决定在“投资股市”和“购买基金”这两种方案中选择一种,已知,,那么选择哪种投资方案,才能使得一年后投资收益的数学期望较大?给出结果并说明理由.
【解析】(1)“购买基金”后,投资结果有“获利”、“不赔不赚”和“亏损”三种,且三种投资结果相互独立,
则,且,
所以,解得;
(2)假设选择“投资股票”方案进行投资,且记为投资股票的获利金额单位:万元,
随机变量的分布列为:
则;
假设选择“购买基金”方案进行投资,且记为购买基金的获利金额单位:万元,
随机变量的分布列为:
则;

选择“投资股市”,才能使得一年后的投资收益的数学期望较大.
【典例4-2】某企业有甲,乙两条生产线,每条生产线都有,,三个流程,为了比较这两条生产线的优劣,经过长期调查,可知甲生产线的,,三个流程的优秀率分别为0.9,0.9,0.8,乙生产线的,,三个流程的优秀率分别为0.8,0.85,0.92.已知每个流程是否优秀相互独立.
(1)求甲生产线的三个流程中至少有一个优秀的概率.
(2)为了评估这两条生产线哪个更优秀,该企业对,,三个流程进行赋分.当流程优秀时,赋30分,当流程不优秀时,赋0分;当流程优秀时,赋40分,当流程不优秀时,赋0分;当流程优秀时,赋50分,当流程不优秀时,赋0分.记甲生产线的,,流程的赋分分别为,,,乙生产线的,,流程的赋分分别为,,,计算与,并据此判断甲、乙哪条生产线更优秀.
【解析】(1)设甲生产线的流程优秀分别记为事件,
甲生产线的三个流程中至少有一个优秀为事件,
则,
所以.
(2)由题设,易知;

由,即乙生产线更优秀.
数学期望反映的是随机变量取值的平均水平,而方差则是反映随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差来对事件发生大小的可能性和稳定性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.
(1)若我们希望实际的平均水平较理想,则先求随机变量的期望,当时,不应认为它们一定一样好,还需要用来比较这两个随机变量的方差,确定它们的偏离程度.
(2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近.
(3)方差不是越小就越好,而是要根据实际问题的需要来判断.
【变式4-1】超轻黏土是一种集艺术性 趣味性 创造性于一体的手工造型材料.某小学为了丰富校园文化生活,举行了超轻黏土制作比赛活动.本次活动是在各班中选拔表现突出的学生,以班级为单位参加比赛.班级选拔共有6节课,每节课完成情况相互独立.每节课学生需独自完成3个动物作品与3个植物作品,若评优作品不少于5个,则将该学生评为“优秀制作人”.最后4节课中,被评为“优秀制作人”的次数不少于3次的学生将代表班级参加比赛.已知小章前2节课制作的作品中,有5个动物作品与4个植物作品为评优作品.
(1)从小章前2节课制作的作品中随机抽取3个动物作品与3个植物作品,求其中至少有5个作品为评优作品的概率.
(2)若小章经过课后练有所提高,最后4节课每节课动物作品与植物作品为评优作品的概率分别为,且,以最后4节课中小章被评为“优秀制作人”的次数的数学期望为依据,试预测小章是否能代表班级参加比赛.
【解析】(1)设“其中至少有5个作品为评优作品”为事件,由题可知,所有可能的情况为:
①动物作品有2个为评优作品,植物作品有3个为评优作品的概率为,
②动物作品有3个为评优作品,植物作品有2个为评优作品的概率为,
③动物作品有3个为评优作品,植物作品有3个为评优作品的概率为.
所以.
(2)最后4节课中,每节课小章被评为“优秀制作人”的概率均为.
由, 得,即,
所以,,
所以,所以.
令,,,
则,
所以在上单调递减,所以.
易知,所以,
所以小章不能代表班级参加比赛.
1.组合投资需要同时考虑风险与收益.为了控制风险需要组合低风险资产,为了扩大收益需要组合高收益资产,现有两个相互独立的投资项目A和B,单独投资100万元项目A的收益记为随机变量X,单独投资100万元项目B的收益记为随机变量Y.若将100万资金按进行组合投资,则投资收益的随机变量Z满足,其中.假设在组合投资中,可用随机变量的期望衡量收益,可用随机变量的方差衡量风险.
(1)若,,求Z的期望与方差;
(2)已知随机变量X满足分布列:
X … …
… …
随机变量Y满足分布列:
Y … …
… …
且随机变量X与Y相互独立,即,,.求证:;
(3)若投资项目X是高收益资产,其每年的收益满足:有30%的可能亏损当前资产的一半;有70%的可能增值当前资产的一倍.投资项目是低风险资产,满足.试问能否满足投资第1年的收益不低于17万,风险不高于500?请说明理由.
【解析】(1)由为二项分布可知:
,,
当时,,,
故组合投资的期望为3,方差为2.91.
(2)因为,
所以,
因为

所以

因为,
由于独立,所以,
从而
而,
同理,
故,
从而.
(3)由(1)得,,
所以,

于是,

由于,,
故满足投资第1年的收益不低于17万,风险不高于500.
题型五:正态分布与标准正态分布
【典例5-1】高中生坚持跑操有利于增强体质.某高中实践活动小组经过调查所在学校学生坚持跑操的次数与综合体测成绩等信息,得到如下数据:该学校有的学生每月平均坚持跑操的次数超过40次,这些学生中,综合体测成绩达到“及格”等级的概率为,而每月平均坚持跑操的次数不超过40次的学生的综合体测成绩达到“及格”等级的概率为.
(1)若从该学校任意抽取一名学生,求该学生综合体测成绩达到“及格”等级的概率;
(2)已知该实践活动小组的6名学生中有4名学生综合体测成绩达到“及格”等级,从这6名学生中抽取2名学生,记为抽取的这2名学生中综合体测成绩达到“及格”等级的人数,求随机变量的分布列和数学期望.
(3)经统计:该校学生综合体测得分近似服从正态分布,若得分,则综合体测成绩达到“优秀”等级,假设学生之间综合体测成绩相互独立.现从该校所有学生中抽取40名学生,记为这40名学生中综合体测成绩达到“优秀”等级的人数,求的数学期望.(结果四舍五入保留整数)
参考数据:若随机变量服从正态分布,则,,
【解析】(1)设事件“抽取1名学生每月平均坚持跑操的次数超过40次”,
则“抽取1名学生每月平均坚持跑操的次数不超过40次”,
事件“抽取1名学生综合体测成绩达到“及格”等级” ,
由全概率公式: ,
∴从该学校任意抽取一名学生,该学生综合体测成绩达到“及格”等级的概率为
(2)的可能取值为0,1,2 ,
, ,,
∴的分布列为:
0 1 2

(3), ,
,,
∴的数学期望约为6人.
【典例5-2】“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.一般地,对于一次成功的考试来说,所有考生得考试成绩应服从正态分布.某单位准备通过考试(按照高分优先录取的原则)录用300人,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.记考生的成绩为,且,已知所有考生考试的平均成绩,且360分及其以上的高分考生有30名.
(1)求的值.(结果保留位整数)
(2)该单位的最低录取分数约是多少?(结果保留为整数)
(3)考生甲的成绩为286分,若甲被录取,能否获得高薪职位?若不能被录取,请说明理由.
参考资料:①当时,令,则.
②当,,,,.
【解析】(1)依题意,令,则,
所以可得,,

又因为,则,解得;
(2)由(1)可得,
设最录取分数为,则,
,,所以,
即最低录取分数线为分.
(3)考生甲的成绩为分分,
所以甲能被录取概率为,
表明不低于考生甲的成绩的人数约为总人数的,约有,
即考生甲大约排在第名,排在名之前,所以甲能获得高薪.
解决正态分布问题有三个关键点:(1)对称轴标准差分布区间.利用对称性可求指定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为特殊区间,从而求出所求概率.注意在标准正态分布下对称轴为.
【变式5-1】某市举行了一次大型宣传活动,结束后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据(人均得分)构成一个样本,依据相关标准,该样本中各地抽取的数据构成数列(n为各地区的编号),且由各地的数据可以认为各地人均得分服从正态分布,μ近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).
(1)利用正态分布的知识求.
(2)组办方为此次参加问卷调查的市民制订如下两种奖励方案.
方案一:(ⅰ)得分不低于μ的可以获赠2次随机话费,得分低于μ的可以获赠1次随机话费.
(ⅱ)每次获赠的随机话费和对应的概率为
获赠的随机话费/元 50 100
概率
方案二:参加此次问卷调查的市民可获得价值100元的大型晚会入场券.
参加此次问卷调查的市民可选择其中一种奖励方案.
①市民小李参加了此次问卷调查,他选择了方案一,记X(单位:元)为他获赠的话费,求X的分布列及数学期望.
②仅从奖励的价值考虑,如果你参加了问卷调查,你选择参加获赠随机话费活动,还是获得价值100元的大型晚会入场券?用统计中相关知识做出决策.
(附:若,则,,)
【解析】(1)样本中各地的人均得分分别为,,,,,,,
所以7个地方人均得分的平均值为,即μ可取123,所以.


所以.
(2)①由题意可得X所有可能的取值为50,100,150,200,
得50元的情况为得分低于μ,概率为.
得100元的情况为有1次机会且获得100元或有2次机会且2次均获得50元,概率为

得150元的情况为有2次机会且2次机会中有1次获得100元、1次获得50元,概率为

得200元的情况为有2次机会且2次均获得100元,概率为.
所以X的分布列为
X 50 100 150 200
P
故.
②由①知,所以应选择获得价值100元的大型晚会入场券.
1.2023年3月某学校举办了春季科技体育节,其中安排的女排赛事共有12个班级作为参赛队伍,本次比赛启用了新的排球用球已知这种球的质量指标(单位:g)服从正态分布,其中,.比赛赛制采取单循环方式,即每支球队进行11场比赛,最后靠积分选出最后冠军,积分规则如下(比赛采取5局3胜制):比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.9轮过后,积分榜上的前2名分别为1班排球队和2班排球队,1班排球队积26分,2班排球队积22分.第10轮1班排球队对抗3班排球队,设每局比赛1班排球队取胜的概率为.
(1)令,则,且,求,并证明:;
(2)第10轮比赛中,记1班排球队3:1取胜的概率为,求出的最大值点,并以作为的值,解决下列问题.
(ⅰ)在第10轮比赛中,1班排球队所得积分为,求的分布列;
(ⅱ)已知第10轮2班排球队积3分,判断1班排球队能否提前一轮夺得冠军(第10轮过后,无论最后一轮即第11轮结果如何,1班排球队积分最多)?若能,求出相应的概率;若不能,请说明理由.
参考数据:,则,,.
【解析】(1),又,
所以.
因为,根据正态曲线对称性,,
又因为,所以.
(2),
.
令,得.
当时,,在上为增函数;
当时,,在上为减函数.
所以的最大值点,从而.
(ⅰ)的可能取值为3,2,1,0.
,,
,,
所以的分布列为
3 2 1 0
(ⅱ)若,则1班10轮后的总积分为29分,2班即便第10轮和第11轮都积3分,
则11轮过后的总积分是28分,,所以,1班如果第10轮积3分,
则可提前一轮夺得冠军,其概率为.
题型六:统计图表及数字特征
【典例6-1】为庆祝“五一”国际劳动节,某校举办“五一”文艺汇演活动,本次汇演共有40个参赛节目,经现场评委评分,分成六组:第一组,第二组,第三组,第四组,第五组,第六组,得到如下频率分布直方图:
(1)估计所有参赛节目评分的第85百分位数(保留1位小数);
(2)若评分结束后只对所有评分在区间的节目进行评奖(每个节目都能获奖,只有一等奖和二等奖),其中每个节目获评为一等奖的概率为,获评为二等奖的概率为,每个节目的评奖结果相互独立.
(ⅰ)设参评节目中恰有2个一等奖的概率为,求的极大值点;
(ⅱ)以(ⅰ)中作为p的值,若对这部分评奖节目进行奖励,已知一等奖节目奖金为500元,若要使得总奖金期望不超过1400元,请估计二等奖奖金的最大值.
【解析】(1)由频率分布直方图可知,
评分为的节目的频率为,
因为前四组的频率为:;
前五组的频率为:;
则第85百分位数占第五组的比例为,
所以,
∴估计所有参赛节目评分的第85百分位数为91.7;
(2)(i)评分在的节目的频数为,
∴,
∴,
∵, ∴当时,单调递增,
当时,单调递减,
当时,,所以取得极大值,
∴的极大值点;
(ii)设获得一等奖的节目数为随机变量X,总奖金为Y,
易知,,∴,
设二等奖奖金为a元,则,
∴,解得,
∴二等奖奖金的最大值为100元.
【典例6-2】睡眠是守卫健康的忠臣,小周同学就高三同学睡眠问题展开了一次调研活动:
* 1 2 3 4 5 6 7 8 9 10 合计/人
(3,4] 1 0 1 2 1 0 0 1 0 0 6
(4,5] 8 7 8 6 4 7 7 4 5 4
(5,6] 8 12 10 8 17 16 12 13 12 12
(6,7] 25 25 26 25 22 22 24 23 25 23 240
(7,8] 6 6 7 7 5 4 5 6 7 7 60
(9,10] 2 2 1 1 2 1 1 2 0 2
(1)小周同学调查了振兴中学高三随机十个班级的单个学生睡眠平均时长所在区间的人数分布,请补全这张统计表(横向代表班级序号,纵向代表平均睡眠时长所在区间,框内数据代表人数)与直方图并通过直方图估计振兴中学高三同学睡眠的分位数(作图不要求写出过程);
(2)之后,小周同学收集了随机名同学的具体平均睡眠时长,这些数据中男生有人,平均睡眠时长与睡眠时长方差分别为与;女生有人,平均睡眠时长与睡眠时长方差分别为与,请根据以上数据计算出这名同学的睡眠时长总方差.
(3)睡眠连续性得分是判断睡眠质量的分数度量,一般算合格.临近大型考试,小周同学用智能手表测出了考试前一周他的睡眠连续性得分,请根据图表得出两条有效信息并为他提出一条可行的睡眠建议.
【解析】(1)图表如图:
由图可知,从左到右各组的频率分别为,
则,
所以60%分位数位于组内,设为,
得,解得,
所以60%分位数为6.475.
(2),
.
(3)信息:①临近考试时睡眠连续性得分呈下降趋势;
②考试前3天睡眠连续性得分均不合格.
建议:调整心态、规律作息、不要紧张、自信迎考.
* 1 2 3 4 5 6 7 8 9 10 合计/人
(3,4] 1 0 1 2 1 0 0 1 0 0 6
(4,5] 8 7 8 6 4 7 7 4 5 4 60
(5,6] 8 12 10 8 17 16 12 13 12 12 120
(6,7] 25 25 26 25 22 22 24 23 25 23 240
(7,8] 6 6 7 7 5 4 5 6 7 7 60
(9,10] 2 2 1 1 2 1 1 2 0 2 14
1、制作频率分布直方图的步骤.
第一步:求极差,决定组数和组距,组距
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图.
2、解决频率分布直方图问题时要抓住3个要点.
(1)直方图中各小矩形的面积之和为1;
(2)直方图中纵轴表示,故每组样本的频率为组距
(3)直方图中每组样本的频数为频率总体个数.
3、用频率分布直方图估计众数、中位数、平均数的方法.
(1)众数为频率分布直方图中最高矩形底边中点的横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.
【变式6-1】某景点奶茶店的甲、乙、丙三款奶茶在国庆黄金周期间的日销售量数据,如下表(单位:杯):
10月1日 10月2日 10月3日 10月4日 10月5日 10月6日 10月7日
甲 60 65 66 65 67 66 63
乙 57 62 63 62 64 63 60
丙 55 60 61 60 62 61 58
(1)从10月1日至7日中随机选取一天,求该天甲款奶茶日销售量大于65杯的概率;
(2)从乙、丙两款奶茶的日销售量数据中各随机选取1个,这2个数据中大于60的个数记为,求的分布列和数学期望;
(3)记乙款奶茶日销售量数据的方差为,表格中所有的日销售量数据的方差为,试判断和的大小.(结论不要求证明)
【解析】(1)对于甲款奶茶,7天中共有3天销量大于65,
设为:“该天甲款奶茶日销售量大于65杯”,则.
(2)设为:“乙款奶茶日销售量大于60杯”,为:“丙款奶茶日销售量大于60杯”,
则,,
而可取,则,
而,故,
故的分布列为:
故.
(3)乙款奶茶日销售量数据的平均值为,
故,
同理可得表格中所有的日销售量数据的平均值为,
,而,故.
1.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和,样本方差分别记为 和.
(1)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)
(2)假设该厂计划用新设备全面投产,若生产一系列产品的指标数据不少于10.3即为质量优秀产品,以表中的频率估计概率,现从该厂生产的一批产品中随机抽取100件产品进行质量抽检,求抽检的产品中质量优秀产品的件数ξ的数学期望.
【解析】(1),



依题意,,
所以,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
(2)从表中数据可得产品的指标数据不少于10.3在10次中有6次,
所以从中取一件产品为优秀的概率为,
所以随机变量ξ服从,
所以抽检的产品中质量优秀产品的件数ξ的数学期望为.
题型七:线性回归与非线性回归分析
【典例7-1】红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度的8组观测数据,制成图l所示的散点图,现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:表中;;;
25 2.9 646 168 422688 50.4 70308
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)求出关于的回归方程.附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,,
【解析】(1)模型①更合适.
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令与温度x可以用线性回归方程来拟合,则.
于是, ,
因此关于的线性回归方程为,即,
所以产卵数y关于温度x的回归方程为.
【典例7-2】随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.
年份代码
中国健身器材市场规模
(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);
(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.
参考数据:
其中,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【解析】(1)两边同时取自然对数得.
设,所以,
因为,,,
所以.
把代入,得,
可得,.
所以,
即关于的回归方程为.
(2)由题意,得的所有可能取值依次为,,,,,且,
,,
,,

所以的分布列为
0 1 2 3 4
.
线性回归分析的原理、方法和步骤:
(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.
(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.
(3)相关指数与相关系数在含有一个解释变量的线性回归模型中是等价的量,都是用来判断线性回归模型拟合效果好不好的量.
(4)利用换元法,可以将一元非线性回归转化为线性回归.
【变式7-1】某校高一新生共1000人,男女比例为1:1,经统计身高大于170cm的学生共600人,其中女生200人.该校为了解高一新生身高和体重的关系,在新生中随机抽测了10人的身高(单位:cm)和体重(单位:kg)作为一个样本,所得样本数据如下表所示:
编号 1 2 3 4 5 6 7 8 9 10
身高 164 165 170 172 173 174 176 177 179 180
体重 57 58 65 65 90 70 75 76 80 84
(1)在对这10个学生组成的样本的检测过程中,采用不放回的方式,每次随机抽取1人检测
(ⅰ)若已进行了三次抽取,求抽取的这三人中至少有两人体重大于74kg的概率;
(ⅱ)求第一次抽取的学生体重大于79kg且第二次抽取的学生身高大于175cm的概率;
(2)由表中数据的散点图和残差分析,编号为5的数据残差过大,确定其为离群点,所以应去掉该数据后再求经验回归方程.已知未去掉离群点的样本相关系数约为0.802,请用样本相关系数说明去掉离群点的合理性(相关系数r保留三位小数).
参考公式及数据:样本相关系数
,,,,.
【解析】(1)(ⅰ)记抽取的这三人中至少有两人体重大于74kg为事件M,则,得.
(ⅱ)记第一次抽取的学生体重大于79kg为事件A,第二次抽取的学生身高大于175cm为事件B.
因为样本中学生身高大于175cm的有4人,身高大于175cm且体重大于79kg的有2人,
身高小于175cm且体重大于79kg的有1人,
所以.
(2)设未去离群点的样本相关系数为,去掉离群点后的样本相关系数为,则.
去掉离群点后,,,
,,




因为,且相比更接近1,所以y与x的线性相关性更强,所以去掉离群点是合理的.
【变式7-2】某省级示范学校高三的一次考试后,为了调查学生们的偏科程度,在实验班随机抽取8名同学,比较物理成绩x与数学成绩y,得到下表(单位:分):
学生号 1 2 3 4 5 6 7 8
x 98 84 87 94 81 91 85 100
y 135 124 113 125 116 120 132 135
(1)求出y关于x的回归方程(精确到0.01);
(2)若相关系数r满足,则我们可以认为y与x之间具有较强的线性相关关系,计算这8名学生的物理成绩和数学成绩是否具有较强的线性相关关系?
(附:,,,,,相关系数)
【解析】(1)设y关于x的回归方程为,由题设有,
,,
故所求回归方程为:;
(2)由,
故这8名学生的物理成绩和数学成绩不具有较强的线性相关关系.
1.习近平总书记指出:要完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展.某部门在对新发展理念组织了全面学习后,对同一组的5名员工采取如下考核制度:在本季度末,由部门其他人对这5名员工进行投票,并统计5名员工本季度创造的营业收入.现将这5名员工所得票数x与本季度创造的营业收入单位:千元用数对表示:,,,,
(1)求x与y的相关系数
(2)若将本季度创造的营业收入最少的员工移除出组,请根据该小组剩余人员的数据求y关于x的线性回归方程.
参考公式:①相关系数②在利用最小二乘法求得的线性回归方程的中,,
参考数据:,,,,
【解析】(1)由题可知,,
所以
(2)由题可知,需将营业收入为60千元的员工移除出组,剔除数据后的,
,,
,,
所以,

故y关于x的线性回归方程为
题型八:独立性检验
【典例8-1】“八段锦”,起源于北宋,已有八百多年的历史. 古人把这套动作比喻为“锦”,意为五颜六色,美而华贵. 体现其动作舒展优美,视其为“祛病健身,效果极好,编排精致,动作完美”,此功法分为八段,每段一个动作,故名为“八段锦”. 作为传统养生功法,对人体有着很多的益处. 为了继续推广“八段锦”,吸引更多的老年市民练习“八段锦”,促进老年市民的延年益寿,市老体协统计了全市的男性老年人和女性老年人(不小于 60 岁的均为老年人)练习“八段锦”的情况,采用简单随机抽样的方法抽取了练习“八段锦”的 200 位老年人,得到了性别与年龄的有关数据,并整理得到以下列联表:
类型 年龄 (岁) 合计
男性 36 111
女性 25
合计 200
(1)补全 列联表,并依据小概率值 的独立性检验,能否认为老年人的性别与年龄是否大于 65 岁有关联
(2)在这 200 位老年人随机抽取一位,求在该老人年龄大于 65 岁的情况下,为女性老年人的概率.
附: ,其中 .
0.01 0.005 0.001
6.635 7.879 10.828
【解析】(1)补全 列联表如下:
类型 年龄 (岁) 合计
男性 36 75 111
女性 64 25 89
合计 100 100 200
零假设为 : 老年人的性别与年龄是否大于 65 岁无关联.
根据列联表中的数据, 得
依据小概率值 的独立性检验,推断 不成立,即老年人的性别与年龄是否大于 65 岁有关联,该推断犯错误的概率不大于 0.001 .
(2)设事件 “抽取的一位老年人年龄大于 65 岁”,事件 “抽取的一位老年人为女性老年人”,
法一: 所求概率为 .
法二: 所求概率为 .
【典例8-2】新能源汽车越来越引起广大消费者的关注,目前新能源汽车的电池有石墨烯电池、三元锂电池、铅酸电池等,其中铅酸电泡有技术成熟.成本较低、高倍率放电的特点,而石墨烯电池可以减少热量对电池的损害,提高电池的使用寿命,石墨烯电池应用到新能源汽车上.对整个汽车行业将是根本性的改变.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名驾驶者,年龄在60周岁以下的为年轻驾驶者,年龄在60周岁及以上的为中老年驾驶者,其中被调查的年轻驾驶者中偏好铅酸电池车的占,得到以下的列联表:
偏好石墨烯电池车 偏好铅酸电池车 合计
中老年驾驶者 200 100
年轻的驾驶者
合计 S00
(1)根据以上数据,完成列联表.依据小概率的独立性检验,能否认为驾驶者对这两种电池的电动车的偏好与年龄有关:
(2)用频率估计概率,在所有参加调查的驾驶者中按年轻驾驶者和中老年驾驶者进行分层抽样,随机抽取5名驾驶者,再从这5名驾驶者中随机抽取2人进行座谈,记2名参加座谈的驾驶者中来自偏好石墨烯电池电动车的中老年驾驶者的人数为,求的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100 0.050 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【解析】(1)被调查的年轻驾驶者人数为,
其中偏好铅酸电池车的年轻的驾驶者人数为.
偏好石墨烯电池车的年轻的驾驶者人数为,
所以列联表为:
偏好石墨烯电池车 偏好铅酸电池车 合计
中老年驾驶者 200 100 300
年轻的驾驶者 80 120 200
合计 280 220 500
零假设:驾驶者对使用这两种电池的新能源汽车的偏好与年龄无关,
根据列联表中的数据可以求得
由于,
根据小概率值的独立性检验,我们推断不成立,即认为驾驶者对使用这两种电池的新能源汽车的偏好与驾驶者的年龄有关.
(2)因为所有参加调查的驾驶者中,中老年驾驶者和年轻驾驶者的比为,
所以由分层抽样知,随机抽取的5名驾驶者中,中老年驾驶者有3人,年轻驾驶者有2人.
根据频率估计概率知,中老年驾驶者偏好石墨烯电池电动车的概率为,偏好铅酸电池电动车的概率为,
从选出的5名驾驶者中随机抽取2人进行座谈,则可能的取值为0,1,2.
“3名被抽取的中老年驾驶者中,恰好抽到人参加座谈”记为事件,
则.
“参加座谈的2名驾驶者中是偏好石墨烯电池电动车中老年驾驶者的人数恰好为人”记为事件,
则,





所以



故的分布列如下:
0 1 2

解独立性检验应用问题的注意事项.
(1)两个明确:①明确两类主体;②明确研究的两个问题.
(2)在列联表中注意事件的对应及相关值的确定,不可混淆.
(3)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
(4)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
【变式8-1】随机数广泛应用于数据加密、安全通信、金融等领域.计算机中的随机数是由算法产生的,其“随机性”的优劣取决于所采用的算法.某工厂计划生产一种随机数发生器,这种发生器的显示屏能显示1,2,3,4中的一个数字,每按一次数字更新按钮后,显示屏上的数字将等可能地更新为另三个数字中的一个.在试生产阶段,采用两种不同算法,生产出相应算法的甲、乙两种随机数发生器.为评估两种算法的优劣,从这两种随机数发生器中随机抽取150件进行检验,得到数据饼图如下:
(1)已知这150件发生器中,乙种发生器的三级品为2件.在答题卡中填写列联表;依据小概率值的独立性检验,能否认为甲、乙两种发生器的一级品率存在差异
一级品 非一级品 合计


合计
(2)若发生器显示屏的初始显示数字为1,记按次数字更新按钮后得到的数字为,.
(i)求,;
(ii)检测一个发生器是否为一级品的方案为:每件被测发生器需进行100轮测试,每轮测试共按10次数字更新按钮;表示100轮测试得到“”的频率,规定满足的被测发生器为一级品.若某件发生器经100轮测试后得到,能否判断该发生器为一级品
附:,
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解析】(1)根据题意可得列联表:
一级品 非一级品 合计
甲 26 24 50
乙 70 30 100
合计 96 54 150
零假设为:甲、乙两批发生器的一级品率没有差异.
根据列联表中的数据,经计算得

根据小概率值的独立性检验,推断不成立,
所以可以认为甲、乙两批发生器的一级品率存在差异,此推断犯错误的概率不大于0.05.
(2)(i)依题意可得.
记“按次按钮后显示的数字为1”,
由全概率公式,得
.
(ii)由全概率公式,得

所以,
即,且,
所以是首项为,公比为的等比数列,
所以,即.
所以.
因为,所以该发生器为一级品.
解法二:(i)依题意可得.
记“按次按钮后显示的数字为1”,“按次按钮后显示的数字为2”,
“按次按钮后显示的数字为3”,“按次按钮后显示的数字为4”,
则,且,,,两两互斥.
依据题意得,,
.
由全概率公式,得
.
(ii)
所以,
即,且,
所以是首项为,公比为的等比数列.
所以,即.
所以.
因为,所以该发生器为一级品.
解法三:(i)依题意可得.
记“按次按钮后显示的数字为1”,
由全概率公式,得
.
.
.
.
.
.
.
.
.
因为,所以该发生器为一级品.
1.一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车 倾向于购买新能源车 合计
女性居民 150 250 400
男性居民 350 250 600
合计 500 500 1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【解析】(1)零假设为:对新能源车与燃油车的购买倾向不存在性别差异;
易知,
所以依据小概率值的独立性检验,我们推断假设不成立,
即认为对新能源车与燃油车的购买倾向存在性别差异,此推断犯错误的概率不大于;
(2)根据表中数据可知按性别采用分层随机抽样的方法抽取10人中3人为女性,7人为男性;
再从中抽取4人进行座谈,共有种,
其中有女性居民参加座谈的情况共有种;
恰有2名男性居民参加座谈的情况共有种;
因此在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率为

(3)从所有参加调查的男性居民中按购买这两种车的倾向性,
采用分层随机抽样的方法抽出12人,可知抽取结果如下表:
倾向于购买燃油车 倾向于购买新能源车
男性居民 7 5
再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,
的所有可能取值为;
所以,;
,,
的分布列如下:
0 1 2 3
数学期望.
题型九:与体育比赛规则有关的概率问题
【典例9-1】某篮球俱乐部由篮球Ⅰ队和Ⅱ队组成.Ⅰ队球员水平相对较高,代表俱乐部参加高级别赛事;Ⅱ队是Ⅰ队的储备队,由具有潜力的运动员组成.为考察Ⅰ队的明星队员甲对球队的贡献,教练对近两年甲参加过的60场与俱乐部外球队的比赛进行统计:甲在前锋位置出场12次,其中球队获胜6次;中锋位置出场24次,其中球队获胜16次;后卫位置出场24次,其中球队获胜18次.用该样本的频率估计概率,则:
(1)甲参加比赛时,求Ⅰ队在某场与俱乐部外球队比赛中获胜的概率;
(2)为备战小组赛,Ⅰ队和Ⅱ队进行10场热身赛,比赛没有平局,获胜得1分,失败得0分.已知Ⅰ队在每场比赛中获胜的概率是p(),若比赛最有可能的比分是7∶3,求p的取值范围;
(3)现由Ⅰ队代表俱乐部出战小组赛,小组共6支球队,进行单循环赛(任意两支队伍间均进行一场比赛),若每场比赛均派甲上场,在已知Ⅰ队至少获胜3场的条件下,记其获胜的场数为X,求X的分布列和数学期望.
【解析】(1)设“甲担任前锋”;“甲担任中锋”;“甲担任后卫”;
“某场比赛中该球队获胜”.
则:,,,
,,,
由全概率公式可得:

所以甲参加比赛时,Ⅰ队在某场与俱乐部外球队比赛中获胜的概率是.
(2)设这10场比赛,Ⅰ队获胜的场数是k,则P(Ⅰ队获胜k场),
由题意,时,P(Ⅰ队获胜k场)最大,
所以有,解得,
所以p的取值范围为.
(3)由题意,Ⅰ队一共需要打5场比赛,
设“5场比赛中Ⅰ队获胜i场”(,4,5),“5场比赛中Ⅰ队至少获胜3场”,
;;
,则,

同理可得,

则X的分布列为:
X 3 4 5
P
.
【典例9-2】甲、乙两名同学进行篮球投篮比赛,比赛规则如下:两人投篮的次数之和不超过5,投篮命中则自己得1分,该名同学继续投篮,若投篮未命中则对方得1分,换另外一名同学投篮,比赛结束时分数多的一方获胜,两人总投篮次数不足5但已经可以确定胜负时比赛就结束,两人总投篮次数达到5次时比赛也结束,已知甲、乙两名同学投篮命中的概率都是,甲同学先投篮.
(1)求甲同学一共投篮三次,且三次投篮连续的情况下获胜的概率;
(2)求甲同学比赛获胜的概率.
【解析】(1)用A表示甲投篮命中,表示甲投篮未命中,
用B表示乙投篮命中,表示乙投篮未命中,
记甲同学连续投篮了三次并赢得了比赛的事件为M,
则.
(2)①剩余两次投篮,甲、乙比分3:0获胜的概率是;
②剩余一次投篮,甲、乙比分3:1获胜的概率是:
(也可用);
③不剩余投篮,前4次投篮甲、乙比分2:2获胜的概率是:

(也可用),
故甲获胜的概率是.
1、在与体育比赛规则有关的问题中,一般都会涉及分组,处理该类问题时主要借助于排列组合.对于分组问题,要注意平均分组与非平均分组,另外,在算概率时注意“直接法”与“间接法”的灵活运用.
2、与体育比赛有关的问题中最常见的就是输赢问题,经常涉及“多人淘汰制问题”“ 三局两胜制问题”“ 五局三胜制问题”“ 七局四胜制问题”,解决这些问题的关键是认识“三局两胜制”“ 五局三胜制”等所进行的场数,赢了几场与第几场赢,用互斥事件分类,分析事件的独立性,用分步乘法计数原理计算概率,在分类时要注意“不重不漏” .
3、在体育比赛问题中,比赛何时结束也是经常要考虑的问题,由于比赛赛制已经确定,而比赛的平均场次不确定,需要对比赛的平均场次进行确定,常用的方法就是求以场数为随机变量的数学期望,然后比较大小.
4、有些比赛会采取积分制,考查得分的分布列与数学期望是常考题型,解题的关键是辨别它的概率模型,常见的概率分布模型有:两点分布、超几何分布、二项分布、正态分布,要注意分布是相互独立的,超几何分布不是,值得注意的是,在比赛中往往是伪二项分布,有的只是局部二项分布.
【变式9-1】一项没有平局的对抗赛分为两个阶段,参赛者在第一阶段中共参加2场比赛,若至少有一场获胜,则进入第二阶段比赛,否则被淘汰,比赛结束;进入第二阶段比赛的参赛者共参加3场比赛.在两个阶段的每场比赛中,获胜方记1分,负方记0分,参赛者参赛总分是两个阶段得分的总和,若甲在第一阶段比赛中每场获胜的概率都为,在第二阶段比赛中每场获胜的概率都为,每场比赛是否获胜相互独立.已知甲参赛总分为2分的概率为.
(1)求;
(2)求甲参赛总分X的分布列和数学期望.
【解析】(1)甲参赛总分为分有两种情况:
第一种情况是在第一阶段两场比赛一胜一负(概率为),
然后在第二阶段三场比赛一胜两负(概率为).
第二种情况是在第一阶段两场比赛全胜(概率为),
然后在第二阶段三场比赛全负(概率为).
根据甲参赛总分为分的概率为,可列出方程:
先计算组合数,.
方程变为.
化简得.即.
因式分解得.
解得或,因为,所以.
(2)甲参赛总分的可能取值为,,,,,.
包括:在第一阶段两场全输,概率为.
包括:在第一阶段一胜一负(概率为),
然后在第二阶段三场全输(概率为),所以.
:前面已求出为.
包括:在第一阶段两场全胜(概率为),
然后在第二阶段一胜两负(概率为),此时.
也包括在第一阶段一胜一负(概率为),
然后在第二阶段两胜一负(概率为).此时.
则.
包括:在第一阶段两场全胜(概率为),
在第二阶段两胜一负(概率为),此时.
也包括在第一阶段一胜一负(概率为),
然后在第二阶段三场全胜(概率为),此时.
则.
包括:在第一阶段两场全胜(概率为),
然后在第二阶段三场全胜(概率为),所以.
所以的分布列为:
1 2 3 4 5
根据数学期望公式,
1.第19届杭州亚运会-电子竞技作为正式体育竞赛项目备受关注.已知某项赛事的季后赛后半段有四支战队参加,采取“双败淘汰赛制”,对阵表如图,赛程如下:
第一轮:四支队伍分别两两对阵(即比赛1和2),两支获胜队伍进入胜者组,两支失败队伍落入败者组.
第二轮:胜者组两支队伍对阵(即比赛3),获胜队伍成为胜者组第一名,失败队伍落入败者组;第一轮落入败者组两支队伍对阵(即比赛4),失败队伍(已两败)被淘汰(获得殿军),获胜队伍留在败者组.
第三轮:败者组两支队伍对阵(即比赛5),失败队伍被淘汰(获得季军);获胜队伍成为败者组第一名.
第四轮:败者组第一名和胜者组第一名决赛(即比赛6),争夺冠军.假设每场比赛双方获胜的概率均为0.5,每场比赛之间相互独立.问:

(1)若第一轮队伍和队伍对阵,则他们仍能在决赛中对阵的概率是多少?
(2)已知队伍在上述季后赛后半段所参加的所有比赛中,败了两场,求在该条件下队伍获得亚军的概率.
【解析】(1)由题意可知,第一轮队伍和队伍对阵,则获胜队伍需要赢得比赛3的胜利,失败队伍需要赢得比赛4和比赛5的胜利,他们才能在决赛中对阵,
所以所求的概率为.
(2)设表示队伍在比赛中胜利,表示队伍在比赛中失败,
设事件:队伍获得亚军,事件队伍所参加的所有比赛中败了两场,
则事件包括,且这五种情况彼此互斥,
进而

事件包括,且这两种情况互斥,
进而,
所以所求事件的概率为.
题型十:决策型问题
【典例10-1】2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6 8 9 10 12
2 3 4 5 6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
【解析】(1)根据表格中的数据,可得
,,



可得相关系数,
故与之间的关系可用线性回归模型进行拟合,
又由,
可得.
综上回归直线方程.
(2)通过甲大学的考试科目数,则,
设通过乙大学的考试科目数为,则可能的取值为0、1、2、3,
则,



所以,
因为该考生更希望通过乙大学的笔试考试,
所以,即,
又由,解得,
即为该考生更希望通过乙大学的笔试时的范围为.
【典例10-2】某农产品经销商计划分别在甲、乙两个市场销售某种农产品(两个市场的销售互不影响),为了了解该种农产品的销售情况,现分别调查了该农产品在甲、乙两个市场过去10个销售周期内的销售情况,得下表:
销售量 销售周期个数 市场 3吨 4吨 5吨
甲 3 4 3
乙 2 5 3
(1)从过去10个销售周期中随机抽取一个销售周期,求甲市场销售量为4吨的概率;
(2)以市场销售量的频率代替销售量的概率.设(单位:吨)表示下个销售周期两个市场的总销售量,求随机变量概率分布列;
(3)在(2)的条件下,设该经销商计划在下个销售周期购进吨该产品,在甲、乙两个市场同时销售,已知该产品每售出1吨获利1000元,未售出的产品降价处理,每吨亏损200元.以销售利润的期望作为决策的依据,判断与应选用哪一个.
【解析】(1)设甲市场销售量为4吨的事件为A,则.
(2)设甲市场销售量为吨的概率为,乙市场销售量为吨的概率为,
则由题意得,,;
,,,
设两个市场总需求量为的概率为,所有可能的取值为6,7,8,9,10,





所以的分布列如下表:
6 7 8 9 10
0.06 0.23 0.35 0.27 0.09
(3)由(2)知,,,
当时,销售利润,当时,,当时,,
因此的分布列为:
0.06
则元;
当时,,,,
销售利润,当时,,
当时,,当时,,
因此的分布列为:
0.06 0.71
则元;
因为,所以应选.
求解决策型问题的求解流程为:
第一步:先确定函数关系式;
第二步:列出分布列,求出期望;
第三步:根据期望进行最后的决策.
【变式10-1】某综艺节目,5位嘉宾轮流参与抽奖.四个一模一样的箱子,只有一个箱子有奖品.抽奖规则为主持人请嘉宾在四个箱子中选择一个,若奖品在此箱子里,则奖品由嘉宾获得.前一位嘉宾抽奖结束后,主持人重新布置箱子,邀请下一位嘉宾抽奖.
(1)记X为5位嘉宾中的中奖人数,求X的分布列,均值和方差;
(2)主持人宣布游戏升级,新的抽奖规则是:当嘉宾选好一个箱子后,主持人(他知道哪个箱子有奖品)会打开一个嘉宾没有选择的空箱子给嘉宾看,此后嘉宾可以选择换一个箱子或者不换.嘉宾做出选择后,主持人再打开嘉宾最终选中的箱子,揭晓嘉宾是否中奖.嘉宾的哪种决策会有更大可能抽中奖品?请说明理由.
【解析】(1)由题意知,每位嘉宾中奖的概率为,不中奖的概率为,
则服从二项分布,
所以,


所以的分布列为:
0 1 2 3 4 5
数学期望为,
方差为;
(2)不换箱子时中奖概率:
嘉宾第一次选择箱子时,中奖概率为;
换箱子时中奖概率:
设4个箱子分别为,有奖品的箱子为,
当嘉宾先选箱,主持人会在箱中打开一个空箱子,
此时嘉宾换箱子后,就选不中奖品,其概率为0;
当嘉宾先选或或箱子,概率为,
此时主持人打开另一个空箱子,嘉宾换箱子后一定能选中有奖品的箱,
其概率为,所以换箱子的中奖概率为.
所以,故嘉宾换箱子会有更大可能抽中奖品.
1.在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.系统就能正常工作.设三台设备的可靠度均为,它们之间相互不影响.
(1)要使系统的可靠度不低于0.992,求的最小值;
(2)当时,求能使系统正常工作的设备数的分布列;
(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可给该产业园带来约50万的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:
方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.8,更换设备硬件总费用为0.8万元;
方案2:花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”.
请从经济损失期望最小的角度判断决策部门该如何决策?并说明理由.
【解析】(1)要使系统的可靠度不低于0.992,设能正常工作的设备数为,
则,
解得,故的最小值为0.8.
(2)设为正常工作的设备数,由题意可知,,




从而的分布列为:
0 1 2 3
0.027 0.189 0.441 0.343
(3)设方案1 方案2的总损失分别为,,
采用方案1,更换部分设备的硬件,使得每台设备的可靠度维持在0.8,
可知计算机网络断掉的概率为:,
故万元.
采用方案2,花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”,
计算机网络断掉的概率为:,
故万元.
因此,从经济损失期望最小的角度,决策部门应选择方案2.
题型十一:递推型概率命题
【典例11-1】马尔科夫链是概率统计中的一个重要模型,其过程具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,即第n+1次状态的概率分布只与第n次的状态有关,与第,…次的状态无关,即.已知甲盒中装有1个白球和2个黑球,乙盒中装有2个白球,现从甲、乙两个盒中各任取1个球交换放入对方的盒中,重复n次()这样的操作,记此时甲盒中白球的个数为,甲盒中恰有2个白球的概率为,恰有1个白球的概率为.
(1)求和.
(2)证明:为等比数列.
(3)求的数学期望(用n表示).
【解析】(1)若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,概率;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率,
研究第2次交换球时的概率,根据第1次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为,
②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为,
此时,若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,
乙盒中的球变为1白1黑,概率为
若甲盒取白球,乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率为,
综上,.
(2)依题意,经过次这样的操作,甲盒中恰有2个白球的概率为,
恰有1个白球的概率为,则甲盒中恰有3个白球的概率为,
研究第次交换球时的概率,根据第次交换球的结果讨论如下:
①当甲盒中的球为2白1黑,乙盒中的球为1白1黑时,对应概率为,
此时,若甲盒取黑球、乙盒取黑球,互换,则甲盒中的球仍为2白1黑,
乙盒中的球仍为1白1黑,概率为;
若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为3白,乙盒中的球变为2黑,概率为;
若甲盒取白球、乙盒取黑球,互换,则甲盒中的球变为1白2黑,乙盒中的球变为2白,概率为;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为2白1黑,乙盒中的球仍为1白1黑,概率为,
②当甲盒中的球为1白2黑,乙盒中的球为2白时,对应概率为,
此时,若甲盒取黑球、乙盒取白球,互换,则甲盒中的球变为2白1黑,乙盒中的球变为1白1黑,概率为;
若甲盒取白球、乙盒取白球,互换,则甲盒中的球仍为1白2黑,乙盒中的球仍为2白,概率为,
③当甲盒中的球为3白,乙盒中的球为2黑时,对应概率为,
此时,甲盒只能取白球、乙盒只能取黑球,互换,则甲盒中的球变为2白1黑,
乙盒中的球变为1白1黑,概率为,
综上,
则,
整理得,又,
所以数列是公比为的等比数列.
(3)由(2)知,则,
随机变量的分布列为
1 2 3
所以.
【典例11-2】如图,单位圆上的一质点在随机外力的作用下,每一次在圆弧上等可能地逆时针或顺时针移动,设移动次回到起始位置的概率为.
(1)求及的值:
(2)求数列的前项和.
【解析】(1)如图:设起始位置为,
移动2次回到起始位置,则;;
所以,
若移动3次回到起始位置,
;;
所以,
(2)每次移动的时候是顺时针与逆时针移动是等可能的,
设掷骰子次时,棋子移动到,,处的概率分别为:,,,
所以.
掷骰子次时,共有,,三种情况,故.
,即,,
又,
时,,
又,可得,
由,
可得数列是首项为公比为的等比数列,
,即,
又.
所以的前项和为
递推型概率命题,综合性较强,主要有以下类型:
1、求通项公式:关键与找出概率或数学期望的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式.
2、求和:主要与数列中的倒序求和错位求和、裂项求和.
3、利用等差、等比数列的性质,研究单调性、最值或求极限.
【变式11-1】马尔科夫链因俄国数学家安德烈 马尔科夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态无关.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.现有两个盒子,各装有2个黑球和1个红球,现从两个盒子中各任取一个球交换放入另一个盒子,重复进行次这样的操作后,记盒子中红球的个数为,恰有1个红球的概率为.
(1)求的值;
(2)求的值(用表示);
(3)求证:的数学期望为定值.
【解析】(1)设第次操作后盒子中恰有2个红球的概率为,则没有红球的概率为.
由题意知,
(2)因为.
所以.
又因为,所以是以为首项,为公比的等比数列.
所以,
(3)因为,①

所以①一②,得.
又因为,所以,所以.
的可能取值是,
所以的概率分布列为
0 1 2
所以.
所以的数学期望为定值1.
【变式11-2】有个编号分别为的盒子,第1个盒子中有2个红球和1个白球,其余盒子中均为1个红球和1个白球,现从第1个盒子中任取一球放入第2个盒子,现从第2个盒子中任取一球放入第3个盒子,,依次进行.
(1)求从第2个盒子中取到红球的概率;
(2)求从第个盒子中取到红球的概率;
(3)设第个盒子中红球的个数为,的期望值为,求证:.
【解析】(1)记“从第个盒子中取到红球”为事件,
此时,,
则;
(2)因为

所以,
则数列是以为首项,为公比的等比数列,
此时,
即,
当时,,符合题意,
综上,从第个盒子中取到红球的概率为;
(3)证明:易知的所有可能取值为1,2,
此时,,
则的分布列为:
1 2
所以,
由于,
故.
1.如图,一个正三角形被分成9个全等的三角形区域,分别记作,,,,,,,,. 一个机器人从区域出发,每经过1秒都从一个区域走到与之相邻的另一个区域(有公共边的区域),且到不同相邻区域的概率相等.

(1)分别写出经过2秒和3秒机器人所有可能位于的区域;
(2)求经过2秒机器人位于区域的概率;
(3)求经过秒机器人位于区域的概率.
【解析】(1)经过2秒机器人可能位于的区域为、,,
经过3秒机器人可能位于的区域为,,,,,;
(2)若经过2秒机器人位于区域,则经过1秒时,机器人必定位于,
有三个相邻区域,故由的概率为,
有两个相邻区域,故由的概率为,
则经过2秒机器人位于区域的概率为;
(3)机器人的运动路径为

设经过秒机器人位于区域的概率,
则当为奇数时,,
当为偶数时,由(2)知,,由对称性可知,
经过秒机器人位于区域的概率与位于区域的概率相等,亦为,
故经过秒机器人位于区域的概率为,
若第秒机器人位于区域,则第秒机器人位于区域的概率为,
若第秒机器人位于区域,则第秒机器人位于区域的概率为,
若第秒机器人位于区域,则第秒机器人位于区域的概率为,
则有,即,
令,即,即有,
即有,则,
故有、、、,
故,
即,
综上所述,当为奇数时,经过秒机器人位于区域的概率为,
当为偶数时,经过秒机器人位于区域的概率为.
题型十二:条件概率、全概率公式、贝叶斯公式
【典例12-1】放行准点率是衡量机场运行效率和服务质量的重要指标之一.已知年该机场飞往地,地及其他地区(不包含,两地)航班放行准点率的估计值分别为和,年该机场飞往地,地及其他地区的航班比例分别为,和.
试解决一下问题:
(1)现在从年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;
(2)若年某航班在该机场准点放行,判断该航班飞往地,地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.
【解析】(1)设"该航班飞往地", "该航班飞往地", "该航班飞往其他地区","该航班准点放行",
则,,,
,,,
由全概率公式得,

所以该航班准点放行的概率为.
(2),


因为,所以该航班飞往其他地区的可能性最大.
【典例12-2】如图所示,在研究某种粒子的实验装置中,有三个腔室,粒子只能从室出发经室到达室.粒子在室不旋转,在室 室都旋转,且只有上旋和下旋两种状态,粒子间的旋转状态相互独立.粒子从室经过1号门进入室后,等可能的变为上旋或下旋状态,粒子从室经过2号门进入室后,粒子的旋转状态发生改变的概率为.现有两个粒子从室出发,先后经过1号门,2号门进入室,记室两个粒子中,上旋状态粒子的个数为.
(1)已知两个粒子通过1号门后,恰有1个上旋状态1个下旋状态.若这两个粒子通过2号门后仍然恰有1个上旋状态1个下旋状态的概率为,求;
(2)若,求两个粒子经过2号门后都为上旋状态的概率;
(3)求的分布列和数学期望.
【解析】(1)设“两个粒子通过2号门后仍然恰有1个上旋状态1个下旋状态”.
事件A发生即通过2号门时,两个粒子都不改变或都改变旋转状态,
故,解得或.
(2)设“两个粒子通过1号门后处于上旋状态粒子个数为个”,,
“两个粒子通过2号门后处于上旋状态的粒子个数为2个”,
则,
则.
(3)由题知,
时分3类情形,
①两个粒子通过1号门后均处上旋状态,通过2号门后均不改变状态;
②两个粒子通过1号门后一个上旋状态一个下旋状态,通过2号门后上旋状态粒子不改变状态,下旋状态粒子改变状态;
③两个粒子通过1号门后两个均为下旋状态,通过2号门后均改变状态,
所以,
同理,
所以所求的分布列为
X 0 1 2
P
所以所求数学期望.
1、一般地,设,为两个事件,且,称为在事件发生的条件下,事件发生的条件概率.
2、全概率公式
3、贝叶斯公式
一般地,当且时,有
【变式12-1】随着春季学期开学,某市市场监管局加强了对学校食堂食品安全管理,助力推广校园文明餐桌行动,培养广大师生文明餐桌新理念,以“小餐桌”带动“大文明”,同时践行绿色发展理念.该市某中学有A,B两个餐厅为老师与学生们提供午餐与晚餐服务,王同学、张老师两人每天午餐和晚餐都在学校就餐,近一个月(30天)选择餐厅就餐情况统计如下:
选择餐厅情况(午餐,晚餐)
王同学 9天 6天 12天 3天
张老师 6天 6天 6天 12天
假设王同学、张老师选择餐厅相互独立,用频率估计概率.
(1)估计一天中王同学午餐和晚餐选择不同餐厅就餐的概率;
(2)记X为王同学、张老师在一天中就专题22 概率与统计的综合应用与高级分析
目录
01考情透视·目标导航 2
02知识导图·思维引航 3
03 知识梳理·方法技巧 4
04 真题研析·精准预测 6
05 核心精讲·题型突破 11
题型一:求概率及随机变量的分布列与期望 11
题型二:超几何分布与二项分布 13
题型三:概率与其它知识的交汇问题 15
题型四:期望与方差的实际应用 18
题型五:正态分布与标准正态分布 21
题型六:统计图表及数字特征 24
题型七:线性回归与非线性回归分析 27
题型八:独立性检验 31
题型九:与体育比赛规则有关的概率问题 35
题型十:决策型问题 37
题型十一:递推型概率命题 40
题型十二:条件概率、全概率公式、贝叶斯公式 42
重难点突破:高等背景下的概统问题 45
概率统计在高考中具有举足轻重的地位,是新高考卷及众多省市高考数学的必考题型。其考查重点涵盖古典概型、相互独立事件的概率计算、条件概率、超几何分布与二项分布、正态分布的应用、统计图表与数字特征的解析、回归分析方法的运用、离散型随机变量的分布列以及期望与方差在实际问题中的应用等方面。
近年来,高考中的概率统计解答题往往紧密联系社会实际,以现实生活场景为命题背景,强调知识的综合运用和实践能力的考察。这要求考生不仅具备收集、整理和分析数据的能力,还能从繁杂的数据中提炼出对解决问题有价值的信息,进而建立数学模型,并运用数学原理和工具来有效解决实际问题。
考点要求 目标要求 考题统计 考情分析
统计图表及数字特征 掌握统计图表绘制,理解数字特征应用 2023年乙卷第17题,12分 2023年II卷第19题,12分 2022年II卷第19题,12分 预测2025年高考数学解答题的可能趋势如下: (1)该题预计将以解答题的压轴题形式呈现,全面考查考生的数学抽象思维、数学建模能力、逻辑推理能力以及数学运算技能这四大核心素养。 (2)题目的热点内容预计将与体育比赛规则相关的概率问题,以及在高等数学背景下的概率统计问题密切相关。
期望与方差 理解期望方差概念,熟练进行计算应用。 2024年II卷第18题,17分 2023年上海卷第19题,14分 2023年I卷第21题,12分 2022年甲卷第19题,12分 2021年I卷第18题,12分
独立性检验 掌握独立性检验,解决分类变量问题。 2023年甲卷第17题,12分 2022年I卷第20题,12分
(一)涉及的概率知识层面
主要考查随机变量的概率分布与数学期望,一定要根据有关概念,判断是等可能事件、互斥事件、相互独立事件还是独立重复试验,以便选择正确的计算方法,进行概率计算及离散型随机变量的分布列和数学期望的计算,也要掌握几种常见常考的概率分布模型:离散型有二项分布、超几何分布,连续型有正态分布.考查运用概率知识解决简单实际问题的能力,
1、离散型随机变量的期望与方差
一般地,若离散型随机变量的分布列为
称为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
称为随机变量的方差,它刻画了随机变量与其均值的偏离程度,其算术平方根为随机变量的标准差.
(1)离散型随机变量的分布列的性质
①;②.
(2)均值与方差的性质
若,其中为常数,则也是随机变量,

(3)分布列的求法
①与排列、组合有关分布列的求法.由排列、组合、概率知识求出概率,再求出分布列.
②与频率分布直方图有关分布列的求法.可由频率估计概率, 再求出分布列.
③与互斥事件有关分布列的求法.弄清互斥事件的关系,利用概率公式求出概率,再列出分布列.
④与独立事件(或独立重复试验)有关分布列的求法.先弄清独立事件的关系,求出各个概率,再列出分布列.
(4)常见的离散型随机变量的概率分布模型
①二项分布; ②超儿何分布.
2、常见的连续型概率分布模型
正态分布.
(二)概率分布与不同知识背景结合考查对实际问题的解决能力
1、与数列结合的实际问题
2、与函数导数结合的实际问题
3、与分段函数求最值、解不等式结合的实际问题
4、与统计结合的实际问题
5、与其他背景结合的实际问题
1.(2024年北京高考数学真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数 0 1 2 3 4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
2.(2024年新课标全国Ⅱ卷数学真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
3.(2023年北京高考数学真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段 价格变化
第1天到第20天 - + + 0 - - - + + 0 + 0 - - + - + 0 0 +
第21天到第40天 0 + + 0 - - - + + 0 + 0 + - - - + 0 - +
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
4.(2023年高考全国乙卷数学(理)真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
5.(2023年新课标全国Ⅰ卷数学真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
6.(2023年新课标全国Ⅱ卷数学真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
7.(2022年新高考全国II卷数学真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
8.(2022年高考全国乙卷数学(理)真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
题型一:求概率及随机变量的分布列与期望
【典例1-1】蛇年来临之际,某商场计划安排新春抽奖活动,方案如下:1号不透明的盒子中装有标有“吉”“安”“和”字样的小球,2号不透明的盒子中装有标有“祥”“康”“顺”字样的小球,顾客先从1号不透明的盒子中取出1个小球,再从2号不透明的盒子取出1个小球,若这2个球上的字组成“吉祥”“安康”“和顺”中的一个词语,则这位顾客中奖,反之没有中奖,每位顾客只能进行一轮抽奖.已知顾客从不透明的盒子取出标有“吉”“安”“和”“祥”“康”“顺”字样小球的概率均为,且顾客取出小球的结果相互独立.
(1)求顾客中奖的概率;
(2)若小明一家三口参加这个抽奖活动,求小明全家中奖次数的分布列及数学期望.
【典例1-2】随着教育部的“双减政策”落地,为了丰富高中基础年级学生的课余生活,2025年元旦期间,某校师生举行一场惊心动魄的足球比赛;由教师代表队、高一学生代表队和高二学生代表队组成、得分规则为:球队胜一场积3分,平一场积1分,负一场积0分.由教师代表队与高一学生代表队和高二学生代表队的两场比赛.根据前期比赛成绩,教师代表队与高一学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为;由教师代表队与高二学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立.
(1)求教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率;
(2)用表示教师代表队两场比赛获得积分之和,求的分布列与期望.
求离散型随机变量的分布列及期望的一般步骤:
(1)根据题中条件确定随机变量的可能取值;
(2)求出随机变量所有可能取值对应的概率,即可得出分布列;
(3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算)
【变式1-1】年末某商场举办购物有奖活动:若购物金额超过1000元,则可以抽奖一次,奖池中有9张卡片,“福”“迎”“春”卡各2张,“蛇”卡3张,每次抽奖者从中随机抽取4张卡片,抽到“蛇”卡获得2分,抽到其他卡均获得1分,最终得7分的人可得120元奖金,最终得4分的人可得60元奖金,其他最终得分的人可得20元奖金.已知小钟获得一次抽奖机会.
(1)求小钟抽到“福”“迎”“春”“蛇”卡各1张的概率;
(2)记小钟的中奖金额为,求的分布列及数学期望.
1.为了让高三同学们在紧张的学习之余放松身心,缓解压力,激发同学们的竞争意识,培养积极向上的心态,为高三生活增添一抹别样的色彩,某校高三(1)班利用课余时间开展一次投篮趣味比赛.已知该班甲同学每次投篮相互独立,每次投篮命中的概率为,且次投篮至少命中次的概率为.
(1)求;
(2)若甲同学连续投篮次,每次投进记分,未投进记分,记甲同学的总得分为,求的分布列和数学期望;
(3)若甲同学投篮时出现命中就停止投篮,且最多投篮次,设随机变量为投篮的次数,证明:.
题型二:超几何分布与二项分布
【典例2-1】高三(1)班有名同学,在某次考试中总成绩在分(含分)以上的有人:甲、乙、丙、丁;在分—分之间的有人:戊、己、庚、辛、壬、癸、子、丑、寅、卯、辰、巳、午、未、申.其中数学成绩超过分的有人:甲、乙、丙、丁、戊、庚、寅、辰、壬、申.
(1)从该班同学中任选一人,求在数学成绩超过分的条件下,总成绩超过分的概率;
(2)从数学成绩超过分的同学中随机抽取人.
①采取不放回抽样方式抽取,记为成绩在分—分之间的同学的个数,求的分布列和期望;
②采取放回抽样方式抽取,记为成绩在分—分之间的同学的个数,求的值.(直接写出结果)
【典例2-2】在某地区进行高中学生每周户外运动调查,随机调查了名高中学生户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
(1)求的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)
(2)为进一步了解这名高中学生户外运动的时间分配,在,两组内的学生中,采用分层抽样的方法抽取了人,现从这人中随机抽取人进行访谈,记在内的人数为,求的分布列和期望;
(3)以频率估计概率,从该地区的高中学生中随机抽取名学生,用“”表示这名学生中恰有名学生户外运动时间在内的概率,当最大时,求的值.
超几何分布与二项分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.
一般地,在含有件产品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,其中,且,称为超几何分布列.
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,则.此时称随机变量服从二项分布,记作,并称为成功概率.此时有.
【变式2-1】某校为了解高三学生每天的作业完成时长,在该校高三学生中随机选取了100人,对他们每天完成各科作业的总时长进行了调研,结果如下表所示:
时长(小时)
人数(人) 3 4 33 42 18
用表格中的频率估计概率,且每个学生完成各科作业时互不影响.
(1)从该校高三学生中随机选取1人,估计该生可以在3小时内完成各科作业的概率;
(2)从样本“完成各科作业的总时长在2.5小时内”的学生中随机选取3人,其中共有人可以在2小时内完成各科作业,求的分布列和数学期望;
(3)从该校高三学生(学生人数较多)中随机选取3人,其中共有人可以在3小时内完成各科作业,求.
1.同学们,你们知道排球比赛的规则和积分制吗 其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1 2 3 4 5 6
甲 25 21 27 27 23 25
乙 18 25 25 25 25 17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小(结论不要求证明).
题型三:概率与其它知识的交汇问题
【典例3-1】如图,一只蚂蚁从正方体的顶点出发沿棱爬行,记蚂蚁从一个顶点到另一个顶点为一次爬行,每次爬行的方向是随机的,蚂蚁沿正方体上、下底面上的棱爬行的概率为,沿正方体的侧棱爬行的概率为.

(1)若蚂蚁爬行5次,求蚂蚁在下底面顶点的概率;
(2)若蚂蚁爬行5次,记它在顶点出现的次数为,求的分布列与数学期望.
【典例3-2】在三维空间中,单位立方体的顶点坐标可用三维坐标表示,其中.而在维空间中,单位立方体的顶点坐标可表示为维坐标,其中.在维空间中,设点,定义维向量,数量积,为坐标原点,即.
(1)在3维空间单位立方体中任取两个不同顶点,求的概率;
(2)在维单位立方体中任取两个不同顶点,记随机变量.
(i)当时,若最大,求的值;
(ii)求的分布列及期望值.
在知识交汇处设计试题是高考命题的指导思想之一,概率作为高中数学具有实际应用背景的主要内容,除与实际应用问题相交汇,还常与排列组合、函数、数列等知识交汇.求解此类问题要充分理解题意.根据题中已知条件,联系所学知识对已知条件进行转化.这类题型具体来说有两大类:
1、所给问题是以集合、函数、立体几何、数列、向量等知识为载体的概率问题.求解时需要利用相关知识把所给问题转化为概率模型,然后利用概率知识求解.
2、所给问题是概率问题,求解时有时需要把所求概率转化为关于某一变量的函数,然后利用函数、导数知识进行求解;或者把问题转化为与概率变量有关的数列递推关系式,再通过构造特殊数列求通项或求和.
【变式3-1】为提高学生的思想政治觉悟,激发爱国热情,增强国防观念和国家安全意识,某校进行军训打靶竞赛.规则如下:每人共有3次机会,击中靶心得1分,否则得0分、已知甲选手第一枪击中靶心的概率为,且满足:如果第n次射击击中靶心概率为p,那么当第n次击中靶心时,第次击中靶心的概率也为p,否则第次击中靶心的概率为.
(1)求甲选手得分X的分布列及其数学期望;
(2)有如下定义:设X是一个随机变量,x是任意实数,函数,称为X的分布函数,对于任意实数,,有.因此,若已知X的分布函数,我们就知道X落在任一区间上的概率.
(i)写出(1)中甲选手得分X的分布函数(分段函数形式);
(ii)靶子是半径为2的一个圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,假如选手射击都能中靶,以Y表示弹着点与圆心的距离.试求随机变量Y的分布函数.
1.在长方体中,已知,从该长方体的八个顶点中,任取两个不同的顶点,用随机变量表示这两点之间的距离.
(1)求随机变量的概率;
(2)求随机变量的分布列.
题型四:期望与方差的实际应用
【典例4-1】现有两种投资方案,一年后投资盈亏的情况如下:
方案一:投资股市:
投资结果 获利 不赔不赚 亏损
概率
方案二:购买基金:
投资结果 获利 不赔不赚 亏损
概率
(1)当时,求的值;
(2)若要将万元钱进行投资,决定在“投资股市”和“购买基金”这两种方案中选择一种,已知,,那么选择哪种投资方案,才能使得一年后投资收益的数学期望较大?给出结果并说明理由.
【典例4-2】某企业有甲,乙两条生产线,每条生产线都有,,三个流程,为了比较这两条生产线的优劣,经过长期调查,可知甲生产线的,,三个流程的优秀率分别为0.9,0.9,0.8,乙生产线的,,三个流程的优秀率分别为0.8,0.85,0.92.已知每个流程是否优秀相互独立.
(1)求甲生产线的三个流程中至少有一个优秀的概率.
(2)为了评估这两条生产线哪个更优秀,该企业对,,三个流程进行赋分.当流程优秀时,赋30分,当流程不优秀时,赋0分;当流程优秀时,赋40分,当流程不优秀时,赋0分;当流程优秀时,赋50分,当流程不优秀时,赋0分.记甲生产线的,,流程的赋分分别为,,,乙生产线的,,流程的赋分分别为,,,计算与,并据此判断甲、乙哪条生产线更优秀.
数学期望反映的是随机变量取值的平均水平,而方差则是反映随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差来对事件发生大小的可能性和稳定性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.
(1)若我们希望实际的平均水平较理想,则先求随机变量的期望,当时,不应认为它们一定一样好,还需要用来比较这两个随机变量的方差,确定它们的偏离程度.
(2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近.
(3)方差不是越小就越好,而是要根据实际问题的需要来判断.
【变式4-1】超轻黏土是一种集艺术性 趣味性 创造性于一体的手工造型材料.某小学为了丰富校园文化生活,举行了超轻黏土制作比赛活动.本次活动是在各班中选拔表现突出的学生,以班级为单位参加比赛.班级选拔共有6节课,每节课完成情况相互独立.每节课学生需独自完成3个动物作品与3个植物作品,若评优作品不少于5个,则将该学生评为“优秀制作人”.最后4节课中,被评为“优秀制作人”的次数不少于3次的学生将代表班级参加比赛.已知小章前2节课制作的作品中,有5个动物作品与4个植物作品为评优作品.
(1)从小章前2节课制作的作品中随机抽取3个动物作品与3个植物作品,求其中至少有5个作品为评优作品的概率.
(2)若小章经过课后练有所提高,最后4节课每节课动物作品与植物作品为评优作品的概率分别为,且,以最后4节课中小章被评为“优秀制作人”的次数的数学期望为依据,试预测小章是否能代表班级参加比赛.
1.组合投资需要同时考虑风险与收益.为了控制风险需要组合低风险资产,为了扩大收益需要组合高收益资产,现有两个相互独立的投资项目A和B,单独投资100万元项目A的收益记为随机变量X,单独投资100万元项目B的收益记为随机变量Y.若将100万资金按进行组合投资,则投资收益的随机变量Z满足,其中.假设在组合投资中,可用随机变量的期望衡量收益,可用随机变量的方差衡量风险.
(1)若,,求Z的期望与方差;
(2)已知随机变量X满足分布列:
X … …
… …
随机变量Y满足分布列:
Y … …
… …
且随机变量X与Y相互独立,即,,.求证:;
(3)若投资项目X是高收益资产,其每年的收益满足:有30%的可能亏损当前资产的一半;有70%的可能增值当前资产的一倍.投资项目是低风险资产,满足.试问能否满足投资第1年的收益不低于17万,风险不高于500?请说明理由.
题型五:正态分布与标准正态分布
【典例5-1】高中生坚持跑操有利于增强体质.某高中实践活动小组经过调查所在学校学生坚持跑操的次数与综合体测成绩等信息,得到如下数据:该学校有的学生每月平均坚持跑操的次数超过40次,这些学生中,综合体测成绩达到“及格”等级的概率为,而每月平均坚持跑操的次数不超过40次的学生的综合体测成绩达到“及格”等级的概率为.
(1)若从该学校任意抽取一名学生,求该学生综合体测成绩达到“及格”等级的概率;
(2)已知该实践活动小组的6名学生中有4名学生综合体测成绩达到“及格”等级,从这6名学生中抽取2名学生,记为抽取的这2名学生中综合体测成绩达到“及格”等级的人数,求随机变量的分布列和数学期望.
(3)经统计:该校学生综合体测得分近似服从正态分布,若得分,则综合体测成绩达到“优秀”等级,假设学生之间综合体测成绩相互独立.现从该校所有学生中抽取40名学生,记为这40名学生中综合体测成绩达到“优秀”等级的人数,求的数学期望.(结果四舍五入保留整数)
参考数据:若随机变量服从正态分布,则,,
【典例5-2】“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.一般地,对于一次成功的考试来说,所有考生得考试成绩应服从正态分布.某单位准备通过考试(按照高分优先录取的原则)录用300人,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.记考生的成绩为,且,已知所有考生考试的平均成绩,且360分及其以上的高分考生有30名.
(1)求的值.(结果保留位整数)
(2)该单位的最低录取分数约是多少?(结果保留为整数)
(3)考生甲的成绩为286分,若甲被录取,能否获得高薪职位?若不能被录取,请说明理由.
参考资料:①当时,令,则.
②当,,,,.
解决正态分布问题有三个关键点:(1)对称轴标准差分布区间.利用对称性可求指定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为特殊区间,从而求出所求概率.注意在标准正态分布下对称轴为.
【变式5-1】某市举行了一次大型宣传活动,结束后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据(人均得分)构成一个样本,依据相关标准,该样本中各地抽取的数据构成数列(n为各地区的编号),且由各地的数据可以认为各地人均得分服从正态分布,μ近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).
(1)利用正态分布的知识求.
(2)组办方为此次参加问卷调查的市民制订如下两种奖励方案.
方案一:(ⅰ)得分不低于μ的可以获赠2次随机话费,得分低于μ的可以获赠1次随机话费.
(ⅱ)每次获赠的随机话费和对应的概率为
获赠的随机话费/元 50 100
概率
方案二:参加此次问卷调查的市民可获得价值100元的大型晚会入场券.
参加此次问卷调查的市民可选择其中一种奖励方案.
①市民小李参加了此次问卷调查,他选择了方案一,记X(单位:元)为他获赠的话费,求X的分布列及数学期望.
②仅从奖励的价值考虑,如果你参加了问卷调查,你选择参加获赠随机话费活动,还是获得价值100元的大型晚会入场券?用统计中相关知识做出决策.
(附:若,则,,)
1.2023年3月某学校举办了春季科技体育节,其中安排的女排赛事共有12个班级作为参赛队伍,本次比赛启用了新的排球用球已知这种球的质量指标(单位:g)服从正态分布,其中,.比赛赛制采取单循环方式,即每支球队进行11场比赛,最后靠积分选出最后冠军,积分规则如下(比赛采取5局3胜制):比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.9轮过后,积分榜上的前2名分别为1班排球队和2班排球队,1班排球队积26分,2班排球队积22分.第10轮1班排球队对抗3班排球队,设每局比赛1班排球队取胜的概率为.
(1)令,则,且,求,并证明:;
(2)第10轮比赛中,记1班排球队3:1取胜的概率为,求出的最大值点,并以作为的值,解决下列问题.
(ⅰ)在第10轮比赛中,1班排球队所得积分为,求的分布列;
(ⅱ)已知第10轮2班排球队积3分,判断1班排球队能否提前一轮夺得冠军(第10轮过后,无论最后一轮即第11轮结果如何,1班排球队积分最多)?若能,求出相应的概率;若不能,请说明理由.
参考数据:,则,,.
题型六:统计图表及数字特征
【典例6-1】为庆祝“五一”国际劳动节,某校举办“五一”文艺汇演活动,本次汇演共有40个参赛节目,经现场评委评分,分成六组:第一组,第二组,第三组,第四组,第五组,第六组,得到如下频率分布直方图:
(1)估计所有参赛节目评分的第85百分位数(保留1位小数);
(2)若评分结束后只对所有评分在区间的节目进行评奖(每个节目都能获奖,只有一等奖和二等奖),其中每个节目获评为一等奖的概率为,获评为二等奖的概率为,每个节目的评奖结果相互独立.
(ⅰ)设参评节目中恰有2个一等奖的概率为,求的极大值点;
(ⅱ)以(ⅰ)中作为p的值,若对这部分评奖节目进行奖励,已知一等奖节目奖金为500元,若要使得总奖金期望不超过1400元,请估计二等奖奖金的最大值.
【典例6-2】睡眠是守卫健康的忠臣,小周同学就高三同学睡眠问题展开了一次调研活动:
* 1 2 3 4 5 6 7 8 9 10 合计/人
(3,4] 1 0 1 2 1 0 0 1 0 0 6
(4,5] 8 7 8 6 4 7 7 4 5 4
(5,6] 8 12 10 8 17 16 12 13 12 12
(6,7] 25 25 26 25 22 22 24 23 25 23 240
(7,8] 6 6 7 7 5 4 5 6 7 7 60
(9,10] 2 2 1 1 2 1 1 2 0 2
(1)小周同学调查了振兴中学高三随机十个班级的单个学生睡眠平均时长所在区间的人数分布,请补全这张统计表(横向代表班级序号,纵向代表平均睡眠时长所在区间,框内数据代表人数)与直方图并通过直方图估计振兴中学高三同学睡眠的分位数(作图不要求写出过程);
(2)之后,小周同学收集了随机名同学的具体平均睡眠时长,这些数据中男生有人,平均睡眠时长与睡眠时长方差分别为与;女生有人,平均睡眠时长与睡眠时长方差分别为与,请根据以上数据计算出这名同学的睡眠时长总方差.
(3)睡眠连续性得分是判断睡眠质量的分数度量,一般算合格.临近大型考试,小周同学用智能手表测出了考试前一周他的睡眠连续性得分,请根据图表得出两条有效信息并为他提出一条可行的睡眠建议.
1、制作频率分布直方图的步骤.
第一步:求极差,决定组数和组距,组距
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图.
2、解决频率分布直方图问题时要抓住3个要点.
(1)直方图中各小矩形的面积之和为1;
(2)直方图中纵轴表示,故每组样本的频率为组距
(3)直方图中每组样本的频数为频率总体个数.
3、用频率分布直方图估计众数、中位数、平均数的方法.
(1)众数为频率分布直方图中最高矩形底边中点的横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.
【变式6-1】某景点奶茶店的甲、乙、丙三款奶茶在国庆黄金周期间的日销售量数据,如下表(单位:杯):
10月1日 10月2日 10月3日 10月4日 10月5日 10月6日 10月7日
甲 60 65 66 65 67 66 63
乙 57 62 63 62 64 63 60
丙 55 60 61 60 62 61 58
(1)从10月1日至7日中随机选取一天,求该天甲款奶茶日销售量大于65杯的概率;
(2)从乙、丙两款奶茶的日销售量数据中各随机选取1个,这2个数据中大于60的个数记为,求的分布列和数学期望;
(3)记乙款奶茶日销售量数据的方差为,表格中所有的日销售量数据的方差为,试判断和的大小.(结论不要求证明)
1.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和,样本方差分别记为 和.
(1)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)
(2)假设该厂计划用新设备全面投产,若生产一系列产品的指标数据不少于10.3即为质量优秀产品,以表中的频率估计概率,现从该厂生产的一批产品中随机抽取100件产品进行质量抽检,求抽检的产品中质量优秀产品的件数ξ的数学期望.
题型七:线性回归与非线性回归分析
【典例7-1】红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度的8组观测数据,制成图l所示的散点图,现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:表中;;;
25 2.9 646 168 422688 50.4 70308
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)求出关于的回归方程.附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,,
【典例7-2】随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.
年份代码
中国健身器材市场规模
(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);
(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.
参考数据:
其中,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
线性回归分析的原理、方法和步骤:
(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.
(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.
(3)相关指数与相关系数在含有一个解释变量的线性回归模型中是等价的量,都是用来判断线性回归模型拟合效果好不好的量.
(4)利用换元法,可以将一元非线性回归转化为线性回归.
【变式7-1】某校高一新生共1000人,男女比例为1:1,经统计身高大于170cm的学生共600人,其中女生200人.该校为了解高一新生身高和体重的关系,在新生中随机抽测了10人的身高(单位:cm)和体重(单位:kg)作为一个样本,所得样本数据如下表所示:
编号 1 2 3 4 5 6 7 8 9 10
身高 164 165 170 172 173 174 176 177 179 180
体重 57 58 65 65 90 70 75 76 80 84
(1)在对这10个学生组成的样本的检测过程中,采用不放回的方式,每次随机抽取1人检测
(ⅰ)若已进行了三次抽取,求抽取的这三人中至少有两人体重大于74kg的概率;
(ⅱ)求第一次抽取的学生体重大于79kg且第二次抽取的学生身高大于175cm的概率;
(2)由表中数据的散点图和残差分析,编号为5的数据残差过大,确定其为离群点,所以应去掉该数据后再求经验回归方程.已知未去掉离群点的样本相关系数约为0.802,请用样本相关系数说明去掉离群点的合理性(相关系数r保留三位小数).
参考公式及数据:样本相关系数
,,,,.
【变式7-2】某省级示范学校高三的一次考试后,为了调查学生们的偏科程度,在实验班随机抽取8名同学,比较物理成绩x与数学成绩y,得到下表(单位:分):
学生号 1 2 3 4 5 6 7 8
x 98 84 87 94 81 91 85 100
y 135 124 113 125 116 120 132 135
(1)求出y关于x的回归方程(精确到0.01);
(2)若相关系数r满足,则我们可以认为y与x之间具有较强的线性相关关系,计算这8名学生的物理成绩和数学成绩是否具有较强的线性相关关系?
(附:,,,,,相关系数)
1.习近平总书记指出:要完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展.某部门在对新发展理念组织了全面学习后,对同一组的5名员工采取如下考核制度:在本季度末,由部门其他人对这5名员工进行投票,并统计5名员工本季度创造的营业收入.现将这5名员工所得票数x与本季度创造的营业收入单位:千元用数对表示:,,,,
(1)求x与y的相关系数
(2)若将本季度创造的营业收入最少的员工移除出组,请根据该小组剩余人员的数据求y关于x的线性回归方程.
参考公式:①相关系数②在利用最小二乘法求得的线性回归方程的中,,
参考数据:,,,,
题型八:独立性检验
【典例8-1】“八段锦”,起源于北宋,已有八百多年的历史. 古人把这套动作比喻为“锦”,意为五颜六色,美而华贵. 体现其动作舒展优美,视其为“祛病健身,效果极好,编排精致,动作完美”,此功法分为八段,每段一个动作,故名为“八段锦”. 作为传统养生功法,对人体有着很多的益处. 为了继续推广“八段锦”,吸引更多的老年市民练习“八段锦”,促进老年市民的延年益寿,市老体协统计了全市的男性老年人和女性老年人(不小于 60 岁的均为老年人)练习“八段锦”的情况,采用简单随机抽样的方法抽取了练习“八段锦”的 200 位老年人,得到了性别与年龄的有关数据,并整理得到以下列联表:
类型 年龄 (岁) 合计
男性 36 111
女性 25
合计 200
(1)补全 列联表,并依据小概率值 的独立性检验,能否认为老年人的性别与年龄是否大于 65 岁有关联
(2)在这 200 位老年人随机抽取一位,求在该老人年龄大于 65 岁的情况下,为女性老年人的概率.
附: ,其中 .
0.01 0.005 0.001
6.635 7.879 10.828
【典例8-2】新能源汽车越来越引起广大消费者的关注,目前新能源汽车的电池有石墨烯电池、三元锂电池、铅酸电池等,其中铅酸电泡有技术成熟.成本较低、高倍率放电的特点,而石墨烯电池可以减少热量对电池的损害,提高电池的使用寿命,石墨烯电池应用到新能源汽车上.对整个汽车行业将是根本性的改变.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名驾驶者,年龄在60周岁以下的为年轻驾驶者,年龄在60周岁及以上的为中老年驾驶者,其中被调查的年轻驾驶者中偏好铅酸电池车的占,得到以下的列联表:
偏好石墨烯电池车 偏好铅酸电池车 合计
中老年驾驶者 200 100
年轻的驾驶者
合计 S00
(1)根据以上数据,完成列联表.依据小概率的独立性检验,能否认为驾驶者对这两种电池的电动车的偏好与年龄有关:
(2)用频率估计概率,在所有参加调查的驾驶者中按年轻驾驶者和中老年驾驶者进行分层抽样,随机抽取5名驾驶者,再从这5名驾驶者中随机抽取2人进行座谈,记2名参加座谈的驾驶者中来自偏好石墨烯电池电动车的中老年驾驶者的人数为,求的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100 0.050 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
解独立性检验应用问题的注意事项.
(1)两个明确:①明确两类主体;②明确研究的两个问题.
(2)在列联表中注意事件的对应及相关值的确定,不可混淆.
(3)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
(4)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
【变式8-1】随机数广泛应用于数据加密、安全通信、金融等领域.计算机中的随机数是由算法产生的,其“随机性”的优劣取决于所采用的算法.某工厂计划生产一种随机数发生器,这种发生器的显示屏能显示1,2,3,4中的一个数字,每按一次数字更新按钮后,显示屏上的数字将等可能地更新为另三个数字中的一个.在试生产阶段,采用两种不同算法,生产出相应算法的甲、乙两种随机数发生器.为评估两种算法的优劣,从这两种随机数发生器中随机抽取150件进行检验,得到数据饼图如下:
(1)已知这150件发生器中,乙种发生器的三级品为2件.在答题卡中填写列联表;依据小概率值的独立性检验,能否认为甲、乙两种发生器的一级品率存在差异
一级品 非一级品 合计


合计
(2)若发生器显示屏的初始显示数字为1,记按次数字更新按钮后得到的数字为,.
(i)求,;
(ii)检测一个发生器是否为一级品的方案为:每件被测发生器需进行100轮测试,每轮测试共按10次数字更新按钮;表示100轮测试得到“”的频率,规定满足的被测发生器为一级品.若某件发生器经100轮测试后得到,能否判断该发生器为一级品
附:,
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
1.一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车 倾向于购买新能源车 合计
女性居民 150 250 400
男性居民 350 250 600
合计 500 500 1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
题型九:与体育比赛规则有关的概率问题
【典例9-1】某篮球俱乐部由篮球Ⅰ队和Ⅱ队组成.Ⅰ队球员水平相对较高,代表俱乐部参加高级别赛事;Ⅱ队是Ⅰ队的储备队,由具有潜力的运动员组成.为考察Ⅰ队的明星队员甲对球队的贡献,教练对近两年甲参加过的60场与俱乐部外球队的比赛进行统计:甲在前锋位置出场12次,其中球队获胜6次;中锋位置出场24次,其中球队获胜16次;后卫位置出场24次,其中球队获胜18次.用该样本的频率估计概率,则:
(1)甲参加比赛时,求Ⅰ队在某场与俱乐部外球队比赛中获胜的概率;
(2)为备战小组赛,Ⅰ队和Ⅱ队进行10场热身赛,比赛没有平局,获胜得1分,失败得0分.已知Ⅰ队在每场比赛中获胜的概率是p(),若比赛最有可能的比分是7∶3,求p的取值范围;
(3)现由Ⅰ队代表俱乐部出战小组赛,小组共6支球队,进行单循环赛(任意两支队伍间均进行一场比赛),若每场比赛均派甲上场,在已知Ⅰ队至少获胜3场的条件下,记其获胜的场数为X,求X的分布列和数学期望.
【典例9-2】甲、乙两名同学进行篮球投篮比赛,比赛规则如下:两人投篮的次数之和不超过5,投篮命中则自己得1分,该名同学继续投篮,若投篮未命中则对方得1分,换另外一名同学投篮,比赛结束时分数多的一方获胜,两人总投篮次数不足5但已经可以确定胜负时比赛就结束,两人总投篮次数达到5次时比赛也结束,已知甲、乙两名同学投篮命中的概率都是,甲同学先投篮.
(1)求甲同学一共投篮三次,且三次投篮连续的情况下获胜的概率;
(2)求甲同学比赛获胜的概率.
1、在与体育比赛规则有关的问题中,一般都会涉及分组,处理该类问题时主要借助于排列组合.对于分组问题,要注意平均分组与非平均分组,另外,在算概率时注意“直接法”与“间接法”的灵活运用.
2、与体育比赛有关的问题中最常见的就是输赢问题,经常涉及“多人淘汰制问题”“ 三局两胜制问题”“ 五局三胜制问题”“ 七局四胜制问题”,解决这些问题的关键是认识“三局两胜制”“ 五局三胜制”等所进行的场数,赢了几场与第几场赢,用互斥事件分类,分析事件的独立性,用分步乘法计数原理计算概率,在分类时要注意“不重不漏” .
3、在体育比赛问题中,比赛何时结束也是经常要考虑的问题,由于比赛赛制已经确定,而比赛的平均场次不确定,需要对比赛的平均场次进行确定,常用的方法就是求以场数为随机变量的数学期望,然后比较大小.
4、有些比赛会采取积分制,考查得分的分布列与数学期望是常考题型,解题的关键是辨别它的概率模型,常见的概率分布模型有:两点分布、超几何分布、二项分布、正态分布,要注意分布是相互独立的,超几何分布不是,值得注意的是,在比赛中往往是伪二项分布,有的只是局部二项分布.
【变式9-1】一项没有平局的对抗赛分为两个阶段,参赛者在第一阶段中共参加2场比赛,若至少有一场获胜,则进入第二阶段比赛,否则被淘汰,比赛结束;进入第二阶段比赛的参赛者共参加3场比赛.在两个阶段的每场比赛中,获胜方记1分,负方记0分,参赛者参赛总分是两个阶段得分的总和,若甲在第一阶段比赛中每场获胜的概率都为,在第二阶段比赛中每场获胜的概率都为,每场比赛是否获胜相互独立.已知甲参赛总分为2分的概率为.
(1)求;
(2)求甲参赛总分X的分布列和数学期望.
1.第19届杭州亚运会-电子竞技作为正式体育竞赛项目备受关注.已知某项赛事的季后赛后半段有四支战队参加,采取“双败淘汰赛制”,对阵表如图,赛程如下:
第一轮:四支队伍分别两两对阵(即比赛1和2),两支获胜队伍进入胜者组,两支失败队伍落入败者组.
第二轮:胜者组两支队伍对阵(即比赛3),获胜队伍成为胜者组第一名,失败队伍落入败者组;第一轮落入败者组两支队伍对阵(即比赛4),失败队伍(已两败)被淘汰(获得殿军),获胜队伍留在败者组.
第三轮:败者组两支队伍对阵(即比赛5),失败队伍被淘汰(获得季军);获胜队伍成为败者组第一名.
第四轮:败者组第一名和胜者组第一名决赛(即比赛6),争夺冠军.假设每场比赛双方获胜的概率均为0.5,每场比赛之间相互独立.问:

(1)若第一轮队伍和队伍对阵,则他们仍能在决赛中对阵的概率是多少?
(2)已知队伍在上述季后赛后半段所参加的所有比赛中,败了两场,求在该条件下队伍获得亚军的概率.
题型十:决策型问题
【典例10-1】2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6 8 9 10 12
2 3 4 5 6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
【典例10-2】某农产品经销商计划分别在甲、乙两个市场销售某种农产品(两个市场的销售互不影响),为了了解该种农产品的销售情况,现分别调查了该农产品在甲、乙两个市场过去10个销售周期内的销售情况,得下表:
销售量 销售周期个数 市场 3吨 4吨 5吨
甲 3 4 3
乙 2 5 3
(1)从过去10个销售周期中随机抽取一个销售周期,求甲市场销售量为4吨的概率;
(2)以市场销售量的频率代替销售量的概率.设(单位:吨)表示下个销售周期两个市场的总销售量,求随机变量概率分布列;
(3)在(2)的条件下,设该经销商计划在下个销售周期购进吨该产品,在甲、乙两个市场同时销售,已知该产品每售出1吨获利1000元,未售出的产品降价处理,每吨亏损200元.以销售利润的期望作为决策的依据,判断与应选用哪一个.
求解决策型问题的求解流程为:
第一步:先确定函数关系式;
第二步:列出分布列,求出期望;
第三步:根据期望进行最后的决策.
【变式10-1】某综艺节目,5位嘉宾轮流参与抽奖.四个一模一样的箱子,只有一个箱子有奖品.抽奖规则为主持人请嘉宾在四个箱子中选择一个,若奖品在此箱子里,则奖品由嘉宾获得.前一位嘉宾抽奖结束后,主持人重新布置箱子,邀请下一位嘉宾抽奖.
(1)记X为5位嘉宾中的中奖人数,求X的分布列,均值和方差;
(2)主持人宣布游戏升级,新的抽奖规则是:当嘉宾选好一个箱子后,主持人(他知道哪个箱子有奖品)会打开一个嘉宾没有选择的空箱子给嘉宾看,此后嘉宾可以选择换一个箱子或者不换.嘉宾做出选择后,主持人再打开嘉宾最终选中的箱子,揭晓嘉宾是否中奖.嘉宾的哪种决策会有更大可能抽中奖品?请说明理由.
1.在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.系统就能正常工作.设三台设备的可靠度均为,它们之间相互不影响.
(1)要使系统的可靠度不低于0.992,求的最小值;
(2)当时,求能使系统正常工作的设备数的分布列;
(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可给该产业园带来约50万的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:
方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.8,更换设备硬件总费用为0.8万元;
方案2:花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”.
请从经济损失期望最小的角度判断决策部门该如何决策?并说明理由.
题型十一:递推型概率命题
【典例11-1】马尔科夫链是概率统计中的一个重要模型,其过程具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,即第n+1次状态的概率分布只与第n次的状态有关,与第,…次的状态无关,即.已知甲盒中装有1个白球和2个黑球,乙盒中装有2个白球,现从甲、乙两个盒中各任取1个球交换放入对方的盒中,重复n次()这样的操作,记此时甲盒中白球的个数为,甲盒中恰有2个白球的概率为,恰有1个白球的概率为.
(1)求和.
(2)证明:为等比数列.
(3)求的数学期望(用n表示).
【典例11-2】如图,单位圆上的一质点在随机外力的作用下,每一次在圆弧上等可能地逆时针或顺时针移动,设移动次回到起始位置的概率为.
(1)求及的值:
(2)求数列的前项和.
递推型概率命题,综合性较强,主要有以下类型:
1、求通项公式:关键与找出概率或数学期望的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式.
2、求和:主要与数列中的倒序求和错位求和、裂项求和.
3、利用等差、等比数列的性质,研究单调性、最值或求极限.
【变式11-1】马尔科夫链因俄国数学家安德烈 马尔科夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态无关.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.现有两个盒子,各装有2个黑球和1个红球,现从两个盒子中各任取一个球交换放入另一个盒子,重复进行次这样的操作后,记盒子中红球的个数为,恰有1个红球的概率为.
(1)求的值;
(2)求的值(用表示);
(3)求证:的数学期望为定值.
【变式11-2】有个编号分别为的盒子,第1个盒子中有2个红球和1个白球,其余盒子中均为1个红球和1个白球,现从第1个盒子中任取一球放入第2个盒子,现从第2个盒子中任取一球放入第3个盒子,,依次进行.
(1)求从第2个盒子中取到红球的概率;
(2)求从第个盒子中取到红球的概率;
(3)设第个盒子中红球的个数为,的期望值为,求证:.
1.如图,一个正三角形被分成9个全等的三角形区域,分别记作,,,,,,,,. 一个机器人从区域出发,每经过1秒都从一个区域走到与之相邻的另一个区域(有公共边的区域),且到不同相邻区域的概率相等.

(1)分别写出经过2秒和3秒机器人所有可能位于的区域;
(2)求经过2秒机器人位于区域的概率;
(3)求经过秒机器人位于区域的概率.
题型十二:条件概率、全概率公式、贝叶斯公式
【典例12-1】放行准点率是衡量机场运行效率和服务质量的重要指标之一.已知年该机场飞往地,地及其他地区(不包含,两地)航班放行准点率的估计值分别为和,年该机场飞往地,地及其他地区的航班比例分别为,和.
试解决一下问题:
(1)现在从年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;
(2)若年某航班在该机场准点放行,判断该航班飞往地,地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.
【典例12-2】如图所示,在研究某种粒子的实验装置中,有三个腔室,粒子只能从室出发经室到达室.粒子在室不旋转,在室 室都旋转,且只有上旋和下旋两种状态,粒子间的旋转状态相互独立.粒子从室经过1号门进入室后,等可能的变为上旋或下旋状态,粒子从室经过2号门进入室后,粒子的旋转状态发生改变的概率为.现有两个粒子从室出发,先后经过1号门,2号门进入室,记室两个粒子中,上旋状态粒子的个数为.
(1)已知两个粒子通过1号门后,恰有1个上旋状态1个下旋状态.若这两个粒子通过2号门后仍然恰有1个上旋状态1个下旋状态的概率为,求;
(2)若,求两个粒子经过2号门后都为上旋状态的概率;
(3)求的分布列和数学期望.
1、一般地,设,为两个事件,且,称为在事件发生的条件下,事件发生的条件概率.
2、全概率公式
3、贝叶斯公式
一般地,当且时,有
【变式12-1】随着春季学期开学,某市市场监管局加强了对学校食堂食品安全管理,助力推广校园文明餐桌行动,培养广大师生文明餐桌新理念,以“小餐桌”带动“大文明”,同时践行绿色发展理念.该市某中学有A,B两个餐厅为老师与学生们提供午餐与晚餐服务,王同学、张老师两人每天午餐和晚餐都在学校就餐,近一个月(30天)选择餐厅就餐情况统计如下:
选择餐厅情况(午餐,晚餐)
王同学 9天 6天 12天 3天
张老师 6天 6天 6天 12天
假设王同学、张老师选择餐厅相互独立,用频率估计概率.
(1)估计一天中王同学午餐和晚餐选择不同餐厅就餐的概率;
(2)记X为王同学、张老师在一天中就餐餐厅的个数,求X的分布列和数学期望;
(3)假设M表示事件“A餐厅推出优惠套餐”,N表示事件“某学生去A餐厅就餐”,,已知推出优惠套餐的情况下学生去该餐厅就餐的概率会比不推出优惠套餐的情况下去该餐厅就餐的概率要大,证明:.
1.巴黎奥运会于2024年7月26日至8月11日举行.某体育局为普及奥运知识,组织了答题活动.设置一个抽题箱,箱中有若干装有题目的小球,小球大小、颜色、质量都一样.每个小球内只有一道题目,每道题目只有一个分值,题目分值分别为2分、10分.抽取规则:每次从抽题箱抽取一个小球,对小球中题目作答后将该题目放回原球内,并把小球放回抽题箱,摇匀后,再抽取.已知2分题目小球被抽到的概率为,10分题目小球被抽到的概率为.
(1)若甲抽取3次,记表示甲3次抽取题目分值之和,求的分布列和数学期望.
(2)若甲、乙各抽取4次,已知甲前两次抽出题目分值之和为20,记事件“乙抽出题目分值之和大于甲抽出题目分值之和”,求.
重难点突破:高等背景下的概统问题
【典例13-1】Catalan数列(卡特兰数列)最早由我国清代数学家明安图(1692-1765)在研究三角函数幂级数的推导过程中发现,成果发表于1774年出版的《割圜密率捷法》中,后由比利时数学家卡特兰(Catalan,1814-1894)的名字来命名,该数列的通项被称为第个Catalan数,其通项公式为.在组合数学中,有如下结论:由个和个构成的所有数列,中,满足“对任意,都有”的数列的个数等于.
已知在数轴上,有一个粒子从原点出发,每秒向左或向右移动一个单位,且向左移动和向右移动的概率均为.
(1)设粒子第3秒末所处的位置为随机变量(若粒子第一秒末向左移一个单位,则位置为;若粒子第一秒末向右移一个单位,则位置为1),求的分布列和数学期望;
(2)记第秒末粒子回到原点的概率为.
(i)求及;
(ii)设粒子在第秒末第一次回到原点的概率为,求.
【典例13-2】定义:由个数(;)排成的行列数表称方阵,其中为方阵中第行第列的数.现有方阵,通过变换将变换为(例如通过可将变换为),其中为中第行第列的数,,.
(1)经过变换为,求;
(2)设集合,都有,首次变换满足,记.
①求,;
②若,从集合中任取个数,表示两数都为奇数的概率,证明:.
高等背景下的概统问题,综合性较强,主要有以下类型:
1、马尔科夫链背景命题.
2、马尔科夫不等式与切比雪夫不等式背景命题.
3、最大似然估计背景命题.
4、卡兰特数背景命题
5、逻辑斯蒂方程背景命题
6、二维离散型随机变量背景命题
7、布尔代数背景命题
8、假设检验原理背景命题
【变式13-1】在概率论和统计学中用协方差来衡量两个变量的总体误差,对于离散型随机变量,定义协方差为.将号码分别为1,2,3,4的4个小球等可能地放入号码分别为1,2,3,4的4个盒子中,每个盒子恰好放1个小球.
(1)求1号球不在1号盒子中,且2号球不在2号盒子中的概率;
(2)记所放小球号码与盒子号码相同的个数为,不同的个数为,求证:;
(3)结合实例,解释协方差的实际含义.
1.母函数(又称生成函数)就是一列用来展示一串数字的挂衣架.这是数学家赫伯特·维尔夫对母函数的一个形象且精妙的比喻.对于任意数列,即用如下方法与一个函数联系起来:,则称是数列的生成函数.例如:求方程的非负整数解的个数.设此方程的生成函数为,其中x的指数代表的值.,则非负整数解的个数为.若,则,可得,于是可得函数的收缩表达式为:.故(广义的二项式定理:两个数之和的任意实数次幂可以展开为类似项之和的恒等式)则根据以上材料,解决下述问题:定义“规范01数列”如下:共有项,其中m项为0,m项为1,且对任意,,不同的“规范01数列”个数记为.
(1)判断以下数列是否为“规范01数列”;
①0,1,0,1,0,1;②0,0,1,1,1,0,0,1;③0,1,0,0,0,1,1,1.
(2)规定,计算,,,的值,归纳数列的递推公式;
(3)设数列对应的生成函数为
①结合与之间的关系,推导的收缩表达式;
②求数列的通项公式.
21世纪教育网(www.21cnjy.com)
同课章节目录