则当a在(0,1)内增大时,( )
A.D(X)增大
B.D(X)减小
C.D(X)先增大后减小
D.D(X)先减小后增大
D
链高考7.(2024新高考Ⅰ,9)为了解某种植区推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值 =2.1,样本方差s2=0.01.已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N( ,s2),则( )
(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
BC
解析 由题意知,X~N(1.8,0.12),Y~N(2.1,0.12).∵P(X<1.8+0.1)≈0.841 3,
∴P(X>1.8+0.1)≈1-0.841 3=0.158 7,
∴P(X>2)=P(X>1.8+2×0.1)1.8+0.1)≈0.158 7,故A错误; P(X>2)
1.8)=0.5,故B正确;
∵P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3,故C正确,D错误.
故选BC.
考点一 排列与组合问题
例1(多选题)(2024山西晋中模拟)某中学的3名男生和2名女生参加数学竞赛,比赛结束后,这5名同学排成一排合影留念,则下列说法正确的是( )
A.若要求2名女生相邻,则这5名同学共有48种不同的排法
B.若要求女生与男生相间排列,则这5名同学共有24种排法
C.若要求2名女生互不相邻,则这5名同学共有72种排法
D.若要求男生甲不在排头也不在排尾,则这5名同学共有72种排法
ACD
[对点训练1](1)(2024浙江杭州二模)将5名志愿者分配到三个社区协助开展活动,每名志愿者至少去一个社区,每个社区至少1名志愿者,则不同的分配方法数是( )
A.300 B.240 C.150 D.50
C
(2)(多选题)(2024山东潍坊模拟)甲、乙、丙、丁、戊五人并排站成一排,下列说法正确的是( )
A.如果甲、乙必须相邻且乙在甲的右边,那么不同的排法有24种
B.最左端只能排甲或乙,最右端不能排甲,则不同的排法共有42种
C.甲、乙不相邻的排法种数为82
D.甲、乙、丙按从左到右的顺序排列的排法有20种
ABD
考点二 二项式定理
例2(1)(2024河北廊坊模拟) (n∈N*)的展开式中只有第4项的二项式系数最大,则展开式中的常数项为( )
A.-160 B.-20 C.20 D.160
A
(2)(多选题)(2024广东佛山模拟)
若(x-1)6=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6,则( )
A.a0=1
B.a3=20
C.2a1+4a2+8a3+16a4+32a5+64a6=0
D.|a0+a2+a4+a6|=|a1+a3+a5|
ACD
解析 将x=0代入(x-1)6=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6,得(0-1)6=a0,解得a0=1,故A正确;
(x-1)6的展开式的通项为Tk+1= x6-k(-1)k,令6-k=3,得k=3,
所以a3= (-1)3=-20,故B错误;
将x=2代入(x-1)6=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6,得(2-1)6 =a0+2a1+4a2+8a3+16a4+32a5+64a6,所以2a1+4a2+8a3+16a4+32a5+64a6=0,故C正确;
将x=1代入(x-1)6=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6,得
(1-1)6=a0+a1+a2+a3+a4+a5+a6,即a0+a1+a2+a3+a4+a5+a6=0,①
将x=-1代入(x-1)6=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6,得(-1-1)6=a0-a1+a2-a3+a4-a5+a6,即a0-a1+a2-a3+a4-a5+a6=64,②
①+②得2(a0+a2+a4+a6)=64,所以a0+a2+a4+a6=32,①-②得2(a1+a3+a5)
=-64,所以a1+a3+a5=-32,所以|a0+a2+a4+a6|=|a1+a3+a5|,故D正确.故选ACD.
[对点训练2](1)(2024浙江金丽衢十二校一模)(1+x-y)5的展开式中含x2y的项的系数为( )
A.30 B.-30 C.10 D.-10
B
(2)(2024山东菏泽模拟)(x2+ax-1)(1-x)6的展开式中含x2的项的系数是-2,则实数a的值为( )
A.0 B.3 C.-1 D.-2
D
考点三 古典概型
例3“春雨惊春清谷天,夏满芒夏暑相连;秋处露秋寒霜降,冬雪雪冬小大寒”中每句的开头一字代表着季节,每一句诗歌包含了这个季节中的6个节气.若从24个节气中任选2个节气,则这2个节气恰好不在一个季节的概率
为 .
解析 我们用A1,A2,…,A6表示春季的6个节气,用B1,B2,…,B6表示夏季的6个节气,用C1,C2,…,C6表示秋季的6个节气,用D1,D2,…,D6表示冬季的6个节气,则试验的样本空间Ω={(A1,A2),(A1,A3),…,(A1,A6),(A1,B1),(A1,B2),…,(A1,B6), (A1,C1),(A1,C2),…,(A1,C6),(A1,D1),(A1,D2),…,(A1,D6),(A2,A3),(A2,A4),…,
(A2,D6),(A3,A4),…,(A3,D6),…,(D5,D6)},共 =276(个)样本点,且每个样本点都是等可能的,所以这是一个古典概型.
(方法一)设事件A=“这2个节气恰好不在一个季节”,则A={(A1,B1),(A1,B2),…, (A1,D6),(A2,B1),(A2,B2),…,(A2,D6),…,(A6,D6),(B1,C1),(B1,C2),…,(B1,D6),…,
(B6,D6),(C1,D1),(C1,D2),…,(C1,D6),…,(C6,D6)},
(方法二)设事件A=“这2个节气恰好不在一个季节”,B=“这2个节气恰好在一个季节”,则B={(A1,A2),(A1,A3),…,(A1,A6),(B1,B2),(B1,B3),…,(B1,B6),(C1,C2),(C1,C3),…,
(C1,C6),(D1,D2),(D1,D3),…,(D1,D6)},
延伸探究
在本例条件下,若从24个节气中任选3个节气,求这3个节气恰好在一个季节的概率.
[对点训练3](2023全国甲,文4)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为( )
解析 我们用A,B表示高一年级的2名学生,用C,D表示高二年级的两名学生,则试验的样本空间Ω={(A,B),(A,C),(A,D),(B,C),(B,D),(C,D)},共有6个样本点,且每个样本点都是等可能的,所以这是一个古典概型.
设事件A=“这2名学生来自不同年级”,则A={(A,C),(A,D),(B,C),(B,D)},则n(A)=4,所以所求概率
D
考点四 条件概率与全概率公式(多考向探究预测)
考向1条件概率
例4从装有3个红球和4个蓝球的袋中,每次不放回地随机摸出一球.设A=“第一次摸球时摸到红球”,B=“第二次摸球时摸到蓝球”,则P(B|A)= .
增分技巧
条件概率的三种求法
考向2全概率公式
C
[对点训练4](1)(2023全国甲,理6)某地的中学生中有60%的同学爱好滑冰, 50%的同学爱好滑雪,70%的同学爱好滑冰或爱好滑雪.在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为( )
A.0.8 B.0.6 C.0.5 D.0.4
A
(2)(多选题)某儿童乐园有甲、乙两家游乐场,小王同学第一天去甲、乙两家游乐场游玩的概率分别为0.4和0.6.如果他第一天去甲游乐场,那么第二天去甲游乐场的概率为0.6;如果他第一天去乙游乐场,那么第二天去甲游乐场的概率为0.5,则小王同学( )
A.第二天去甲游乐场的概率为0.54
B.第二天去乙游乐场的概率为0.44
C.第二天去了甲游乐场,则第一天去乙游乐场的概率为
D.第二天去了乙游乐场,则第一天去甲游乐场的概率为
AC
解析 设事件A1=“小王同学第一天去甲游乐场”,事件A2=“小王同学第二天去甲游乐场”,事件B1=“小王同学第一天去乙游乐场”,事件B2=“小王同学第二天去乙游乐场”,则P(A1)=0.4,P(B1)=0.6,P(A2|A1)=0.6,P(A2|B1)=0.5,所以P(A2)=P(A1)P(A2|A1)+P(B1)P(A2|B1)=0.4×0.6+0.6×0.5=0.54,故选项A正确;
因为P(B2)=1-P(A2)=0.46,故选项B不正确;(共44张PPT)
第2讲 统计与成对数据的统计分析
考点一 用样本估计总体
例1(多选题)(2024湖北黄石模拟)随着互联网的发展,网上购物几乎成为人们日常生活中不可或缺的一部分,这也使得快递行业市场规模呈现出爆发式的增长.陈先生计划在家所在的小区内开一家快递驿站,为了确定驿站规模的大小,他统计了隔壁小区的甲驿站和乙驿站一周的日收件量(单位:件),得到折线图如图,则下列说法正确的是( )
A.乙驿站一周的日收件量的极差为80
B.甲驿站日收件量的中位数为160
C.甲驿站日收件量的平均值大于乙驿站的日收件量的平均值
D.甲驿站和乙驿站的日收件量的方差分别记为
答案 BC
解析 乙驿站一周的日收件量的极差为160-40=120,故A错误;
甲驿站日收件量从小到大排列为:130,150,160,160,180,190,200,所以中位数为160,故B正确;
由题图可知甲驿站日收件量每天都比乙驿站的日收件量多,所以甲驿站日收件量的平均值大于乙驿站的日收件量的平均值,故C正确;
由题图可知甲驿站日收件量的波动比乙驿站的日收件量的波动小,所以
,故D错误.故选BC.
[对点训练1](多选题)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:min),得到下列两个频率分布直方图.基于以上统计信息,可知( )
A.骑车时间的中位数的估计值是22
B.坐公交车时间的40%分位数的估计值是19
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.骑车时间小于平均数的估计值的次数少于50
答案 BC
解析 对于A,因为0.1×2=0.2,(0.1+0.2)×2=0.6,所以中位数落在区间[20,22)内,设骑车时间的中位数为a,则0.1×2+0.2(a-20)=0.5,解得a=21.5,故骑车时间的中位数的估计值是21.5,故A错误;
对于B,因为(0.025+0.05+0.075)×2=0.3,0.3+0.1×2=0.5,所以40%分位数落在区间[18,20)内,设坐公交车时间的40%分位数为b,则0.3+0.1×(b-18)=0.4,解得b=19,故坐公交车时间的40%分位数的估计值是19,故B正确;
对于C,坐公交车时间的平均数的估计值
=13×0.025×2+15×0.05×2+17×0.075×2+19×0.1×2+21×0.1×2
+23×0.075×2+25×0.05×2+27×0.025×2=20,
骑车时间的平均数的估计值
=19×0.1×2+21×0.2×2+23×0.15×2+25×0.05×2=21.6.
因为 ,所以坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,故C正确;
对于D,因为0.1×2+0.2×(21.6-20)=0.52,所以骑车时间小于平均数的估计值的频率为0.52,所以骑车时间小于平均数的估计值的次数为0.52×100=52,故D错误.故选BC.
考点二 回归分析(多考向探究预测)
考向1线性回归分析
例2(2024湖北武汉模拟)随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,在直播带货领域得到使用.某公司使用虚拟角色直播带货的销售金额逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.
年月 2023年8月 2023年9月 2023年10月 2023年11月 2023年12月 2024年1月
月份编号x 1 2 3 4 5 6
销售金额 y/万元 15.4 25.4 35.4 85.4 155.4 195.4
若y与x的相关关系拟用线性回归模型表示,回答如下问题:
(1)试求变量y与x的样本相关系数r(结果精确到0.01);
(2)试求y关于x的经验回归方程,并据此预测2024年2月该公司的销售金额(结果精确到0.1).
[对点训练2]“城市公交”泛指城市范围内定线运营的公共汽车及轨道交通等交通方式.某城市的公交公司为了方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设了起点站,为了研究车辆发车间隔时间x与乘客等候人数y之间的关系,经过调查得到如下数据:
编号i 1 2 3 4 5
间隔时间xi/min 6 8 10 12 14
等候人数yi 15 18 20 24 23
(1)易知可用一元线性回归模型描述y与x的关系,请用样本相关系数加以说明;
(2)建立y关于x的经验回归方程,并预测车辆发车间隔时间为20 min时乘客的等候人数.
因为|r|接近1,所以y与x的线性相关程度非常高,所以可以用一元线性回归模型描述y与x的关系.
考向2非线性回归分析
例3(2024辽宁沈阳模拟)土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土壤生态系统中,由于提供能源的有机物被分解的难易程度不同,这两条途径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应;以真菌途径为主的土壤,氮和能量转化比较缓慢,有利于有机质存储和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组数据,如下表所示:
编号i 1 2 3 4 5 6 7 8
细菌xi/百万个 70 80 90 100 110 120 130 140
真菌yi/百万个 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0
其散点图如下,散点大致分布在指数型函数y=aebx(a>0)的图象附近.
(1)求y关于x的经验回归方程(参数精确到0.001);
(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体分布的概率,若该实验小组从8组数据任选4组,记真菌数yi(单位:百万个)与细菌数xi(单位:百万个)的比值位于区间(0.13,0.20)内的组数为X,求X的分布列与数学期望.
(2)由已知图表可知从第1组到第8组的真菌数yi(单位:百万个)与细菌数xi(单位:百万个)的比值依次
用表格表示X的分布列为
[对点训练3](2024陕西安康模拟)随着移动互联网和直播技术的发展,直播带货已经成为一种热门的销售方式.下面统计了某产品通过直播带货途径从6月份到10月份每个月的销售量yi(单位:万件)(i=1,2,3,4,5)的数据,得到如图所示的散点图.其中6月份至10月份的月份代码为xi(i=1,2,3,4,5),如:x1=1表示6月份.
(1)根据散点图判断,模型①y=a+bx与模型②y=c+dx2哪一个更适宜描述月销售量y与月份代码x的关系 (给出判断即可,不必说明理由)
(2)(ⅰ)根据(1)的判断结果,建立y关于x的经验回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份该产品的销售量.
解 (1)由散点图可知该产品每个月的销售量的增加幅度不一致,散点图非线性,结合图象故选模型②y=c+dx2.
考点三 独立性检验
例4(2023全国甲,理19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;
(2)试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5
18.0 18.8 19.2 19.8 20.2 21.6 22.8
23.6 23.9 25.1 28.2 32.3 36.5
(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
分组 对照组
试验组
(ⅱ)根据(ⅰ)中的列联表,依据小概率值α=0.05的χ2独立性检验,能否推断小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
(2)(ⅰ)将40只小白鼠体重的增加量从小到大排列,得7.8,9.2,11.4,12.4,13.2,15.2,15.5,16.5,18.0,18.8,18.8,19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,23.9,25.1,25.8,26.5,27.5,28.2,30.1,32.3,32.6,34.3,34.8,35.6,35.6,35.8,36.2,36.5,37.3,40.5,43.2,所以
列联表为
分组 对照组 6 14
试验组 14 6
(ⅱ)零假设为H0:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量没有差异.
根据列联表中的数据,经计算得到
根据小概率值α=0.05的χ2独立性检验,我们推断H0不成立,即认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异,此推断犯错误的概率不大于0.05.
[对点训练4](2024江苏徐州一模)某中学对该校学生的学习兴趣和预习情况进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类,设事件A=“学习兴趣高”, =“学习兴趣一般”,事件B=“主动预习”,
(1)计算P(A)和P(A|B)的值,并判断A与B是否为独立事件;
(2)为验证学生的学习兴趣与预习情况是否有关,该校用分层抽样的方法抽取了一个容量为m(m∈N*)的样本,利用χ2独立性检验,计算得到χ2=1.350.为提高检验结论的可靠性,现将样本容量调整为原来的t(t∈N*)倍,使得根据小概率值α=0.005的独立性检验,可以认为学生的学习兴趣与预习情况有关,试确定t的最小值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
(2)零假设为H0:学生的学习兴趣与预习情况无关.
假设原列联表为
预习情况 学习兴趣 合计
兴趣高 兴趣一般 主动预习 a b a+b
不太主动预习 c d c+d
合计 a+c b+d a+b+c+d
将样本容量调整为原来的t(t∈N*)倍,则新的列联表为
预习情况 学习兴趣 合计
兴趣高 兴趣一般 主动预习 ta tb t(a+b)
不太主动预习 tc td t(c+d)
合计 t(a+c) t(b+d) t(a+b+c+d)
根据列联表中的数据,经计算得到
因为根据小概率值α=0.005的独立性检验,可以推断H0不成立,
即学生的学习兴趣与预习情况有关,
所以1.35t≥x0.005=7.879,
解得t≥5.84.
又t∈N*,所以t的最小值为6.(共19张PPT)
培优拓展(十三)概率与数列
概率统计与数列的交汇涉及的知识广泛,内涵丰富,是近年来高考命题的热点,主要有以下类型:(1)求数列的通项公式;(2)证明数列是等比数列或等差数列;(3)与数列求和相结合;(4)利用等差数列、等比数列的性质,研究单调性、最值等.
角度一 概率与数列的证明、通项公式问题
例1(2024河北石家庄模拟)甲、乙两口袋中各装有1个黑球和2个白球,现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复进行n(n∈N*)次这样的操作,记第n次操作后,口袋甲中黑球的个数为Xn,恰有1个黑球的概率为pn.
(1)求p1,p2的值;
(2)证明: 是等比数列,并求pn的值(用n表示);
(3)证明:Xn的数学期望E(Xn)为定值.
(1)解 设第n次操作后,口袋甲中恰有2个黑球的概率为qn,则恰有0个黑球的概率为1-pn-qn.
所以Xn的分布列为
[对点训练1](2024山东聊城一模)如图,一个正三角形被分成9个全等的三角形区域,分别记作A,B1,P,B2,C1,Q1,C2,Q,C3.一个机器人从区域P出发,每经过1秒都从一个区域走到与之相邻的另一个区域(有公共边的区域),且到不同相邻区域的概率相等.
(1)分别写出经过2秒和3秒机器人所有可能位于的区域;
(2)求经过2秒机器人位于区域Q的概率;
(3)求经过n秒机器人位于区域Q的概率.
解 (1)经过2秒机器人可能位于的区域为P,Q1,Q,
经过3秒机器人可能位于的区域为A,B1,B2,C1,C2,C3.
(2)若经过2秒机器人位于区域Q,则经过1秒时,机器人必定位于区域B2,
(3)机器人的运动路径为P→A∪B1∪B2→P∪Q1∪Q→A∪B1∪B2∪C1∪C2∪C3→P∪Q1∪Q→A∪B1∪B2∪C1∪C2∪C3→P∪Q1∪Q→…,
设经过n秒机器人位于区域Q的概率为Pn,则当n为奇数时,Pn=0.
当n为偶数时,由对称性可知,经过n秒机器人位于区域Q的概率与位于区域Q1的概率相等,均为Pn,故经过n秒机器人位于区域P的概率为1-2Pn.
角度二 概率与数列的求和问题
例2(2024黑龙江哈尔滨一模)为调查某地景区的客流量情况,现对某一时间段A景区的部分游客作问卷调查,经统计,其中75%的游客计划只游览A景区,另外25%的游客计划既游览A景区又游览B景区.为提高游客的旅游热情,景区将为游客发放文旅纪念品,每位游客若只游览A景区,则得到1份文旅纪念品;若既游览A景区又游览B景区,则获得2份文旅纪念品.假设每位游客游览A景区与是否游览B景区是相互独立的,用频率估计概率.
(1)从A景区的游客中随机抽取3人,记这3人获得文旅纪念品的总个数为X,求X的分布列及数学期望;
(2)从A景区的游客中随机抽取n人,记这n个游客得到文旅纪念品的总个数恰为n+1个的概率为an,求{an}的前n项和Sn;
(3)从A景区的游客中随机抽取100人,这些游客得到纪念品的总个数恰为m个的概率为bm,当bm取最大值时,求m的值.
所以X的分布列为
[对点训练2](2024江苏扬州模拟)某公司开发了一款学习类的闯关益智游戏,每一关的难度分别有Ⅰ,Ⅱ,Ⅲ三级,并且下一关的难度与上一关的难度有关,若上一关的难度是Ⅰ或者Ⅱ,则下一关的难度依次是Ⅰ,Ⅱ,Ⅲ的概率
分别为 ,若上一关的难度是Ⅲ,则下一关的难度依次是Ⅰ,Ⅱ,Ⅲ的概率分别为 ,已知第1关的难度为Ⅰ.
(1)求第3关的难度为Ⅲ的概率;
(2)用Pn表示第n关的难度为Ⅲ的概率,求Pn;
(3)设 (n≥2),记f(n)=a2+a3+…+an,且f(n)≥λ对任意n≥2,n∈N*恒成立,求实数λ的最大值.(共18张PPT)
培优拓展(十四)概率统计与函数、导数
概率统计与函数、导数交汇问题也是高考命题的一个热点,属于综合性较强的试题,题目多以概率统计的实际应用为主体,在涉及求概率、期望的最值或范围问题时,需要用导数或函数的方法解决,难度较大.
角度一 概率统计与函数的综合
例1(2023新高考Ⅱ,19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
解 (1)当p(c)=0.5%时,由患病者频率分布直方图可得第一个小矩形面积为0.002×5=0.01,
由未患病者频率分布直方图可得
q(c)=0.01×(100-97.5)+0.002×5=0.035=3.5%.
(2)当c∈[95,100)时,p(c)=(c-95)×0.002,q(c)=(100-c)×0.01+0.01,
∴f(c)=-0.008c+0.82>0.02;
当c∈[100,105]时,p(c)=5×0.002+(c-100)×0.012,q(c)=(105-c)×0.002, ∴f(c)=0.01c-0.98≥0.02.
故当c=100时,f(c)取最小值,最小值为f(100)=0.02.
角度二 概率统计与导数的综合
例2(2024河南三门峡模拟)为了普及奥运知识,M大学举办了一次奥运知识竞赛,竞赛分为初赛与决赛,初赛通过后才能参加决赛.
(1)初赛从6道题中任选2题作答,2题均答对则进入决赛.已知这6道题中小王能答对其中4道题,用X表示小王在初赛中答对的题目个数,求X的数学期望以及小王在已经答对1道题的前提下,仍未进入决赛的概率;
(2)M大学为鼓励大学生踊跃参赛并取得佳绩,对进入决赛的参赛大学生给予一定的奖励.奖励规则如下:已进入决赛的参赛大学生允许连续抽奖3次,中奖1次奖励120元,中奖2次奖励180元,中奖3次奖励360元,若3次均未中奖,则只奖励60元.假定每次抽奖中奖的概率均为p(0(ⅰ)记一名进入决赛的大学生恰好中奖1次的概率为f(p),求f(p)的极大值;
(ⅱ)M大学数学系共有9名大学生进入了决赛,若这9名大学生获得的总奖金的期望值不小于1 120元,试求此时p的取值范围.
针对训练
1.(2024浙江杭州模拟)为选拔培养对象,某高校在暑假期间从中学里挑选优秀学生参加数学、物理、化学学科夏令营活动.
(1)若数学组的7名学员中恰有3人来自A中学,从这7名学员中选取3人,用ξ表示选取的人中来自A中学的人数,求ξ的分布列和数学期望;
(2)在夏令营开幕式的晚会上,物理组举行了一次学科知识竞答活动,规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利.已知甲、乙两名同学组成一组,甲、乙答对每道题的概率分别为p1,p2.假设甲、乙两人每次答题相互独立,且互不影响.当p1+p2= 时,求甲、乙两名同学在每轮答题中取胜的概率的最大值.
解 (1)由题可知,ξ服从超几何分布,且N=7,M=3,n=3.
(2)用χ表示甲答对题数,由题可知χ~B(2,p1);
用η表示乙答对题数,由题可知η~B(2,p2).设A=“甲、乙两位同学在每轮答题中取胜”,
2.(2024江苏南通模拟)“踩高跷,猜灯谜”是我国元宵节传统的文化活动.某地为了弘扬文化传统,在元宵节举办形式多样的猜灯谜活动.
(1)某商户借“灯谜”活动促销,将灯谜按难易度分为B,C两类,抽到B类灯谜并答对,则购物打八折优惠;抽到C类灯谜并答对,则购物打七折优惠.抽取灯谜规则如下:在一不透明的纸箱中有8张完全相同的卡片,其中3张写有A字母,3张写有B字母,2张写有C字母,顾客每次不放回地从箱中随机取出1张卡片,若取到写有A的卡片,则再取1次,直至取到写有B或C的卡片为止,求该顾客取到写有B的卡片的概率.
(2)小明尝试去找全街最适合他的灯谜,规定只能取一次,并且只可以向前走,不能回头,他在街道上一共会遇到n条灯谜(不妨设每条灯谜的适合度各不相同),最适合的灯谜出现在各个位置上的概率相等,小明准备采用如下策略:不取前k(1≤k①若n=4,k=2,求P;
②当n趋向于无穷大时,从理论的角度,求P的最大值及P取最大值时t的值.
解 (1)设M=“该顾客取到写有B的卡片”,则由题可知
(2)①设A=“小明摘到那条最适合的灯谜”.
由题可知,试验的样本空间包含的样本点个数为n(Ω)= =24,且每个样本点都是等可能的.
要摘到最适合的灯谜,有以下两种情况:
最适合的灯谜是第3条,其他的灯谜随意在哪个位置,有 =6(种)情况;
最适合的灯谜是最后1条,第二适合的灯谜是第1条或第2条,其他的灯谜随意在哪个位置,有 =4(种)情况,所以n(A)=6+4=10,所以
②设Bj=“最适合的灯谜排在第j条”(j=1,2,…,n),
因为最适合的灯谜出现在各个位置上的概率相等,(共34张PPT)
专题突破练17 计数原理与概率
1
2
3
4
5
6
7
8
9
10
11
12
主干知识达标练
13
14
15
16
17
1.(2023北京,5) 的展开式中含x的项的系数为( )
A.-80 B.-40 C.40 D.80
D
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2.(2024山东聊城模拟)三名男同学和两名女同学随机站成一列,则两名女同学相邻的概率是( )
B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
3.(2024广东湛江二模)已知(1-2x)9=a0+a1x+…+a9x9,则a0+ ai=( )
A.-2 B.-19 C.15 D.17
D
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
5.有5名志愿者参加社区服务,共服务星期六、星期日两天,每天从中任选2人参加服务,则恰有1人连续参加两天服务的选择种数为( )
A.120 B.60
C.40 D.30
B
解析 (方法一)先在5名志愿者中安排1名在这两天都参加社区服务,有5种安排方法,再在星期六、星期日,每天从剩下的4名志愿者中安排1名不同的志愿者参加社区服务,有4×3=12(种)安排方法.由分步乘法计数原理得恰有1人在这两天都参加的不同的安排方法共有5×12=60(种).
(方法二)在5名志愿者中安排2名在星期六参加社区服务,有 =10(种)安排方法.再从星期六参加社区服务的2名志愿者中安排1名及从剩下的3名志愿者中安排1名在星期日参加社区服务,有2×3=6(种)安排方法.由分步乘法计数原理得恰有1人在这两天都参加的不同的安排方法共有10×6=60(种).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
B.各项系数的和是64
C.第4项的二项式系数最大
D.奇数项的二项式系数的和是32
ACD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
7.(多选题)某班星期一上午要安排语文、数学、英语、物理4节课,且该天上午总共4节课,下列结论正确的是( )
A.若数学课不安排在第一节,则有18种不同的安排方法
B.若语文课和数学课必须相邻,且语文课排在数学课前面,则有6种不同的安排方法
C.若语文课和数学课不能相邻,则有12种不同的安排方法
D.若语文课、数学课、英语课按从前到后的顺序安排,则有3种不同的安排方法
ABC
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
8.(5分)(2024甘肃定西一模)已知某厂甲、乙两车间生产同一批衣架,且甲、乙两车间的产量分别占全厂产量的60%,40%,甲、乙车间的优品率分别为95%,90%.现从该厂这批产品中任取一件,则取到优品的概率为 .(用百分数表示)
93%
解析 从该厂这批产品中任取一件,设A1=“取到的产品由甲车间生产”, A2=“取到的产品由乙车间生产”,B=“取到的产品为优品”.
由题可得P(A1)=0.6,P(A2)=0.4,P(B|A1)=0.95,P(B|A2)=0.9,
故P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)=0.6×0.95+0.4×0.9=0.93=93%.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
9.(5分)(2023新高考Ⅰ,13)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有 种(用数字作答).
64
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
关键能力提升练
10.(2024山东临沂一模)将1到30这30个正整数分成甲、乙两组,每组各15个数,使得甲组的中位数比乙组的中位数小2,则不同的分组方法数是( )
B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
解析 因为甲组、乙组均为15个数,所以其中位数也均为从小到大排列的第8个数,即各组小于中位数的有7个数,大于中位数的也有7个数.因为甲组的中位数比乙组的中位数小2,所以甲组的中位数和乙组的中位数中间有1个数,所以小于甲组的中位数的数至少有7×2-1=13(个),至多有7×2=14(个),所以甲组的中位数为14或15.
若甲组的中位数为14,则乙组的中位数为16,15一定在乙组,此时从1~13中选7个数放到甲组,剩下的6个数放到乙组,再从17~30中选7个数放到甲组,剩下的7个数放到乙组,此时有 种分组方法;
若甲组的中位数为15,则乙组的中位数为17,16一定在甲组,此时从1~14中选7个数放到甲组,剩下的7个数放到乙组,再从18~30中选6个数放到甲组,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
11.(多选题)(2024广东广州一模)甲箱中有3个红球和2个白球,乙箱中有2个红球和2个白球(两箱中的球除颜色外没有其他区别),先从甲箱中随机取出一球放入乙箱,分别用事件A1和A2表示从甲箱中取出的球是红球和白球;再从乙箱中随机取出两球,用事件B表示从乙箱中取出的两球都是红球,则( )
ABD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
12.(2024山东济南一模)某公司现有员工120人,在荣获“优秀员工”称号的85人中,有75人是高级工程师,既没有荣获“优秀员工”称号又不是高级工程师的员工共有14人,公司将随机选择一名员工接受电视新闻节目的采访,被选中的员工是高级工程师的概率为( )
C
解析 由题意得,试验的样本空间Ω的样本点总数为120,即n(Ω)=120.
每个样本点都是等可能的,所以这是一个古典概型.
设事件A=“被选中的员工是高级工程师”,则n(A)=120+75-85-14=96,所以所求概率为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
13.(多选题)(2024山东日照一模)从标有1,2,3,…,8的8张卡片中有放回地抽取两次,每次抽取一张,依次得到数字a,b,记点A(a,b),B(1,-1),O(0,0),则( )
ACD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
解析 由题可知点A位于第一象限.
用图表表示点A的坐标,如图.
a b 1 2 3 4 5 6 7 8
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (1,7) (1,8)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (2,7) (2,8)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (3,7) (3,8)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (4,7) (4,8)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (5,7) (5,8)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) (6,7) (6,8)
7 (7,1) (7,2) (7,3) (7,4) (7,5) (7,6) (7,7) (7,8)
8 (8,1) (8,2) (8,3) (8,4) (8,5) (8,6) (8,7) (8,8)
可以得到,试验的样本空间包含的样本点的个数为n(Ω)= =64,且每个样本点都是等可能的,所以这是一个古典概型.
对于A,如图,设直线l过点O,且与OB垂直,因为
kOB=-1, 所以l:y=x,所以当a1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
对于B,如图,设直线m过点B,且与OB垂直,所以l:y+1=x-1,即l:y=x-2,所以当b=a-2时,∠ABO是直角.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
对于C,如图,若△AOB为锐角三角形,则点A位于直线l和m之间,由题易知点A位于直线y=x-1上,所以当b=a-1时,△AOB为锐角三角形.设C=“△AOB为锐角三角形”,则n(C)=7,所以
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
14.(多选题)(2024山东济南一模)下列等式中正确的是( )
BCD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
16.(5分)(2024河北邢台模拟)将1,2,3,…,9这9个数填入如图所示的格子中(要求每个数都要填入,每个格子中只能填一个数),记第1行中最大的数为a,第2行中最大的数为b,第3行中最大的数为c,则a60 480
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
核心素养创新练
17.(17分)(2024江苏苏州模拟)在一个抽奖游戏中,主持人从编号为1,2,3,4的四个外观相同的空箱子中随机选择一个,放入一件奖品,再将四个箱子关闭.主持人知道奖品在哪个箱子里.游戏规则是主持人请抽奖人在这四个箱子中选择一个,若奖品在此箱子里,则奖品由获奖人获得.现有抽奖人甲选择了2号箱,在打开2号箱之前,主持人先打开了另外三个箱子中的一个空箱子.按游戏规则,主持人将随机打开甲的选择之外的一个空箱子.
(1)计算主持人打开4号箱的概率;
(2)当主持人打开4号箱后,现在给抽奖人甲一次重新选择的机会,请问他是坚持选2号箱,还是改选1号或3号箱 (以获得奖品的概率最大为决策依据)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
解 (1)设Ai=“i号箱里有奖品”(i=1,2,3,4),B=“主持人打开4号箱”,则Ω=A1∪A2∪A3∪A4,且A1,A2,A3,A4两两互斥.
由题意可知,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17(共20张PPT)
专题突破练18 统计与成对数据的统计分析
1
2
3
4
5
6
主干知识达标练
1.(多选题)某学校共有2 000名男生,为了解这部分学生的身体发育情况,学校抽查了其中100名男生的体重情况.根据所得样本数据绘制的频率分布直方图如图所示,则( )
A.样本数据的众数的估计值为67.5
B.样本数据的80%分位数的估计值为72.5
C.样本数据的平均数的估计值为66
D.该校男生中低于60 kg的人数大约为300
ABD
1
2
3
4
5
6
解析 对于A,在频率分布直方图中,体重在区间[65,70)内的学生最多,所以样本数据的众数的估计值为67.5,故A正确;
对于B,因为(0.03+0.05+0.06)×5=0.7,0.7+0.04×5=0.9,所以80%分位数落在区间[70,75)内.设80%分位数为x,则0.7+0.04(x-70)=0.8,解得x=72.5,所以样本数据的80%分位数的估计值为72.5,故B正确;
对于C,样本数据的平均数的估计值为5×57.5×0.03+62.5×0.05+67.5×0.06+72.5×0.04+77.5×0.02=66.75,故C错误;
对于D,被抽到的100名男生中体重低于60 kg的频率为0.03×5=0.15,故可估计该校男生体重低于60 kg的概率为0.15,所以该校男生中低于60 kg的人数大约为
2 000×0.15=300,故D正确.
故选ABD.
1
2
3
4
5
6
2.(多选题)(2024甘肃陇南一模)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
x/年 2 3 4 5 6
y/万元 2.2 3.8 5.5 6.5 7
根据表中的数据可得到经验回归方程为y=1.23x+ ,则( )
A. =0.08
B.y与x的样本相关系数r>0
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元
ABC
1
2
3
4
5
6
1
2
3
4
5
6
3.(多选题)(2024山东德州模拟)进入冬季,哈尔滨旅游火爆全网,下图是一周内哈尔滨冰雪大世界和中央大街日旅游人数的折线图,则( )
A.中央大街日旅游人数的极差是1.2万
B.冰雪大世界日旅游人数的中位数是2.3万
C.冰雪大世界日旅游人数的平均数比中央大街大
D.冰雪大世界日旅游人数的方差比中央大街大
BC
1
2
3
4
5
6
解析 中央大街日旅游人数的最大值为2.8万,最小值为0.9万,所以极差为1.9万,故A错误;
冰雪大世界日旅游人数由小到大依次为1.7,1.8,1.9,2.3,2.4,2.6,2.9,所以其中位数为2.3,故B正确;
1
2
3
4
5
6
1
2
3
4
5
6
4.(17分)(2023全国乙,理17)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为,样本方差为s2.
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
关键能力提升练
5.(多选题)(2024广东汕头一模)某次考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析学生的成绩分布情况,计算得到这100名学生中,成绩位于[80,90)内的学生成绩的方差为12,成绩位于[90,100]内的学生成绩的方差为10.则( )
A.a=0.004
B.估计该年级学生成绩的中位数为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.5
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
答案 BCD
1
2
3
4
5
6
1
2
3
4
5
6
解析 对于A选项,在频率分布直方图中,所有直方图的面积之和为1,则(2a+3a+7a+6a+2a)×10=200a=1,解得a=0.005,故A错误;
对于B选项,因为(2a+3a)×10=50a=0.25,0.25+7a×10=0.6,所以这100名学生成绩的中位数落在区间[70,80)内.
设这100名学生成绩的中位数为m,则0.25+(m-70)×7×0.005=0.5,解得
m= 77.14,所以这100名学生成绩的中位数的估计值为77.14,所以估计该年级学生成绩的中位数为77.14,故B正确;
1
2
3
4
5
6
1
2
3
4
5
6
6.(17分)(2024安徽芜湖二模)据新华社北京2月26日报道,2024年中国航天预计实施100次左右发射任务,有望创造新的纪录.我国首个商业航天发射场将迎来首次发射任务,多个卫星星座将加速组网建设.由于航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下.
飞行距离x/km 56 63 71 79 90 102 110 117
损坏零件数y/个 61 73 90 105 119 136 149 163
1
2
3
4
5
6
(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成2×2列联表,并根据小概率值α=0.01的独立性检验,判断推进器是否报废与保养情况是否有关.
(1)建立y关于x的一元线性回归模型,根据所给数据,求y关于x的经验回归方程 ;(参数精确到0.1)
1
2
3
4
5
6
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
损坏情况 保养情况 合计
保养 未保养 报废 20
未报废
合计 60 100
1
2
3
4
5
6
(2)由题意,报废推进器中保养过的共有20×30%=6(台),未保养的推进器共有20-6=14(台),所以2×2列联表为
损坏情况 保养情况 合计
保养 未保养 报废 6 14 20
未报废 54 26 80
合计 60 40 100
1
2
3
4
5
6
零假设为H0:推进器是否报废与保养情况无关,根据列联表中的数据,经计
根据小概率值α=0.01的χ2独立性检验,我们推断H0不成立,即认为推进器是否报废与保养情况有关,此推断犯错误的概率不大于0.01.(共29张PPT)
专题突破练19 统计与概率解答题
1
2
3
4
5
6
主干知识达标练
1.(17分)(2024山东济宁一模)袋中装有大小相同的4个红球,2个白球.某人进行摸球游戏,游戏规则如下:①每次从袋中摸取一个小球,若摸到红球则放回袋中,充分搅拌后再进行下一次摸取;②若摸到白球或摸球次数达到4次时本轮摸球游戏结束.
(1)求摸球游戏结束时摸球次数不超过3的概率;
(2)若摸出1次红球计1分,摸出1次白球记2分,求游戏结束时,此人总得分X的分布列和数学期望.
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
所以X的分布列为
1
2
3
4
5
6
2.(17分)(2024陕西西安一模)某市为提升中学生的环境保护意识,举办了一次“环境保护知识竞赛”,分预赛和复赛两个环节,预赛成绩排名前三百名的学生参加复赛.已知共有12 000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如图所示的频率分布直方图.
(1)规定预赛成绩不低于80分为优良,若从上述样本中预赛成绩不低于60分的学生中随机地抽取2人,用
X表示其中预赛成绩优良的人数,求至少有1人预赛成绩优良的概率,并求X的分布列及数学期望;
1
2
3
4
5
6
(2)由频率分布直方图可认为该市参加预赛的学生的预赛成绩Z服从正态分布N(μ,σ2),其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且σ2=362,已知小明的预赛成绩为91分,利用该正态分布,估计小明是否有资格参加复赛
附:若Z~N(μ,σ2),则P(μ-σ≤Z≤μ+σ)≈0.682 7,P(μ-2σ≤Z≤μ+2σ)≈0.954 5,
P(μ-3σ≤Z≤μ+3σ)≈0.997 3;
1
2
3
4
5
6
解 (1)根据频率分布直方图可得,抽取的100人中,成绩位于区间[60,80)内的有0.012 5×20×100=25(人),成绩优良(位于区间[80,100)内)的有0.007 5×20×100=15(人),则X服从超几何分布,且N=40,M=15,n=2.
1
2
3
4
5
6
(2)由频率分布直方图可知,样本数据的平均数的估计值为(10×0.005+30×0.01+50×0.015+70×0.012 5+90×0.007 5)×20=53,所以μ=53.
故全市参加预赛的学生中,成绩高于91分的约有12 000×0.022 75=273(人).
因为273<300,所以小明有资格参加复赛.
1
2
3
4
5
6
关键能力提升练
3.(17分)(2024广西南宁模拟)为降低工厂废气排放量,某厂生产甲、乙两种不同型号的减排器,现分别从甲、乙两种减排器中各抽取100件进行性能质量评估检测,综合得分k的频率分布直方图如图所示.
甲型号减排器 乙型号减排器
1
2
3
4
5
6
综合得分k的范围 减排器等级 减排器利润率
k≥85 一级品 2a
75≤k<85 二级品 3a2
70≤k<75 三级品 a2
(1)若从这100件甲型号减排器中按等级用比例分配的分层随机抽样方法抽取10件,再从这10件产品中随机抽取5件,求抽取的5件中至少有3件一级品的概率.
(2)将频率分布直方图中的频率近似地看作概率,用样本估计总体,则
①若从乙型号减排器中随机抽取4件,记X为其中二级品的个数,求X的分布列及数学期望;
②从数学期望来看,投资哪种型号减排器的利润更大
1
2
3
4
5
6
解 (1)根据频率分布直方图可得,抽取的100件甲型号减排器中,综合得分位于区间[85,95]内的频率为0.08×5+0.04×5=0.6,即一级品的频率为0.6,所以从中按等级用比例分配的分层随机抽样方法抽取10件,需要从一级品中抽取10×0.6=6(件).
用Y表示从抽到的10件产品中随机抽取5件,其中一级品的数量,则Y服从超几何分布,且N=10,M=6,n=5.
因此至少有3件一级品的概率为P(Y≥3)=P(Y=3)+P(Y=4)+P(Y=5)
1
2
3
4
5
6
(2)①根据频率分布直方图可得,抽取的100件乙型号减排器中,综合得分位于区间[75,85)内的频率为0.02×5+0.03×5=0.25,
即二级品的频率为0.25,所以可以估计该厂生产的乙型号减排器中,二级品的概率为0.25.
由题可知,X服从二项分布,即X~B(4,0.25),
所以X的分布列为P(X=k)= (0.25)k(0.75)4-k,k=0,1,2,3,4.
X的数学期望为E(X)=4×0.25=1.
1
2
3
4
5
6
②由题可知,甲型号减排器无三级品.
由(1)知,抽取的100件甲型号减排器中,一级品的频率为0.6,二级品的频率为1-0.6=0.4,所以可以估计该厂生产的甲型号减排器中,一级品的概率为0.6,二级品的频率为0.4,所以甲型号减排器的利润率的平均值为E甲=0.6×2a+0.4×3a2=1.2a2+1.2a.根据频率分布直方图可得,抽取的100件乙型号减排器中,综合得分位于区间[70,75)内的频率为0.01×5=0.05,即三级品的频率为0.05,所以可以估计该厂生产的乙型号减排器中,三级品的概率为0.05.
1
2
3
4
5
6
由(2)①知,该厂生产的乙型号减排器中,二级品的概率为0.25,所以一级品的概率为1-0.05-0.25=0.7,所以乙型号减排器的利润率的平均值为E乙=0.7×2a+0.25×3a2+0.05×a2=0.8a2+1.4a.
E甲-E乙=1.2a2+1.2a-(0.8a2+1.4a)=0.4a2-0.2a=0.2a(2a-1).
因为 ,所以E甲-E乙<0,即E甲1
2
3
4
5
6
4.(17分)(2024浙江金丽衢十二校二模)某工厂生产某种元件,其质量按测试指标划分为:指标大于或等于82为合格品,小于82为次品,现抽取100件该元件进行检测,检测结果如下表所示.
测试指标 [20,76) [76,82) [82,88) [88,94) [94,100]
元件数/件 12 18 36 30 4
(1)现从这100件样品中随机抽取2件,若其中一件为合格品,求另一件也为合格品的概率;
(2)关于随机变量,俄罗斯数学家切比雪夫提出切比雪夫不等式:
若随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对任意正数ε,均有
1
2
3
4
5
6
(ⅱ)由切比雪夫不等式可知,即使分布未知,随机变量的取值范围落在期望左右的一定范围内的概率是有界的.若该工厂声称本厂元件合格率为90%,那么根据所给样本数据,请结合切比雪夫不等式说明该工厂所提供的合格率是否可信 (注:当随机事件发生的概率小于0.05时,可称其为小概率事件,小概率事件基本不会发生)
1
2
3
4
5
6
(1)解 由题可知,样品中合格品有36+30+4=70(件),从这100件样品中随机抽取2件.
1
2
3
4
5
6
1
2
3
4
5
6
(ⅱ)解 用Y表示随机抽取100件产品中合格品的件数,假设产品合格率为90%的说法成立,则Y~B(100,0.9),
所以E(X)=100×0.9=90,D(X)=100×0.9×(1-0.9)=9.
由切比雪夫不等式知,P(X=70)≤P(|X-90|≥20)
即在假设下随机抽取100个元件中合格品为70个的概率不超过0.022 5,所以该事件为小概率事件,基本不会发生,据此我们有理由推断该工厂所提供的合格率不可信.
1
2
3
4
5
6
核心素养创新练
5.(多选题)(2024浙江温州模拟)某企业协会规定:企业员工一周7天要有一天休息,另有一天的工作时间不超过4 h,且其余5天的工作时间均不超过8 h(每天的工作时间以整数计),则认为该企业“达标”.请根据以下企业上报的一周7天的工作时间的数值特征,判断其中无法确保“达标”的企业有( )
A.甲企业:均值为5,中位数为8
B.乙企业:众数为6,中位数为6
C.丙企业:众数和均值均为5,下四分位数为4,上四分位数为8
D.丁企业:均值为5,方差为6
ABD
1
2
3
4
5
6
解析 甲企业一周7天的工作时间可以为9,8,8,8,2,0,0,满足均值为5,中位数为8,故不达标,故A正确;
乙企业一周7天工作时间可以为6,6,6,6,6,6,6,满足众数为6,中位数为6,故不达标,故B正确;
丙企业一周7天的工作时间的众数和均值均为5,下四分位数为4,上四分位数为8,设其一周7天的工作时间为4,5,5,8,a,b,c(0≤a≤4≤b≤8≤c≤24),b+c+a=13,为满足众数为5,则b≠4,则b≥5.若a=4,则b=5,则c=4,不满足题意;
若c=8,则b=5,则a=0,满足题意,所以0≤a<4<5≤b≤8≤c,所以a+b≥5,所以c≤8,所以c=8,所以a=0,b=5,故丙企业一定达标,故C错误;
丁企业一周7天的工作时间可以为0,5,5,5,5,6,9,满足均值为5,方差为6,故不达标,故D正确.
故选ABD.
1
2
3
4
5
6
6.(17分)(2024浙江台州二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入,该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)关系如图所示.
1
2
3
4
5
6
令vi=ln xi(i=1,2,…,5),数据经计算可知:
现有①y=bx+a和②y=nln x+m两种模型作为年销售量y关于年广告费x的回归模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好;
(2)根据拟合程度更好的回归模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时产品的年销售量;
1
2
3
4
5
6
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量ξ(单位:百万元)影响,设随机变量ξ服从正态分布N(600,σ2),且满足P(ξ>800)=0.3.在(2)的条件下,求该公司年净利润的最大值大于1 000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量)
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
(3)由(2)可知年销售量为5ln x+4(百万辆),所以年净利润为
200×(5ln x+4)-200x-ξ(百万元).
令g(x)=200×(5ln x+4)-200x-ξ,所以g'(x)= -200.
当x∈(0,5)时,g'(x)>0,g(x)单调递增;
当x∈(5,+∞)时,g'(x)<0,g(x)单调递减.
所以当x=5时,g(x)取最大值,最大值为g(5)=200×(5ln 5+4-5)-ξ ≈200×(5×1.6+4-5)-ξ=1 400-ξ,即年净利润的最大值为1 400-ξ(百万元).
令1 400-ξ>1 000,得ξ<400.
因为随机变量ξ服从正态分布N(600,σ2),且P(ξ>800)=0.3,所以P(ξ<400)=P(ξ>800)=0.3,所以该公司年净利润的最大值大于1 000(百万元)的概率为0.3.(共31张PPT)
专项突破五 统计与概率解答题
考点一 相互独立事件
例1(2024山东烟台一模)某大学举行中文知识竞赛决赛,决赛分为必答、抢答两个环节,两环节依次进行.必答环节共2道题,答对分别记30分、40分,答错均记0分;抢答环节包括多道题,每道题进行抢答,抢到并答对者得15分,若抢到后未答对,则对方得15分;两个环节总分先达到或超过100分者获胜,比赛结束.已知甲、乙两人参加决赛,且在必答环节,甲答对这2道题的概率分别为 ,乙答对这2道题的概率分别为 ;在抢答环节,任意一题甲、乙两人抢到的概率均为 ,甲答对的概率均为 ,乙答对的概率均为 .假定甲、乙两人在各环节、各道题中答题相互独立.
(1)在必答环节中,求甲、乙两人得分之和大于100分的概率;
(2)在抢答环节中,求任意一题甲获得15分的概率;
(3)若在必答环节甲得分为70分,乙得分为40分,设抢答环节经过X道题抢答后比赛结束,求随机变量X的分布列及数学期望.
增分技巧
求相互独立事件概率的两种方法
[对点训练1](2024湖北武汉模拟)“中式八球”是受群众欢迎的台球运动项目之一.在一场“中式八球”邀请赛中,甲、乙、丙、丁4人角逐最后的冠军,本次邀请赛采取“双败淘汰制”.具体赛制如下:首先,4人通过抽签两两对阵,胜者进入“胜区”,败者进入“败区”;接下来,“胜区”的2人对阵,胜者进入最后的决赛,“败区”的2人对阵,败者获得第四名;紧接着,“败区”的胜者和“胜区”的败者对阵,胜者晋级最后的决赛,败者获得第三名;最后,剩下的2人进行最后的冠亚军决赛,胜者获得冠军,败者获得第二名.
现假定甲对阵乙、丙、丁获胜的概率均为p(0(1)经抽签,第一轮由甲对阵乙,丙对阵丁.若p=0.6,求:
(ⅰ)甲连胜三场获得冠军的概率;
(ⅱ)甲在“双败淘汰制”下获得冠军的概率.
(2)除“双败淘汰制”外,“中式八球”也经常采用传统的“单败淘汰制”,即抽签决定两两对阵,胜者晋级,败者淘汰,直至决出最后的冠军.当p满足什么条件时,“双败淘汰制”比“单败淘汰制”更利于甲在此次邀请赛中获得冠军
解 (1)记Ai=“甲在第i场比赛获胜”(i=1,2,3,4),则P(Ai)=0.6,P( )=0.4,且不同对阵的结果相互独立.
(ⅰ)事件“甲连胜三场获得冠军”可表示为B=A1A2A4,所以P(B)=P(A1A2A4)=P(A1)P(A2)·P(A4)=0.6×0.6×0.6=0.216.
因此,甲连胜三场获得冠军的概率为0.216.
(2)由(1)可得“双败淘汰制”下甲获得冠军的概率为P1=p3+2p3(1-p).
易知“单败淘汰制”下甲获得冠军的概率为P2=p2.
令P1>P2,得p3+2p3(1-p)>p2,解得0.5
考点二 超几何分布
例2(2024云南昆明诊断测试)某企业响应国家“强芯固基”号召,为汇聚科研力量,准备科学合理增加研发资金.为了解研发资金的投入额x(单位:千万元)对年收入的附加额y(单位:千万元)的影响,对2017年至2023年研发资金的投入额xi(i=1,2,…,7)和年收入的附加额yi进行研究,得到相关数据如下表所示.
年份代码i 1 2 3 4 5 6 7
研发资金的投入额xi/千万元 10 30 40 60 80 90 110
年收入的附加额yi/千万元 3.2 4 4.8 6 7.3 7.45 9.25
(1)求y关于x的经验回归方程;
(2)若年收入的附加额与研发资金的投入额的比值大于0.1,则称对应的年份为“优”,从上面的7个年份中任意取3个,记X表示这3个年份为“优”的个数,求X的分布列及数学期望.
(2)由表格数据可得,7个年份中年收入的附加额与研发资金的投入额的比值大于0.1的有3个,即“优”的年份有3个.
由题可知,X服从超几何分布,且N=7,M=3,n=3,则X的分布列为
计算的具体结果如表所示.
[对点训练2](2024山东聊城二模)随着互联网的普及、大数据的驱动,线上线下相结合的新零售时代已全面开启,新零售背景下,即时配送行业稳定快速增长.某即时配送公司为更好地了解客户需求,优化自身服务,提高客户满意度,在其A,B两个分公司的客户中各随机抽取10位客户进行了满意度评分调查(满分100分),评分结果如下:
分公司A:66,80,72,79,80,78,87,86,91,91.
分公司B:62,77,82,70,73,86,85,94,92,89.
(1)求抽取的这20位客户评分的第一四分位数;
(2)规定评分在75分以下的为不满意,从上述不满意的客户中随机抽取3人继续沟通不满意的原因及改进建议,设被抽到的3人中分公司B的客户人数为X,求X的分布列和数学期望.
解 (1)将抽取的这20位客户的评分从小到大排列为62,66,70,72,73,77,78,79,80,80,82,85,86,86,87,89,91,91,92,94.
因为20×25%=5,所以抽取的这20位客户评分的第一四分位数为
(2)分公司A的客户中评分在75分以下的有2人;
分公司B的客户中评分在75分以下的有3人,所以不满意的客户共5人.
由题可知,X服从超几何分布,且N=5,M=3,n=3,则X的分布列为
计算的具体结果如表所示.
考点三 二项分布
例3(2024山东临沂一模)某学校举办了精彩纷呈的数学文化节活动,其中有个“掷骰子赢奖品”的登台阶游戏最受欢迎.游戏规则如下:抛掷一枚质地均匀的骰子一次,出现3的倍数,则一次上三级台阶,否则上二级台阶,再重复以上步骤,当参加游戏的学生位于第8、第9或第10级台阶时游戏结束.规定:从平地开始,结束时学生位于第8级台阶可获得一本课外读物,位于第9级台阶可获得一套智力玩具,位于第10级台阶则认定游戏失败.
(1)某学生抛掷三次骰子后,按游戏规则位于第X级台阶,求X的分布列及数学期望E(X);
(2)甲、乙两位学生参加游戏,求恰有一人获得奖品的概率.
(2)由题可知,当某位学生恰好位于第10级台阶,且未曾位于第8、第9级台阶时,游戏失败.又因为每次上二级或三级台阶,所以其上一次掷骰子时位于第7级台阶.因为抛掷两次骰子,至多上六级台阶;抛掷三次骰子,至少上六级台阶;抛掷四次骰子,至少上8级台阶,所以位于第7级台阶时,恰好抛掷了三次骰子,位于第10级台阶时,第四次抛掷骰子上三级台阶,所以某位学生不能获得奖品的概率为P=P(X=7)P(A)= .两位同学参加游戏,用Z表示不能获得奖品的人数,
(1)若p= ,求甲、乙两队共投中5次的概率;
(2)以甲、乙两队投中次数的数学期望为依据,若甲队获胜的期望更大,求p的取值范围.
由分步乘法计数原理,乙队所有队员各投篮一次,共有8种可能的结果,它们两两互斥,每个结果都是3个相互独立事件的积.
用Y表示乙队投中的次数,则Y的可能结果为0,1,2,3.
考点四 正态分布
例4(2024四川成都二模)某省举办了一次高三年级化学模拟考试(满分100分),其中甲市有20 000名学生参加.根据经验,本次模拟考试该省总体成绩及各市成绩都近似服从正态分布N(μ,σ2).
(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有455人.甲市学生A的成绩为76分,试估计学生A在甲市的大致名次;
(2)在参加该省本次模拟考试的学生中随机抽取40人,记Y表示在本次化学考试中成绩在[μ-3σ,μ+3σ]之外的人数,求P(Y≥1)及Y的数学期望.
参考数据:0.997 340≈0.897 5.
参考公式:若X~N(μ,σ2),有P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5, P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解 (1)用X表示本次模拟考试甲市成绩,由题可知X近似服从正态分布,即X~N(μ,σ2).
因为甲市平均成绩为65分,所以N=65.
因为甲市学生A在该次考试中成绩为76分,所以甲市成绩高于学生A的学生人数约为20 000×P(X>76)=20 000×0.158 65=3 173,所以学生A在甲市的大致名次为3 174名.
(2)由题可知该省成绩近似服从正态分布,所以在参加该省本次模拟考试的学生中随机抽取1人,其成绩在[μ-3σ,μ+3σ]之内的概率约为0.997 3,
所以其成绩在[μ-3σ,μ+3σ]之外的概率约为0.002 7.
由题可知随机变量Y服从二项分布,即Y~B(40,0.002 7),
所以P(Y≥1)=1-P(Y=0)=1-0.997 340≈1-0.897 5=0.102 5,
E(Y)=40×0.002 7=0.108.
[对点训练4](2024四川泸州诊断测试)统计学中有如下结论:若X~N(μ,σ2),从X的取值中随机抽取k(k∈N*,k≥2)个数据,记这k个数据的平均数为Y,则随机变量Y: N(μ, ).某人喜欢吃披萨,他每天都会到同一家披萨店购买一份披萨,该披萨店的老板声称自己所出售的披萨的平均质量是500 g,上下浮动不超过25 g,这句话用数学语言来表达就是:每份披萨的质量服从期望为500,标准差为25的正态分布.
(1)假设老板的说法是真实的,若从该披萨店随机购买25份披萨,记这25份披萨的质量的平均值为Y,利用上述结论求P(Y<490);
(2)此人每天都会将买来的披萨称重并记录,25天后,得到的数据都落在(475,525)上,并经计算得到25份披萨的质量的平均值为488.72,通过分析他举报了该老板.试从概率角度说明他举报该老板的理由.
附:①若随机变量η服从正态分布N(μ,σ2),则P(μ-σ≤η≤μ+σ)≈0.682 7,
P(μ-2σ≤η≤μ+2σ)≈0.954 5,P(μ-3σ≤η≤μ+3σ)≈0.997 3;
②通常把发生概率小于0.05的事件称为小概率事件,小概率事件基本不会发生.
(2)由(1)可知P(Y<490)≈0.022 75.
因为488.72<490,0.022 75<0.05,所以25份披萨的质量的平均值为488.72 g为小概率事件,小概率事件基本不会发生,所以披萨店的老板的说法不真实.