(共59张PPT)
专题六 概率与统计
第2讲 概率与统计(小题) 第一课时 概率、事件及分布
D. 0
B
0.6
3.2
解析:①小桐一周跑11圈有两种情况:第一次跑5圈、第二次跑6圈和第一次跑6圈、第二次跑5圈,两种情况的概率分别为P1=0.5×0.6=0.3,P2=0.5×0.6=0.3,所以小桐一周跑11圈的概率P=P1+P2=0.3+0.3=0.6.
②小桐一周跑的圈数的所有可能取值为10,11,12,其中达标的圈数为11,12,则小桐一周内运动量达标的概率P'=1-0.5×0.4=0.8.合格周数X的所有可能取值为0,1,2,3,4,X服从二项分布B(4,0.8),所以X的数学期望E(X)=4×0.8=3.2.
■热点突破
热点 概率
A
A
A. A B
D
A. A,B互斥
B. A∪B=C
C. P(ABC)=P(A)P(B)P( C)
D. A,B,C两两独立
D
C
(1)古典概型用古典概型概率公式求解.
(2)条件概率用条件概率公式及全概率公式求解.
(3)根据事件间关系,利用概率的加法、乘法公式及对立事件的概率公式求解.
规律方法 求概率的方法与技巧
热点 分布列、期望、方差
A. 115分,105 B. 115分,265
C. 120分,105 D. 120分,265
B
(2)(多选)(2025·河北“五个一名校联盟”第二次联考)已知随机变量X的分布列为
X 0 1 2
P m
ACD
(3)(2025·江西部分学校联考)已知随机变量X的分布列为
X -4 -3 0 3
P a b c
规律方法 分布列性质的两个作用
(1)利用分布列中各事件概率之和为1的性质可求参数的值及检查分布列的正确性.
(2)随机变量X所取的值对应的事件是两两互斥的,利用这一点可以求随机变量在某个范围内的概率.
热点 二项分布、超几何分布、正态分布
B. μ=3
D. 5D(X)+D(Y)=10
ABD
C
A. 1.8 B. 3.6 C. 4.2 D. 4.8
C
解析:已知从群体中随机抽取10人,对某活动持满意态度的人数比例为90%=0.9,
设这10人中持满意态度的人数为X,那么X服从参数为n=10(试验次数),p=0.9(每次试验成功的概率)的二项分布,即X~B(10,0.9).
对于二项分布X~B(n,p),其方差公式为D(X)=np(1-p).
将n=10,p=0.9代入公式可得D(X)=10×0.9×(1-0.9)=10×0.9×0.1=0.9.
已知随机变量Y=2X+3,根据随机变量线性变换后的方差性质D(aX+b)=
a2D(X),
得D(Y)=D(2X+3)=22D(X).由前面已求得D(X)=0.9,则D(Y)=4×0.9=3.6.故选B.
A. E(2X+1)=1
B. D(2Y+1)=12
C. P(X≤-2)+P(X≤2)=1
D. P(|X|≤2)>P(|Y|≤2)
ACD
解析:由随机变量X服从正态分布N(0,22),可得E(X)=0,D(X)=4,由随机变量Y服从正态分布N(2,32),可得E(Y)=2,D(Y)=9.E(2X+1)=2E(X)+1=1,A正确;D(2Y+1)=22D(Y)=36,B错误;由正态曲线的性质,得P(X≤-2)+P(X≤2)=1-P(X≥2)+P(X≤2)=1,C正确;P(|X|≤2)=P(-2≤X≤2)=P(0-2≤X≤0+2)=0.682 7,P(|Y|≤2)=P(-2≤Y≤2)<0.5,所以P(|X|≤2)>P(|Y|≤2),D正确.故选ACD.
BCD
A. n=5
规律方法 若随机变量X的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的均值和方差的公式求解.
冲刺集训26 概率、事件及分布
冲刺集训26 概率、事件及分布
A. 2 C. 3 D. 4
C
A. 0.14 B. 0.22 C. 0.28 D. 0.36
解析:因为随机变量X~N(2,σ2),且P(X≤4)=0.64,所以P(X<0)=P(X>4)=1-P(X≤4)=1-0.64=0.36,所以P(0≤X≤2)=P(X≤2)-P(X<0)=0.5-0.36=0.14.故选A.
A
C
C
A
C
A. 事件A与B一定是对立事件
B. P(A∪B)=1
C. P(AB)=0.24
D
C
A. f(0)=1
B. f(x)是偶函数
D. f(x)是增函数
CD
A. 若随机选择一项,则得分X的期望E(X)为定值
C. 存在p0使随机选择三项的得分期望大于随机选择一项的得分期望
D. 存在p0使随机选择三项的得分期望大于随机选择两项的得分期望
AB
X1 0 2 3
P
X2 0 4 6
P
X3 0 6
P
11. (多选)(2025·广东二模)已知离散型随机变量X的分布列为P(X=xi)=pi(i=1,2,3,…,n).定义随机变量Y=etX(t∈R,e为自然对数的底数,e=2.718 28…)的分布列如下:
Y …
P p1 p2 … pn
AD
A. M'X(0)=E(X)
C. 若X~B(n,p),则MX(t)=(etp+1-p)n
D. 若实数a,b为常数,则MaX+b(t)=ebt·MX(at)
A. 若随机变量X~N(2,1),则P(X≥3)>0.5
B. 若随机变量X~N(2,1),则P(3<X<4)<P(1<X<2)
BCD
A. 若A,B互斥,则P(A∪B)=0.9
C. 若A,B相互独立,则P(A∪B)=0.7
ACD
解析:设选出的是第k个袋子,连续三次取球的方法数为n(n-1)(n-2),
第三次取出的是白球的三次取球颜色有如下四种情形:
(白,白,白):取法数为(n-k)(n-k-1)(n-k-2),
(白,红,白):取法数为(n-k)k(n-k-1),
(红,白,白):取法数为k(n-k)(n-k-1),
(红,红,白):取法数为k(k-1)(n-k),
14(共55张PPT)
专题六 概率与统计
第4讲 成对数据分析(大题)
高考定位:高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
■真题研析
1. (2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
超声波检查结果
组别 正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
2. (2025·上海卷)2024年巴黎奥运会,中国获得了男子4×100米混合泳接力金牌,以下是历届奥运会男子4×100米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78 207.46 207.95 209.34 209.35
210.68 213.73 214.84 216.93 216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
■热点突破
热点 线性回归分析
例1 (2025·安徽合肥二模)某研究小组为了解青少年的身高与体重的关系,随机从15岁人群中选取了9人,测得他们的身高(单位:cm)和体重(单位:kg),得到如表数据:
样本号i 1 2 3 4 5 6 7 8 9 均值
身高xi 165 157 156 173 163 159 177 161 165 164
体重yi 53 46 48 56 57 49 60 45 54 52
(1)若两组变量间的样本相关系数r满足0.8≤|r|<1,则称其为高度相关,判断青少年身高与体重是否高度相关,并说明理由(r精确到0.01);
(2)建立y关于x的经验回归方程,并预测某同学身高为180 cm时,体重的估计值(结果保留整数).
热点 非线性回归分析
例2 (2025·全国一模)某公司为考核员工,采用某方案对员工进行业务技能测试,然后统计并分析测试成绩以确定员工绩效等级.
(1)已知该公司甲部门有3名负责人,乙部门有4名负责人,该公司从甲、乙两部门中随机选取3名负责人做测试分析,记负责人中来自甲部门的人数为X,求X最有可能的取值.
(2)该公司统计了七个部门测试的平均成绩x(满分100分)与绩效等级优秀率y,如表所示.
x 32 41 54 68 74 80 92
y 0.28 0.34 0.44 0.58 0.66 0.74 0.94
P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
规律方法 选择适当的数学模型进行变量代换将非线性回归问题转化为线性回归问题解答.
热点 独立性检验
例3 (2025·山东聊城一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于130分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组[90,100)的频数为10.
(1)求a的值和样本容量;
(2)估计所有参赛学生的平均成绩(同组数据用该组区间的中点值代表);
(3)假设在抽取的样本中,男生比女生多20人,女生的获奖率为12.5%,填写下列2×2列联表,并依据小概率值α=0.01的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别 奖励 合计
获奖 未获奖
男
女
合计
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解:(3)由题意可知,获奖人数为100×(0.015+0.005)×10=20人,
由题意可得如下2×2列联表,
性别 奖励 合计
获奖 未获奖
男 15 45 60
女 5 35 40
合计 20 80 100
冲刺集训30 成对数据分析(大题)
冲刺集训30 成对数据分析(大题)
1. (2025·宁夏银川二中高三一模)某企业近年来的广告费用x(百万元)与所获得的利润y(千万元)的数据如下表所示,已知y与x之间具有线性相关关系.
年份 2020 2021 2022 2023 2024
广告费用x/百万元 1.5 1.6 1.7 1.8 1.9
利润y/千万元 1.6 2 2.4 2.5 3
(1)求y关于x的线性回归方程;
解: (2)由题可知,到2027年时广告费用为2.2百万元,故可预测该公司所获得的利润约为
3.3×2.2-3.31=3.95(千万元).
2. (2025·山东烟台三模)近年来,新能源汽车因其动力充沛、提速快、用车成本低等特点得到民众的青睐.某机构为研究汽油价格x(单位:元/升)与新能源汽车的月销售量y(单位:万辆)之间的关系,收集整理得到如下数据:
x 6 6.5 7 7.5 8
y 1.5 2 3 4.5 6.8
(1)若用模型y=bln x+a模拟x与y之间关系,求出回归方程;
(2)根据建立的回归方程,预测当汽油价格上涨至9元/升时,新能源汽车的销量;
(3)假设当汽油价格为9元/升时,实际销量超过预测值的概率为0.6.现进行5次独立观测,记这5次观测中实际销量超过预测值的次数为ξ,求ξ的数学期望.
解:(3)由题知,ξ~B(5,0.6),
所以E(ξ)=5×0.6=3,
即ξ的数学期望为3.
3. (2025·山东临沂二模)体育是培养学生高尚人格的重要途径之一.足球作为一项团队运动项目,深受学生喜爱,为了解学生是否喜爱足球运动是否与性别有关,随机抽取了100名学生作为样本,统计得到如下的列联表:
喜爱足球运动 不喜爱足球运动 合计
男生 40 a
女生 b 25
合计 100
(1)求a,b;
(2)根据小概率值α=0.001的独立性检验,判断学生是否喜爱足球运动是否与性别有关?
解:(2)零假设H0:是否喜爱足球运动与性别无关.
作出列联表如下:
喜爱足球运动 不喜爱足球运动 合计
男生 40 15 55
女生 20 25 45
合计 60 40 100
(3)用样本分布的频率估计总体分布的概率,现在从喜爱足球运动的学生中随机抽取30名,记其中男生的人数为Z,求使事件“Z=k”概率最大的k的值.
α 0.01 0.005 0.001
xα 6.635 7.879 10.828
X 1 2 3 … n-1 n
P …
(3)B款游戏为抽球游戏,游戏规则如下:有n个小球,编号分别为1,2,…,n,参与者从中随机抽取k个小球,记录编号后放回,再重新随机抽取k个小球,记被重复抽取的小球数为Y,并向参与者发放Y张优惠券,求P(Y=m)取得最大值时m的值.
X 4 5 6 7 8
P
(2)从第11题得分的100名学生中随机抽取n人(0<n≤100,n∈N*),记这n人得到书签的总数为(n+1)的概率为Pn,求P1+P2+P3+…+Pn的值;
(3)已知王老师班有20名学生在第11题得分,若以需要赠送书签总个数概率最大为依据,请问王老师应该提前准备多少个书签比较合理?
而0≤x≤20,x∈N,所以x=15,
所以m=40-15=25,
所以若以需要赠送书签总个数概率最大为依据,王老师应该提前准备25个书签比较合理.
(2)记该选手在第n轮答题结束时挑战依然未终止的概率为Pn.
①求p3,p4;
②证明:存在实数λ,使得数列{pn+1-λpn}为等比数列.(共54张PPT)
专题六 概率与统计
第2讲 概率与统计(小题) 第二课时 统计及回归分析
高考定位:高考对本讲内容的考查往往以实际问题为背景,考查样本的数字特征、经验回归方程的求解与运用、独立性检验问题,中等难度.
■真题研析
A. 若随机变量X~N(μ,σ2),则P(X≤μ-σ)=P(X≥μ+σ)
B. 若随机变量X~N(1,22),Y~N(2,22),则P(X≤1)<P(Y≤2)
C. 若|r|越趋近于1,则线性相关程度越强
D. 若|r|越趋近于0,则线性相关程度越弱
解析:A选项,由X~N(μ,σ2),可知正态曲线关于直线x=μ对称,故有P(X≤μ-σ)=P(X≥μ+σ),A正确;B选项,由X~N(1,22),可知P(X≤1)=0.5,由Y~N(2,22),可知P(Y≤2)=0.5,故P(X≤1)=P(Y≤2),B错误;C选项,相关系数r的范围是[-1,1],|r|越趋近于1,则两个变量之间线性相关程度越强,C正确;D选项,相关系数r越趋近于0时,两个变量之间线性相关程度越弱,D正确.故选B.
B
A. 8 B. 9 C. 12 D. 18
A. x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B. x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C. x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D. x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
C
BD
■热点突破
热点 统计
A. 99 B. 100 C. 101 D. 113
B
A. 6,6,6,6,6 B. 5,5,6,7,7
C. 4,5,6,7,8 D. 4,4,6,8,8
D
C
A. 在被抽取的学生中,成绩在区间[90,100)内
的学生有750人
B. 频率分布直方图中x的值为0.020
C. 估计全校学生成绩的中位数为87
D. 估计全校学生成绩的样本数据的80%分位数为90
解析:由题图可知,成绩在区间[90,100)内的频率为0.040×10=0.4,而0.4×2 000=800≠750,故A错误;由题图可知,(0.005+0.010+x+0.030+0.040)×10=1,得x=0.015,故B错误;前3组的频率和为0.3,前4组的频率和为0.6,所以中位数在第4组,设中位数为x,则0.3+(x-80)×0.03=0.5,得x≈87,故估计全校学生成绩的中位数为87,故C正确;样本数据的80%分位数在第5组,设样本数据的80%分位数为x,则0.6+(x-90)×0.04=0.8,得x=95,故D错误.故选C.
D
A. A型号空调月销售量的极差比B型号空调月销售量的极差大
B. A型号空调月平均销售量比B型号空调月平均销售量大
C. A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大
D. A型号空调月销售量的方差比B型号空调月销售量的方差小
规律方法 (1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
热点 回归分析
C
A. BMI越大,脂肪百分比越大
B. BMI越大,脂肪百分比越小
C. BMI与脂肪百分比正相关
D. BMI与脂肪百分比负相关
解析:由散点图可得BMI增大时,脂肪百分比或变大或变小,故A、B错误;根据散点图的分布可得BMI与脂肪百分比正相关,故C正确,D错误.故选C.
A. 残差平方和变小
B. 相关系数r变大
C. 决定系数R2变大
D. 解释变量x与响应变量y的相关性变弱
D
解析:从散点图可分析出,若去掉D点,则解释变量x与响应变量y的线性相关性变强,且是正相关,所以相关系数r变大,决定系数R2变大,残差平方和变小,故选D.
A
月份x 1 2 3 4 5
销量y 0.5 s 1 t 1.4
A. -0.919 B. -0.1
C. 0.1 D. 0.919
C
A. 变量x与y的样本相关系数r<0
B. b=3
C. 当x=6时,残差为-0.1
D. 当x=20时,y的预测值为11.2
x 4 6 8 10 12
y a 2 b c 6
BCD
12
(2)残差=观测值-预测值.
(3)两变量线性相关程度越强,|r|越接近于1.
(4)通过经验回归方程求的都是估计值,而不是真实值.
热点 独立性检验
附:
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
BC
A. 若α=0.100,则认为“毛色”和“角”无关
B. 若α=0.100,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%
C. 若α=0.010,则认为“毛色”和“角”无关
D. 若α=0.010,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%
解析:若α=0.100,因为2.727>2.706,所以认为“毛色”和“角”有关,此推断犯错误的概率不超过10%,故A错误,B正确;若α=0.010,因为2.727<6.635,所以认为“毛色”和“角”无关,故C正确,D错误.
(2)(2025·福建龙岩阶段训练)假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1 y2
x1 10 18
x2 m 26
A. 8 B. 9 C. 14 D. 19
C
附:
α 0.050 0.010
xα 3.841 6.635
A
A. 12人 B. 6人 C. 10人 D. 18人
性别 对某视频APP的态度 合计
喜欢 不喜欢
男 x
女
合计 x
A. 某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B. 数据1,3,4,5,7,9,11,16的第75百分位数为10
C. 线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D. 根据分类变量x与y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断x与y有关联,此推断犯错误的概率不大于0.05
ABD
规律方法 (1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
冲刺集训27 统计及回归分析
冲刺集训27 统计及回归分析
A. 已知一组各不相同的数据xi(1≤i≤30,i∈N),去掉其中最大和最小两个数据后,剩下的28个数据的22%分位数等于原来数据的22%分位数
C. 若随机变量X服从正态分布N(3,σ2),且P(X≤4)=0.6,则P(3<X<4)=0.2
D
A. 7 B. 8 C. 9 D. 10
D
A. 1 000名学生成绩的平均数是77
B. 成绩不低于80分的学生所占比例为40%
C. 用分层抽样方法从该校学生中抽取容量为100的样本,则应在[70,80)内抽取30人
D. 这1 000名学生成绩的第50百分位数是80
D
解析:对于A,由频率分布直方图,得1 000名学生成绩的平均数是55×0.1+65×0.2+75×0.2+85×0.3+95×0.2=78,A错误;对于B,成绩不低于80分的学生频率为10×(0.03+0.02)=0.5,成绩不低于80分的学生所占比例为50%,B错误;对于C,由分层抽样特点得,应在[70,80)内抽取100×0.02×10=20人,C错误;对于D,1 000名学生成绩的第50百分位数即中位数为80,D正确.故选D.
A. 0.1 B. 0.2 C. 0.3 D. 0.4
A
参考值:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
A. x与y不独立
B. x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立
D. x与y独立,这个结论犯错误的概率不超过0.05
解析:零假设H0为x与y独立,由χ2=2.826<3.841,故依据α=0.05的独立性检验,可得H0成立,故可以认为x与y独立.
C
月份 7月 8月 9月 10月 11月 12月
跑步里程 310 254 220 210 248 300
A. 210公里 B. 251公里
C. 254公里 D. 248公里
解析:将小丽7~12月份每个月的跑步里程(单位:公里)从小到大排列为210,220,248,254,300,310.因为6×60%=3.6,所以小丽7~12月份每个月的跑步里程的60%分位数为254公里.故选C.
C
A. 5 B. 6 C. 7 D. 8
C
患疾病A 不患疾病A 合计
过量饮酒 3a b
不过量饮酒 a 2b
合计 400
α 0.100 0.050 0.010 0.001
xα 2.706 3.841 6.635 10.828
ACD
A. 任意一人不患疾病A的概率为0.9
D. 依据小概率值α=0.001的独立性检验,认为过量饮酒与患疾病A有关
患疾病A 不患疾病A 合计
过量饮酒 30 120 150
不过量饮酒 10 240 250
合计 40 360 400
月份编号x 1 2 3 4 5
下载量y/万次 5 4.5 4 3.5 2.5
A. y与x负相关
C. 预测第6个月的下载量是2.1万次
D. 残差绝对值的最大值为0.2
ACD
月份编号x 1 2 3 4 5
下载量y/万次 5 4.5 4 3.5 2.5
下载量预测值
z/万次 5.1 4.5 3.9 3.3 2.7
残差绝对值 0.1 0 0.1 0.2 0.2
A. 甲同学的平均成绩高于乙同学
B. 乙同学击中8环的概率高于甲同学
C. 甲同学击中10环的概率高于乙同学
D. 乙同学的射击成绩更稳定
BCD
解析:由于E(X)=E(Y)=8,即平均水平相当,故A错误;由题图可知,甲同学击中8环的概率小于乙同学击中8环的概率,故B正确;甲同学击中10环的概率大于乙同学击中10环的概率,故C正确;从概率分布图来看,乙同学的成绩分布相对更集中在均值8环附近,波动更小,所以乙同学的射击成绩更稳定,故D正确,故选BCD.
x 1 2 3 4 5
y 0.5 0.8 1 1.2 1.5
B. 当x=5时的残差为0.02
C. 样本数据y的40%分位数为0.8
D. 去掉样本点(3,1)后,y与x的样本相关系数不变
ABD
A. 对于独立性检验,随机变量χ2的值越大,则推断“两变量有关系”犯错误的概率越小
B. 若P(A)>0,P(B)>0,P(B|A)=P(B),则P(A|B)=P( )
C. 随机变量X服从正态分布N(1,σ2),P(X>1.5)=0.34,若P(X<a)=0.34,则a=0.5
D. 数据4,3,2,5,6,7的50%分位数为4
ABC
A
A. 具有相关关系的两个变量x,y的相关系数r越大,则x,y之间的线性相关程度越强
B. 已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)=0.3
C. 数据27,30,37,39,40,50的第30百分位数是30
D. 若一组样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数
BCD
解析:对于A,具有相关关系的两个变量x,y的相关系数|r|越大,则x,y之间的线性相关程度越强,故A不正确;对于B,随机变量ξ服从正态分布N(2,σ2),又P(ξ<4)=0.8,所以P(ξ≤0)=P(ξ≥4)=1-0.8=0.2,则P(0<ξ<2)=P(ξ<2)-P(ξ≤0)=0.5-0.2=0.3,故B正确;对于C,因为6×30%=1.8,所以数据27,30,37,39,40,50的第30百分位数是30,故C正确;对于D,由对称性知若频率分布直方图左右对称,则平均数等于中位数,而若频率分布直方图为单峰不对称,且在右边“拖尾”,则平均数大于中位数,故D正确.故选BCD.
9(共37张PPT)
专题六 概率与统计
第1讲 排列组合与二项式定理
高考定位:(1)主要考查两个计数原理、排列、组合的简单应用,时常与概率相结合,以选择题、填空题为主.(2)二项式定理主要考查通项公式、二项式系数等知识,有时也与函数、不等式、数列等知识交汇考查.
-20
80
1
15
■热点突破
热点 排列问题
A. 8种 B. 12种 C. 16种 D. 10种
B
A. 24 B. 30 C. 36 D. 54
B
AB
A. 16种 B. 32种 C. 48种 D. 64种
B
解析:根据题意,第一天从5个人中选1个人值班,有5种选法;第二天不能选第一天值班的人,所以有4种选法;第三天同样不能选第二天值班的人,所以还是有4种选法;第四天也不能选第三天值班的人,有4种选法;第五天不能选第四天值班的人,有4种选法,所以总共有5×4×4×4×4=1 280种不同的安排方法.
1 280
规律方法 (1)“分类”与“分步”要明确,保证分类要不重不漏,环环相扣.
(2)排列方法:相邻问题捆绑法、间隔问题插空法、定位问题优先法等.
热点 组合问题
A. 120种 B. 210种
C. 1 440种 D. 2 880种
D
A. 32 B. 20 C. 16 D. 10
C
A. 141种 B. 144种 C. 147种 D. 149种
A
42
规律方法 分组、分配中提防“均分问题”,避免重复计算.
热点 二项式定理
A. 252 B. -252 C. 210 D. -210
C
A. 16 B. 32 C. 48 D. 64
C
A. 60 B. 120 C. 240 D. 360
B
A. -1 B. 0 C. 1 D. 2
解析:令x=0,得(0-1)5=a5·0+a4·0+a3·0+a2·0+a1·0+a0 a0=-1,令x=1,得(2-1)5=a5·1+a4·1+a3·1+a2·1+a1·1+a0 a5+a4+a3+a2+a1+a0=1,所以a1+a2+a3+a4+a5=1-(-1)=2,故选D.
D
A. 15 B. 16 C. 202 D. 203
BD
(2)求三项展开式的特定项,一般转化为二项式求解或用定义法.
(3)求解系数和问题应用赋值法.
(4)涉及整除或近似值问题要应用二项展开式解决.
规律方法 (1)求两个因式积的特定项,一般对某个因式用通项公式,再结合因式相乘,分类讨论求解.
冲刺集训25 排列组合与二项式定理
冲刺集训25 排列组合与二项式定理
A. -240 B. -60 C. 60 D. 240
C
A. -210 B. -120 C. 120 D. 210
B
A. 66 B. 75 C. 78 D. 90
B
A. 31 B. 32 C. 63 D. 64
解析:因为(1-x)7=a0+a1x+a2x2+…+a7x7,所以当x=0时,(1-0)7=a0=1,当x=1时,0=a0+a1+a2+…+a7 ①,当x=-1时,27=a0-a1+a2-a3+…+a6-a7 ②,①+②=2(a0+a2+a4+a6)=27,所以a0+a2+a4+a6=26=64,所以a2+a4+a6=64-1=63,故选C.
C
A. 3 B. 2 C. 1 D. 0
D
A B C D
E F G H
A. 168 B. 336 C. 338 D. 84
B
解析:第一步:排男生,第一个男生在第一行选一个位置有四个位置可选,第二个男生在第二行有三个位置可选,由于两个男生可以互换,故男生的排法有4×3×2=24(种).第二步:排女生,假设男生选AF,则女生有BE,BG,BH,CE,CH,DE,DG,共7种选择,男生选其他两个位置时同理,由于女生可以互换,故女生的排法有2×7=14(种).根据分步乘法计数原理可得,不同的坐法共有24×14=336(种),故选B.
A. 4 B. 6 C. 8 D. 12
C
A. 40 B. 48 C. 52 D. 60
B
A. a0=1
B. a1+a2+…+a2 025=0
C. a1+a2 024=0
D. a0+a2+a4+…+a2 024=22 024
ACD
A. n=10
B. 展开式中奇数项的二项式系数的和为256
C. 展开式中x15的系数为45m8
D. 若展开式中各项系数的和为1 024,则第6项的系数最大
ACD
A. a1+a2+…+an=1
B. |a0|+|a1|+…+|an|=39
C. f(6)除以8所得的余数为1
D. a1+2a2+3a3+…+nan=18
BCD
80
解析:若编号为1的盒子中球数为1,则编号为2的盒子中的球数可以为1、2、3、4,有4种情况,
若编号为1的盒子中球数为2,则编号为2的盒子中的球数可以为1、2、3,有3种情况,
综上所述,不同的放法种数为4+3=7种.
7(共41张PPT)
专题六 概率与统计
第3讲 概率(大题)第一课时 概率、分布列及期望与方差
高考定位:(1)概率重点考查古典概型、条件概率、全概率公式的基本应用.(2)离散型随机变量的分布列、均值、方差和概率的计算问题常常结合在一起进行考查,重点考查超几何分布、二项分布及正态分布,以解答题为主,中等难度.
■真题研析
1. (2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
解:(1)该地区这种疾病患者的平均年龄为(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
解:(2)设事件A为“该地区一位这种疾病患者的年龄位于区间[20,70)”,P(A)=(0.012+0.017+0.023+0.020+0.017)×10=0.89,
∴估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率为0.89.
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).
2. (2025·北京卷)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试,为了解学生对该知识点的掌握情况,随机抽查甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立.用频率估计概率.
(Ⅰ)估计甲校高一年级学生该题选择正确的概率p;
(Ⅱ)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计X=1的概率及X的数学期望;
X 0 1 2
P
(Ⅲ)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为100%,乙校学生选择正确的概率为85%,设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为p1,p2,判断p1与p2的大小(结论不要求证明).
■热点突破
热点 互斥、独立事件的概率
(2)求选手甲在该次比赛得分为40分的概率;
(3)已知该次比赛选手甲进入了高分组,记选手甲在该次比赛中的得分为X(单位:分),求随机变量X的分布列和期望.
X 0 20 40 60 80
P
规律方法 正确区分事件为互斥事件还是相互独立事件,并运用公式求概率.
热点 条件概率、全概率
(1)求在继续打了两个球后比赛结束的条件下,乙同学获胜的概率;
(2)求乙同学最终获胜的概率.
规律方法 (1)条件概率的计算常用方法有公式法和缩小样本空间法.
(2)利用全概率公式求概率的思路:首先按照确定的标准,将一个复合事件分解为若干个互斥事件Ai(i=1,2,…,n),然后求P(Ai)和所求事件B在各个互斥事件Ai发生的条件下的概率P(B|Ai),代入全概率公式计算.
热点 决策问题
例3 (2025·江苏模拟)甲、乙两人组队准备参加一项挑战比赛,该挑战比赛共分n(n∈N*,n≥2)关,规则如下:首先某队员先上场从第一关开始挑战,若挑战成功,则该队员继续挑战下一关,否则该队员被淘汰,并由第二名队员接力,从上一名队员失败的关卡开始继续挑战,当两名队员均被淘汰或者n关都挑战成功,挑战比赛结束.若甲每一关挑战成功的概率均为p(0<p<1),乙每一关挑战成功的概率均为q(0<q<1),且甲、乙两人每关挑战成功与否互不影响,每关成功与否也互不影响.
②设X为挑战比赛结束时挑战成功的关卡数,求E(X).
(2)如果n关都挑战成功,那么比赛挑战成功.试判断甲先出场与乙先出场比赛挑战成功的概率是否相同,并说明理由.
解:(2)设甲先出场比赛挑战成功的概率为P1,乙先出场比赛挑战成功的概率为P2,
则P1=pn+pn-1(1-p)q+pn-2(1-p)q2+…+(1-p)qn
=(pn+pn-1q+pn-2q2+…+qn)-(pnq+pn-1q2+pn-2q3+…+pqn);
P2=qn+qn-1(1-q)p+qn-2(1-q)p2+…+(1-q)pn
=(qn+qn-1p+qn-2p2+…+pn)-(qnp+qn-1p2+qn-2p3+…+qpn).
因为pn+pn-1q+pn-2q2+…+qn=qn+qn-1p+qn-2p2+…+pn,
pnq+pn-1q2+pn-2q3+…+pqn=qnp+qn-1p2+qn-2p3+…+qpn,
所以P1=P2.
因此,甲先出场与乙先出场比赛挑战成功的概率相同.
规律方法 概率中的决策问题,核心是利用概率与统计知识(如期望、方差、概率分布等)分析不同方案的收益或风险或事件发生的概率的大小,从而选择最优策略.主要是收益最大化、风险最小化、成本最小化、概率最大等,本质是“用数据说话”,通过期望、方差、概率等指标将不确定的结果量化,再根据目标(收益、风险、概率等)选择最优方案,同时需兼顾实际场景中的风险承受能力.
冲刺集训28 概率、分布列及期望与方差
冲刺集训28 概率、分布列及期望与方差
1. (2025·山东日照一模)近期根据我国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和时间第x天间的数据,如表:
x 1 2 3 4 5
y 75 84 93 98 100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和时间第x天之间的关系?若可用,估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数|r|>0.75,则线性相关程度很高,可以用线性回归模型拟合,r精确到0.01);
2. (2025·甘肃兰州一模)“春雨惊春清谷天,夏满芒夏暑相连,秋处露秋寒霜降,冬雪雪冬小大寒.”这二十八字节气歌是我国古人智慧的结晶.某文具店试销二十四节气书签,每套书签24张,分别印有春夏秋冬四季节气各6张.文具店为促销进行抽奖活动,凡购买一套二十四节气书签可参加抽奖,抽奖规则如下:从一套书签中挑出6张春季卡,6张夏季卡,将其中3张春季卡和3张夏季卡装在一个不透明的盒中,剩余的3张春季卡和3张夏季卡放在盒外.现从盒中随机抽出一张卡,若抽出春季卡,则把它放回盒子中,若抽出夏季卡,则该卡与盒外的一张春季卡置换.如此操作不超过4次,将盒中的夏季卡全部置换为春季卡,则停止抽卡并获得2套二十四节气书签,否则不获奖.
(1)求只抽3次即获奖的概率;
(2)若促销的30天中预计有360人参加活动,从数学期望的角度分析商家准备多少套书签作为奖品更为合理?
(2)如果比赛采用五局三胜制进行比赛,求比赛的局数X的分布列和期望;
X 3 4 5
P
(3)如果每局比赛甲获胜的概率为p(0<p<1),乙获胜的概率为q(q=1-p),比赛的赛制有五局三胜制和三局两胜制两种选择,请问对于甲选手来说,如何选择比赛赛制对自己更有利,请说明理由,由此你能得出什么结论.
4. (2025·福建泉州一模)编号为1,2,3,…,n(n≥2,n∈N*)的n个球依次被等可能地涂成黑色或白色,设编号为奇数的黑色球的个数为X,编号为偶数的白色球的个数为Y,记事件“X>Y”为An,P(An)=an.
(1)求a2,a3,P(A3|A2);
(2)当n=2k+1(k∈N*)时,求an;
(3)当n=2k(k∈N*)时,设ξ=k+|X-Y|,证明:E(ξ)=2k(1-a2k).(共40张PPT)
专题六 概率与统计
第3讲 概率(大题)
第二课时 二项分布、超几何分布、正态分布
■真题研析
1. (2023·全国甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望.
∴X的分布列为
X 0 1 2
P
(2)试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5
30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3
40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8
19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2
32.3 36.5
(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
<m ≥m
对照组
试验组
<m ≥m
对照组 6 14
试验组 14 6
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
(ⅱ)由(ⅰ)中列联表可得
∴有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
(1)求p3,p4(用p表示);
(3)证明:对任意正整数m,p2m+1-q2m+1<p2m-q2m<p2m+2-q2m+2.
■热点突破
热点 二项分布
例1 (2025·浙江模拟)某手机厂对屏幕进行两项独立检测:亮度检测通过率0.875,色准检测通过率0.8.产品需通过两项检测才算合格.随机抽取3件产品,设合格品数为X.
(1)求单件产品为合格品的概率;
解:(1)设合格的概率为P,则P=P(亮度通过)×P(色准通过)=0.875×0.8=0.7.
(2)求X的分布列及数学期望;
X 0 1 2 3
P 0.027 0.189 0.441 0.343
数学期望E(X)=3×0.7=2.1.
(3)已知合格品利润为100元/件,若改进工艺能使亮度检测通过率提升至0.9,但每件成本增加1元.是否值得改进?
解:(3)改进前:
每件产品的合格概率p=0.7.对于3件产品,期望合格数E(X)=2.1.总期望利润=E(X)×100=2.1×100=210元.
改进后:
每件产品的合格概率p'=0.72,对于3件产品,新的期望合格数E(X')=3×0.72=2.16.总期望利润=E(X')×100=2.16×100=216元.净期望利润=216-3=213元.改进前的期望利润是210元,改进后是213元,改进后利润增加了3元.故值得改进.
规律方法 公式法解决二项分布问题是指利用二项分布的概率公式,求离散型随机变量的分布列、数学期望与方差.破解此类题的步骤如下:
热点 超几何分布
例2 为了调查阅读名著时间与作文成绩的关系,某高中实践活动小组随机对600名学生进行调查,了解每名学生平均每月阅读名著的时间(单位:h)与其作文成绩的情况,统计数据如表:
平均每月阅读
名著的时间≥
15 h 平均每月阅读
名著的时间<
15 h 合计
作文成绩优秀 220 80 300
作文成绩不优秀 180 120 300
合计 400 200 600
(1)以频率估计概率,用样本估计总体,若从该学校随机选取一名学生,求该学生的作文成绩优秀的概率;
(2)根据小概率值α=0.001的独立性检验,能否认为平均每月阅读名著的时间与作文成绩有关联?
(3)若按照分层随机抽样的方法从平均每月阅读名著的时间小于15 h的学生中选取5名学生进行调研,再从这5名学生中选取2名学生进行深度采访,记X为选取的这2名学生中作文成绩优秀的人数,求X的分布列和数学期望.
参考数据:
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
X 0 1 2
P
热点 正态分布
例3 为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,
从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,
故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416=0.040 8.
X的数学期望为E(X)=16×0.002 6=0.041 6.
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
解:(2)①如果生产状态正常,
一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,
一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.
因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,
可见上述监控生产过程的方法是合理的.
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
规律方法 利用正态曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称及曲线与x轴之间的面积为1,注意下面三个结论的活用:
(1)对任意的a,有P(X<μ-a)=P(X>μ+a).
(2)P(X<x0)=1-P(X≥x0).
(3)P(a<X<b)=P(X<b)-P(X≤a).
冲刺集训29 二项分布、超几何分布、正态分布
冲刺集训29 二项分布、超几何分布、正态分布
(1)求P(55<X<70);
Z 2 3 4 5 6
P
抗体 指标值 合计
小于60 不小于60
有抗体
没有抗体
合计
解:(1)由题可得,2×2列联表如表:
抗体 指标值 合计
小于60 不小于60
有抗体 25 125 150
没有抗体 20 30 50
合计 45 155 200
(2)用甲组中小白鼠产生抗体的频率估计概率,记乙组小白鼠在注射疫苗后产生抗体的只数为X,当P(X=k)(0≤k≤100,k∈N)取最大值时,求k.
参考数据:
α 0.1 0.05 0.005 0.001
xα 2.706 3.841 7.879 10.828
(2)从盒子中1次随机取出1个球,取出后不放回,共取2次,设取出的黑球数量为X,求X的分布列与期望.
X 0 1 2
P
(2)记抛掷n次得分为Xn,求Xn的分布列及数学期望.
Xn n n+1 … n+k … 2n
P … …