(共61张PPT)
v
第十章 计数原理、概率
10.8 概率统计的综合问题
2027高考数学一轮总复习
内容索引
课时作业
关键能力 提升
考试要求 三年考情 1.会从统计图表中提取有效信息,用以解决概率问题. 2.能够解决概率与回归分析、独立性检验的综合问题. 2023 2024 2025
新课标Ⅱ卷T19
关键能力 提升
考点1 频率分布直方图与概率
【例1】 (2025·北京朝阳区二模)某电商平台为了解用户对配送服务的满意度,分别从A地区和B地区随机抽取了500名和100名用户进行问卷评分调查,将评分数据按[40,50),[50,60),…,[90,100]分组整理得到如下频率分布直方图.(用频率估计概率)
(1)从A地区的全体用户中随机抽取一名,求该用户评分不低于60分的概率;
【解】设事件M:从A地区的全体用户中随机抽取一名,该用户评分不低于60分.
由频率分布直方图可知,从A地区抽取的500名用户中评分不低于60分的频率为(0.025+0.035+0.015+0.005)×10=0.8,所以P(M)=0.8.
(2)从B地区评分为[80,100]的样本中随机抽取2名,记评分不低于90分的用户人数为X,求X的分布列和数学期望;
【解】B地区评分为[80,100]的样本用户共有100×(0.010+0.005)×10
=15(人),
其中评分不低于90分的人数为5.
由题意可知,X的所有可能取值为0,1,2.
P(X=0)=,P(X=1)=,P(X=2)=.
所以X的分布列为
则X的数学期望E(X)=0×.
X 0 1 2
P
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,设A地区评分的平均值估计为μ1,A,B两地区评分的平均值估计为μ,比较μ1与μ的大小关系.(直接写出结论)
【解】μ1>μ.
根据频率分布直方图,估计A地区评分的平均值为μ1=45×0.05+55×0.15+
65×0.25+75×0.35+85×0.15+95×0.05=70.5(分),
估计B地区评分的平均值为45×0.1+55×0.2+65×0.3+75×0.25+85×0.1
+95×0.05=67(分)<μ1,
所以A,B两地区评分的平均值μ<μ1.
统计图表与概率综合问题的求解策略
(1)正确识读统计图表,从图表中提取有效信息及样本数据.
(2)根据统计原理即用样本数字特征估计总体的思想,结合样本中各统计量之间的关系构造数学模型(函数模型、不等式模型、二项分布模型、超几何分布模型或正态分布模型等).
(3)正确进行运算,求出样本数据中能够说明问题的特征值,从而用此数据估计总体或作出科学的决策与判断.
规律总结
【对点训练1】 (2025·广东广州三模)为减少环境污染,保护生态环境,某校进行了“垃圾分类知识普及活动”,并对高一、高二全体学生进行了相关知识测试.现从高一、高二各随机抽取了20名学生,对他们的成绩(百分制)进行了整理和分析后得到如下信息:
高一年级成绩分布表
成绩 [50,60) [60,70) [70,80) [80,90) [90,100]
人数 1 2 3 4 10
高二年级成绩频率分布直方图
(1)用频率估计概率,从高一和高二全体学生中各抽取一人,求这两人成绩都不低于90分的概率;
解:从高一年级成绩分布表可以看出,成绩不低于90分的频率为.
从高二年级成绩频率分布直方图中可以看出,成绩不低于90分的频率为0.025×10=0.25=.
所以从高一和高二全体学生中各抽取1人,这两人的成绩都不低于90分的概率为.
(2)从高一全体学生中抽取一人,从高二全体学生中抽取两人,随机变量X表示这三人中成绩不低于90分的人数,求X的分布列和数学期望.
解:根据题意可知,X的可能取值为0,1,2,3.
当X=0时,即这三个人的成绩都低于90分,此时概率P(X=0)=.
当X=1时,即这三个人中只有1人的成绩是不低于90分的,此时概率P(X=1)=.
当X=2时,即这三个人中只有2人的成绩是不低于90分的,此时概率P(X=2)=.
当X=3时,即这三个人的成绩都是不低于90分的,此时概率P(X=3)=.
所以X的分布列为
所以数学期望E(X)=0×=1.
X 0 1 2 3
P
考点2 独立性检验与概率
【例2】 (2025·山东临沂二模)体育是培养学生高尚人格的重要途径之一.足球作为一项团队运动项目,深受学生喜爱,为了解学生喜爱足球运动是否与性别有关,随机抽取了100名学生作为样本,统计得到如下的2×2列联表:
单位:名
项目 喜爱足球运动 不喜爱足球运动 合计
男生 40 a
女生 b 25
合计 100
已知从这100名学生中随机抽取1名,抽到喜爱足球运动的学生的概率为.
(1)求a,b;
【解】因为从这100名学生中随机抽取1名,抽到喜爱足球运动的学生的概率为,所以b=100×-40=20,a=100-40-25-b=15.
(2)根据小概率值α=0.001的独立性检验,判断学生喜爱足球运动是否与性别有关;
【解】零假设H0:学生喜爱足球运动与性别无关.
作出2×2列联表如下:
单位:名
项目 喜爱足 球运动 不喜爱足 球运动 合计
男生 40 15 55
女生 20 25 45
合计 60 40 100
由题知,χ2=≈8.249<10.828,
根据小概率值α=0.001的独立性检验,我们推断H0成立,也就是说学生喜爱足球运动与性别无关.
(3)用样本分布的频率估计总体分布的概率,现在从喜爱足球运动的学生中随机抽取30名,记其中男生的人数为Z,求使事件“Z=k”概率最大的k的值.
附:χ2=,n=a+b+c+d.
α 0.01 0.005 0.001
xα 6.635 7.879 10.828
【解】现在从喜爱足球运动的学生中随机抽取1名学生,该学生是男生的概率是,
从而从喜爱足球运动的学生中随机抽取30名时,记其中男生的人数为Z,则Z~B,
所以P(Z=k)=(k=0,1,…,30),
令
解得,
故使事件“Z=k”概率最大的k的值为20.
独立性检验与概率综合问题的解题思路
本类题目以生活题材为背景,涉及独立性检验与概率问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次按照随机变量满足的概率模型求解.
规律总结
【对点训练2】 人工智能对人们的生活有较大的影响,为了让老师更加重视人工智能,某校随机抽出30名男教师和20名女教师参加学校组织的“人工智能”相关知识问卷调查(满分100分),若分数为80分及以上的为优秀,其他为非优秀,统计并得到如下2×2列联表:
单位:名
项目 男教师 女教师 合计
优秀 20 15 35
非优秀 10 5 15
合计 30 20 50
(1)根据小概率值α=0.1的独立性检验,能否认为这次成绩是否优秀与性别有关
解:零假设H0:这次成绩是否优秀与性别无关.由2×2列联表中的数据,可得χ2=≈
0.397<2.706,
根据小概率值α=0.1的独立性检验,我们推断H0成立,即这次成绩是否优秀与性别无关.
(2)从样本中成绩非优秀的15名教师中,随机抽取2人进行调研,记抽出的2人中女教师的人数为X,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
解:由题意得,随机变量X的可能取值为0,1,2,则P(X=0)=;
P(X=1)=;
P(X=2)=.
所以随机变量X的分布列为
所以期望E(X)=0×.
X 0 1 2
P
考点3 回归分析与概率
【例3】 (2025·陕西咸阳三模)某市近来昼夜温差较大,若人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于儿童以及年老体弱的人群,所以要多加防范.某高中数学兴趣小组研究了昼夜温差大小与某社区新增感冒就诊人数之间的关系,他们记录了某六天的温差,并到社区卫生服务中心查阅了这六天中每天新增感冒就诊的人数,得到的数据如下表:
时间 第一天 第二天 第三天 第四天 第五天 第六天
昼夜温差 x/℃ 4 7 8 9 14 12
新增感冒 就诊人数 y/位 y1 y2 y3 y4 y5 y6
(1)已知第一天新增感冒就诊的人群中有4位男性,从第一天新增感冒就诊的人群中随机抽取2位,其中男性人数记为X,若抽取的2人中仅有一位女性的概率为,求随机变量X的分布列和数学期望;
【解】 因为, 所以,解得y1=9(分数值已舍去).
即第一天新增感冒就诊人数为9,其中男性4位,女性5位,
则随机变量X的所有可能取值为0,1,2,且X服从超几何分布,其中N=9,M=4,n=2,P(X=0)=,P(X=1)=,P(X=2)=,则X的分布列为
X的数学期望E(X)=0×.
X 0 1 2
P
(2)已知两个变量x与y之间的样本相关系数r=,请用最小二乘法求出y关于x的经验回归方程,并据此估计昼夜温差为16 ℃时,该社区卫生服务中心新增感冒就诊的人数.
参考数据:=3 463,(yi-)2=289.
参考公式:r=,=,.
【解】因为xi=54,所以=9, 所以(xi-)2=64,
由于r=,
所以(xi-)(yi-)=128,
所以=2,
因为=3 463,(yi-)2==289,解得=23,所以=23-2×9=5,所以=2x+5,
当x=16时,=32+5=37,据此估计昼夜温差为16 ℃时,该社区卫生服务中心新增感冒就诊的人数为37.
回归分析与概率综合问题的解题思路
(1)此类问题的特点为同一生活实践情境下设计两类问题,即①求经验回归方程(预测);②求某随机变量的概率(范围)、均值、方差等.
(2)充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确运算的目的.
(3)明确所求问题所属事件的类型,准确构建概率模型.
规律总结
【对点训练3】 (2026·湖南常德一模)某景区经过提质改造后统计连续5天进入该景区参观的人数(单位:千人)如表所示.
日期 3月 5日 3月 6日 3月 7日 3月 8日 3月
9日
第x天 1 2 3 4 5
参观人数y 2.2 2.6 3.1 5.2 6.9
(1)建立y关于x的经验回归方程,预测第10天进入该景区参观的人数;
解:依题意,=3,而xiyi=72,=55,=4,
则=1.2,=4-1.2×3=0.4,因此=1.2x+0.4,当x=10时,=1.2×10+0.4=12.4,
所以y关于x的经验回归方程为=1.2x+0.4,第10天进入该景区参观的人数约为12.4千人.
(2)该景区只开放东门、西门供游客出入,游客从东门、西门进入该景区的概率分别为,,且出景区与进入景区选择相同的门的概率为,出景区与进入景区选择不同的门的概率为,假设游客从东门、西门出入景区互不影响,求甲、乙两名游客都从西门出景区的概率.
附:参考数据:xiyi=72,=55,=4.
参考公式:经验回归直线
=,.
解:记“甲从西门进入景区”为事件A,“甲从西门出景区”为事件B,“乙从西门出景区”为事件C,则P(A)=,P()=,P(B|A)=,P(B|)=,
由全概率公式得,P(B)=P(B|A)P(A)+P(B|)P()=,同理P(C)=,
所以甲、乙两名游客都从西门出景区的概率P(BC)=P(B)P(C)=.
课时作业77
基础巩固
1.(15分)(2025·安徽合肥三模)近年来,“社区咖啡”的理念在全国各地深入人心,“社区咖啡”主要采用手冲咖啡的模式.已知某款手冲咖啡的二段萃取时间在100 s到110 s之间,现将某咖啡师一个月内完成的1 000次咖啡二段萃取时间进行统计,结果如图所示.
(1)求a的值及这1 000次二段萃取时间在[102,104)的次数;
解:由题意,利用频率分布直方图的性质,可得(0.025+a+0.175+0.125×2)
×2=1,解得a=0.050, 则这一个月内完成的1 000次咖啡二段萃取时间在[102,104)的次数为1 000×0.050×2=100.
(2)求这1 000次咖啡二段萃取时间的中位数以及平均数;
解:前两组的频率之和为(0.025+0.050)×2=0.15,前三组的频率之和为(0.025+0.050+0.175)×2=0.5,所以中位数为106 s,估计所求平均数为101×0.05+103×0.1+105×0.35+(107+109)×0.25=106.1(s).
(3)以频率估计概率,若从该咖啡师无数次的咖啡二段萃取时间中随机抽取3次,求至少有2次萃取时间超过108 s的概率.
解:萃取时间超过108 s的频率为0.125×2=0.25,即概率为0.25.设抽取3次,萃取时间超过108 s的次数为X,则X~B,所以P(X≥2)=P(X=2)+
P(X=3)=
.
2.(15分)(2026·山东淄博一模)某地为调查大型水域的水质情况,设置若干站点检测水质指数(“M指数”),以这些站点所测“M指数”的平均值为依据,播报此大型水域的水质情况.如图是某30天内该大型水域“M指数”的频率分布直方图,其中分组区间分别为[12,20),[20,28),[28,36),
[36,44),[44,52),[52,60),[60,68),[68,76].
(1)规定:“M指数”不超过50为“优质水源日”,否则称为“非优质水源日”.对该地区50名外出郊游的市民进行调查,得到如下列联表:
单位:名
请完成上述列联表,并根据α=0.05的独立性检验,能否认为优质水源日出游与性别有关
项目 男市民 女市民 合计
优质水源日出游 12 30
非优质水源日出游 6
合计 50
解:零假设为H0:优质水源日出游与性别无关.补全列联表如下:
单位:名
项目 男市民 女市民 合计
优质水源 日出游 12 18 30
非优质水 源日出游 14 6 20
合计 26 24 50
所以χ2=≈4.327>3.841,
根据α =0.05的独立性检验,推断H0不成立,故可认为优质水源日出游与性别有关,此推断犯错误的概率不超过0.05.
(2)从“M指数”在第一组[12,20)和第二组[20,28)的所有天数中选取3天的数据进行评价,记这3天的数据来自第一组的有X天,求X的分布列和数学期望.
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:根据题意,第一组有30×8×=3(天),第二组有30×8×=4(天),
所以X的可能取值为0,1,2,3,P(X=0)=,P(X=1)=,
P(X=2)=,P(X=3)=,所以X的分布列为
所以E(X)=0×.
X 0 1 2 3
P
3.(15分)(2025·湖南长沙三模)某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标xi,yi(i=1,2,3,4,5),数据如下表所示:
项目 地点1 地点2 地点3 地点4 地点5
x 2 4 5 6 8
y 3 4 4 4 5
试求y与x之间的样本相关系数r,并利用r说明y与x的线性相关程度;(若|r|>0.75,则线性相关程度较高,否则线性相关程度不高)
解:由题可知,=5, =4,(xi-)(yi-)=6,
==2,
=,
则样本相关系数r=≈0.95,
因为r>0.75,所以y与x的线性相关程度较高.
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附:r=,≈0.95.
解:设操作成功的次数为X,则X的所有可能取值为0,1,2.
P(X=0)=,
P(X=1)=,
P(X=2)=,所以E(X)=0×.
4.(15分)自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,某家专注于四足机器人研发的中国科技公司在全球范围内备受瞩目,旗下一款机器人在巡检与监控、安防与救援、科研与影视等方面应用广泛.现统计出该机器人在某地区2025年1月至5月的销售量如下表所示:
素养提升
月份x 1 2 3 4 5
销售量y/台 26 37 50 64 93
(1)经计算样本相关系数r≈0.98,故变量x,y的线性相关程度很强,求y关于x的经验回归方程;
解:由题表可得,×(1+2+3+4+5)=3,×(26+37+50+64+93)
=54, (xi-)2=4+1+0+1+4=10,(xi-)(yi-)=56+17+0+10+78=161,
所以=16.1,=54-16.1×3=5.7,故y关于x的经验回归方程是=16.1x+5.7.
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”的对数X的分布列和数学期望.
附:经验回归直线,.
解:当x=1时,=16.1×1+5.7=21.8,残差的绝对值为|26-21.8|=4.2<5;
当x=2时,=16.1×2+5.7=37.9,残差的绝对值为|37-37.9|=0.9<5;
当x=3时,=16.1×3+5.7=54,残差的绝对值为|50-54|=4<5;
当x=4时,=16.1×4+5.7=70.1,残差的绝对值为|64-70.1|=6.1>5;
当x=5时,=16.1×5+5.7=86.2,残差的绝对值为|93-86.2|=6.8>5.
所以“次数据”为第四组和第五组共两组数据.故“次数据”的对数X的所有可能取值为0,1,2.
P(X=0)=,P(X=1)=,P(X=2)=.
所以X的分布列为
X的数学期望E(X)=0×=1.2.
X 0 1 2
P
本课结束