概率与统计是高考考查学生数学建模素养和数据分析素养的重要载体,在高考中占有非常重要的地位.概率与统计的命题方向主要有以下两类:一是概率计算问题;二是统计案例问题.近年来新高考加大了相互独立事件和条件概率的考查力度,由于该部分知识也恰是新教材中扩充的内容,切合了新课标对教学的要求,指引师生在后续的备考中要关注教材改版前后内容的变化,同时兼顾知识间的渗透与融合.
命题点一 立足统计本质、注重知识交融
[典例1] (2023·新高考Ⅱ卷)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f (c)=p(c)+q(c).当c∈[95,105]时,求f (c)的解析式,并求f (c)在区间[95,105]的最小值.
[解] (1)由题图知(100-95)×0.002=1%>0.5%,所以95<c<100,
设X为患病者的该指标,
则p(c)=P(X≤c)=(c-95)×0.002=0.5%,
解得c=97.5.
设Y为未患病者的该指标,
则q(c)=P(Y>c)=(100-97.5)×0.01+5×0.002=0.035=3.5%.
(2)当95≤c≤100时,
p(c)=(c-95)×0.002=0.002c-0.19,
q(c)=(100-c)×0.01+5×0.002=-0.01c+1.01,所以f (c)=p(c)+q(c)=-0.008c+0.82;
当100<c≤105时,
p(c)=5×0.002+(c-100)×0.012=0.012c-1.19,q(c)=(105-c)×0.002=-0.002c+0.21,
所以f (c)=p(c)+q(c)=0.01c-0.98.
综上所述,f (c)=
由一次函数的单调性知,函数f (c)在[95,100]上单调递减,在(100,105]上单调递增,作出f (c)在区间[95,105]上的大致图象(略),可得f (c)在区间[95,105]上的最小值f (c)min=f (100)=-0.008×100+0.82=0.02.
概率主要研究随机现象,统计主要研究数据,进行数据分析.将两者巧妙地融合是历年来高考命题的思想之一,高考曾将频率分布直方图与二项分布、超几何分布、正态分布融为一体考查,本题又将频率分布直方图与分位数、函数建模巧妙地融为一体,给出了新的命题动向.关注知识间的内在联系,研习高考命题思路,提升备考技能.
【教用·备选题】
(2024·安徽黄山一模)某校高三年级1 000名学生的高考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,[110,130),[130,150].
(1)求图中a的值,并根据频率分布直方图,估计这1 000名学生的这次考试数学成绩的第85百分位数;
(2)从这次数学成绩位于的学生中采用比例分配的分层随机抽样的方法抽取9人,再从这9人中随机抽取3人,该3人中成绩在区间的人数记为X,求X的分布列及数学期望.
[解] (1)由频率分布直方图可得(0.002 5+0.007 5+0.015 0×2+2a)×20=1,
解得a=0.005.
前四个矩形的面积之和为(0.002 5+0.007 5+2×0.015 0)×20=0.8,
前五个矩形的面积之和为0.8+0.005×20=0.9,
设这1 000名学生的这次考试数学成绩的第85百分位数为m,则0.8+×0.005=0.85,解得m=120,
因此,这1 000名学生的这次考试数学成绩的第85百分位数为120.
(2)数学成绩位于的学生人数之比为0.007 5∶0.015=1∶2,
所以,所抽取的9人中,数学成绩位于的学生人数为9×=3,数学成绩位于的学生人数为9×=6.
由题意可知,随机变量X的可能取值有0,1,2,3,则P==,P==,
P==,P==,
所以,随机变量X的分布列如下表所示:
X 0 1 2 3
P
所以,E=0×+1×+2×+3×=2.
命题点二 考查数据分析、渗透原理论证
[典例2] (2022·新高考Ⅰ卷改编)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
单位:人
组别 卫生习惯
不够良好 良好
病例组 40 60
对照组 10 90
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
(1)依据小概率值α=0.01的独立性检验,能否认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=;
②利用该调查数据,给出P(A|B),P(A|)的估计值,并利用①的结果给出R的估计值.
[解] (1)零假设为H0:患该疾病群体与未患该疾病群体的卫生习惯无差异.
χ2==
=24>6.635=x0.01,
依据小概率值α=0.01的独立性检验,推断H0不成立,即认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:R==,
由题意知,证明
=即可,
左边==,
右边==,
左边=右边,故R=.
②由已知P(A|B)=,P(A|)=,
又P()=,
所以R==6.
新教材与老教材相比,对核心概念、重要公式等都做了必要的拓展、补充或证明,平时备考需进一步加强对核心概念的认知和基本理论体系的建立.如本题(2)问与我们平时的备考不同,一是题干长,二是涉及条件概率,而且还是证明问题.本题看似麻烦,实则容易,由已知条件和所求R的值两个等式可分别利用条件概率公式展开相乘化简,即可得证;然后结合互斥、对立事件概率之间的关系就可以轻而易举地解答出最后一问.
【教用·备选题】
1.(2024·湖北荆州模拟)某果园产苹果,其中一堆苹果中大果与小果的比例为4∶1.
(1)若选择分层随机抽样,抽出100个苹果,其中大果的单果平均质量为240克,方差为300,小果的单果平均质量为190克,方差为320,试估计果园苹果的单果平均质量、方差;
(2)现用一台分选机筛选,已知这台分选机把大果筛选为小果的概率为10%,把小果筛选为大果的概率为5%,经过分选机筛选后,现从“大果”里随机抽取一个,求这个“大果”是真的大果的概率.
参考公式:样本划分为2层,各层的容量、平均数和方差分别为:;.记样本平均数为,样本方差为s2,s2=+()2].
[解] (1)因为大果与小果的比例为4∶1,
所以100个苹果中,大果的个数为×100=80,小果的个数为×100=20,
设大果的单果平均质量为克,方差为,小果的单果平均质量为克,方差为,
设100个苹果的单果平均质量为克,方差为s2,则==300,==320,
所以100个苹果的单果平均质量==230克,
100个苹果的方差s2=×[300+(240-230)2]+×[320+(190-230)2]=704,
故估计果园苹果的单果平均质量为230克,方差为704.
(2)设事件A1=“放入水果分选机的苹果为大果”,
事件A2=“放入水果分选机的苹果为小果”,
事件B=“水果分选机筛选的苹果为‘大果’”,
由题知P=,P=,
P=10%=,P=5%=,
所以P=1-P=1-=,
由全概率公式可得,P(B)=P+P
=PP+PP
==,
P=PP==,
因此,P==÷=,
所以从“大果”里随机抽取一个,这个“大果”是真的大果的概率为.
2.从装有3个红球和4个蓝球的袋中,每次随机摸出1个球,摸出的球不再放回,记Ai表示事件“第i次摸到红球”,i=1,2,…,7.
(1)求第一次摸到蓝球的条件下第二次摸到红球的概率;
(2)记P(A1A2A3)表示A1,A2,A3同时发生的概率,P(A3|A1A2)表示已知A1与A2都发生时A3发生的概率.
①证明:P(A1A2A3)=P(A1)P(A2|A1)P(A3|A1A2);
②求P(A3).
[解] (1)由条件概率公式可得P(A2|)===,
所以在第一次摸到蓝球的条件下,第二次摸到红球的概率为.
(2)①证明:由条件概率乘法公式
P(A3|A1A2)=,可得P(A1A2A3)=P(A1A2)P(A3|A1A2),
由P(A2|A1)=,
可得P(A1A2)=P(A1)P(A2|A1),
所以P(A1A2A3)=P(A1)P(A2|A1)P(A3|A1A2).
②由①可得P(A3)=
=)
==,所以P(A3)=.
1 / 7概率与统计是高考考查学生数学建模素养和数据分析素养的重要载体,在高考中占有非常重要的地位.概率与统计的命题方向主要有以下两类:一是概率计算问题;二是统计案例问题.近年来新高考加大了相互独立事件和条件概率的考查力度,由于该部分知识也恰是新教材中扩充的内容,切合了新课标对教学的要求,指引师生在后续的备考中要关注教材改版前后内容的变化,同时兼顾知识间的渗透与融合.
命题点一 立足统计本质、注重知识交融
[典例1] (2023·新高考Ⅱ卷)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f (c)=p(c)+q(c).当c∈[95,105]时,求f (c)的解析式,并求f (c)在区间[95,105]的最小值.
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
概率主要研究随机现象,统计主要研究数据,进行数据分析.将两者巧妙地融合是历年来高考命题的思想之一,高考曾将频率分布直方图与二项分布、超几何分布、正态分布融为一体考查,本题又将频率分布直方图与分位数、函数建模巧妙地融为一体,给出了新的命题动向.关注知识间的内在联系,研习高考命题思路,提升备考技能.
命题点二 考查数据分析、渗透原理论证
[典例2] (2022·新高考Ⅰ卷改编)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
单位:人
组别 卫生习惯
不够良好 良好
病例组 40 60
对照组 10 90
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
(1)依据小概率值α=0.01的独立性检验,能否认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=;
②利用该调查数据,给出P(A|B),P(A|)的估计值,并利用①的结果给出R的估计值.
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
新教材与老教材相比,对核心概念、重要公式等都做了必要的拓展、补充或证明,平时备考需进一步加强对核心概念的认知和基本理论体系的建立.如本题(2)问与我们平时的备考不同,一是题干长,二是涉及条件概率,而且还是证明问题.本题看似麻烦,实则容易,由已知条件和所求R的值两个等式可分别利用条件概率公式展开相乘化简,即可得证;然后结合互斥、对立事件概率之间的关系就可以轻而易举地解答出最后一问.
1 / 3