名称 | 2024届高考数学二轮复习专题五统计与概率(课件+学案)(含解析) | | |
格式 | zip | ||
文件大小 | 12.7MB | ||
资源类型 | 教案 | ||
版本资源 | 通用版 | ||
科目 | 数学 | ||
更新时间 | 2024-01-29 14:46:31 |
当p∈(0,)时,f′(p)>0,当p∈(,1)时,f′(p)<0,
所以f(p)最大时p的值p0=.
(3) 解析:由(2)知p=.
设Y表示余下的480件产品中不合格品的数量,依题意知Y~B(480,),
所以E(Y)=480×=72.
若不对该箱余下的口罩做检验,这一箱产品的检验费用与赔偿费用的和记为X,则X=0.2×20+5Y,
所以E(X)=0.2×20+5×E(Y)=364.
如果对余下的产品做检验,这一箱产品所需要的检验费为0.2×500=100(元).
364远大于100,所以应该对余下的480个口罩进行检验.
[巩固训练5] (1) 解析:依题意有χ2=≈6.061<6.635,
∴没有99%的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关.
(2) 解析:由题意得:该地区每名密切接触者感染病毒的概率为=,
设随机抽取的4人中至多有2人感染病毒为事件A,则P(A)=)2()2=;
(3) 解析:f(p)=(1-p)p+(1-p)2p=p(1-p)(2-p)=p3-3p2+2p
则f′(p)=3p2-6p+2,
令f′(p)=0,则p1=,p2=(舍去),
当0
0,函数f(p)在(0,)上单调递增,
当
所以,当p=时,该家庭至少检测了2名成员才能确定为“感染高危家庭”的可能性最大.(共83张PPT) α 0.1 0.05 0.01 0.005 0.001 (3)现对一箱产品检验了20个,结果恰有3个不合格品,以(2)中确定的p0作为p的值.已知每个口罩的检验费用为0.2元,若有不合格品进入用户手中,则生产商要为每个不合格品支付5元的赔偿费用.以检验费用与赔偿费用之和的期望为决策依据,是否要对这箱产品余下的480个口罩做检验? 附:χ2=
统计与概率
1.[2023·福建厦门模拟]某餐馆在A网站有200条评价,好评率为90%,在B网站有100条评价,好评率为87%.综合考虑这两个网站的信息,这家餐馆的好评率为( )
A.88% B.88.5% C.89% D.89.5%
答案:C
2.[2023·河南安阳三模]小明在跨境电商平台上从国外购买了几件商品,这些商品的价格如果按美元计,则平均数为20,方差为50,如果按人民币计(汇率按1美元=7元人民币),则平均数和方差分别为( )
A.20,50 B.140,350
C.140,700 D.140,2 450
答案:D
解析:由题意知这些商品的价格如果按人民币计算,价格是按美元计算的价格的7倍,
故按人民币计,则平均数和方差分别为7×20=140,72×50=2 450.故选D.
3.[2023·江苏盐城三模](多选)随机抽取6位影迷对电影《长津湖》的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有( )
A.均值为95 B.极差为6
C.方差为26 D.第80百分位数为97
答案:ABD
4.[2023·天津南开二模]某车间从生产的一批零件中随机抽取了1 000个进行一项质量指标的检测,整理检测结果得到此项质量指标的频率分布直方图如图所示.若用分层抽样的方法从质量指标在区间[40,70)的零件中抽取170个进行再次检测,则质量指标在区间[50,60)内的零件应抽取( )
A.30个 B.40个
C.60个 D.70个
答案:C
(1)[2023·山东滨州二模]某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中数据用该组区间中点值近似代替)( )
A.x3
(2)[2023·广东深圳二模](多选)光明学校组建了演讲、舞蹈、航模、合唱、机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委在全校学生中随机选取一部分学生(这部分学生人数少于全校学生人数)进行调查,并将调查结果绘制成了如下两个不完整的统计图:则( )
A.选取的这部分学生的总人数为500人
B.合唱社团的人数占样本总量的40%
C.选取的学生中参加机器人社团的学生数为78人
D.选取的学生中参加合唱社团的人数比参加机器人社团人数多125
答案:ABD
技法领悟
众数、中位数、平均数与直方图的关系
1.众数为频率分布直方图中最高矩形的底边中点的横坐标.
2.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
3.平均数等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的和.
[巩固训练1] (1)[2021·新高考Ⅰ卷](多选)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
答案:CD
解析:A:E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;
B:若第一组中位数为xi,则第二组的中位数为yi=xi+c,显然不相同,错误;
C:D(y)=D(x)+D(c)=D(x),故方差相同,正确;
D:由极差的定义知:若第一组的极差为xmax-xmin,则第二组的极差为ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故极差相同,正确.故选CD.
(2)[2023·安徽铜陵三模](多选)近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识,某校为了了解学生的身体素质状况,举行了一场身体素质体能测试,以便对体能不达标的学生进行有效的训练,促进他们体能的提升,现从全部测试成绩中随机抽取200名学生的测试成绩,进行适当分组后,画出如下频率分布直方图,则( )
A.a=0.020
B.在被抽取的学生中,成绩在区间[80,100]内的学生有70人
C.估计全校学生体能测试成绩的平均数为77.5
D.估计全校学生体能测试成绩的69%分位数为84
答案:ACD
答案:B
解析:线性相关系数|r|越大,两个变量的线性相关性越强,故A错误,B正确;
残差平方和S2越小,则决定系数R2越大,从而两个变量拟合的效果越好,
残差平方和S2越大,则决定系数R2越小,从而两个变量拟合的效果越差,故C、D错误.故选B.
2.[2023·辽宁实验中学模拟]已知x,y的对应值如下表所示:
若y与x线性相关,且经验回归方程为y=1.6x+0.6,则m=( )
A.2 B.3 C.4 D.5
x 0 2 4 6 8
y 1 m+1 2m+1 3m+3 11
答案:B
答案:C
(1)[2023·河北石家庄三模]观察下列四幅残差图,满足一元线性回归模型中对随机误差的假定的是( )
答案:B
解析:根据一元线性回归模型中对随机误差e的假定,残差应是均值为0、方差为σ2的随机变量的观测值.A图表示残差与观测时间有线性关系,故A错;
B图表示残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故B正确;
C图表示残差与观测时间有非线性关系,故C错;
D图表示残差的方差不是一个常数,随着观测时间变大而变大,故D错.故选B.
答案:C
男生 女生 合计
喜欢滑冰 2x
不喜欢滑冰 x
合计 3x x 4x
答案:C
答案:BCD
答案:D
2.[2023·安徽亳州一中模拟]在数字通信中,信号是由数字0和1组成的序列.由于随机因素的干扰,发送的信号0或1可能被错误的接收为1或0.已知发送信号0时,接收为0和1的概率分别为0.9和0.1;发送信号为1时,接收为1和0的概率分别为p和1-p.假设发送信号0和1是等可能的.已知接收到1的概率为0.525,则p的值为( )
A.0.8 B.0.85 C.0.9 D.0.95
答案:D
答案:D
4.[2023·河南郑州模拟]已知某小麦品种的株高X(单位:cm)服从正态分布N(78,σ2),且P(76
3.(1)[2023·全国甲卷]有50人报名足球俱乐部,60人报名乒乓球俱乐部,70人报名足球或乒乓球俱乐部,若已知某人报足球俱乐部,则其报乒乓球俱乐部的概率为( )
A.0.8 B.0.4 C.0.2 D.0.1
答案:A
答案:C
技法领悟
求复杂事件概率的两种方法
1.直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或一独立重复试验问题,然后用相应概率公式求解.
2.间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
[巩固训练3] (1)[2023·湖北武昌实验中学模拟]设某公路上经过的货车与客车的数量之比为2∶1,货车中途停车修理的概率为0.02,客车为0.01,今有一辆汽车中途停车修理,则该汽车是货车的概率为( )
A.0.8 B.0.6 C.0.5 D.0.3
答案:A
答案:D
第二讲 统计、统计案例与概率——大题备考
高考试题对统计、统计案例与概率的考查主要围绕五个方面:一是概率的综合、二是概率与频率分布直方图的综合、三是概率与线性回归、独立性检验的综合、四是概率统计与数列的交汇、五是概率统计与导数的交汇.
微专题1 概率的综合
[2022·全国甲卷]甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
解析:由题意得,X的所有可能取值为0,10,20,30.
易知乙学校在三个项目中获胜的概率分别为0.5,0.6,0.2,则
P(X=0)=(1-0.5)×(1-0.6)×(1-0.2)=0.16,
P(X=10)=0.5×(1-0.6)×(1-0.2)+(1-0.5)×0.6×(1-0.2)+(1-0.5)×(1-0.6)×0.2=0.44,
P(X=20)=0.5×0.6×(1-0.2)+0.5×(1-0.6)×0.2+(1-0.5)×0.6×0.2=0.34,
P(X=30)=0.5×0.6×0.2=0.06,
所以X的分布列为
则E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
X 0 10 20 30
P 0.16 0.44 0.34 0.06
1.[2023·河北保定一模]在过去三年防疫攻坚战中,我国的中医中药起到了举世瞩目的作用.某公司收到国家药品监督管理局签发的散寒化湿颗粒《药品注册证书》,散寒化湿颗粒是依据第六版至第九版《新型冠状病毒肺炎诊疗方案》中的“寒湿疫方”研制的中药新药.初期为试验这种新药对新冠病毒的有效率,把该药分发给患有相关疾病的志愿者服用.
(1)若10位志愿者中恰有6人服药后有效,从这10位患者中选取3人,以ξ表示选取的人中服药后有效的人数,求ξ的分布列和数学期望;
ξ 0 1 2 3
P
(2)若有3组志愿者参加试验,甲,乙,丙组志愿者人数分别占总数的40%,32%,28%,服药后,甲组的有效率为64%,乙组的有效率为75%,丙组的有效率为80%,从中任意选取一人,发现新药对其有效,计算他来自乙组的概率.
技法领悟
1.明确随机变量的可能有哪些,且每一个取值所表示的意义.
2.要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率.
3.均值能反映随机变量取值的“平均水平”,因此,当均值不同时,两个随机变量取值的水平可见分晓,由此可对实际问题作出决策判断;若两个随机变量均值相同,则可通过分析两个变量的方差来作出决策.
[巩固训练1] [2021·新高考Ⅰ卷]某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
X 0 20 100
P 0.2 0.32 0.48
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
微专题2 概率与频率分布直方图的综合
[2023·河南郑州模拟]2023 U.I.M.F1摩托艇世界锦标赛中国郑州大奖赛于2023年4月29日~30日在郑东新区龙湖水域举办.这场世界瞩目的国际体育赛事在风光迤逦的龙湖上演绎了速度与激情,全面展示了郑州现代化国家中心城市的活力与魅力.为让更多的人了解体育运动项目和体育精神,某大学社团举办了相关项目的知识竞赛,并从中随机抽取了100名学生的成绩,绘制成如图所示的频率分布直方图.
(1)求频率分布直方图中成绩的平均数和中位数(同一组数据用该组区间的中点值代替);
(2)若先采用分层抽样的方法从成绩在[80,90),[90,100]的学生中共抽取6人,再从这6人中随机抽取2人为赛事志愿者,求这2名志愿者中至少有一人的成绩在[90,100]的概率.
2.[2023·黑龙江大庆实验中学模拟]某学校为了解学生对航天知识的知晓情况,在全校学生中开展了航天知识测试(满分100分),随机抽取了100名学生的测试成绩,按照[60,70),[70,80),[80,90),[90,100]分组,得到如下所示的样本频率分布直方图:
(1)根据频率分布直方图,估计该校学生测试成绩的平均数;
(2)从测试成绩在[90,100]的同学中再次选拔进入复赛的选手,一共有6道题,从中随机挑选出4道题进行测试,至少答对3道题者才可以进入复赛.现有甲、乙两人参加选拔,在这6道题中甲能答对4道,乙能答对3道,且甲、乙两人各题是否答对相互独立.记甲、乙两人中进入复赛的人数为ξ,求ξ的分布列及期望.
ξ 0 1 2
P
技法领悟
解决此类问题时,准确的把题中所涉及的事件分解,明确所求问题所属事件类型是关键.
[巩固训练2] [2023·河北沧州模拟]据相关机构调查表明我国中小学生身体健康状况不容忽视,多项身体指标(如肺活量、柔韧度、力量、速度、耐力等)自2000年起呈下降趋势,并且下降趋势明显,在国家的积极干预下,这种状况得到遏制,并向好的方向发展,到2019年中小学生在肺活量、柔韧度、力量、速度、耐力等多项指标出现好转,但肥胖、近视等问题依然严重,体育事业任重道远.某初中学校为提高学生身体素质,日常组织学生参加中短跑锻炼,学校在一次百米短跑测试中,抽取200名女生作为样本,统计她们的成绩(单位:秒),整理得到如图所示的频率分布直方图(每组区间包含左端点,不包含右端点).
(1)估计样本中女生短跑成绩的平均数;(同一组的数据用该组区间的中点值为代表)
解析:(1)估计样本中女生短跑成绩的平均数为:
(11×0.02+13×0.06+15×0.18+17×0.14+19×0.06+21×0.03+23×0.01)×2=16.16.
微专题3 概率与线性回归、独立性检验的综合
[2020·新高考Ⅰ卷]为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
3.[2022·新高考Ⅰ卷]一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
不够良好 良好
病例组 40 60
对照组 10 90
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
技法领悟
1.对于线性回归、独立性检验问题,只要熟悉公式,认真计算,就能得分.
2.对于概率问题,要弄清概率模型,正确区分二项分布与超几何分布.
A充电桩投资金额x/万元 3 4 6 7 9 10
所获利润y/百万元 1.5 2 3 4.5 6 7
(1)已知可用一元线性回归模型拟合y与x的关系,求其经验回归方程;
X 0 1 2 3 4
P
微专题4 概率统计与数列的交汇
4.[2023·新高考Ⅰ卷]甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
技法领悟
概率问题与数列的交汇,综合性较强,主要有以下类型
1.求通项公式:关键是找出概率Pn或数学期望E(Xn)的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式.
2.求和:主要是数列中的公式求和、错位求和、裂项求和.
3.利用等差、等比数列的性质,研究单调性、最值.
[巩固训练4] [2023·山东烟台三模]现有甲、乙两个袋子,每个袋子中均装有大小、形状、质地完全相同的2个黑球和1个红球,若每次分别从两个袋子中随机摸出1个球互相交换后放袋子中,重复进行n(n∈N*)次此操作.记第n次操作后,甲袋子中红球的个数为Xn.
(1)求X1的分布列和数学期望;
X1 0 1 2
P
(2)求第n次操作后,甲袋子中恰有1个红球的概率Pn.
微专题5 概率统计与导数的交汇
5.[2023·河北张家口一模]某医疗用品生产商用新旧两台设备生产防护口罩,产品成箱包装,每箱500个.
(1)若从新旧两台设备生产的产品中分别随机抽取100箱作为样本,其中新设备生产的100箱样本中有10箱存在不合格品,旧设备生产的100箱样本中有25箱存在不合格品,由样本数据,填写完成2×2列联表,并依据小概率值α=0.01的独立性检验,能否认为“有不合格品”与“设备”有关联?
单位:箱
是否有不合格品
设备 无不合格品 有不合格品 合计
新
旧
合计
是否有不合
格品设备 无不合格品 有不合格品 合计
新 90 10 100
旧 75 25 100
合计 165 35 200
(2)若每箱口罩在出厂前都要做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱口罩中任取20个做检验,再根据检验结果决定是否对余下的所有口罩做检验.设每个口罩为不合格品的概率都为p(0
xα 2.706 3.841 6.635 7.879 10.828
技法领悟
解决有关概率的最大(最小)问题往往利用函数的导数或不等式来实现.
[巩固训练5] [2023·江苏扬州模拟]今年5月以来,世界多个国家报告了猴痘病例,非洲地区猴痘地方性流行国家较多.我国目前为止尚无猴痘病例报告.我国作为为人民健康负责任的国家,对可能出现的猴痘病毒防控提前做出部署.同时国家卫生健康委员会同国家中医药管理局制定了《猴痘诊疗指南(2022年版)》.此《指南》中指出:①猴痘病人潜伏期5~21天;②既往接种过天花疫苗者对猴痘病毒存在一定程度的交叉保护力.据此,援非中国医疗队针对援助的某非洲国家制定了猴痘病毒防控措施之一是要求与猴痘病毒确诊患者的密切接触者集中医学观察21天.在医学观察期结束后发现密切接触者中未接种过天花疫苗者感染病毒的比例较大.对该国家200个接种与未接种天花疫苗的密切接触者样本医学观察结束后,统计了感染病毒情况,得到下面的列联表:
接种天花疫
苗与否/人数 感染猴痘病毒 未感染猴痘病毒
未接种天花疫苗 30 60
接种天花疫苗 20 90
(1)是否有99%的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关;
(2)以样本中结束医学观察的密切接触者感染猴痘病毒的频率估计概率.现从该国所有结束医学观察的密切接触者中随机抽取4人进行感染猴痘病毒人数统计,求其中至多有2人感染猴痘病毒的概率;
α 0.1 0.05 0.010
xα 2.706 3.841 6.635专题五 统计与概率
第一讲 统计与统计案例、概率——小题备考
微专题1 统计问题
常考常用结论
1.直方图的两个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
2.统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn).
(4)方差与标准差
方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2].
标准差:
s=.
1.[2023·福建厦门模拟]某餐馆在A网站有200条评价,好评率为90%,在B网站有100条评价,好评率为87%.综合考虑这两个网站的信息,这家餐馆的好评率为( )
A.88% B.88.5% C.89% D.89.5%
2.[2023·河南安阳三模]小明在跨境电商平台上从国外购买了几件商品,这些商品的价格如果按美元计,则平均数为20,方差为50,如果按人民币计(汇率按1美元=7元人民币),则平均数和方差分别为( )
A.20,50 B.140,350
C.140,700 D.140,2 450
3.[2023·江苏盐城三模](多选)随机抽取6位影迷对电影《长津湖》的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有( )
A.均值为95 B.极差为6
C.方差为26 D.第80百分位数为97
4.[2023·天津南开二模]某车间从生产的一批零件中随机抽取了1 000个进行一项质量指标的检测,整理检测结果得到此项质量指标的频率分布直方图如图所示.若用分层抽样的方法从质量指标在区间[40,70)的零件中抽取170个进行再次检测,则质量指标在区间[50,60)内的零件应抽取( )
A.30个 B.40个 C.60个 D.70个
(1)[2023·山东滨州二模]某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中数据用该组区间中点值近似代替)( )
A.x3
A.选取的这部分学生的总人数为500人
B.合唱社团的人数占样本总量的40%
C.选取的学生中参加机器人社团的学生数为78人
D.选取的学生中参加合唱社团的人数比参加机器人社团人数多125
技法领悟
众数、中位数、平均数与直方图的关系
1.众数为频率分布直方图中最高矩形的底边中点的横坐标.
2.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
3.平均数等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的和.
[巩固训练1] (1)[2021·新高考Ⅰ卷](多选)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
(2)[2023·安徽铜陵三模](多选)近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识,某校为了了解学生的身体素质状况,举行了一场身体素质体能测试,以便对体能不达标的学生进行有效的训练,促进他们体能的提升,现从全部测试成绩中随机抽取200名学生的测试成绩,进行适当分组后,画出如下频率分布直方图,则( )
A.a=0.020
B.在被抽取的学生中,成绩在区间[80,100]内的学生有70人
C.估计全校学生体能测试成绩的平均数为77.5
D.估计全校学生体能测试成绩的69%分位数为84
微专题2 统计案例问题
常考常用结论
1.方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数,回归方程的斜率和截距分别为==,=-,(,)是样本中心点,回归直线过样本中心点.
2.(1)正相关与负相关就看回归直线的斜率,斜率为正则为正相关,斜率为负则为负相关.
(2)样本相关系数
r=具有以下性质:r>0表示两个变量正相关,r<0表示两个变量负相关;|r|≤1,且|r|越接近于1,线性相关程度越强,|r|越接近于0,线性相关程度越弱.
3.“卡方公式”:χ2=,
n=a+b+c+d.
1.[2023·江苏天一中学模拟]对两组变量进行回归分析,得到不同的两组样本数据,第一组对应的相关系数,残差平方和,决定系数分别为r1,S,R,第二组对应的相关系数,残差平方和,决定系数分别为r2,S,R,则( )
A.若r1>r2,则第一组变量比第二组的线性相关关系强
B.若r>r,则第一组变量比第二组的线性相关关系强
C.若S>S,则第一组变量比第二组变量拟合的效果好
D.若R>R,则第二组变量比第一组变量拟合的效果好
2.[2023·辽宁实验中学模拟]已知x,y的对应值如下表所示:
x 0 2 4 6 8
y 1 m+1 2m+1 3m+3 11
若y与x线性相关,且经验回归方程为y=1.6x+0.6,则m=( )
A.2 B.3 C.4 D.5
3.某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得χ2=≈5.879,临界值表如下:
α 0.15 0.10 0.05 0.025 0.010
xα 2.072 2.076 3.841 5.024 6.635
则下列说法中正确的是( )
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下可以认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下可以认为“学生对2022年冬奥会的关注与性别无关”
2.(1)[2023·河北石家庄三模]观察下列四幅残差图,满足一元线性回归模型中对随机误差的假定的是( )
(2)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的3倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有95%的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.10 0.05 0.025 0.010
xα 2.706 3.841 5.024 6.635
A.12 B.18 C.36 D.48
技法领悟
1.求经验回归方程的关键
(1)正确理解,的计算公式并能准确地进行运算.
(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过经验回归方程估计和预测变量的值.
2.独立性检验的关键
(1)根据2×2列联表准确计算χ2,若2×2列联表没有列出来,要先列出此表.
(2)χ2的观测值越大,对应假设事件H0成立的概率越小,H0不成立的概率越大.
[巩固训练2] (1)在新高考改革中,山东省新高考实行的是6选3的3+3模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理6门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)
选物理 不选物理 总计
男生 340 110 450
女生 140 210 350
总计 480 320 800
表一
选生物 不选生物 总计
男生 150 300 450
女生 150 200 350
总计 300 500 800
表二
试根据小概率值α=0.005的独立性检验,分析物理和生物选课与性别是否有关( )
附:χ2=,
n=a+b+c+d.α=P(χ2≥xα)
α 0.15 0.10 0.05 0.025 0.01 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.选物理与性别有关,选生物与性别有关
B.选物理与性别无关,选生物与性别有关
C.选物理与性别有关,选生物与性别无关
D.选物理与性别无关,选生物与性别无关
(2)[2023·重庆万州模拟](多选)新能源汽车的核心部件是动力电池,碳酸锂是动力电池的主要成分.从2021年底开始,碳酸锂的价格一直升高,下表是2022年我国某企业前5个月购买碳酸锂价格与月份的统计数据.
月份代码x 1 2 3 4 5
碳酸锂价格y 0.5 0.8 1 1.2 1.5
若y关于x的经验回归方程为=0.28x+,则下列说法中正确的有( )
A.y与x的样本相关系数r<0
B.=0.16
C.经验回归方程=0.28x+经过点(3,1)
D.由经验回归方程可预测6月份的碳酸锂价格约为1.84
微专题3 概率问题
常考常用结论
1.古典概型的概率公式
P(A)=
2.条件概率
P(B|A)==
4.相互独立事件的概率:P(AB)=P(A)P(B)
5.二项分布:
Pn(k)=Cpk(1-p)n-k;E(X)=np;D(X)=np(1-p)
6.超几何分布:
P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.
E(X)=np=
7.正态分布:
若X~N(μ,σ2),则如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
1.[2022·新高考Ⅰ卷]从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
2.[2023·安徽亳州一中模拟]在数字通信中,信号是由数字0和1组成的序列.由于随机因素的干扰,发送的信号0或1可能被错误的接收为1或0.已知发送信号0时,接收为0和1的概率分别为0.9和0.1;发送信号为1时,接收为1和0的概率分别为p和1-p.假设发送信号0和1是等可能的.已知接收到1的概率为0.525,则p的值为( )
A.0.8 B.0.85 C.0.9 D.0.95
3.[2023·河北唐山三模]假设有两箱零件,第一箱内装有5件,其中有2件次品;第二箱内装有10件,其中有3件次品.现从两箱中随机挑选1箱,然后从该箱中随机取1个零件,若取到的是次品,则这件次品是从第一箱中取出的概率为( )
A. B. C. D.
4.[2023·河南郑州模拟]已知某小麦品种的株高X(单位:cm)服从正态分布N(78,σ2),且P(76
A.0.8 B.0.4 C.0.2 D.0.1
(2)已知从甲袋中摸出一个红球的概率是,从乙袋中摸出一个红球的概率是,现从两袋中各模出一个球,下列结论错误的是( )
A.两个球都是红球的概率为
B.两个球中恰有1个红球的概率为
C.两个球不都是红球的概率为
D.至少有1个红球的概率为
技法领悟
求复杂事件概率的两种方法
1.直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或一独立重复试验问题,然后用相应概率公式求解.
2.间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
[巩固训练3] (1)[2023·湖北武昌实验中学模拟]设某公路上经过的货车与客车的数量之比为2∶1,货车中途停车修理的概率为0.02,客车为0.01,今有一辆汽车中途停车修理,则该汽车是货车的概率为( )
A.0.8 B.0.6 C.0.5 D.0.3
(2)[2023·河南安阳三模]为了应对即将到来的汛期,某地防汛指挥部抽调6名专业人员(包括甲、乙两人)平均分成三组,对当地三处重点水利工程进行防汛安全检查,则甲、乙不同组的概率为( )
A. B. C. D.
第二讲 统计、统计案例与概率——大题备考
高考试题对统计、统计案例与概率的考查主要围绕五个方面:一是概率的综合、二是概率与频率分布直方图的综合、三是概率与线性回归、独立性检验的综合、四是概率统计与数列的交汇、五是概率统计与导数的交汇.
微专题1 概率的综合
[2022·全国甲卷]甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
1.[2023·河北保定一模]在过去三年防疫攻坚战中,我国的中医中药起到了举世瞩目的作用.某公司收到国家药品监督管理局签发的散寒化湿颗粒《药品注册证书》,散寒化湿颗粒是依据第六版至第九版《新型冠状病毒肺炎诊疗方案》中的“寒湿疫方”研制的中药新药.初期为试验这种新药对新冠病毒的有效率,把该药分发给患有相关疾病的志愿者服用.
(1)若10位志愿者中恰有6人服药后有效,从这10位患者中选取3人,以ξ表示选取的人中服药后有效的人数,求ξ的分布列和数学期望;
(2)若有3组志愿者参加试验,甲,乙,丙组志愿者人数分别占总数的40%,32%,28%,服药后,甲组的有效率为64%,乙组的有效率为75%,丙组的有效率为80%,从中任意选取一人,发现新药对其有效,计算他来自乙组的概率.
技法领悟
1.明确随机变量的可能有哪些,且每一个取值所表示的意义.
2.要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率.
3.均值能反映随机变量取值的“平均水平”,因此,当均值不同时,两个随机变量取值的水平可见分晓,由此可对实际问题作出决策判断;若两个随机变量均值相同,则可通过分析两个变量的方差来作出决策.
[巩固训练1] [2021·新高考Ⅰ卷]某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
微专题2 概率与频率分布直方图的综合
[2023·河南郑州模拟]2023 U.I.M.F1摩托艇世界锦标赛中国郑州大奖赛于2023年4月29日~30日在郑东新区龙湖水域举办.这场世界瞩目的国际体育赛事在风光迤逦的龙湖上演绎了速度与激情,全面展示了郑州现代化国家中心城市的活力与魅力.为让更多的人了解体育运动项目和体育精神,某大学社团举办了相关项目的知识竞赛,并从中随机抽取了100名学生的成绩,绘制成如图所示的频率分布直方图.
(1)求频率分布直方图中成绩的平均数和中位数(同一组数据用该组区间的中点值代替);
(2)若先采用分层抽样的方法从成绩在[80,90),[90,100]的学生中共抽取6人,再从这6人中随机抽取2人为赛事志愿者,求这2名志愿者中至少有一人的成绩在[90,100]的概率.
2.[2023·黑龙江大庆实验中学模拟]某学校为了解学生对航天知识的知晓情况,在全校学生中开展了航天知识测试(满分100分),随机抽取了100名学生的测试成绩,按照[60,70),[70,80),[80,90),[90,100]分组,得到如下所示的样本频率分布直方图:
(1)根据频率分布直方图,估计该校学生测试成绩的平均数;
(2)从测试成绩在[90,100]的同学中再次选拔进入复赛的选手,一共有6道题,从中随机挑选出4道题进行测试,至少答对3道题者才可以进入复赛.现有甲、乙两人参加选拔,在这6道题中甲能答对4道,乙能答对3道,且甲、乙两人各题是否答对相互独立.记甲、乙两人中进入复赛的人数为ξ,求ξ的分布列及期望.
技法领悟
解决此类问题时,准确的把题中所涉及的事件分解,明确所求问题所属事件类型是关键.
[巩固训练2] [2023·河北沧州模拟]据相关机构调查表明我国中小学生身体健康状况不容忽视,多项身体指标(如肺活量、柔韧度、力量、速度、耐力等)自2000年起呈下降趋势,并且下降趋势明显,在国家的积极干预下,这种状况得到遏制,并向好的方向发展,到2019年中小学生在肺活量、柔韧度、力量、速度、耐力等多项指标出现好转,但肥胖、近视等问题依然严重,体育事业任重道远.某初中学校为提高学生身体素质,日常组织学生参加中短跑锻炼,学校在一次百米短跑测试中,抽取200名女生作为样本,统计她们的成绩(单位:秒),整理得到如图所示的频率分布直方图(每组区间包含左端点,不包含右端点).
(1)估计样本中女生短跑成绩的平均数;(同一组的数据用该组区间的中点值为代表)
(2)由频率分布直方图,可以认为该校女生的短跑成绩X~N(μ,σ2),其中μ近似为女生短跑平均成绩,σ2近似为样本方差s2,经计算得s2=5.79,若从该校女生中随机抽取10人,记其中短跑成绩在(11.34,20.98]内的人数为Y,求P(Y≤8)(结果保留2个有效数字).
附参考数据:≈2.41,随机变量X服从正态分布N(μ,σ2),则P(μ-σ
[2020·新高考Ⅰ卷]为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
3.[2022·新高考Ⅰ卷]一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=·;
(ⅱ)利用该调查数据,给出P(A|B),P(A|)的估计值,并利用(ⅰ)的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
技法领悟
1.对于线性回归、独立性检验问题,只要熟悉公式,认真计算,就能得分.
2.对于概率问题,要弄清概率模型,正确区分二项分布与超几何分布.
A充电桩投资金额x/万元 3 4 6 7 9 10
所获利润y/百万元 1.5 2 3 4.5 6 7
(1)已知可用一元线性回归模型拟合y与x的关系,求其经验回归方程;
(2)若规定所获利润y与投资金额x的比值不低于,则称对应的投入额为“优秀投资额”.记2分,所获利润y与投资金额x的比值低于且大于,则称对应的投入额为“良好投资额”,记1分,所获利润y与投资金额x的比值不超过,则称对应的投入额为“不合格投资额”,记0分,现从表中6个投资金额中任意选2个,用X表示记分之和,求X的分布列及数学期望.
微专题4 概率统计与数列的交汇
4.[2023·新高考Ⅰ卷]甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
技法领悟
概率问题与数列的交汇,综合性较强,主要有以下类型
1.求通项公式:关键是找出概率Pn或数学期望E(Xn)的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式.
2.求和:主要是数列中的公式求和、错位求和、裂项求和.
3.利用等差、等比数列的性质,研究单调性、最值.
[巩固训练4] [2023·山东烟台三模]现有甲、乙两个袋子,每个袋子中均装有大小、形状、质地完全相同的2个黑球和1个红球,若每次分别从两个袋子中随机摸出1个球互相交换后放袋子中,重复进行n(n∈N*)次此操作.记第n次操作后,甲袋子中红球的个数为Xn.
(1)求X1的分布列和数学期望;
(2)求第n次操作后,甲袋子中恰有1个红球的概率Pn.
微专题5 概率统计与导数的交汇
5.[2023·河北张家口一模]某医疗用品生产商用新旧两台设备生产防护口罩,产品成箱包装,每箱500个.
(1)若从新旧两台设备生产的产品中分别随机抽取100箱作为样本,其中新设备生产的100箱样本中有10箱存在不合格品,旧设备生产的100箱样本中有25箱存在不合格品,由样本数据,填写完成2×2列联表,并依据小概率值α=0.01的独立性检验,能否认为“有不合格品”与“设备”有关联?
单位:箱
是否有不合格品 设备 无不合格品 有不合格品 合计
新
旧
合计
(2)若每箱口罩在出厂前都要做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱口罩中任取20个做检验,再根据检验结果决定是否对余下的所有口罩做检验.设每个口罩为不合格品的概率都为p(0
附表:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
附:χ2=,其中n=a+b+c+d.
技法领悟
解决有关概率的最大(最小)问题往往利用函数的导数或不等式来实现.
[巩固训练5] [2023·江苏扬州模拟]今年5月以来,世界多个国家报告了猴痘病例,非洲地区猴痘地方性流行国家较多.我国目前为止尚无猴痘病例报告.我国作为为人民健康负责任的国家,对可能出现的猴痘病毒防控提前做出部署.同时国家卫生健康委员会同国家中医药管理局制定了《猴痘诊疗指南(2022年版)》.此《指南》中指出:①猴痘病人潜伏期5~21天;②既往接种过天花疫苗者对猴痘病毒存在一定程度的交叉保护力.据此,援非中国医疗队针对援助的某非洲国家制定了猴痘病毒防控措施之一是要求与猴痘病毒确诊患者的密切接触者集中医学观察21天.在医学观察期结束后发现密切接触者中未接种过天花疫苗者感染病毒的比例较大.对该国家200个接种与未接种天花疫苗的密切接触者样本医学观察结束后,统计了感染病毒情况,得到下面的列联表:
接种天花疫 苗与否/人数 感染猴痘病毒 未感染猴痘病毒
未接种天花疫苗 30 60
接种天花疫苗 20 90
(1)是否有99%的把握认为密切接触者感染猴痘病毒与未接种天花疫苗有关;
(2)以样本中结束医学观察的密切接触者感染猴痘病毒的频率估计概率.现从该国所有结束医学观察的密切接触者中随机抽取4人进行感染猴痘病毒人数统计,求其中至多有2人感染猴痘病毒的概率;
(3)该国现有一个中风险村庄,当地政府决定对村庄内所有住户进行排查.在排查期间,发现一户3口之家与确诊患者有过密切接触,这种情况下医护人员要对其家庭成员逐一进行猴痘病毒检测.每名成员进行检测后即告知结果,若检测结果呈阳性,则该家庭被确定为“感染高危家庭”.假设该家庭每个成员检测呈阳性的概率均为p(0
α 0.1 0.05 0.010
xα 2.706 3.841 6.635