名称 | 新高考数学二轮复习专题五概率与统计 课件(共5份打包) | | |
格式 | zip | ||
文件大小 | 15.1MB | ||
资源类型 | 教案 | ||
版本资源 | 通用版 | ||
科目 | 数学 | ||
更新时间 | 2023-01-02 08:38:05 |
E(X)=np,D(X)=np(1-p). 对于B,0.943 9-0.93=0.013 9,0.951 1-0.937 2=0.013 9两个区间长度均为1个σ,但μ>0.93,由正态分布性质知,落在(0.93,0.943 9)内的概率大于落在(0.937 2,0.951 1)内的概率,故B错误; C.E(X)随着p的增大而减小 D.E(X)随着p的增大而增大 8.现有两种核酸检测方式;(1)逐份检测;(2)混合检测:将其中k份核酸分别取样混合在一起检测,若检测结果为阴性,则这k份核酸全为阴性,因而这k份核酸只要检测一次就够了;如果检测结果为阳性,为了明确这k份核酸样本究竟哪几份为阳性,就需要对这k份核酸再逐份检测,此时,这k份核酸的检测次数总共为k+1次.假设在接受检测的核酸样本中,每份样本的检测结果是阴性还是阳性都是独立的,并且每份样本是阳性的概率都为p(0 A.0.4 B.0.3 C.0.2 D.0.1 三、填空题
核心提炼
2.超几何分布
(2022·全国甲卷)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
例2
考向1 相互独立事件
设甲在三个项目中获胜的事件依次记为A,B,C,
所以甲学校获得冠军的概率为
=0.5×0.4×0.8+(1-0.5)×0.4×0.8+0.5×(1-0.4)×0.8+0.5×0.4× (1-0.8)
=0.16+0.16+0.24+0.04=0.6.
(2)用X表示乙学校的总得分,求X的分布列与期望.
依题可知,X的可能取值为0,10,20,30,
所以P(X=0)=0.5×0.4×0.8=0.16,
P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
P(X=30)=0.5×0.6×0.2=0.06.
则X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
(2022·漳州质检)北京冬奥会某个项目招募志愿者需进行有关专业、礼仪及服务等方面知识的测试,测试合格者录用为志愿者.现有备选题10道,规定每次测试都从备选题中随机抽出3道题进行测试,至少答对2道题者视为合格,已知每位参加笔试的人员测试能否合格是相互独立的.若甲能答对其中的6道题,乙能答对其中的8道题.求:
(1)甲、乙两人至多一人测试合格的概率;
例3
考向2 超几何分布
(2)甲答对的试题数X的分布列和均值.
由题可知,甲答对的试题数X可以取0,1,2,3,
故X的分布列为
(2022·湖北联考)某中学将立德树人融入到教育的各个环节,开展“职业体验,导航人生”的社会实践教育活动,让学生站在课程“中央”.为了更好地了解学生的喜好情况,根据学校实际将职业体验分为:救死扶伤的医务类、除暴安良的警察类、百花齐放的文化类、公平正义的法律类四种职业体验类型,并在全校学生中随机抽取100名学生调查意向选择喜好类型,统计如下:
例4
考向3 二项分布
类型 救死扶伤的医务类 除暴安良的警察类 百花齐放的文化类 公平正义的法律类
人数 30 20 20 30
在这100名学生中,随机抽取了3名学生,并以统计的频率代替职业意向类型的概率(假设每名学生在选择职业类型时仅能选择其中一类,且不受其他学生选择结果的影响).
(1)求救死扶伤的医务类、除暴安良的警察类这两种职业类型在这3名学生中都有选择的概率;
类型 救死扶伤的医务类 除暴安良的警察类 百花齐放的文化类 公平正义的法律类
人数 30 20 20 30
由题意设职业体验选择救死扶伤的医务类、除暴安良的警察类、百花齐放的文化类、公平正义的法律类的概率分别为P(A),P(B),P(C),P(D),
所以救死扶伤的医务类、除暴安良的警察类这两类职业类型在这3名学生中都有选择的概率为
(2)设这3名学生中选择除暴安良的警察类的随机数为X,求X的分布列与均值.
类型 救死扶伤的医务类 除暴安良的警察类 百花齐放的文化类 公平正义的法律类
人数 30 20 20 30
所以X的分布列为
规律方法
求随机变量X的均值与方差的方法及步骤
(1)理解随机变量X的意义,写出X可能的全部取值;
(2)求X取每个值时对应的概率,写出随机变量X的分布列;
(3)由均值和方差的计算公式,求得均值E(X),方差D(X);
(4)若随机变量X的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的均值和方差的公式求解.
(1)求北干道的N1,N2,N3,N4四个易堵塞路段至少有一个被堵塞的概率;
跟踪演练2
记北干道的N1,N2,N3,N4四个易堵塞路段至少有一个被堵塞为事件A,
(2)若南干道被堵塞路段的个数为X,求X的分布列及均值E(X);
由题意可知X的可能取值为0,1,2,
随机变量X的分布列为
(3)若按照“平均被堵塞路段少的路线是较好的高峰期出行路线”的标准,则从城西开往城东较好的高峰期出行路线是哪一条?请说明理由.
因为E(X)
考点三
核心提炼
解决正态分布问题的三个关键点
(1)对称轴x=μ.
(2)样本标准差σ.
(3)分布区间:利用3σ原则求概率时,要注意利用μ,σ分布区间的特征把所求的范围转化为3σ的特殊区间.
(1)(2022·太原模拟)已知随机变量X服从正态分布N(μ,σ2),若P(X≥1+a)=P(X≤1-a),则μ等于
A.0 B.1 C.2 D.-1
√
例5
因为P(X≥1+a)=P(X≤1-a),
(2)(多选)(2022·长春质检)国家质量监督检验标准中,医用口罩的过滤率是重要的指标,根据长期生产经验,某企业在生产线状态正常情况下生产的医用口罩的过滤率X~N(0.937 2,0.013 92).若生产状态正常,则下列结论正确的是
A.P(X≤0.9)<0.5
B.X的取值在(0.93,0.943 9)内的概率与在(0.937 2,0.951 1)内的概率相等
C.P(X<0.9)=P(X>0.974 4)
D.记ξ表示一天内抽取的50只口罩中过滤率大于μ+2σ的数量,则P(ξ≥1)>0.6
(参考数据:若X~N(μ,σ2) (σ>0),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3;0.9850≈0.364)
√
√
√
由X~N(0.937 2,0.013 92)知,
μ=0.937 2,σ=0.013 9,
对于A,由正态分布曲线可得P(X≤0.9)
所以P(ξ≥1)=1-P(ξ=0)=1-(1-p)50>1-(1-0.02)50,
1-(1-0.02)50=1-0.9850≈1-0.364=0.636>0.6,故D正确.
利用正态曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1,注意下面三个结论的灵活运用:
(1)对任意的a,有P(X<μ-a)=P(X>μ+a).
(2)P(X
(1)(2022·株洲质检)某工厂有甲、乙两条生产线生产同一型号的机械零件,产品的尺寸分别记为X,Y,已知X,Y均服从正态分布,X~N(μ1, ),Y~N(μ2, ),其正态分布密度曲线如图所示,则下列结论中正确的是
A.甲生产线产品的稳定性高于乙生产
线产品的稳定性
B.甲生产线产品的稳定性低于乙生产
线产品的稳定性
C.甲生产线的产品尺寸均值大于乙生产线的产品尺寸均值
D.甲生产线的产品尺寸均值小于乙生产线的产品尺寸均值
跟踪演练3
√
由图知甲、乙两条生产线的均值相等,甲的正态分布密度曲线较瘦高,所以甲生产线产品的稳定性高于乙生产线产品的稳定性.
(2)(2022·哈尔滨模拟)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取,并测量零件的直径尺寸,根据长期生产经验,可以认为这条生产线正常状态下生产的零件直径尺寸X(单位:cm)服从正态分布N(18,4),若X落在[20,22]内的零件个数为2 718,则可估计所抽取的这批零件中直径X高于22的个数大约为(附:若随机变量服从正态分布N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3)
A.27 B.40 C.228 D.455
√
由正态分布N(18,4)可知,μ=18,σ=2,
∴μ+σ=20,μ+2σ=22,
直径X高于22的个数大约为
2 718÷0.135 9×0.022 75=455.
专题强化练
一、单项选择题
1.设离散型随机变量X的分布列为
若随机变量Y=|X-1|,则P(Y=1)等于
A.0.3 B.0.4 C.0.6 D.0.7
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
X 0 1 2 3 4
P 0.2 0.1 0.1 0.3 m
因为Y=|X-1|,
所以P(Y=1)=P(X=0或X=2)=P(X=0)+P(X=2)=0.2+0.1=0.3.
2.(2022·广州模拟)已知随机变量X~N(μ,σ2),若P(μ≤X≤μ+1)=0.2,则P(X≥μ-1)等于
A.0.7 B.0.4 C.0.3 D.0.2
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由已知P(μ-1≤X≤μ)=P(μ≤X≤μ+1)=0.2,
所以P(X≥μ-1)=P(μ-1≤X≤μ)+P(X≥μ)=0.2+0.5=0.7.
3.一批电阻的电阻值X(单位:Ω)服从正态分布N(1 000,52).现从甲、乙两箱出厂成品中各随机抽取一个电阻,测得电阻值分别为1 011 Ω和982 Ω,可以认为
A.甲、乙两箱电阻均可出厂
B.甲、乙两箱电阻均不可出厂
C.甲箱电阻可出厂,乙箱电阻不可出厂
D.甲箱电阻不可出厂,乙箱电阻可出厂
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
因为X~N(1 000,52),
所以μ=1 000,σ=5,
所以μ-3σ=1 000-3×5=985,
μ+3σ=1 000+3×5=1 015.
因为1 011∈[985,1 015],982 [985,1 015],
所以甲箱电阻可出厂,乙箱电阻不可出厂.
4.(2022·韶关模拟)某一部件由三个电子元件按照如图所示的方式连接而成,元件1和元件2同时正常工作,或元件3正常工作,则部件正常工作,设三个电子元件正常工作的概率均为 ,且各个元件能否正常工作相互独立,那么该部件正常工作的概率为
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
讨论元件3正常与不正常,
5.(2022·萍乡模拟)高尔顿(钉)板是在一块竖起的木板上钉上一排排互相平行、水平间隔相等的圆柱形小木块(如图所示),并且每一排小木块数目都比上一排多一个,一排中各个小木块正好对准上面一排两个相邻小木块的正中央,从入口处放入一个直径略小于两个小木块间隔的小球,当小球从之间的间隙下落时碰到下一排小木块,它将以相等的可能性向左或向右落下,
若小球再通过间隙,又碰到下一排小木块.如此继续下去,
小球最后落入下方条状的格子内,则小球落到第⑤个格子的
概率是
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6.(2022·全国乙卷)某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则
A.p与该棋手和甲、乙、丙的比赛次序无关
B.该棋手在第二盘与甲比赛,p最大
C.该棋手在第二盘与乙比赛,p最大
D.该棋手在第二盘与丙比赛,p最大
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
设该棋手在第二盘与甲比赛连胜两盘的概率为P甲,
在第二盘与乙比赛连胜两盘的概率为P乙,
在第二盘与丙比赛连胜两盘的概率为P丙,
方法一 由题意可知,P甲=2p1[p2(1-p3)+p3(1-p2)]
=2p1p2+2p1p3-4p1p2p3,
P乙=2p2[p1(1-p3)+p3(1-p1)]=2p1p2+2p2p3-4p1p2p3,
P丙=2p3[p1(1-p2)+p2(1-p1)]=2p1p3+2p2p3-4p1p2p3.
所以P丙-P甲=2p2(p3-p1)>0,
P丙-P乙=2p1(p3-p2)>0,所以P丙最大,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
方法二 (特殊值法)
不妨设p1=0.4,p2=0.5,p3=0.6,
则该棋手在第二盘与甲比赛连胜两盘的概率
P甲=2p1[p2(1-p3)+p3(1-p2)]=0.4;
在第二盘与乙比赛连胜两盘的概率
P乙=2p2[p1(1-p3)+p3(1-p1)]=0.52;
在第二盘与丙比赛连胜两盘的概率
P丙=2p3[p1(1-p2)+p2(1-p1)]=0.6.
所以P丙最大,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
A.P(X=2)的值最大 B.P(X=0)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
√
二、多项选择题
X 0 1 2
P p-p2 1-p p2
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
X 0 1 2
P p-p2 1-p p2
所以p-p2=p(1-p)<1-p,即P(X=0)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
设混合检测方式,样本需要检测的总次数Y可能取值为1,11,
P(Y=1)=(1-p)10,P(Y=11)=1-(1-p)10,
故Y的分布列为
Y 1 11
P (1-p)10 1-(1-p)10
∴E(Y)=1×(1-p)10+11×[1-(1-p)10]=11-10×(1-p)10,
设逐份检测方式,样本需要检测的总次数X,则E(X)=10,
要使得混合检测方式优于逐份检测方式,
需E(Y)
2
3
4
5
6
7
8
9
10
11
12
13
14
又lg 0.794≈-0.1,
∴1-p>10lg 0.794=0.794,
∴p<1-0.794=0.206,
∴0
9.已知随机变量ξ的分布列如下表,D(ξ)表示ξ的方差,则D(2ξ+1)=____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.(2022·湖州模拟)盒中有4个球,其中1个红球,1个黄球,2个蓝球,从盒中随机取球,每次取1个,取后不放回,直到蓝球全部被取出为止,
在这一过程中取球次数为ξ,则ξ的均值E(ξ)=_____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题意可知,随机变量ξ的可能取值有2,3,4,
所以随机变量ξ的分布列如下表所示:
11.(2022·常州模拟)为了了解某类工程的工期,某公司随机选取了10个这类工程,得到如下数据(单位:天):17,23,19,21,22,21,19,17,22,19.若该类工程的工期X~N(μ,σ2)(其中μ和σ分别为样本的均值和标准差),由于情况需要,要求在22天之内完成一项此类工程,估计能够在规定时间内完成该工程的概率约为(保留两位小数)______.
附:若随机变量X服从正态分布N(μ,σ2),
则P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
0.84
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以σ=2.
所以P(20-2≤X≤20+2)≈0.682 7,
所以P(20≤X≤22)≈0.341 35,
所以P(X≤22)=0.5+0.341 35=0.841 35≈0.84.
12.(2022·苏州模拟)泊松分布是统计学里常见的离散型概率分布,由法国数学家泊松首次提出.泊松分布的概率分布列为P(X=k)= e-λ(k=0,1,2,…),其中e为自然对数的底数,λ是泊松分布的均值.已知某种商品每周销售的件数相互独立,且服从参数为λ(λ>0)的泊松分布.若每周销售1件该商品与每周销售2件该商品的概率相等,则两周共销售2件该商
品的概率为____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
四、解答题
13.(2022·潍坊模拟)根据国家部署,2022年中国空间站“天宫”将正式完成在轨建造任务,成为长期有人照料的国家级太空实验室,支持开展大规模、多学科交叉的空间科学实验.为普及空间站相关知识,某部门组织了空间站建造过程3D模拟编程闯关活动,它是由太空发射、自定义漫游、全尺寸太阳能、空间运输等10个相互独立的程序题目组成.规则是:编写程序能够正常运行即为程序正确.每位参赛者从10个不同的题目中随机选择3个进行编程,全部结束后提交评委测试,若其中2个及以上程序正确即为闯关成功.现已知10个程序中,甲只能正确完成其中6个,乙正确完成每个程序的概率为 ,每位选手每次编程都互不影响.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)求乙闯关成功的概率;
记乙闯关成功为事件A,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)求甲编写程序正确的个数X的分布列和均值,并判断甲和乙谁闯关成功的可能性更大.
由题意知随机变量X所有可能的取值为0,1,2,3,
故X的分布列为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14.(2022·济南模拟)某婴幼儿游泳馆为了吸引顾客,推出优惠活动,即对首次消费的顾客按80元收费,并注册成为会员,对会员消费的不同次数给予相应的优惠,标准如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
消费次数 第1次 第2次 第3次 不少于4次
收费比例 1 0.95 0.90 0.85
该游泳馆从注册的会员中,随机抽取了100位会员并统计他们的消费次数,得到数据如下:
消费次数 1次 2次 3次 不少于4次
频数 60 25 10 5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
消费次数 第1次 第2次 第3次 不少于4次
收费比例 1 0.95 0.90 0.85
假设每位顾客游泳1次,游泳馆的成本为30元.根据所给数据,回答下列问题:
(1)估计该游泳馆1位会员至少消费2次的概率;
消费次数 1次 2次 3次 不少于4次
频数 60 25 10 5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
25+10+5=40,即随机抽取的100位会员中,至少消费2次的会员有40位,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
消费次数 第1次 第2次 第3次 不少于4次
收费比例 1 0.95 0.90 0.85
(2)某会员消费4次,求这4次消费中,游泳馆获得的平均利润;
消费次数 1次 2次 3次 不少于4次
频数 60 25 10 5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
第1次消费时,80-30=50(元),所以游泳馆获得的利润为50元,
第2次消费时,80×0.95-30=46(元),所以游泳馆获得的利润为46元,
第3次消费时,80×0.90-30=42(元),所以游泳馆获得的利润为42元,
第4次消费时,80×0.85-30=38(元),所以游泳馆获得的利润为38元,
∴这4次消费中,游泳馆获得的平均利润为44元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
消费次数 第1次 第2次 第3次 不少于4次
收费比例 1 0.95 0.90 0.85
(3)假设每个会员最多消费4次,以事件发生的频率作为相应事件发生的概率,从该游泳馆的所有会员中随机抽取2位,记游泳馆从这2位会员的消费中获得的平均利润之差的绝对值为X,求X的分布列和均值E(X).
消费次数 1次 2次 3次 不少于4次
频数 60 25 10 5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题意知,X的所有可能取值为0,2,4,6.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
∴X的分布列为
1
2
3
4
5
6
7
8
9
10
11
12
13
14(共89张PPT)
第3讲 统计与成对数据的分析
专题五 概率与统计
考情分析
高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.
考点一 统计图表
考点二 回归分析
考点三 独立性检验
专题强化练
内容索引
统计图表
考点一
核心提炼
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(1)(多选)(2022·湖北八市联考)某中学举行党史知识竞赛,对全校参赛的1 000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是
A.图中的x值为0.020
B.这组数据的极差为50
C.得分在80分及以上的人数为400
D.这组数据的平均数的估计值为77
√
例1
√
√
由(0.005+x+0.035+0.030+0.010)×10=1,解得x=0.020,故选项A正确;
频率分布直方图无法看出这组数据的最大值和最小值,故选项B不正确;
得分在80分及以上的人数的频率为
(0.030+0.010)×10=0.4,
故人数为1 000×0.4=400,故选项C正确;
这组数据的平均数的估计值为55×0.05+65
×0.2+75×0.35+85×0.3+95×0.1=77.
故选项D正确.
(2)(多选)(2022·张家口模拟)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方计划建立“21世纪20年代强化气候行动工作组”,推动两国气候变化
合作和多边进程.为响应《宣言》要求,
某地区统计了2020年该地区一次能源消
费结构比例,并规划了2030年一次能源
消费结构比例,如图所示,
经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区
A.2030年煤的消费量相对2020年减少了
B.2030年天然气的消费量是2020年的5倍
C.2030年石油的消费量相对2020年不变
D.2030年水、核、风能的消费量是2020年
的7.5倍
√
√
设2020年该地区一次能源消费总量为a,
则2020年煤的消费量为0.6a,
规划2030年煤的消费量为a×2.5×0.3=
0.75a>0.6a,故A错误;
2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5× 0.2=0.5a=5×0.1a,故B正确;
2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a>0.2a,故C错误;
2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.
(1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
易错提醒
(1)(多选)(2022·潍坊模拟)某市共青团委统计了甲、乙两名同学近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图.则下列说法中正确的是
A.甲得分的30%分位数是31
B.乙得分的众数是48
C.甲得分的中位数小于乙得分的中位数
D.甲得分的极差等于乙得分的极差
跟踪演练1
√
√
√
对于A,甲得分从小到大排列为27,28,31,39,42,
45,55,55,58,66,而10×30%=3,
所以甲得分的30%分位数是35,A不正确;
对于B,乙的得分中有两个48,其余分数值均只
有一个,因此,乙得分的众数是48,B正确;
对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;
对于D,甲得分的极差、乙得分的极差都是39,D正确.
(2)(多选)(2022·广东六校联考)2021年1月11日,
国家统计局发布2020年全国居民消费价格指
数(CPI)相关数据,指出2020年较好地实现了
“居民消费价格涨幅3.5%左右”的物价调控
目标.2020年全国居民消费价格涨跌幅如折线
图所示,则
A.从环比看,CPI由2020年11月份的环比下降0.6%在12月份转为环比上涨0.7%
B.2020年1月份CPI同比增长最多
C.2020年CPI环比上涨的月份数比下跌的月份数多
D.2020年全年CPI同比平均比2019年上涨约2.5%
√
√
√
由图中环比折线图可以看出,2020年
11月份的环比为-0.6%,12月份的环比
为+0.7%,
所以CPI由2020年11月份的环比下降
0.6%在12月份转为环比上涨0.7%,故选项A正确;
由同比折线图可以看出,2020年1月份的CPI同比增长5.4%,全年最高,故选项B正确;
从环比折线图可以看出,2020年CPI环比上涨的月份数为6,环比下跌的月份数也为6,故选项C错误;
由同比折线图可知,2020年全年CPI同比平均比2019年上涨 ×(5.4%+5.2%+4.3%+3.3%+2.4%+2.5%+2.7%+2.4%+1.7%+0.5%-0.5%+0.2%)≈2.5%,选项D正确.
回归分析
考点二
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
核心提炼
(3)写出经验回归方程.
(2022·湖南六校联考)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2022年7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:万人)的数据如下表:
例2
日期 7月10日 7月11日 7月12日 7月13日 7月14日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
(1)依据表中的统计数据,请判断该电商平台直播的第x天与到该电商平台专营店购物的人数y(单位:万人)是否具有较高的线性相关程度?(注:若0.3<|r|<0.75,则线性相关程度一般,若|r|>0.75,则线性相关程度较高,计算r时精确度为0.01)
日期 7月10日 7月11日 7月12日 7月13日 7月14日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
所以该电商平台直播的第x天与到该电商平台专营店购物的人数y具有较高的线性相关程度.
(2)求购买人数y与直播的第x天的经验回归方程;用样本估计总体,请预测从2022年7月10日起的第38天到该专营店购物的人数(单位:万人).
日期 7月10日 7月11日 7月12日 7月13日 7月14日
第x天 1 2 3 4 5
人数y(单位:万人) 75 84 93 98 100
由(1)知可用一元线性回归模型拟合购买人数y与直播的第x天之间的关系.
预测从2022年7月10日起的第38天到该专营店购物的人数为314万人.
易错提醒
(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.
(4)区分样本相关系数r与决定系数R2.
(5)通过经验回归方程求的都是估计值,而不是真实值.
(1)(多选)(2022·汕头模拟)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是
A.样本相关系数r变大
B.残差平方和变大
C.决定系数R2变小
D.解释变量x与响应变量y的相关性变强
跟踪演练2
√
√
由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,
所以样本相关系数r的值变大,决定系数R2的值变大,残差平方和变小.
C.若该产品价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为-0.4
(2)(多选)(2022·重庆模拟)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如下表所示:
√
√
x 10 15 20 25 30
y 11 10 8 6 5
√
对A,B,由表中的数据可知,
所以日需求量大约为3.2 kg,所以C选项正确;
x 10 15 20 25 30
y 11 10 8 6 5
x 10 15 20 25 30
y 11 10 8 6 5
独立性检验
考点三
核心提炼
独立性检验的一般步骤
(1)根据样本数据列2×2列联表.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
(2022·济宁模拟)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%.学校为了考查学生对寄宿生活适应与否是否与性别有关,构建了如下2×2列联表:
例3
不适应寄宿生活 适应寄宿生活 合计
男生
女生
合计
(1)请将2×2列联表补充完整,并依据小概率值α=0.010的独立性检验,是否可以推断适应寄宿生活与否与性别有关;
不适应寄宿生活 适应寄宿生活 合计
男生
女生
合计
补充列联表如下:
不适应寄宿生活 适应寄宿生活 合计
男生 8 32 40
女生 32 28 60
合计 40 60 100
零假设为H0:适应寄宿生活与否与性别无关.
根据列联表中的数据得,
根据小概率值α=0.010的独立性检验,推断H0不成立,可以推断适应寄宿生活与否与性别有关联.
(2)从男生中以“是否适应寄宿生活”为标准采用分层随机抽样的方法抽取10人,再从这10人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为X,求随机变量X的分布列及均值.
不适应寄宿生活 适应寄宿生活 合计
男生 8 32 40
女生 32 28 60
合计 40 60 100
α 0.025 0.010 0.001
xα 5.024 6.635 10.828
由题意知,抽取的10人中,有2人不适应寄宿生活,有8人适应寄宿生活,
故随机变量X的取值可以是0,1,2,
随机变量X的分布列为
(1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
易错提醒
(2022·河北联考)《2021新锐品牌数字化运营白皮书》中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是针对企业本身,指2011年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发布的我国A市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分析数据.A市从购买家电类新锐品牌人群中随机调查了100位男性顾客和100位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如图所示的频数分布表:
跟踪演练3
消费金额(元) [0,100] (100,1 000] (1 000,5 000] (5 000,10 000] (10 000,+∞)
女性顾客人数 50 30 10 6 4
男性顾客人数 20 40 24 10 6
(1)若以我国A市2021年上半年新锐品牌人群用户性别分析数据作为A市抽取新锐品牌人群性别概率,从A市新锐品牌人群中随机抽取四人,X为四人中男性的人数,求X的概率分布列和均值;
若以我国A市2021年上半年新锐品牌人群用户性别比例数据作为A市抽取新锐品牌人群性别概率,则A市新锐品牌人群中随机抽取一人为男性的概率为75%,为女性的概率为25%,且X服从二项分布,
X的所有可能取值为0,1,2,3,4,
得X分布列为
(2)根据A市统计购买家电消费金额数据频数分布表,完成下列2×2列联表,并依据小概率值α=0.010的独立性检验,分析购买家电类新锐品牌人群消费金额千元以上是否与性别有关?
不超千元 千元以上 合计
女性顾客
男性顾客
合计
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
根据所给数据,可得2×2列联表:
不超千元 千元以上 合计
女性顾客 80 20 100
男性顾客 60 40 100
合计 140 60 200
零假设为H0:购买家电类新锐品牌人群消费金额千元以上与性别无关.
根据小概率值α=0.010的独立性检验,推断H0不成立,即认为购买家电类新锐品牌人群消费金额千元以上与性别有关.
专题强化练
一、单项选择题
1.某公司2022年1月至7月空调销售完成情况如图,如7月份销售量是190台,若月份为x,销售量为y,由统计数据(xi,yi)(i=1,2,…,7)得到散点图,下面四个经验回归方程类型中最适合作为销售量y和月份x的经验回归方程类型的是
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由散点图分布可知,散点图分布在一个二次函数的图象附近,因此,最适合作为销售量y和月份x的经验回归方程类型的是y=a+bx2.
2.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则
A.讲座前问卷答题的正确率的中位数
小于70%
B.讲座后问卷答题的正确率的平均数
大于85%
C.讲座前问卷答题的正确率的标准差
小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于B,讲座后问卷答题的正确率
分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;
对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
3.(2022·济南模拟)某学校于3月12日组织师生举行植树活动,购买垂柳、银杏、侧柏、海桐四种树苗共计1 200棵,比例如图所示.高一、高二、高三报名参加植树活动的人数分别为600,400,200,若每种
树苗均按各年级报名人数的比例进行分配,则高三年级
应分得侧柏的数量为
A.34 B.46 C.50 D.70
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由扇形统计图知,购买的1 200棵树苗中,侧柏的数量为1 200×25%=300,
依题意知,高一、高二、高三分到的侧柏的棵数比为600∶400∶200=3∶2∶1,
4.(2022·运城模拟)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型y=
(其中e为自然对数的底数)拟合,设z=ln y,其变换后得到一组数据:
由表可得经验回归方程z=0.2x+a,则
当x=60时,蝗虫的产卵量y的估计值为
A.e6 B.10 C.6 D.e10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
x 20 23 25 27 30
z 2 2.4 3 3 4.6
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由表格数据知,
x 20 23 25 27 30
z 2 2.4 3 3 4.6
∴z=0.2x-2,即ln y=0.2x-2,
∴y=e0.2x-2,∴当x=60时,y=e10,
故当x=60时,蝗虫的产卵量y的估计值为e10.
5.(2022·绵阳模拟)某车间从生产的一批产品中随机抽取了1 000个零件进行一项质量指标的检测,整理检测结果得此项质量指标的频率分布直方图如图所示,则下列结论错误的是
A.a=0.005
B.估计这批产品该项质量指标的众数为45
C.估计这批产品该项质量指标的中位数为60
D.从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以众数为45,故B正确;
质量指标大于等于60的有两组,
频率之和为(0.020+0.010)×10=0.3<0.5,
所以60不是中位数,故C错误;
由于质量指标在[50,70)之间的频率之和为(0.03+0.02)×10=0.5,
可以近似认为从这批产品中随机选取1个零件,其质量指标在[50,70)的概率约为0.5,故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故A正确;
6.为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为
A.74 B.128 C.138 D.136
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
二、多项选择题
7.(2022·益阳调研)据新华社报道,“十三五”以来,中国建成了全球规模最大的信息通信网络,光纤宽带用户占比从2015年底的56%提升至94%,行政村通光纤和4G的比例均超过了99%;中国移动网络速率在全球139个国家和地区中排名第4位;在5G网络方面,中国已
初步建成全球最大规模的5G移动网络.如图是某科研机构对我国2023-2029年5G用户规模和年增长率发展的预测图,则下列结论正确的是
2023-2029年中国5G用户规模和年增长率发展预测图
A.2023-2029年,我国5G用户规模逐年增加
B.2023-2028年,我国5G用户规模后3年的
方差小于前3年的方差
C.2023-2026年,我国5G用户规模的年增长
率逐年下降
D.2023-2029年,我国5G用户规模年增长最多的是2025年
1
2
3
4
5
6
7
8
9
10
11
12
13
14
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题图可知,2023-2029年,我国5G用
户规模逐年增加,故A正确;
2023-2028年,我国5G用户规模前3年
比后3年的分散,方差比后3年的大,故
B正确;
2023-2026年,我国5G用户规模的年增长率逐年下降,故C正确;
2023-2029年,我国5G用户规模年增长最多的是2024年,增加了35 978.6万人,而2025年我国5G用户规模增加了27 317.4万人,所以D错误.
B.借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7
C.y与x的样本相关系数r>0
D.2023年的借阅量一定不少于6.12万册
8.(2022·菏泽模拟)某地为响应“扶贫必扶智,扶智就是扶知识、扶技术、扶方法”的号召,建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如下表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
√
√
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
年借阅量y(万册) 4.9 5.1 5.5 5.7 5.8
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于B,因为5×75%=3.75,所以借阅量4.9,5.1,5.5,5.7,5.8的75%分位数为5.7,所以B正确;
对于C,因为0.24>0,所以y与x的样本相关系数r>0,所以C正确;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9.(2022·山东联考)为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随机抽取了50名高中生,通过问卷调查,得到以下数据:
选物理 不选物理
数学成绩优异 20 7
数学成绩一般 10 13
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
A.依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关
B.在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩
无关
C.95%的数学成绩优异的同学选择物理
D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会
发生变化
1
2
3
4
5
6
7
8
9
10
11
12
13
14
选物理 不选物理
数学成绩优异 20 7
数学成绩一般 10 13
√
√
因为4.844>3.841=x0.05,所以依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关;
因为4.844<6.635=x0.01,所以在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关;
若表中的数据都扩大为原来的10倍,
又48.44>10.828,故结论发生变化.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.(2022·连云港模拟)一组数据x1,x2,…,x10是公差为-1的等差数列,若去掉首末两项x1,x10后,则
A.平均数变大 B.中位数没变
C.方差变小 D.极差没变
1
2
3
4
5
6
7
8
9
10
11
12
13
14
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题意可知,对于选项A,
去掉x1,x10后的平均数为
即平均数不变,故选项A错误;
对于选项C,设公差为d,则原数据的方差为
去掉x1,x10后的方差为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
即方差变小,故选项C正确;
对于选项D,原数据的极差为x1-x10=-9d=9,
去掉x1,x10后的极差为x2-x9=-7d=7,
即极差变小,故选项D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
三、填空题
11.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示.(残差=观测值-预测值)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为 据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为_____.
4.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
因为样本(4,3)处的残差为-0.15,
12.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18].如图是按上述分组方法得到的频率分布直方图,若成绩低于a即为优秀,如果优秀的人数为14,则a的估计值是_______.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
测试结果位于[13,14)的频率为0.06<0.14,
测试结果位于[13,15)的频率为0.06+0.16>0.14,
所以a∈(14,15),
由题意可得0.06+(a-14)×0.16=0.14,
解得a=14.5.
四、解答题
13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
由表格中的数据易得
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14.(2022·广东大联考)中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区纯电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的经验回归方程为 =4.7x-
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)求y与x的样本相关系数r,并据此判断电动汽车销量y与年份x的相关程度;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
样本相关系数为
故y与x线性相关程度较强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
购买非电动车 购买电动车 总计
男性 39 6 45
女性 30 15 45
总计 69 21 90
依据小概率值α=0.025的独立性检验,能否认为购买电动汽车与车主性别有关;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
零假设为H0:购买电动汽车与车主性别无关.
根据小概率值α=0.025的独立性检验,推断H0不成立,即认为购买电动汽车与车主性别有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)在购买电动汽车的车主中按照性别进行分层随机抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为X,求X的分布列和均值.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.10 0.05 0.025 0.010 0.001
xα 2.706 3.841 5.024 6.635 10.828
故X的分布列为
1
2
3
4
5
6
7
8
9
10
11
12
13
14(共7张PPT)
规范答题5 概率与统计
专题五 概率与统计
(12分)(2022·新高考全国Ⅰ改编)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)依据小概率值α=0.01的独立性检验,能否认为患该疾病群体与未患该疾病群体的卫生习惯有差异? [切入点:求χ2]
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
思路分析
答题得分模板 规范答题不丢分
(1)求x2→下结论.
思路
(2)代入条件概率公式求R.
分析
(3)古典概型求条件概率→代入公式求R.
答题得分模板
规范答题不丢分
(1)解零假设为H。:患该疾病群体与未患该疾病群体的卫生习惯无差异
22
200×(40×90-60×10)2
由已知X
n(ad-bc)2
=24,①[2分]
①处求x2
(a+b)(c+d)(a+c)(b+d)
50×150×100×100
又x0.01=6.635<24,②[3分
②处判断H是否成立
所以依据小概率值α=0.01的独立性检验,推断H。不成立,即认为患该
疾病群体与未患该疾病群体的卫生习惯有差异.[4分]
(2)①证明
P(BIA)P(BIA)P(AB)P(A)
P(AB)P(A)
因为R=
③[6分]←--
③处代入条件概率公式
P(BIA)P(BIA)P(A)P(AB)
P(A)
P(AB)
P(AB)
P(B)P(A B)
P(B)
所以R=
④[8分]
④处整理化简凑成条件
P(B)P(AB)
P(B)P(A B)
概率公式
P(AIB)P(AIB)
所以R=
[9分]
P(AIB)P(AIB)
②解由已知
P(AIB)=40,P(AIB)=10
100
100
⑤处由古典概型求条件
又P(AB)=60,PA8=90,5
100
100
[11分]
概率
P(AIB)P(AIB
所以R=
2=6.[12分]
P(AIB)
P(AIB(共47张PPT)
培优点7 概率与统计的创新问题
专题五 概率与统计
概率与统计问题在近几年的高考中背景取自现实,题型新颖,综合性增强,难度加深,主要考查学生的阅读理解能力和数据分析能力.要从已知数表、题干信息中经过阅读分析判断获取关键信息,搞清各数据、各事件间的关系,建立相应的数学模型求解.
考点一 概率和数列的综合
考点二 概率和函数的综合
专题强化练
内容索引
概率和数列的综合
考点一
某商城玩具柜台五一期间促销,购买甲、乙系列的盲盒,并且集齐所有的产品就可以赠送节日礼物,现有甲、乙两个系列盲盒,每个甲系列盲盒可以开出玩偶A1,A2,A3中的一个,每个乙系列盲盒可以开出玩偶B1,B2中的一个.
(1)记事件En:一次性购买n个甲系列盲盒后集齐玩偶A1,A2,A3玩偶;事件Fn:一次性购买n个乙系列盲盒后集齐B1,B2玩偶.求概率P(E5)及P(F4);
例1
若一次性购买5个甲系列盲盒,得到玩偶的情况总数为35,集齐A1,A2,A3玩偶,则有两种情况:
①求{Qn}的通项公式;
②若每天购买盲盒的人数约为100,且这100人都已购买过很多次这两个系列的盲盒,试估计该礼品店每天应准备甲、乙两个系列的盲盒各多少个.
因为每天购买盲盒的100人都已购买过很多次,所以对于每一个人来说,某一天来购买盲盒时,可看作n→+∞,
即购买甲系列盲盒的人数的均值为40,所以礼品店应准备甲系列盲盒40个,乙系列盲盒60个.
本题的关键是通过审题,找到第n次购买与前一次购买之间的联系,从而找到数列的递推关系.
规律方法
(2022·青岛模拟)规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回地任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则该轮记为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量X,求X的分布列和均值;
跟踪演练1
由题知,X的取值可能为1,2,3,
所以X的分布列为
(2)为验证抽球试验成功的概率不超过 ,有1 000名数学爱好者独立地进行该抽球试验,记t表示成功时抽球试验的轮次数,y表示对应的人数,部分统计数据如下:
t 1 2 3 4 5
y 232 98 60 40 20
所以估计t=6时,y≈11;
估计t=7时,y≈4;
估计t≥8时,y<0,
预测成功的总人数为450+11+4=465.
由题知,在前n轮就成功的概率为
又因为在前n轮没有成功的概率为
概率和函数的综合
考点二
(2022·九江模拟)瑞昌剪纸被列入第二批国家级非物质文化遗产名录.为了弘扬中国优秀的传统文化,某校将举办一次剪纸比赛,共进行5轮比赛,每轮比赛结果互不影响.比赛规则如下:每一轮比赛中,参赛者在30分钟内完成规定作品和创意作品各2幅,若有不少于3幅作品入选,将获得“巧手奖”.5轮比赛中,至少获得4次“巧手奖”的同学将进入决赛.某同学经历多次模拟训练,指导老师从训练作品中随机抽取规定作品和创意作品各5幅,其中有4幅规定作品和3幅创意作品符合入选标准.
(1)从这10幅训练作品中,随机抽取规定作品和创意作品各2幅,试预测该同学在一轮比赛中获“巧手奖”的概率;
例2
由题可知,所有可能的情况如下,
(2)以上述两类作品各自入选的频率作为该同学参赛时每幅作品入选的概率.经指导老师对该同学进行赛前强化训练,规定作品和创意作品入选的概率共提高了 ,以获得“巧手奖”的次数均值为参考,试预测该同学能否进入决赛?
设强化训练后,规定作品入选的概率为p1,创意作品入选的概率为p2,
由已知可得,强化训练后该同学某一轮可获得“巧手奖”的概率为
=2p1p2(p1+p2)-3(p1p2)2=3p1p2-3(p1p2)2,
令p1p2=t,
∵该同学在5轮比赛中获得“巧手奖”的次数X~B(5,P),
易错提醒
构造函数求最值时,要注意变量的选取,以及变量自身的隐含条件对变量范围的限制.
(2022·新余模拟)学习强国中有两项竞赛答题活动,一项为“双人对战”,另一项为“四人赛”.活动规则如下:一天内参与“双人对战”活动,仅首局比赛可获得积分,获胜得2分,失败得1分;一天内参与“四人赛”活动,仅前两局比赛可获得积分,首局获胜得3分,次局获胜得2分,失败均得1分.已知李明参加“双人对战”活动时,每局比赛获胜的概率为 ;参加“四人赛”活动(每天两局)时,第一局和第二局比赛获胜的概率分别为p, .李明周一到周五每天都参加了“双人对战”活动和“四人赛”活动(每天两局),各局比赛互不影响.
(1)求李明这5天参加“双人对战”活动的总得分X的分布列和均值;
跟踪演练2
X可取5,6,7,8,9,10,
分布列为
(2)设李明在这5天的“四人赛”活动(每天两局)中,恰有3天每天得分不低于3分的概率为f(p).求p为何值时,f(p)取得最大值.
设一天得分不低于3分为事件A,
则恰有3天每天得分不低于3分的概率
专题强化练
1.(2022·湖北八市联考)2022年2月6日,中国女足在两球落后的情况下,以3∶2逆转击败韩国女足,成功夺得亚洲杯冠军,在之前的半决赛中,中国女足通过点球大战6∶5惊险战胜日本女足,其中门将朱钰两度扑出日本队员的点球,表现神勇.
(1)扑点球的难度一般比较大,假设罚点球的球员会等可能地随机选择球门的左、中、右三个方向射门,门将也会等可能地随机选择球门的左、中、右三个方向来扑点球,而且门将即使方向判断正确也有 的可能性扑不到球.不考虑其它因素,在一次点球大战中,求门将在前三次扑出点球的个数X的分布列和均值;
1
2
则X的分布列为
1
2
(2)好成绩的取得离不开平时的努力训练,甲、乙、丙、丁4名女足队员在某次传接球的训练中,球从甲脚下开始,等可能地随机传向另外3人中的1人,接球者接到球后再等可能地随机传向另外3人中的1人,如此不停地传下去,假设传出的球都能接住.记第n次传球之前球在甲脚下的概率为pn,易知p1=1,p2=0.
1
2
第n次传球之前球在甲脚下的概率为pn,
则当n≥2时,第(n-1)次传球之前,球在甲脚下的概率为pn-1,第(n-1)次传球之前,球不在甲脚下的概率为1-pn-1,
1
2
②设第n次传球之前,球在乙脚下的概率为qn,比较p10与q10的大小.
1
2
2.某网络购物平台每年11月11日举行“双十一”购物节,当天有多项优惠活动,深受广大消费者喜爱.
(1)已知该网络购物平台近5年“双十一”购物节当天成交额如下表:
1
2
年份 2018 2019 2020 2021 2022
成交额(百亿元) 9 12 17 21 27
求成交额y(百亿元)与时间变量x(记2018年为x=1,2019年为x=2,…依此类推)的经验回归方程,并预测2023年该平台“双十一”购物节当天的成交额(百亿元);
1
2
1
2
1
2
所以预测2023年该平台“双十一”购物节当天的成交额为30.7百亿元.
1
2
(2)在2023年“双十一”购物节前,某同学的爸爸、妈妈计划在该网络购物平台上分别参加A,B两店各一个订单的“秒杀”抢购,若该同学的爸爸、妈妈在A,B两店订单“秒杀”成功的概率分别为p,q,记该同学的爸爸和妈妈抢购到的订单总数量为X.
①求X的分布列及E(X);
由题意知,X的可能取值为0,1,2,
P(X=0)=(1-p)(1-q)=1-p-q+pq,
P(X=1)=(1-p)q+(1-q)p=p+q-2pq,
P(X=2)=pq,
所以X的分布列为
1
2
X 0 1 2
P 1-p-q+pq p+q-2pq pq
E(X)=p+q-2pq+2pq=p+q.
1
2
因为Y=kX,
设f(t)=2sin πt-πt,则E(Y)=f(t),
1
2
所以E(Y)取最大值时,k的值为3.
1
2