2021版老高考数学(理)二轮复习解答题 精讲4 统计与概率课件(96张PPT)+学案

文档属性

名称 2021版老高考数学(理)二轮复习解答题 精讲4 统计与概率课件(96张PPT)+学案
格式 zip
文件大小 5.0MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2020-10-29 20:27:28

文档简介

 统计与概率
阅卷案例
思维导图
(2020·全国卷Ⅰ,T19,12分)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为.(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.本题考查:相互独立事件、互斥事件的概率等知识,逻辑推理、数学运算的核心素养.
答题模板
标准解答
踩点得分
第1步:辨型结合题干信息分析待求概率的模型.第2步:辨析辨析各事件间的关系.第3步:计算套用相应事件的概率公式计算求解.
第(1)问直接套用公式且结果正确得1分.第(2)问得分点及说明:1.每求对一种情况得1分,共3分.2.本问最终结果正确得2分.第(3)问得分点及说明:1.每求对一种情况得1分,共4分.2.本问最终结果正确得2分.
命题点1 用样本估计总体
 总体估计的方法
(1)统计量法:①若数据已知,常借助,s2等量对样本总体做出估计,其中=,s2=
(xi-)2.
②若数据未知,如以频率分布直方图形式给出,则应明确直方图中各统计量的求法.
(2)图表分析法:若根据图表比较样本数据的大小,可根据数据分布情况直观分析,大致判断平均数的范围,并依据数据的波动情况比较方差(标准差)的大小.
[高考题型全通关]
1.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值.经数据处理后得到该样本的频率分布直方图,其中质量指标值不大于1.50的茎叶图如图所示,以这100件产品的质量指标值在各区间内的频率代替相应区间的概率.
(1)求图中a,b,c的值;
(2)估计这种产品质量指标值的平均数及方差(说明:①同一组中的数据用该组区间的中点值作代表;②方差的计算只需列式正确);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于1.50的产品至少要占全部产品的90%”的规定?
切入点:依据=频率求解图中a,b,c的值;借助互斥事件的概率对(3)做出判断.
[解] (1)由频率分布直方图和茎叶图得:
解得a=0.5,b=1,c=1.5.
(2)估计这种产品质量指标值的平均数为:
=1.35×0.5×0.1+1.45×1×0.1+1.55×3×0.1+1.65×4×0.1+1.75×1.5×0.1=1.6,
估计这种产品质量指标值的方差为:
s2=(1.35-1.6)2×0.05+(1.45-1.6)2×0.1+(1.55-1.6)2×0.3+(1.65-1.6)2×0.4+(1.75-1.6)2×0.15=0.0105.
(3)∵质量指标值不低于1.50的产品占比为:
0.30+0.40+0.15=0.85<0.9,
∴不能认为该企业生产的这种产品符合“质量指标值不低于1.50的产品至少要占全部产品的90%”的规定.
2.某音乐院校举行“校园之星”评选活动,评委由本校全体学生组成,对A,B两位选手,随机调查了20个学生的评分,得到下面的茎叶图:
(1)通过茎叶图比较A,B两位选手所得分数的平均值及分散程度(不要求计算出具体值,得出结论即可);
(2)校方将会根据评分结果对参赛选手进行三向分流:
所得分数
低于60分
60分到79分
不低于80分
分流方向
淘汰出局
复赛待选
直接晋级
记事件C“A获得的分流等级高于B”,根据所给数据,以事件发生的频率作为相应事件发生的概率,求事件C发生的概率.
[解] (1)通过茎叶图可以看出,A选手所得分数的平均值高于B选手所得分数的平均值;A选手所得分数比较集中,B选手所得分数比较分散.
(2)记CA1表示事件:“A选手直接晋级”;CA2表示事件:“A选手复赛待选”;CB1表示事件:“B选手复赛待选”;CB2表示事件:“B选手淘汰出局.
则CA1与CB1独立,CA2与CB2独立,CA1与CA2互斥,则C=∪∪,
P=P+P+P
=PP+PP+PP
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,.
故P=,P=,P=,P=,
所以P=×+×+×=.
命题点2 回归分析
 进行回归分析的一般思路
(1)定关系:依据样本数据散点图或相关系数r,确定两个变量是否具有较强的相关关系.
(2)算各值:分别计算,,x,xiyi的值.
(3)求系数:求出回归系数,.
其中==.
(4)写方程:=x+.
(5)作预测:依据回归方程给出预测值.
提醒:非线性回归分析可借助代数变换转化为线性回归分析.
[高考题型全通关]
1.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:吨)和年利润z(单位:千元)的影响,对近13年的年宣传费xi和年销售量yi(i=1,2,…,13)数据作了初步处理,得到如下图所示的散点图及一些统计量的值.
由散点图知,按y=a+b,y=c+建立y关于x的回归方程是合理的.令s=,t=,
经计算得如下数据:
10.15
109.94
3.04
0.16
siyi-13
tiyi-13
s-132
t-132
y-132
13.94
-2.10
11.67
0.21
21.22
且(si,yi)与(ti,yi)(i=1,2,…,13)的相关系数分别为r1=0.886与r2=-0.995.
(1)从以上模型中选择更优的回归方程,并用相关系数加以说明;
(2)根据(1)的选择结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=10y-x.根据(2)的结果回答下列问题:
①年宣传费x=20时,年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(ui,vi)(i=1,2,…,n),其回归直线v=+u的斜率和截距的最小二乘估计分别为=,=-.
[解] (1)由于|r1|<|r2|<1,
故y=c+更优.
(2)===-10,
=-=109.94+10×0.16=111.54.
则y关于x的回归方程为=111.54-.
(3)由题意,年利润z=10y-x=1
115.4-,
①当x=20时,年利润的预报值是=1
115.4-=1
090.4.
②由基本不等式得,年利润的预报值=1
115.4-,
由于x+≥20,当且仅当x=,即x=10时等号成立,此时max=1
115.4-20=1
095.4.
[点评] 处理本题(2)应抓住两点:一是会借助题设信息实现非线性回归方程与线性回归方程的转换.二是会利用已知数据进行代数运算,只要这两点到位第(2)问的求解便顺理成章.复习备考要强化这种意识,对于第(3)问,体现了函数的应用及最值的求法.实现了知识的横向联系.
2.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
xiyi
x
7
30
1
464.24
364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
①剔除异常数据后,求出(1)中所选模型的回归方程;
②广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为:
==,
=-.
[解] (1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)①剔除异常数据,即3月份的数据后,得
=×(7×6-6)=7.2,
=×(30×6-31.8)=29.64.
xiyi=1
464.24-6×31.8=1
273.44,
x=364-62=328.

===3,
=-=29.64-3×7.2=8.04.
所以y关于x的回归方程为=3x+8.04.
②把x=18代入①中所求回归方程得
=3×18+8.04=62.04,故预报值为62.04万元.
命题点3 独立性检验
 解决统计案例问题关键是过好三关:
(1)假设关,即假设两个分类变量无关.
(2)应用公式关,把相关数据代入独立性检验公式求出K2的观测值k.
(3)对比关,将k与临界值进行对比,进而作出判断.
[高考题型全通关]
1.某工厂有两台不同的机器A和B,生产同一种产品各10万件,现从各自生产的产品中分别随机抽取20件,进行质量鉴定,鉴定成绩的茎叶图如图所示.
该产品的质量评价标准规定:鉴定成绩在[90,100)内的产品,质量等级为优秀;鉴定成绩在[80,90)内的产品,质量等级为良好;鉴定成绩在[60,80)内的产品,质量等级为合格.将频率视为概率.
(1)完成下列2×2列联表,以产品质量等级是否达到良好以上(含良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为产品等级是否达到良好以上(含良好)与生产产品的机器有关;
A机器生产的产品
B机器生产的产品
总计
良好以上
(含良好)
合格
总计
(2)已知质量等级为优秀的产品的售价为12元/件,质量等级为良好的产品的售价为10元/件,质量等级为合格的产品的售价为5元/件,A机器每生产10万件的成本为20万元,B机器每生产10万件的成本为30万元.该工厂决定,按样本数据测算,两种机器分别生产10万件产品,若收益之差达到5万元以上,则淘汰收益低的机器,若收益之差不超过5万元,则保留原来的两台机器,你认为该工厂会怎么做?
附:K2=,
P(K2≥k)
0.25
0.15
0.10
0.05
0.010
k
1.323
2.072
2.706
3.841
6.635
[解] (1)完成2×2列联表如下.
A机器生产的产品
B机器生产的产品
总计
良好以上(含良好)
6
12
18
合格
14
8
22
总计
20
20
40
结合列联表中的数据,可得K2的观测值k==≈3.636<3.841.
故在误差不超过0.05的情况下,不能认为产品等级是否达到良好以上(含良好)与生产产品的机器有关.
(2)由题意得,A机器每生产10万件产品的利润为10×(12×0.1+10×0.2+5×0.7)-20=47(万元),B机器每生产10万件产品的利润为10×(12×0.15+10×0.45+5×0.4)-30=53(万元),
因为53-47=6(万元),6>5,
所以该工厂应该会卖掉A机器,同时购买一台B机器.
[点评] 破解直方图、茎叶图、独立性检验相交汇的开放性问题的关键是会利用直方图、茎叶图得到相关的数据,充分利用2×2列联表准确地计算出K2的观测值k,并将K2的观测值k与临界值进行比较,进而作出统计推断.对于开放性问题要会转化,如本题第(2)小题,把所求问题转化为比较两台机器每生产10万件产品所获利润的大小,即可得出结论.
2.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.
(1)根据女性频率分布直方图估计女性使用微信的平均时间;
(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“微信控”与“性别”有关?
微信控
非微信控
总计
男性
50
女性
50
总计
100
参考公式:K2=,其中n=a+b+c+d,
参考数据:
P(K2≥k)
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
[解] (1)女性平均使用微信的时间为:
0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时).
(2)由已知得:2(0.04+a+0.14+2×0.12)=1,
解得a=0.08.
由题设条件得列联表
微信控
非微信控
总计
男性
38
12
50
女性
30
20
50
总计
68
32
100
∴K2的观测值k=
=≈2.941>2.706.
所以有90%的把握认为“微信控”与“性别有关”.
命题点4 随机变量的分布列、期望与方差
 随机变量的分布列、期望、方差的求法
(1)求离散型随机变量的分布列的关键是正确理解随机变量取每一个值所表示的具体事件,然后综合应用各类求概率的公式,求出概率.
(2)如果随机变量X能够断定服从超几何分布或二项分布,则其概率可直接利用公式求解.
①若随机变量X服从超几何分布H(N,M,n),则p(X=k)=(k=0,1,2,3,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N
),且E(X)=.
②若随机变量X服从二项分布B(n,p),则
P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n),
且E(X)=np,D(x)=np(1-p).
[高考题型全通关]
1.设甲、乙两位同学上学期间,每天7:30之前到校的概率均为,假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;
(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.
[解] (1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,
故X~B,
从而P(X=k)=C,
k=0,1,2,3.
所以,随机变量X的分布列为
X
0
1
2
3
P
随机变量X的数学期望E(X)=3×=2.
(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B,且M={X=3,Y=1}∪{X=2,Y=0}.
由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,
从而由(1)知
P(M)=P({X=3,Y=1}∪{X=2,Y=0})=P(X=3,Y=1)+P(X=2,Y=0)
=P(X=3)P(Y=1)+P(X=2)P(Y=0)
=×+×=.
2.甲、乙两名运动员互不影响地进行四次射击训练,根据以往的数据统计,他们射击成绩均不低于8环(成绩环数以整数计),且甲、乙射击成绩(环数)的分布列如下:
(1)求p,q的值;
(2)若甲、乙两射手各射击两次,求四次射击中恰有三次命中9环的概率;
(3)若两个射手各射击1次,记两人所得环数的差的绝对值为ξ,求ξ的分布列和数学期望.
[解] (1)由题意得p=,q=.
(2)记事件C:甲命中一次9环,乙命中两次9环,事件D:甲命中两次9环,乙命中一次9环,则四次射击中恰有三次命中9环为事件C+D,
∴P(C+D)=C×××C+C×C××=.
(3)ξ的取值分别为0,1,2,
P(ξ=0)=×+×+×=,
P(ξ=1)=×+×+×+×=,
P(ξ=2)=×+×=,
∴ξ的分布列如下表:
ξ
0
1
2
P
∴E(ξ)=0×+1×+2×=.
命题点5 概率与统计的综合应用
 二项分布同超几何分布、正态分布的联系
(1)二项分布与超几何分布:二项分布是有放回随机试验模型,而超几何分布是无放回随机试验模型,但当样本数量无限大时,超几何分布可转化为二项分布.
(2)二项分布与正态分布:两种分布的图象均类同于频率分布直方图,而正态分布N(μ,σ2)中参数μ=E(ξ),σ2=D(ξ),这便在频率分布直方图的媒介下,交汇交融产生命题点.
[高考题型全通关]
1.(2020·甘肃五市联考)某省食品药品监管局对16个大学食堂的“进货渠道合格性”和“食品安全”进行量化评估,满分为10分,大部分大学食堂的评分在7~10分之间,以下表格记录了它们的评分情况:
分数段
[0,7)
[7,8)
[8,9)
[9,10]
食堂个数
1
3
8
4
(1)现从16个大学食堂中随机抽取3个,求至多有1个大学食堂的评分不低于9分的概率;
(2)以这16个大学食堂的评分数据评估全国的大学食堂的评分情况,若从全国的大学食堂中任选3个,记X表示抽到评分不低于9分的食堂个数,求X的分布列及数学期望.
[解] (1)记Ai(i=0,1,2,3)表示“所抽取的3个大学食堂中有i个大学食堂评分不低于9分”,“至多有1个大学食堂评分不低于9分”记为事件A,则
P(A)=P(A0)+P(A1)=+=.
(2)由表格数据知,从这16个大学食堂中任选1个,评分不低于9分的概率为=.
由题意知,X的所有可能取值为0,1,2,3.
P(X=0)==,
P(X=1)=C××=,
P(X=2)=C××=,
P(X=3)==.
所以X的分布列为
X
0
1
2
3
P
数学期望E(X)=0×+1×+2×+3×=.
[点评] 本题完全阐释了二项分布与超几何分布间的内在联系,尽管超几何分布是无放回模拟试验,但用其估计样本总体的概率时,其可视为有放回模拟试验,即所谓的二项分布.
2.(2020·广州模拟)某城市A公司外卖配送员底薪是每月1
800元,设一人每月配送的单数为X,若X∈[1,300],每单提成3元,若X∈(300,600],每单提成4元,若X∈(600,+∞),每单提成4.5元.B公司外卖配送员底薪是每月2
100元,设一人每月配送单数为Y,若Y∈[1,400],每单提成3元,若Y∈(400,+∞),每单提成4元.小王想在A公司和B公司之间选择一份外卖配送员工作,他随机调查了A公司外卖配送员甲和B公司外卖配送员乙在2019年4月份(30天)的送餐量数据,如下表:
表1:A公司外卖配送员甲送餐量统计
日送餐量x/单
13
14
16
17
18
20
天数
2
6
12
6
2
2
表2:B公司外卖配送员乙送餐量统计
日送餐量y/单
11
13
14
15
16
18
天数
4
5
12
3
5
1
(1)设A公司外卖配送员月工资(单位:元)为f(X),B公司外卖配送员月工资(单位:元)为g(Y),当X=Y且X,Y∈(300,600]时,比较f(X)与g(Y)的大小关系.
(2)将甲、乙4月份的日送餐量的频率视为对应公司的外卖配送员日送餐量的概率.
①计算外卖配送员甲和乙的日送餐量的数学期望E(x)和E(y);
②请利用所学的统计学知识为小王做出选择,并说明理由.
[解] (1)当X=Y且X,Y∈(300,600]时,g(Y)=g(X).
当x∈(300,400]时,f(X)-g(Y)=f(X)-g(X)=(1
800+4X)-(2
100+3X)=X-300>0;
当X∈(400,600]时,f(X)-g(Y)=f(X)-g(X)=(1
800+4X)-(2
100+4X)=-300<0.
所以当X∈(300,400]时,f(X)>g(Y);当X∈(400,600]时,f(X)<g(Y).
(2)①甲的日送餐量x的分布列为:
x
13
14
16
17
18
20
P
乙的日送餐量y的分布列为:
y
11
13
14
15
16
18
P
则E(x)=13×+14×+16×+17×+18×+20×=16,
E(y)=11×+13×+14×+15×+16×+18×=14.
②E(X)=30E(x)=480,480∈(300,600];
E(Y)=30E(y)=420,420∈(400,+∞).
所以A公司外卖配送员的平均月薪约为1
800+4E(X)=3
720(元),
B公司外卖配送员的平均月薪约为2
100+4E(Y)=3
780(元),
3
720<3
780,
所以小王应选择做B公司外卖配送员.
[点评] 数学期望反映了离散型随机变量取值的平均水平,因此可以通过求解数学期望来进行决策分析.如本题,要判断小王选择哪个公司,只需依照条件估计出A,B两个公司的外卖配送员的平均月薪,选择平均月薪较高的公司即可.用数学期望值来观察风险、分析风险,进而做出正确决策,在生活中较为常见,此类题可能成为高考命题的一个新方向.
3.某质检部门从某烤鳗鱼有限公司生产的某批次的烤鳗鱼中随机抽取200箱,检测这些产品的某项质量指标值(记为Z),由检测结果得到如图所示的频率分布直方图.
(1)质检部门规定,当Z≥95时,产品为合格品;当Z<95时,产品为不合格品.该公司每生产一箱这种产品,若是合格品,则盈利90元;若是不合格品,则亏损30元.记Y为生产一箱这种产品的利润,求Y的分布列和E(Y);
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用所在区间的中点值作代表).
①利用该正态分布,求P(75.6②某客户从该公司购买了500箱这种产品,记X表示这500箱产品中该质量指标值位于(75.6,124.4)上的产品箱数,利用①的结果,求X的期望与方差.
附:≈12.2,
若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682
7,P(μ-2σ<Z≤μ+2σ)≈0.954
5,P(μ-3σ<Z≤μ+3σ)≈0.997
3.
[解] (1)由频率估计概率,产品为合格品的概率为(0.033+0.024+0.008+0.002)×10=0.67,产品为不合格品的概率为1-0.67=0.33.
所以随机变量Y的分布列为
Y
90
-30
P
0.67
0.33
所以E(Y)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的质量指标值的样本平均数和样本方差s2分别为=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150,
所以Z~N(100,150).
①因为Z~N(100,150),
所以P(75.6<Z≤124.4)=P(100-12.2×2<Z≤100+12.2×2)≈0.954
5.
②由①可知,一箱产品中该质量指标值位于(75.6,124.4)上的概率为0.954
5,
依题意知X~B(500,0.954
5),
所以E(X)=500×0.954
5=477.25,
D(X)=500×0.954
5×(1-0.954
5)≈21.7.
[点评] 本题较好的体现了概率统计的交汇交融性,展示了二项分布.正态分布同频率分布直方图间的内在联系,复习备考时可从知识间的内在联系上寻找命题的结合点,提升自己的知识体系.
13/18
同课章节目录