2023届高中数学二轮复习专题四概率与统计 课件(167张)

文档属性

名称 2023届高中数学二轮复习专题四概率与统计 课件(167张)
格式 zip
文件大小 5.2MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2022-12-23 14:28:19

图片预览

文档简介

(共167张PPT)
专题四 概率与统计
上篇
2023
内容索引
01
02
03
高考小题突破5 概率与统计的基本计算
培优拓展  统计图表创新题中的数据分析素养
◎高考保分大题四 概率与统计的综合问题
04
培优拓展  非线性回归问题
考情分析 1.从题型和题量上看,高考对本专题考查基本稳定在“两小一大”的形式,总分约22分.题型选择、填空均可命题,解答必考.
2.从考查内容上看,选择、填空题中主要考查抽样方法、古典概型、用样本估计总体、正态分布及统计图表信息题等.解答题常考查成对数据的统计分析,条件概率,以现实生产、生活、科技等真实情境为背景的离散型随机变量的分布列、期望、方差等,难度有所提升.
3.核心素养:数学建模、数据分析、逻辑推理、数学运算等.
备考策略 1.重视新增知识,如百分位数、条件概率与全概率公式、分层抽样中的样本数字特征等,在理解的基础上能熟练运用相关公式进行计算.
2.重视阅读理解,本部分知识与实际联系密切,一般阅读量较大,需要平时多加训练,抓住材料本质,提炼关键内容,通过数学建模达到处理题目信息的目的.
3.重视对统计图表信息题的训练,此类问题常通过真实的统计图表,以选择题尤其是多选题的形式考查读图能力和数据分析的核心素养,是高考命题的热点.
4.提升运算正确率,重视几种特殊分布,尤其是二项分布和超几何分布,平时多注意数学运算的训练,力求会的题目做对.
真题感悟
1.(2022·全国甲·理2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则(  )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案 B 
解析 对于A,中位数为(70%+75%)÷2=72.5%>70%,A错误;对于B,平均数为89.5%>85%,B正确;对于C,从图中可以看出,讲座前问卷答题的正确率的波动幅度要大于讲座后问卷答题的正确率的波动幅度,故C错误;对于D,讲座后问卷答题的正确率的极差为20%,讲座前问卷答题的正确率的极差为35%,D错误.故选B.
2.(2021·天津·4)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是(  )
A.20 B.40 C.64 D.80
答案 D 
解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.
3.(2021·全国甲·理10)将4个1和2个0随机排成一行,则2个0不相邻的概率为(  )
答案 C 
4.(2021·新高考Ⅰ·8)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球.甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则(  )
A.甲与丙相互独立
B.甲与丁相互独立
C.乙与丙相互独立
D.丙与丁相互独立
答案 B 
5.(多选)(2021·新高考Ⅰ·9)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(  )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
答案 CD 
6.(2022·全国乙·文19)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:
(3)由题意及(1),可知该林区这种树木的总材积量的估计值为 ×186
=1 209(m3).
7.(2021·新高考Ⅰ·18)某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.
已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题 并说明理由.
(2)若小明先回答A类问题,期望为E(X).
若小明先回答B类问题,Y为小明的累计得分,
Y=0,80,100,
因为E(X)知识精要
1.抽样方法
(1)从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为
(2)分层随机抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本数量.
等可能性,公平性
名师点析
简单随机抽样、分层随机抽样都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
名师点析
在频率分布直方图中确定众数、中位数和平均数的方法
在频率分布直方图中,众数是最高小长方形底边中点的横坐标;中位数左边和右边的小长方形的面积是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.数据的统计相关性
(1)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
(2)经验回归方程:若变量x与y具有线性相关关系,有n个样本数据
    
(3)决定系数R2:R2=1- .R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.
名师点析
根据经验回归方程进行预报,得到的仅是一个预测值,而不是真实发生的值.
4.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其2×2列联表是:
变量 y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d n
随机变量
5.概率的计算公式
对立事件一定是互斥事件,但互斥事件不一定是对立事件
误区警示
要注意概率P(A|B)与P(AB)的区别
(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.
(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).
6.两种特殊分布
(1)超几何分布
在含有M件次品的N件产品中,任取n件(不放回),其中恰有X件次品,则
(2)二项分布
一般地,在n重伯努利试验中,事件A发生的次数为X,设每次试验中事件A发生的概率为p,则P(X=k)= pkqn-k,其中0名师点析
1.超几何分布的模型是不放回抽样,要注意明确其中参数M,N,n的含义.
2.二项分布的条件是独立性与重复性.
7.离散型随机变量的分布列
设离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则称下表为离散型随机变量X的分布列.
X x1 x2 x3 … xi … xn
P p1 p2 p3 … pi … pn
名师点析
1.离散型随机变量的分布列的两个性质
(1)pi≥0(i=1,2,…,n);
(2)p1+p2+…+pn=1.
2.期望公式:E(X)=x1p1+x2p2+…+xnpn.
8.离散型随机变量的方差公式
名师点析
方差和标准差都是描述一组数据离散程度大小的量,只是单位不同.标准差的单位与数据的单位相同,方差的单位是数据单位的平方.
9.期望与方差的性质
(1)离散型随机变量期望的性质
①E(aX+b)=aE(X)+b;
②若X~B(n,p),则E(X)=np;
③若X服从两点分布,则E(X)=p.
(2)离散型随机变量方差的性质
①D(aX+b)=a2D(X);
②若X~B(n,p),则D(X)=np(1-p);
③若X服从两点分布,则D(X)=p(1-p).
10.正态分布
正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2).如果随机变量X服从正态分布,则记为X~N(μ,σ2).满足正态分布的三个基本概率的值是①P(μ-σ≤X≤μ+σ)≈0.682 7;②P(μ-2σ≤X≤μ+2σ)≈0.954 5;
③P(μ-3σ≤X≤μ+3σ)≈0.997 3.
注意是σ2,不是σ
名师点析
利用正态分布密度曲线的对称性研究相关概率问题是常见考法,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
高考小题突破5 
考点一
用样本估计总体
典例突破1(1)(2021·全国甲·理2)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是(  )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
(2)(多选)(2022·福建莆田模拟)有一组样本甲的数据xi(i=1,2,3,4,5,6),由这组数据得到新样本乙的数据2xi+1(i=1,2,3,4,5,6),其中xi(i=1,2,3,4,5,6)为不全相等的正实数.下列说法正确的是(  )
A.样本甲的极差一定小于样本乙的极差
B.样本甲的方差一定大于样本乙的方差
C.若m为样本甲的中位数,则样本乙的中位数为2m+1
D.若m为样本甲的平均数,则样本乙的平均数为2m+1
答案 (1)C (2)ACD 
解析 (1)该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1=6%,A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1=10%,B正确;
该地农户家庭年收入的平均值为0.02×3+0.04×4+0.1×5+0.14×6+0.2×7+0.2×8+0.1×9+0.1×10+0.04×11+0.02×12+0.02×13+0.02×14=7.68,C不正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比率为(0.1+0.14+0.2+0.2)×1=64%,D正确.
(2)xi(i=1,2,3,4,5,6)为不全相等的正实数,若甲的极差为m(m>0),平均数为E(X),方差为D(X),则D(X)>0,中位数为n,则乙的极差为2m,平均数为2E(X)+1,方差为4D(X),中位数为2n+1,由2m>m,故A正确;
由题意可知,4D(X)>D(X),故B不正确;
由上分析知:若m为样本甲的中位数,则样本乙的中位数为2m+1,故C正确;
由上分析知:若m为样本甲的平均数,则样本乙的平均数为2m+1,故D正确.
增分技巧
1.用样本的频率估计总体的步骤
①确定样本容量N.②确定事件发生的次数(频数)n.③求频率 .④估计总体.
2.用样本的数字特征估计总体的步骤
①确定样本.②求样本的平均数、众数、中位数、方差(标准差).③由数字分析样本、估计总体.
对点练1(1)(多选)(2022·山东潍坊一模)某市共青团委统计了甲、乙两名同学近十期“青年大学习”答题得分情况,整理成如图所示的茎叶图,则下列说法中正确的是(  )
A.甲得分的30%分位数是31
B.乙得分的众数是48
C.甲得分的中位数小于乙得分的中位数
D.甲得分的极差等于乙得分的极差
(2)(多选)(2022·山东烟台三模)若某地区规定在一段时间内没有发生大规模群体病毒感染的标准为“连续10天,每天新增疑似病例不超过7人”,根据该地区下列过去10天新增疑似病例的相关数据,可以认为该地区没有发生大规模群体感染的是(  )
A.平均数为2,中位数为3
B.平均数为1,方差大于0.5
C.平均数为2,众数为2
D.平均数为2,方差为3
答案 (1)BCD (2)AD 
解析 (1)对于A,甲得分从小到大排列为27,28,31,39,42,45,55,55,58,66,而10×30%=3,所以甲得分的30%分位数是35,A不正确;
对于B,乙的得分中有两个48,其余分数值均只有一个,因此乙得分的众数是48,B正确;
对于C,甲得分的中位数是43.5,乙得分的中位数是45,C正确;
对于D,甲得分的极差、乙得分的极差都是39,D正确.
(2)对于A,因为10个数的平均数为2,中位数为3,将10个数从小到大排列,设后面4个数从小到大依次为a,b,c,d,
显然有d≥c≥b≥a≥3,而a+b+c+d≤14,则d的最大值为5,A符合条件;
对于B,平均数为1,方差大于0.5,可能存在大于7的数,如连续10天的数据为0,0,0,0,0,0,0,0,0,10,其平均数为1,方差大于0.5,B不符合条件;
对于C,平均数为2,众数为2,可能存在大于7的数,如连续10天的数据为0,0,0,2,2,2,2,2,2,8,其平均数为2,众数为2,C不符合条件;
对于D,设连续10天的数据为xi,i∈N*,i≤10,因为平均数为2,方差为3,则有
考点二
古典概型
典例突破2(1)(2022·山东菏泽二模)中国空间站的主体结构包括天和核心舱、问天实验舱和梦天实验舱,假设空间站要安排甲、乙、丙、丁4名航天员开展实验,其中天和核心舱安排2人,问天实验舱与梦天实验舱各安排1人,则甲、乙两人安排在同一个舱内的概率为(  )
(2)(2022·新高考Ⅰ·5)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为(  )
答案 (1)A (2)D
增分技巧
古典概型求解的关键点
(1)解答古典概型问题,关键是正确求出基本事件的总数和A包含的基本事件的个数,常用到计数原理与排列、组合的相关知识.
(2)在求基本事件的总数时,要准确理解基本事件的构成,这样才能保证所求A所包含的基本事件的个数的求法与基本事件的总数的求法的一致性.
对点练2(1)(2022·河北邯郸二模)甲、乙两人玩一个传纸牌的游戏,每个回合,两人同时随机从自己的纸牌中选一张给对方.游戏开始时,甲手中的两张纸牌数字分别为1,3,乙手中的两张纸牌数字分别为2,4,则一个回合之后,甲手中的纸牌数字之和大于乙手中的纸牌数字之和的概率为(  )
(2)(2022·山东聊城一模)第24届冬奥会于2022年2月4日至20日在北京和张家口举行,中国邮政陆续发行了多款纪念邮票,其图案包括“冬梦”“飞跃”“冰墩墩”“雪容融”等,小明现有“冬梦”“飞跃”“冰墩墩”“雪容融”邮票各2张,他打算从这8张邮票中任选3张赠送给同学小红,则在选中的3张邮票中既有“冰墩墩”邮票又有“雪容融”邮票的概率为     .
解析 (1)甲手中的两张纸牌数字用{1,3}表示,乙手中的两张纸牌数字用{2,4}表示,一个回合之后,甲、乙两人手中的两张纸牌数字可能为①{2,3},{1,4};②{4,3},{2,1};③{1,2},{3,4};④{1,4},{2,3},共4种情况,其中甲手中的纸牌数字之和大于乙手中的纸牌数字之和只有②一种情况,所以甲手中的纸牌数字之和大于乙手中的纸牌数字之和的概率为 .
考点三
相互独立事件的概率
典例突破3(1)
(2022·广东韶关二模)某一部件由三个电子元件按如图方式连接而成,元件1和元件2同时正常工作,或元件3正常工作,则部件正常工作,设三个电子元件正常工作的概率均为 ,且各个元件能否正常工作相互独立,那么该部件正常工作的概率为(  )
答案 (1)D (2)AB 
解析 (1)讨论元件3正常与不正常:
第一类,元件3正常,上部分正常或不正常都不影响该部件正常工作,则正常
增分技巧
求相互独立事件和n次独立重复试验的概率的注意点
(1)求复杂事件的概率,要正确分析复杂事件的构成,分析复杂事件能转化为几个彼此互斥事件的“和”事件还是能转化为几个相互独立事件同时发生的“积”事件,然后用概率公式求解.
(2)注意辨别n次独立重复试验的基本特征:①同一个试验独立重复做n次;②各次试验的结果相互独立.
(2)(2022·辽宁大连模拟)投壶是中国古代士大夫宴饮时做的一种投掷游戏,在战国时期较为盛行.如图为一幅唐朝的投壶图,假设甲、乙是唐朝的两位投壶游戏参与者,且甲、乙每次投壶投中的概率分别为 ,每人每次投壶相互独立.若约定甲投壶2次,乙投壶3次,投中次数多者胜,则甲最后获胜的概率为     .
考点四
条件概率与全概率公式
考向1条件概率
典例突破4(1)(2022·甘肃酒泉模拟)同时抛掷两枚质地均匀的骰子,记两枚骰子正面向上的点数分别为x,y,则在2x+y=12的条件下,x与y不相等的概率是(  )
(2)(2022·北京东城三模)若某地区60岁及以上人群的某疫苗全程(两针)接种率为60%,加强免疫接种(第三针)的接种率为36%,则在该地区完成该疫苗全程接种的60岁及以上人群中随机抽取一人,此人完成了加强免疫接种的概率为(  )
A.0.6 B.0.375 C.0.36 D.0.216
答案 (1)D (2)A 
解析 (1)(方法一)记“2x+y=12”为事件A,“x与y不相等”为事件B,则
(2)设事件A为抽取的一人完成该疫苗全程接种,事件B为抽取的一人完成加强免疫接种,
所以P(A)=0.6,P(AB)=0.36,
所以在该地区完成该疫苗全程接种的60岁及以上人群中随机抽取一人,此
增分技巧
条件概率的三种求法
定义法 先求P(A)和P(AB),再由P(B|A)= 求P(B|A)
基本事件法 借助古典概型概率公式,先求A包含的基本事件个数n(A),再求AB所包含的基本事件个数n(AB),得P(B|A)=
缩样法 缩小基本事件集合的方法,就是去掉第一次抽到的情况,只研究剩下的情况,用古典概型求解,它能化繁为简
对点练4(1)(2022·山东济宁模拟)已知n是一个三位正整数,若n的十位数字大于个位数字,百位数字大于十位数字,则称n为三位递增数.已知a,b,c∈{0,1,2,3,4},设事件A为“由a,b,c组成三位正整数(数字可重复)”,事件B为“由a,b,c组成的三位正整数为递增数”,则P(B|A)=(  )
(2)(2022·江西南昌二模)从装有4个红球和3个蓝球(除颜色外完全相同)的盒子中任取两个球,则在选到的两个球颜色相同的条件下,都是红球的概率为     .
解析 (1)由题可知n(A)=4×5×5=100,由a,b,c组成的三位正整数为递增数,则:
若该三位数个位是0,则百位和十位从1,2,3,4四个数字中任选两个按大小排列即可,共 =6种可能;
若该三位数个位是1,则百位和十位从2,3,4三个数字中任选两个按大小排列即可,共 =3种可能;
若该三位数个位是2,则百位为4,十位为3,共1种可能.
考向2全概率公式
典例突破5(1)(2022·湖北黄冈模拟)为了提升全民身体素质,学校十分重视学生体育锻炼,某校篮球运动员进行投篮练习.如果他前一球投进,则后一
(2)(2022·海南嘉积中学模拟)长时间玩手机可能影响视力,据调查,某校学生大约40%的人近视,而该校大约有20%的学生每天玩手机超过1 h,这些人的近视率约为50%.现从每天玩手机不超过1 h的学生中任意调查一名学生,则他近视的概率为(  )
答案 (1)B (2)B 
(2)令A1=“玩手机时间超过1 h的学生”,A2=“玩手机时间不超过1 h的学生”,B=“任意调查一人,此人近视”,则Ω=A1∪A2,且A1,A2互斥,P(A1)=0.2,P(A2)=0.8,P(B|A1)=0.5,P(B)=0.4,依题意,P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)=0.2×0.5+0.8×P(B|A2)=0.4,
增分技巧
应用全概率公式求概率的步骤
(1)根据题意找出完备事件组,即满足全概率公式的Ω的一个划分A1,A2,A3,…,An;
(2)用Ai(i=1,2,3,…,n)来表示待求的事件;
(3)代入全概率公式求解.
对点练5(1)(2022·广东茂名模拟)某乒乓球训练馆使用的球是A,B,C三种不同品牌标准比赛球,根据以往使用的记录数据:
品牌名称 合格率 购买球占比
A 98% 0.2
B 99% 0.6
C 97% 0.2
若这些球在盒子中是均匀混合的,且无区别的标志,现从盒子中随机地取一只球用于训练,则它是合格品的概率为(  )
A.0.986 B.0.984
C.0.982 D.0.980
(2)(多选)(2022·湖北襄阳模拟)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯统计理论,随机事件A,B存在如下关系:P(A|B)= .
某高校有甲、乙两家餐厅,王同学第一天去甲、乙两家餐厅就餐的概率分别为0.4和0.6.如果他第一天去甲餐厅,那么第二天去甲餐厅的概率为0.6;如果第一天去乙餐厅,那么第二天去甲餐厅的概率为0.5,则王同学(  )
A.第二天去甲餐厅的概率为0.54
B.第二天去乙餐厅的概率为0.44
答案 (1)B (2)AC 
解析 (1)将A,B,C分别记为第1,第2,第3个品牌,设事件M1表示“取到的球是第i个品牌(i=1,2,3)”,事件N表示“取到的是一个合格品”,其中M1,M2,M3两两互斥,所以P(N)=P(M1N)+P(M2N)+P(M3N)=P(M1)P(N|M1)+P(M2)P(N|M2)+P(M3)P(N|M3)=0.98×0.2+0.99×0.6+0.97×0.2=0.984,所以它是合格品的概率为0.984.
(2)设A1:第一天去甲餐厅,A2:第二天去甲餐厅,B1:第一天去乙餐厅,B2:第二天去乙餐厅,所以P(A1)=0.4,P(B1)=0.6,P(A2|A1)=0.6,P(A2|B1)=0.5.
所以P(A2)P(A1|A2)=0.24,P(A2)P(B1|A2)=0.3,
所以有P(A2)=P(A1)P(A2|A1)+P(B1)P(A2|B1)=0.4×0.6+0.6×0.5=0.54,因此选项A正确;
P(B2)=1-P(A2)=0.46,因此选项B不正确;
考点五
正态分布及其应用
典例突破6(1)(2022·河北唐山三模)在某次测验中,测验结果ξ服从正态分布N(80,σ2).若P(ξ>90)=0.2,则P(70<ξ<90)=     .
(2)(2022·山东泰安一模)随着时代发展和社会进步,教师职业越来越受青睐,考取教师资格证成为不少人的就业规划之一.当前,中小学教师资格考试分笔试和面试两部分.已知某市2021年共有10 000名考生参加了中小学教师资格考试的笔试,现从中随机抽取100人的笔试成绩(满分100分)作为样本,整理得到如下频数分布表:
笔试成绩X [40,50) [50,60) [60,70) [70,80) [80,90) [90,100]
人数 5 10 25 30 20 10
由频数分布表可认为该市全体考生的笔试成绩X近似服从正态分布N(μ,σ2),其中,μ近似为100名样本考生笔试成绩的平均值(同一组的数据用该组区间的中点值代替),则μ=     .若σ=12.9,据此估计该市全体考生中笔试成绩高于85.9的人数(结果四舍五入精确到个位)为     .
参考数据:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
答案 (1)0.6 (2)73 1 587 
解析 (1)因为ξ服从正态分布N(80,σ2),所以P(ξ<80)=0.5.
因为P(70<ξ<90)=2(P(ξ<90)-P(ξ<80))=2(1-P(ξ>90)-P(ξ<80))
=2×(1-0.2-0.5)=0.6.
增分技巧
正态分布下常见的概率计算
利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量μ,σ进行对比联系,确定它们属于[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]中的哪一个.
对点练6(1)(2022·山东德州二模)设随机变量X服从正态分布N(1,σ2),若P(X<2-a)=0.3,则P(2-aA.0.2 B.0.3 C.0.4 D.0.6
(2)(2021·新高考Ⅱ·6)某物理量的测量结果服从正态分布N(10,σ2),下列结论中不正确的是(  )
A.σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大
B.σ越小,该物理量在一次测量中大于10的概率为0.5
C.σ越小,该物理量在一次测量中小于9.99与大于10.01的概率相等
D.σ越小,该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等
答案 (1)C (2)D 
解析 (1)因为x=2-a,x=a关于x=1对称,故P(2-a=2[0.5-P(X<2-a)]=0.4.
(2)对于A,σ2为数据的方差,所以σ越小,数据在μ=10附近越集中,所以测量结果落在(9.9,10.1)内的概率越大,故A正确;对于B,由正态密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C,由正态密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;对于D,因为该物理量一次测量结果落在(9.9,10.2)的概率大于落在(10,10.3)的概率,所以一次测量结果落在(9.9,10.2)的概率与落在(10,10.3)的概率不同,故D错误.
培优拓展
统计图表创新题中的数据分析素养
图表信息题是题设条件或结论中包含有图表的试题.用图表形式提供信息与以往通过单一文字提供信息比较,往往有直观、信息量大、数量之间关系明确等优点,成为近年命题的热点.一般以真实的生活实例为情境命题,如国家统计局公布的一些统计数据等,对考生读图、识图及数据处理的能力提出了较高的要求.解答这类试题,需要仔细观察,挖掘图表所含的信息,并对所得到的信息进行分类、合成、提取、加工,最终求得问题的答案.
高中数学除了最常见的频率分布直方图和茎叶图外,常见的统计图表还有扇形图(饼图)、柱(条)形图、折线图、雷达图等.
类型1扇形图(饼图)
【例1】 (多选)(2022·河北衡水模拟)2021年我国全国发电量为81 121.8亿千瓦时,相比2020年增长了6 951.4亿千瓦时,如图是我国2020年和2021年全国发电结构占比图,则下列说法正确的有(  )
A.2020年与2021年这两年的全国发电量中火力发电占比均最高
B.2021年全国火力发电量低于2020年全国火力发电量
C.2020年与2021年的全国水力发电量占比均在当年排名第二
D.2021年的风力、太阳能、核能发电量占比均高于2020年
答案 ACD 
解析 对于A:根据扇形图易知2020和2021这两年发电量中火力发电的占比都是最高,故A正确;
对于B:由题意得2020年全国发电量为81 121.8-6 951.4=74 170.4亿千瓦时,2020年火力发电量为74 170.4×71.18%≈52 794.5亿千瓦时,2021年火力发电量为81 121.8×71.13%≈57 701.9亿千瓦时,故B错误.
对于C:根据扇形图易知2020和2021这两年发电量中水力发电都排名第二,故C正确;
根据两扇形图易知D正确.
增分技巧
扇形图,又称扇形统计图,它是用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分数,通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.
类型2条(柱)形图
【例2】 (多选)(2022·辽宁锦州模拟)随着时代的革新,科技的进步,通信技术已经成为我们日常生活及工作中必不可少的一部分.在信息化时代下,通信行业作为一个新兴的科学技术类行业,在具有长远发展潜力的同时也面临着激烈的竞争.“2019年6月末—2021年6月末(9个季度)全国互联网宽带接入端口数(单位:亿个)”统计图如图.根据统计图的相关信息进行分析,下列说法中正确的有(  )
A.2020年12月末,全国互联网宽带接入端口数较2019年同期增长0.30亿个
B.2021年6月末,全国互联网宽带接入端口数较2020年同期增长率约为5.19%
2019年6月末—2021年6月末(9个季度)
全国互联网宽带接入端口数
C.2019年6月末—2021年6月末(9个季度),全国互联网宽带接入端口数每个季度都在增长,且增长量是递增的
D.2019年6月末—2021年6月末(9个季度),全国互联网宽带接入端口数每个季度的8个增长量的平均值约为0.10
答案 AD 
解析 根据统计图,逐项分析如下.
选项 正误 原因
A √ 2019年12月末,全国互联网宽带接入端口数达9.16亿个,2020年12月末,全国互联网宽带接入端口数达9.46亿个,增长0.30亿个
B × 2020年6月末,全国互联网宽带接入端口数达9.31亿个,2021年6月末,全国互联网宽带接入端口数达9.82亿个,所以同期增长率约为 ≈5.48%
选项 正误 原因
C × 全国互联网宽带接入端口数从2019年6月末—2021年6月末(9个季度)的8个增长量分别为0.10,0.03,0.07,0.08,0.06,0.09,0.19,0.17,易知增长量不是递增的
D √ 由选项C的判断知从2019年6月末—2021年6月末(9个季度)全国互联网宽带接入端口数的增长量的平均值约为(0.10+0.03+0.07+0.08+0.06+0.09+0.19+0.17)× ≈0.10
类型3折线图
【例3】 (多选)(2022·广东梅州二模)如图是国家统计局于2021年3月10日发布的2020年2月到2021年2月全国居民消费价格的涨跌幅情况折线图,其中同比是指本期与同期作对比,如2020年10月与2019年10月相比;环比是指本期与上期作对比,如2020年12月与2020年11月相比.下列关于“居民消费价格涨跌幅”图表的理解,正确的选项是(  )
全国居民消费价格涨跌幅
A.2020年10月,全国居民消费价格同比下降
B.2020年11月,全国居民消费价格环比下降
C.2020年2月至2021年2月,全国居民消费价格环比在2021年1月涨幅最高
D.2020年4月的全国居民消费价格高于2019年5月的全国居民消费价格
答案 BCD 
解析 从图中可以看出2020年10月,全国居民消费价格同比为0.5>0,故全国居民消费价格同比上升,A错误;
2020年11月,全国居民消费价格环比为-0.6<0,故全国居民消费价格环比下降,B正确;
2020年2月至2021年2月,全国居民消费价格环比在2021年1月涨幅为1.0,最高,C正确;
设2019年4月的全国居民消费价格为a,则2020年4月的全国居民消费价格为(1+3.3%)a,则2020年5月的全国居民消费价格为(1-0.8%)(1+3.3%)a,故
(1+3.3%)a>1.000 7a,故2020年4月的全国居民消费价格高于2019年5月的全国居民消费价格,D正确.
类型4雷达图
【例4】 (多选)(2022·辽宁沈阳高一期末)最近,EDG电子竞技俱乐部首次夺得英雄联盟全球总决赛冠军的消息在网络上轰动一时,这是对电子竞技体育主流价值的一种认可,也是一场集体的自我证明,电竞并不等同于打游戏,其需要很强的责任心和自律精神,我国体育总局已经将电子竞技项目列为正式体育竞赛项目,现某公司推出一款全新电子竞技游戏.下面雷达图给出该游戏中3个人物的5种特征分析,则下列说法正确的有(  )
A.小轲的生命值低,但是法力、防衡力、移动速度都很出色,适合快速进攻
B.小娜的各项特征均衡,组队进攻时,可以弥补小轲的弱点
C.小班的生命值比小轲大,所以游戏中一定比小轲活得久
D.如果进行一对一对抗赛,小班比小娜的胜率大
某电子竞技游戏人物特征
答案 AB 
解析 人物小轲的生命值估计为25,回血值估计为50,移动速度估计为55,防御力估计为51,法力估计为58,故小轲适合快速进攻,A对;
人物小娜的生命值估计为50,回血值估计为55,移动速度估计为45,防御力估计为40,法力估计为43,小娜的生命值高,各项特征均衡,组队进攻时,可以弥补小轲的弱点,B对;
人物小班的生命值估计为39,回血值估计为30,移动速度估计为32,防御力估计为30,法力估计为43,虽然小班的生命值比小轲大,但回血值、移动速度、防御值、法力值均低于小轲,所以在游戏中不一定比小轲活得久,C错;
由于人物小娜的生命值、回血值、移动速度、防御力都高于人物小班,而两者的法力值几乎一样,所以小娜比小班的胜率大,D错.
增分技巧
雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法.轴的相对位置和角度通常是无信息的,它相当于平行坐标图,轴径向排列.
高考保分大题四
热点一 经验回归方程的实际应用
典例突破1(2022·江西南昌模拟)某种机器随着使用年限的增加,其价值逐渐减小.经调查显示,该机器售价为25万元,其使用年限x(单位:年)与价值y(单位:万元)之间的对应关系统计如下表所示.
x 1 3 5 7 9 11 13 15
y 24 23 22 20 19 19 17 16
由上表数据可知,可用线性回归模型(下面简称为模型一)拟合y与x的关系.
(2)研究人员采用另外一种非线性模型(下面简称为模型二)对上述数据进行研究,得到模型二的相关系数r'=-0.923.
①计算模型一的相关系数r;
②试根据①中计算结果,说明选择哪种模型拟合效果更好.
参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,…,n),其经验回
②相关系数r是衡量模型好坏的标准,相关系数的绝对值越接近于1,模型的拟合性就越强,因为|r|比|r'|更接近于1,故模型一相比模型二具有更好的拟合效果.
增分技巧
线性回归分析问题的类型及解题方法
(1)求经验回归方程:
(2)预测变量值:
①若已知经验回归方程(方程中无参数),进行预测时,可以直接将数值代入求得特定要求下的预测值.
②若经验回归方程中有参数,根据经验回归直线一定经过点(),求出参数值,得到经验回归方程,进而完成预测.
对点练1
(2022·河南开封三模)根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间对应数据的散点图,如图所示.
(1)请从相关系数r(精确到0.01)的角度分析,能否用线性回归模型拟合y与x的关系(若|r|≥0.75,则线性相关程度很强,可用线性回归模型拟合);
(2)建立y关于x的经验回归方程,并用其估计当
该种液体肥料每亩使用量为9千克时,该蔬菜基
地西红柿亩产量的增加量约为多少百千克
热点二 独立性检验的实际应用
典例突破2(2022·四川泸州诊断测试)劳动教育具有树德、增智、强体、育美的综合育人价值.某学校为了解学生参加家务劳动的情况,随机抽查了100名学生,其中有40名男生,并统计了这些学生在某个休息日做家务劳动的时间,将劳动时间分为5组:[0.5,1),[1,1.5),
[1.5,2),[2,2.5),[2.5,3],得到如图所示的频率
分布直方图.
(1)已知该校学生李华在该休息日做了1.6小时的家务劳动,根据绘制的频率分布直方图,试用统计的知识分析李华做家务劳动的时间处于什么水平(同一组中的数据以这组数据所在区间的中点值作代表);
(2)若做家务劳动的时间不低于2小时称为“喜欢做家务”,已知调查数据中喜欢做家务劳动的男生有5人,据所给数据,完成下面的2×2列联表,并依据小概率值α=0.05的χ2独立性检验,分析喜欢做家务劳动是否与性别有关.
类别 喜欢做家务 不喜欢做家务
男生
女生
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)由题知,(0.3+0.5+m+0.4+0.1)×0.5=1,解得m=0.7.
若选择中位数:劳动的时间在[0.5,1.5)的频率为(0.3+0.5)×0.5=0.4,劳动的时间在[1.5,2)的频率为0.7×0.5=0.35,0.4+ =0.47,所以1.6小时的家务劳动略低于中等水平;
若选择平均数:这些学生在某个休息日做家务劳动的时间的平均数为
=0.75×0.15+1.25×0.25+1.75×0.35+2.25×0.2+2.75×0.05=1.625>1.6,所以1.6小时的家务劳动略低于平均水平.
(2)零假设为H0:喜欢做家务劳动与性别无关.
2×2列联表如下:
类别 喜欢做家务 不喜欢做家务 合计
男生 5 35 40
女生 20 40 60
合计 25 75 100
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即喜欢做家务劳动与性别有关,此推断犯错误的概率不大于0.05.
热点三 离散型随机变量的分布列、均值与方差
考向1以超几何分布为背景的期望与方差
典例突破3(2022·河北唐山二模)目前,全国多数省份已经开始了新高考改革.改革后,考生的高考总成绩由语文、数学、外语3门全国统一考试科目成绩和3门选择性科目成绩组成.注:甲、乙两名同学对选择性科目的选择是随机的.
(1)A省规定:选择性考试科目学生可以从思想政治、历史、地理、物理、化学、生物学6门科目中任选3门参加选择性考试.求甲同学在选择物理科目的条件下,选择化学科目的概率.
(2)B省规定:3门选择性科目由学生首先从物理科目和历史科目中任选1门,再从思想政治、地理、化学、生物学4门科目中任选2门.
①求乙同学同时选择物理科目和化学科目的概率;
②为调查学生的选科情况,从某校高二年级抽取了10名同学,其中有6名首选物理,4名首选历史.现从这10名同学中再选3名同学做进一步调查.将其中首选历史的人数记作X,求随机变量X的分布列和数学期望.
解 (1)“选择物理”记作事件A,“选择化学”记作事件B,则
对于②,随机变量X可以取0,1,2,3.
随机变量X的分布列为
增分技巧
求超几何分布的分布列的步骤
第一步,验证随机变量服从超几何分布,并确定参数N,M,n的值;
第二步,根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率;
第三步,用表格的形式列出分布列.
对点练2(2022·山东烟台一模)2022年2月4日至20日,第24届冬季奥林匹克运动会在北京成功举办.这场冰雪盛会是运动健儿奋力拼搏的舞台,也是中外文明交流互鉴的舞台,折射出我国更加坚实的文化自信,诠释着新时代中国的从容姿态,传递出中华儿女与世界人民“一起向未来”的共同心声.某学校统计了全校学生观看北京冬奥会开幕式和闭幕式的时长情况(单位:分钟),并根据样本数据绘制得到如下所示
的频率分布直方图.
(1)求频率分布直方图中a的值,并估计样本数据的85%分位数;
(2)采用分层随机抽样方式,从观看时长在[200,280]中的学生中抽取6人.若从这6人中随机抽取3人在全校交流观看体会,设抽取的3人中观看时长在[200,240)的人数为X,求X的分布列和数学期望.
解 (1)由题意,40×(0.000 5+0.002×2+2a+0.006+0.006 5)=1,解得a=0.004.
由频率分布直方图知,观看时长在200分钟以下占比为40×(0.000 5
+0.002+0.004+0.006+0.006 5)=0.76,观看时长在240分钟以下占比为0.76+40×0.004=0.92,所以85%分位数位于[200,240)内,85%分位数为
(2)由题意,观看时长在[200,240),[240,280]中对应的频率分别为0.16和0.08,所以采用分层随机抽样的方式在两个区间中应分别抽取4人和2人.
于是抽取的3人中观看时长在[200,240)中的人数X的所有可能取值为1,2,3.
X的分布列为
考向2以互斥或独立事件为背景的期望与方差
典例突破4(12分)(2022·全国甲·理19)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【规范解答】
则P(X=0)=0.5×0.4×0.8=0.16,
P(X=10)=0.5×0.4×(1-0.8)+0.5×(1-0.4)×0.8+(1-0.5)×0.4×0.8=0.44,
P(X=20)=0.5×(1-0.4)×(1-0.8)+(1-0.5)×0.4×(1-0.8)+(1-0.5)×(1-0.4)×0.8=0.34,
X 0 10 20 30
P 0.16 0.44 0.34 0.06
【教师讲评】
(1)从总得分最高分析,知甲学校获得冠军有两种情况,一是三个项目均获胜,二是其中的两个项目获胜,利用对立事件及相互独立事件的概率公式求解;
(2)从甲学校获胜的项目个数出发,列出X的所有可能取值,再利用相互独立事件同时发生的概率公式计算相应概率,列出分布列,根据公式计算期望即可.
增分技巧
求相互独立事件概率的两种方法
直接法 正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或独立重复试验问题,然后用相应概率公式求解
间接法 当复杂事件正面情况较多,反面情况较少时,可利用其对立事件进行求解,对于“至少”“至多”等问题往往也用这种方法求解
对点练3(2022·山东泰安三模)某商场为了促销,规定顾客购买满500元商品即可抽奖,最多有3次抽奖机会.每次抽中,可依次获得10元、20元、30元奖金,若没有抽中,不可继续抽奖,顾客每次抽中后,可以选择带走所有奖金,结束抽奖;也可选择继续抽奖,若没有抽中,则连同前面所得奖金全部归零,结束抽奖.小明购买了500元商品并参与了抽奖活动,已知他每次抽中的概率
(1)求小明第一次抽中,但所得奖金归零的概率;
(2)设小明所得奖金总数为随机变量X,求X的分布列和数学期望.
解 (1)记小明第i次抽中为事件Ai(i=1,2,3),则有
随机变量X的分布列为
考向3以二项分布为背景的期望与方差
典例突破5(2022·河北沧州二模)足球比赛淘汰赛阶段通常常规比赛时间为90分钟,若在90分钟结束时进球数持平,需进行30分钟的加时赛,若加时赛仍是平局,则采用“点球大战”的方式决定胜负.“点球大战”的规则如下:①两队各派5名队员,双方轮流踢点球,累计进球个数多者胜;②如果在踢满5轮前,一队的进球数已多于另一队踢满5轮最多可能射中的球数,则不需要再踢(例如:第4轮结束时,双方“点球大战”的进球数比为2∶0,则不需再踢第5轮);③若前5轮“点球大战”中双方进球数持平,则从第6轮起,双方每轮各派1人罚点球,若均进球或均不进球,则继续下一轮,直到出现一方进球另一方不进球的情况,进球方胜出.
(1)假设踢点球的球员等可能地随机选择球门的左、中、右三个方向射门,门将也会等可能地选择球门的左、中、右三个方向来扑点球,而且门将即使方向判断正确也只有 的可能性将球扑出,若球员射门均在门内,在一次“点球大战”中,求门将在前三次扑出点球的个数X的分布列和期望.
(2)现有甲、乙两队在半决赛中相遇,常规赛和加时赛后双方战平,需进行“点球大战”来决定胜负,设甲队每名队员射进点球的概率均为 ,乙队每名队员射进点球的概率均为 ,假设每轮点球中进球与否互不影响,各轮结果也互不影响.
(i)若甲队先踢点球,求在第3轮结束时,甲队踢进了3个球(不含常规赛和加时赛进球)并胜出的概率;
(ii)求“点球大战”在第6轮结束,且乙队以5∶4(不含常规赛和加时赛得分)胜出的概率.
解 (1)依题意可得,门将每次可以扑出点球的概率为
则X的分布列为
(2)(i)记事件“甲队先踢点球,在第3轮结束时,甲队踢进了3个球(不含常规赛和加时赛进球)并胜出”为事件A,意味着甲队先踢点球,前三轮点球乙队没进球,甲队前三轮踢进3个点球,乙队没进球对应的概率为
(ii)记“点球大战在第6轮结束,且乙队以5∶4(不含常规赛和加时赛得分)胜出”为事件B,意味着前5轮结束后比分为4∶4,第6轮乙队进球甲队没进球,
增分技巧
破解有关二项分布的“四关”
对点练4(2022·湖南衡阳二模)随着近期我国不断走向转型化进程以及社会就业压力的不断加剧,创业逐渐成为在校大学生和毕业大学生的一种职业选择方式.但创业过程中可能会遇到风险,有些风险是可以控制的,有些风险是不可控制的,某地政府为鼓励大学生创业,制定了一系列优惠政策:已知创业项目甲成功的概率为 ,项目成功后可获得政府奖金20万元;创业项目乙成功的概率为P0(0(1)大学毕业生张某选择创业项目甲,毕业生李某选择创业项目乙,记他们获得的奖金累计为X(单位:万元),若X≤30的概率为 ,求P0的大小;
(2)若两位大学毕业生都选择创业项目甲或创业项目乙进行创业,问:他们选择何种创业项目,累计得到的奖金的数学期望最大
(2)设两位大学毕业生都选择创业项目甲且创业成功的次数为X1,都选择创业项目乙且创业成功的次数为X2,则这两人选择项目甲累计获得奖金的数学期望为E(20X1),选择项目乙累计获得奖金的数学期望为E(30X1).
热点四 预测与决策问题
典例突破6(2022·山东枣庄三模)某商家决定借助线上平台开展销售活动.现有甲、乙两个平台供选择,且当每件商品的售价为a(300≤a≤500)元时,从该商品在两个平台所有销售数据中各随机抽取100天的日销售量统计如下,
商品日销售量/件 6 7 8 9 10
甲平台的天数 14 26 26 24 10
乙平台的天数 10 25 35 20 10
假设该商品在两个平台日销售量的概率与表格中相应日销售量的频率相等,且每天的销售量互不影响.
(1)求“甲平台日销售量不低于8件”的概率,并计算“从甲平台所有销售数据中随机抽取3天的日销售量,其中至少有2天日销售量不低于8件”的概率.
(2)已知甲平台的收费方案为:每天佣金60元,且每销售一件商品,平台收费30元;乙平台的收费方案为:每天不收取佣金,但采用分段收费,即每天销售商品不超过8件的部分,每件收费40元,超过8件的部分,每件收费35元.某商家决定在两个平台中选择一个长期合作,从日销售收入(单价×日销售量-平台费用)的期望值较大的角度,你认为该商家应如何决策 说明理由.
解 (1)设事件A=“甲平台日销售量不低于8件”,则
(2)设甲平台的日销售收入为X,则X的所有可能取值为6a-240,7a-270,
8a-300,9a-330,10a-360.
所以X的分布列为
设乙平台的日销售收入为Y,则Y的所有可能取值为6a-240,7a-280,8a-320,
9a-355,10a-390.
所以Y的分布列为
E(Y)-E(X)=0.05a-19,令0.05a-19>0得a>380,令0.05a-19<0,得a<380.
令0.05a-19=0,得a=380.
所以当300≤a<380时,选择甲平台;当a=380时,甲乙平台均可;当380增分技巧
利用样本的数字特征解决有关决策的问题就是根据提取的数据,建立相应的概率模型,然后利用概率知识求出样本的数字特征——数学期望、方差等,通过比较得到最优方案,从而解决问题.解题的关键如下:
(1)建立模型,根据题意准确建立解决问题的概率模型,要注意各种概率模型的差异性,不能混淆;
(2)分析数据,分析题中的相关数据,确定概率模型中的相关参数;
(3)求值,利用概率知识求出概率模型中的数学期望、方差等数字特征;
(4)做出决策,比较概率模型中的数字特征,确定解决问题的最优方案,做出决策.
对点练5(2022·山东济宁一模)血液检测是诊断是否患某疾病的重要依据,通过提取的血液样本进行检测,样本的某一指标会呈现阳性或阴性.若样本指标呈阳性,说明该样本携带病毒;若样本指标呈阴性,说明该样本不携带病毒.根据统计发现,每个疑似病例的样本呈阳性(即样本携带病毒)的概率均为p(0(1)若p= ,求这4例疑似病例中呈阳性的病例个数X的分布列;
(2)若将该4例疑似病例样本进行化验,且方案二比方案一更“优”,求p的取值范围.
则这4例疑似病例中呈阳性的病例个数X的分布列为
(2)方案一中,逐个化验,化验次数为4,期望为4;
方案二中,设化验次数为Y,则Y的所有可能取值为2,4,6,
每组两个样本化验呈阴性的概率为(1-p)2,设x=(1-p)2,
培优拓展
非线性回归问题
通过变量间的相关关系对两个变量进行统计分析是数学的重要应用.经验回归方程不一定总是线性的,也可能是非线性的回归关系,此类问题具有十分重要的现实意义.解决此类问题,应先判断选择函数模型,进行变量代换,求出代换后的经验回归方程,再转化为非线性经验回归方程.
【例题】 个人所得税是国家对本国公民、居住在本国境内的个人的所得和境外个人来源于本国的所得征收的一种所得税.现将自2013年至2017年的我国的个人所得税收入统计如下:
年份 2013 2014 2015 2016 2017
时间代号x 1 2 3 4 5
个税收入y/千亿元 6.53 7.38 8.62 10.09 11.97
并制作了如图所示的时间代号x与个人所得税收入y的散点图:
根据散点图判断,可用①y=menx与②y=px2+q作为年个人所得税收入y关于时间代号x的经验回归方程,经过数据运算和处理,得到如下数据:
以下计算过程中四舍五入的保留两位小数.
(1)根据所给数据,分别求出①②中y关于x的经验回归方程;
(2)已知2018年个人所得税收入为13.87千亿元,用2018年的数据验证(1)中所得两个回归方程,哪个更适宜作为y关于时间代号x的经验回归方程
(3)你还能从统计学哪些角度来进一步确认哪个经验回归方程更适宜 (只需叙述,不必计算)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和
解 (1)对于①,由y=menx,等式两边取自然对数得ln y=nx+ln m,由题意知z=ln y,r=ln m,
(3)从统计学分析,这里从5组数据建立经验回归方程,数据较少,故应增加数据组数建立方程,再用残差及决定系数R2来检验拟合效果.
增分技巧
非线性经验回归方程的求法
(1)根据原始数据作出散点图(或观察题目中已经给出的散点图);
(2)根据散点图,选择恰当的拟合函数;
(3)作恰当变换,将其转化成线性函数,求经验回归方程;
(4)在(3)的基础上通过相应变换,即可得非线性经验回归方程.
同课章节目录