4.概率统计 教案 2022届高三数学一轮复习备考(Word无答案)

文档属性

名称 4.概率统计 教案 2022届高三数学一轮复习备考(Word无答案)
格式 docx
文件大小 1.3MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2021-09-25 20:03:08

图片预览

文档简介

4.1
频率、概率及基本性质
【知识点】
1.随机试验:具有以下特征的试验:①在完全相同的条件下,试验可以重复进行多次;②每次试验的结果不尽相同,试验前无法肯定出现哪个结果;③所有可能的试验结果事前可以明确知道.
  如:在沙滩抛掷一枚质地均匀的硬币,做了5回试验,试验结果如下表
第1回
第2回
第3回
第4回
第5回
试验总次数n
100
100
100
1000
10000
正面向上的次数nA(称频数)
57
43
37
537
5173
正面向上的频率
正面向上的概率P(A)
2.频率与概率定义
 ⑴事件A的频数与频率:
 在完全相同的条件下,对某个试验重复做n次,事件A出现(发生)的   称为事件A的频数,记为nA,fn(A)=   称为事件A的频率.
 ⑵随着试验次数n的增加,事件A的频率会稳定在某个   附近,这个   称为事件A的概率,记为   .
3.频率和概率的区别与联系
事件A的概率反映事件A发生的可能性大小,是与试验次数无关的常数,是确定的值;
 事件A在n次重复试验中发生的频率是不确定的、随机的;
 事件A的概率是A的频率的稳定值;A的频率有时作为A的概率的估计值.
4.频率与概率的性质
频率fn(A)
概率P(A)
范围
不可能事件
必然事件
【应用点】
1.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
人.
2.盒中装有4只相同的白球与6只相同的黄球,从中任取一只球.
  ⑴A=“取出的球是白球”是    事件,P(A)= ;
  ⑵B=“取出的球是蓝球”是    事件,P(B)= ;
  ⑶C=“取出的球是黄球”是    事件,P(C)= ;
⑷D=“取出的球是白球或黄球”是    事件,P(D)= .
3.某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
  ⑴事件A=“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;
  ⑵事件B=“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P(B)的估计值;
⑶求续保人本年度的平均保费的估计值.
4.为了估计水库中鱼的尾数,可以使用以下方法:先从水库中捕出一定数量的鱼,例如2000尾,给每尾鱼做上记号,不影响其存活,然后放回水库.经过适当的时间,让做了记号的鱼和水库中的其它鱼充分混合后,再从水库中捕出一定数量的鱼,例如500尾,查看其中有记号的鱼,设有40尾,试依据上述数据估计水库中鱼的尾数.
【核心点】
1.频率与概率的意义;
2.频率与概率的区别和联系
4.2
事件、事件的关系与运算
【知识点】
1.事件及其分类
  必然事件:在条件S下   
 发生的事件,记为
(相当于全集);
不可能事件:在条件S下  
  发生的事件,记为
(相当于空集);
必然事件和不可能事件统称    事件.
随机事件:在条件S下
发生也
发生的事件,通常用字母A、B、C、…表示.
2.事件间的关系及其运算:
  ⑴包含关系:ABA
,则B

⑵相等关系:A=B“A
当且仅当B
”;
⑶并事件(或称和事):C=A∪B“C发生A发生  B发生”;
  ⑷交事件(或称积事件):C=A∩B或C=AB
“C发生A发生  B发生”;
⑸互斥事件(又称互不相容):A、B互斥A∩B= 一次试验中,事件A、B
发生;  
当A、B互斥时,A∪B表示为A B;若Ai(i=1,2,…,n)任意两个互斥,则称两两互斥.
  ⑹对立事件:A、B对立A∩B= 且A∪B= 一次试验中,A、B
发生且A、B  一个发生;记B=  ,A=  .
⑺相互独立事件:A、B相互独立A(或B)是否发生对B(或A)发生的   没有影响
              P(AB)=P(A)
P(B)
              P(B|A)
P(B)且P(A|B) P(A);
结论:若A与B相互独立,则与B、A与、与也相互独立.
3.概率公式
 ⑴加法公式:若A、B互斥,则P(A+B)=

推论:P(A+)=

,即P(A)=
.
 ⑵乘法公式:若Ai(i=1、2、3、…、n)相互独立,则P(A1A2A3…An)=
.
【应用点】
1.掷三颗骰子,向上的点数之和记为X,则一个必然事件是X≥  ;一个不可能事件是X=  .
2.甲、乙等7人站成一排,事件A=“甲站排头”,事件B=“乙不站排头”,则
  A与B的关系是    ;A与的关系是    .
 
3.连掷三颗骰子,用Ai表示第i(i=1,2,3)颗骰子向上一面是奇数,试用Ai表示下列各事件:
 ⑴恰有一颗骰子向上一面是奇数                   ;
 ⑵全是偶数                            ;
 ⑶至少有一颗骰子向上一面是奇数                  ;
 ⑷向上一面的点数和是偶数                     .
4.一个袋子中装有黄色球3只、红色球4只、黑色球3只,它们除了颜色不同外没有区别,从中不放回连续随机地摸出3只球,记A=“3只球为黄色”,B=“3只球为红色”,C=“3只球为黑色”.
A、B、C的关系是   
 ,=              ;
  用A、B、C表示出“3只球同色”=              ;
  用A、B、C表示出“3只球不全同色”=              .
  
5.有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取两次,每次取1个球.A表示事件“第一次取出的球的数字是1”,B表示事件“第二次取出的球的数字是2”,C表示事件“两次取出的球的数字之和是8”,D表示事件“两次取出的球的数字之和是7”,则
A与B的关系是     ;A与C的关系是     ;A与D的关系是     ;
B与D的关系是     ;
B与C的关系是  
   .
6.加工某一零件需经过三道工序,设第一、二、三道工序的次品率分别为、、,且各道工序互不影响,则加工出来的零件的次品率
.
7.甲、乙两颗卫星同时监测台风,在同一时刻,甲、乙两颗卫星准确预报台风的概率分别为0.8和0.75,则在同一时刻至少有一颗卫星预报准确的概率为________.
8.袋中有12个小球,分别为红球、黑球、黄球、绿球,从中任取一球,得到红球的概率为,得到黑球或黄球的概率是,得到黄球或绿球的概率是,试求得到黑球、黄球、绿球的概率各是多少?
9.甲、乙二人进行一次围棋比赛,约定先胜3局者获得这次比赛的胜利,比赛结束.假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立.已知前2局中,甲、乙各胜1局.
(1)求再赛2局结束这次比赛的概率;
(2)求甲获得这次比赛胜利的概率.
【核心点】
1.事件间的关系及其判断、事件的运算;
2.能用已知事件表示所求事件.
4.3
古典概率
【知识点】
1.古典概率模型(简称古典概型):具有下列两个要素的概率模型
①有限性:基本事件的个数
;②等可能性:每个基本事件发生的可能性    .
2.古典概率计算
  所有可能结果的集合记为,n()表示中元素的个数,n(A)表示A中元素的个数,则P(A)=

       
.
【应用点】
1.一个袋子中装有大小相同的黄色球3只、红色球2只、黑色球2只,每个球有一个区别于其他球的编号,从中随机地摸出1只球,
  ⑴把每个球的编号看作一个基本事件建立的概率模型是否是古典概型?
  ⑵把球的颜色作为划分基本事件的依据,有多少个基本事件?以这些基本事件建立的概率模型是否是古典概型?
2.⑴某种饮料每箱装6听,其中有4听合格,2听不合格,现质检人员从中随机抽取2听进行检测,则检测出至少有一听不合格饮料的概率是(  )
    A.      
B.      C.
D.
⑵考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于(  )
A.
B.
C.
D.
⑶考察正方体6个面的中心,从中任意选3个点连成三角形,再把剩下的3个点也连成三角形,则所得的两个三角形全等的概率等于(  )
A.1
B.
C.
D.
0
⑷已知一组抛物线,其中a为2,4,6,8中任取的一个数,b为1,3,5,7中任取的一个数,从这些抛物线中任意抽取两条,它们在与直线x=1交点处的切线相互平行的概率是(  )
A.
B.
C.
D.
⑸在△ABC中,角A、B、C所对的边分别是a、b、c,A=30°,若将一枚质地均匀的正方体骰子先后抛掷两次,所得的点数分别为a、b,则满足条件的三角形有两个解的概率是(  )
A.1
B.
C.
D.
前三个选项都不对
 ⑹设集合A={1,2},B={1,2,3},分别从集合A和B中随机取一个数a和b,确定平面上的一个点P(a,b),记“点P(a,b)落在直线x+y=n上”为事件(2≤n≤5,nN),若事件的概率最大,则n的所有可能值为(  )
A.3
B.4
C.2和5
D.3和4
3.甲、乙等五名奥运志愿者被随机地分到A,B,C,D四个不同的岗位服务,每个岗位至少有一名志愿者.
⑴求甲、乙两人同时参加A岗位服务的概率;
⑵求甲、乙两人不在同一个岗位服务的概率.
4.已知7件产品中有2件次品,现逐一不放回地进行检验,直到2件次品都能被确认为止.
  (1)求检验次数为3的概率;
  (2)求检验次数为5的概率.
5.在医学生物试验中,经常以果蝇作为试验对象.一个关有6只果蝇的笼子里,不慎混入了两只苍蝇(此时笼内共有8只蝇子:6只果蝇和2只苍蝇),只好把笼子打开一个小孔,让蝇子一只一只地往外飞,直到两只苍蝇都飞出,再关闭小孔.
  (1)求笼内恰好剩下1只果蝇的概率;
  (2)求笼内至少剩下5只果蝇的概率.
6.将一枚质地均匀的正方体骰子先后抛掷两次,第一次所得的点数为a,第二次所得的点数为b,试就方程组解答下列各题:
  (1)求方程组只有一个解的概率;
  (2)求方程组只有正数解的概率.
 
7.设a,b是从集合{1,2,3,4,5}中随机选取的数,求直线y=ax+b与圆x2+y2=2有公共点的概率.
8.某食品厂制作了4种不同的精美卡片,在该厂生产的每袋食品中都随机装入一张卡片,规定:如果收集齐了4种不同的卡片,便可获得奖品,小明一次性购买该种食品6袋,那么小明获奖的概率是多少?
【核心点】
1.古典概型及其判断;
2.古典概型下的概率计算——(1)关键是找准两个集合:(这是关键中的关键!)和A,是所有基本事件的集合,A是的子集;⑵要善于运用概率加法公式、对立事件概率关系将复杂事件简单化.
4.4
条件概率、相互独立事件的概率计算、二项分布
【知识点】
1.设A、B是两个事件,且P(A)>0,称
为在事件A发生的条件下,事件B发生的条件概率,记为  .
计算:①P(B|A)=    ;②P(B|A)=    .
性质:①范围P(B|A)

   ②加法公式:若B、C   ,则P((B+C)|A)=
.
2.A、B互斥,则A、B中至少有一个发生的概率为
.(加法公式)
3.若A、B相互独立,则A、B同时发生的概率为
.(乘法公式)
4.n次独立重复试验中,每次试验中事件A发生的概率为p,那么n次试验中事件A恰好发生k次的概率P(X=k)=
,其中k{        }.称X服从
,记为X~
.
【应用点】
1.甲、乙两名跳高运动员一次试跳2米高度成功的概率分别是0.7,0.6,且每次试跳成功与否相互之间没有影响,求:
⑴甲试跳三次,第三次才成功的概率;
⑵甲、乙两人在第一次试跳中至少有一人成功的概率;
⑶甲、乙各试跳两次,甲比乙的成功次数恰好多一次的概率.
2.某地区为下岗人员免费提供财会和计算机培训,以提高下岗人员的再就业能力,每名下岗人员可以选择参加一项培训、参加两项培训或不参加培训,已知参加过财会培训的有60%,参加过计算机培训的有75%,假设每个人对培训项目的选择是相互独立的,且各人的选择相互之间没有影响.
⑴任选1名下岗人员,求该人参加过培训的概率;
⑵任选3名下岗人员,求这3人中至少有2人参加过培训的概率.
3.甲、乙、丙三人参加了一家公司的招聘面试,面试合格者可正式签约.甲表示只要面试合格就签约.乙、丙则约定:两人面试都合格就一同签约,否则两人都不签约.设每人面试合格的概率都是,且面试是否合格互不影响.求:
⑴至少有1人面试合格的概率;
⑵没有人签约的概率.
4.甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一个人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得0分.已知甲每轮猜对的概率是,乙每轮猜对的概率是;每轮活动中甲、乙猜对与否互不影响.各轮结果亦互不影响.假设“星队”参加两轮活动,求:
⑴“星队”至少猜对3个成语的概率;
⑵“星队”两轮得分之和X的分布列和数学期望E(X).
5.一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.
假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为50%,且各件产品是否为优质品相互独立.
⑴求这批产品通过检验的概率;
⑵已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.
6.袋中有大小完全相同的7个白球,3个黑球.
⑴若甲一次性抽取4个球,求甲至多抽到1个黑球的概率;
⑵若乙共抽取4次,每次抽取1个球,记录好球的颜色后再放回袋子中,等待下次抽取,且规定抽到白球得10分,抽到黑球得20分,求乙总得分X的分布列和数学期望.
7.⑴甲、乙两人进行一种投壶比赛,比赛投中情况分“有初”“贯耳”“散射”“双耳”“依竿”五种,其中“有初”算“两筹”,“贯耳”算“四筹”,“散射”算“五筹”,“双耳”算“六筹”,“依竿”算“十筹”,三场比赛得筹数最多者获胜.假设甲投中“有初”的概率为,投中“贯耳”的概率为,投中“散射”的概率为,投中“双耳”的概率为,投中“依竿”的概率为,乙的投掷水平
与甲相同,且甲、乙投掷相互独立.比赛第一场,两人平局;第二场,甲投了个“贯耳”,乙投了个“双耳”;则三场比赛结束时甲获胜的概率为(  )
    A.
B.
C.
D.
⑵(多选题)一个口袋中有3个红球4个白球,从中取出2个球,下列命题中正确的有(  ) 
    A.如果是不放回抽取,那么取出1个红球1个白球的概率是
    B.如果是不放回抽取,那么在至少取出1个红球的条件下第2次取出红球的概率是
    C.如果是有放回抽取,那么取出1个红球1个白球的概率是
    D.如果是有放回抽取,那么第1次取到红球的概率和第2次取到红球的概率相同
【核心点】
1.相互独立事件同时发生的概率计算;
2.n次独立重复试验中事件A恰好发生k次的概率如何计算.
4.5
随机抽样
【知识点】
简单随机抽样:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),每次抽取时总体内的各个个体被抽到的机会都相等的抽样方法.
抽签法(抓阄法):个体编号→搅拌均匀→连续抽取n次→得到样本容量为n的样本.
随机数法:个体编号→产生随机数表→随意选定表中某个数字→确定读数规则→读取数字(根据编号确定是一位数一位数地读、二位二位数地读还是三位三位数地读…)→在编号内的数取出但不重复直到满足样本容量为止.
系统抽样:从容量为N的总体中抽取容量为n的样本:个体编号→确定分段间隔k,对编号分段,当是整数时,k=;当不是整数时,采取等可能剔除的方法剔除部分个体M,获得整数k=→在第1段用简单随机抽样确定第一个体编号m(m≤k)→按照一定规则抽取样本:通常是将m加上间隔k得到第2个个体编号m+k,第3个个体编号
,…(也称等距抽样).
分层抽样:在抽样时,将总体分成互不交叉的层,按照一定的比例,从各层抽取一定数量的个体,将各层取出的个体合在一起作为样本.
简单随机抽样、系统抽样、分层抽样的特点、适用范围:
抽样方法
不同点
共同点
适用范围
简单随机抽样
每个个体被抽到的机会均等
总体中个体数较少
系统抽样
总体中个体数较多
分层抽样
总体中个体差异明显
【应用点】
1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是
.若用分层抽样方法,则40岁以下年龄段应抽取
人.
2.一个总体分为A,B两层,其个体数之比为4:1,用分层抽样方法从总体中抽取一个容量为10的样本,已知B层中甲、乙都被抽到的概率为,则总体中的个体数为
.
3.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本
.
若样本中的青年职工为7人,则样本容量为(  )
  A.7
B.15
C.25
D.35
4.将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为(  )
   A.26,
16,
8,
B.25,17,8
C.25,16,9
D.24,17,9
5.对一个容量为m(m≥3,mN)的总体抽取容量为3的样本,当选取系统抽样方法抽取样本时,总体中每个个体被抽中的概率是,则选取简单随机抽样、分层抽样方法抽取样本时,总体中每个个体被抽中的概率分别是(  )
  A.,
B.,
C.,
D.前三个选项都不对
6.某单位有技师18人、技术员12人、工程师6人.需要从这些人中抽取一个容量为n(nN
)的样本
,如果采用系统抽样的方法抽取,不用剔除个体;如果采用分层抽样的方法抽取,各层抽取结果都是整数;如果样本容量增加1,则在采用系统抽样时,需要在总体中先剔除1个个体,
求样本容量.
  
【核心点】
1.系统抽样——样本编号按顺序成等差数列,分层抽样——每层获取样本的比例都是;
2.三种抽样方法的共性、个性、适用范围.
4.6
用样本估计总体
【知识点】
如何处理从实践中所获取的数据?
1.频率分布直方图
⑴作法:求
(数据中
值与
值的差)→决定

(无固定标准,分组力求合适)→将数据分组→列
表→画
直方图(纵轴表示
,横轴表示收集的数据).
⑵频率分布直方图的性质:
小长方形面积=
×(
)=

各小长方形的面积总和=
.
⑶频率分布折线图:连接频率分布直方图中各小长方形上端的中点.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线.总体密度曲线反映了总体在各个范围内取值的
,总体在区间(a,b)内取值的百分比=横轴、x=a、x=b以及总体密度曲线围成图形的
,夹在总体密度曲线与横轴之间部分的面积=
.
频率分布折线图是随着样本容量、组距的变化而变化,是不确定的、随机的,总体密度曲线是固有的、确定的.
2.茎叶图:根据数据特征确定茎的主干(中间的一列数:可能是数据中的十位数字、或百位与十位数字等等)→叶(个位数字),适用范围:样本数据较
.
3.样本的数字特征
⑴众数:数样本据中,出现
最多的数据;
    频率分布直方图中,
的小长方形下端的
是众数的估计值.
⑵中位数:样本数据按大小依次排列,处在
位置的一个数据或最
数据的
数; 
     频率分布直方图中,中位数左边和右边的直方图的
.
⑶平均数:即样本数据的算术平均数,指的是=        ;
     频率分布直方图中,平均数的估计值=频率分布直方图中每个小矩形的
×小矩形底边

 
之和.
⑷方差:s2=                  ,其中方差的
根s称为标准差. 
    方差或标准差越小,说明样本数据越集中;方差或标准差越大,说明样本数据越分散.方差或标准差=0反映样本数据全都相等.
  ⑸极差:样本数据中,   值-   值=极差.极差与方差(或标准差)具有同等效用.
注意:对于一个固定的总体而言,不同的样本可能产生不同的众数、中位数、平均数、方差、极差、频率分布直方图.如果获取的样本科学合理,那么通过该样本可以对总体作出正确的估计,否则就有可能歪曲事实.统计的基本思想就是利用样本的特征来反映总体的特征.
【应用点】
1.⑴已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位
数为10.5,若要使该总体的方差最小,则a、b的取值分别是
.
⑵根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图),从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是(

A.48米
B.49米
C.50米
D.51米
⑶(多选题)有一组样本数据x1,x2,…,xn,由这组数据得到样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(  )
 
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
  
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
⑷若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为(  )
A.8
B.15
C.16
D.32
⑸(多选题)在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是(  )
平均数≤3
    
B.平均数≤3且标准差s≤2
C.平均数≤3且极差≤2
D.众数=1且极差≤4
2.某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:
分组
[500,900)
[900,1100)
[1100,1300)
[1300,1500)
[1500,1700)
频数
48
121
208
223
193
频率
分组
[1700,1900)
[1900,)
频数
165
42
频率
 ⑴将各组的频率填入表中;
 ⑵根据上述统计结果,计算灯管使用寿命不足1500小时的频率;
 ⑶该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求至少有2支灯管的使用寿命不足1500小时的概率.
3.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工.根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].
(1)求频率分布直方图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.
4.随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差;
(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.
【核心点】
1.频率分布直方图的性质,五个数;
2.数据图形化:频率分布直方图或茎叶图.
4.7
离散型随机变量及其分布
【知识点】
1.随机变量:随着
变化而变化的变量,随机变量类似于函数中的因变量,其中
类似于函数中的自变量.随机变量常用字母X、Y、、…表示.
2.离散型随机变量:所有值可以
的随机变量.
3.离散型随机变量的分布列:若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)对应事件的概率P(X=xi)=pi,则表格
X


P
称为离散型随机变量X的概率分布列,简称X的分布列,简记为P(X=xi)=pi(i=1,2,…,n).
性质:⑴pi≥
(i=1,2,…,n),⑵=
.
4.常见离散型随机变量分布列
X
0
1
P
1-p
p

称上表形式的随机变量X服从两点分布或0-1分布、伯努利分布,称P(X=1)=p为成功概率.
⑵在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则
P(X=k)=
,k=0,1,2,…,m,即
X
0
1

m
P
其中m=min{M,n},且n≤N,M≤N,n,M,N∈N
,称上表形式的随机变量X服从超几何分布.
⑶在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=
,k=0,1,2,…,n.称随机变量X服从二项分布,记为X~B(n,p).
  0-1分布与二项分布的关系是                           .
5.离散型随机变量X的均值或数学期望、方差、标准差
离散型随机变量X的分布列
X
x1
x2

xi

xn
P
p1
p2
pi
pn
则称E(X)=
为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(xi-E(X))2描述了xi
相对于E(X)的偏离程度.而D(X)=
为这些偏离程度的加权平均,刻画了随机变量X与其均值E(X)的
偏离程度,称D(X)为随机变量X的
,其中
称随机变量X的标准差.方差与标准差反映了随机变量取值偏离于均值的平均程度,方差或标准差越小,则随机变量偏离于

程度越小.
结论:
⑴若Y=aX+b,其中a、b为常数,X是随机变量,则Y也是随机变量,且P(Y=axi+b)=
,E(Y)=
,D(aX+b)=
.
⑵X服从两点分布,则E(X)=
,D(X)=
.
⑶X~B(n,p),则E(X)=
,D(X)=
.
【应用点】
1.从学校回家要经过5个红绿灯口,可能遇到红灯的次数X是一个
,其中{x=0}表示的事件是“
”,
{x=1}表示的事件是“
”,
{x=2}表示的事件是“
”,
{x=3}表示的事件是“
”,
{x=4}表示的事件是“
”,
{x=5}表示的事件是“
”,“第一与第三个路口碰到红灯,其它路口碰到绿灯”
(填“能”或“不能”)用X表示.
2.⑴已知甲盒中仅有1个球且为红球,乙盒中有m个红球和n个篮球(m≥3,n≥3),从乙盒中随机抽取i(i=1,2)个球放入甲盒中.
(a)放入i个球后,甲盒中含有红球的个数记为R(i=1,2);
(b)放入i个球后,从甲盒中取1个球是红球的概率记为pi(i=1,2).
则(  )
  A.
B.
  C.
D.
 ⑵衡南五中高一年级和高二年级进行篮球比赛,赛制为3局2胜制,若比赛没有平局,且高二队每局获胜的概率都是p(0<p<),记比赛的最终局数为随机变量X,则(  )
    A.E(X)=
B.E(X)>
C.D(X)<
D.D(X)(,)
⑶随机变量的取值为0,1,2,若,,则________.
3.从某批产品中,有放回地抽取产品二次,每次随机抽取1件,假设事件A:“取出的2件产品中至多有1件是二等品”的概率P(A)=0.96.
⑴求从该批产品中任取1件是二等品的概率p;
⑵若该批产品共100件,从中任意抽取2件,表示取出的2件产品中二等品的件数,求的分布列.
4.某单位有三辆汽车参加某种事故保险,单位年初向保险公司缴纳每辆元的保险金,对在一年内发生此种事故的每辆汽车,单位可获元的赔偿(假设每辆车最多只赔偿一次),设这三辆车在一年内发生此种事故的概率分别为,,,且各车是否发生事故相互独立,求一年内该单位在此保险中:
⑴获赔的概率;
⑵获赔金额的分布列与期望.
5.购买某种保险,每个投保人每年度向保险公司交纳保费a元,若投保人在购买保险的一年度内出险,则可以获得10
000元的赔偿金.假定在一年度内有10
000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10
000元的概率为.
⑴求一投保人在一年度内出险的概率p;
⑵设保险公司开办该项险种业务除赔偿金外的成本为50
000元,为保证盈利的期望不小于0,求每位投保人应交纳的最低保费(单位:元).
6.袋中有20个大小相同的球,其中记上0号的有10个,记上号的有个(=1,2,3,4).现从袋中任取一球.表示所取球的标号.
⑴求的分布列,期望和方差;
⑵若,
,,试求a,b的值.
7.某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,每次抽奖都是从装有4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出1个球,在摸出的2个球中,若都是红球,则获一等奖;若只有1个红球,则获二等奖;若没有红球,则不获奖.
(1)求顾客抽奖1次能获奖的概率;
(2)若某顾客有3次抽奖机会,记该顾客在3次抽奖中获一等奖的次数为X,求X的分布列和数学期望.
【核心点】
1.离散型随机变量的可能取值,每一个取值对应的事件是什么,计算概率P(X=k);
2.期望、方差的有关结论;
3.特殊的离散型随机变量.
4.8
正态分布
【知识点】
1.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如右图所示.根据此图,画出频率分布折线图:
当样本容量增大,组数增加,频率分布折线越来越趋近于一条光滑曲线——总体密度曲线,这条曲线就是或近似地是函数=
的图像,其中实数、(>0)为参数,我们称的图像为正态分布密度曲线,简称正态曲线.
2.正态曲线的特点
  ⑴曲线位于
,与
不相交.
  ⑵曲线是
,它关于直线
对称.
  ⑶曲线在
处达到峰值
.
  ⑷曲线与x轴之间的面积=
.
3.对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=
,则称随机变量X服从正态分布,正态分布完全由参数
确定,而P(X=b)=
,X服从正态分布记为X~N(、2).正态总体几乎取值于区间
 
之内,而此区间以外取值在一次试验中几乎不可能发生,因而通常认为服从于正态分布N(、2)的随机变量X只取
之间的值,简称为3原则.
【应用点】
1.⑴已知随机变量服从正态分布N(3,
2),则P(=(

A.
B.
C.
D.
⑵设随机变量服从正态分布,若,则c=
(
)
A.1
B.2
C.3
D.4
⑶两个正态分布和的密度函数图像如图.则有(

A.
B.
C.
D.
⑷在如图所示的正方形中随机投掷10
000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为(  )
附:若X~N(μ,σ2),
则P(μ-σ<X≤μ+σ)=0.682
6,
P(μ-2σ<X≤μ+2σ)=0.954
4.
A.2
386
B.2
718
C.3
413
D.4
772
⑸已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(  )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%.)
A.4.56%
B.13.59%
C.27.18%
D.31.74%
⑹设X~N(μ1,σ),Y~N(μ2,σ),这两个正态分布密度曲线如图所示,下列结论中正确的是(  )
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.对任意正数t,P(X≥t)≥P(Y≥t)
D.对任意正数t,P(X≤t)≥P(Y≤t)
2.从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
⑴求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);
⑵由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布,其中近似为样本平均数,近似为样本方差.
(i)利用该正态分布,求;
(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i)的结果,求E(X).
附:≈12.2.
若~,则=0.6826,=0.9544.
【核心点】
1.正态曲线的性质;
2.P(Xu)=,P(Xu+m).
4.9
变量间的相关关系与最小二乘法
【知识点】
1.常见的两个变量间的关系有两类,一类是函数关系,反映的是两个变量间的   关系;另一类是相关关系,它反映的是两个变量间的    关系.怎么样研究两个变量间的相关关系?通常做法是:
作出这两个变量以其中一个为横向变量,另一个为纵向变量画出散点图;若这些点散布在从左下到右上的区域,两个变量的这种相关关系称为  相关;若这些点散布在从左上到右下的区域,两个变量的这种相关关系称为  相关.
如果散点图中点的分布从整体上看大致在一条直线上,则称这两个变量具有线性相关关系,这条直线称为线性回归直线,这条直线的方程称为线性回归直线方程.
2.回归直线方程的求法:画散点图→→设回归方程=x+→→计算,→→、分别是使Q(,)=取最小值时,的值(这种求使得样本数据的点到回归直线的距离的平方和最小的方法称最小二乘法)→→=,=-→→回归直线方程.显然,任何回归直线都经过点
,它称为
.这种对具有线性相关关系的两个变量进行统计分析的方法称为回归分析.
3.非线性相关关系的两个变量间的方程→→通过   向线性相关关系  .
4.判断求得的线性回归直线反映实际情况的程度:
⑴残差与残差图:两个具有线性相关关系的变量对应的样本点不共线,而是散布在某一条直线的附近(线性回归直线),两个变量的这种相关关系可用线性回归模型,其中e是随机变量,称为随机误差,D(e)=越小,用bx+a预报真实值y的精度越高,e是引起预报值与真实值y之间存在误差的原因之一.对于样本点(x1,y1)、(x2,y2)、…、(xn,yn)而言,随机误差ei=yi-bxi-a,其估计值=yi-=yi-xi-(i=1,2,…,n)称为相应于点(xi,yi)的残差,以残差为纵坐标,样本编号或xi或为横坐标描点作图(这样的点称为残差点),这样作出的图形称为残差图,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越 ,说明模型拟合精度越 ,回归方程的预报精度越 .
⑵相关指数:R2=1-,R2越大,模型的拟合效果越 ;R2越小,模型的拟合效果越 .
【应用点】
1.⑴为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,据此估计,该社区一户年收入为15万元家庭的年支出为(  )
A.11.4万元
B.11.8万元
C.12.0万元
D.12.2万元
⑵根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
0.5
得到的回归方程为,则(

A.
B.
C.
D.
⑶已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的回归方程是(

A.
=1.23x+4
B.
=1.23x+5
C.
=1.23x+0.08
D.
=0.08x+1.23
⑷对变量x,
y
有观测数据(,)(i=1,2,…,10),得散点图1;对变量u
,v
有观测数据(,)(i=1,2,…,10),得散点图2.
由这两个散点图可以判断(

A.x
与y
正相关,u
与v
正相关
B.x
与y
正相关,u
与v
负相关
C.x
与y
负相关,u
与v
正相关
D.x
与y
负相关,u
与v
负相关
⑸对于n对观察数据,根据线性回归模型,对于每一个xi,对应的随机误差项εi=yi-(a+bxi),我们希望总体误差越小越好,即(  )
A.εi越小越好
B.越小越好
 
C.越小越好 
D.越小越好
2.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图
⑴由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
⑵建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:,,,≈2.646.
参考公式:相关系数
=t+
中斜率和截距的最小二乘估计公式分别为.
3.某企业研发了一种产品,产品的成本由原料成本及非原料成本组成.每批产品的非原料总成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x
1
2
3
4
5
6
7
y
6
11
21
34
66
101
196
  根据以上数据绘制如图所示的散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用对数型函数模型y=a+blnx(a、b为常数)和指数型函数模型y=c·dx(c、d均为大于零的常数)分别对两个变量的关系进行拟合.
⑴根据散点图判断,y=a+blnx与y=c·dx哪一个适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理由)
⑵根据⑴的判断结果及表1中的数据,建立y关于x的回归方程;
⑶已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千件产品.
100.54
62.14
1.54
2535
50.12
3.47
参考数据:
其中=lg,=.=x+
中斜率和截距的最小二乘估计公式
分别为.
【核心点】
1.线性回归直线方程的求法,非线性回归方程转化为线性回归直线方程求之;
2.回归效果的判断.
4.10
独立性检验基本思想
【知识点】
1.独立性检验:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数表(称为列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
该表称为2×2列联表,n=a+b+c+d
为样本容量,K2=,利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
2.独立性检验具体做法:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界→→查表确定临界值k0→→利用K2公式,计算随机变量K2的观测值k→→若k≥k0,就推断“两个分类变量之间有关系”,该推断犯错误的概率不超过
;否则,则认为在犯错误的概率不超过
的前提下推断“两个分类变量之间无关系”.
【应用点】
1.⑴用独立性检验来考察两个变量x与y是否有关系,当统计量K2的值(

A.越大,“x与y是有关系的”成立可能性越小
B.越大,“x与y是有关系的”成立可能性越大
C.越小,“x与y是没有关系的”成立可能性越小
D.与“x与y有关系”成立的可能性无关
⑵已知随机事件A与B,经计算得到K2的范围是3.841<K2<6.635,则(下表是K2的临界值表,供参考)(  )
P(K2≥x0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.有95%
把握说事件A与B有关
B.有95%
把握说事件A与B无关
C.有99%
把握说事件A与B有关
D.有99%
把握说事件A与B无关
2.在对人们的休闲方式的一次独立性检验中,共调查了124人,其中女性70人,男性54人,女性中有43人主要休闲方式是看电视,另外27人主要休闲方式是运动;男性中有21人主要休闲方式是看电视,另外33人主要休闲方式是运动.
(1)根据以上数据建立一个2×2的列联表;
(2)试判断性别与休闲方式是否有关系(可靠性不低于95﹪).
3.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查。下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”。
⑴根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别
有关?
⑵将上述调查所得到的频率视为概率。现在从该地区大量电视观众中,采用随机抽
样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X。若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X)。
非体育迷
体育迷
合计


10
55
合计
【核心点】
1.独立性检验的基本思想;
2.K2的观测值k的作用.
4.11
概率统计综合问题
【应用点】
1.为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组.每组100只,其中一组注射药物A,另一组注射药物B.实验结果统计如下面表1与表2.(疱疹面积单位:)
表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
频数
30
40
20
10
表2:注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
频数
10
25
20
30
15
⑴完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
⑵完成下面列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:
疱疹面积小于70mm2
疱疹面积不小于70mm2
合计
注射药物A
a=
b=
注射药物B
c=
d=
合计
n=
附:
2.乒乓球台面被球网分成甲、乙两部分.如图,甲上有两个不相交的区域A,B,乙被划分为两个不相交的区域C,D.某次测试要求队员接到落点在甲上的来球后向乙回球.规定:回球一次,落点在C上记3分,在D上记1分,其它情况记0分.对落点在A上的来球,队员小明回球的落点在C上的概率为,在D上的概率为;对落点在B上的来球,小明回球的落点在C上的概率为,在D上的概率为.假设共有两次来球且落在A,B上各一次,小明的两次回球互不影响.求:
⑴小明两次回球的落点中恰有一次的落点在乙上的概率;
⑵两次回球结束后,小明得分之和的分布列与数学期望.
3.随机将1、2、…、2n(nN,n>1)这2n个连续正整数分成A、B两组,每组n个数,A组最小数为a1,最大数为a2;B组最小数为b1,最大数为b2,记=a2-a1,=b2-b1。
⑴当n=3时,求的分布列和数学期望;
⑵令C表示事件与的取值恰好相等,求事件C发生的概率P(C);
⑶对⑵中的事件C,表示C的对立事件,判断P(C)和P()的大小关系,并说明理由。
4.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
⑴假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求P(X≥1)及X的数学期望;
⑵一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)试说明上述监控生产过程方法的合理性;
(ii)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,其中为抽取的第个零件的尺寸,.
用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?
附:若随机变量服从正态分布,则,
,.
【核心点】
理解,理解,再理解!2021-2022编者-龙诗春
同课章节目录