(共30张PPT)
概率与统计小结(第一课时)
高二年级 数学
一、随机事件的条件概率
二、离散型随机变量及其分布列
三、正态分布
本章所学习的概率方面的相关内容有:
一、随机事件的条件概率
条件概率:
乘法公式:
全概率公式:
贝叶斯公式:
二、离散型随机变量及其分布列
离散型随机变量的分布列:
一般地,当离散型随机变量X的取值范围是 时,如果对任意 ,概率 都是已知的,则称
X的概率分布是已知的.
二、离散型随机变量及其分布列
离散型随机变量的分布列如下表所示:
X
P
写出一个离散型随机变量的分布有以下几个步骤:
(1)写出X的所有取值;
(2)求X取每一个值的概率;
(3)列出表格.
二、离散型随机变量及其分布列
两点分布:
一般地,如果随机变量的分布列能写成下列表格的形式,则称这个随机变量服从参数为p的两点分布(或0-1分布).
两点分布也称为伯努利分布.
W 1 0
P
二、离散型随机变量及其分布列
n次独立重复试验:
在相同的条件下重复n次伯努利试验时,人们总是约定这n次试验是相互独立的,此时这n次伯努利试验也常称为n次独立重复试验.
二、离散型随机变量及其分布列
二项分布:一般地,如果一次伯努利试验中,出现“成功”的概率为p,记,且次独立重复试验中出现“成功”的次数为X,则X的分布列如下表所示:
X 0 1
P
称X 服从参数为n,p的二项分布,记作
二、离散型随机变量及其分布列
超几何分布:一般地,若有总数为N的甲、乙两类物品,其中甲类有M件 ,从所有物品中随机取出n件 ,则这n件中所含甲类物品数X是一个离散型随机变量,X能取不小于t且不大于s的所有自然数,其中s是M与n中的较小者,t在n不大于乙类物品件数 时取0,否则t取n减乙类物品件数之差.
二、离散型随机变量及其分布列
超几何分布:
而且,
这里的X称为服从参数为N,n,M的超几何分布,记作:
二、离散型随机变量及其分布列
离散型随机变量的均值:
一般地,如果离散型随机变量X的分布列如下表所示:
则称
为离散型随机变量X的均值或期望.
X
P
二、离散型随机变量及其分布列
其中,方差和标准差都是刻画X的离散程度(波动大小).
离散型随机变量的方差:
因为X的均值为E(X),所以称
为离散型随机变量的方差,称 为离散型随机变量的标准差.
三、正态分布
正态分布:
一般地,如果随机变量X落在区间[a,b]内的概率,总是等于
对应的正态曲线与 轴在区间[a,b]内围成的面积,则称X服从参数为 与 的正态分布,记作
此时 称为X的概率密度函数.
三、正态分布
标准正态分布:
且 的正态分布为标准正态分布.
如果 ,那么对于任意 ,通常记 ,
也就是说 表示 对应的正态曲线与 轴在区间
内所围的面积.
具有性质:
例 某班从6名干部(男生2人,女生4人)中,任选3人参加学校的义务劳动.设“男生甲被选中”为事件A,“女生乙被选中”为事件B,求P(B|A).
典型例题
解: 男生甲被选中的概率为
男生甲、女生乙都被选中的概率为
所以,在男生甲被选中的情况下,女生乙也被选中的概率为
例 某射击运动员进行射击训练时,假设每次击中目标的概率均为0.6,且每次射击结果互不影响,已知射手射击了5次,求:
(1)其中恰有3次击中目标的概率;
典型例题
解:设事件A为恰有3次击中目标.
答:其中恰有3次击中目标的概率为 .
则
例 某射击运动员进行射击训练时,假设每次击中目标的概率均为0.6,且每次射击结果互不影响,已知射手射击了5次,求:
(2)其中恰有3次连续击中目标,而其他两次没有击中目标的概率.
典型例题
分析 解题关键:恰有3次连续击中目标,而其他两次没有击中目标.
例 某射击运动员进行射击训练时,假设每次击中目标的概率均为0.6,且每次射击结果互不影响,已知射手射击了5次,求:
(2)其中恰有3次连续击中目标,而其他两次没有击中目标的概率.
典型例题
解:设事件B为恰有3次连续击中目标,而其他两次没有击中目标.
则
答:恰有3次连续击中目标,而其他两次没有击中目标的概率为
例 假设每一年都只有365天,而且每人在任意一天中出生的概率都相等.设一个有30人的班级中,恰有X位同学在元旦出生,指出X满足的分布列,并求出P.
典型例题
则X满足的分布列如下:
解:一个有30人的班级中,恰有X位同学在元旦出生,则X服从二项分布,即 .若记
例 假设每一年都只有365天,而且每人在任意一天中出生的概率都相等.设一个有30人的班级中,恰有X位同学在元旦出生,指出X满足的分布列,并求出 .
典型例题
解:此时
答: 的值约为
例 一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望及方差.
典型例题
例 (1)求在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
典型例题
分析:首先,我们应该先求出日销售量不低于100个的概率以及日销售量低于50个的概率.
其次,在3天里,有连续两天的日销售量都不低于100个,且另一天的日销售量低于50个的情况共有2种.
例 (1)求在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
典型例题
解:(1)由频率分布直方图可知,
日销售量不低于100个的概率为
日销售量低于50个的概率
例 (1)求在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个的概率;
典型例题
解:(1)记“在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个”的事件为A,则
所以在未来3天里,有连续两天的日销售量都不低于100个且另一天的日销售量低于50个的概率为0.108.
例 (2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望及方差.
典型例题
解:(2)X可能为0,1,2,3,则X服从二项分布,即
则
例 (2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望及方差.
典型例题
解:(2)所以X的分布列为
X 0 1 2 3
P 0.064 0.288 0.432 0.216
因为X服从二项分布,所以
1.随机事件的条件概率
2.离散型随机变量及其分布列
3.正态分布
课堂小结
教材第123页A组第4题
1.乒乓球单打决赛在甲、乙两名运动员间进行,比赛采用7局4胜制,假设两人在每一局比赛中获胜的可能性相等.
(1)求甲以4比1获胜的概率;
(2)求乙获胜且比赛局数多于5局的概率.
课后作业
教材第124页B组第4题
2.已知某电脑卖家只卖甲、乙两个品牌的电脑,其中甲品牌的电脑占70%.甲品牌的电脑中,优质率为80%;乙品牌的电脑中,优质率为90%.从该电脑卖家中随机购买一台电脑:
(1)求买到优质电脑的概率;
(2)若已知买到的是优质电脑,求买到的是甲品牌电脑的概率(精确到0.1%).
课后作业
谢谢(共36张PPT)
概率与统计小结(2)
高二年级 数学
本章所学习的统计方面的相关内容有:
一、成对数据的统计相关性;
二、一元线性回归模型;
三、 列联表.
一、成对数据的统计相关性
一般地,如果收集到了变量 和变量 的 对数据(简称为成对数据),如下表所示.
序号i 1 2 3 n
变量x
变量y
一、成对数据的统计相关性
则在平面直角坐标系 中描出点 ,就可以得到这 对数据的散点图.
如果由变量的成对数据、散点图或直观经验可知,变量 和变量 直接的关系可以近似用一次函数来刻画,则称两个变量线性相关.
一、成对数据的统计相关性
此时,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;
如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.
一、成对数据的统计相关性
相关系数:现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用
来衡量 与 的线性相关性强弱,称为相关系数.
二、一元线性回归模型
回归直线方程:
一般地,已知变量 与 的 对成对数据 .任意给定一个一次函数 ,对每一个已知的 ,由直线方程可以得到一个估计值
二、一元线性回归模型
如果一次函数 能使残差平方和即
取得最小值,则 称为 关于 的回归直线方程(对应的直线称为回归直线).
因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
二、一元线性回归模型
可以证明,给定两个变量 与 的一组数据之后,回归直线
总是存在的,而且
其中, 称为回归系数,也是回归直线方程的斜率.
二、一元线性回归模型
利用线性回归分析方法解决实际问题的基本步骤是:
第一步,利用数据表格或散点图等不同的方法,直观判断两个变量 与 之间是否具有线性相关关系;
第二步,判断两个变量 与 之间可能具有线性相关关系后,通过计算相关系数,衡量两个变量 与 之间线性相关关系的强弱.
二、一元线性回归模型
利用线性回归分析习方法解决实际问题的基本步骤是:
第三步,根据公式求出 关于 的回归直线方程;
第四步,依据回归直线做出统计推断或结果解释.
三、 列联表
列联表:
总计
a b a+b
c d c+d
总计 a+c b+d a+b+c+d
由此可得卡方的计算公式为:
三、 列联表
统计学中,常用的显著性水平 以及对应的分位数 如下表所示.
三、 列联表
(1)绘制 列联表;
(2)计算卡方数值;
(3)与显著性水平对应的分位数比较;
(4)若 ,就称在犯错误的概率不超过 的前提下,可以认为A与B不独立,或者说有 的把握认为A与B有关;若 ,则说没有 的把握认为A与B有关.
利用 列联表解决独立性检验实际问题的基本步骤:
例 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
典型例题
(1)由表中数据分析,是否有95%的把握认为收看新闻节目的观众与年龄有关?
文艺节目 新闻节目
20到40岁 40 18
大于40岁 15 27
分析:由表可得:
典型例题
文艺节目 新闻节目
20到40岁 40 18
大于40岁 15 27
解:根据题意可得,
所以有95%的把握认为收看新闻节目的观众与年龄有关.
典型例题
(2)用分层抽样的方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?
文艺节目 新闻节目
20到40岁 40 18
大于40岁 15 27
解:在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取
所以应抽取3名观众.
典型例题
(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20到40岁的概率.
文艺节目 新闻节目
20到40岁 40 18
大于40岁 15 27
解:由(2)得,5名观众中,有3名大于40岁的观众,有2名年龄为20到40岁的观众.
设事件A为恰有1名观众的年龄为20到40岁.
则
所以恰有1名观众的年龄为20到40岁的概率为
例 已知 与 之间的几组数据如下表所示.
典型例题
假设根据上表数据所得线性回归直线方程为 ,若某同学根据上表中的前两组数据,求得一次函数表达式为 .判断 与 的相对大小,以及 与 的相对大小.
1 2 3 4 5 6
0 2 1 3 3 4
解:由已知可得:
典型例题
1 1 0 1 0
2 2 2 4 4
3 3 1 9 3
4 4 3 16 12
5 5 3 25 15
6 6 4 36 24
21 13 91 58
解:所以,
典型例题
又因为一次函数过点(1,0)和(2,2),可得
所以
例 某地近十年粮食需求量逐年上升,下表是部分统计数据.
典型例题
(1)利用所给数据求年需求量与年份之间的回归方程;
年份x 2012 2014 2016 2018 2020
需求量y/万吨 236 246 257 276 286
(2)利用(1)中所求出的线性回归方程预测该地2022年的粮食需求量.
典型例题
(1)利用所给数据求年需求量与年份之间的回归方程;
年份x 2012 2014 2016 2018 2020
需求量y/万吨 236 246 257 276 286
解:根据所给的表格可知,用年份减去2016,得到-4,-2,0,2,4,
需求量都减去257,得到-21,-11,0,19,29,这样对应的年份和需求量之间是一个线性关系.
典型例题
(1)利用所给数据求年需求量与年份之间的回归方程;
年份x 2012 2014 2016 2018 2020
需求量y/万吨 236 246 257 276 286
解:
所以线性回归方程是
即
典型例题
(2)利用(1)中所求出的线性回归方程预测该地2022年的粮食需求量.
年份x 2012 2014 2016 2018 2020
需求量y/万吨 236 246 257 276 286
解:当
所以预测该地2022年的粮食需求量是299.2万吨.
例 某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均运动时间的样本数据(单位:h).
典型例题
(1)应收集多少位女生样本数据?
解:应收集 位女生样本数据.
典型例题
(2)根据这300个样本数据,得到学生每周平均
体育运动时间的频率分布直方图如图所示.其中样本数据分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].
估计该校学生每周平均体育运动时间超过4h的概率.
解:该校学生每周平均体育运动时间超过4h的概率为
典型例题
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4h.请制作每周平均体育运动时间与性别的 列联表,并判断是否有95%的把握认为该校学生的每周平均体育运动时间与性别有关.
解:由(2)得,该校学生每周平均体育运动时间超过4h的人数为:
所以该校有60名女生每周平均体育运动时间超过4h,有165名男生每周平均体育运动时间超过4h.
典型例题
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4h.请制作每周平均体育运动时间与性别的 列联表,并判断是否有95%的把握认为该校学生的每周平均体育运动时间与性别有关.
解:所以根据题意可列出 列联表如下
超过4小时 不超过4小时 总计
男 165 45 210
女 60 30 90
总计 225 75 300
典型例题
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4h.请制作每周平均体育运动时间与性别的 列联表,并判断是否有95%的把握认为该校学生的每周平均体育运动时间与性别有关.
解:所以可得:
所以有95%的把握认为该校学生的每周平均体育运动时间与性别有关.
1.一元线性回归模型
2.独立性检验
课堂小结
教材第118页习题4-3B第4题
4.某工厂有25周岁及以上的工人300名,25周岁以下的工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁及以上”和“25周岁以下”分为两组,再将两组工人的日平均
课后作业
教材第118页习题4-3B第4题
生产件数分成5组:
[50,60),[60,70),[70,80),[80,90),
[90,100),分别加以统计,得到如图所示
的频率分布直方图.
课后作业
教材第118页习题4-3B第4题
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下”的工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件列出 列联表,并判断是否有90%的把握认为生产能手与工人所在的年龄组有关.
课后作业
教材第124页A组第11题
11.在调查男女学生购买食品时是否阅读营养成分说明时,调查了36位男生、38位女生,而且阅读营养成分的人有46位,阅读营养成分的人中有28位女生.用 列联表表示上述数据.
课后作业
谢谢