(共20张PPT)
(2)任何事件(除不可能事件)都可以表示成基本事件的和。
(1)任何两个基本事件是互斥的;
基本事件
例1 、 从字母a、b、c、d中任意取出两个不同字母的试验中,有哪些基本事件?
解:所求的基本事件共有6个:
A={ a,b },B={ a,c }, C={ a,d } ,
D={ b,c }, E={ b,d },
F={ c,d }
注:我们一般用列举法列出所有基本事
件的结果,列举时按照一定的逻辑顺序,
可以使我们做到不重不漏。
(1)试验中所有可能出现的基本事件只有有限个;(有限性)
(2)每个基本事件出现的可能性相等。
(等可能性)
我们将具有这两个特点的概率模型称为古典概率概型,简称古典概型。
(1)向一个圆面内随机地投射一个点,如果该点落在圆内任意一点都是等可能的,你认为这是古典概型吗 为什么?
(2)如图,某同学随机地向一靶心进行射击,这一试验的结果只有有限个:命中10环、命中9环……命中5环和不中环。你认为这是古典概型吗?为什么?
因为试验的所有可能结果是圆面内所有的点,试验的所有可能结果数是无限的,虽然每一个试验结果出现的“可能性相同”,但这个试验不满足古典概型的第一个条件。
不是古典概型,因为试验的所有可能结果只有7个,而命中10环、命中9环……命中5环和不中环的出现不是等可能的,即不满足古典概型的第二个条件。
在古典概型下,某次试验由n个基本事件组成,基本事件出现的概率是多少?若随机事件A由m个基本事件组成,那么A出现的概率如何计算?
例2 单选题是标准化考试中常用的题型,一般是从A,B,C,D四个选项中选择一个正确答案。如果考生掌握了考察的内容,他可以选择唯一正确的答案。假设考生不会做,他随机的选择一个答案,问他答对的概率是多少?
(变)在标准化考试中既有单选题又有多选题,多选题是从A,B,C,D四个选项中选出所有正确的答案,同学们可能有一种感觉,如果不知道正确答案,多选题更难猜对,这是为什么?
思考
我们探讨正确答案的所有结果:
如果只有一个正确答案是对的,则有4种;
如果有两个答案是正确的,则正确答案可以是(A、B)(A、C)(A、D)(B、C)(B、D) (C、D)6种
如果有三个答案是正确的,则正确答案可以是(A、B、C)(A、C、D)(A、B、D)(B、C、D)4种
所有四个都正确,则正确答案只有1种。
正确答案的所有可能结果有4+6+4+1=15种,从这15种答案中任选一种的可能性只有1/15,因此更难猜对。
解:(1)将骰子抛掷1次,它出现的点数有1,2,3,4,5,6这6种结果,对于每一种结果,第二次抛时又都有6种可能的结果,于是共有6×6=36种不同的结果。
由表可知,等可能基本事件总数为36种。
例3(掷骰子问题):将一个骰子先后抛掷2次,观察向上的点数。
问: (1)共有多少种不同的结果
(2)两数之和不低于10的的概率是多少?
(3)两数之和是3的倍数的概率是多少?
例、从含有两件正品a,b和一件次品c的三件产品中每次任取1件,每次取出后不放回,连续取两次,求取出的两件中恰好有一件次品的概率。
解:每次取一个,取后不放回连续取两次,其事件空间是
Ω={ }
(a,b),
(a,c),
(b,a),
(b,c),
(c,a),
(c,b)
∴n = 6
用A表示“取出的两件中恰好有一件次品”这一事件,则
A={ }
(a,c),
(b,c),
(c,a),
(c,b)
∴m=4
∴P(A) =
变式:从含有两件品a,b和一件次品c的三件产品中每次任取1件,每次取出后放回,连续取两次,求取出的两件中恰好有一件次品的概率。
解:有放回的连取两次取得两件,其一切可能的结 果组成的 事件空间是
Ω={ }
(a,a),
(a,b),
(a,c),
(b,a),
(b,b),
(b,c),
(c,a),
(c,b),
(c,c)
∴n=9
用B表示“恰有一件次品”这一事件,则
B={ }
(a,c),
(b,c),
(c,a),
(c,b)
∴m=4
∴P(B) =
例、某种饮料每箱装6听,如果其中有2听不合格,问质检人员从中随机抽取2听,检测出不合格产品的概率有多大?
1 2 3 4 a b
1 (1,2) (1,3) (1,4) (1,a) (1,b)
2 (2,1) (2,3) (2,4) (2,a) (2,b)
3 (3,1) (3,2) (3,4) (3,a) (3,b)
4 (4,1) (4,2) (4,3) (4,a) (4,b)
a (a,1) (a,2) (a,3) (a,4) (a,b)
b (b,1) (b,2) (b,3) (b,4) (b,a)
〖解〗合格的4听分别记作1,2,3,4,不合格的2听记作a,b.6听里随机抽出2听的所有基本事件共有30个,设检测出不合格产品的事件为A,事件A包括A1={仅第1次抽出的是不合格产品}、A2={仅第2次抽出的是不合格产品}、A3= ={两次抽出的都是不合格产品},且A1、A2、A3互斥,因此:
例、某种饮料每箱装6听,如果其中有2听不合格,问质检人员从中随机抽取2听,检测出不合格产品的概率有多大?
例 设袋中有4只红球和6只黑球,现从袋中有放
回地摸球3次,求前2次摸到黑球、第3次摸到红球
的概率.
解
第1次摸球
10种
第2次摸球
10种
第3次摸球
10种
6种
第1次摸到黑球
6种
第2次摸到黑球
4种
第3次摸到红球
基本事件总数为
A 所包含基本事件的个数为
例: 用三种不同的颜色给图中的3个矩形
随机涂色,每个矩形只能涂一种颜色,求
(1)3个矩形的颜色都相同的概率;
(2)3个矩形的颜色都不同的概率.
解 : 本题的等可能基本事件共有27个
(1)同一颜色的事件记为A,P(A)=3/27 =1/9;
(2)不同颜色的事件记为B,P(B)=6/27 =2/9
思考与练习
1.有四条线段,其长度分别是3,4,5,7,现从中任取三条,它们能构成三角形的概率是( ).
A. B. C. D.
2.从1,2, 3,4, 5五个数字中,任取两数,求两数都是奇数的概率。
3、五件产品中有两件次品,从中任取两件来检验.
(1)一共有多少种不同的结果
(2)两件都是正品的概率是多少
(3)恰有一件次品的概率是多少
20种
3/10
3/5
4、从分别写上数字1, 2,3,…,9的9张卡片中,任取2张,则取出的两张卡片上的“两数之和为 偶数”的概率是
古典概型之概率求法总结:
1、判断是否为古典概型,如果是,用枚举法准确求出基本事件个数n。
应特别注意:严防遗漏,绝不重复;
2、求出事件A包含的基本事件个数m.
3、P(A)=m/n
1.古典概型:
我们将具有:
(1)试验中所有可能出现的基本事件只有有限个(有限性)
(2)每个基本事件出现的可能性相等。(等可能性)
这样两个特点的概率模型称为古典概率概型,简称古典概型。
2.古典概型计算任何事件的概率计算公式为:
3.求某个随机事件A包含的基本事件的个数和实验中基本事件的总数常用的方法是列举法(画树状图和列表),注意做到不重不漏。
小结(共19张PPT)
3.1 频率与概率
投掷硬币的试验:
虽然我们不能预先判断出现正面向上,还是反面向上。但是假定硬币均匀,直观上可以认为出现正面与反面的机会相等。即在大量试验中出现正面的频率接近于0.5.
历史上有些学者做过成千上万次的投掷硬币的试验。结果如下表:
实验者 试验次数(n) 出现正面的次数(m) 出现正面的频率(m/n)
棣莫佛 2048 1061 0.5181
蒲 丰 4040 2048 0.5069
费 勒 10000 4979 0.4979
皮尔逊 12000 6019 0.5016
皮尔逊 24000 12012 0.5005
抛硬币试验
我们可以设想有50人投掷硬币,如果每人投5次,计算每个人投出正面的频率,在这50个频率中,一般说,0,0.2,0.4,0.6,0.8,1 都会有。而且会有不少是0或1;
如果要求每个人投20次,这时频率为0,0.05,0.95,1的将会变少;多数频率在0.35~0.65之间,甚至于比较集中在0.4~0.6之间;
如果要求每人投掷1000次,这时绝大多数频率会集中在0.5附近,和0.5有较大差距的频率值也会有,但这样的频率值很少。
而且随着投掷次数的增多,频率越来越明显地集中在0.5附近。
人们经过大量试验和实际经验的积累逐渐认识到:在多次重复试验中,同一事件发生的频率在某一数值附近摆动,而且随着试验次数的增加,一般摆动幅度越小,
频率呈现一定的稳定性,频率的稳定性揭示出随机事件发生的可能性有一定的大小。
事件的频率稳定在某一数值附近,我们就用这一数值表示事件发生的可能性大小。
事件的概率
一般地,在n次重复进行的试验中,事件A发生的频率 ,当n很大时,总在某个常数附近摆动,随着n的增加,摆动幅度越来越小,这时就把这个常数叫做事件A的概率,记为P(A).
由定义可得概率P(A)满足:
必然事件与不可能事件可看作随机事件的两种特殊情况.
注意点:
1.随机事件A的概率范围
因此,随机事件发生的概率都满足:0≤P(A)≤1
2.频率与概率的关系
(1)联系: 随着试验次数的增加, 频率会在概率的附近摆动,并趋于稳定.
在实际问题中,若事件的概率未知, 常用频率作为它的估计值.
(2)区别: 频率本身是随机的,在试验前不能确定, 做同样次数或不同次数的重复试验得到的事件的频率都可能不同.
而概率是一个确定数,是客观存在的,与每次试验无关.
例1. 为了确定某类种子的发芽率,从一大批种子中抽出若干批作发芽试验,其结果如下:
种子粒数 25 70 130 700 2000 3000
发芽粒数 24 60 116 639 1806 2713
发芽率 0.96 0.857 0.892 0.913 0.903 0.904
从以上的数据可以看出,这类种子的发芽率约为0.9.
概率的意义
概率是对随机事件发生的可能性大小的度量,
它反映了随机事件发生的可能性的大小。但随机事件的概率大,并不表明它在每一次试验中一定能发生。概率的大小只能说明随机事件在一次试验中发生的可能性的大小,即随机性中含有的规律性。认识了这种随机性中的规律性,就使我们能比较准确地预测随机事件发生的可能性。
例2. 如果某种彩票的中奖概率为1/1000,那么买1000张这种彩票一定能中奖吗?
解:买1000张彩票相当于1000次试验,对于一次试验来说,其结果是随机的,即有可能中奖,也有可能不中奖,但这种随机性又呈现一定的规律性,“彩票的中奖概率为1/1000是指当试验次数相当大,即随着购买彩票的张数的增加,大约有1/1000的彩票中奖。
例3.在生活中,我们有时要用抽签的方法来决定一件事情,例如6张票中有1张奖票,6个人按顺序从中各抽1张以决定谁得到其中的奖票,那么,先抽或是后抽(后抽人不知道先抽人抽出的结果)对各人来说公平吗?也就是说,各人抽到奖票的概率相等吗?
小组合作,实验探究
解: 不妨把问题转化为排序问题,即把6张票随机地排列在位置1,2,3,4,5,6上, 对于这张奖票来说,由于是随机排列,因此它的位置有6种可能,故它排在任一位置上的概率都是 1/6 。6个人按排定的顺序去抽,比如甲排在第1位上,那么他抽得奖票的概率,即奖票恰好排在第1个位置上的概率为1/6 。因此,不管排在第几位上去抽,在不知前面的人抽出结果的前提下,得到奖票的概率都是1/6 。
例4.生活中,我们经常听到这样的议论:“天气预报说昨天降水概率为90%,结果根本一点雨都没下,天气预报也太不准确了。”学了概率后,你能给出解释吗?
例5. 从一批准备出厂的电视机中,随机抽取10台进行质量检查,其中有一台是次品,能否说这批电视机的次品的概率为0.10
练习、某篮球运动员在同一条件下进行投篮练习,结果如下表:
投篮次数 8 10 15 20 30 40 50
进球次数 6 8 12 17 25 32 39
进球频率
计算表中进球的频率;
这位运动员投篮一次,进球的概率约是多少
(3)这位运动员进球的概率是0.8,那么他投10次篮一定能
投中8次吗
不一定. 投10次篮相当于做10次试验,每次试验的结果都是随机的, 所以投10次篮的结果也是随机的.
概率约是0.8
0.78
0.75
0.80
0.80
0.85
0.83
0.80
1.概率是频率的稳定值,根据随机事件发生的频率只能得到概率的估计值.
2.随机事件A在每次试验中是否发生是不能预知的,但是在大量重复试验后,随着试验次数的增加,事件A发生的频率逐渐稳定在区间[0,1]内的某个常数上(即事件A的概率),这个常数越接近于1,事件A发生的概率就越大,也就是事件A发生的可能性就越大;反之,概率越接近于0,事件A发生的可能性就越小.因此,概率就是用来度量某事件发生的可能性大小的量.
3.任何事件的概率是0~1之间的一个确定的数,
小概率(接近0)事件很少发生,大概率(接近1)事件则经常发生,知道随机事件的概率的大小有利于我们作出正确的决策.
有的同学有99%可以好好学习的概率,但却选择了1%不思进取的概率,因为他不懂得对青春的珍惜;
有的同学有99%对父母说句“我爱你”的概率,但却选择了1%沉默的概率。因为他还没有读懂父母对他的希冀。
有的同学有99%宽宏忍让的概率,但却选择了1%翻脸的概率,因为他还不懂得宽宏的真正含义。
有的同学有99%帮助别人的概率,但却选择了1%麻木不仁的概率,因为他还没有领会生命的真谛。(共30张PPT)
3.1 频率与概率
无限连分式求π
平面上画着一些平行线,相邻的两条平行线之间的距离都为d,向此平面任投一长度为l(l历史上,法国数学家布丰(George-Louis Leelere de Buffon ,1707-1788)最早设计了本节这个投针试验,并于1777年给出了针与平行线相
交的概率的计算公式P= ,由于它与π有关,
于是人们想到利用投针试验来估计π的值。
试验者
时间
投掷次数
相交次数
π的试验值
Wolf
1850年
5000
2532
3.1596
Smith
1855年
3204
1218.5
3.1554
C.De Morgan
1860年
600
382.5
3.137
Fox
1884年
1030
489
3.1595
Lazzerini
1901年
3408
1808
3.1415929
Reina
1925年
2520
859
3.1795
投针试验的历史资料
找一根铁丝弯成一个圆圈,使其直径恰恰等于平行线间的距离d。可以想象得到,对于这样的圆圈来说,不管怎么扔下,都将和平行线有两个交点。因此,如果圆圈扔下的次数为n次,那么相交的交点总数必为2n。现在设想把圆圈拉直,变成一条长为πd的铁丝。显然,这样的铁丝扔下时与平行线相交的情形要比圆圈复杂些,可能有4个交点,3个交点,2个交点,1个交点,甚至于都不相交。由于圆圈和直线的长度同为πd,根据机会均等的原理,当它们投掷次数较多,且相等时,两者与平行线组交点的总数期望也是一样的。这就是说,当长为πd的铁丝扔下n次时,与平行线相交的交点总数应大致为2n。现在转而讨论铁丝长为L的情形。当投掷次数n增大的时候,这种铁丝跟平行线相交的交点总数m应当与长度L成正比,因而有:m=kL,式中k是比例系数。为了求出k来,只需注意到,对于L=πd的特殊情形,有m=2n。于是求得k=(2n)/(πd)。代入前式就有:m≈(2Ln)/(πd)从而π≈(2Ln)/(dm)
论证思路
布丰投针问题的重要性并非是为了求得比其它方法更精确的 π 值,而是在于它是第一个用几何形式表达概率问题的例子。它开创了使用随机数处理确定性数学问题的先河,是用偶然性方法去解决确定性计算的前导
蒙特卡洛方法
投掷硬币的试验:
虽然我们不能预先判断出现正面向上,还是反面向上。但是假定硬币均匀,直观上可以认为出现正面与反面的机会相等。即在大量试验中出现正面的频率接近于0.5.
历史上有些学者做过成千上万次的投掷硬币的试验。结果如下表:
实验者 试验次数(n) 出现正面的次数(m) 出现正面的频率(m/n)
棣莫佛 2048 1061 0.5181
蒲 丰 4040 2048 0.5069
费 勒 10000 4979 0.4979
皮尔逊 12000 6019 0.5016
皮尔逊 24000 12012 0.5005
抛硬币试验
从一定高度落下的图钉,落地后可能钉尖着地,也可能钉帽着地。你估计哪种事件发生的概率大?
用试验的方法估计钉尖着地的概率
人们经过大量试验和实际经验的积累逐渐认识到:在多次重复试验中,同一事件发生的频率在某一数值附近摆动,而且随着试验次数的增加,一般摆动幅度越小,
事件的频率稳定在某一数值附近,我们就用这一数值表示事件发生的可能性大小。
事件的概率
一般地,在n次重复进行的试验中,事件A发生的频率 ,当n很大时,总在某个常数附近摆动,随着n的增加,摆动幅度越来越小,这时就把这个常数叫做事件A的概率,记为P(A).
由定义可得概率P(A)满足:
随机事件A的概率范围
必然事件与不可能事件可看作随机事件的两种特殊情况.
因此,随机事件发生的概率都满足:0≤P(A)≤1
1、概率的意义
概率是对随机事件发生的可能性大小的度量,
它反映了随机事件发生的可能性的大小。
但随机事件的概率大,并不表明它在每一次试验中一定能发生。
2.频率与概率的关系
(1)联系: 随着试验次数的增加, 频率会在概率的附近摆动,并趋于稳定.
在实际问题中,若事件的概率未知, 常用频率作为它的估计值.
(2)区别: 频率本身是随机的,在试验前不能确定, 做同样次数或不同次数的重复试验得到的事件的频率都可能不同.
而概率是一个确定数,是客观存在的,与每次试验无关.
(1)联系
(2)区别
例1. 如果某种彩票的中奖概率为1/1000,那么买1000张这种彩票一定能中奖吗?
中奖概率=
例2.在生活中,我们有时要用抽签的方法来决定一件事情,例如6张票中有1张奖票,6个人按顺序从中各抽1张以决定谁得到其中的奖票,那么,先抽或是后抽(后抽人不知道先抽人抽出的结果)对各人来说公平吗?也就是说,各人抽到奖票的概率相等吗?
小组合作,实验探究
小组合作,实验探究
1、每组 1号洗牌,(手在桌下,纸牌背面向上)
2、按2~6号依次抽取一张,最后是1号(不得翻看)
3、听1号指令统一翻牌,由1号记录结果
4、重复1~3步,18次停止,做好合计,上交记录单
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
4
3
2
4
3
2
解: 把6张票随机地排列在位置1,2,3,4,5,6上, 对于奖票来说,它排在任一位置上的概率都是 1/6 。
6个人按排定的顺序去抽,比如甲排在第1位上,那么他抽得奖票的概率,即奖票恰好排在第1个位置上的概率为1/6 。因此,不管排在第几位上去抽,在不知前面的人抽出结果的前提下,得到奖票的概率都是1/6 。
练1.生活中,我们经常听到这样的议论:“天气预报说昨天降水概率为90%,结果根本一点雨都没下,天气预报也太不准确了。”学了概率后,你能给出解释吗?
练2、某篮球运动员在同一条件下进行投篮练习,结果如下表:
投篮次数 8 10 15 20 30 40 50
进球次数 6 8 12 17 25 32 39
进球频率
计算表中进球的频率;
这位运动员投篮一次,进球的概率约是多少
(3)这位运动员进球的概率是0.8,那么他投10次篮一定能
投中8次吗
不一定. 投10次篮相当于做10次试验,每次试验的结果都是随机的, 所以投10次篮的结果也是随机的.
概率约是0.8
0.78
0.75
0.80
0.80
0.85
0.83
0.80
1.概率是频率的稳定值,根据随机事件发生的频率只能得到概率的估计值.
2. 在大量重复试验后,随着试验次数的增加,随机事件A发生的频率逐渐稳定在区间[0,1]内的某个常数上(即事件A的概率),概率就是用来度量某事件发生的可能性大小的量.
有的同学有99%可以独立完成的概率,但却选择了1%不劳而获的概率,因为他不懂得对知识的珍惜;
有的同学有99%对父母说句“我爱你”的概率,但却选择了1%沉默的概率。因为他还没有读懂父母对他的希冀。
有的同学有99%宽宏忍让的概率,但却选择了1%翻脸的概率,因为他还不懂得宽宏的真正含义。
有的同学有99%帮助别人的概率,但却选择了1%麻木不仁的概率,因为他还没有领会生命的真谛。(共48张PPT)
算法知识结构:
基本概念
算法
基本结构
表示方法
应用
自然语言
程序框图
基本算法语句
顺序结构
条件结构
循环结构
更相减损术
秦九韶算法
割圆术
赋值语句
条件语句
循环语句
输入、输出语句
算法中从上一步骤指向下一步骤(连接程序框)
流程线
判断条件是否成立,在出口处标明“是” “否”或“Y” “N”
判断框
赋值、计算
处理框
表示一个算法输入输出信息
输入,输出框
表示一个算法的起始与结束
起止框
连接点
连接程序框图的两部分
1.常见的程序框图
条件结构
满足条件?
步骤1
步骤2
是
否
满足条件?
步骤A
是
否
IF 条件为真
语句序列A
END
条件语句
IF 条件为真
语句序列1
ELSE
语句序列2
END
循环for语句的基本格式:
for =
end
循 环 语 句
循环变量
初始值:步长:终值
循环体
For k= 1 : 1 : 100
For k= 1 : 1 : 100
循环while语句的基本格式:
while =
end
循 环 语 句
表达式条件
循环体
1、如图给出了一个算法
流程图,该算法流程
图的功能是( )
A.求a,b,c三数的最大数
B.求a,b,c三数的最小数
C.将a,b,c按从小到大排序
D.将a,b,c按从大到小排序
2、甲、乙两人玩游戏,规则如流程图所示,则甲胜的概率是 。
s = 1
i = 1
While S≤11
s = s+i
i = i+1
End
Print s
s = 1 i = 1
s = 2 i = 2
s = 4 i = 3
s = 7 i = 4
s = 11 i = 5
s = 16 i = 6
3.请说明该算法程序的执行结果
4:你能画出求分段函数
的值的程序框图吗?
开始
输入x
输出y
结束
是
y=x+2
否
y=1-x
x≥0?
x>1?
是
y=3x-1
否
统计
用样本估计总体
随机抽样
简单随机抽样
系统抽样
分层抽样
变量间的相关关系
用样本的频率
布估计总体分布
用样本的数字特征估计总体数字特征
线性回归分析
知识梳理
1. 简单随机抽样
(1)思想:设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.
抽签法:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
(2)步骤:
随机数表法:
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.
2. 系统抽样
(1)思想:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.
(2)步骤:
第一步,将总体的N个个体编号.
第二步,确定分段间隔k,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号.
第四步,按照一定的规则抽取样本.
3. 分层抽样
(1)思想:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.
(2)步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
4. 频率分布表
(1)含义:表示样本数据分布规律的表格.
(2)作法:
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.
5. 频率分布直方图
(1)含义:表示样本数据分布规律的图形.
(2)作法:
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
6. 茎叶图
作法:
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
7. 众数、中位数和平均数
8. 标准差
9. 相关关系
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.
10. 散点图
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
11. 回归直线
12. 回归方程
1. 某公司在甲乙丙丁死各地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售情况,需从这600个销售点抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点中抽取7个调查其销售收入售后服务等情况,记这项调查为②,则完成这两项调查采用的方法依次是( )
A.分层抽样,系统抽样 B.分层抽样,简单随机抽样
C.系统抽样,分层抽样 D.简单随机抽样,分层抽样
B
2. 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人。上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作。
解:因为抽样比k=1:5,应从副处级以上干部中抽取2人,一般干部中抽取14人,工人中抽取4人。
因副处级以上干部与工人人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;
对一般干部70人采用00,01,……,69编号,然后用随机数表法抽取14人。
3. 有关线性回归的说法,不正确的是( )
A. 相关关系的两个变量不是因果关系
B. 散点图能直观地反映数据的相关程度
C. 回归直线最能代表线性相关的两个变量之间的关系
D. 任一组数据都有回归方程
D
4.线性回归方程y=bx+a过定点________.
^
(x, y)
5.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.
^
概率知识点:
1、频率与概率的意义
3、古典概型
4、几何概型
2、事件的关系和运算
1、频率本身是随机的,在试验前不能确定。做同样次数的重复试验得到事件的频率会不同。
2、概率是一个确定的数,与每次试验无关。是用来度量事件发生可能性大小的量。
3、频率是概率的近似值,随着试验次数的增加,频率会越来越接近概率。
频率与概率的意义:
事件的关系和运算:
(1)并事件(和事件):
(2)交事件(积事件):
(3)互斥事件:
(4)互为对立事件:
且 是必然事件
互斥事件与对立事件的联系与区别:
1、两事件对立,必定互斥,但互斥未必对立
2、互斥的概念适用于多个事件,但对立概念只适用于两个事件
3、两个事件互斥只表明这两个事件不能同时发生,
即至多只能发生一个,但可以都不发生;
而两事件对立则表明它们有且只有一个发生
概率的基本性质
(1) 0≤P(A)≤1
(2) 当事件A、B互斥时,
(3) 当事件A、B对立时,
(1)试验中所有可能出现的基本事件只有有限个;(有限性)
(2)每个基本事件出现的可能性相等。(等可能性)
古典概型
1)两个特征:
2)古典概型计算任何事件的概率计算公式为:
(1)试验中所有可能出现的结果(基本事件)有无限多个.
(2)每个基本事件出现的可能性相等.
几何概型
1)几何概型的特点:
2)在几何概型中,事件A的概率的计算公式如下:
1. 抛掷一枚质地均匀的硬币,如果连续抛掷1000次,那么第999次出现正面朝上的概率是( )
B.
C.
D.
A.
2、某种彩票中奖几率为0.1%,某人连续买1000张彩票,下列说法正确的是:( )
A、此人一定会中奖
B、此人一定不会中奖
C、每张彩票中奖的可能性都相等
D、最后买的几张彩票中奖的可能性
大些
3. 一批产品中,有10件正品和5件次品,对产品逐个进行检测,如果已检测到前 3次均为正品,则第4次检测的产品为正品的概率是( )
A.7/12 B. 4/15 C. 6/11 D. 1/3
4、在去掉大小王的52张扑克中,随机抽取一张牌,这张牌是J或Q的概率为_________
5.有一人在打靶中,连续射击2次,事件“至少有1次中靶”的对立事件是( )
A.至多有1次中靶 B.2次都中靶
C.2次都不中靶 D.只有1次中靶
6、甲、乙两人下棋,两人下和棋的概率为 ,乙获胜的概率为 ,则甲获胜的概率为_______________
7、在相距5米的两根木杆上系一条绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率为______________
8、将甲、乙两颗骰子先后各抛一次,a,b分别表示抛掷甲、乙两颗骰子所得的点数,若把点数P(a,b)落在不等式组
所表示的区域的事件记为A,求P(A)
9、袋中有红、白色球各一个,每次任意取一个,有放回地抽三次,
(1)三次颜色中恰有两次同色的概率?
(2)三次颜色全相同的概率?
(3)抽取的红球多于白球的概率?
10、从1,2,3,4,5五个数字中任意取2个出来组成一个没有重复数字的两位数,求
(1)这个两位数是奇数的概率。
(2)这个两位数大于30的概率。
(3)求十位和个位上数字之和大于4两位数的概率。
11、有一个半径为4的圆,现将一枚直径为2的硬币投向其中,(硬币完全落在圆外的不计),则硬币完全落在圆内的概率?
思考: 半径为4的圆改为:边长为4的正方形?
A
O
如图: OA=2,OB=5,在线段OB上任意取一点P,试求:
B
(1)三角形AOP为钝角三角形的概率
(2)三角形AOP为锐角三角形的概率
12、
13、甲乙两辆货车都要停靠同一个站台卸货,他们可能在一昼夜的任一时刻到达,甲乙两辆货车卸货的时间分别是6小时与4小时。求有一辆货车停靠站台时不需等待的概率。(共33张PPT)
2.2.1 用样本的频率分布估计总体的分布
用样本估计总体
用样本估计总体(两种):
一种是:用样本的频率分布估计总体的分布。
另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。
一 频率分布图和频率分布直方图
频率分布折线图 和总体密度曲线
三 茎叶图
一、频率分布表与频率分布直方图:
1.频数、频率
将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
每组的频数除以样本容量的商叫做该组的频率;
频率反映每组数据在样本中所占比例的大小。
2.样本的频率分布表
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本的频率分布表。
3.列频率分布表的步骤
下面我们通过一个具体的实例来阐述这一方法。
某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:
列频率分布表的方法步骤:
①求极差(也称全距,即一组数据中最大值与最小值的差):
计算极差时,需要找出这组数据的最大值和最小值
最大值
最小值
运用上面的算法得出这组样本数据的最大值是25.56,用类似的算法可以得出最小值是25.24它们的差为 25.56-25.24= 0.32,所以极差等于0.32mm.
②决定组距与组数
那么组数= ——— =10.67,于是分成11组。
极差
组距
样本数据有100个,由上面算得极差为0.32,取组距为0.03,
③决定分点,将数据分组
将第1组的起点定为25.235,以组距为0.03将数据分组时,可以分成以下11组:
[25.235,25.265),[25.265,26.295), ……, [25.535,25.565].
④登记频数,计算频率,列出频率分布表
频率= —————,如第1小组的频率为——— =0.01.
频数
样本容量
1
100
频率分布表:
⑤ 绘制频率分布直方图
(1)频率分布直方图的绘制方法与步骤
S1 先制作频率分布表,然后作直角坐标系,以横轴表示产品内径尺寸,纵轴表示频率/组距.
S2 把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上25.235,25.265,
…… , 25.565表示的点;
S3 在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组的频率。
这些矩形就构成了频率分布直方图。
(2)有关问题的理解
① 因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。
②在频率分布直方图中,各小矩形的面积之和等于1.
③同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同。不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断。
④同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。
⑤上例中,如果规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们可依据抽样分析统计出产品中优等品的比例,也就是它的频率。从上表或上图容易看出,这个频率值等于0.12+0.18+0.25+0.16 +0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。工厂可以根据质量规范,看看是否达到优等品率的要求,如果没有达到,就需要进一步分析原因,解决问题。
频率分布直方图的特点
从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
例1. 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。试作出该样本的频率分布表。
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
解:最大值=180,最小值=151,
极差=29,决定分为10组;
则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数。
可取区间[150.5, 180.5]
分组 频数 频率
[150.5,153.5) 4 0.04
[153.5,156.5) 8 0.08
[156.5,159.5) 8 0.08
[159.5,162.5) 11 0.11
[162.5165.5) 22 0.22
[165.5,168.5) 19 0.19
[168.5,171.5) 14 0.14
[171.5,174.5) 7 0.07
[174.5,177.5) 4 0.04
[177.5,180.5) 3 0.03
合计 100 1
频率分布直方图为:
二、总体密度曲线
1.频率分布折线图
把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图。
频率分布折线图
2.总体密度曲线
总体密度曲线与x轴,直线x=a,x=b围成的面积等于x在[a,b]取值时的概率.
2.茎叶图
茎叶图也是用来表示数据的一种图,茎是中间的一列数,叶是从茎上生长出来的数.
例.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.
甲: 12,15,24,25,31,31,36,36,37,39,44,49,50.
乙: 8,13,14,16,23,26,28,33,38,39,51
解:画出两人得分的茎叶图
甲运动员的得分
中位数是
众数是
几种表示样本分布的方法比较:
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便;
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到频率分布表中看不清楚的数据模式,但是从频率分布直方图本身不能得出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线。
(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。
练习题:
1.在频率分布直方图中,小矩形的高表示( )
A.频率/样本容量
B.组距×频率
C.频率
D.频率/组距
D
2.在用样本频率估计总体分布的过程中,下列说法中正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
C
3.一个容量为20的样本数据,分组后组距与频数如下表.
组距 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)
频数 2 3 4 5 4 2
则样本在区间(-∞,50)上的频率为( )
A.0.5 B.0.25 C.0.6 D.0.7
D
4.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是( )
A.20人 B.40人
C.70人 D.80人
A(共21张PPT)
2.2.2 用样本的数字特征估计总体的数字特征
一、众数、中位数、平均数
(1)众数:在样本数据中,频率分布最大值所对应的样本数据或出现次数最多的那个数据。
(2)中位数:样本数据中,累计频率为0.5时所对应的样本数据或将数据按大小排列,位于最中间的数据(如果数据的个数为偶数,就取当中两个数据的平均数作为中位数)。
(3)平均数:样本数据的算术平均数,即
例1. 从某大型企业全体员工某月的月工资表中随机抽取50名员工工资资料如下:
800 800 800 800 800 1000 1000 1000
1000 1000 1000 1000 1000 1000 1000 1200
1200 1200 1200 1200 1200 1200 1200 1200
1200 1200 1200 1200 1200 1200 1200 1200
1200 1200 1200 1500 1500 1500 1500 1500
1500 1500 2000 2000 2000 2000 2000 2500
2500 2500
平均数是这50个数值的和除以50得1320.
估计这个企业员工的平均工资是1320元.
同样,再随机抽取50名员工的工资,计算所得的样本平均数一般会与例1中的样本平均数不同。
所以用样本的平均数估计总体的平均数时,样本的平均数只是总体的平均数的近似值。
在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡。
三种数字特征的比较 :
(1)样本众数通常用来表示分离变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分离变量的中心位置;
(2)中位数不受少数几个极端数据的影响,容易计算,它仅利用了数据中排在中间的数据的信息。当样本数据质量比较差,即存在一些错误数据时,应该用抗极端数据强的中位数表示数据的中心值。
(3)平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大,与众数和中位数相比,平均数代表了数据更多的信息,当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差。
(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值。在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策。
练习题:
1.若M个数的平均数是x,N个数的平均数是y,则这M+N个数的平均数是 .
,
和
的样本平均数分别是 x 和 y,
那么一组数
的平均数是
2. 如果两组数
.
二、用样本的标准差估计总体的标准差
数据的离散程度可以用极差、方差或标准差来描述。
为了表示样本数据的单位表示的波动幅度,通常要求出样本方差或者它的算术平方根.
(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是
来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。
那么我们用它们的平均数,即
(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。
例1. 计算数据5,7,7,8,10,11的标准差.
解: x= ——————— =8
5+7+7+8+10+11
6
数据 xi x xi-x (xi-x)2
5 8 -3 9
7 8 -1 1
7 8 -1 1
8 8 0 0
10 8 2 4
11 8 3 9
方差 s2= ——————— =4;
9+1+1+0+4+9
6
标准差.
所以这组数据的标准差是2.
练.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1)
解:
.
所以这组数据的方差为5.5,标准差为2.3 .
例4. 从甲、乙两名学生中选拔一人乘积射击比赛,对他们的射击水平进行测试,两人在相同的条件下各射击10次,命中环数如下﹕
甲﹕7,8,6,8,6,5,8,10,7,4;
乙﹕9,5,7,8,7,6,8,6,7,7.
(1)计算甲、乙两人射击命中环数的平均数和标准差;
(2)比较两人的成绩,然后决定选择哪一人参赛.
解:(1)计算得x甲=7,x乙=7;
s甲=1.73,s乙=1.10.
(2)由(1)知,甲、乙两人平均成绩相等,但s乙(3)标准差和频率直方图的关系
从标准差的定义可知,如果样本各数据都相等,则标准差得0,这表明数据没有波动幅度,数据没有离散性;若个体的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也很大,数据的离散程度很高,因此标准差描述了数据对平均数的离散程度。
s
s
2s
2s
x
的平均数为 ,
(2)新数据
方差为 .
,方差仍为 .
(1)新数据
的平均数为
,方差为 .
的平均数为
(3)新数据
如果数据
的平均数为 ,
方差为
,则
(4)方差的运算性质:
练习:
(3)若k1,k2,…, k8的方差为3,则2(k1-3),
2(k2-3), …, 2(k8-3)的方差为________
4
32
12
A
B(共29张PPT)
3.1 频率与概率
无限连分式求π
平面上画着一些平行线,相邻的两条平行线之间的距离都为d,向此平面任投一长度为l(l历史上,法国数学家布丰(George-Louis Leelere de Buffon ,1707-1788)最早设计了本节这个投针试验,并于1777年给出了针与平行线相
交的概率的计算公式P= ,由于它与π有关,
于是人们想到利用投针试验来估计π的值。
试验者
时间
投掷次数
相交次数
π的试验值
Wolf
1850年
5000
2532
3.1596
Smith
1855年
3204
1218.5
3.1554
C.De Morgan
1860年
600
382.5
3.137
Fox
1884年
1030
489
3.1595
Lazzerini
1901年
3408
1808
3.1415929
Reina
1925年
2520
859
3.1795
投针试验的历史资料
找一根铁丝弯成一个圆圈,使其直径恰恰等于平行线间的距离d。可以想象得到,对于这样的圆圈来说,不管怎么扔下,都将和平行线有两个交点。因此,如果圆圈扔下的次数为n次,那么相交的交点总数必为2n。现在设想把圆圈拉直,变成一条长为πd的铁丝。显然,这样的铁丝扔下时与平行线相交的情形要比圆圈复杂些,可能有4个交点,3个交点,2个交点,1个交点,甚至于都不相交。由于圆圈和直线的长度同为πd,根据机会均等的原理,当它们投掷次数较多,且相等时,两者与平行线组交点的总数期望也是一样的。这就是说,当长为πd的铁丝扔下n次时,与平行线相交的交点总数应大致为2n。现在转而讨论铁丝长为L的情形。当投掷次数n增大的时候,这种铁丝跟平行线相交的交点总数m应当与长度L成正比,因而有:m=kL,式中k是比例系数。为了求出k来,只需注意到,对于L=πd的特殊情形,有m=2n。于是求得k=(2n)/(πd)。代入前式就有:m≈(2Ln)/(πd)从而π≈(2Ln)/(dm)
布丰投针问题的重要性并非是为了求得比其它方法更精确的 π 值,而是在于它是第一个用几何形式表达概率问题的例子。计算 π 的这一方法,不但因其新颖,奇妙而让人叫绝,而且它开创了使用随机数处理确定性数学问题的先河,是用偶然性方法去解决确定性计算的前导
蒙特卡洛方法
投掷硬币的试验:
虽然我们不能预先判断出现正面向上,还是反面向上。但是假定硬币均匀,直观上可以认为出现正面与反面的机会相等。即在大量试验中出现正面的频率接近于0.5.
历史上有些学者做过成千上万次的投掷硬币的试验。结果如下表:
实验者 试验次数(n) 出现正面的次数(m) 出现正面的频率(m/n)
棣莫佛 2048 1061 0.5181
蒲 丰 4040 2048 0.5069
费 勒 10000 4979 0.4979
皮尔逊 12000 6019 0.5016
皮尔逊 24000 12012 0.5005
抛硬币试验
我们可以设想有50人投掷硬币,如果每人投5次,计算每个人投出正面的频率,在这50个频率中,一般说,0,0.2,0.4,0.6,0.8,1 都会有。而且会有不少是0或1;
如果要求每个人投20次,这时频率为0,0.05,0.95,1的将会变少;多数频率在0.35~0.65之间,甚至于比较集中在0.4~0.6之间;
如果要求每人投掷1000次,这时绝大多数频率会集中在0.5附近,和0.5有较大差距的频率值也会有,但这样的频率值很少。
而且随着投掷次数的增多,频率越来越明显地集中在0.5附近。
从一定高度落下的图钉,落地后可能钉尖着地,也可能钉帽着地。你估计哪种事件发生的概率大?
用试验的方法估计钉尖着地的概率
人们经过大量试验和实际经验的积累逐渐认识到:在多次重复试验中,同一事件发生的频率在某一数值附近摆动,而且随着试验次数的增加,一般摆动幅度越小,
频率呈现一定的稳定性,频率的稳定性揭示出随机事件发生的可能性有一定的大小。
事件的频率稳定在某一数值附近,我们就用这一数值表示事件发生的可能性大小。
事件的概率
一般地,在n次重复进行的试验中,事件A发生的频率 ,当n很大时,总在某个常数附近摆动,随着n的增加,摆动幅度越来越小,这时就把这个常数叫做事件A的概率,记为P(A).
由定义可得概率P(A)满足:
必然事件与不可能事件可看作随机事件的两种特殊情况.
注意点:
1.随机事件A的概率范围
因此,随机事件发生的概率都满足:0≤P(A)≤1
2.频率与概率的关系
(1)联系: 随着试验次数的增加, 频率会在概率的附近摆动,并趋于稳定.
在实际问题中,若事件的概率未知, 常用频率作为它的估计值.
(2)区别: 频率本身是随机的,在试验前不能确定, 做同样次数或不同次数的重复试验得到的事件的频率都可能不同.
而概率是一个确定数,是客观存在的,与每次试验无关.
(1)联系
(2)区别
概率的意义
概率是对随机事件发生的可能性大小的度量,
它反映了随机事件发生的可能性的大小。但随机事件的概率大,并不表明它在每一次试验中一定能发生。概率的大小只能说明随机事件在一次试验中发生的可能性的大小,即随机性中含有的规律性。认识了这种随机性中的规律性,就使我们能比较准确地预测随机事件发生的可能性。
例1. 为了确定某类种子的发芽率,从一大批种子中抽出若干批作发芽试验,其结果如下:
种子粒数 25 70 130 700 2000 3000
发芽粒数 24 60 116 639 1806 2713
发芽率 0.96 0.857 0.892 0.913 0.903 0.904
从以上的数据可以看出,这类种子的发芽率约为
0.9
例2. 如果某种彩票的中奖概率为1/1000,那么买1000张这种彩票一定能中奖吗?
中奖概率=
例3.在生活中,我们有时要用抽签的方法来决定一件事情,例如6张票中有1张奖票,6个人按顺序从中各抽1张以决定谁得到其中的奖票,那么,先抽或是后抽(后抽人不知道先抽人抽出的结果)对各人来说公平吗?也就是说,各人抽到奖票的概率相等吗?
小组合作,实验探究
小组合作,实验探究
1、每组 1号洗牌,(手在桌下,纸牌背面向上)
2、按2~6号依次抽取一张,最后是1号(不得翻看)
3、听1号指令统一翻牌,由1号记录结果
4、重复进行1~3步,18次后停止,上交记录单
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
4
3
2
4
3
2
解: 不妨把问题转化为排序问题,即把6张票随机地排列在位置1,2,3,4,5,6上, 对于这张奖票来说,由于是随机排列,因此它的位置有6种可能,故它排在任一位置上的概率都是 1/6 。6个人按排定的顺序去抽,比如甲排在第1位上,那么他抽得奖票的概率,即奖票恰好排在第1个位置上的概率为1/6 。因此,不管排在第几位上去抽,在不知前面的人抽出结果的前提下,得到奖票的概率都是1/6 。
例4.生活中,我们经常听到这样的议论:“天气预报说昨天降水概率为90%,结果根本一点雨都没下,天气预报也太不准确了。”学了概率后,你能给出解释吗?
例5. 从一批准备出厂的电视机中,随机抽取10台进行质量检查,其中有一台是次品,能否说这批电视机的次品的概率为0.10
练习、某篮球运动员在同一条件下进行投篮练习,结果如下表:
投篮次数 8 10 15 20 30 40 50
进球次数 6 8 12 17 25 32 39
进球频率
计算表中进球的频率;
这位运动员投篮一次,进球的概率约是多少
(3)这位运动员进球的概率是0.8,那么他投10次篮一定能
投中8次吗
不一定. 投10次篮相当于做10次试验,每次试验的结果都是随机的, 所以投10次篮的结果也是随机的.
概率约是0.8
0.78
0.75
0.80
0.80
0.85
0.83
0.80
1.概率是频率的稳定值,根据随机事件发生的频率只能得到概率的估计值.
2. 在大量重复试验后,随着试验次数的增加,随机事件A发生的频率逐渐稳定在区间[0,1]内的某个常数上(即事件A的概率),概率就是用来度量某事件发生的可能性大小的量.
有的同学有99%可以独立完成的概率,但却选择了1%不劳而获的概率,因为他不懂得对知识的珍惜;
有的同学有99%对父母说句“我爱你”的概率,但却选择了1%沉默的概率。因为他还没有读懂父母对他的希冀。
有的同学有99%宽宏忍让的概率,但却选择了1%翻脸的概率,因为他还不懂得宽宏的真正含义。
有的同学有99%帮助别人的概率,但却选择了1%麻木不仁的概率,因为他还没有领会生命的真谛。(共28张PPT)
一个口袋中装有3个白球,2个黑球,
从口袋中每次拿一个球,不放回,
第2次拿到黑球的概率是 .
1.取一根长度为30cm的绳子,拉直后在任意位置剪断,那么剪得两段的长度都不小于10cm的概率有多大?
从30cm的绳子上的任意一点剪断.
基本事件:
问题情境
2.射箭比赛的箭靶是涂有五个彩色的分环.从外向内为白色、黑色、蓝色、红色,靶心是金色,金色靶心叫“黄心”.奥运会的比赛靶面直径为122cm,靶心直径为12.2cm.运动员在70m外射箭,假设每箭都能中靶,且射中靶面内任一点都是等可能的,那么射中黄心的概率是多少
射中靶面直径为122cm的大圆内的任意一点.
基本事件:
问题情境
对于问题1.记“剪得两段绳长都不小于10cm”为事件A. 把绳子三等分,于是当剪断位置处在中间一段上时,事件A发生.由于中间一段的长度等于绳长的1/3.
对于一个随机试验,我们将每个基本事件理解为从某个特定的几何区域内随机地取一点,该区域中的每一个点被取到的机会都一样,而一个随机事件的发生则理解为恰好取到上述区域内的某个指定区域中的点.这里的区域可以是线段、平面图形、立体图形等.用这种方法处理随机试验,称为几何概型.
几何概型的特点:
(1)基本事件有无限多个;
(2)基本事件发生是等可能的.
几何概型的公式:
问题:图中有两个转盘,甲乙两人玩转盘游戏,规定当指针指向黄色区域时,甲获胜,否则乙获胜。在两种情况下分别求甲获胜的概率是多少?
(1)
(2)
问题: 甲获胜的概率与区域的位置有关吗?与图形的大小有关吗 甲获胜的可能性是由什么决定的?
(1)
(2)
(3)
总结规律:
几何概型公式(1):
例1 某人午觉醒来,发现表停了,他打开收音机,想听电台报时,求他等待的时间不多于10分钟的概率。
解:设A={等待的时间不多于10分钟},事件A恰好是打开收音机的时刻位于[50,60]时间段内,因此由几何概型的求概率公式得
P(A)=(60-50)/60=1/6
“等待报时的时间不超过10分钟”的概率为1/6
总结规律:
几何概型公式(2):
例2 有一杯1升的水,其中含有1个细菌,用一个小杯从这杯水中取出0.1升,求小杯水中含有这个细菌的概率.
分析:细菌在这升水中的分布可以看作是随机的,取得0.1升水可作为事件的区域。
解:取出0.1升中“含有这个细菌”这一事件记为A,则
总结规律:
公式(3):
公式(2):
公式(1):
一个路口的红绿灯,红灯的时间为30秒,黄灯的时间为5秒,绿灯的时间为40秒。当你到达路口时,看见下列三种情况的 概率各是多少?
(1)红灯;(2)黄灯;(3)不是红灯。
练习1(口答)
练习2
在500ml的水中有一个草履虫,现从中随机取出2ml水样放到显微镜下观察,则发现草履虫的概率是( )
A.0.5 B.0.4
C.0.004 D.不能确定
练习3.取一根长为3米的绳子,拉直后在任意位置剪断,那么剪得两段的长都不少于1米的概率有多大
3m
1m
1m
4.在半径为1的圆上随机地取两点,连成一条线,则其长超过圆内等边三角形的边长的概率是多少?
B
C
D
E
.
0
1. 假设你家订了一份报纸,送报人在早上6:30至7:30之间把报纸送到你家,你父亲离开家去工作的时间在早上7:00至8:00之间,问你父亲在离开家前能得到报纸(称为事件A)的概率是多少?
解:这里涉及到两个变量,把送报人的时间设为x变量,父亲上班的时间设为y变量,于是得到数对(x,y),表示某一天两个变量之间的关系。
五、提高
Ω={(x,y)| 6.5≤x≤7.5, 7≤y≤8}.
y x
y
x
8
7.5
7
6.5
6.5 7 7.5 8
1. 假设你家订了一份报纸,送报人在早上6:30至7:30之间把报纸送到你家,你父亲离开家去工作的时间在早上7:00至8:00之间,问你父亲在离开家前能得到报纸(称为事件A)的概率是多少?
事件A满足的条件是
A={(x,y)| y≤x, x∈Ω, y∈Ω}.
在直角坐标系中画出图形。
Ω表示的是矩形面积1,
A表示的是阴影部分面积
所以P(A)=
2.(会面问题)甲、乙二人约定在 12 点到 5 点之间在某地会面,先到者等一个小时后即离去,设二人在这段时间内的各时刻到达是等可能的,且二人互不影响。求二人能会面的概率。
解: 以 X , Y 分别表示甲、乙二人到达的时刻,于是
即 点 M 落在图中的阴影部
分.所有的点构成一个正
方形,即有无穷多个结果.
由于每人在任一时刻到达
都是等可能的,所以落在正
方形内各点是等可能的.
.M(X,Y)
y
5
4
3
2
1
0 1 2 3 4 5
x
二人会面的条件是:
0 1 2 3 4 5
y
x
5
4
3
2
1
y=x+1
y=x -1
记“两人会面”为事件A
1.几何概型的特点.
2.古典概型与几何概型的区别:
1)两种模型的基本事件发生的可能性都相等;
2)古典概型要求基本事件是有限个,而几何概型则要求基本事件有无限多个。
3.几何概型的概率公式及运用.
四、总结(共30张PPT)
2.1.3分层抽样
表层采取样本
稍深层采取样本
深层采样
某市有大型、中型与小型的商店共1500家,它们的数目之比为2:11:17,要了解商店的每日零售额情况,要求抽取其中的30家进行调查,应当采用怎样的抽样方法?
由于各类商店的零售额有较大的差别,因此考虑采用分层抽样的方法。
一、分层抽样
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样。分层抽样能使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的抽样方法。
例如,某中学高中学生有900名,为了考察他们的体重状况,打算抽取容量为45的一个样本。已知高一有400人,高二有300人。高三有200人,采用分层抽样。
样本容量与总体容量的比是45:900= 1:20,所以在高一、高二、高三3个层面上取的学生数分别为20,15,10人。
当有些层面上抽取的学生数用除法算出的结果不是整数时,可作细微调整。
例如上例中高一、高二、高三的学生数分别为402,296,202,则三个层面上用上面方法求得的数目分别为20.1,14.8,10.1. 每层还是分别按20,15,10名学生抽取。
在每个层面上抽样时,可以采用简单随机抽样的方法。
分层抽样的特点:
(1)适用于总体由有明显差别的几部分组成的情况;
(2)抽取的样本更好地反映了总体的情况;
(3)是等可能性抽样,每个个体被抽到的可能性都是
分层抽样的过程
当总体由差异明显的几部分组成时
总体的个体数N
样本容量tttt n
各部分抽取的个体数
该部分所有的个体数
=
根据公式确定在每部分应抽取的个体数
根据确定的个体数在每部分进行抽样
分层抽样的步骤:
(1)根据已经掌握的信息,将总体分成若干个互不相交的层;
(2)根据总体中的个体数N和样本容量n,计算抽样比k= ;
(3)确定第i层应该抽取的个体数目ni使得各ni之和为n;
(4)在各个层中,按步骤(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本。
例1. 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人。上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作。
解:因为抽样比k=1:5,应从副处级以上干部中抽取2人,一般干部中抽取14人,工人中抽取4人。
因副处级以上干部与工人人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;
对一般干部70人采用00,01,……,69编号,然后用随机数表法抽取14人。
二、三种抽样方法的比较
(1)简单随机抽样:简单随机抽样是最基本的抽样方法,其他的各种随机抽样方法中,大都会以某种形式引用它。
(2)系统抽样:①系统抽样比其他随机抽样方法更容易施行,可节约抽样成本;
②系统抽样所得样本的代表性和具体的编号有关,如果编号的个体特征随编号变化呈现一定的周期性,可能会使系统抽样的代表性很差;
③系统抽样比简单随机抽样的应用范围更广,它可以应用到个体有自然编号,但是总体中个体的数目却在抽样时无法确定的情况(如生产线上产品的质量检验)。
(3)分层抽样:充分利用了已知的总体信息,得到的样本比前两种方法有更好的代表性,并且可得到各层的子样本以估计各层的信息。
上述三种抽样方法的比较如下表所示:
类别 共同点 各自特点 相互联系 适用范围
简单随机抽样 抽样过程中每个个体被抽取的概率相等 从总体中逐个抽取 总体中的个体数较少
系统抽样 将总体均分成几部分,按事先确定的规则在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的个体数较多
分层抽样 将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
例2 选择合适的抽样方法抽样
(1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样。
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个。 抽取3个入样。
(3)有甲厂生产的300个篮球,抽取10个入样。
(4)有甲厂生产的300个篮球,抽取30个入样。
(1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样。
解:总体由有差异明显的几个层次组成,需选用分层抽样法。
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个。 抽取3个入样。
解:总体容量较小,用抽签法。
(3)有甲厂生产的300个篮球,抽取10个入样。
解:总体容量较大,样本容量较小宜用随机数表法。
解:总体容量较大,样本容量也较大,宜用系统抽样法。
(4)有甲厂生产的300个篮球,抽取30个入样。
1. 一批灯泡400只,其中20 W、40 W、60 W的数目之比为4∶3∶1,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为______________.
20、15、5
课堂练习
2.从总体为N的一批零件中用分层抽样抽取一个容量为30的样本,若每个零件被抽取的机率为0.25,则N等于( )
A.150 B.200 C.120 D.100
C
3.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2:3:5,现用分层抽样的方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量n= 。
80
4.某校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从女学生中抽取的人数为80人,则n= .
192
5、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体健康情况需从中抽取一个容量为36的样本,合适的抽取方案是
A、简单抽样方法
B、系统抽样
C、分层抽样
D、先从老年人中去掉一人,然后分层抽样
D、先从老年人中去掉一人,然后分层抽样
6、某工厂有甲、乙、丙三个车间,甲车间有x名职工,乙车间有300名职工,丙车间有y名职工,现采用分层抽样的方法抽取容量为45人的样本,甲抽取20人,丙抽取10人,则该工厂共有多少人?
乙车间需抽出45-20-10=15人
每个个体被抽取的概率是
X=20÷ =400
y=10÷ =200
则该工厂共有300+400+200=900人
7. 某公司在甲乙丙丁各地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售情况,需从这600个销售点抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点中抽取7个调查其销售收入售后服务等情况,记这项调查为②,则完成这两项调查采用的方法依次是( )
A.分层抽样,系统抽样 B.分层抽样,简单随机抽样
C.系统抽样,分层抽样 D.简单随机抽样,分层抽样
B(共14张PPT)
1.2 基本算法语句
条件语句和循环语句
复习回顾
条件结构
满足条件?
步骤A
步骤B
是
否
满足条件?
步骤A
是
否
新课讲授
条件结构
满足条件?
步骤1
步骤2
是
否
满足条件?
步骤A
是
否
IF 条件为真
语句A
END
条件语句
IF 条件为真
语句1
ELSE
语句2
END
条件语句的基本格式:
if <条件1>
<语句1>
else if <条件2>
<语句2>
else <语句3>
框图
条件1
假
真
语句1
条件2
真
假
语句2
语句3
思考:阅读下面的程序,当X=2和 -2时,输出的Y值是多少?
INPUT “x=”;x
IF x>=1
y=x∧2+3*x
ELSE
y=x-4
END
PRINT y
循环for语句的基本格式:
for =
end
循 环 语 句
循环变量
初始值:步长:终值
循环体
For k= 1 : 1 : 100
For k= 1 : : 100
例.阅读下列用for语句写出的算法,请说明该算法的功能及循环体执行次数。
例.阅读下列用for语句写出的算法,请说明该算法程序的执行结果。
循环while语句的基本格式:
while =
end
循 环 语 句
表达式条件
循环体
满足条件?
循环体
是
否
开始
结束
i=1
S=0
i=i+1
S=S+i
输出S
i≤100
是
否
i=1
S=0
WHLIE i<=100
S=S+i
i=i+1
END
PRINT S
END
例:编写计算机程序来计算1+2+3+…+100的值。
s = 1
i = 1
While i≤5
s = 2(s+1)
i = i+1
End
Print s
s = 1 i = 1
s = 4 i = 2
s = 10 i = 3
s = 22 i = 4
s = 46 i = 5
s = 94 i = 6
请说明该算法程序的执行结果
s = 1
i = 1
While S≤11
s = s+i
i = i+1
End
Print i
s = 1 i = 1
s = 2 i = 2
s = 4 i = 3
s = 7 i = 4
s = 11 i = 5
s = 16 i = 6
请说明该算法程序的执行结果
s = 1
i = 1
While S≤11
i = i+1
s = s+i
End
Print i
i = 1 s = 1
i = 2 s= 3
请说明该算法程序的执行结果
i = 3 s= 6
i = 4 s= 10
i = 5 s= 15
练习 作业
《45分钟作业与单元评估》(共27张PPT)
事件的定义:
随机事件:
在一定条件下可能发生也可能不发生的事件叫随机事件。
必然事件:
在一定条件下必然要发生的事件叫必然事件。
不可能事件:
在一定条件下不可能发生的事件叫不可能事件。
随机事件 的概率的定义
概率与频率的关系:
(1)频率是概率的近似值,随着试验次数的增加,频率会越来越接近概率。
(2)频率本身是随机的,在试验前不能确定。
(3)概率是一个确定的数,是客观存在的,与每次试验无关。
事件的关系和运算
(1)并事件:
如果某事件发生当且仅当事件A发生或事件B发生,则称此事件为事件A与事件B的并事件(或和事件),记做
(或A+B)
(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥.其含义是:事件A与事件B在任何一次试验中都不会同时发生。
(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件.其含义是:事件A与事件B在任何一次试验中有且仅有一个发生。
概率的几个基本性质
(1) 概率的加法公式:
当事件A与事件B互斥时,则 P(A∪B)=P(A)+P(B)。
(2)当事件A与事件B是对立事件时,
有P(A∪B)=P(A)+P(B)=1 ,于是有P(A)=1- P(B)
(1) 试验中所有可能出现的基本事件只有有限个;
(2) 每个基本事件出现的可能性相等。
我们将具有这两个特点的概率模型称为古典概率模型,简称古典概型。
对于古典概型,任何事件A发生的概率为:
古典概型的定义
几何概型的定义
如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称为几何概型.
几何概型的特点:
(1)试验中所有可能出现的结果(基本事件)有无限多个.
(2)每个基本事件出现的可能性相等.
在几何概型中,事件A的概率的计算公式如下:
2.若事件A,B互斥,那么( )
A、 A+B是必然事件
B、 是必然事件
C、 一定互斥
D、 一定不互斥
例题
4、从装有2个红球和2个白球的口袋内任取2个球,那么互 斥而不对立的两个事件是 ( )
A、至少有1个白球; 都是白球
B、至少有1个白球; 至少有1个红球
C、恰有1个白球; 恰有2个白球
D、至少有1个白球; 都是红球
6、袋中有红、白色球各一个,每次任意取一个,有放回地抽三次,
(1)三次颜色中恰有两次同色的概率?
(2)三次颜色全相同的概率?
(3)抽取的红球多于白球的概率?
7、从1,2,3,4,5五个数字中任意取2个出来组成一个没有重复数字的两位数,求
(1)这个两位数是奇数的概率。
(2)这个两位数大于30的概率。
(3)求十位和个位上数字之和大于4两位数的概率。
8、
1 2 3
4 5 6
7 8 9
10 11 12
13 14 15
16 17 18
19 20
11 一只蚂蚁在边长分别为3,4,5
的三角形ABC区域内任意爬行,则其恰在
离三个顶点的距离都大于1的地方的
概率是 .
A
B
C
3
4
5
x>0
y>0
x+y<3
3-x-y<1
12:取一根长度为3m的绳子,拉直后在任意的两个位置剪断,那么剪得的中间这一段绳子的长度小于1m的概率是多少?
y
x
o
3
3
设 左右段分别为 x,y
2
2
x
y
13、甲乙两辆货车都要停靠同一个站台卸货,他们可能在一昼夜的任一时刻到达,甲乙两辆货车卸货的时间都是4小时。求有一辆货车停靠站台时不需等待的概率。
A
O
如图: OA=2,OB=5,在线段OB上任意取一点C,试求:
B
(1)三角形AOC为钝角三角形的概率
(2)三角形AOC为锐角三角形的概率
14、
14 如图,在三角形AOB中,已知
∠AOB=60°,OA=2,OB=5,在线段OB上任取一点C,试求
(1)△AOC为钝角三角形的概率.
(2)△AOC为锐角三角形的概率.
A
B
O
C
D
E
C
15. “抛阶砖”是国外游乐场的典型游戏之一.参与者只须将手上的“金币”(设“金币”的半径为1)抛向离身边若干距离的阶砖平面上,抛出的“金币”若恰好落在任何一个阶砖(边长为4的正方形)的范围内(不与阶砖相连的线重叠),便可获奖.
设阶砖每边长度为a ,
“金币”直径为d .
a
若“金币”成功地落在阶砖上,其圆心必位于右图的绿色区域A内.
a
A
S
15、有一个半径为4的圆,现将一枚直径为2的硬币投向其中,(硬币完全落在圆外的不计),则硬币完全落在圆内的概率?
B
C
D
E
.
0(共42张PPT)
2.1.1简单的随机抽样
无论是生活、工作、学习,我们每时每刻都要同数据打交道,那么如何从众多的数据中合理地提取有效数据,又如何科学地对数据进行分析,从而使我们能够作出科学的决策,这正是统计的内涵.
由总体合理抽取样本
由样本科学推断总体
在1936年的美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查共和党的兰顿(时任堪萨斯州州长)和罗斯福(当时的总统)谁将当选下一届总统。为了了解公众意向,调查者根据电话簿和俱乐部的车辆登记簿上的名单,统一给大批人发了调查表。 通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜。
分析:当时的访问对象是从电话号码簿和俱乐部会员名册上选取的,但在1936年,美国家庭电话尚未普及,只有100万部左右,尤其是有条件参加俱乐部的人,大多数是经济上富有,政治上保守,倾向于共和党的选民,这就造成了显著的系统误差.
简单随机抽样
系统抽样
分层抽样
统计的有关概念
总体、个体、样本
(1)总体:一般把所考察对象的某一数值指标的全体构成的集合看作是总体;
(2)个体:构成总体的每一个元素叫做个体;
(3)样本:从总体中抽出的若干个个体所组成的集合叫做样本;
(4)样本容量:样本中个体的个数叫做样本容量。
一、简单随机抽样
一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样的特点 :
(1)它要求被抽取的样本的个数有限,这样,便于通过随机抽取的样本对总体进行分析;
(2)它是从总体中逐个地进行抽取。 这样,便于在抽样实践中进行操作;
(3)它是一种不放回抽样。 由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算。
(4)它每一次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性。
简单随机抽样
从个体数目为N的总体中运用简单随机抽样方法抽取样本容量为n的样本时,每个个体被抽取的概率均为n/N
抽签法
随机数表法
较适用于个体数目较小时
抽签法的过程
先将总体中的N个个体进行编号(号码从1~N)
再将号码写在号签上,放入箱中进行混合搅拌
从箱中连续抽取n次,得到容量为n的样本
抽签法的优点和缺点 :
优点:抽签法能够保证每个个体入选样本的机会都相等(得到的样本是简单随机样本);
缺点:(1)当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法成本高(费时、费力);
(2)号签很多时,把它们“搅拌均匀”就比较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加。
某班有学生50人,为了了解学生各方面的情况,需要从中抽取一个容量为10的样本,用抽签法确定要抽取的学生
解:
S1 将这50名学生按学号编号,分别为1, 2,……,50;
S2 将这50个号码分别写在相同的50张纸片上;
S3 将这50张纸片放在一个盒子里搅拌均匀,抽出一张纸片,记下上面的号码,然后再搅拌均匀,继续抽取第2张纸片,记下号码;重复这个过程直到取到第10个号码时终止。
于是,和这10个号码对应的10个学生就构成了一个简单随机样本 。
四、随机数表法
随机数表由数字0,1,2,3,……,9 这10个数字组成,并且每个数字在表中各个位置上出现的机会一样。通过随机数生成器,例如计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表.
通过(P87 页)随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后抽取样本。
例如要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验。用随机数表抽取的步骤如下:
(1) 对850颗种子进行编号:可以编为001,……,850.
(2) 给出的随机数表是5个数一组,使用各个5位数组的前3位,从各组数中任选一个前3位小于或等于850的数作为起始号码,例如从第1行第7组开始,取出299作为抽取的第1个代号;
(3) 继续向右读,数组的前3位数不大于850且不与前面取出的数重复,就把它取出,否则跳过不取,取到一行末尾时转到下一行从左到右继续读,如此下去,直到得到在001~850之间的50个三位数。
用随机数表法抽取样本的步骤:
S1 将总体中的所有个体编号(每个号码位数一致);
S2 在随机数表中任选一个数作为开始;
S3 从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过;若在编号中,则取出。得到的号码若在前面已经取出,也跳过,如此进行下去,直到取满为止;
S4 根据选定的号码抽取样本。
用随机数表法抽取样本的优缺点:
优点:简单易行。 它很好地解决了用抽签法时,当总体中的个体数较多时制签难的问题。
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取样本仍不方便。
例1.从30个灯泡中抽取10个进行质量检测,说明利用随机数表法抽取这个样本的步骤。 (随机数表见本章末第87页附表)
解:S1 将30个灯泡编号:00,01,02,03,……,30;
S2 在随机数表中任取一组数作为开始。 如从第5行第5组的数12开始;
S3 从12开始向右读,依次选出12,….这10个编号的灯泡。
例2.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程。
2.1.2系统抽样
实际抽样中往往要考察容量很大的总体,例如某省农村家庭的年平均收入状况;某电视机厂生产的某种型号的电视机的质量是否合格。
这样样本容量越大越能更好地反映总体的特征,但工作量也随之增大。
一、系统抽样的概念
当总体元素个数很大时,样本的容量不宜太小,采用简单随机抽样就显得费事,这时,可以将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这样抽取的方法叫做系统抽样。
例1. 为了解某地区今年高一学生期末考试数学科的成绩,拟从参加考试的15000名学生的数学成绩中抽取容量为150的样本。采用什么样的抽样方法。
解:对全体学生的数学成绩进行编号,号码从1~15000,样本容量与总体容量的比为150:15000=1:100.
我们将总体平均分为150个部分,其中每一部分包含100个号码.
然后对1~100号进行简单随机抽样,抽取一个号码,比如说是56.
接下来每隔100个号码抽取1个,顺次取出156,256,…,14956的学生数学成绩,这样就得到了容量为150的样本。
二、系统抽样的步骤
从元素个数为N的总体中抽取容量为n的样本,如果总体容量能被样本容量整除,设 ,可先由数字1到k中随机地抽取一个数s作为起始数,然后顺次抽取第s+k,s+2k,s+3k,……,s+(n-1)k 个数,这样就得到容量为n的样本.
如果总体容量不能被样本容量整除,可随机地从总体中剔除余数个个体,然后再按系统抽样方法进行抽样.
由于抽样的间隔相等,因此系统抽样也被称作等距抽样.
上述过程中,总体的每个个体被剔除的机会相等,也就是每个个体不被剔除的机会相等,并且编号的过程是随机的,可知在整个抽样过程中每个个体被抽取的机会仍然相等.
系统抽样与简单随机抽样的主要差别
(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;
(2)系统抽样所得样本的代表性和具体的编号有关;而简单随机抽样所得样本的代表性与个体的编号无关,如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差;
(3)系统抽样比简单随机抽样的应用范围更广。
例3.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额。采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,……抽出,发票上的销售额组成一个调查样本。这种抽取样本的方法是( )
(A)抽签法 (B)随机数表法
(C)系统抽样法 (D)其他方式的抽样
C
例4.某工厂生产的产品,用传送带将产品送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品进行检测,则这种抽样方法是 .
系统抽样
例5.某年级共有1800名学生参加期末考试,为了了解学生的成绩,按照1:50的比例抽取一个样本,用系统抽样的方法进行抽样,写出过程。
解:将1800名学生按1至1800编上号码,按编号顺序分成36组,每组50名,先在第一组中用抽签法抽出k号(1≤k≤50),其余的k+50n(n=1,2,3,……,35)也被抽出,即可得所需的样本.
下列抽样试验中不是系统抽样的是( )。
A. 从标有1~15号的15个球中,任选3个作为样本,按从小号到大号排序,随机选起点i0,以后i0+5,i0+10(超过15则从1再数起)号作样本
B. 工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品进行检验
C. 进行某一市场调查,规定在商场门口随机抽一个人进行询问调查,直到调查到事先规定调查人数为止
D. 电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
C(共18张PPT)
案例1 求两个正整数最大公约数的算法
3 5
9 15
[问题1]:在小学,我们已经学过求最大公约数的知识,你能求出18与30的最大公约数吗?
18 30
2
3
∴18和30的最大公约数是2×3=6.
先用两个数公有的质因数连续去除,一直除到所得的商是互质数为止,然后把所有的除数连乘起来.
[问题2]:我们都是利用找公约数的方法来求最大公约数,如果公约数比较大而且根据我们的观察又不能得到一些公约数,我们又应该怎样求它们的最大公约数?比如求98与63的最大公约数
更相减损术
我国早期也有解决求最大公约数问题的算法,就是更相减损术。
更相减损术求最大公约数的步骤如下:
用较大的数减去较小的数,接着把较小的数与所得的差比较,并以大数减小数。继续这个操作,直到所得的差与小数相等为止,则这个数(等值)就是所求的最大公约数。
例1 用更相减损术求98与63的最大公约数.
解:把98和63以大数减小数,并辗转相减,
即:98-63=35;
63-35=28;
35-28=7;
28-7=21;
21-7=14;
14-7=7.
所以,98与63的最大公约数是7。
更相减损术又被称作“等值算法”
练习:用更相减损术(等值算法)求两个正数
84与72的最大公约数。
2.辗转相除法:
例2 求两个正数8251和6105的最大公约数。
分析:8251与6105两数都比较大,而且没有明显的公约数,如能把它们都变小一点,根据已有的知识即可求出最大公约数.
解:8251=6105×1+2146
显然8251与6105的最大公约数也必是2146的约数,同样6105与2146的公约数也必是8251的约数,所以8251与6105的最大公约数也是6105与2146的最大公约数。
2.辗转相除法:
例2 求两个正数8251和6105的最大公约数。
解:8251=6105×1+2146;
6105=2146×2+1813;
2146=1813×1+333;
1813=333×5+148;
333=148×2+37;
148=37×4+0.
则37为8251与6105的最大公约数。
以上我们求最大公约数的方法就是辗转相除法。也叫欧几里德算法,它是由欧几里德在公元前300年左右首先提出的。
第一步,给定两个正数m,n
第二步,计算m除以n所得到余数r
第三步,m=n,n=r
第四步,若r=0,则m,n的最大公约数等于m;
否则返回第二步
辗转相除法求最大公约数算法:
练习2:利用辗转相除法求两数4081与20723的最大公约数.
20723=4081×5+318;
4081=318×12+265;
318=265×1+53;
265=53×5+0.
秦九韶算法
案例2
计算多项式f(x) =x5+x4+x3+x2+x+1
当x = 5的值的算法:
算法1:
因为f(x) =x5+x4+x3+x2+x+1
所以f(5)=55+54+53+52+5+1
=3125+625+125+25+5+1
= 3906
算法2:
f(5)=55+54+53+52+5+1
=5×(54+53+52+5+1 ) +1
=5×(5×(53+52+5 +1 )+1 ) +1
=5×(5×(5×(52+5 +1) +1 ) +1 ) +1
=5×(5×(5×(5 ×(5 +1) +1 )+1)+1) +1
f(x)=2x5-5x4-4x3+3x2-6x+7
=(2x4-5x3-4x2+3x-6)x+7
=((2x3-5x2-4x+3)x-6)x+7
=(((2x2-5x-4)x+3)x-6)x+7
=((((2x-5)x-4)x+3)x-6)x+7
v0=2
v1=v0x-5=2×5-5=5
v2=v1x-4=5×5-4=21
v3=v2x+3=21×5+3=108
v4=v3x-6=108×5-6=534
v5=v4x+7=534×5+7=2677
所以,当x=5时,多项式的值是2677.
这种求多项式值的方法就叫秦九韶算法.
求多项式f(x)=2x5-5x4-4x3+3x2-6x+7当x=5时的值.
f(x)=anxn+an-1xn-1+an-2xn-2+……+a1x+a0.
我们可以改写成如下形式:
f(x)=(…(anx+an-1)x+an-2)x+…+a1)x+a0.
求多项式的值时,首先计算最内层括号内一次多项式的值,即
v1=anx+an-1,
然后由内向外逐层计算一次多项式的值,即
一般地,对于一个n次多项式
v2=v1x+an-2,
v3=v2x+an-3, ……,
vn=vn-1x+a0.
这样,求n次多项式f(x)的值就转化为求n个一次多项式的值.这种算法称为秦九韶算法.
秦九韶算法是求一元多项式的值的一种方法.
它的特点是:把求一个n次多项式的值转化为求n个一次多项式的值,通过这种转化,把运算的次数由至多n(n+1)/2次乘法运算和n次加法运算,减少为n次乘法运算和n次加法运算,大大提高了运算效率.
练: 已知一个五次多项式为
用秦九韶算法求这个多项式当x = 5的值。
解:
将多项式变形:
按由里到外的顺序,依此计算一次多项式当x = 5时的值:
所以,当x = 5时,多项式的值等于17255.2
1、课堂练习
P39 例题
《红对勾》
2、作业(共21张PPT)
*
3.1.4 概率的加法公式
在一个盒子内放有10个大小相同的小球,其中有7个红球、2个绿球、1个黄球.把
“从盒中摸出1个球,得到红球”叫做事件A,
“从盒中摸出1个球,得到绿球”叫做事件B,
“从盒中摸出1个球,得到黄球”叫做事件C.
A
B
C
I
如果从盒中摸出的1个红球,即事件A发
生,那么事件B就不发生;如果从盒中摸
出的1个球是绿球,即事件B发生,那么
事件A就不发生;也就是说事件A与B不
可能同时发生.这种不可能同时发生的两
个事件叫做互斥事件.
事件B与C也是互斥事件,事件A与C也
是互斥事件.
A
B
C
I
对于上面的事件A、B、C,其中任何两个都是互斥事件,这时我们说事件A、B、C彼此互斥.一般地,如果事件A1、A2,…,An中的任何两个都是互斥事件,那么就说事件A1、A2,…,An彼此互斥.
从集合的角度看,几个事件彼此互斥,是指由各个事件所含的结果组成的集合彼此互不相交.
A
B
C
I
“从盒中摸出1个球,得到的不是红球(即绿球或黄球)”记作事件
从集合的角度看,同事件 所含的结果组成的集合,是全集中的事件A所含的结果组成的集合的补集.
由于事件A与 不可能同时发生,它们是互斥事件.事件A与 必有一个发生.这其中必有一个发生互斥事件叫做对立事件.事件
A的对立事件通常记作 .
I
A
A
B
C
I
在上面的问题中,“从盒中摸出1个球,得到红球或绿球”是一个事件,当摸出的是红球或绿球时,表示这个事件发生,我们把这个事件记作 .现在要问:事件A+B的概率是多少?
互斥事件的和事件的概率加法公式
由概率的统计定义,可知
上述结论说明,如果事件A、B互斥,那么事件A ∪ B发生(即A、B中至少有一个发生)的概率,等于事件A、B分别发生的概率的和。
一般地,如果事件A1,A2,…,An彼此互斥,那么事件A1+A2+…+An发生(即A1,A2,…,An中有一个发生)的概率,等于这n个事件分别发生的概率的和,即
P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
根据对立事件的意义,A+ 是一个必然事
件,它的概率等于1.
又由于A与 互斥,我们得到
P(A)+P( )=P(A+ )=1
即:对立事件的概率的和等于1
P( )=1-P(A)
例1:在数学考试中,小明的成绩在90分以上的概率是0.18,在80—89分的概率是0.51,在70—79分的该律师0.15,在60—69分的概率是0.09,计算小明在数学考试中取得80分以上成绩的概率和小明考试及格的概率?
解:(1)分别记小明的考试成绩在90分以上,在80—89分,在70—79分,在60—69分为事件B、C、D、E。
(2)因为这四个事件是互斥的,所以可以利用互斥事件的概率加法公式,根据公式得出
成绩在80分以上的概率:
成绩在60分以上的概率:
求“小明考试不及格”的概率是多少?
总结一下,本题给我们提出了哪些解题方法与数学思想?
在求较复杂的事件的概率时,通常有两种方法:
一是将所求概率化为一些互斥事件的概率的和来求;
二是若求一个事件的概率,可转化为求其对立事件的概率,体现“正难则反”的数学思想。
归纳出求解方法和步骤,以及应当注意的问题?
解题步骤可归纳为4步:
(1)引用数学符号表示问题中的有关事件;
(2)判断各事件的互斥性;
(3)应用概率的加法公式进行计算;
(4)写出答案。
如果A、B两个事件不互斥,就不能运用互斥事件的
概率加法公式。若A、B为互斥事件,才能运用概率
的加法公式。
判别下列每对事件是不是互斥事件,如果是,再判别它们是不是对立事件.
从一堆产品(其中正品与次品都多于2个)中任取2件,其中:
(1)恰有1件次品和恰有2件次品;
(2)至少有1件次品和 全是次品;
(3)至少有1件正品和至少有1件次品;
(4)至少有1件次品和全是正品.
巩固练习
巩固练习
练习:某人射击一次,命中7~10环的概率如下表所示:
(1)求射击一次,至少命中7环的概率;
(2)求射击一次,命中不足7环的概率;
命中环数 10环 9环 8环 7环
概 率 0.12 0.18 0.28 0.32
1.互斥事件定义:不可能同时发生的两个事件。
4、概率公式:P(A+B)=P(A)+P(B)
如果事件A,B互斥,那么事件A+B发生(即A,B中有一个发生)的概率,等于事件A,B分别发生的概率的和。
2.对立事件定义:必有一个发生的互斥事件叫对立事件。
P(A)+P( )=P(A∪ )=1
集合角度:
A∩B=
事件A、B互斥
A∪B=I
A∩B=
事件A、B对立
小结
3.两个事件的并(或和)的定义:
A
B
A
B
1.抽查10件产品,设事件A:至少有两件次品,则A的对立事件为( )
A. 至多两件次品
B. 至多一件次品
C. 至多两件正品
D. 至少两件正品
B
2、抛掷一个骰子,记A为事件“落地时向上的数是奇数”,B为事件“落地时向上的数是偶数”,C为事件“落地时向上的数是3的倍数”
判别下列每件事件是不是互斥事件,如果是,再判别它们是不是对立事件。
(1)A与B;
(2)A与C;
(3)B与C
解:从袋中任取一球,记事件“摸到红球”、“摸到黑球”、“摸到黄球”、“摸到绿球”为A、B、C、D,
则有P(B∪C)=P(B)+P(C)=
,解得
,P(C∪D)=P(C)+P(D)=
P(B∪C∪D)=1-P(A)=
答:得到黑球、得到黄球、得到绿球的概率分别是
袋中有12个小球,分别为红球、黑球、黄球、绿球,从中任取一球,得到红球的概率为1/3,得到黑球或黄球的概率是5/12 ,得到黄球或绿球的概率也是5/12 ,试求得到黑球、得到黄球、得到绿球的概率各是多少?
4.从1,2,…,9中任取两数,其中:①恰有一个偶数和恰有一个奇数;②至少有一个奇数和两个都是奇数;③至少有一个奇数和两个都是偶数;④至少有一个奇数和至少有一个偶数。在上述事件中,是对立事件的是( )
(A)① (B)②④
(C)③ (D)①③
C
5. 从装有两个红球和两个黑球的口袋内任取两个球,那么互斥而不对立的两个事件是( )
A.“至少有一个黑球”与“都是黑球”
B.“至少有一个黑球”与“至少有一个红球”
C.“恰有一个黑球”与“恰有两个黑球”
D.“至少有一个黑球”与“都是红球”
C组别 号码 第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次 第11次 第12次 第13次 第14次 第15次 第16次 第17次 第18次 合计
第
组 1
2
3
4
5
6
组别 号码 第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次 第11次 第12次 第13次 第14次 第15次 第16次 第17次 第18次 合计
第
组 1
2
3
4
5
6
组别 号码 第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次 第11次 第12次 第13次 第14次 第15次 第16次 第17次 第18次 合计
第
组 1
2
3
4
5
6
组别 号码 第1次 第2次 第3次 第4次 第5次 第6次 第7次 第8次 第9次 第10次 第11次 第12次 第13次 第14次 第15次 第16次 第17次 第18次 合计
第
组 1
2
3
4
5
6
抽签问题实验结果统计
组别 号码 频数 频率 组别 号码 频数 频率 组别 号码 频数 频率 组别 号码 频数 频率
第
1
组 1 0 第
2
组 1 0 第
3
组 1 0 第
4
组 1 0
2 0 2 0 2 0 2 0
3 0 3 0 3 0 3 0
4 0 4 0 4 0 4 0
5 0 5 0 5 0 5 0
6 0 6 0 6 0 6 0
组别 号码 频数 频率 组别 号码 频数 频率 组别 号码 频数 频率 组别 号码 频数 频率
第
5
组 1 0 第
6
组 1 0 第
7
组 1 0 第
8
组 1 0
2 0 2 0 2 0 2 0
3 0 3 0 3 0 3 0
4 0 4 0 4 0 4 0
5 0 5 0 5 0 5 0
6 0 6 0 6 0 6 0
全班实验结果统计(144次)
号码 频数 频率
1 0 0.000
2 0 0.000
3 0 0.000
4 0 0.000
5 0 0.000
6 0 0.000
合计 0 0(共19张PPT)
3.1.1 随机现象与基本事件空间
在自然界和现实生活中,一些事物都是相互联系和不断发展的。在它们彼此间的联系和发展中,根据它们是否有必然的因果联系,可以分成截然不同的两大类:
一类是确定性的现象。这类现象是在一定条件下,必定会导致某种确定的结果。
另一类是不确定性的现象。这类现象是
在一定条件下,它的结果是不确定的。
例1. 我们通常把硬币上刻有国徽的一面称为正面,现在任意抛一枚质地均匀的硬币,那么可能出现“正面向上”,也可能出现“反面向上”。究竟得到哪一种结果,不可能事先确定,这是一种随机现象。
例2. 一名中学生在篮球场的罚球线练习投篮,对于每次投篮,他可能投进,也可能投不进。即使他打篮球的技术很好,我们最多说,他投进的可能性很大,并不能保证每投必进。这也是一种随机现象。
例3. 在城市中,当我们走到装有交通信号灯的十字路口时,可能遇到绿灯,也可能遇到红灯和黄灯,一般来说,行人在十字路口看到的交通信号灯颜色,可以认为是一种随机现象。
例4. 在10个同类产品中,有8个正品、2个次品. 从中任意抽出3个检验,那么“抽到3个正品”、“抽到2个产品”、“抽到1个产品”三种结果都有可能发生,至于出现哪一种结果,由于是任意抽取,抽取前无法预料,这也是一种随机现象。
为了探索随机现象的规律性,需要对随机现象进行观察。
我们把观察随机现象或为了某种目的而进行的实验统称为试验。把观察的结果或实验的结果称为试验的结果.
例如,掷一次骰子、打一次靶、参加一次考试、做一次化学实验等等,都是一次试验。
一个试验满足下述条件:
(1)试验可以在相同的情形下重复进行;
(2)试验的所有结果是明确可知的,但不止一个;
(3)每次试验总是出现这些结果中的一个,但在一次试验之前却不能确定这次试验会出现哪一个结果。
一、随机事件
当我们在同样的条件下重复进行试验时,有的结果始终不发生,则称为不可能事件;有的结果在每次试验中一定发生,则称为必然事件;在试验中可能发生,也可能不发生的结果称为随机事件。
随机事件通常用大写英文字母A、B、C、…来表示,随机事件可以简称为事件,有时讲到事件也包括不可能事件和必然事件。
例1.指出下列事件是必然事件、不可能事件还是随机事件:
(1)某体操运动员将在某次运动会上获得全能冠军;
(2)同一门炮向同一目标发射多发炮弹,其中50%的炮弹击中目标;
(3)某人给朋友打电话,却忘记了朋友电话号码的最后一位数字,就随意地在键盘上按了一个数字,恰巧是朋友的电话号码;
(4)技术非常发达后,不需要任何能量的“永动机”将会出现。
例2. 指出下列事件是必然事件、不可能事件,还是随机事件.
(1)在标准大气压下且温度低于0℃时,冰融化;
(2)在常温下,焊锡熔化;
(3)掷一枚硬币,出现正面;
(4)某地12月12日下雨;
(5)如果a>b,那么a-b>0;
(6)导体通电后发热;
(7)没有水分,种子发芽;
(8)函数y=logax(a>0,a≠1)在其定义域内是增函数.
二、基本事件空间
基本事件:在试验中不能再分的最简单的随机事件,其他事件可以用它们来表示,这样的事件称为基本事件。
基本事件空间:所有基本事件构成的集合称为基本事件空间。基本事件空间常用大写希腊字母Ω表示。
例如,掷一枚硬币,观察落地后哪一面向上,这个试验的基本事件空间就是集合{正面向上,反面向上}。即
Ω = {正面向上,反面向上}.
或简记为Ω ={正,反}.
掷一颗骰子,观察掷出的点数,这个事件的基本事件空间是
Ω ={1,2,3,4,5,6}.
一先一后掷两枚硬币,观察正反面出现的情况,则基本事件空间
Ω ={(正,正),(正,反),(反,正),(反,反)}.
设A=“至少有一次出现正面”.
则A={(正,正),(正,反),(反,正)}.
基本事件可以理解为基本事件空间中不能再分的最小元素,而一个事件可以由若干个基本事件组成,即随机事件可以理解为基本事件空间的子集。
例如掷骰子是一个试验,在这个试验中出现“偶数点向上”的结果就是一个事件A,但事件A不是基本事件,它是由三个基本事件构成的,这三个基本事件是“2点向上”、“4点向上”和“6点向上”。
例3. 连续掷3枚硬币,观察落地后这3枚硬币出现正面还是反面,
(1)写出这个试验的基本事件空间;
(2)求这个试验基本事件的总数;
(3)“恰有两枚正面向上”这一事件包含哪几个基本事件。
解:(1)Ω ={(正,正,正),(正,正,反),(正,反,正),(正,反,反),(反,正,正),(反,正,反),(反,反,正),(反,反,反)};
(2)基本事件总数是8;
(3)“恰有两枚正面向上”包含3个基本事件: (正,正,反),(正,反,正),(反,正,正).
例4. 从A、B、C、D、E、F共6名学生中选出4人参加数学竞赛,
(1)写出这个试验的基本事件空间;
(2)求这个试验的基本事件总数;
(3)写出事件“A没被选中”所包含的基本事件’。
解:(1)这个试验的基本事件空间是:Ω={(A,B,C,D),(A,B,C,E),(A,B,C,F),(A,B,D,E),(A,B,D,F),(A,B,E,F),(A,C, D,E),(A,C,D,F),(A,C,E,F),(A,D,E,F),(B,C,D,E),(B,C,D,F),(B,C,E,F),(B,D,E, F),(C,D,E,F)};
(2)从6名学生中选出4人参加数学竞赛,共有15种可能情况;
(3)“A没被选中”包含下列5个基本事件:{(B,C,D,E),(B,C,D,F),(B,C,E,F),(B,D,E,F),(C,D,E,F)}。
例5. 一颗骰子投掷两次,观察掷出的点数(a,b)
(1)写出这个试验的基本事件空间;
(2)“两次投掷点数相同”这一事件包含哪几个基本事件。
(3)“两次投掷点数之和是7”这一事件包含哪几个基本事件。
(4)“两次投掷点数之差是1”这一事件包含哪几个基本事件。
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
(6,1)
(4,1)
(3,1)
(2,1)
(1,1)
1
6
4
3
2
1
(6,2)
(4,2)
(3,2)
(2,2)
(1,2)
2
(6,3)
(4,3)
(3,3)
(2,3)
(1,3)
3
(6,4)
(4,4)
(3,4)
(2,4)
(1,4)
4
(6,5)
(4,5)
(3,5)
(2,5)
(1,5)
5
6
第一次
第二次
(5,6)
(6,6)
(4,6)
(3,6)
(2,6)
(1,6)(共26张PPT)
2.3.1 变量间的相互关系
一、变量之间的相关关系
变量与变量之间的关系常见的有两类:一类是确定性的函数关系,像正方形的边长a和面积S的关系,另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的。
一般地:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。
设某地10户家庭的年收入和年饮食支出的统计资料如下表: (单位:万元)
年收入 2 4 4 6 6 6 7 7 8 10
饮食支出 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
由表中数据可以看出,y有随x增加而增加的趋势
当年收入的值由小变大时,年饮食支出的值也在由小变大。这种相关称作正相关;反之如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称作负相关。
为了更清楚地看出x与y是否有相关关系,我们以年收入x的取值为横坐标,把年饮食支出y的相应取值作为纵坐标,在直角坐标系中描点。这样的图形叫做散点图。
x
y
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似描述,这种近似的过程称为曲线拟合。在两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的。此时,我们可以用一条直线来拟合(如图),这条直线叫回归直线。
例2. 5个学生的数学和物理成绩如下表:
学生
学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否有相关关系.
数学
物理
具有相关关系.
例3. 下表给出了某校12名高一学生的身高(单位:cm)和体重(单位:kg):
身高 151 152 153 154 156 157 158 160 160 162 163 164
体重 40 41 41 41.5 42 42.5 43 44 45 45 46 45.5
画出散点图,并观察它们是否有相关关系.
身高
体重
具有相关关系.
例4:下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:
气温/℃ 26 18 13 10 4 -1
杯数 20 24 34 38 50 64
(1)将上表中的数据制成散点图.
(2)你能从散点图中发现温度与饮料杯数近似成什么关系吗
(3)如果近似成线性关系的话,请画出一条直线方程来近似地表示这种线性关系.
(1)画出散点图:
温度
杯数
(2)温度与杯数成负相关.
温度与杯数成线性相关关系。
温度
杯数
温度
杯数
连接最左侧和最右侧的点
画出的直线上方的点和下方的点的数目相同
我们要找出一条直线,使这条直线“最贴近”已知的数据点。记此直线方程是
这里在y的上方加记号“^”,是为了区分Y的实际值y. 表示当x取xi (i=1,2,…,6)时,Y相应的观察值为yi,而直线上对应于xi的纵坐标是yi=bxi+a.
^
上式叫做Y对于x的回归直线方程,
b叫做回归系数。
回归直线的方程 的求法:
设x,Y的一组观察值为 (xi,yi) (i=1,2
…,n) 且回归直线的方程为
当变量x取xi (i=1,2,…,n)时,可以得到: (i=1,2,…,n),
它与实际收集到的yi之间的偏差是:
(i=1,2,…,n),
可见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表n个点与相应直线在整体上的接近程度。故采用n个偏差的平方和
表示n个点与相应直线在整体上的接近程度.
记
(∑为连加符号)
上式展开后,是一个关于a,b的二次多项式,应用配方法,可求使Q取得最小值时a、b的值.
这样,回归直线就是所有直线中Q取最小值的那一条。由于平方又叫做二乘方,所以这种使“离差平方和为最小”的方法,叫做“最小二乘法”。
用最小二乘法求回归直线方程中a,b有下面的公式:
其中
同样a,b的上方加“^”,表示是由观察值按最小二乘法求得的估计值。
由于 ,故巧合的是:(xi,yi) (i=1,2,…,n)的中心点 在回归直线上,x处的估计值为 .
例2. 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间x之间相应的一组观察值如下表:
x/s 5 10 15 20 30 40 50 60 70 90 120
Y/μm 6 10 10 13 16 17 19 23 25 29 46
(1)画出表中数据的散点图;
(2)求Y对x的回归直线方程;
(3)试预测腐蚀时间为100时腐蚀深度是多少?
解:(1)散点图如下
(2)根据公式求腐蚀深度Y对腐蚀时间x的回归直线方程。
序号 x Y x2 xy
1 5 6 25 30
2 10 10 100 100
3 15 10 225 150
4 20 13 400 260
5 30 16 900 480
6 40 17 1600 680
7 50 19 2500 950
8 60 23 2600 1380
9 70 25 4900 1750
10 90 29 8100 2610
11 120 46 14400 5520
∑ 510 214 36780 13910
计算a, b的值.
^
^
由上表分别计算x,y的平均数得
写出回归方程为y=0.304x+5.346.
^
(3)根据求得的回归方程,当腐蚀时间为100s时,
y=0.304×100+5.346=38.86(μm)
^
即腐蚀深度约为38.86μm.
1. 有关线性回归的说法,不正确的是( )
A. 相关关系的两个变量不是因果关系
B. 散点图能直观地反映数据的相关程度
C. 回归直线最能代表线性相关的两个变量之间的关系
D. 任一组数据都有回归方程
D
练习
2.线性回归方程y=bx+a过定点________.
^
(x, y)
3.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.
^