(共29张PPT)
对于样本点等可能的试验,我们可以用古典概型公式计算有关事件的概率。
但在现实中,很多试验的样本点往往不是等可能的或者是否等可能不容易判断.
例如,抛掷一枚质地不均匀的骰子,或者抛掷一枚图钉,此时无法通过古典概型公式计算有关事件的概率。
我们需要寻找新的求概率的方法.
在相同条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例 为事件A出现的频率.
事件的概率越大,意味着事件发生的可能性越大,,在重复试验中,相应的频数一般也越大;
事件的概率越小,则事件发生的可能性越小,在重复试验中,相应的频数一般也越小.
在初中,我们利用频率与概率的这种关系,通过大量重复试验,用频率去估计概率.
1、在重复试验中,频率的大小是否就决定了概率的大小呢
2、频率与概率之间到底是一种怎样的关系呢
频率与概率
学习目标
1.理解概率的意义以及频率与概率的区别与联系.
2.能初步利用概率知识解释现实生活中的概率问题.
3.了解随机模拟的含义,会利用随机模拟估计概率.
探究:重复做同时抛掷两枚质地均匀的硬币的试验,设事件A=“一个正面朝上,一个反面朝上”,统计A出现的次数并计算频率,再与其概率进行比较.你发现了什么规律
把硬币正面朝上记为1,反面朝上记为0,则这个试验的样本空间
Ω={(1,1),(1,0),(O,1),(0,0)},
所以P(A)=
A={(1,0),(O,1)},
0.5
下面我们分步实施试验,考察随着试验次数的增加,事件A的频率的变化情况,以及频率与概率的关系.
第1步:每人重复做25次试验,记录事件A发生的次数,计算频率;
第2步:每4名同学为一组,相互比较试验结果;
第3步:各组统计事件A发生的次数,计算事件A发生的频率,将结果填入下表中.
小组序号 试验总次数 事件A发生的次数 事件A发生的频率
1 100
2 100
3 100
…
合计
每组中4名同学的结果一样吗
为什么会出现这样的情况
比较在自己试验25次、小组试验100次和全班试验总次数的情况下,事件A发生的频率.
(1)各小组的试验结果一样吗 为什么会出现这种情况
(2)随着试验次数的增加,事件A发生的频率有什么变化规律
试验总次数 事件A发生的次数 事件A发生的频率
本人 25
小组 100
全班
利用计算机模拟掷两枚硬币的试验,在重复试验次数为20,100,500时各做5组试验,得到事件A=“一个正面朝上,一个反面朝上”发生的频数nA和频率fn(A)(如下表).
序号 n=20 n=100 n=500 频数 频率 频数 频率 频数 频率
1 12 0.6 56 0.56 216 0.522
2 9 0.45 50 0.50 241 0.482
3 13 0.65 48 0.48 250 0.5
4 7 0.35 55 0.55 258 0.516
5 12 0.6 52 0.52 253 0.506
用折线图表示频率的波动情况(如下图).
由折线图你发现什么?
(1)试验次数n相同,频率fn(A)可能不同,这说明随机事件发生的频率具有随机性.
(2)从整体来看,频率在概率0.5附近波动.当试验次数较少时,波动幅度较大;当试验次数较大时,波动幅度较小.
但试验次数多的波动幅度并不全都比次数少的小,只是波动幅度小的可能性更大.
大量试验表明,在任何确定次数的随机试验中,一个随机事件A发生的频率具有随机性.
一般地,随着试验次数n的增大,频率偏离概率的幅度会缩小,即事件A发生的频率fn(A)会逐渐稳定于事件A发生的概率P(A).我们称频率的这个性质为频率的稳定性.
因此,我们可以用频率fn(A)大数定律阐述了随着试验次教估计概率P(A).
1、频率的稳定性
估算法求概率的方法:
(1)在实际问题中,常用事件发生的频率作为概率的估计值.
(2)在用频率估计概率时,要注意试验次数n不能太小,只有当n很大时,频率才会呈现出规律性,即在某个常数附近波动,且这个常数就是概率.
频率与概率的区别与联系
名称 区别 联系
频率
概率 本身是随机的,在试验之前无法确定,大多会随着试验次数的改变而改变.做同样次数的重复试验,得到的频率值也可能会不同.
是一个[0,1]中的确定值,不随试验结果的改变而改变
(1)频率是概率的近似值,随着试验次数的增加,频率会越来越接近概率
(2)在实际问题中,事件的概率通常情况下是未知的,常用频率估计概率
例1 新生婴儿性别比是每100名女婴对应的男婴数. 通过抽样调查得知,我国2014年、2015年出生的婴儿性别比分别为115.88和113.51.
(1)分别估计我国2014年和2015年男婴的出生率(新生儿中男婴的比率,精确到0.001);
(2)根据估计结果,你认为“生男孩和生女孩是等可能的”这个判断可靠吗
解:(1)2014年男婴出生频率为
0.537
2015年男婴出生频率为
0.532
由此估计,2014年男婴出生率约为0.537,2015年男婴出生率约为0.532.
(2)
由于调查新生儿人数的样本非常大,根据频率的稳定性,上述对男婴出生率的估计具有较高的可信度. 因此,我们有理由怀疑“生男孩和生女孩是等可能的”的结论.
例2 一个游戏包含两个随机事件A和B,规定事件A发生则甲获胜,事件B发生则乙获胜.判断游戏是否公平的标准是事件A和B发生的概率是否相等.
在游戏过程中甲发现:玩了10次时,双方各胜5次;但玩到1000次时,自己才胜300次,而乙却胜了700次.据此,甲认为游戏不公平,但乙认为游戏是公平的.你更支持谁的结论?为什么?
解: 当游戏玩了10次时,甲乙获胜的频率都为0.5;当游戏玩了1000次时,甲获胜的频率为0.3,乙获胜的频率为0.7.
根据频率的稳定性,随着试验次数的增加,频率偏离概率很大的可能性会越来越小.相对10次游戏,1000次游戏时的频率接近概率的可能性更大,因此我们更愿意相信1000次时的频率离概率更近.
而游戏玩到1000次时,甲乙获胜的频率分别是0.3和0.7,存在很大差距,所以有理由认为游戏是不公平的.
因此,应该支持甲对游戏公平性的判断.
降水的概率是气象专家根据气象条件和经验,经分析推断得到的.
对“降水的概率为90%”比较合理的解释是:大量观察发现,在类似的气象条件下,大约有90%的天数要下雨.
只有根据气象预报的长期记录,才能评价预报的准确性.如果在类似气象条件下预报要下雨的那些天(天数较多)里,大约有90%确实下雨了,那么应该认为预报是准确的;如果真实下雨的天数所占的比例与90%差别较大,那么就可以认为预报不太准确.
思考 气象工作者有时用概率预报天气,如某气象台预报“明天的降水概率是90%,如果您明天要出门,最好携带雨具”,如果第二天没有下雨,我们或许会抱怨气象台预报得不准确.那么如何理解“降水率是90%”?又该如何评价预报得结果是否准确呢?
1.判断下列说法是否正确,并说明理由:
(1) 抛掷一枚硬币正面朝上的概率为0.5,则抛掷两枚硬币,一定是一次正面朝上,一次反面朝上;
(2) 抛掷一枚质地均匀的硬币10次,结果是4次正面朝上,所以事件“正面朝上”的概率为0.4;
(3) 当试验次数很大时,随机事件发生的频率接近其概率;
(4) 在一次试验中,随机事件可能发生也可能不发生,所以事件发生和不发生的概率各是0.5.
解: (1)不正确. 抛掷两枚硬币, 样本空间Ω={(正,正), (正,反), (反,正), (反,反)}, 所以抛掷两枚硬币, 不一定是一次正面朝上, 一次反面朝上.
(2)不正确. 不能说概率为0.4, 只能说正面朝上的频率为0.4.
(3)正确.
(4)不正确. 一次试验, 只能说事件发生和不发生的频率各是0.5.
练习
- - - - - - - - - -
教材254页
2. 用掷两枚硬币做胜负游戏, 规定: 两枚硬币同时出现正面或同时出现反面算甲胜, 一个正面、一个反面算乙胜. 这个游戏公平吗
解:这个游戏是公平的. 理由如下:
掷两枚质地均匀的硬币的样本空间Ω={(正,正), (正,反), (反,正), (反,反)}, 则
两枚硬币同时出现正面或同时出现反面的概率为2/4=0.5,即甲胜的概率为0.5,
一个正面、一个反面的概率也为0.5,即乙胜的概率为0.5,所以这个游戏是公平的.
练习
- - - - - - - - - -
教材254页
3. 据统计ABO血型具有民族和地区差异. 在我国H省调查了30488人,四种血型的人数如下:
(1)计算H省各种血型的频率并填表(精确到0.001);
(2)如果从H省任意调查一个人的血型,那么他是O型血的概率大约是多少
血型 A B O AB
人数/人 7704 10765 8970 3049
频率
0.253
0.353
0.294
0.100
解:(1) 各种血型的频率如上表所示.
(2) 由(1)可得,此人是O血型的概率大约是0.294.
练习
- - - - - - - - - -
教材254页
2、随机模拟
用频率估计概率,需要做大量的重复试验.
有没有其他方法可以替代试验呢
我们知道,利用计算器或计算机软件可以产生随机数. 实际上,我们也可以根据不同的随机试验构建相应的随机数模拟试验,这样就可以快速地进行大量重复试验了.
例如,对于抛掷一枚质地均匀硬币的试验,我们可以让计算器或计算机产生取值于集合{0, 1}的随机数,用0表示反面朝上,用1表示正面朝上,这样不断产生0, 1两个随机数,相当于不断地做拋掷硬币的试验.
又如,一个袋中装有2个红球和3个白球,这些球除颜色不同外没有其他差别,对于从袋中摸出一个球的试验,我们可以让计算器或计算机产生取值于集合{1, 2, 3, 4, 5}的随机数,用1, 2表示红球,用3, 4, 5表示白球. 这样不断产生1~5之间的整数随机数,相当于不断地做从袋中摸球的试验.
下表数据是用电子表格软件模拟上述摸球试验的结果,其中n为试验次数,nA为摸到红球的频数,fn(A) 为摸到红球的频率.
画出频率折线图如下图所示,从图中可以看出: 随着试验次数的增加,摸到红球的频率稳定于概率0.4.
n 10 20 50 100 150 200 250 300
nA 6 7 20 45 66 77 104 116
fn(A) 0.6 0.35 0.4 0.45 0.44 0.385 0.416 0.39
我们称利用随机模拟解决问题的方法为蒙特卡洛(Monte Carlo)方法.
例3 从你所在班级任意选出6名同学,调查他们的出生月份,假设出生在一月,二月······+二月是等可能的. 设事件A=“至少有两人出生月份相同”,设计一种试验方法,模拟20次,估计事件A发生的概率,
解: (方法1)根据假设,每个人的出生月份在12个月中是等可能的,而且相互之间没有影响,所以观察6个人的出生月份可以看成可重复试验. 因此,可以构建如下有放回摸球试验进行模拟:
在袋子中装入编号为1, 2,······,12的12个球,这些球除编号外没有什么差别. 有放回地随机从袋中摸6次球,得到6个数代表6个人的出生月份,这就完成了一次模拟试验. 如果这6个数中至少有2个相同,表示事件A发生了. 重复以上模拟试验20次,就可以统计出事件A发生的频率.
例3 从你所在班级任意选出6名同学,调查他们的出生月份,假设出生在一月,二月······+二月是等可能的. 设事件A=“至少有两人出生月份相同”,设计一种试验方法,模拟20次,估计事件A发生的概率,
解: (方法2)利用电子表格软件模拟试验. 在A1, B1, C1, D1, E1, F1 单元格分别输入“= RANDBETWEEN (1,12)”,得到6个数,代表6个人的出生月份,完成一次模拟试验. 选中Al, Bl, C1, D1, E1, F1单元格,将鼠标指向右下角的黑点,按住鼠标左键拖动到第20行,相当于做20次重复试验. 统计其中有相同数的频率,得到事件A的概率的估计值.
分析20次模拟试验的结果,若事件A发生次数为n,则事件A的概率估计值为n/20,则此估计值与事件A的概率(约0.78)应该相差不大.
例4 在一次奥运会男子羽毛球单打比赛中,运动员甲和乙进入了决赛. 假设每局比赛甲获胜的概率为0.6, 乙获胜的概率为0. 4. 利用计算机模拟试验,估计甲获得冠军的概率.
解: 设事件A=“甲获得冠军”, 事件B=“单局比赛甲胜”, 则P(B)=0.6. 用计算器或计算机产生1~ 5之间的随机数, 当出现随机数1, 2或3时, 表示一局比赛甲获胜, 其概率为0.6. 由于要比赛3局, 所以每3个随机数为一组. 例如, 产生20组随机数:
423 123 423 344 114 453 525 332 152 342 534 443 512 541 125 432 334 151 314 354
相当于做了20次重复试验. 其中事件A发生对应的数组分别是
423, 123, 423, 114, 332, 152, 342, 512, 125, 432, 334, 151, 314, 共13个,
相当于事件A发生了13次, 用频率估计事件A的概率, 则P(A)=13/20=0.65.
这个值与用随机模拟方法得到事件A的概率的精确值0.648是比较接近的, 说明用计算机模拟试验估计的概率比较合理.
B
孟德尔遗传规律
从维也纳大学回到布鲁恩不久,孟德尔就开始了长达8年的豌豆实验。孟德尔首先从许多种子商那里,弄来了34个品种的豌豆,从中挑选出22个品种用于实验。它们都具有某种可以相互区分的稳定性状,例如高茎或矮茎、圆粒或皱粒、灰色种皮或白色种皮等。
阅读与思考
豌豆杂交试验
孟德尔把黄色和绿色的豌豆杂交,第一年收获的豌豆是黄色的。第二年,当他把第一年收获的黄色豌豆再种下时,收获的豌豆既有黄色的又有绿色的。
同样他把圆形和皱皮豌豆杂交,第一年收获的都是圆形豌豆,连一粒皱皮豌豆都没有。第二年,当他把这种杂交圆形再种下时,得到的却既有圆形豌豆,又有皱皮豌豆。
试验具体数据如下:
性状 显性 隐性 显性:隐性
子叶的颜色 黄色 6022 绿色 2001 3.01:1
种子的性状 圆形 5474 皱皮 1850 2.96:1
茎的高度 长茎 787 短茎 277 2.84:1
第二代
第一代
亲本
dd
DD
黄色豌豆(DD,Dd):绿色豌豆(dd)≈ 3:1.
遗传机理中的统计规律
DD表示纯黄色的豌豆
dd 表示纯绿色的豌豆
(其中D为显性因子,d为隐性因子)
Dd
Dd
DD
Dd
Dd
dd
孟德尔从豌豆实验中洞察到遗传规律是一种统计规律,下面给出解释:
孟德尔遗传定律
基因分离律:基因不融合,而是各自分开;如果双亲都是杂种,后代以3 :1(显性 :隐性)的比例分离;
基因自由组合律:每对基因自由组合或分离,不受其他基因的影响。