2.4 线性回归方程
案例探究
在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?
分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.
在实际问题中,变量之间的常见关系有如下两类:
一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r之间就是确定性函数关系,可以用函数S=πr2表示.
一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.
自学导引
1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.
2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.
3.请你说出确定性关系与相关关系的相同点和不同点.
答案:相同点:均是指两个变量的关系.
不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.
4.你是否还能举出一些现实生活中存在的相关关系的问题?
答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.
5.将n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.
6.(1)当两个变量成正相关时,散点图有什么特点?
(2)当两个变量成负相关时,散点图又有什么特点?
答案:(1)散点图中的点散布在从左下角到右上角的区域.
(2)散点图中的点散布在从左上角到右下角的区域.
7.对于散点图可以作出如下判断:
(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;
(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;
(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.
8.回归直线是怎样定义的?
答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
疑难剖析
【例1】
下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?
年平均气温(℃)
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
748
542
507
813
574
701
432
思路分析:用回归直线进行拟合两变量关系的一般步骤为:
(1)作出散点图,判断散点是否在一条直线?附近;
(2)如果散点在一条直线附近,以公式求出a,
b,并写出线性回归方程.
解:以x轴为年平均气温,y轴为年降雨量可得相应的散点图:
因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直线进行拟合,用公式求得的回归方程也是没有意义的.
思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系.
思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程.
观察两相关变量得如下数据:
x
-1
-2
-3
-4
-5
5
3
4
2
1
y
-9
-7
-5
-3
-1
1
5
3
7
9
求两变量间的回归方程.
错解:求线性回归直线方程的步骤:
第一步:列表xi,yi,xiyi;
第二步:计算,,,,;
第三步:代入公式计算b,
a的值;
第四步:写出回归直线方程.
列表:
i
1
2
3
4
5
6
7
8
9
10
xi
-1
-2
-3
-4
-5
5
3
4
2
1
yi
-9
-7
-5
-3
-1
1
5
3
7
9
xiyi
9
14
15
12
5
5
15
12
14
9
计算得:=0,
=0
=110,
=310,
=110
∴b=
a=-b=0-1
0=0
故所求回归直线方程为=x.
正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x和y不具有线性相关关系,也就不存在线性回归方程.
【例2】
某班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:
x
24
15
23
19
16
11
20
16
17
13
y
92
79
97
89
64
47
83
68
71
59
某同学每周用于数学学习的时间为18小时,试预测该生数学成绩.
思路分析:首先应该利用表中数据通过计算去判断数学学习的时间x与数学成绩y是否具有线性相关关系.若有,则可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.
解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示的数据:
i
1
2
3
4
5
6
7
8
9
10
xi
24
15
23
19
16
11
20
16
17
13
yi
92
79
97
89
64
47
83
68
71
59
xiyi
2
208
1
185
2
231
1
691
1
204
517
1
660
1
088
1
207
767
=17.4,=74.9=3
182,=58
375,=13
578
于是可得b=
a=-b=74.9-3.53×17.4≈13.5
故所求回归直线方程为y=3.53x+13.5
当x=18时,=3.53×18+13.5=77.04≈77
故该同学预计可得77分左右.
思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.
【例3】
一般说,一个人的身高越高,他的手就越大.
为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:
(单位:cm)
身高
168
170
171
172
174
176
178
178
180
181
一揸长
19.0
20.0
21.0
21.5
21.0
22.0
24.0
23.0
22.5
23.0
(1)依据上述数据制作散点图,发现两者有何相关关系吗?
(2)如果近似成线性关系,求线性回归方程.
(3)如果一个学生身高185
cm,估计他的右手一揸长.
思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.
解:(1)散点图如下:
可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.
(2)设线性回归方程为=bx+a
由上述数据计算可得=174.8,
=21.7
=305
730,
=37
986
∴b==
a=-b=-31.264
∴方程为=0.303x-31.264.
(3)当x=185时,
=24.79.
思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.
拓展迁移
【拓展点1】
如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x轴的变量为__________.
答案:播放次数
【拓展点2】
有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.
品牌
所含热量的百分比
口味记录
A
25
89
B
34
89
C
20
80
D
19
78
E
26
75
F
20
71
G
19
65
H
24
62
I
19
60
J
13
52
(1)求出回归直线方程;
(2)关于两个变量之间的关系,得出的结论是什么?
答案:(1)
=1.565x+37.827
(2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.
【拓展点3】
某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
尿汞含量x
2
4
6
8
10
消光系数y
64
138
205
285
360
(1)作出散点图;
(2)如果y与x之间具有线性相关关系,求回归方程;
(3)估计尿汞含量为9毫克/升时消光系数.
答案:(1)散点图略.
(2)由散点图可知y与x线性相关.设回归方程为=bx+A.
计算可得回归方程为=36.95x-11.3.
(3)当x=9时,=36.95×9-11.3=321.25≈321
PAGE
13.3 几何概型
案例探究
判断下列试验中事件A发生的概率是否是古典概型?若不是,它又是什么概型呢?
(1)抛掷两颗骰子,求出现两个“4点”的概率;
(2)如右图所示,图中有一个转盘,甲乙两人玩转盘游戏,规定当指针指向B区域时,甲获胜,否则乙获胜,求甲获胜的概率.
分析:本题探究的是几何概型与古典概型的特点,古典概型具有有限性和等可能性,而几何概型则是在试验中出现无限多个结果,且与事件的区域长度有关.?
解:(1)抛掷两颗骰子,出现的可能结果有6×6=36种,且它们都是等可能的,因此属于古典概型.
(2)游戏中指针指向B区域时有无限多个结果,而且不难发现“指针落在阴影部分”.概率可以用阴影部分的面积与总面积的比来衡量,即与区域长度有关,因此属于几何概型.
请同学们再想想下面问题.
某人欲从某车站乘车出差,已知该站发往各地的客车均每小时一班,求此人等车时间不多于10分钟的概率.
分析:假设他在0~60分钟之间任何一个时刻到车站等车是等可能的,但在0到60分钟之间有无穷多个时刻,不能用古典概型公式计算随机事件发生的概率.我们可以通过几何概型的求概率公式得到事件发生的概率.因为客车每小时一班,他在0到60分钟之间任何一个时刻到站等车是等可能的,所以他在哪个时间段到站等车的概率只与该时间段的长度有关,而与该时间段的位置无关,这符合几何概型的条件.
解:设A={等待的时间不多于10分钟},
我们所关心的事件A恰好是到站等车的时刻位于[50,60]这一时间段内,因此由几何概型的概率公式,得
P(A)=.
即“等待的时间不多于10分钟”的概率为.
自学导引
1.对于一个随机试验,我们将每个基本事件理解为从某个特定的几何区域内随机地取一点,该区域中每一点被取到的机会都一样;而一个随机事件的发生则理解为恰好取到上述区域内的某个指定区域中的点.这里的区域可以是线段、平面图形、立体图形等.用这种方法处理随机试验,称为几何概型(geometric
probability
model).
2.几何概型的两个基本特征:(1)无限性:在一次试验中可能出现的结果有无限多个.
(2)等可能性:每个结果的发生具有等可能性.
3.一般地,在几何区域D中随机地取一点,记事件“该点落在其内部一个区域d内”为事件A,则事件A发生的概率
P(A)=.
这里要求D的测度不为0,其中“测度”的意义依D确定,当D分别是线段、平面图形和立体图形时,相应的“测度”分别是长度、面积和体积等.
4.几何概型的试验中,事件A发生的概率P(A)只与子区域d的测度(长度、面积、体积)成正比,而与子区域d的位置和形状无关.
疑难剖析
古典概型与几何概型中基本事件发生的可能性是相等的,但古典概型要求基本事件有有限个,几何概型的基本事件则有无限多个.
计算几何概型的概率要先计算基本事件总体与事件A包含的基本事件对应的区域的测度(角度、面积、体积),而这可能遇到困难,这是本节难点之一.实际上本节的重点不在于计算,而在于如何利用几何知识,把问题转化为各种几何概型的概率问题.
同时要注意判断基本事件的等可能性,这需要严谨思维,切忌想当然,需要从问题的实际背景中去判断.
【例1】
在等腰Rt△ABC中,在斜边AB上任取一点M,求AM的长小于AC的长的概率.
思路分析:点M随机地落在线段AB上,故线段AB为区域D.当点M位于图中线段AC′上时,AM
解:在AB上截取AC′=AC.于是P(AM.
思维陷阱:如右图,在等腰Rt△ABC中,过直角顶点C在∠ACB内部任作一条射线CM,与线段AB交于点M,求AM错解:在AB上取AC′=AC,在∠ACB内作射线CM看作在线段AC上任取一点M,过C、M作射线CM,则概率为.
错因分析:虽然在线段上任取一点是等可能的,但过点C和任取的点所作的射线是不均匀的,因而不能把等可能取点看作等可能作射线.因此在确定基本事件时,一定要注意选择好观察角度,注意判断基本事件发生的等可能性.?
正解:在∠ACB内的射线CM是均匀分布的,所以射线CM作在任何位置都是等可能的.在AB上取AC′=AC,则∠ACC′=67.5°,故满足条件的概率为=0.75.
思维启示:判断基本事件应从“等可能”的角度入手,选择好观察角度.
【例2】
如右图,在直角坐标系内,∠xOT=60°,任作一条射线OA,求射线OA落在∠xOT内的概率.
思路分析:以O为起点作射线OA是随机的,因而射线OA落在任何位置都是等可能的.落在∠xOT内的概率只与∠xOT的大小有关,符合几何概型的条件.
记B={射线OA落在∠xOT内}.
∵∠xOT=60°,
∴P(B)=
=.
思维启示:此题关键是搞清过O作射线OA可以在平面内任意作,而且是均匀的.因而基本事件的发生是等可能的.
【例3】
如右图,在墙上挂着一块边长为16cm的正方形木板,上面画了小、中、大三个同心圆,半径分别为2cm、4cm、6cm,某人站在3
m之外向此板投镖,设投镖击中线上或没有投中木板时都不算,可重投,问:
(1)投中大圆内的概率是多少?
(2)投中小圆与中圆形成的圆环的概率是多少?
(3)投中大圆之外的概率是多少?
思路分析:投中正方形木板上每一点(投中线上或没投中都不算)都是一个基本事件,这一点可以是正方形木板上任意一点,因而基本事件有无限多个,且每个基本事件发生的可能性都相等,所以投中某一部分的概率只与这部分的几何度量(面积)有关,这符合几何概型的条件.
解:记A={投镖击中大圆内},
B={投镖击中小圆与中圆形成的圆环},
C={投镖击中大圆之外}.
S正方形=162=256,
S大圆=π×62=36π,
S中圆=π×42=16π,
S小圆=π×22=4π.
∴P(A)=
.
P(B)=
.
P(C)=.
答:投中大圆内的概率是π;投中小圆与中圆形成的圆环的概率为π;投中大圆之外的概率是1-π.
思维启示:投中线上或没投中不算,是为了保证投中正方形内各部分的任意一点都是等可能的,因而可用几何概型的概率公式求概率.
【例4】
在500mL的水中有一个草履虫,现从中随机取出2mL水样放到显微镜下观察,求发现草履虫的概率.
思路分析:由于草履虫在水中什么位置是随机的,而取水样也具有随机性,所以取哪一部分水样的可能性相等.因而取到草履虫的概率只与所取水样的体积有关.这符合几何概型的条件.
解:记事件A={在取出的2mL水样中有草履虫}.
由几何概率公式得,P(A)==0.004.
【例5】
甲、乙两人约定在6时到7时之间在某处会面,并约定先到者应等候另一人一刻钟,过时即可离去.求两人能会面的概率.
思路分析:甲、乙两人中每人到达会面地点的时刻都是6时到7时之间的任一时刻,如果在平面直角坐标系内用x轴表示甲到达约会地点的时间,y轴表示乙到达约会地点的时间,用0分到60分表示6时到7时的时间段,则横轴0到60与纵轴0到60的正方形中任一点的坐标(x,y),就表示甲、乙两人分别在6时到7时时间段内到达的时间.而能会面的时间由|x-y|≤15所对应的图中阴影部分表示.由于每人到达的时间都是随机的,所以正方形内每个点都是等可能被取到的(即基本事件等可能发生).所以两人能会面的概率只与阴影部分的面积有关,这就转化为面积型几何概率问题.
解:以x和y轴分别表示甲、乙两人到达约定地点的时间,则两人能够会面的充要条件是|x-y|≤15.在如右图所示平面直角坐标系下,(x,y)的所有可能结果是边长为60的正方形,而事件A“两人能够会面”的可能结果由上图中的阴影部分表示.由几何概率公式得:
P(A)=
答:两人能会面的概率是.
思维启示:本题的难点是把两个时间分别用x,y两个坐标表示,构成平面内的点(x,y),从而把时间这个一维长度问题转化为平面图形的二维面积问题,转化成面积型几何概率问题.
拓展迁移
【拓展点】
乔和摩进行了30分钟的关于他们前一天夜里进行的活动的谈话,然而谈话却被监听录音机录了下来,联邦调查局拿到磁带并发现其中有10秒钟长的一段内容包含他们俩犯罪的信息,然而后来发现,这段谈话的一部分被联邦调查局的一名工作人员擦掉了,该工作人员声称她完全是无意中按错了键,使从此处往后的所有内容都被擦掉了.试问:如果这10秒钟的谈话记录开始于磁带记录后的半分钟处,那么含有犯罪内容的谈话被部分或全部偶然擦掉的概率将是多大?
分析:包含两人犯罪的谈话录音的部分在30
s到40s之间,当按错键的时刻在这段时间内时,部分被擦掉,当按错键的时刻在0到30
s之间时全部被擦掉,即在0到40s之间即0到min之间的时间段内按错键时含有犯罪内容的谈话被部分或全部擦掉,而0到30
min之间的时间段内任一时刻按错键的可能性是相等的,所以按错键使含有犯罪内容的谈话被部分或全部擦掉的概率只与从开始到谈话内容结束的时间段长度有关,符合几何概型的条件.
解:记A={按错键使含有犯罪内容的谈话被部分或全部擦掉},A发生就是在0到
min时间段内按错键.
P(A)=.
PAGE
13.2 古典概型
案例探究
某班数学兴趣小组有男生和女生各2名,现从中任选2名学生去参加校数学竞赛,请思考下列问题:
(1)恰好有一名参赛学生是男生的概率;
(2)至少有一名参赛学生是男生的概率;
(3)至多有一名参赛学生是男生的概率.
分析:由题设知,此题属于古典概型.先算基本事件总数,然后再计算各类事件发生的概率.
解:基本事件有:(男1,男2),(男1,女1),(男1,女2),(男2,女1),(男2,女2),(女1,女2),共6个.
(1)恰好有一参赛男生的基本事件有:
(男1,女1),(男1,女2),(男2,女1),(男2,女2).
共4个,所以这一事件的概率为P==.
(2)至少有一名参赛男生的基本事件有:?
(男1,男2),(男1,女1),(男1,女2),(男2,女2),(男2,女1).
共有5种不同的结果,所以,所求事件的概率为P=.
(3)至多有一名参赛男生的基本事件有:
(男1,女1),(男1,女2),(男2,女1),(男2,女2),(女1,女2).
共有5种不同的结果,所以,所求事件的概率为P=.
自学导引
1.在1次试验中可能出现的每一个基本结果,称为基本事件.若在1次试验中,每个基本事件发生的可能性都相同,则称这些基本事件为等可能基本事件.
2.(1)试验中所有可能出现的基本事件只有有限个(有限性);
(2)每个基本事件出现的可能性相等(等可能性).
我们将具有这两个特点的概率模型称为古典概型.
3.如果一次试验的等可能基本事件共有n个,那么每一个等可能基本事件发生的概率都是;如果某个事件A包含的基本事件有m个,那么事件A的概率P(A)=.
4.先后抛掷两枚硬币,观察正反面出现的情况,在此试验中有哪些基本事件?
答:它有4个基本事件,分别是(正,正),(正,反),(反,正),(反,反).其中(正,正)代表第1和第2枚硬币都出现正面,(正,反)代表1枚硬币出现正面而第2枚硬币出现反面,(反,正)代表第1枚硬币出现反面而第2枚硬币出现正面,(反,反)代表第1和第2枚硬币都出现反面.
5.是不是所有的试验都是古典概型?举例说明.
(1)一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特征——有限性和等可能性.(2)并不是所有的试验都是古典概型.例如,在适宜的条件下“种下一粒种子观察它是否发芽”,这个试验的基本事件空间为{发芽,不发芽},而“发芽”与“不发芽”这两种结果出现的机会一般是不均等的.又如,从规格直径为300
mm±0.6mm的一批合格产品中任意抽一根,测量其直径d,测量值可能是从299.4mm到300.6mm之间的任何一个值,所有可能的结果有无限多个.这两个试验都不属于古典概型.
疑难剖析
【例1】
掷一颗质地均匀的骰子,观察掷出的点数,写出所有的基本事件,说明其是否是古典概型.
思路分析:因为骰子为立方体形状,其六个面分别对应1点、2点、…、6点,所以基本事件应有6个.
解:有6个基本事件,分别是“出现1点”,“出现2点”,…“出现6点”.因为骰子的质地均匀,所以每个基本事件的发生是等可能的,因此它是古典概型.
思维启示:基本事件是试验中不能再分的最简单的随机事件,其他事件可以用它们来描绘.
【例2】
掷一颗骰子,观察掷出的点数,求掷得奇数点的概率.
思路分析:掷骰子有6个基本事件,具有有限性和等可能性,因此是古典概型.
解:这个试验的基本事件共有6个,即(出现1点)、(出现2点)、…、(出现6点),
所以基本事件数n=6,
事件A={掷得奇数点}={出现1点,出现3点,出现5点},
其包含的基本事件数m=3.
所以,P(A)====0.5.
思维陷阱:如一个口袋内装有大小相等的3个黑球和2个白球,从中摸出一个球,求摸出一个黑球的概率.?
错解:从中摸出一球的可能结果有两种“黑球”“白球”,则摸出一黑球的概率为.?
错因分析:因为黑球数高于白球数,因此摸到黑球的机会就大于摸到白球的机会,它们不是等可能的,因此上述解法不正确.
正解:我们把3个黑球分别标上“A、B、C”三个字母加以区分,把两个白球标上“D、E”以示区分.那么摸出一个球的所有结果为“黑A”“黑B”“黑C”“白D”“白E”,共五种,因此摸出一个黑球的概率为.
思维启示:利用古典概型公式P(A)=求概率的步骤:(1)首先检验是否是古典概型,即基本事件是否有限个.每个基本事件是否具有等可能性;(2)利用列举法把等可能的基本事件一一列出.从而求出基本事件总数n及所求事件包含基本事件的个数m;(3)利用公式P(A)=求出事件的概率.
【例3】
将一颗质地均匀的骰子先后抛掷两次,求:
(1)一共有多少种不同的结果?
(2)其中向上的数之和是5的结果有多少种?
(3)向上的数之和是5的概率是多少?
(4)向上的数之和是5的倍数的概率是多少?
思路分析:由于骰子的质地是均匀的,故先后抛掷的结果是等可能的,可把基本事件一一列出,然后根据事件求出概率.
(1)先后抛掷两枚质地均匀的骰子,共有以下不同的结果.
1
2
3
4
5
6
123456
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(1,6)(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(2,6)(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
(3,6)(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
(4,6)(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
(5,6)(6,1)
(6,2)
(6,3)
(6,4)
(6,5)
(6,6)
即共有36种不同的结果.
(2)在上面的结果中,向上的数之和为5的结果有:(1,4),(2,3),(3,2),(4,1),共4种.
(3)由于骰子的质地是均匀的,所以将它抛掷两次的所有36种结果是等可能出现的,其中向上的数之和为5的结果(记为事件A)有4种,因此,所求的概率为
P(A)==.
(4)出现向上的数之和为5的倍数的事件(记为事件B)有:
(1,4),(2,3),(3,2),(4,1),(4,6),(6,4),(5,5).
共7种不同结果,且都是等可能的,所以其概率为
P(B)=.
思维启示:求概率时,常常把全体基本事件一一列出,以便我们准确地找出基本事件总数,以及某事件所含的基本事件个数.这是我们初学概率最常用、最基本的方法.
【例4】
一个盒子里装有标号1、2、…、10的标签,今随机地选取两张标签,根据下列条件求两张标签上的数字为相邻整数的概率:
(1)标签的选取是无放回的;
(2)标签的选取是有放回的.
思路分析:首先要弄清基本事件个数,然后用古典概型概率公式P(A)=求解.
解:随机地选取两张标签,记事件A为“两张标签上的数字为相邻整数”,可能结果为(1,2),(2,3),(3,4),…,(9,10)共9种.?
(1)如果标签是无放回的,按抽取顺序记录为(x,y)则x有10种可能,y有9种可能,但(x、y)与(y、x)是一样的,共有可能的结果为10×9÷2=45种,因此事件A的概率为P(A)==.
(2)如果小球是有放回的,按抽取顺序记录结果(x、y),则x有10种可能,y有10种可能,但(x、y)与(y、x)是一样的,共有可能结果10×10÷2=50种.因此事件A的概率为.
思维启示:准确把握不同条件下的基本事件总数.对于不放回抽样,计算基本事件个数既可看作有顺序的,也可看作无顺序的,其结果是一样的,但不论选择哪一种方式,观察的角度必须一致,否则会产生错误.对于有放回的抽样,计算基本事件个数只能看作是无序的,若看作是有序的,则各个基本事件就不是等可能的情况,不符合古典概型.
【例5】
每个人的基因都有两份,一份来自父亲,另一份来自母亲.同样地,他的父亲和母亲的基因也有两份.在生殖的过程中,父亲和母亲各自随机地提供一份基因给他们的后代.
以褐色颜色的眼睛为例.每个人都有一份基因显示他的眼睛颜色:(1)眼睛为褐色;(2)眼睛不为褐色.
如果孩子得到的父母的基因都是“眼睛为褐色”的基因,则孩子的眼睛也为褐色.如果孩子得到的父母的基因都为“眼睛不为褐色”的基因,则孩子眼睛不为褐色(是什么颜色取决于其他的基因).如果孩子得到的基因中一份为“眼睛为褐色”的,另一份为“眼睛不为褐色”的,则孩子的眼睛不会出现两种可能,而只会出现眼睛颜色为褐色的情况.生物学家把“眼睛为褐色”的基因叫做显性基因.
方便起见,我们用它母B代表“眼睛为褐色”这个显性基因,用b代表“眼睛不为褐色”这个基因.每个人都有两份基因,控制一个人眼睛颜色的基因有BB,Bb(表示父亲提供基因B,母亲提供基因b),bB,bB.注意在BB,Bb,bB和bb这4种基因中只有bb基因显示为眼睛颜色不为褐色,其他的基因都显示眼睛颜色为褐色.
假设父亲和母亲控制眼睛颜色的基因都为Bb,?则孩子眼睛不为褐色的概率有多大?
解析:由于父亲和母亲控制眼睛颜色的基因都为Bb,从而孩子有可能产生的基因有4种,即BB,Bb,bB,bb(右图).又因为父亲或母亲提供给孩子基因B或b的概率是一样的,所以可以认为孩子的基因是这4种中的任何一种的可能性是一样的.因此,这是一个古典概型问题.只有当孩子的基因为bb时,眼睛才不为褐色,所以,(1)“孩子眼睛为褐色”这个随机事件发生的概率为=0.75.(2)“孩子眼睛不为褐色”这个随机事件发生的概率为=0.25.
拓展迁移
【拓展点1】
若以连续两次掷骰子分别得到的点数m、n作为点P的坐标(m,n),求点P落在圆x2+y2=18内的概率.
解析:易知基本事件有36个,
事件“点P(m,n)在圆x2+y2=18内”包括下列10个基本事件:
(1,1),(1,2)(1,3),(1,4),(2,1),(2,2),(2,3),(3,1),(3,2),(4,1).
故所求概率是=.
【拓展点2】
在标准化的考试中既有单选题又有多选题,多选题是从?A、B、C、D?四个选项中选出所有正确答案,同学们可能有一种感觉,如果不知道正确答案,多选题更难猜对,这是为什么?
解析:我们可以探讨正确答案的所有结果:
如果只有一个答案是正确的,则有4种;如果有两个答案是正确,则正确答案可以是(A、B)、(A、C)、(A、D)、(B、C)、(B、D)、(C、D)6种.
如果有三个答案是正确的,则正确答案可以是(A、B、C)、(A、C、D)、(A、B、D)、(B、C、D)4种.
如果四个都正确,则正确答案只有1种.
故正确答案的所有可能结果有4+6+4+1=15种,从这15种答案中任取一种的可能性只有.因此更难猜对.
【拓展点3】
齐王与田忌赛马,田忌的上马优于齐王的中马,劣于齐王的上马,田忌的中马优于齐王的下马,劣于齐王的中马,田志的下马劣于齐王的下马,现各出上、中、下三匹马分组进行比赛,如双方均不知对方马的出现顺序,探求田忌获胜的概率.
解析:要对阵齐王的上、中、下三匹马,田忌的三匹马按出场顺序(x,y,z)记录结果,x有3种可能结果,y有2种可能结果,z有1种可能
结果,所以试验的所有结果有3×2×1=6种.
田忌要想获胜,只有一种可能结果,即x为下马,y为上马,z为中马.因此,所求事件即田忌获胜的概率为:P=.
PAGE
12.2.1 频率分布表
案例探究
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为要较合理地确定出这个标准,需要做哪些工作?
很明显,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.
由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况,假设通过抽样方式我们获得了100位居民某年的月均用水量(单位:t):
3.1
2.5
2.0
2.0
1.5
1.0
1.6
1.8
1.9
1.6
3.4
2.6
2.2
2.2
1.5
1.2
0.2
0.4
0.3
0.4
3.2
2.7
2.3
2.1
1.6
1.2
3.7
1.5
0.5
3.8
3.3
2.8
2.3
2.2
1.7
1.3
3.6
1.7
0.6
4.1
3.2
2.9
2.4
2.3
1.8
1.4
3.5
1.9
0.8
4.3
3.0
2.9
2.4
2.4
1.9
1.3
1.4
1.8
0.7
2.0
2.5
2.8
2.3
2.3
1.8
1.3
1.3
1.6
0.9
2.3
2.6
2.7
2.4
2.1
1.7
1.4
1.2
1.5
0.5
2.4
2.5
2.6
2.3
2.1
1.6
1.0
1.0
1.7
0.8
2.4
2.8
2.5
2.2
2.0
1.5
1.0
1.2
1.8
0.6
2.2
上面这些数据能告诉我们什么呢?
分析:该数据中最小值是0.2
t,最大值是4.3
t,它们相差4.1,其他在0.2
t~4.3
t之间.可取区间[0,4.5],并将此区间分成9个小区间,每个区间长度为0.5,再统计每个区间内的频数并计算相应的频率.我们将整个取值区间的长度称为全距,分成的区间的长度称为组距.
解:(1)在全部数据中找出最小值0.2和最大值4.3,则两者之差为4.1(称为极差),确定全距为4.5,决定以组距0.5将区间[0,4.5]分成9组(为了方便组距应力求取整);组数=极差/组距=4.1/0.5=8.2,所以组数取9(取进位).
(2)从第一组[0,0.5)开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:
分组
频数累计
频数
频率
[0,0.5)
4
4
0.04
[0.5,1)
12
8
0.08
[1,1.5)
27
15
0.15
[1.5,2)
49
22
0.22
[2,2.5)
74
25
0.25
[2.5,3)
88
14
0.14
[3,3.5)
94
6
0.06
[3.5,4)
98
4
0.04
[4,4.5]
100
2
0.02
合计
100
1
结论:从上面所作频率分布表中,我们可以看到月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.且可以计算出大约有88%的居民月均用水量在3吨以下,因此,居民月均用水量标准定为3吨是市政府可以考虑的一个标准.
注:在画频率分布表时,除最右边的区间是闭区间外,其他均为左闭右开区间,称区间的左端点为下组限,右端点为上组限.此处采用下组限在内,上组限不在内的分组方法.
自学导引
1.什么叫做频率分布表?
答案:
我们把反映总体频率分布的表格称为频率分布表.
2.给定一组数据如何作出它们的频率分布表?
答案:一般地,作频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
3.什么叫做全距和组距?组距等于什么?
答案:我们将整个取值区间的长度称为全距,所分成的区间的长度称为组距;
组距=全距/组数.
4.在制作频率分布表时,分的组数过多或过少各有何利弊?
答案:分组过多或过少都不好.分组过多给制作频率分布表带来困难.过少虽减少了作表步骤,但不能很好地反映总体.一般样本容量越大,所分组数应越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.
5.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=120.
6.将100个数据分成8个组,其中有一组是9个数据,那么该组的频数是9,频率是0.09
(频率=频数/样本容量).
疑难剖析
【例1】
为了解某地区高三学生的身体发育情况,当地教育机构抽查了本地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg):
56.5
69.5
65
61.5
64.5
66.5
64
64.5
76
58.5
72
73.5
56
67
70
57.5
65.5
68
71
75
62
68.5
62.5
66
59.5
63.5
64.5
67.5
73
68
55
72
66.5
74
63
60
55.5
70
64.5
58
64
70.5
57
62.5
65
69
71.5
73
62
58
76
71
66
63.5
56
59.5
63.5
65
70
74.5
68.5
64
55.5
72.5
66.5
68
76
57.5
60
71.5
57
69.5
74
64.5
59
61.5
67
68
63.5
58
59
65.5
62.5
69.5
72
64.5
75.5
68.5
64
62
65.5
58.5
67.5
70.5
65
66
66.5
70
63
59.5
试根据上述数据画出样本的频率分布表.
思路分析:此题容量较大,先要对所给数据进行分析,找到最大值与最小值以确定全距,再分组作出频率分布表.
解:按照下列步骤获得样本的频率分布.
(1)求最大值与最小值的差(即全距).
在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.
(2)确定组距与组数.
如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是合适的.于是组距为2,组数为11.
(3)决定分点.
根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5.为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).
(4)列频率分布表
分组
频数累计
频数
频率
[54.5,56.5)
5
5
0.05
[56.5,58.5)
12
7
0.07
[58.5,60.5)
21
9
0.09
[60.5,62.5)
26
5
0.05
[62.5,64.5)
39
13
0.13
[64.5,66.5)
55
16
0.16
[66.5,68.5)
67
12
0.12
[68.5,70.5)
78
11
0.11
[70.5,72.5)
87
9
0.09
[72.5,74.5)
93
6
0.06
[74.5,76.5)
100
7
0.07
合计
100
1.00
【例2】
为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.
试列出样本的频率分布表.
思路分析:由于总体中的个体取不同数值很少,只有四种:一级品、二级品、三级品和次品,可分别记为1,2,3和4.所以所取样本的不同数值及其相应的频率可用频率分布表表示,并根据频率分布表估计总体分布.
解:把一级品、二级品、三级品和次品,分别记为1,2,3和4,由题意列样本的频率分布表为:
产品
频数
频率
一级品(记为1)
5
0.17
二级品(记为2)
8
0.27
三级品(记为3)
13
0.43
次品(记为4)
4
0.13
【例3】
有一容量为50的样本,数据的分组及各组的频数如下:
[10,15)
4,[15,20)
5,[20,25)
10,[25,30)
11,[30,35)
9,[35,40)
8,[40,45)
3
请列出所给样本的频率分布表.
思路分析:本题考查样本的频率分布表的画法以及用样本频率分布估计总体分布.由于是连续型总体,所以对样本分成7组,组距为5,从而可用频率分布表表示样本的频率分布,并估计总体分布.
解:
样本的频率分布表为:
分组
频数
频率
[10,15)
4
0.08
[15,20)
5
0.10
[20,25)
10
0.20
[25,30)
11
0.22
[30,35)
9
0.18
[35,40)
8
0.16
[40,45)
3
0.06
拓展迁移
【拓展点】
下面列出43位美国历届总统(从1789年的华盛顿到2001年的小布什)的就任年龄:
57 61 57 57 58 57 61 54
68
51 49 64 50 48 65 52 56 46
54 49 51 47 55 55 54 42 51
56 55 51 54 51 60 62 43 55
56 61 52 69 64 46 54
(1)根据以上数据以5为组距画出相应的频率分布表.
(2)根据以上数据以4为组距画出相应的频率分布表.
解析:(1)以5为组距列频率分布表如下:
年龄分组
频数
频率
频率/组距
[40,45)
2
0.046
5
0.009
[45,50)
6
0.139
5
0.027
9
[50,55)
13
0.302
3
0.060
5
[55,60)
12
0.279
1
0.055
8
[60,65)
7
0.162
8
0.032
6
[65,70]
3
0.069
8
0.014
0
(2)(略)方法步骤与(1)相类似.(请同学们自己独立完成)
PAGE
11.2.1 顺序结构
案例探究
已知函数f(x)=x2,把区间[-3,3]十等分,画出求等分点函数值算法的流程图.
思路分析:把区间[
( http: / / www.21cnjy.com )-3,3]十等分,则等分点自变量x的值依次是-3,-2.4,-1.8,-1.2,
-0.6,0,0.6,1.2,1.8,2.4,3,从这十一个数可以看出,每两个数之间相差0.6,我们在计算等分点函数值时,可以引入变量i,从自变量为-3开始,每算一个等分点的值,i就加0.6,直到i=3为止.因此描述此问题的流程图为一个循环结构的流程图.
解:流程图:
像这种由一些图框和带箭头的流程线组成的表示操作先后次序的图形就是这节课要研究的流程图.
自学导引
1.流程图:是由一些图框和带箭头的
( http: / / www.21cnjy.com )流程线组成的,其中图框表示各种操作的类型,图框中的文字和符号表示操作的内容,带箭头的流程线表示操作的先后次序.?
2.任何一种算法都是由三种基本逻辑结构组成,它们是顺序结构、选择结构、循环结构.
3.填写下表.
图形符号
名称
符号表示的意义
起、止框
算法的起始和结束
( http: / / www.21cnjy.com )
输入、输出框
算法的输入和输出的信息
( http: / / www.21cnjy.com )
处理框(执行框)
赋值、计算
( http: / / www.21cnjy.com )
判断框
判断某一条件是否成立,成立时在出口处标明“是”或“Y”;不成立时标明“否”或“N”
流程线
流程进行的方向
循环框
程序做重复运算
( http: / / www.21cnjy.com )
连结点
连结另一页或另一部分的流程图
注释框
帮助理解流程图
4.顺序结构是任何一个算法都不可缺少的基本结构,它由若干个依次执行的处理步骤组成.
疑难剖析
顺序结构是最简单的算法结构,语句与语句之间,框与框之间是按从上到下的顺序进行的,不会引起步骤的跳转.
【例1】
已知x=10,y=2,画出计算w=5x+8y的值的流程图.
思路分析:首先写出解决这个问题的算法,然后根据算法的步骤和画流程图的一些规则画出流程图.
解:流程图:
思维启示:画流程框图要使用标准的框图符号,画流程线时不要忘记画箭头,否则就难以判定各框的执行顺序了.
【例2】
画已知梯形两底a,b和高h,求梯形面积的流程图.
思路分析:对于套用公式型的问题,要注意所给公式中变量的个数及输入输出部分的设计.首先写出算法:S1:输入a、b、h;
?S2:计算S=(a+b)·h;
?S3:输出.
解:根据以上算法画出流程图,如右图所示.
思维启示:一些公式的直接套用求值,函数求值等问题,其算法不包含判断和重复操作过程,只用顺序结构描述即可.
【例3】
画出计算1×2×3×4×5?的流程图.
思路分析:由于本题只有有限个数,故可设计如下算法,S1:计算1×2,得到2;
?S2:计算第一步得到的结果2与3的积得到6;
?S3:计算第二步得到的结果6与4的积,得到24;
?S4:计算第三步得到的结果24与5的积,得到120.根据算法可设计出流?程图?.?
解法1:
解法2:
思维启示:这是典型的顺序结构框图,整
( http: / / www.21cnjy.com )个算法的执行过程是S1→S2→S3→S4,即执行完S1后,必须执行S2,执行完S2后,必须执行S3……直到程序结束.
【例4】
已知两个单元分别存放了变量x和y,试交换两个变量的值.请用流程图来描述两个变量交换的算法.
( http: / / www.21cnjy.com )
思路分析:为了达到交换的目的,需要引
( http: / / www.21cnjy.com )入一个中间变量P,通过P使两个变量交换,即先将变量x的值赋给P,再将变量y的值赋给x,最后将t的值赋给变量y.用顺序结构的流程图就能表达其算法.
解:流程图如右图所示.
思维启示:当你看流程
( http: / / www.21cnjy.com )图时可能有些糊涂,但是只要你想着x、y、P是变化着的量,开始有初始值,当我们赋给它们值以后,新的值就把以前的值替代了,我们不妨把三个变量看成存储数据的盒子,新的数据进去就把旧的数据赶走了.
【例5】
阅读如图所示的流程图,说出运行的结果.
思路分析:由流程图结构判断这是一顺序结构,其运行自上而下进行.
解:S1:先把1赋给x;
S2:把3赋给y;
S3:把y+1赋给x,即将3+1赋?给x;
∴x现在的值是4,它将x原来的值x=1覆盖了.
S4:把x+1赋给y,即4+1赋给y,
∴y现在的值是5,它将y原来值y=3覆盖了.
∴x=4,y=5.
拓展迁移
【拓展点1】
设计一个算法,求点P0(x0,y0)到直线l:Ax+By+C=0的距离d,并画出流程图.
思路分析:首先将求解过程用自然语言描述出来,然后根据描述的步骤写出算法并画出流程图.
解:算法:S1:输入点的坐标和直线方程的系数;
?S2:计算z1=Ax0+By0+C;
?S3:计算z2=A2+B2;
?S4:计算d=;
?S5:输出d.
由以上算法可知该算法是顺序结构,用流程图表示该题的算法如下图所示.
【拓展点2】
设计一个算法求平面内两点A(a,b)、B(c,d)之间的距离并画出流程图.
解:算法:S1:输入a、b、c、d;
?S2:计算:AB=;
?S3:输出AB.
流程图如下图所示:
思维启示:上面两个题中,
( http: / / www.21cnjy.com )都引入了中间变量,例如例6中把Ax0+By0+C和A2+B2的值分别赋予z1,z2,一个可以起到简化流程图的作用,另外还起到过渡的作用.2.1.3 分层抽样
案例探究
某个公司的员工有300人,其中不到35岁的有95人,35岁至49岁的有135人,50岁以上的有70人,为了了解这个公司员工与身体状况有关的某项指标,要从中抽取60名员工作为样本,员工年龄与这项指标有关,应该怎样抽取?
分析:为了使抽出的60名员工更充分地反映公司员工的整体情况,在各个年龄段可按这部分员工人数与员工总数的比进行抽样.
因为抽取人数与员工总数的比为60∶300=1∶5,
所以在各年龄段抽取的员工人数依次是,,,即19,27,14.
在各个年龄段分别抽取时,可采用前面介绍的简单随机抽样的方法,将各年龄段抽取的职工合在一起,就是所要抽取的60名员工.
像这样,当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成互不交叉的几部分,然后按照各部分在总体中所占的比例,从各部分中独立的抽取一定数量的个体,将各部分取出的个体合在一起作为样本,这种抽样方法叫做分层抽样,其中所分成的各部分叫做层.
可以看到,由于各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,分层抽样时,每一个个体被抽到的概率都是相等的.
由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着广泛的应用.
自学导引
1.当总体由差异明显的几部分组成时,通常采用分层抽样方法抽取样本.
2.某农场在三块地种有小麦,其中平地种有120
亩,河沟地种有30亩,坡地种有90亩,估产时,可按照4∶1∶3的比例从各块地中抽取样本.
3.某学校有教师180人,后勤服务人员40人,行政管理人员20人,要从中抽选24人参加学区召开的职工代表大会,为了使所抽的人员更具有代表性,分别应从上述人员中抽选教师18人,后勤服务人员4人,行政管理人员2人.
4.为了解初一学生的身体发育情况,打算在初一年级10个班的某两个班按男女生比例抽取样本,正确的抽样方法是( )
A.随机抽样
B.分层抽样
C.先用抽签法,再用分层抽样
D.先用分层抽样,再用随机数表法
答案:C
5.在简单随机抽样、系统抽样和分层抽样中,每个个体被抽到的可能性都相同的方法有( )
A.1种
B.2种
C.3种
D.0种
答案:C
疑难剖析
1.采用分层抽样方法抽取样本的步骤:
(1)分层;
(2)按比例确定每层抽取个体的个数;
(3)各层抽样(方法可以不同);
(4)汇合成样本.
2.采用分层抽样方法抽取样本的注意点:
(1)分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可以按各层个体数在总体上所占比例抽取,分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,只要分层恰当,一般说来抽样结果就比简单随机抽样更能反映总体情况.
(2)将总体分成几层,分层抽取时采用简单随机抽样和系统抽样.
【例1】
某校高中部有学生950人,其中高一年级学生350人,高二年级学生400人,其余为高三年级学生,若采用分层抽样从高中部所有学生抽取一个容量为190的样本,则每个年级应抽取多少人?
思路分析:考查分层抽样的抽取规则:按照各部分所占的比进行抽取.
总体个数N=950,样本容量n=190,n∶N=1∶5,各年级按照此比例即可得到应抽取的人数.
解:由题意知:高一、高二、高三年级学生数分别为350人,400人和200人.由于总体个数N=950,样本容量n=190,n∶N=1∶5,所以,高一年级应抽取的学生数为:350×=70;高二年级应抽取的学生数为:400×=80;高三年级应抽取的学生数为:200×=40.
答:高一、高二、高三年级应抽取的学生数分别为70人,80人和40人.
思维启示:当总体由差异明显的几部分组成时,采用分层抽样.抽取时要按照各部分所占的比进行抽取.各层抽样时可采用简单随机抽样或系统抽样.?
【例2】
某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12
000人,其中持各种态度的人数如下表所示:
很喜爱
喜爱
一般
不喜爱
2
435
4
567
3
926
1
072
电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中各应抽选出多少人?
思路分析:总体个数N=12
000,样本容量n=60,
n∶N=1∶200,各种态度的人按照这个比例即可得到应抽取的人数.
解:由题意知:很喜欢、喜欢、一般、不喜欢的人数分别为2
435人,4
567人,3
926人和1
072人.由于总体个数N=12
000,样本容量n=60,n∶N=1∶200,所以,应抽取很喜欢的人数为:2
435×≈12;应抽取喜欢的人数为:4
567×≈23;应抽取很一般的人数为:3
926×≈20;应抽取不喜欢的人数为:1
072×≈5.
答:应抽取很喜欢、喜欢、一般和不喜欢的人数分别为12人,23人,20人和5人.
思维启示:分层抽样的两个步骤:①先求出样本容量与总体的个数的比值;②按比例分配各层所要抽取的个体数.但应注意有时计算出的个体数可能是一个近似数,这并不影响样本的容量.
【例3】
一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法从这批产品中抽取容量为20的样本.
思路分析:系统抽样方法:将200件产品随机的分成20组,每组10个产品,每组用抽签的方法从中抽取一个产品,这样就得到了一个容量为20的样本.
分层抽样法:总体个数N=200,样本容量n=20,
n∶N=1∶10,各个级别的产品按照这个比例即可得到应抽取的产品数.
解:系统抽样方法:首先将这200件产品001,002,003,…,200进行编号,然后按号码顺序以一定的间隔进行抽取,由于200∶20
=10,这个间隔可以定为10,即从号码为001~010的第一个间隔中随机的抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到6,16,26,36,46,56,66,76,86,96,106,116,126,136,146,156,166,176,186,196,这样就得到了一个容量为20的样本.
分层抽样:由题意知:一级品,二级品,三级品分别有100个、60个、40个,由于总体个数N=200,样本容量n=20,n∶N=1∶10,所以,需要从一级产品中抽取100×=10;需要从二级产品中抽取60×=6;需要从三级产品中抽取40×=4;将一级品的100个产品按00,01,02,…,99编号,将二级品的60个产品按00,01,02,…,59编号,将三级品的40个产品按00,01,02,…,39编号,采用随机数表法,分别从中抽取10个、6个、4个,这样就得到了一个容量为20的样本.
思维启示:两种抽样方法都各有自己的优点,而分层抽样对本题来说更能体现实际情况.
拓展迁移
【拓展点1】某车运公司有货车1
201辆,客车
800辆,从中抽取1/10调查车辆的使用和保养情况,请给出抽样过程.
解析:第一步:明确货车和客车各应抽取多少辆,货车应抽取1
201×1/10≈120,客车应抽取800×1/10=80.第二步:用随机数表法剔除一辆货车.第三步:用系统抽样方法分别抽取货车120辆、客车80辆.这些货车和客车便组成了所要抽取的样本.
【拓展点2】
某单位有45名女职工,30名男职工,现调查平均工作量,准备抽取1/15,已知男女职工工作量有明显不同,应如何抽样?
解析:第一步:明确男女职工各应抽取多少名,男职工应抽取30×1/15=2,女职工应抽取45×1/15=3.第二步:抽取2名男职工和3名女职工,因为男职工30人抽出2人,女职工45人抽出3人,所以可用抽签法分别抽出2名男职工,3名女职工.这样便得到所要抽的样本.
思维启示:分层后,各层的个体数不大,所要抽的个体数也不多,可采用抽签法.
PAGE
13.4 互斥事件及其发生的概率
案例探究
有3个1
g砝码,3个3
g砝码和2个5g砝码,任意取出2个砝码,想一想,如何求下面三个事件的概率?
(1)两个砝码重量相同的概率;
(2)两个砝码总重为6g的概率;
(3)两个砝码总重量不超过8g的概率.
解析:(1)记“两个砝码重量相同”的事件为A.
“两个砝码重量都是1g”的事件为A1.
“两个砝码重量都是3g”为事件A2,“两个砝码重量都是5g”为事件A3,A1、A2、A3是互斥的.
显然A=A1+A2+A3,由前面知识得P(A1)=,P(A2)=,P(A3)=.(为什么)
由互斥事件的加法公式,有P(A)=P(A1)+P(A2)+P(A3)=++=.
(2)记“两个砝码总重量为6g”为事件B.
“两个砝码中一个砝码为1g,另一个砝码为5
g”为事件B1,“两个砝码重量都为3g”为事件B2,B1,B2互斥.
显然B=B1+B2.
P(B1)==,P(B2)=.(为什么)
∴P(B)=P(B1)+P(B2)=+=.
(3)正面去求比较复杂,故可考虑其对立事件.
设“两个砝码总重量大于8
g”的事件为C.“两个砝码总重量不超过8g”的事件为D,则C与D为对立事件.两个砝码总重量超过8g,其中只包括两个砝码都是5g的情况,于是P(C)=.
∴P(D)=1-P(C)=1-=.
自学导引
1.不能同时发生的两个事件称为互斥事件(exclusive
events).
2.如果事件A,B互斥,那么事件A+B发生的概率,等于事件A,B分别发生的概率的和,即P(A+B)=P(A)+P(B).
一般地,如果事件A1,A2,…,An两两互斥,则P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An).
3.两个互斥事件必有一个发生,则称这两个事件为对立事件(complementary
events).事件A的对立事件记为A.
4.对立事件A与A必有一个发生,故A+A是必然事件,从而P(A)+P()=P(A+)=1.
由此,我们可以得到一个重要公式:
P()=1-P(A).
5.体育考试的成绩分为四个等级:优、良、中、不及格,某班50名学生参加了体育考试,结果如下:
优
85分及以上
9人
良
75~84分
15人
中
60~74分
21人
不及格
60分以下
5人
(1)体育考试的成绩的等级为优、良、中、不及格的事件分别记为A,B,C,D.则A,B,C,D之间的关系为彼此互斥.
(2)若将“体育成绩及格”记为事件E,则E与D为对立事件.
6.互斥事件和对立事件是针对两个事件而言的,它们有区别又有联系.在一次试验中,两个互斥的事件有可能都不发生,也可能有一个发生;而两个对立的事件则必有一个发生,但不可能同时发生.所以,两个事件互斥,它们未必对立;反之,两个事件对立,它们一定互斥.
疑难剖析
【例1】
判断下列每对事件是否为互斥事件、对立事件,并说明道理.
从扑克牌40张(红桃、黑桃、方块、梅花点数从1~10各10张)中,任取一张.
(1)“抽出红桃”与“抽出黑桃”;
(2)“抽出红色牌”与“抽出黑色牌”;
(3)“抽出的牌点数为5的倍数”与“抽出的牌点数大于9”.
思路分析:判别两个事件是否互斥,就要考察它们是否不能同时发生;判别两个互斥事件是否对立,再要考察它们是否必有一个发生.
解:(1)是互斥事件,不是对立事件.
道理是:从40张扑克牌中任意抽取1张,“抽出红桃”和“抽出黑桃”是不可能同时发生的,所以是互斥事件.同时,不能保证其中必有一个发生.这是由于还可能抽出“方块”或者“梅花”.因此,二者不是对立事件.
(2)既是互斥事件,又是对立事件.
道理是:从40张扑克牌中,任意抽取1张,“抽出红色牌”与“抽出黑色牌”,两个事件不可能同时发生,并且其中必有一个发生,所以它们既是互斥事件,又是对立事件.
(3)不是互斥事件,当然不可能是对立事件.
道理是:从40张扑克牌中任意抽取1张,“抽出的牌点数为5的倍数”与“抽出的牌点数大于9”这两个事件可能同时发生,如抽得10.因此,二者不是互斥事件,当然不可能是对立事件.
思维启示:“互斥事件”是“对立事件”是就两个事件而言的,互斥事件是不可同时发生的两个事件,而对立事件是其中必有一个发生的互斥事件.因此,对立事件必须是互斥事件,但互斥事件不一定是对立事件.也就是说,“互斥事件”是“对立事件”的必要但不充分的条件.“对立事件”是“互斥事件”的充分不必要条件.
变式训练:某小组有3名男生和2名女生,从中任选2名同学参加演讲比赛.判断下列每对事件是不是互斥事件,如果是,再判别它们是不是对立事件.
(1)恰有1名男生与2名都是男生;
(2)至少有1名男生与全是男生;
(3)至少有1名男生与全是女生;
(4)至少有1名男生与至少有1名女生.
解:(1)因为“恰有1名男生”与“2名都是男生”不可能同时发生,所以它们是互斥事件;当选出的是2名女生时它们都不发生,所以它们不是对立事件.
(2)因为选出的是2名男生时“至少有1名男生”与“全是男生”同时发生,所以它们不是互斥事件.
(3)因为“至少有1名男生”与“全是女生”不可能同时发生,所以它们互斥;由于它们必有一个发生,所以它们对立.
(4)由于选出的是1名男生1名女生时,“至少有1名男生”与“至少有1名女生”同时发生,所以它们不是互斥事件.
【例2】
射手张强在一次射击中射中10环、9环、8环、7环、7环以下的概率分别为0.24,0.28,0.19,0.16,0.13,计算这个射手在一次射击中:
(1)射中10环或9环的概率;
(2)至少射中7环的概率;
(3)射中环数不足8环的概率.
思路分析:“射中10环”“射中9环”…“射中7环以下”是彼此互斥事件,可运用“事件的并(和)”的概率公式求解.
解:设“射中10环”“射中9环”“射中8环”“射中7环”“射中7环以下”的事件分别为A、B、C、D、E,则A、B、C、D、E是彼此互斥事件.
(1)射中10环或9环的概率为P(A+B)=P(A)+P(B)=0.24+0.28=0.52.
(2)至少射中7环包括射中10环或9环或8环或7环,于是至少射中7环的概率为P(A+B+C+D)=P(A)+P(B)+P(C)+P(D)=0.24+0.28+0.19+0.16=0.87.
(3)射中环数不足8环包括射中7环或射中7环以下,于是射中环数不足8环的概率为P(D+E)=P(D)+P(E)=0.16+0.13=0.29.
思维陷阱:抛掷一枚质地均匀的骰子,向上的一面出现1点,2点,3点,4点,5点,6点的概率都是,记事件A为“出现奇数”,事件B为“向上的数不超过3”,求P(A+B).
错解:记事件“出现1点”“出现2点”“出现3点”“出现5点”分别为A1,A2,A3,A5则
P(A)=P(A1)+P(A3)+P(A5)=++=,
P(B)=P(A1)+P(A2)+P(A3)=++=,
∴P(A+B)=P(A)+P(B)=+=1.
错因分析:上述解法错误的原因是:A、B两事件不是互斥事件,错误地运用了互斥事件的概率公式.
正解:记事件“出现1点”“出现2点”“出现3点”“出现5点”分别为A1,A2,A3,A5,这四个事件彼此互斥.故
P(A+B)=P(A1)+P(A2)+P(A3)+P(A5)=+++=.
思维启示:公式P(A+B)=P(A)+P(B)只有在A、B互斥时才可使用,A、B两事件不互斥就不能使用这一公式.同学们在应用这一公式求解时,首先要判断准确是否是互斥事件,然后再应用公式,要避免盲目地、机械地应用公式.
【例3】
一枚硬币连掷3次,求出现正面的概率.
解法1:设A表示“掷3次硬币出现正面”,Ω表示“连续掷3次硬币”,则Ω={(正,反,反),(反,正,反),(反,反,正),(正,正,反),(正,反,正),(反,正,正),(正,正,正),(反,反,反)}
Ω有8个基本事件组成,而且可以认为这些基本事件的出现是等可能的,且
A={(正,反,反),(反,正,反),(反,反,正),(正,正,反),(正,反,正),(反,正,正),(正,正,正)}
事件A有7个基本事件组成,
因而P(A)=.
解法2:设A1表示“掷3次硬币有一次出现正面”,A2表示“掷3次硬币有两次出现正面”,A3表示“掷3次硬币有三次出现正面”,A表示“掷了3次硬币出现正面”.显然A=A1+A2+A3,同解法一容易得出P(A1)=,P(A2)=,P(A3)=,
又因为A1、A2、A3彼此是互斥的,所以:?
P(A)=P(A1+A2+A3)=P(A1)+P(A2)+P(A3)=++=.
解法3:在本例中,显然A表示“掷3次硬币,三次均出现反面”的事件,且P()=,根据P(A)+P()=1.
∴P(A)=1-P()=1-=.
思维启示:(1)会用列举法计算一些随机事件所含的基本事件数.
(2)求某些较为复杂的事件的概率时,通常有两种方法:一是将所求事件的概率化成一些彼此互斥的事件的概率的和;二是先求此事件的对立事件的概率,再利用公式P(A)=1-P(A)计算.
变式训练:口袋中有若干红球、黄球与蓝球,从口袋中任意摸一球,摸出红球的概率为0.45,摸出黄球的概率为0.33,求:
(1)摸出红球或黄球的概率;
(2)摸出蓝球的概率.
解:记事件A为“摸出红球”,B为“摸出黄球”,C为“摸出蓝球”.
(1)A与B是互斥事件,故摸出红球或黄球的概率为P(A+B)=P(A)+P(B)=0.45+0.33=0.78.
(2)事件C与A+B是对立事件,故摸出蓝球的概率是P(C)=1-P(A+B)=1-0.78=0.22.
【例4】
如右图所示,设有一个正方形网格,其中每个最小正方形的边长都等于6cm.现用直径等于2cm的硬币投掷到此网格上.求硬币落下后与格线有公共点的概率.
解析:记A={硬币落下后与格线有公共点},B={硬币落下后与格线没有公共点},则事件A与B是对立事件.为了确定硬币的位置,由硬币中心O向正方形网格四边引垂线OM、ON、OP、OQ,垂足为M、N、P、Q.事件B发生的充要条件是|OM|、|ON|、|OP|、|OQ|都大于2cm,即O在与正方形网格同中心的以4cm为边长的小正方形内.所以由几何概率公式得P(B)=.因为A、B是对立事件,所以P(A)=1-P(B)=1-.
答:硬币落下后与格线有公共点的概率是.
思维启示:解决此题的关键是转化为对立事件的概率,寻找与事件B对应的区域是解答此题的难点.
【例5】
在一只袋子中装有4个红玻璃球、3个绿玻璃球,从中无放回地任意抽取两次,每次只取一个,试求:
(1)取得两个红球的概率;
(2)取得两个绿球的概率;
(3)取得两个同颜色的球的概率;
(4)至少取得一个红球的概率.
解析:记四个红玻璃球为a1、a2、a3、a4,三个绿玻璃球为b1、b2、b3,第一次抽取有7种结果,对第一次抽取时的每种结果,第二次抽取时又有6种结果,故共有7×6=42种结果.
(1)记“取得两个红球”为事件A1,A1有(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4),(a2,a1),(a3,a1),(a4,a1),(a3,a2),(a4,a2),(a4,a3)12种结果.
∴P(A1)==.
(2)记“取得两个绿球”为事件A2,A2有(b1,b2),(b1,b3),(b2,b3),(b2,b1),(b3,b1),(b3,b2)6种结果.
∴P(A2)==.
(3)记“取得两个同颜色的球”为事件A.
A=A1+A2,A1、A2互斥.
由互斥事件的概率加法公式得P(A)=P(A1)+P(A2)=
+=.
(4)记“至少取得一个红球的概率”为事件B,显然事件B是事件A2的对立事件.
∴P(B)=1-P(A2)=1-=.
思维启示:袋中摸球问题是概率中的重要题型,课本中举了一些例子,主要考查概念,作定性分析.本题把本节所学知识与前几节知识结合起来就一些随机事件作了定量分析,目的是加强知识的综合应用.通过枚举法或画树形图找出随机事件的结果的个数,利用等可能性事件求出概率,或通过互斥事件的概率公式,达到巩固概念的目的.在求解时,要注意灵活使用公式,若直接求较困难或情况较多,则可通过求其对立事件的概率来求.?
拓展迁移
【拓展点1】
用0,1两个数字编码,码长为4(均为二进制四位数,首位可以是0),从所有码中任选一码,求事件“码中至少有两个1”的概率.
解法1:事件“码中至少有两个1”记为A,用x1,x2,x3,x4分别表示码的第一、二、三、四位上的数字,它们在0,1中取值,于是令
A={x1+x2+x3+x4≥2}
A1={x1+x2+x3+x4=2}
A2={x1+x2+x3+x4=3}
A3={x1+x2+x3+x4=4}
容易得出四位数的全部码有24=16个,故Ω中元素个数为16.
A1中的元素具有特征是四位数中有两个1,两个0,具体为:1100,1010,1001,0011,0101,0110.因而A1中包含6个元素.
A2中的元素特征是四位数中有三个1,一个0,具体为:
1101,1110,1011,0111,因而A2中会有4个元素.A3中的元素特征是四位数中有四个1.具体为1111.因而A3中含有1个元素,由于A1、A2、A3互斥,A=A1+A2+A3.
∴P(A)=P(A1)+P(A2)+P(A3)=
解法2:本解法比解法一更为简便.
=“最多有一个1”={x1+x2+x3+x4≤1}.
A中元素特征为四位数中四个数均为0或一个1,三个0,具体为:0000,1000,0100,0010,0001,因而中含有5个元素.
∴P(A)=,
∴P(A)=1-P(A)=1-=.
【拓展点2】
在数学考试中,小明的成绩在90分以上的概率是0.18,在80~89分的概率是0.51.在70~79分的概率是0.15,在60~69分的概率是0.09.计算小明在数学考试中取得80分以上成绩的概率和小明考试不及格(低于60分)的概率.
思路分析:成绩在80分以上是事件90分以上和80~89分的并,而及格是不及格的对立事件,利用概率的性质即可求之.
解:分别设小明的考试成绩在90分以上,在80~90分,在70~79分,在60~69分为事件B,C,D,E,这4个事件是彼此互斥的.
根据加法公式,小明的考试成绩在80分以上的概率是:
P(B+C)=P(B)+P(C)=0.18+0.51=0.69.
小明考试及格的概率,即成绩在60分以上的概率为:
P(B+C+D+E)=P(B)+P(C)+P(D)+P(E)=0.18+0.51+0.15+0.09=0.93.
而小明考试不及格与小明考试及格为对立事件.
所以小明考试不及格的概率为1-P(B+C+D+E)=1-0.93=0.07.
【拓展点3】
如果从不包括大小王的52张扑克牌中随机抽取一张,那么取到红心(事件A)的概率是.取到方块(事件B)的概率是,问:
(1)取到红色牌(事件C)的概率是多少?
(2)取到黑色牌(事件D)的概率是多少
思路分析:事件C是事件A与事件B的并,且A与B互斥,因此可用互斥事件的概率和公式求解.事件C与事件D为对立事件,因此P(D)=1-P(C).
解:(1)因为C=A+B,且A与B不会同时发生,所以A与B是互斥事件,根据概率加法公式得,P(C)=P(A)+P(B)=.
(2)C与D也是互斥事件,又由于C+D为必然事件,所以C与D为对立事件,所以,P(D)=1-P(C)=.
PAGE
12.3.2 方差与标准差
平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,某地区的统计报表显示,此地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么,它就既不能代表贫困户家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.
案例探究
甲、乙两班学生各50人,其语文平均成绩都是80分,但甲班最高成绩98分,最低42分,而乙班最高成绩86分,最低60分.初步看出,两班语文成绩是不一样的,甲班学生的语文成绩个别差异程度大、水平参差不齐;而乙班学生的语文成绩差异程度小,语文水平整齐度大些.
如果你是老师,你应当如何对这两个班的成绩作出评价呢?
分析:我们把一组数据的最大值与最小值的差称为极差,由数据可知甲班的极差较大,数据点较分散,乙班的极差较小,数据点分布较集中,这说明乙班成绩比甲班稳定,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.我们还可以考虑每一个学生的成绩与平均成绩的离差,离差越小,稳定性就越高.结合上节有关离差的讨论,可用每个同学的成绩与平均成绩的差的平方和表示.由于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差(variance).
因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差(standard
deviation).标准差也可以刻画数据的稳定程度.
一般地,设一组数据x1,x2,…,xn,其平均数为x,则称S2=为这个样本的方差,其算术平方根
S=(
)
为样本的标准差,分别简称样本方差、样本标准差.
根据上述方差计算公式可算出甲、乙两个班样本的方差,从而比较哪个班成绩好些.
计算标准差时,首先要计算数据的平均数,接着要计算各数据与平均数之间的离差平方,即(xi-)2,最后由公式(
)计算标准差S.
例如,4名儿童的身高分别是110厘米,100厘米,120厘米和150厘米,若求4名儿童身高数据的标准差时,其基本步骤如下:
(1)求平均数:==120(厘米)
(2)求离差平方和:
∑(xi-)2=(110―120)2+(100―120)2+(120―120)2+(150―120)2
=100+400+0+900=1
400(平方厘米)
(3)求标准差S:S===?18.71(厘米)
这样,我们大体可认为,这4名儿童身高差异程度,从平均角度来看,约相差18.71厘米.
自党导引
1.天气预报说今天最高气温7
℃,最低气温-2
℃,则今天气温的极差为多少?
答案:9℃?
2.据统计,某小区居民中年龄最大的为89岁,年纪最小的为1岁,那么小区人口年龄的极差为多少?
答案:88岁
3.你认为下面几种说法中正确的是( )
A.一组数据的平均值总是正数
B.一组数据的方差有可能是负数
C.用一组数据中的每个数分别减去平均值,再将得到的差相加,和一定为零
D.一组数据的标准差一定比方差小
答案:C
4.我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差.
5.方差实际上是一种表示一组数据的离散程度的量,我们可以用“先平均,再求差,然后平方,最后再平均”的方法得到.
6.标准差与方差有什么关系?这二者与原数据在单位上有什么关系?
答案:标准差是方差的算术平方根,标准差与原数据具有相同的单位,方差的单位是原单位的平方.
7.反映数据离散程度的指标是什么?在一次数学测试中,甲、乙两班的平均成绩相同,甲班成绩的方差为42,乙班成绩的方差为35,这样的结果说明两个班的数学学习状况各有什么特点?
答案:反映数据离散程度的指标是方差和标准差.甲班的方差大于乙班的方差,说明甲班的学生成绩较分散,优生和成绩差的学生较多.而乙班的学生成绩较集中,优生和成绩差的学生较少.
8.观察下面的折线图,回答问题:
(1)a组数据的极差较大.
(2)a组数据的方差较大.
9.比较下面两幅频数分布图中的数据,哪组的平均值较大?哪组的标准差较大?
答案:b组的平均值较大,a组的标准差较大.
10.观察下面的几组图,分别指出各组中哪一组的标准差较大,并说说为什么.
(1)
(2)
(3)
答案:(1)标准差相同,因为虽然数据排列不同,但其实是相同的两组数据;(2)b组的标准差较大,因为a组有一些数距离平均值较近;(3)b组的标准差较大,因为b组中每个数据都是a组中的两倍,因此标准差也是它的两倍.?
疑难剖析
【例1】
某校团委举办了英语口语竞赛.甲、乙两个团小组成绩如下:
甲组:76 90 84 86 81 87 86
乙组:82 84 85 89 80 94 76
(1)分别求出甲、乙两个团小组的平均分、标准差(精确到0.01);
(2)说明哪个团小组成绩比较稳定?
思路分析:由于所给数据较整,用定义公式求x及S.再由所学统计知识即可作此判断.
?解:(1)∵=84.29,
=84.29,
(2)∵S1思维启示:方差的概念是本单元的一个重点,也是本章的重点和难点,中考命题常常涉及到方差的概念比较抽象,理解有一定的困难,因此在复习时要多接触一些实例,以加深理解计算方差的公式.
【例2】
某校从甲、乙两名优秀选手中选1名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8次,测试成绩如下表:
甲成绩(秒)
乙成绩(秒)
1
12.1
12
2
12.2
12.4
3
13
12.8
4
12.5
13
5
13.1
12.2
6
12.5
12.8
7
12.4
12.3
8
12.2
12.5
根据测试成绩,请你运用所学过的统计知识作出判断,派哪一位选手参加比赛更好?为什么?
思路分析:首先计算甲、乙两选手的成绩的平均数,然后看每位同学成绩的方差
,利用方差比较两位同学成绩的稳定性.?
解:设甲的平均数是1,乙的平均数是2,甲的方差是S甲2,乙的方差是S乙2,则由题意可求得:
?1==12.5;
?2==12.5;
S甲2=[(12.1-12.5)2+(12.2-12.5)2+(13-12.5)2+(12.5-12.5)2+(13.1-12.5)2+(12.5-12.5)2+(12.4-12.5)2+(12.2-12.5)2]=0.12
S乙2=[(12-12.5)2+(12.4-12.5)2+(12.8-12.5)2+(13-12.5)2+(12.2-12.5)2+(12.8-12.5)2+(12.3-12.5)2+(12.5-12.5)2]=0.10.
∵S甲2>S乙2,∴虽然甲乙两人的平均成绩相同,但乙的成绩较稳定,应选乙选手参加比赛.
思维启示:在显示数据离散程度(波动大小)的一类数中,方差是刻画总体或样本波动大小的一个重要特征数据,其定义是用各偏差的平方的平均数建立起来的,对于一组数据,除需了解它们的平均水平外,还常常需要了解它们的波动大小(即偏离平均数的大小).对于两组可比的数据,平均数只能反映它们的集中趋势,而比较它们的波动大小,就要通过计算标准差或方差的大小来确定.还应注意,只有当两组数据的平均数相等或比较接近时,方差或标准差才能反映数据波动大小的实际情况——方差或标准差越大(小),波动也越大(小).
【例3】
为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须更换掉前的使用天数如下表:
天数
151~181
181~210
211~240
241~270
271~300
301~330
331~360
361~390
灯管数
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
思路分析:总体的平均数与标准差往往是很难求,甚至是不可能求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差,只要样本的代表性好,这种做法就是合理的.
解:(1)各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为+=267.9≈268(天).
(3)将组中值对于此平均数求方差:
=2
128.60(天2)
故标准差为≈46(天).?
答:估计这种日光灯的平均使用寿命约为268天,故可在222天到314天左右统一更换较合适.
思维启示:(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
(2)平均数和标准差是工业生产中检测产品
质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题.
在Excel中,可分别用函数“VARP(
)”和“STDEVP(
)”计算方差和标准差.也可用计算器,在“统计”模式下输入数据,按“SHIFT
SVAR
2”键,得标准差,再按x2键即为方差.
拓展迁移
【拓展点1】
标准差的取值范围是什么?标准差为0的样本数据有什么特点?
答案:非负,标准差为0意味着所有的样本数据都相等.
【拓展点2】
甲乙两人同时生产内径为25.4mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽取20件,量得其内径尺寸如下(单位mm):
甲
25.46 25.32 25.45 25.39 25.36
25.34
25.42 25.45 25.38 25.42 25.39 25.43
25.39 25.40 25.44
25.40
25.42 25.35
25.41 25.39
乙
25.40 25.43 25.44 25.48 25.48 25.47
25.49 25.49 25.36 25.34 25.33 25.43
25.43 25.32 25.47
25.31 25.32 25.32
25.32 25.48
从生产的零件内径的尺寸看,谁生产的质量较高?
思考:两个总体的平均数与标准差知不知道?25.40
mm是不是它们的平均数?
答案:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40
mm的差异大时质量低,差异小时质量高,当总体的平均数与标准尺寸很接近时,总体的标准差小时质量高,标准差大时质量低.这样,比较两人的生产质量,只要比较他们所生产的零件尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.
∵甲=25.400
5,
乙=25.405
5,
S甲≈0.037,S乙≈0.068,∴S甲因此,甲生产的质量较高.
PAGE
12.3.1 平均数及其估计
案例探究
为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg)
56.5
69.5
65
61.5
64.5
66.5
64
64.5
76
58.5
72
73.5
56
67
70
57.5
65.5
68
71
75
62
68.5
62.5
66
59.5
63.5
64.5
67.5
73
68
55
72
66.5
74
63
60
55.5
70
64.5
58
64
70.5
57
62.5
65
69
71.5
73
62
58
76
71
66
63.5
56
59.5
63.5
65
70
74.5
68.5
64
55.5
72.5
66.5
68
76
57.5
60
71.5
57
69.5
74
64.5
59
61.5
67
68
63.5
58
59
65.5
62.5
69.5
72
64.5
75.5
68.5
64
62
65.5
58.5
67.5
70.5
65
66
66.5
70
63
59.5
根据上述数据我们可以画出样本的频率分布直方图,并对相应的总体分布作出估计.
由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如从这些样本数据的频率分布直方图可以看出,体重在(64.5,66.5)kg的学生比体重为其他值的学生数多,但他并没有告诉我们多多少.
试问:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
能否用一个数值来描写样本数据的离散程度?
初中我们曾经学过众数、中位数、平均数等各种数字特征.应当说,这些数字都能够为我们提供关于样本数据的特征信息.
我们常用算术平均数(其中ai(i=1,2,…,n)为n个实验数据)作为体重的最理想的近似值,它的依据是什么呢?
处理实验数据的原则是使这个近似值与实验数据之间的离差最小,设这个近似值为x,那么它与n个实验值ai(i=1,2,…,n)的离差分别为?x-a1,x-a2,x-a3,…,x-an.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究|x-a1|+|x-a2|+…+|x-an|取最小值时x的值.但由于含有绝对值,运算不太方便,所以,考虑离差的平方和,即
(x-a1)2+(x-a2)2+…+(x-an)2,
当此和最小时,对应的x的值作为近似值.因为
(x-a1)2+(x-a2)2+…+(x-an)2=nx2-2(a1+a2+…+an)x+a12+a22+…+an2,
所以当x=时离差的平方和最小,故可用作为表示体重的理想近似值,称其为这n个数据a1,a2,…,an的平均数(average)或均值(mean),一般记为=.
这样,我们可以用计算器求得,该地区内100名年龄为17.5~18岁的男生的体重的最佳近似值为x=65.5(kg).
这样我们就得到了样本平均数的求解方法:
样本数据的算术平均数,即=.
Excel中函数“AVERAGE(
)”可直接用于计算给定数据的平均数.如求12,12.4,12.8,13,12.2,12.8,12.3,12.5,12.5的平均数,可直接把它们输到工作表中A1∶J1区域后,在某空白单元格中输入“=AVERAGE(A1∶H1)”即可,即得它们的平均数为12.5(如下图).
自学导引
1.在频率分布直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中累积频率为0.5时所对应的样本数据值,平均数是指样本数据的算术平均数.?
2.下列数字特征一定是数据组中数据的是( )
A.众数 B.中位数
C.标准差
D.平均数
答案:A
3.数据:1,1,3,3的众数和中位数分别是( )
A.1或3,2
B.3,2
C.1或3,1或3
D.3,3
答案:A
4.频率分布直方图的重心是( )
A.众数
B.中位数
C.标准差
D.平均数
答案:D
疑难剖析
【例1】
某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下:(总分:150)
甲班:112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120
98 95 119
108 100 96 115 111 104 95 108 111 105
104 107 119 107 93
102 98 112 112 99
92 102 93 84 94
94 100 90 84 114
乙班:116 95 109 96 106 98 108 99 110 103
94 98 105 101 115 104 112 101 113 96
108 100 110 98 107
87 108 106 103 97
107 106 111 121
97 107 114 122 101 107
107 111 114
106 104 104 95 111 111 110
试确定这次考试中,哪个班的语文成绩更好些.
思路分析:我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可.
解析:用科学计算器或计算机分别求得甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.
【例2】
某教师出了一份共3道题的测试卷,每题1分,全班得3分、2分、1分和0分的学生所占比例分别为0.3、0.5、0.1和0.1.
(1)若全班共10人,则平均分是多少?
(2)若全班共20人,则平均分是多少?
(3)若该班人数未知,能求出该班的平均分吗?
思路分析:上述所占比例就是各数据的频率.
解:由题意,
平均分=3×0.3+2×0.5+1×0.1=2.
答:全班的平均分为2分.
思维启示:各数据频率确定时,平均数不受样本容量的影响.
【例3】
某工厂人员及工资构成如下表:
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资
2
200
250
220
200
100
人数
1
6
5
10
1
23
合计
2
200
1
500
1
100
2
000
100
6
900
(1)指出这个问题中周工资的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?
思路分析:根据众数、中位数、平均数各自的特点,选择合适的数据反映该厂的工资水平.
解析:由表格可知:众数=200,
∵23的中间位置众数是12,
∴中位数=220.
平均数=(2
200+1
500+1
100+2
000+100)÷23=300.
虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
思维启示:平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更能反映客观情况.
拓展迁移
【拓展点1】
以往的招生统计数据显示,某大学录取的新生高考总分的中位数基本上稳定在550分.你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择.
提示:应该查阅一下这所大学的其他招生信息,例如平均信息、最低录取分数线信息等,尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易作出判断;在已知平均数的情况下,如果平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来作出判断.
【拓展点2】
在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”,“去年,在50名员工中,最高年收入达到了100万,他们年收入的平均数是3.5万”.如果你希望获得年薪2.5万元,
(1)你是否能够判断自己可以成为此公司的一名高收入者?
(2)如果招聘员继续告诉你,“员工收入的变化范围是从0.5万到100万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?
(3)如果招聘员继续给你提供了如下信息,员工收入的中间0.5(即去掉最少的0.25和最多的0.25后所剩下的)的变化范围是1万到3万,你又该如何使用这条信息来作出是否受聘的决定?
(4)你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多?
答案:(1)不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数.现在已经知道至少有一个人的收入为x50=100万元,那么其他员工的收入之和为=3.5×50-100=75(万元),每人平均只有1.53万元.如果再有几个收入特别高者,那么初进公司的员工的工资会更低.
(2)公司的员工的收入将会很低.
(3)可以确定有0.75的员工工资在1万元以上,其中0.25的员工工资在3万元以上.
(4)收入的中位数大约是2万元.因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.
PAGE
12.2.3 茎叶图
案例探究
某赛季甲、乙两名运动员每场得分的原始记录如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试利用茎叶图分析一下甲、乙两名运动员谁发挥的比较稳定?
思路分析:本题如果用频率分布表或频率分布直方图来估计,就很难达到预期的效果,因此我们就选择统计中的另一种表示数据的图——茎叶图来表示.用茎叶图表示,顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.用中间的数字来表示得分的十位数,旁边的数字分别表示两个人得分的个位数.?
解:由作茎叶图的方法,得到如下图所示的茎叶图:
甲
乙
86
4
38
6
3
1
012345
2
54
51
1
6
6
7
94
90
探究:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但当数据较多时,茎叶图就显的不太方便了.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长了.特别是当数据是3位数时也不够方便.另外还可以看出茎叶图既可以分析单组数据,也可以对两组数据进行比较.
结论:从上图可以看出,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.比如,乙运动员的得分基本上是对称的,集中程度高(在30多分),中位数是36;甲运动员的得分除一个特殊得分(51)外,也大致对称,中位数是26.由此可以清楚的看出,乙运动员的发挥比较稳定,总体得分比甲好.
自学导引
1.什么叫做茎叶图?
2.作茎叶图的方法是什么?
疑难剖析
【例1】
在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,
19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子所含的字的个数如下:
27,39,33,24,19,32,41,33,27,35,12,
36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你能得到什么结论?
思路分析:本题考察学生的应用茎叶图分析数据的能力,可根据画茎叶图的一般步骤来进行:以十位数为茎,个位数为叶.
解:(1)由题意以十位数为茎,个位数为叶作如下图所示茎叶图
电脑杂志
报纸文章
9
8
7
7
5
5
4
1
08
7
7
7
6
5
4
4
3
2
06
1
1234
2
3
8
92
2
3
4
7
7
72
2
3
3
5
6
91
1
6
(2)由以上茎叶图和数据可以看出,电脑杂志上每个句子的字数集中在10
~
30之间,中位数为22.5;而报纸上每个句子的字数集中在20
~
40之间,中位数为27.还可以看出电脑杂志上每个句子的平均字数比报纸文章每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明.
拓展迁移
【拓展点1】某中学高二(2)班A、B两名同学自高中以来每场数学考试成绩情况如下:
A的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
B的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两个人数学成绩茎叶图,请根据茎叶图对两人的成绩进行分析比较.
思路分析:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学成绩的个位数.
解:A、B两人数学成绩的茎叶图如下图:
A
B
56
5
19
8
6
15
4
170
67891011
93
6
83
8
8
91
34
容易看出A的中位数为88,B的中位数为98,B的成绩较好.
【拓展点2】下面是某班学生的父母的年龄的茎叶图,试比较这些同学的父母的平均年龄.
父亲年龄
母亲年龄
8
85
4
3
2
1
1
08
7
7
5
4
2
11
3456
5
6
8
9
90
2
3
3
4
4
4
6
7
8
9
91
2
2
3
5
76
思路分析:根据茎叶图上的原始数据可以分析数字特征,对两组数据加以比较,从而作出大致估计.
解析:由茎叶图可知父亲年龄的分布主要集中在40~
60之间,平均年龄大约在48左右;而母亲的年龄分布大致对称,平均年龄大约在45岁左右.可见父亲的平均年龄比母亲的要大.
PAGE
11.2.2 选择结构
案例探究
在某些省份,对2007届高中毕
( http: / / www.21cnjy.com )业生实行学分制管理,要将每学期的期中、期末各科成绩统计备案,若每科成绩满分是100分,要求是这样的:低于60分的记录为“不及格”,60~70分(含60分)的记录为“及格”;70~80分(含70分)的记录为“良好”;80分以上(包括80分)记录为“优秀”.请你帮助设计一个流程图来表示上述算法.
解析:流程图如图所示:
由上面的流程图可
( http: / / www.21cnjy.com )以看出,输入成绩G后我们首先进行了判断:G是否大于等于60?并根据条件的判断决定下一步要执行哪一方案.这样用顺序结构是无法描述的,需要另一种结构来处理这类问题,因此像这种先根据条件判断,然后再决定执行哪一种操作的结构就是我们要学习的选择结构.
自学导引
1.选择结构是指:在算法中通过对条件的判断、根据条件是否成立而选择不同流向的算法结构.
2.在许多算法中,需要对问题的条件作出逻辑判断,判断后依据条件是否成立而进行不同的处理方式,这就需要用选择结构来实现.
3.选择结构的特点是什么?
答:(1)条件结构的语句与语句、框与框之间必须有一个环节是根据条件进行的判断的操作;
(2)它的基本形式如图所示,它包含一个判断框(框内含判断条件),当条件成立时执行A,否则执行B或不执行任何操作.
4.试举出一含有选择结构的算法,并用流程图表示算法.
解:例如求一个数的绝对值.
算法:S1:输入实数x;
S2:若x≥0,则输出x;否则输出-x;
S3:结束算法.
流程图如图所示:
疑难剖析
在一个算法中含有一个条件判断,而根据条件是否成立有不同的处理过程时,需采用选择结构来处理.
【例1】
任意给定3个正实数,设计一个算法,判断分别以这3个数为三边边长的三角形是否存在.画出这个算法的流程图.
思路分析:判断分别以这3个数为三边边长的三角形是否存在,只需要验证这3个数当中任意两个数的和是否大于第3个数.
解:算法如下:
S1:输入a,b,c;
S2:若a+b>c,a+c>b,b+c>a同时成立,则存在这样的三角形;否则不存在这样的三角形;
S3:算法结束.
流程图如图所示:
思维启示:一般含有条件判断的问题需要利用选择结构来设计算法.
【例2】
在国内寄平信,每封信的重量x(克)不超过60克时的邮费(单位:分)标准为y=试画出计算邮费的流程图.
思路分析:由于邮费根据信的
( http: / / www.21cnjy.com )重量分为三种情况,故需要用到选择结构设计算法,并且经过一次条件的判断后,如当x>20时,还应继续进行第二次判断,才能依据相应x值确定相应的邮费.
解:流程图如图所示:
思维启示:(1)解决分段函数的求值等问题时,一般可采用选择结构来设计算法.?
(2)本题中含有两个判断结构,当题目中出现多个判断时,要分清判断的先后次序,逐层判断设计流程图.
【例3】
画出用公式法解二元一次方程组的算法的流程图.
思路分析:求解方
( http: / / www.21cnjy.com )程组时,关键看a11a22-a12a21是否为零,若a11a22-a12a21=0,则方程组有无穷多组解或无解;若a11a22-a12a21≠0,则方程组有唯一解,可用选择结构设计流程图.
解:流程图如图所示:
思维启示:(1)该题中方程
( http: / / www.21cnjy.com )组的解的情况取决于方程(a11a22-a21a12)x1=b1a22-b2a12中x1的系数是否为0,需要时x1的系数a11a22-a21a12是否为零进行分类讨论,可见,数学中有关分类讨论的问题可采用选择结构来设计流程图.
(2)本题中将a11a22-a12a21赋予D,目的是为简化后面框图中书写的过程.
【例4】
有3个数a、b、c,要求按由大到小的顺序输出,试写出算法,并画出流程图.
思路分析:为了节约变量,把它们重新排列后,仍用a、b、c表示,并使a≥b≥c,具体操作步骤如下.
解:第一步:输入3个整数a、b、c;
第二步:将a与b比较,并把小者赋给b,大者赋给a;
第三步:将a与c比较,并把小者赋给c,大者赋给a,此时a已是三者中最大的;
第四步:将b与c比较,并把小者赋给c,大者赋给b,此时a、b、c已按从大到小的顺序排列好;
第五步:按顺序输出a、b、C.
流程图如图:
思维启示:(1)本题的解
( http: / / www.21cnjy.com )题思路是:找出三个数中最大的数赋予a,余下的两个数中的最大的数赋予b,最小的数赋予c,这样a、b、c就按从大到小的顺序排列.
(2)本题中为了交换两个变量的值,引入了一个中间变量t.
【例5】
观察所给的流程图,说出它所表示的函数.
思路分析:由流程图形式可以看出:这是一个含有两个选择结构的流程图,根据判断条件确定算法流向,因此所表示的是一分段函数.
解:该流程图所表示的函数是:
拓展迁移
【拓展点1】
到银行办理个人异地汇
( http: / / www.21cnjy.com )款(不超过100万元),银行收取一定的手续费,汇款额不超过100元,收取1元手续费,超过100元但不超过5
000元,按汇款额的1%收取,超过5
000元,一律收取50元手续费,试用条件语句描述汇款额为x元时,银行收取手续费y元的过程,画出流程图.
思路分析:这是一个实际问题,故应先建立数学模型,
由此看出,求手续费时,需先判断x的范围,故应用条件结构描述.
解:流程图如图所示:
【拓展点2】
对一
( http: / / www.21cnjy.com )批货物征收税金:价格在10
000元以上的货物征税5%?;在5
000元以上、10
000元以下(含10
000元)的征税3%;在1
000元以上、5
000元以下(含5
000元)的货物征税2%;1
000元以下(含1
000元)的货物免税.请设计一个算法,根据货物价格输出税金,画出算法流程图.
思路分析:这是一个实际问题,应首先建立数学模型,设货物价格为x元,税金为y元,则:
由上述函数解析式可以看出,需先判断x的范围,再根据x的范围计算税金,故应利用选择结构来描述算法.
解:S1:先判断货物价格在哪个区间上;
?
S2:计算货物价格税金.
流程图如图所示:
思维启示:对于分为多段的分段函数的求值问题,往往需要用选择结构的嵌套.3.1.2 随机事件的概率
案例探究
一个地区从某年起几年之内的新生婴儿数及其中的男婴数如下:
时间范围
1年内
2年内
3年内
4年内
新生婴儿数n
5
544
9
607
13
520
17
190
男婴数nA
2
883
4
970
6
994
8
892
(1)计算男婴出生频率(保留4位小数);
(2)这一地区男婴出生的概率约是多少?
解析:(1)计算即得到男婴出生频率依次是:0.520
0,0.517
3,0.517
3,0.517
3.
(2)由于这些频率非常接近0.517
3,因而这一地区男婴出生的概率约为0.517
3.
自学导引
1.在相同的条件下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数na为事件A出现的频数,比值称为事件A出现的频率,记作fn(A).
2.对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率稳定在某个常数上,我们可以用这个常数来刻画该随机事件发生的可能性大小,把这个常数称为事件A的概率,记作P(A).
3.一般地,如果随机事件A在n次试验中发生了m次,当试验的次数n很大时,我们可以将事件A发生的频率作为事件A发生的概率的近似值,即P(A)≈.
4.从定义中,可以看出随机事件A的概率满足0≤P(A)≤1.这是因为在n次试验中,事件A发生的频数m满足0≤m≤n,所以0≤m[]n≤1;当A是必然事件时P(A)=1,当A是不可能事件时,P(A)=0.
5.如何正确理解“频率”与概率之间的关系?
答:随机事件的频率,指此事件发生的次数与试验总次数的比值,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小.我们给这个常数取一个名字,叫做这个随机事件的概率.概率可看做频率在理论上的期望值,它从数量上反映了随机事件发生的可能性的大小.频率在大量重复试验的前提下可近似地作为这个事件的概率.
疑难剖析
对概念的理解是学好本节的关键.概率可以看作频率在理论上的期望值,而随机事件的频率可以看作是其概率的随机表现;随机事件的概率是事件固有的,客观存在的,可以在相同条件下通过大量重复试验予以识别和检验,而不能以一次或少数次的试验结果下判断.
【例1】
某射击运动员进行双向飞碟射击训练,各次训练的成绩记录如下:
射击次数
100
120
150
100
150
160
150
击中飞碟数
81
95
123
82
119
127
121
击中飞碟的频率
(1)将各次记录击中飞碟的频率填入表中;
(2)这个运动员击中飞碟的概率约为多少?
思路分析:利用频率公式依次计算出击中飞碟的频率,然后根据频率估计出运动员击中飞碟概率的近似值.
解:(1)射中次数100,击中飞碟数是81,故击中飞碟的频率是=0.81,同理可求得下面的频率依次是0.792,0.820,0.820,0.793,0.794,0.807;(2)击中飞碟的频率稳定在0.81的附近.故这个运动员击中飞碟的概率约为0.81.
思维启示:事件A发生的频率记录的是重复试验中事件A发生后的统计结果.事件A发生的概率描述的是事件A发生的可能性的大小,两者是不同的概念,但在大量的试验结果面前,可用频率近似表示概率.事件A的频率可有小幅变化和波动,但其概率是一个常数.
【例2】
用一台自动机床加工一批螺母,从中抽出100个逐个进行直径检验,结果如下:
直径
个数
6.881
6.892
6.9010
6.9117
6.9217
6.9326
6.9415
6.958
6.962
6.972
从这100个螺母中,任意抽取一个,求事件A(6.92解:事件A的频率为:=0.43
事件B的频率为:=0.93
事件C的频率为:=0.04
事件D的频率为:=0.01
思维陷阱:下表是计算机模拟掷硬币的试验结果,试对其频率进行分析.
试验次数
正面朝上的频数
正面朝上的频率
5
4
0.8
10
6
0.6
15
6
0.4
20
14
0.7
25
11
0.44
30
16
0.533
333
35
18
0.514
286
40
20
0.5
45
20
0.444
444
50
20
0.4
55
26
0.472
727
60
31
0.516
667
65
30
0.461
538
70
35
0.5
75
34
0.453
333
80
38
0.475
85
43
0.505
882
90
46
0.511
111
95
56
0.589
474
100
53
0.53
错解1:当试验次数为5时,“正面朝上”的频率是0.8,故可作出结论:当试验次数为5时,正面朝上的概率是0.8.
错解2:根据对试验次数是5,10,15,20,25的频率分析,正面朝上的频率是0.8,0.6,0.4,0.7,0.44.即使当试验次数为50时,正面朝上的频率仍为0.4.故正面朝上的频率不具有一种统计规律性.
错因分析:上述两种解法错误的原因是把频率等同于概率.随机事件的概率是事件固有的,不随试验次数的改变而改变.而频率是随着试验次数的改变而改变,在相同条件下可以通过大量重复试验,利用频率的稳定值来估计概率,但是不能以一次或少数次的试验结果下判断.
正解:在抛掷硬币的试验中,“正面朝上”的频率仍是一个随机变量,当试验次数很小时,频率不具有规律性,但是在大量重复试验后,随着次数的增加,频率逐步地稳定在0.5上,在其附近摆动.因此可以估计“正面朝上”的频率是0.5.
【例3】
已知如下两表:
表1
抛掷硬币试验结果表
抛掷次数(n)
正面向上次数(m)
正面向上频率()
2
048
1
061
0.518
1
4
040
2
048
0.506
9
12
000
6
019
0.501
6
24
000
12
012
0.500
5
30
000
14
984
0.499
6
72
088
36
124
0.501
1
表2
某批兵兵球产品质量检查结果表
抽取球数n
50
100
200
500
1
000
2
000
优等品数m
45
92
194
470
954
1
902
优等品频率
0.9
0.92
0.97
0.94
0.954
0.951
试根据表1、表2结果比较两个不同事件发生的可能性的大小.
解:从表1可以看出,当抛掷硬币的次数很多时,出现正面向上的频率值是稳定的,接近于常数0.5,在它附近摆动.所以掷一枚硬币掷出“正面向上”的概率为0.5,即出现“正面向上”的可能性是50%.
从表2可以看出,当抽查的球数很多时,抽到优等品的频率接近于0.95,在它附近摆动.所以任取一个乒乓球得到优等品的概率是0.95,即得到优等品的可能性是95%.于是抛掷硬币时正面向上的可能性比抽查乒乓球时抽到优等品的可能性要小得多.
思维启示:利用随机事件概率的统计定义,可以比较不同事件发生的可能性大小.
【例4】
孟德尔的豌豆试验数据,孟德尔用黄色和绿色的豌豆杂交,第一年收获的豌豆都是黄色的.第二年,当他把第一年收获的黄色豌豆再种下时,收获的豌豆既有黄色的,又有绿色的.具体数据如下表:
性状
显性
隐性
显性∶隐性
子叶的颜色
黄色6
022
绿色2
001
3.01∶1
请你用概率的知识解释一下这个遗传规律.
解析:纯黄色和纯绿色的豌豆均有两个特征(用符号?YY?代表纯黄色豌豆的两个特征,符号yy代表纯绿色豌豆的两个特征).如右图所示,当纯黄色和纯绿色这两种豌豆杂交时,下一代是从父母辈中各随机地选取一个特征,于是第一年收获的豌豆特征为Yy.当把第一代杂交豌豆再种下时,下一代同样是从父母辈中各随机地选取一个特征,所以第二代的豌豆特征为:YY,Yy,yy.这里对于豌豆来说Y是显性因子,y是隐性因子,当显性因子与隐性因子组合时,表现出显性因子的特征,即YY,Yy皆呈黄色,yy呈绿色,因此在第二代中YY与yy出现的概率都是,Yy出现的概率为,所以黄色豌豆(YY,Yy)∶绿色豌豆(yy)=3∶1.
拓展迁移
【拓展点1】
某医院治疗一种疾病的治愈率为10%?,那么,前9个病人都没有治愈,第10个人就一定能治愈吗?
解析:如果把治疗一个病人作为一次试验,治愈率是10%,指随着试验次数的增加,即治疗的病人数的增加,大约有10%?的人能够治愈,对于一次试验来说,其结果是随机的,因此前9个病人没有治愈是可能的.对第10个人来说,其结果仍然是随机的,即有可能治愈,也可能没有治愈.
【拓展点2】
在42位美国总统中,有两人的生日相同,三人卒日相同.什尔克生于1795年11月2日,哈定则生于1865年11月2日;门罗卒于1831年7月4日,而亚当斯、杰佛逊都卒于1826年7月4日.还有两位总统的死期都是3月8日:费尔莫死于1874年,塔夫脱死于1930年,这是巧合吗?
记n为相关的人数,n个人中至少有两人的生日在同一天的概率为P(A),则有下表:
n
10
20
23
30
40
50
P(A)
0.12
0.41
0.51
0.71
0.89
0.97
试用上表解释上述现象.
解析:上表所列的答案足以引起多数人的惊奇,因为“至少两个人的生日相同”这件事情发生的概率,并不如大多数人直觉想象中的那样小,而是相当大,由表中可以看出,当人数是40时,“至少有两人相同生日”的概率为0.89,因此,在42位美国总统中,有两人生日相同,三人卒日相同,根本不是什么巧合,而是很正常的.
【拓展点3】
请同学们把同样大小的9个白色乒乓球和1个黄色乒乓球放在1个不透明的袋中,然后每次摸出1个球后再放回袋中,这样摸10次,观察是否一定至少有1次摸到黄球.
解析:因为每次摸出1个球相当于1次随机试验,其结果有两种可能:黄球或白球.随着试验次数的增加,会发现摸到白球的频率要比摸到黄球的频率大,但没有1次摸到黄球也是有可能的,所以不一定至少有1次摸到黄球.
PAGE
11.1 算法的含义
案例探究
有8个小球,其中7个重量相同,仅有一个较重,用天平如何称出那个重的小球.
方法1:把8个小球分成四组,依次将每组放在天平上,直到某一组不平衡,就可确定重的小球,最多需称4次.
方法2:(1)从8个小球中任取6
( http: / / www.21cnjy.com )个小球,将这6个小球每边3个置于天平上;(2)若天平平衡,则表明重的小球在剩余的2个小球中,只需将那两个小球放在天平上再称1次就可找到重的那个小球;(3)若天平不平衡,则从较重的一边的3个球中任取两个球称量,若平衡,则剩下的那个即为要找的小球,若不平衡,则重的那边就是要找的小球.?
我们做任何事情,都是在一定条件下按某种顺序执行一系列操作.解决数学问题也常常如此,这就是本节内容要研究的算法思想.
自学导引
一般而言,对一类问题机械的、统一的求解方法称为算法.
1.算法概念的理解
(1)算法是指可以用计算机来解决的
( http: / / www.21cnjy.com )某一类问题的程序或步骤,这些程序或步骤必须是明确有效的,而且能在有限步骤之内完成.(2)算法与一般意义上具体问题的解法既有联系,又有区别,它们之间是特殊与一般的关系,也是抽象与具体的关系.算法的获得要借助一般意义上具体问题的求解方法,而任何一个具体问题都可以利用这类问题的一般算法来解决.(3)算法一方面具有具体化、程序化、机械化的特点,同时又有高度的抽象性、概括性、精确性,所以算法在解决问题中更具条理性、逻辑化特点.
2.算法的五个特点
(1)概括性:写出的算法必须能解决一类问题,并且能重复使用.
例如:给出求解方程组的一个算法.
( http: / / www.21cnjy.com )
解析:解这个方程组的步骤是:
第一步:②-①×2得5y=3;
③
第二步:解③得y=
( http: / / www.21cnjy.com );
第三步:将y=
( http: / / www.21cnjy.com )代入①,得x=
( http: / / www.21cnjy.com ).
像上例二元一次方程组的求解问题,也适用于其他二元一次方程组的求解.
(2)正确性与顺序性:算法从初始步
( http: / / www.21cnjy.com )骤开始,分为若干明确的步骤,前一步是后一步的前提,只有执行完前一步才能进行下一步,而且每一步都是正确无误的,从而组成了一个有着很强逻辑性的序列.
(3)有限性:算法有明确的开始和结束界限,终止时表示问题得到解答或指出问题没解,是在有限步骤内求解某一问题.
(4)不唯一性:求解某一问题的算法不是唯一的,可以有不同的算法.当然这些算法有繁简之分,但是都能解决这一类问题.
(5)普遍性:很多
( http: / / www.21cnjy.com )具体的问题,都可以设计合理的算法去解决,例如,手算、心算、用算盘、用计算器算都要经过有限的、事先设计好的步骤来实现.同样的一个工作计划,生产流程都可以视为算法.
疑难剖析
算法是数学及其应用的重要组成部
( http: / / www.21cnjy.com )分,是计算科学的重要基础.随着现代信息技术的飞速发展,算法在科学技术、社会发展中发挥着越来越大的作用,并日益融入社会生活的方方面面,算法思想已成为现代人应具备的一种数学素养.
算法是高中数学课程的新增内容,其思想方法是非常重要的.
【例1】
试写出求解二元一次方程组的算法.
思路分析:本题主要考查二元一次方程组的解的算法.不妨设二元一次方程组为
( http: / / www.21cnjy.com )
对于求方程的根,解方程组这
( http: / / www.21cnjy.com )样的数值性的问题,我们都有具体的计算方法,只要我们把平时的计算方法严格地按步骤把它描述出来即可.因此我们很容易得到下面的算法.
解:由于是二元一次方程组,故方程组中a11、a21不能同时为0.
第一步,假定a11≠0(如果a11=0,可将第一个方程与第二个方程互换),①×(-
( http: / / www.21cnjy.com ))+②得到
(a22-
( http: / / www.21cnjy.com ))x2=b2-
( http: / / www.21cnjy.com ).
即方程组可化为
( http: / / www.21cnjy.com )
第二步,如果a11a22-a21a12≠0,解方程④得到
x2=
( http: / / www.21cnjy.com )
⑤
第三步,将⑤代入③,整理得到
x1=
( http: / / www.21cnjy.com )
⑥
第四步,输出结果x1、x2.?
如果a11a22-a21a12=0,则从④可以看出方程组无解或有无穷多组解.
嗣位启示:从本例可以发现,
( http: / / www.21cnjy.com )求解某个问题的算法不同于求解一个具体问题的方法,算法必须能够解决一类问题.并且能够重复使用;算法过程要能一步一步地执行,每一步操作必须确切,能在有限步后得出结果.
变式训练:1.试写出求一元二次方程ax2+bx+c=0的根的算法.
解:第一步:计算Δ=b2-4ac;
第二步:如果Δ<0.则原方程无实数解,
否则(Δ≥0)
( http: / / www.21cnjy.com )
( http: / / www.21cnjy.com )
第三步:输出x1,x2或无实数解的信息.
2.试写出求x2-5x-6>0的解的算法.
解:第一步:求对应方程x2-5x-6=0的两根x1=-1,x2=6.
第二步:写出解集{x|x>6或x<-1}.
【例2】
写出求1+2+3+4+5+6的一个算法.
思路分析1:按照逐一相加的程序进行.
解法1:第一步:计算1+2,得3;
第二步:将第一步中的运算结果3与3相加得6;
第三步:将第二步中的运算结果6与4相加得10;
第四步:将第三步中的运算结果10与5相加得15;
第五步:将第四步中的运算结果15与6相加得21.
思路分析2:可以运用公式1+2+3+…+n=
( http: / / www.21cnjy.com );直接计算.
解法2:第一步:取n=6;
第二步:计算
( http: / / www.21cnjy.com );
第三步:输出运算结果.
思维启示:题目尽管简单,还是要一步一步地做.否则就不能利用上述算法解决这一类问题.
变式训练:写出求1×2×3×4×5×6的值的算法.
解:第一步:计算1×2,得2;
第二步:将第一步中的运算结果2与3相乘得6;
第三步:将第二步中的运算结果6与4相乘得24;
第四步:将第三步中的运算结果24与5相乘得120;
第五步:将第四步中的运算结果120与6相乘得720.
【例3】
已知球的半径R=5,写出求球的体积V的一个算法.
思路分析:算法具有普遍性,过去学过的许多公式的应用都是算法,描述算法时只要将问题的解答分为明确的步骤即可.
解:第一步:输入球的半径R=5;
第二步:用球的体积公式V=
( http: / / www.21cnjy.com )πR3,计算V的值;
第三步:输出V.
思维启示:平时我们解题的一般步骤只注
( http: / / www.21cnjy.com )重第二步,其他步骤往往忽略了,算法却讲究“一步一步地去做”.像这类套用现成公式求值的题一般分为三步:“第一步输入需要的值,第二步套用公式,第三步输出结果.”
【例4】
写出一个求解任意二次函数y=ax2+bx+c?(a≠0)的最值的算法.
思路分析:由二次函数的知识得,当a>0时,函数有最小值
( http: / / www.21cnjy.com );当a<0时,函数有最大值
( http: / / www.21cnjy.com ).
解:算法步骤如下:
第一步:输入a、b、c;
第二步:计算m=
( http: / / www.21cnjy.com )
第三步:若a>0,输出最小值m;
第四步:若a<0,输出最大值m.
变式训练:写出求点M(1,2)到直线3x+5y-6=0的距离的算法.
解:第一步:输入点M的坐标x0=1,y0=2及直线方程的系数A=3,B=5,C=-6;
第二步:计算P=Ax0+By0+C;
第三步:计算Q=A2+B2;
第四步:计算d=
( http: / / www.21cnjy.com );
第五步:输出D.
【例5】
一列快车
( http: / / www.21cnjy.com )长168米,一列慢车长?184米?.如果两车相向而行,从相遇到离开需4秒,如果同向而行,从快车追及慢车到离开需16秒钟,求两车的速度.
思路分析:本题是
( http: / / www.21cnjy.com )一个实际的数值问题,对于这样的问题一定要建立它的数学模型;按照数学的处理方案一步一步地具体化,两车相向而行,则其相对速度为速度之和,两车同向而行,则其相对速度为速度之差,相对移动的距离均为两辆火车的长度之和.
第一步:设快车时速为x公里/小时,慢车时速为y公里/小时,可以得到如下方程组:
( http: / / www.21cnjy.com )
第二步:将其化简得
( http: / / www.21cnjy.com )
第三步:将①+②得x=55;
③
第四步:将③代入①或②得y=33.
思维启示:本题的关键是将具体的问题转化为数学模型,只要掌握了这个过程,则对于描述本题的算法就是解方程组的步骤了.
【例6】
现有有限个正整数,试设计一个求这些有限个正整数中最大数的算法.
思路分析:如果让我们从10个、
( http: / / www.21cnjy.com )8个正整数中找出最大数,也许是一件很简单的事,我们一眼就能看出结果.但如果给我们100个、1
000个,甚至更多的数,那么找出其中最大的数就是一件很困难的事了.我们必须依靠算法来解决这个问题.我们可以设想有一个基础数(如第一个数),让它作为其中的最大数,然后将第二个数与这个基础数比较,将这两者中的较大者再作为基础数与第三个数进行比较,找出其中的较大者,将其作为基础数再与第四个数比较,依次下去,直到与最后一个数比较完毕,就能确定出有限个正整数中的最大数.
解:算法步骤用自然语言叙述如下:
第一步:先假定这些正整数中的第一个数为“最大值”;
第二步:将这些整数中下一个数与“最大值”比较,如果它大于此“最大值”,这时就假定“最大值”是这个整数;
第三步:如果还有其他正整数,重复第二步;
第四步:一直到没有可比的数为止,这时假定的“最大值”就是这有限个正整数中的最大值.
思维启示:一种算法,就是要求我
( http: / / www.21cnjy.com )们去按部就班地做,每做一步都有唯一的结果,并且对任意的有限个正整数都适用,且在有限步之后,总能得出结果.
拓展迁移
【拓展点1】
写出求1×2×3×…×9×10的值的算法.
解法1:可用最原始的方法进行计算.
第一步,先求1×2,得到结果2;
第二步,将第一步所得结果2再乘以3,得到结果6;
第三步,将6再乘以4,得到24;
第四步,将24再乘以5,得到120;
……
第九步,将362
880再乘以10,得到3
628
800,即是最后结果.
虽然这样的算法是正确的,但
( http: / / www.21cnjy.com )过于繁琐.如果要求1×2×…×10
000的值,则要写9
999个步骤,显然是不可取的,而且每次都直接使用上一步的数值结果(如2,6,24等)也不方便,应当找到一种通用的方法.通过分析可发现规律,乘数是前一个加1.利用这一规律,可以得到第二种算法.
解法2:可以设两个变量,一个代表
( http: / / www.21cnjy.com )被乘数,一个代表乘数,不另设变量存放乘积结果,而直接将每一步的乘积放在被乘数变量中.现在设p为被乘数,i为乘数.用循环算法来求结果,可将算法改写如下.
第一步:使p=1.
第二步:使i=2.
第三步:使p=p×i(乘积仍放在变量p中).
第四步:使i=i+1(使i的值加1).
第五步:如果i≤10,则返回重新执行步骤第三步,以及其后的步骤第四步和第五步,否则算法结束.
【拓展点2】
试写出求1+2+3+4+5+…+n的算法.
思路分析:如果仅仅几个数相加
( http: / / www.21cnjy.com ).我们可以一个一个地相加.其实那也是一种算法.从例题2可以看出,我们每一步都是在重复运算,不同的是运算的数值不一样.但是运算的数值是有规律的.因此可以引进两个变量,一个是sum代表和,一个是i,先设sum=0,i=1,i的值在变化,sum的值变化.
解:第一步:设i的值为1;
第二步:设sum的值为0;
第三步:如果i≤n执行第四步,否则转去执行第七步;
第四步:计算sum+i并将结果代替sum;
第五步:计算i加1并将结果代替i;
第六步:转去执行第三步;
第七步:输出sum的值并结束算法.
【拓展点3】
设火车托运重量为P(单位:kg)行李时,每千米费用(单位:元)标准为:
( http: / / www.21cnjy.com )
写出求行李托运费用的算法.
解析:第一步:输入P,里程D;
第二步:若P≤30kg,则费用为0.3P×D.
若P>30kg,则费用为[0.3×30+0.5×(P-30)]×D;
第三步:输出费用.1.3 基本算法语句
1.3.1 赋值语句 1.3.2 输入、输出语句
案例探究
用伪代码写出计算任何一个学生的语、数、外三门课成绩的算法.
解:Begin(算法开始)
Read
a←“chinese”
b←“maths”
c←“foreign
language”
Aver←(a+b+c)/3
Print
aver
End
伪代码是表示算法的一种方法,它是介于自然语言和计算机语言之间的文字和符号,是描述算法简单而实用的方法.
自学导引
1.伪代码是介于自然语言和计算机语言之间的文字和符号.
2.在伪代码中,赋值语句用符号“←”表示,“x←y”表示将y的值赋给x,其中x是一个变量,y是一个与x同类型的变量或表达式.?
3.在某些算法中,变量的初值要根据情况经常地变化,每次做题时,即使初始值数据改变,也不必改变程序部分,只要每次程序运行时,输入相应的数据即可,这个过程在程序语言中用“输入语句”来控制,其格式为“Read
a,b”表示输入的数据送给a,B.
4.任何求解问题的算法,都要把求解的结果“输出”,任何程序语言也必须有“输出语句”来控制,其格式为:“Print
x”,表示输出运算结果x.
疑难剖析
【例1】
若三角形的边长分别为a,b,c,借助于公式S=(其中p=),求该三角形的面积.试用输入、输出语句表示计算面积的一个算法.
分析:这里有三个变量a,b,c的值需要输入,变量p的值由a,b,c确定,可用赋值语句,S的计算也用赋值语句,最后输出的是S的值.
解:Read
a,b,c
p←(a+b+c)/2
x←p-a
y←p-b
z←p-c
S←SQR(p
x
y
z)
Print“三角形的三条边长分别为:”;a,b,c
Print“这个三角形的面积是:”;S
End
思维启示:在程序语言中,乘、除、乘方、求平方根、求绝对值,分别用下列符号表示:
、/、∧、SQR( ),ABS( ),如3×2,3÷2,32,,|3|分别写成3
2,3/2,3∧2,?SQR(3),ABS(3),在程序中≥,≤,≠分别写成>=,<=,<>.
【例2】
试用伪代码设计一个程序,已知圆柱体的底面半径和高,求圆柱体的表面积.
思路分析:根据圆柱的表面积等于两底的面积加上侧面积,我们就可以先求出底面积,再算出侧面积,然后把两个面积相加,圆柱体的表面积便有了.
解:程序:Read“R,H=”;R,H
A←2
3.145
R
H
B←3.145
R
R
S←A+2
B
Print“S=”;S
End
思维启示:“R,H=”提示输入圆柱体的底面半径和侧面高,当我们把值赋给R,H后,R,H中的值与2及3.1415相乘,乘积存入变量A,R中的值代入圆面积公式,求出圆的面积存入B,A中的值与两个底面的面积2B相加存入S,则S中的值便是圆柱体的表面积.
【例3】
根据下面伪代码编写的程序,画出流程图.
Read“输入边长A,B的值”;A,B
Read“输入夹角C的角度值”;C
C←C
3.141
6/180
P←A
A+B
B-2
A
B
cos(C)
Y←SQR(P)
Print“第三边=”;Y
End
思路分析:从伪代码程序可以看出,此程序只用输入语句、赋值语句和输出语句组成,因此根据程序画流程图,只要按顺序从上到下把输入语句、赋值语句、输出语句换成输入框、处理框、输出框就可以了.
解:流程图如图所示:
【例4】
编写一个程序求出方程x2-3x+2=0的两根.
思路分析:用输入语句输入a,b,c的值,然后利用求根公式求根,最后输出方程的两根即可.
解:Read
a,b,c”;1,-3,2
x1←(-b+SQR(b∧2-4
a
c))/(2
a)
x2←(-b-SQR(b∧2-4
a
c))/(2
a)
Print“x1=”;x1;“x2=”;x2
End
【例5】
某粮库3月4日存粮50
000
kg,3月5日调进粮食30
000
kg,3月6日调出全部存粮的二分之一,编写一个算法描述输出每天的库存数,并用伪代码表示.
思路分析:粮库的库存是逐日变化的,可以设置一个变量来存放每天的库存数,我们只设一个变量a,处理时,每次当天的库存统计好存入变量里,然后输出变量当前值,来说明当天的库存.在这样的思路,则流程图如图所示.
解:由流程图看出,这是一个有多个输出的顺序结构,因此只需用输入、输出、赋值语句即可写出程序.
程序为:
a←50
000
Print“3月4日库存数:”;a;“kg”
a←a+30
000
Print“3月5日库存数:”;a;“kg”
a←a/2
Print“3月6日库存数:”;a;“kg”
End
拓展迁移
【拓展点】某市2003年1~12月的产值分别为5.3,3.8,4.2,5.4,6.2,4.6,6.7,7.3,6.4,
5.8,
4.7,6.5(亿元),该市要统计每季度的月平均产值及2003年的月平均产值,试分别用赋值语句和输入、输出语句表示计算上述各个平均值的算法.
解:Read“a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12”;
5.3,3.8,4.2,5.4,6.2,4.6,6.7,7.3,6.4,5.8,4.7,6.5
?Print“第1季度aver=”;(a1+a2+a3)/3
?Print“第2季度aver=”;(a4+a5+a6)/3
?Print“第3季度aver=”;(a7+a8+a9)/3
?Print“第4季度aver=”;(a10+a11+a12)/3
?Print“全年aver=”;(a1+a2+a3+…+a12)/12
?End
PAGE
11.2.3 循环结构
案例探究
北京获得了2008年第29届奥林匹克运动会主办权,你知道在申办奥运会的最后阶段,国际奥委会是如何通过投票决定主办权归属的吗 对遴选出的5个申办城市进行表决的操作程序是:首先进行第一轮投票,如果有一个城市得票超过总票数的一半,那么该城市将获得举办权;如果所有申办城市得票数都不超过总票数的一半,则将得票最少的城市淘汰,然后进行第二轮投票,如果第二轮投票仍没选出主办城市,那将进行第三轮投票,如此重复投票,直到选出一个申办城市为止.
请用自然语言和流程图描述该过程.
解析:用自然语言描述操作过程.
第一步:投票;
第二步:统计票数,如果有一个城市得票超过总票数一半,那么该城市就获得主办权,转第三步宣布主办权,否则淘汰得票数最少城市,转第一步;
第三步:宣布主办城市.
流程图如图所示:?
从上面案例可以看出,只要得票没有超过半数的城市,就得重新执行第一、二步,且每次过程是相同的,像这种重复执行同一操作的结构就是我们要学习的循环结构.
自学导引
1.循环结构:在一些算法中,经常会出现从某处开始,按一定条件,反复执行某一处理步骤的结构.
2.在一个循环结构中,总有一部分过程被重复执行,如案例探究中如下图所示的部分,在循环结构中我们称它为循环体.
3.循环结构在流程图中也是利用判断框表示,判断框内写上条件,两个出口分别对应着条件成立和条件不成立时执行的不同指令,其中一个要指向循环体,然后再从循环体回到判断框的入口处.它的基本结构形式有如下图所示的两种.
其中上图(1)称为当型循环,当给定条件P成立时反复执行循环体,直到条件P不满足时,才停止循环,退出循环体;图(2)称为直到型循环,即先执行A块,再判断给定的条件P是否成立,若条件P不成立,则再执行循环体,直到条件P成立为止,才停止循环,退出循环体.
4.简述三种基本逻辑结构特点.
顺序结构:
①顺序结构的语句与语句、框与框之间都是按从上到下的顺序;
②顺序结构是最简单的算法结构,任何一个算法都离不开它;
条件结构:
①条件结构的语句与语句、框与框之间必须有一个环节是按条件的判断而进行的操作;
②它包含一个判断框,当条件成立(或为“真”)时执行一个步骤,否则执行另一个步骤.
循环结构:
在一个循环结构中,总有一个处理过程要重复一系列的处理步骤若干次,而且每次的处理步骤完全相同.
5.简述条件结构与循环结构的区别与联系.
联系:它们都有一个或几个判断框,并且只有在进行判断后才可执行下一步.
区别:条件结构中进行判断只进行一次,而循环结构中只要不满足条件就进行判断直到满足条件为止.
疑难剖析
一些算法中(如累加、累乘问题),若出现从某处开始按照一定的条件反复执行某一处理步骤的情况,需采用循环结构处理,关键要确定循环条件与循环体.一般来说,画出框图前,需确定三件事情:①确定循环变量和初始条件;②确定算法中反复执行的部分,即循环体;③确定循环的终止条件.
【例1】
画出求1×2×3×4×5×…×n的流程图.
思路分析:这是一个累乘问题,重复进行了n-1次乘法,可以用循环结构描述,需引入累乘变量mul和计数变量i,这里mul与i每一次循环,它们的值都在改变,先用自然语言描述.
解:算法:第一步:设mul的值为1;
第二步:设i的值为2;
第三步:如果i≤n执行第四步,否则转去执行第七步;
第四步:计算mul乘i并将结果赋给mul;
第五步:计算i加1并将结果赋给i;
第六步:转去执行第三步;
第七步:输出mul的值并结束算法.
流程图如图:
方法1:
方法2:
思维启示:(1)对于连乘积问题,其运算过程包含循环过程,于是可采用循环结构来描述算法.
(2)本题中判断框起了一个控制作用,它决定了是继续执行循环体还是退出循环体.由于判断框中设置的循环条件不同,导致方法1是当型循环,方法2是直到型循环,可见当型循环和直到型循环是可以相互转化的.
【例2】
设计一个计算1+2+3+4+…+100的值的计算法,并画出流程图.
思路分析:本题是一个累加问题,我们需要一个累加变量和一个计数变量,将累加变量初始值设为0,计数变量的值从1到100.
解:算法:第一步:赋给累加变量sum初始值0,赋给计数变量i初始值1;
第二步:若i>100,输出sum,否则执行第三、四步;
第三步:计算sum=sum+i;
第四步:i=i+1,并转到第二步.
流程图如图:
思维启示:(1)对于累加求和问题,往往包含循环运算的过程,可利用循环结构来设计算法.
(2)运用循环结构描述算法时,关键是设置循环条件和循环体.
【例3】
给出以下10个数:5,9,80,43,95,73,28,17,60,36,要求把大于40的数找出来并输出.试画出该问题的算法流程图.
思路分析:可以从第1个数开始与40比较大小,若该数大于40,就输出,小于或等于40,就直接再与下一个数比较大小,这样共需比较10次,可设计一个计数变量,用循环结构设计算法.
解:流程图如图所示
思维启示:本题的算法设计中既用了条件结构,也用了循环结构.条件结构用于判断输入的数是否大于40,循环结构用于控制输入的数的个数,这里用变量I作为计数变量.
【例4】
已知函数f(x)=x3-1,把区间[0,10]10等分,求函数在该区间的端点及各分点处的函数值,画出该算法的流程图.
思路分析:把区间[0,10]10等分,每份长度均为1,9个分点处的值依次是1,2,3,…,9,这样连同两端点在内共有11个数:0,1,2,…,10,我们可以引入变量i,从0开始,每算一个函数值,i的值就加1,直到i=10为止.故可用一个循环结构设计算法.
解:
思维启示:对于这种有规律的重复计算问题,一般采用循环结构设计算法.
【例5】
给定两个正整数m,n(m≥n),求其最大公约数.写出算法,并画出流程图.
解:算法如下;
?S1:输入两个正整数m,n;
?S2:取m除以n的余数,并用r保存;
?S3:若r=0,则n的当前值即为所求的最大公约数,转到步骤S5;否则执行步骤S4;
?S4:使m=n,n=r,转到步骤?S2继续执行;
?S5:输出n,算法结束.
流程图如图所示.
拓展迁移
【拓展点1】
画出计算1++++…+值的一个算法流程图.
思路分析:从题目可以看出相加数的分子是不变的,而分母是有规律递增的,因此我们也可以引入累加变量sum和计数变量i,则sum=sum+这个式子是反复进行的.
解:流程图如图所示:
【拓展点2】
画出求(共6个2)的值的算法的流程图.
思路分析:这个式子实际上是求和,取倒数;再求和,取倒数,反复共需5次达到目的.第一个和为2+;于是可用循环结构设计该算法.
解:流程图如图所示.
【拓展点3】
画出求的值的算法的流程图.
思路分析:这个式子实际上是2乘以2,取其算术根;再乘以2,取其算术根,反复操作n-1次达到目的,于是可用循环结构设计该算法.
解:该算法的流程图如图所示:
思维启示:像这类有规律的重复运算问题,可以用循环结构设计算法,但要注意根据题目的运算规律设置循环体,根据运算的次数设置循环条件.
PAGE
12.1.2 系统抽样
案例探究
某高一年级共有20个班,每班有50名同学,为了了解高一学生的视力状况,从这1
000名学生中抽取100名作为样本进行检查应该怎样抽取?
分析:本题总体元素个数较大,样本容量也较大,采用简单随机抽样,比较费事.这时,我们可以按照这样的方法来抽样:首先将这1
000名学生从1开始进行编号,然后按号码顺序以一定的间隔进行抽取,由于1
000:100=10,这个间隔可以定为10,即从号码为1~10的第一个间隔中随机的抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到
6,16,26,36,46,…,996.这样我们就得到一个容量为50的样本.这种抽样方法是一种系统抽样.
将总体分成均衡的若干部分,按照预先制定的规则从每一部分抽取一个个体,得到所需样本的抽样叫做系统抽样.
一般的,假设要从容量为N的总体中抽取容量为n的样本我们可以按下列步骤进行系统抽样:
第一步:先将总体的N个个体进行编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
第二步:确定分段间隔k对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;
第三步:在第一段用简单随机抽样确定一个个体编号m(m≤k);
第四步:按照一定的规则抽取样本,通常是将m加上间隔k得到第二个个体编号(m+k),再加k得到第三个个体编号(m+2k),依次进行下去,直到获取整个样本.
注意:当N/n不是正整数时,令k=[N/n],即先从总体中用简单随机抽样的方法剔除N-nk个个体,再将其余的编号均分成k段.
如:若用系统抽样的方法从由21个个体组成的总体中抽一个容量为5的样本,可如下操作:
第一步:将21个个体用随机方式编号;
第二步:从总体剔除一个个体(剔除方法可用随机数表法),将剩下的20个个体重新进行编号,(分别为00,01,02,03,04
,…,19)并分成5段;
第三步:在第一段00,01,02,03这四个号中用简单随机抽样抽出一个(如02)作为起始号码;
第四步:将编号为02,06,10,14,18的个体抽出,组成样本.
自学导引
1.系统抽样是指:将总体分成均衡的若干部分,按照预先制定的规则从每一部分抽取一个个体,得到所需样本的抽样;
系统抽样的步骤:
(1)第一步:先将总体的N个个体进行编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)第二步:确定分段间隔k对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;
(3)第三步:在第一段用简单随机抽样确定一个个体编号m(m≤k);
(4)第四步:按照一定的规则抽取样本,通常是将m加上间隔k得到第二个个体编号(m+k),再加k得到第三个个体编号(m+2k),依次进行下去,直到获取整个样本.
2.在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样法从中抽取容量为20的样本,则每个个体被抽取的概率为( )
A.
B.
C.
D.
答案:D
3.为了了解参加一次知识竞赛的1
252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应剔除的个体数目是( )
A.4
B.5
C.6 D.2
答案:D
4.从容量为N的总体中抽取容量为n的样本,若用系统抽样法,则抽样间隔为( )
A.N/n
B.n
C.\ ?
D.\+1
答案:C
疑难剖析
【例1】
要从1
005名学生中选取一个样本容量为20的样本,试用系统抽样的方法给出抽样过程.
思路分析:考察用系统抽样方法抽取样本。
因为1
005=20×50+5,为了保证“等距”的分段,应先剔除5人.
解:第一步:将1
005名学生用随机方式编号;
第二步:从总体剔除5个(剔除方法可用随机数表法),将剩下的1
000名学生重新进行编号,(分别为000,001,002,003,…,999)并分成20段;
第三步:在第一段000,001,002,…,049这五十个号中用简单随机抽样抽出一个(如003)作为起始号码;
第四步:将编号为003,053,103,…953的个体抽出,组成样本.
思维启示:本题为了保证“等距”的分段,先剔除5人,对多余个体的剔除不影响总体中每个个体被抽到的可能性,仍然能保证抽样的公平性.
【例2】一个总体中共有100个个体,随机编号0,1,2,3,4,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )
思路分析:考察系统抽样方法中获取样本的方法.这是一个用系统抽样法抽取样本的问题,抽取的样本所对的编号与样本所在的组数有关.
解:根据题意,第7组中的号码是[60,69]内的正整数.
因为m=6,k=7,m+k=13,所以抽取的号码个位数为3,于是此号码为63.
思维启示:系统抽样方法中获得样本的方法可以按照一定的规律设定.
【例3】
从2
004名同学中,抽取一个容量为20的样本,写出系统抽样的步骤.
思路分析:考查系统抽样的四个步骤.
由于总体中的个体数为2
004,不能被样本用量20整除,这时可用简单随机抽样先从总体中剔除4个个体,然后再按系统抽样方法往下进行.
解:(1)可用简单随机抽样先从总体中剔除4个个体,然后再将剩余的2
000名同学采用随机的方法编号为0
001~2
000;
(2)将这2
000个号码按0
001~100为第一组,101~200为第二组,201~300为第三组,…,1
901~2
000为第二十组;
(3)在第一组采用抽签法抽出后两位为k(00~99)的号码;
(4)将其余各组中编号后两位为k的抽出,即可得到一个容量为20的样本.
思维启示:为了确定分段间隔,应先用简单随机抽样从总体中剔除4个个体,使剩下的总体中的个体数能被样本容量整除.
拓展迁移
【拓展点1】
从某工厂生产的802个零件中,随机的抽取80个测试规格尺寸,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,样本容量也较大,可用系统抽样法进行抽样.
解析:第一步:将802个零件用随机方式编号;
第二步:从总体剔除2个(剔除方法可用随机数表法),将剩下的800个零件重新进行编号,(分别为001,002,003,…,800)并分成80段;
第三步:在第一段001,002,…,010,这十个号中用简单随机抽样抽出一个(如003)作为起始号码;
第四步:将编号为003,013,023,…793的个体抽出,组成样本.
思维启示:802不能被80整除,为了保证等距分段,应先剔除2个.
【拓展点2】
从某工厂生产的802个零件中,随机的抽取8个测试规格尺寸,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,样本容量较小,可用随机数法进行抽样.
解析:第一步,现将802个零件用速记方式编号,可以编为001,002,003,…,802;
第二步,在随机数表中任选一个数,例如选出第8行第29列的数7;
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下),每次读3位,凡不在001~802中的数跳过去不取,遇到已经读过去的数也不取,便可依次得到751,286,735,443,387,211,234,297.这样8个号码就是所要抽取的8个样本个体的号码.
思维启示:本小题若用系统抽样法,每段的个体数较大不方便.
【拓展点3】
从某工厂生产的20个零件中,随机的抽取8个测试规格程度,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较小,样本容量也较小,可用抽签法进行抽样.
解析:(1)将20个零件用随机方式编号,分别为01,02,03,…,20.
(2)将这20个号码分别写在相同的20张纸片上.
(3)将这20张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满8个号码时终止.
(4)从总体中将与抽到的号签的编号相一致的个体取出,这样就得到了所要抽取的样本.
PAGE
13.1.1 随机现象
案例探究
在日常生活中,经常会遇到一些无法事先预测结果的事件:
(1)抛掷一枚硬币,它将正面朝上还是反面朝上?
(2)明天早上到校的时间是几点?
(3)购买本期福利彩票是否能够中奖?
分析:(1)抛掷一枚硬币可能正面朝上,也可能反面朝上.
(2)明天早上到校的时间无法确定.
(3)购买本期福利彩票可能中奖也可能不中奖.
像上面这些事情的结果是不确定的,是无法预知的,像这样的现象我们称之为随机现象.
自学导引
1.在一定条件下,事先就能断定发生或不发生某种结果,这种现象就是确定性现象.
2.在一定条件下,某种现象可能发生,也可能不发生,事先不能断定出现哪种结果,这种现象称为随机现象.
3.对于某个现象,如果能让其条件实现一次,就是进行了一次试验.而试验的每一种可能的结果,都是一个事件.
4.在一定条件下,必然会发生的事件叫必然事件.
5.在一定条件下,肯定不会发生的事件叫做不可能事件.
6.在一定条件下可能发生也可能不发生的事件叫做随机事件.
疑难剖析
【例1】
指出下列事件是必然事件,不可能事件,随机事件?
(1)如果a,b都是实数,那么a+b=b+a;
(2)从分别标有1,2,3,4,5,6的6张号签中任取一张,得到4号签;
(3)没有水分,种子发芽;
(4)某电话总机在60秒内接到至少15次呼叫;
(5)在标准大气压下,水的温度达到50℃时沸腾;
(6)同性电荷,相互排斥;
(7)某体操运动员将在某次运动会上获得全能冠军;
(8)同时掷两枚骰子,点数之和为13.
思路分析:本题主要考查必然事件、不可能事件、随机事件的概念,这三种事件的判断标准是,事件发生还是不发生在做实验前能否确定.
解:(1)(6)是必然事件,(2)(4)(7)是随机事件,(3)(5)(8)是不可能事件.
思维启示:准确掌握必然事件、随机事件、不可能事件的概念是解决该类问题的关键.
【例2】
从100个同类产品中(其中有2个次品)任取3个.
(1)三个正品;(2)两个正品,一个次品;(3)一个正品,两个次品;(4)三个次品;(5)至少一个次品;(6)至少一个正品.
以上六种事件中哪些是必然事件,哪些是不可能事件,哪些是随机事件?
解:(6)至少一个正品,是必然事件;(4)三个次品,是不可能事件;(1)(2)(3)(5)是随机事件.
【例3】
给出下列四个命题,其中正确命题个数是( )
①=-1是不可能事件 ②y=f(x)是奇函数,则f(0)=0是随机事件 ③若loga
(x-1)>0,则x>2是必然事件 ④函数y=ax(a>0且a≠1)是增函数是必然事件.
?A.1 ?B.2 ?C.3 ?D.4
思路分析:本题综合考查数学有关知识及 三个事件的概念.
解析:对于①,∵≥0,而-1<0,
∴=-1是不可能事件.
∴①正确;
对于②,∵y=f(x)是奇函数,只有当x=0有意义时才有f(0)=0.
∴②正确;对于③,
∵loga(x-1)>0,即loga(x-1)>loga1.
当a>1时,x-1>1,即x>2.
当0故loga(x-1)>0,则x>2是随机事件.
∴③不正确;
对于④,∵y=ax,当a>1时,是增函数.
当0∴函数y=ax是增函数是随机事件.
∴④不正确.
故应选B.
答案:B
思维启示:数学中的真命题描述的事件是必然事件,假命题描述的事件是不可能事件.
拓展迁移
【拓展点1】
指出下面事件是什么事件?
事件“从长为1、2、3、5、8的木棍中,任取三根构成以它们为边的三角形”.
解析:构成三角形的条件:两边之和大于第三边,两边之差小于第三边.从1、2、3、5、8中任取三根木棍,其中总有两根木棍的长度之和小于或等于第三边,于是一定构不成三角形.故事件“从长为1、2、3、5、8的木棍中,任取三根得到以它们为边的三角形.”为不可能事件.
【拓展点2】
请举出一些必然事件、不可能事件、随机事件的例子.
解析:必然事件:①三角形内角和是180°;②抛一石块,下落.
不可能事件:①二次函数的定义域是空集;②在常温下,焊锡熔化.
随机事件:①某人射击一次,中靶;②某电视剧的收视率为40%.
PAGE
11.3.3 条件语句
案例探究
某市电信部门规定,打市内电话时,如果通话时间不超过3min,则收取通话费0.2元;如果通话时间超过3
min,则超过部分以0.1元/min计(不足1
min按1
min计).试设计一个计算通话费用的算法,画出流程图并用伪代码描述.
解:解决这一问题的算法步骤:
?
S1:输入通话时间t;
?
S2:如果t≤3,那么c←0.2
否则c←0.2+0.1(t-0.3)
?
S3:输出c
其流程图如图:
用伪代码表示为:
Read“t=”;t
If
t<=3
then
c←0.2
Eles
c←0.2+0.1
(t-3)
Print“c=”;c
End
if
End
像这种if
A
then
B
Else
C
End
if
语句就是这节课要学习的条件语句.
自学导引
1.算法逻辑结构中条件结构一般由算法语句中的条件语句来实现.
2.条件语句的一般格式有两种,一种是If-then-else格式,其形式为:
if条件then语句1Else语句2END
if
,另一种是If-then格式,其形式
If条件then语句End
if
为:
3.条件语句两种格式的流程图可化为:
疑难剖析
【例1】
已知分段函数y=编写程序输入自变量x,输出其相应的函数值.
思路分析:由于函数是一个分段函数,所以输入x的值后根据x所在的范围,选择相应的函数解析式代入求值,故应该选择条件语句,又因为实数x的值共分为三个范围,所以要用条件语句的嵌套,流程图如图.
解:伪代码表示:
Read“x=”;x
If
x<0
then
y←-x+1
Else
If
x=0
then
y←0
Else
y←x+1
End
if
End
if
Print
y
End
思维启示:由于分段函数,是对x的范围进行判断,从而选择不同的解析式进行计算,像这种数学上的分类讨论问题一般都选择条件语句进行算法设计.
【例2】
任意输入三个正数,判断能否构成三角形,若能构成三角形,利用公式
S=[其中p=(a+b+c)]计算其面积.
思路分析:能否构成三角形,要看两边之和是否大于第三边,且任意两边都要比较,这实际上有三个条件同时成立.
解:Read“请输入三个正数a,b,c:”;a,b,c
If
a+b>c
and
b+c>a
and
c+a>b
Then
p←(a+b+c)/2
m←p
(p-a)
(p-b)
(p-c)
S←SQR(m)
Print“能构成三角形”
Print“这个三角形的面积是S=”;S
Else
Print“构不成三角形”
End
if
End
思维启示:本题首先要判断能否构成三角形,若能构成三角形,则计算其面积,否则输出不能构成三角形,于是需采用条件语句设计算法程序.
【例3】
输入三个数,按由小到大的顺序把它们打印出来,画出流程图,并用伪代码表示.
思路分析:根据题意有如图所示的流程图,于是可根据流程图写出程序.
解:程序如下:
Read“输入三个数”a,b,c
If
a>b
then?
t←a
a←b
b←t
End
if
If
a>c
then
t←a
a←c
c←t
End
if
If
b>c
then
t←b
b←c
c←t
End
if
Print
a,b,c
End
思维启示:本题中当每个判断条件不成立时没有可执行的语句,于是采用这一格式来设计程序,本题中有三个判断条件设计了三个模块,逐块处理,最后连成一个整体方案.
【例4】
根据下面程序,画出流程图,并说出表示了什么样的算法.
Read“请输入a,b,c”;a,b,c
If
a>b
and
a>c
then
Print“最大数为”;a
if
b>c
Then
print
“最大数为”;b
print“最大数为”;c
End
分析:我们根据程序按顺序从上到下分析.
第一步:是输入a,b,c三个数;
第二步:是判断a与b,a与c的大小,如果a同时大于b,c则输出a,否则执行第三步;
第三步:判断b与c的大小,因为a已小于b和c,则只需比较b与c的大小就能看出a,b,c中谁是最大的了,如果b>c,则输出b,否则输出C.
通过上面的分析,程序表示一个什么样的算法已经非常清楚了.
解:则框图为下图
拓展迁移
【拓展点1】
学习优良奖的条件如下:
(1)所考五门课成绩总分超过450分;
(2)每门课都在88分以上;
(3)前三门(主课)每门成绩都在95分以上,其他两门(非主课)每门成绩在88分以上.
输入某学生的五门课成绩,问他是否够优良条件?写出程序伪代码.
解析:伪代码如下:
Read“输入学生成绩”;a,b,c,d,e
Sum←a+b+c+d+e
If
Sum≥450
and
a≥95
and
b≥95
and
c≥95
and
d≥88
and
e≥88
Then
print“该生够优良条件”
Else
print“该生不够优良条件”
End
if
End
【拓展点2】
某商场实行优惠措施,若购物金额x在800元以上,打8折,若购物金额x在500元以上,则打9折,否则不打折.请写出一个程序(伪代码表示).
解析:根据题意首先画出流程图.
伪代码如下:
Read“购物金额”;x
If
x>=800
then
y←x
0.8
Print“应缴金额”;y
Else
If
x>=500
then
y←x
0.9
Print“应缴金额”;y
Else
y←x
Print“应缴金额”;y
End
if
End
if
End
PAGE
12.2.2 频率分布直方图与折线图
案例探究
在上一节的案例探究中,作出样本的频率分布直方图,再根据直方图解决用水量标准问题.
分析:作出它的频率分布直方图,就能够方便的找出一个合适的标准,从而解决用水量标准问题!
解:画频率分布直方图.建立平面直角坐标系,以横轴表示月均用水量,纵坐标表示频率/组距,就得到了这组数据的频率分布直方图,如下图所示:
探究:
1.
一般地,作频率分布直方图的方法为:
把横轴分为若干段,每一段对应一个组的组距.然后以这些线段为边作矩形,矩形的高等于该组的频率/组距,这样得出的一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.
2.容易知道,频率分布直方图是以面积的形式反映了数据在各个小组的频率的大小,并且可看出在频率分布直方图中,各小长方形的面积总和等于1.
3.频率分布直方图比频率分布表更直观形象地反映了样本的分布规律.一般来说,样本容量越大,这种估计就越精确.
4.如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为样本的频率分布折线图.
5.频率折线图的优点是它反映了数据的变化趋势.如果将样本取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线.
结论:从上面所作的频率分布直方图中,我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.且可以计算出大约有88%的居民月均用水量在3吨以下,因此,居民月均用水量标准定为3吨是市政府可以考虑的一个标准.
自学导引
1.什么叫做频率分布直方图?作频率分布直方图的一般方法是什么?
答案:我们可以利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图.一般地,作频率分布直方图的方法为:
以数据的单位为横轴单位,以频率/组距为纵轴单位.把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.
2.什么叫做频率分布折线图?
答案:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为样本的频率折线图.
3.什么叫做总体分布的密度曲线?它反映了什么?
答案:定义:样本容量取得足够大,分组的组距足够小,相应的频率折线图将趋于一条曲线,这条曲线就叫做总体分布的密度曲线;总体密度曲线反映了总体的变化趋势和总体在各个范围内取值的百分比.
4.在频率分布直方图中,各小长方形的面积总和等于1.(因为各小长方形的面积
=所对应区间的频率,总面积
=
1
)
5.作有关产品尺寸的样本的频率分布直方图时,用横坐标表示样本数据,用纵坐标表示频率/组距,在横坐标上以数据分组的两端点表示的线段为底,在纵坐标上以频率/组距为高作矩形.
6.条形图用高度来表示各组的频率,直方图用面积来表示各组频率.
7.从某校2
100名学生中随机抽取一个30名学生的样本,样本中每个学生用于课外作业的时间(单位:分钟)依次为:75,80,85,65,95,100,70,55,65,75,85,110,120,80,85,80,75,90,90,95,70,60,60,75,90,95,65,75,80,80.该学校的学生中作业时间是一个半小时以上(含一个半小时)的学生有630人,所占频率为0.3.(因为该样本中作业时间超过一个半小时的有9人,则频率=9/30=0.3;所以学生数=总体人数×0.3=2
100×0.3
=630)
疑难剖析
【例1】
为了了解某地区高三学生的身体发育情况,当地教育机构抽查了本地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg):
56.5
69.5
65
61.5
64.5
66.5
64
64.5
76
58.5
72
73.5
56
67
70
57.5
65.5
68
71
75
62
68.5
62.5
66
59.5
63.5
64.5
67.5
73
68
55
72
66.5
74
63
60
55.5
70
64.5
58
64
70.5
57
62.5
65
69
71.5
73
62
58
76
71
66
63.5
56
59.5
63.5
65
70
74.5
68.5
64
55.5
72.5
66.5
68
76
57.5
60
71.5
57
69.5
74
64.5
59
61.5
67
68
63.5
58
59
65.5
62.5
69.5
72
64.5
75.5
68.5
64
62
65.5
58.5
67.5
70.5
65
66
66.5
70
63
59.5
试根据上述数据画出样本的频率分布直方图与折线图,并对相应的总体分布作出估计.
思路分析:此题容量较大,首先要对所给数据进行分析,找到最大值与最小值以确定全距,再分组作出频率分布表、频率分布直方图和折线图.
(1)在上节【疑难剖析】例1列出频率分布表的基础上绘制出频率分布直方图如下:
(2)作频率分布折线图
将上述频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,这条折线就是所要作的折线图.(如下图所示)
思维启示:由于图中各小长方形的面积等于相应各组的频率,这个矩形的面积的大小反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5
kg的学生较少,约占12%;等等.
【例2】
为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1)画出表示样本频率分布的条形图;
(2)根据条形图,估计此种产品为二级品或三级品所占的百分比约是多少?
思路分析:由于总体中的个体取不同数值很少,只有四种:一级品、二级品、三级品和次品,可分别记为1,2,3和4.所以所取样本的不同数值及其相应的频率可用条形图表示,并根据频率分布条形图估计总体分布.
(1)在【疑难剖析】例2列出频率分布表的基础上画样本频率分布的条形图为
(2)此种产品为二级品或三级品所占的百分比约是0.27+0.43=0.70=70%.
思维启示:频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.特别应引起同学们注意的是条形图与直方图画法的区别.
【例3】
有一容量为50的样本,数据的分组及各组的频数如下:
[10,15)
4,[15,20)
5,[20,25)
10,[25,30)
11,[30,35)
9,
[35,40)
8,[40,45)
3
(1)画出频率分布直方图;
(2)估计总体中,个体分布在[20,35)之内的约占总体的百分之几?
思路分析:本题考查样本的频率分布直方图的画法以及用样本频率分布估计总体分布.由于是连续型总体,从而可用频率分布直方图表示样本的频率分布,并估计总体分布.
(1)在上一节【疑难剖析】例3列出频率分布表的基础上画频率分布直方图为
(3)由频率分布表知数据落在[20,35)范围内的频率为0.20+0.22+0.18=0.60,总体中,个体分布在[20,35)之内的约占总体的60%.
点评:频率分布直方图是用小矩形的面积表示该区间内取值的频率,所有小矩形的面积之和等于1.
思维启示:用样本的频率分布估计总体分布,分以下两种情况:
1.当总体中的个体取不同数值很少时,用频率分布表列出几个不同数值的频率,用相应的条形图的高来表示取各个值的频率;
2.当总体中的个体取不同数值很多、甚至无限时,用频率分布表列出各个不同区间内取值的频率,用相应的直方图的面积来表示在各个区间内取值的频率.
【例4】
200辆汽车经过某一段公路的时速的频率分布直方图如图所示,则时速在[50,60)的汽车大约有.
思路分析:本题考查学生逆向思维能力,再现由频率分布直方图对总体进行估计,从频率分布直方图上找出所要求的信息.
解:由于图中的纵坐标是频率除以组距,所以小矩形的面积就是对应本部分区间的频率,于是在[50,60)内的车辆大约有:(60-50)×0.03×200=60辆.
思维启示:直方图中第二个小矩形的面积约等于总体中的个体落在区间[50,60)内的百分比.
拓展迁移
【拓展点】下面列出43位美国历届总统(从1789年的华盛顿到2001年的小布什)的就任年龄:
57 61 57 57 58 57 61 54 68
51 49 64 50 48 65 52 56 46
54 49 51 47 55 55 54 42 51
56 55 51 54 51 60 62 43 55
56 61 52 69 64 46 54
(1)以5为组距画出相应的频率分布直方图和折线图,并用自己的语言描述一下历届美国总统就任年龄的分布情况.
(2)以4为组距画出相应的频率分布直方图和折线图,并用自己的语言描述一下历届美国总统就任年龄的分布情况.
(3)两次所做的频率分布直方图及折线图相同吗?试分别估计就任年龄在55岁以下的频率,并与实际频率作比较.
解析:(1)以5为组距列频率分布表如下:
年龄分组
频数
频率
频率/组距
[40,45)
2
0.046
5
0.009
[45,50)
6
0.139
5
0.027
9
[50,55)
13
0.302
3
0.060
5
[55,60)
12
0.279
1
0.055
8
[60,65)
7
0.162
8
0.032
6
[65,70]
3
0.069
8
0.014
0
画频率分布直方图:
(2)历届总统的就任年龄90%集中在45~65之间.(图略)
(3)两次所作频率分布直方图及折线图有所不同.以5为组距的分析方案,就任年龄在55岁以下的频率为0.488
3;以4为组距的分析方案,就任年龄在55岁以下的频率为≈0.3721.
PAGE
12.1.1 简单随机抽样
案例探究
假设你作为一个产品质量检查员,要考察某公司生产的一批300克袋装牛奶的质量是否达标,你准备怎样做?
分析:显然,你只能从中抽取一定数量的牛奶作为检验的样本(为什么?).那么应当怎样获取样本呢?
设计抽样方法时,在考虑样本代表性的前提下,应尽量使抽样过程简便易行.
获得样本牛奶的一个方法就是,将这批袋装牛奶“搅拌均匀”,然后不放回的摸取(以保证每袋牛奶被抽中的机会相等)这样我们就可以得到一个简单的随机样本,这样的抽样方法就是简单随机抽样.
一般地,设一个总体的个体总数为N,如果通过逐个抽取的方法从中抽取样本,且每次抽取时总体的各个个体被抽到的机会都相等,就称这样的抽样为简单随机抽样.
事实上:用简单随机抽样的方法从个体数为N的总体中逐次抽取一个容量为n的样本,那么每次抽取时,各个个体被抽到的机会相等,在整个抽样过程中每个个体被抽到的机会都等于.
由于简单随机抽样体现了抽样的客观性和公平性,且这种抽样方法比较简单,所以成为一种基本的抽样方法.如何实施简单抽样呢?下面介绍两种常用方法.
(1)抽签法
先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等.
(2)随机数表法
下面举例说明如何用随机数表来抽取样本.
为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:
第一步,先将40件产品编号,可以编为00,01,02,…,38,39;
第二步,在附录1随机数表中任意选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下:
16
22
77
94
39 49
54
43
54
82
17
37
93
23
78 87
35
20
96
43
84
26
34
91
64
84
42
17
53
31 57
24
55
06
88
77
04
74
47
67 21
76
33
50
25
83
92
12
06
76
63
01
63
78
59 16
95
55
67
19
98
10
50
71
75 12
86
73
58
07
44
39
52
38
79
33
21
12
34
29 78
64
56
07
82
52
42
07
44
38 15
51
00
13
42
99
66
02
79
54
57
60
86
32
44 09
47
27
96
54
49
17
46
09
62 90
52
84
77
27
08
02
73
43
28
第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.
至此,10个样本号码已经取满,于是,所要抽取的样本号码是16 19 10 12 07 39 38 33 21 34.
注:将总体中的N个个体编号时可以从0开始,例如N=100时编号可以是00,01,02,…,99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表.
当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.在上面每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.由于随机数表中每个位置上出现哪一个数字是等可能的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等可能的.因而利用随机数表抽取样本保证了各个个体被抽取的可能性相等.
自党导引
1.在统计中,总体、个体、样本、样本容量分别指的是什么?为什么通常是从总体中抽取一个样本,通过样本来研究总体?
答案:在统计中,所有考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.由于我们所要考察的总体中的个体数往往很多,且有时虽然总体中的个体数目不是很多,但考察时带有破坏性,因此通常是从总体中抽取一个样本,通过样本来研究总体.
2.为了了解某校高一学生在2005~2006学年度第二学期期末考试情况,要从该年级800名学生中抽取200名进行数据分析,则在这次考察中,考察的总体数为800,样本容量为200.
3.某地有2
000人参加自学考试,为了解他们的成绩,从中抽取一个样本,若每个考生被抽到的机率都是百分之四,则这个样本的容量是80.
4.下列抽取样本的方式是否属于简单随机抽样?说明理由.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有100个零件,从中选取8个零件进行质量检测,在抽样操作时,从中任意抽取一个零件进行检测后再把它放回盒子里.
答案:(1)不是简单随机抽样,由于被抽去样本的总体的个数是无限的,而不是有限的.(2)不是简单随机抽样,由于它是放回抽样.
5.为了检验某种产品个体质量,决定从60件产品中抽取15件进行检查,请利用随机数表法进行抽选,并写出抽样过程.
分析:依据随机数表抽去样本的三个步骤.
解:第一步,现将60件产品编号,可以编为00,01,02,03,…,58,59.
第二步,在随机数表中任选一个数,例如选出第7行第9列的数3.
第三步,从选定的数3开始向右读(读数的方向也可以是向左、向上、向下),两位、两位地读,得到一个两位数字31.由于31<59,说明号码31在总体内,将它取出;继续向右读数,又取出57、24、55、06当读到88时,由于88>59,将它去掉,再依次取下去,77>59,也将它去掉,依次再取出04、47、21、33、50、25、12当读到06时,它与前面的重复,将它取掉,再继续取下去,直到样本的15个号码全部取出.这样我们就得到一个样本容量为15的样本.
疑难剖析
1.随机抽样:
在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性.因此抽样时要保证每一个个体都可能被抽到,而且每一个个体被抽到的机会是均等的.满足这样条件的抽样是随机抽样.
2.简单随机抽样的特点:
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
(2)它是从总体中逐个地进行抽取.这样便于在抽样实践中进行操作.
(3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
(4)它每次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性.
【例1】
下面抽取样本的方式是简单随机抽样吗?为什么?
(1)从100个个体中一次性抽取10
个个体作为样本.
(2)从无限多个个体中抽取30个作为样本.
(3)盒子里共有80枝钢笔,今从中选取8个进行检测,在抽样操作时,从中任意的拿出一个钢笔进行质量检测后再把它放回箱子里.
思路分析:考查对简单随机抽样的定义及特点的理解和掌握.第(1)题中的“一次性”抽取不符合简单随机抽样的定义.第(2)题中的样本总体个数不是有限个.第(3)题中“放回抽样”不符合简单随机抽样的“不放回抽样”的特点.
解:(1)不是简单随机抽样,它是一次性抽取,不是逐个抽取,不符合简单随机抽样的定义.
(2)不是简单随机抽样,因为抽取的样本的总体的个数是无限的而不是有限的.
(3)不是简单随机抽样,因为它是放回抽样,这不符合简单随机抽样“不放回抽样”的特点.
思维启示:“一次性”抽取和“逐个”抽取不影响个体抽到的可能性,但“一次性“抽取不符合简单随机抽样的定义.这就要求我们必须搞清楚简单随机抽样的定义.
3.抽签法的优缺点:
优点:简单易行,当总体中的个体数不多时,使总体处于搅拌均匀的状态比较容易,这时每个个体有均等的机会被抽到,即抽签法能保证每一个个体入选样本的机会都相等,从而能保证样本的代表性.(得到样本是简单随机抽样).?
缺点:(1)当总体的个数较多时,对个体编号的工作量太大,制作号签的成本将会增加,使得抽签法成本高(费时、费力).(2)
号签很多时把它“搅拌均匀”就很困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加.?
【例2】
某车间有80名工人,为了了解该车间工人工作能力、态度等各个方面的情况,要从中抽取一个容量为20的样本,用抽签法确定抽取的工人.
思路分析:考查抽签法抽取样本步骤及特点:这是一个用抽签法从容量为80的总体中抽取一个容量为20的样本的案例,用抽签法的步骤设计.
解:(1)将80名工人编号,分别为1、2、3、…80.
(2)将这80个号码分别写在相同的80张纸片上.
(3)将这80张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满20个号码时终止.于是和这20个号码对应的20个工人就构成了一个简单随机抽样.
思维启示:抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.
4.随机数表法抽取样本的优点和缺点:
优点:与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间.
缺点:产生的样本不是真正的简单样本.
拓展迁移
【拓展点1】
从某电动车厂生产的30辆电动车中,随机的抽取3辆进行测试,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较小,样本容量也较小,可用抽签法进行抽样.
解析:(1)将30辆电动车用随机方式编号,分别为01、02、03、…30.
(2)将这30个号码分别写在相同的30张纸片上.
(3)将这30张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满3个号码时终止.
(4)从总体中将与抽到的号签的编号相一致的个体取出.这样就得到了所要抽取的样本.
思维启示:一个抽样试验能否用抽签法,关键看两点:一是制签是否方便,二是号签是否容易搅拌均匀.一般地,当总体容量较小,样本容量也较小时,可用抽签法.
【拓展点2】从某电动车厂生产的3
000辆电动车中,随机的抽取10辆进行测试,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,若用抽签法,制签复杂,将号签搅匀也不容易,所以可用随机数法进行抽样.
解析:第一步:将3
000辆电动车用随机方式编号,分别为0
001、0
002、03、…3
000.
第二步:在随机数表中任选一个数,例如选出第1行第26列的数“3”.
第三步:从选定的数“3”开始向右读(读数的方向也可以是向左、向上、向下),每次读4位,凡不在0
001—3
000中的数跳过去不取,遇到已经读过的数也不取,便可依次得到2
616,1
410,1
457,2
042,2
707,1
676,1
012,0
372,1
014,2
188;这10个号码对应的10辆汽车就是要抽去的对象.
思维启示:当总体容量较大,样本容量也较大时,可用随机数法进行抽样.
PAGE
11.4 算法案例
案例探究
有一个故事是讲唐代大官杨埙提拔官员的经过.他让两个资格职位相同的候选人解答下面这个问题,谁先答出就提拔谁.“有人在林中散步,无意中听到几个强盗在商量怎样分配抢来的布匹.若每人分6匹,就剩5匹;若每人分7匹,就差8匹.问共有强盗几个?布匹多少?”你能用一个简单算式求出强盗个数和布匹数吗?
解析:这个问题可看作二元一次方程组问题.问题的特点是给出两种分配方案,一种分法分不完,一种分法不够分.
中国古代的《九章算术》一书中搜集了许多这类问题,各题都有完整的解法,后人称这种算法为——“盈不足术”.
这种算法可以概括为两句口诀:有余加不足,大减小来除.
公式:(盈+不足)÷两次所得之差=人数,
每人所得数×人数+盈=物品总数,
求得强盗有(8+5)÷(7-6)=13(人),布匹有6×13+5=83(匹).
伪代码:
Read
a,b,c,d
x←(a+b)/(d-c)
y←cx+a
Print
x,y
流程图:
自学导引
1.int(x)表示不超过x的最大整数.
2.mod(a,b)表示a除以b所得的余数,称b为模.
3.辗转相除法是用于求两个数的最大公约数的一种方法,这种算法由欧几里得在公元前300年左右首先提出,因而又叫欧几里得辗转相除法.
4.欧几里得辗转相除法找出a,b的最大公约数的步骤是:计算出a÷b的余数r,若r=0,则b为a,b的最大公约数;若r≠0,则把前面的除数b作为新的被除数,把余数r作为新的除数,继续运算,直到余数为0,此时的除数即为正整数a,b的最大公约数.
5.秦九韶算法是我国南宋数学家秦九韶在他的代表作《数书九章》中提出的一种用于计算一次同余式组的方法,称作大衍求一术.
疑难剖析
【例1】
输入两个正整数a和b(a>b),求它们的最大公约数.
思路分析:求两个正整数a、b(a>b)的最大公约数,可以归结为求一数列:
a,b,r1,r2,…,rn-1,rn,rn-1,0
此数列的首项与第二项是a和b,从第三项开始的各项,分别是前两项相除所得的余数,如果余数为0,它的前项rn-1即是a和b的最大公约数,这种方法叫做欧几里得辗转相除法,其算法如下:
S1 输入a,b(a>b)
S2 求a/b的余数r;
S3 如果r≠0,则将b→a,r→b,再次求a/b的余数r,转至S2;
S4 输出最大公约数B.
解:流程图如下:
伪代码如下:
10
Read
a,b
20
r←Mod(a,b)
30
If
r=0
Then
Goto
80
40
Else
50
a←b
60
b←r
70
Goto
20
80
Print
b
90
End
思维启示:(1)每行语句前边有一个数字,我们称这个数字为行号,它的作用表示该行在伪代码中的位置和执行顺序.
(2)If语句和Goto?语句两个语句可结合能够实现循环.
变式训练:用辗转相除法、更相减损术求228,1
995最大公约数.
分析:使用辗转相除法,我们就根据a=nb+r这个式子,反复执行,直到r=0为止.用更相减损术我们就根据r=a-b这个式子,反复执行就可.
解:所以有以下解法:
用辗转相除法:
1
995=8×228+171
228=1×171+57
171=3×57+0
所以:57就是228和1
995的最大公约数.
用更相减损术:
1
995-228=1
767
1
767-228=1
539
1
539-228=1
311
1
311-228=1
083
1
083-228=855
855-228=627
627-228=399
399-228=171
228-171=57
171-57=114
114-57=57
57-57=0
则57就是228,1
995的最大公约数.
思维启示:由该题可以看出,辗转相除法得最大公约数步骤较少,而更相减损术运算简易,两种方法各有所长.
【例2】
用二分法设计一个求方程x2-2=0的近似根的算法.
思路分析:回顾二分法解方程的过程,并假设所求近似根与精确解的差的绝对值不超过?0.005?,则不难设计出以下步骤:
第一步:令f(x)=x2-2.因为f(1)<0,
f(2)>0,所以设x1=1,x2=2.
第二步:令m=,判断f(m)是否为0.若是,则m为所求;若否,则继续判断f(x1)·?f(m)大于0还是小于0.
第三步:若f(x1)·f(m)>0,则令x1=m;否则,令x2=m.
第四步:判断|x1-x2|<0.005是否成立?若是,则x1,x2之间的任意取值均为满足条件的近似根;若否,则返回第二步.
解:流程图如图:
伪代码:
10
f(x)←x∧2-2
20
Read“输入误差ε和初值x1,x2”;ε,
x1,x2
30 m←(x1+x2)/2
40
If
f(m)=0
Then
Goto
110
50
If
f(x1)f(m)>0
Then
60
x1←m
70
Else
80
x2←m
90
End
If
100
If
ABS
(x1-x2)>=ε
Then
Goto
30
110
Print
m
【例3】
相传在远古时代有一片森林,栖息着3种动物,凤凰、麒麟和九头鸟.凤凰有1只头2只脚,麒麟是1只头4只脚,九头鸟有9只头2只脚.它们这3种动物的头加起来一共是100只,脚加起来也正好是100只,问森林中各生活着多少只凤凰、麒麟和九头鸟?
思路分析:假设凤凰的只数为x,麒麟的只数为y,九头鸟的只数为z,那么,
(1)凤凰的只数x可能的取值为1~50,如果用伪代码表示,就应该如下:
For
x=1
To
50
Step
1
(2)麒麟的只数y可能的取值为1~25,如果用伪代码表示,就应该如下:
For
y=1
To
25
Step
1
(3)如果知道了凤凰和麒麟的只数后,那么九头鸟的只数就应该如下:
z=(100-x-y)/9.
如何考虑x、y、z三个变量之间的关系?
当凤凰x=1时(只在开始时),变量麒麟y的取值可以从1~25,让变量y从1开始取值(例如:y的值为1);
通过(100-x-y)/9表达式,计算出z的值;
完成上述步骤后,x、y、z三个变量都取到了自己相应的值,但是这三个值是否是正确的解呢?我们必须通过以下的两个条件来判断:
x+y+9×z=100
And
2×x+4×y+2×z=100.
如果全部满足,就输出x、y、z的值,如果不满足,就让y值加1,然后重复步骤(2)到步骤(4),直至y的取值超过25;
然后让x的取值加1后,重复步骤(1)到步骤(5)的操作,直至x的取值超过50为止,退出算法.
解:流程图和伪代码如下:
For
x
from
1
to
50
For
y
from
1
to
25
z←(100-x-y)/9
If
2x+4y+2z=100
then
Print
x,y,z
End
for
End
for
拓展迁移
【拓展点】
意大利数学家菲波契,在1202年出版的一书里提出了这样的一个问题:一对兔子饲养到第二个月进入成年,第三个月生一对小兔,以后每个月生一对小兔,所生小兔能全部存活并且也是第二个月成年,第三个月生一对小兔,以后每月生一对小兔,这样下去到年底应有多少对兔子.
思路分析:根据题意可知,第一个月有1对小兔,第二个月有1对成年兔子,第三个月有两对兔子,从第三个月开始,每个月的兔子对数是前面两个月兔子对数的和,设第N个月有F对兔子,第N-1个月有S对兔子,第N-2个月有Q对兔子,则有F=S+Q,一个月后,即第N+1个月时,式中变量S的新值应变第N个月兔子的对数(F的旧值),变量Q的新值应变为N-1个月兔子的对数(S的旧值),这样,用S+Q求出变量F的新值就是N+1个月兔子的数,依此类推,可以得到一个数序列,数序列的第12项就是年底应有兔子对数,我们可以先确定前两个月的兔子对数均为1,以此为基准,构造一个循环程序,让表示“第×个月的I从3逐次增加1,一直变化到12”,最后一次循环得到的F就是所求结果.
解析:流程图如图所示:
伪代码:
S←1
Q←1
I←3
While
I<=12
F←S+Q
Q←S
S←F
i←i+1
End
While
Print“兔子的对数为:”;F
End
PAGE
11.3.4 循环语句
案例探究
高一·五班共60人,市青少年保护中心来抽样检测同学们的身体素质,要求学号被3整除的同学参加体检.已知学生的学号是从1到60号,请编写输出参加同学学号的一个算法,画出流程图,并用伪代码表示.
解:算法设计:第一步:选择一个变量S表示学号,并赋给初值0;
第二步:开始进入While循环语句,首先判断S是否小于60;
第三步:写出循环体,用End
while来控制循环;
第四步:用End来结束程序.
流程图如图所示:
伪代码表示为:
S←0
While
S<60
S←S+3
Print
S
End
while
End
自学导引
1.循环语句是用来实现算法中的循环结构.
2.伪代码语言中的循环语句主要有两种类型,“For”语句和“While”语句.
3.For语句的一般格式为:For
I
from“初值”to“终值”step“步长……End
for.
4.“While”语句的一般格式为:.
5.当循环次数已经确定时可选用“For”语句来表示;当循环次数不能确定时,可选用“while”语句来表示.
疑难剖析
【例1】
求使1×2×3×…×n<5
000的最大整数n,画出流程图,并用伪代码表示.
思路分析:本题是一个连乘积问题,一般情况下选用循环语句设计算法.由于不能确定循环次数,所以可运用“While”语句来实现.
解:流程图如图:
用伪代码表示为:
n←1
S←1
While
S<5
000
S←S
n
n←n+1
End
while
Print
n-1
End
思维启示:对于数学中有规律的连乘积问题一般选用循环语句来设计算法.循环语句包括?For语句循环和While语句循环,解题时要根据需要灵活运用.
【例2】
设计求+++…+的值的算法,用伪代码表示.
思路分析:本题可以用迭代的方法,+++…一个数一个数的向上加,直到加到为止,于是可以选用循环语句来设计算法.
解法1:S←0
For
I
from
1
to
1
000
step
1
S←S+1/i
End
for
Print
S
End
解法2:S←0
i←1
While
i<=1
000
S←S+
i←i+1
End
while
Print
S
End
【例3】
如果我国工农业产值每年以9%增长率增长,问几年后我国产值翻一番.画出流程图;并用伪代码表示.
思路分析:根据问题,我们先设原来产值p(基数)为100,然后每年底计算一次增长后产值,如果未达到200,就再计算下一年产值,直到某一年产值达到或超过200为止,我们按此思路画出程序框图.
解:流程图如图所示:
用伪代码表示为:
p←100
R←0.09
n←0
While
p<200
p←p
(1+R)
n←n+1
End
while
Print
n
End
思维启示:解决此问题需要我们理解变量n,用n来累计经历的年数,每执行一次循环,n就加1,表示又经历了一年.
【例4】
根据下面程序,画出其算法的流程图.
i=-1
While
i<=1
x←i
f(x)←x∧3
i←i+0.2
Print“f(x)”;f(x)
End
While
End
思路分析:可以看出这是一个有循环语句的程序,第一次循环取x=-1,第二次取x=-1+0.2+……最后一次取x=1,实际上就是把区间[-1,1]10等分,求该函数在各分点和区间端点的函数值问题.
解析:流程图如图:
拓展迁移
【拓展点】
相传古代印度国王舍罕要褒赏他聪明能干的宰相达依尔(国际象棋的发明者),问他需要什么,达依尔说:“国王只要在国际象棋的棋盘第一格子放一粒麦子,第二个格子上放两粒,第三个格子里放四粒,以后按此比例每一格加一倍,一直放到第64格(国际象棋是8×8=64格),我就感恩不尽,其他什么也不要了.”国王想:“这有多少,还不容易!”让人扛来一袋小麦,但不到一会儿就全用没了,再来一袋很快又没有了,结果全印度的粮食都用完还不够,国王很奇怪,怎么也算不清这笔账.一个国际象棋棋盘一共能放多少小麦粒
试用流程图表示其算法,并用伪代码表示.
思路分析:根据题目可知
第一个格 放1粒=20
第二个格 放2粒=21
第三个格 放4粒=22
第四个格 放8粒=23
…… ……?
第六十四格 放263粒
则此题就转化为求1+21+22+23+24+…+263的和的问题.我们引入一个累加变量Sum,一个计数变量i,累加64次就能算出一共有多少粒小麦.
解析:流程图如图:
用伪代码表示为:
i←0
Sum←0
While
i<=63
Sum←Sum+2∧i
i←i+1
End
While
Print
Sum
End
PAGE
1