2.1.2 系统抽样
案例探究
某高一年级共有20个班,每班有50名同学,为了了解高一学生的视力状况,从这1
000名学生中抽取100名作为样本进行检查应该怎样抽取?
分析:本题总体元素个数较大,样本容量也较大,采用简单随机抽样,比较费事.这时,我们可以按照这样的方法来抽样:首先将这1
000名学生从1开始进行编号,然后按号码顺序以一定的间隔进行抽取,由于1
000:100=10,这个间隔可以定为10,即从号码为1~10的第一个间隔中随机的抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到
6,16,26,36,46,…,996.这样我们就得到一个容量为50的样本.这种抽样方法是一种系统抽样.
将总体分成均衡的若干部分,按照预先制定的规则从每一部分抽取一个个体,得到所需样本的抽样叫做系统抽样.
一般的,假设要从容量为N的总体中抽取容量为n的样本我们可以按下列步骤进行系统抽样:
第一步:先将总体的N个个体进行编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
第二步:确定分段间隔k对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;
第三步:在第一段用简单随机抽样确定一个个体编号m(m≤k);
第四步:按照一定的规则抽取样本,通常是将m加上间隔k得到第二个个体编号(m+k),再加k得到第三个个体编号(m+2k),依次进行下去,直到获取整个样本.
注意:当N/n不是正整数时,令k=[N/n],即先从总体中用简单随机抽样的方法剔除N-nk个个体,再将其余的编号均分成k段.
如:若用系统抽样的方法从由21个个体组成的总体中抽一个容量为5的样本,可如下操作:
第一步:将21个个体用随机方式编号;
第二步:从总体剔除一个个体(剔除方法可用随机数表法),将剩下的20个个体重新进行编号,(分别为00,01,02,03,04
,…,19)并分成5段;
第三步:在第一段00,01,02,03这四个号中用简单随机抽样抽出一个(如02)作为起始号码;
第四步:将编号为02,06,10,14,18的个体抽出,组成样本.
自学导引
1.系统抽样是指:将总体分成均衡的若干部分,按照预先制定的规则从每一部分抽取一个个体,得到所需样本的抽样;
系统抽样的步骤:
(1)第一步:先将总体的N个个体进行编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)第二步:确定分段间隔k对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;
(3)第三步:在第一段用简单随机抽样确定一个个体编号m(m≤k);
(4)第四步:按照一定的规则抽取样本,通常是将m加上间隔k得到第二个个体编号(m+k),再加k得到第三个个体编号(m+2k),依次进行下去,直到获取整个样本.
2.在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样法从中抽取容量为20的样本,则每个个体被抽取的概率为( )
A.
B.
C.
D.
答案:D
3.为了了解参加一次知识竞赛的1
252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应剔除的个体数目是( )
A.4
B.5
C.6 D.2
答案:D
4.从容量为N的总体中抽取容量为n的样本,若用系统抽样法,则抽样间隔为( )
A.N/n
B.n
C.\ ?
D.\+1
答案:C
疑难剖析
【例1】
要从1
005名学生中选取一个样本容量为20的样本,试用系统抽样的方法给出抽样过程.
思路分析:考察用系统抽样方法抽取样本。
因为1
005=20×50+5,为了保证“等距”的分段,应先剔除5人.
解:第一步:将1
005名学生用随机方式编号;
第二步:从总体剔除5个(剔除方法可用随机数表法),将剩下的1
000名学生重新进行编号,(分别为000,001,002,003,…,999)并分成20段;
第三步:在第一段000,001,002,…,049这五十个号中用简单随机抽样抽出一个(如003)作为起始号码;
第四步:将编号为003,053,103,…953的个体抽出,组成样本.
思维启示:本题为了保证“等距”的分段,先剔除5人,对多余个体的剔除不影响总体中每个个体被抽到的可能性,仍然能保证抽样的公平性.
【例2】一个总体中共有100个个体,随机编号0,1,2,3,4,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )
思路分析:考察系统抽样方法中获取样本的方法.这是一个用系统抽样法抽取样本的问题,抽取的样本所对的编号与样本所在的组数有关.
解:根据题意,第7组中的号码是[60,69]内的正整数.
因为m=6,k=7,m+k=13,所以抽取的号码个位数为3,于是此号码为63.
思维启示:系统抽样方法中获得样本的方法可以按照一定的规律设定.
【例3】
从2
004名同学中,抽取一个容量为20的样本,写出系统抽样的步骤.
思路分析:考查系统抽样的四个步骤.
由于总体中的个体数为2
004,不能被样本用量20整除,这时可用简单随机抽样先从总体中剔除4个个体,然后再按系统抽样方法往下进行.
解:(1)可用简单随机抽样先从总体中剔除4个个体,然后再将剩余的2
000名同学采用随机的方法编号为0
001~2
000;
(2)将这2
000个号码按0
001~100为第一组,101~200为第二组,201~300为第三组,…,1
901~2
000为第二十组;
(3)在第一组采用抽签法抽出后两位为k(00~99)的号码;
(4)将其余各组中编号后两位为k的抽出,即可得到一个容量为20的样本.
思维启示:为了确定分段间隔,应先用简单随机抽样从总体中剔除4个个体,使剩下的总体中的个体数能被样本容量整除.
拓展迁移
【拓展点1】
从某工厂生产的802个零件中,随机的抽取80个测试规格尺寸,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,样本容量也较大,可用系统抽样法进行抽样.
解析:第一步:将802个零件用随机方式编号;
第二步:从总体剔除2个(剔除方法可用随机数表法),将剩下的800个零件重新进行编号,(分别为001,002,003,…,800)并分成80段;
第三步:在第一段001,002,…,010,这十个号中用简单随机抽样抽出一个(如003)作为起始号码;
第四步:将编号为003,013,023,…793的个体抽出,组成样本.
思维启示:802不能被80整除,为了保证等距分段,应先剔除2个.
【拓展点2】
从某工厂生产的802个零件中,随机的抽取8个测试规格尺寸,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,样本容量较小,可用随机数法进行抽样.
解析:第一步,现将802个零件用速记方式编号,可以编为001,002,003,…,802;
第二步,在随机数表中任选一个数,例如选出第8行第29列的数7;
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下),每次读3位,凡不在001~802中的数跳过去不取,遇到已经读过去的数也不取,便可依次得到751,286,735,443,387,211,234,297.这样8个号码就是所要抽取的8个样本个体的号码.
思维启示:本小题若用系统抽样法,每段的个体数较大不方便.
【拓展点3】
从某工厂生产的20个零件中,随机的抽取8个测试规格程度,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较小,样本容量也较小,可用抽签法进行抽样.
解析:(1)将20个零件用随机方式编号,分别为01,02,03,…,20.
(2)将这20个号码分别写在相同的20张纸片上.
(3)将这20张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满8个号码时终止.
(4)从总体中将与抽到的号签的编号相一致的个体取出,这样就得到了所要抽取的样本.2.1.3 分层抽样
庖丁巧解牛
知识·巧学
一、分层抽样的概念
当已知总体由差异明显的几部分组成时,不宜用简单随机抽样和系统抽样,为了使样本更能充分地反映总体的情况,应将总体分成互不交叉的几部分,然后按照各部分所占的比例,从各部分中独立抽取一定数量的个体,再将各部分抽出的个体合在一起作为样本,这种抽样方法叫做分层抽样.其中所分成的每一部分叫层.
根据定义可知,分层抽样使用的前提是总体可以分层,层与层之间有明显的区别,互不重叠,而层内个体间差异很小,每层中所抽取的个体数可按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即.这样抽取能使所得到的样本结构与总体结构基本相同,可以提高样本对总体的代表性.
深化升华
分层抽样具有以下主要特点:
(1)适用于总体由差异明显的几部分组成的情况;
(2)在每一层进行抽样时,采用简单随机抽样或系统抽样;
(3)它能充分利用已掌握的信息,使样本具有良好的代表性;
(4)它也是等可能性抽样,每个个体被抽到的可能性都是.而且在每层抽样时,可以根据具体情况采用不同的抽样方法.
二、分层抽样的一般步骤
分层抽样的操作步骤是:
(1)分层:将总体按某种特征分成若干部分.
(2)确定比例:计算各层的个体数与总体的个体数的比.
计算出抽样比k=
(3)确定各层应抽取的样本容量.
(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.
(5)汇合成样本.
学法一得
①分层抽样时,各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,每一个个体被抽到的可能性都是相等的;每一层抽样中采用简单随机抽样或系统抽样.②由于分层抽样充分利用了我们所掌握的信息,使样本具有较好的代表性,而且在各层抽样时可以根据具体情况采取不同的抽样方法,所以分层抽样在实践中有着非常广泛的应用.
三、三种抽样方法的比较
在具体情景中,需要我们准确地选择适当的抽样方法进行抽样.在各种方法间选择时,要遵循以下原则:
(1)若总体由差异明显的几个层次组成,则宜用分层抽样法.当抽样比与各层的个体数的乘积是整数时,则该积就是该层的入样数;当抽样比与各层的个体数的乘积不是整数时,则该积经过四舍五入后就是该层的入样数.
(2)若总体中没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
①当总体容量较小时宜用抽签法;
②当总体容量较大,样本容量较小时宜用随机数表法;
③当总体容量较大,样本容量也较大时宜用系统抽样法.
三种抽样方法的优、缺点及相互之间的关系:
简单随机抽样:简单随机抽样是最基本的抽样方法,其他的各种随机抽样方法中大都会用到它.其优点是简便易行,缺点是当容量较大时难于操作,个体差异明显时所得样本无代表性.
系统抽样:优点是①系统抽样比其他随机抽样方法更容易实现,可节约抽样成本.②系统抽样比简单随机抽样的应用范围更广.它可以应用到个体有自然编号,但总体中个体的数目却在抽样时无法确定的情况(如生产线的产品的质量检验).
缺点是系统抽样所得样本的代表性和具体的编号有关(简单随机抽样所得样本的代表性与个体的编号无关).如果编号的个体特征随编号变化呈现一定的周期性,可能会使系统抽样的代表性很差.
分层抽样:优点是充分利用了已知的总体信息,得到的样本比前两种方法有更好的代表性,并且可得到各层的子样本以顾及各层的信息.
简单随机抽样、系统抽样、分层抽样的共同点是在抽样过程中每个个体被抽到的可能性相等,体现了这些抽样方法的客观性和公平性.其中简单随机抽样是最简单和最基本的抽样方法,在进行系统抽样和分层抽样时都要用到简单随机抽样的方法,抽样方法经常交叉起来使用.对于个体数量很大的总体,可采用系统抽样,系统中每一均衡部分,又可采用简单随机抽样.
辨析比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
每个个体被抽取的可能性相同
从总体中逐个抽取
总体中的个体数较少
分层抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样
总体由差异明显的几部分组成
系统抽样
按简单随机抽样抽取第一个样本,然后按相同的间隔抽取其他样本
抽取第一个样本时,采用简单随机抽样
总体中的个体数较多
典题·热题
知识点一
分层抽样的概念
例1
某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是(
)
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老年人中剔除1人,再用分层抽样
思路解析:由于总体由差异明显的三部分组成,考虑用分层抽样.
总体总人数为28+54+81=163(人).样本容量为36,若按36︰163取样本,无法得到整数解.故考虑先剔除1人,
抽取比例变为36︰162=2︰9,则中年人取54×=12(人),青年人取81×=18(人),
应从老年人中剔除1人,老年人取27×=6(人),组成容量为36的样本.
∴应选D.
答案:D
误区警示
通过以上的实例分析可以感悟到,在具体情景中,需要我们准确地选择适当的抽样方法进行抽样.各种方法间选择时,要遵循以下原则:(1)若总体由差异明显的几个层次组成,则宜用分层抽样法.当抽样比与各层的个体数的乘积是整数时,则该积就是该层的入样数;当抽样比与各层的个体数的乘积不是整数时,则该积经过四舍五入后就是该层的入样数.
知识点二
分层抽样的过程与步骤
例2
选择合适的抽样方法抽样,写出抽样过程.
(1)30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样;
(3)有甲厂生产的300个篮球,抽取10个入样;
(4)有甲厂生产的300个篮球,抽取30个入样.
思路分析:应结合三种抽样方法的使用范围和实际情况灵活使用各种抽样方法解决问题.
解:(1)总体由差异明显的几个层次组成,需选用分层抽样法.
第一步:确定抽取个数,30/10=3,所以甲厂生产的应抽取21/3=7个,乙厂生产的应抽取9/3=3个;
第二步:用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本;
(2)总体容量较小,用抽签法.
第一步:将30个篮球编号,编号为00,01,…,29;
第二步:将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
第三步:把号签放入一个不透明的袋子中,充分搅匀;
第四步:从袋子中逐个抽取3个号签,并记录上面的号码;
第五步:找出和所得号码对应的篮球.
(3)总体容量较大,样本容量较小,宜用随机数表法.
第一步:将300个篮球用随机方式编号,编号为001,002,…,299;
第二步:在随机数表中随机地确定一个数作为开始,如第8行第29列的数7开始,任选一个方向作为读数方向,比如向右读;
第三步:从数7开始向右读,每次读三位,凡不在001—299中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到286,211,234,297,207,013,027,086,284,281这10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大,宜用系统抽样法.
第一步:将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段;
第二步:在第一段000,001,002,…,009这三个编号中用简单随机抽样抽出一个(如002)作为起始号码;
第三步:将编号为002,012,022,…,292的个体抽出,组成样本.
巧解提示
在解决问题的过程中,应结合三种抽样方法的使用范围和实际情况灵活使用各种抽样方法.
问题·探究
方案设计探究
问题
为了考查某校的教学水平,将抽查这个学校高三年级的部分学生的本学年考试成绩进行考查,为了全面地反映实际情况,采取以下三种方式进行抽查:(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了号,假定该校每班学生人数都相同)
(1)从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;
(2)每个班都抽取1人,共计20人,考察这20个学生的成绩;
(3)把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考查.(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人)
试探究上面三种抽取方式各自抽取样本的步骤.
探究过程:(1)这三种抽取方式中,其总体都是指该校高三年级全体学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年度的成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本年度的成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本年度的成绩,样本容量为100;
(2)上面三种抽取方式中,第一种方式采用的方法是简单的随机抽样法;第二种方式采用的方法是简单的随机抽样法和系统抽样法;第三种方式采用的方法是简单的随机抽样法和分层抽样法;
(3)第一种方式抽样的步骤如下:第一步,在这20个班中用抽签法任意抽取一个班;第二步,从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.
第二种方式抽样的步骤如下:第一步,在第一个班中,用简单的随机抽样法任意抽取某一学生,记其学号为a;第二步,在其余的19个班中,选取学号为a的学生,共计20人.
第三种方式抽样的步骤如下:第一步,分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次;第二步,确定各个层次抽取的人数.因为样本容量与总体的个体数之比为100∶1
000=1∶10,所以在每个层次抽取的个体数依次为150/10,600/10,250/10,即15,60,25;第三步,按层次分别抽取.在优秀生中用简单的随机抽样法抽取15人,在良好生中用简单的随机抽样法抽取60人,在普通生中用简单的随机抽样法抽取25人.
探究结论:三种抽样方法都是一种等几率抽样,经常交叉起来使用,比如,分层抽样中,若每层中个体数量仍很大,则可辅之系统抽样,系统中的每一均衡的部分,又可采用简单随机抽样.为熟练掌握三种抽样方法,应结合具体实例,多分析,多实践,从解决问题的过程中体会三种抽样方法的特点和用法,进一步理解抽样的必要性和统计的基本思想.2.1.1
简单随机抽样
庖丁巧解牛
知识·巧学
一、简单随机抽样实施的方法
1.抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
辨析比较
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时费力不方便且可能导致抽样不公平.
抽签法的一般步骤:
(1)将总体中的N个个体编号;
(2)将这N个号码写在形状、大小相同的号签上;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽取1个号签,连续抽取k次;
(5)将总体中与抽到的号签的编号一致的k个个体取出.
抽签法在使用时,我们应该注意以下几点:
(1)编号是为了所有个体和号签建立一一对应的关系,这样抽取号签就是抽取相应个体;
(2)号签要求形状、大小相同的目的是使每个号签没有任何区别,保证抽样的公平性;
(3)将号签均匀搅拌的目的是为了抽签的随机性;
(4)抽取时我们应该采取无放回的抽取,目的是保证抽出的号签不会重复.
方法点拨
(1)将个体编号时,可利用已有的编号,例如:学生的学号、座位号等.
(2)当总体个数不多时,适宜采用此方法.
2.随机数表法:按照一定的规则到随机数表中选取号码的抽样方法.
随机数表法抽取样本的步骤:
①将个体编号;
②在随机数表中任选一个数作为开始;
③从选定的数开始,按照一定抽样规则在随机数表中选取数字,取满足要求的数字就得到样本的号码.
深化升华
随机数表的制作:(1)抽签法;(2)抛掷骰子法;(3)计算机生成法.
随机数表法在使用时,我们应该注意以下几点:
①随机数表法是优于抽签法的一种抽签形式,它利用随机数表中的数字来对应抽出其个体,避免了抽签法制签这个麻烦过程.
②第一个数的选择必须是任意的,这样才能保证抽样的随机性,同时我们抽样的顺序并不固定,你可以向上、向下、向左、向右等等.
③在编号时,对于两位的编号,一般是将起始编号编为00,而不是01,它的好处在于它可使100个个体都用两位数码表示,否则将会出现3位数码100,也就是这样确定的起始号便于我们使用随机数表.
④要注意将数字大于个体编号和重复的数字跳过去,直到取出和样本容量相等的个体数为止.
辨析比较
随机数表法的优点:简单易行,解决了总体数量较多时抽签法的缺点.
缺点:当总体数量很多、需要的样本容量很大时,用随机数表法仍不方便.
二、简单随机抽样
所谓简单随机抽样就是从个体数为N的总体中不重复地取出n个个体(n<N),并且每个个体都有相同的机会被取到.其中抽签法、随机数表法都属于简单随机抽样.
简单随机抽样的特点如下:
①它要求被抽取样本的总体个数是有限的.这样便于通过随机抽取的样本对总体进行分析;
②它是从总体中逐个地进行抽取.这样便于抽样在实践中进行操作;
③它是一种不放回的抽样.由于抽样在实践中多采用不放回抽样,使其具有广泛的实用性,而且由于抽取的样本没有重复的个体,便于有关的分析和计算.
④它是等可能地抽取.由于抽取的随机性,在整个抽样过程中每一个个体被抽到的可能性相同,这样保证了抽样的公平性.
学法一得
对于简单随机抽样的理解
①在简单随机抽样的定义中,“总体内的各个个体被抽到的机会都相等”是“是总体中的所有个体搅拌均匀”的统计描述.
②随机抽样所得的样本具有随机性:在一个总体中不同的随机抽样所得的样本可以是不同的.
③统计结果的错误来源:一是样本的代表性差:由抽样方法引起,或者由样本的随机性引起.二是错误数据:抽取样本数据过程中,由于测量、数据抄录等错误得到错误的数据.
典题·热题
知识点一
简单随机抽样——抽签法
例1
高一(5)班有50名同学,现要从中选出6人参加一个座谈会,请你用抽签法选出参加座谈会的6名同学.
思路分析:根据抽签法的特点和操作步骤一步一步地进行即可.
解:按照抽签法的操作步骤,可按如下进行:
①给50名同学编号,号码为01,02,…,50;
②将这50名同学的编号分别写在一张小纸条上,揉成小球,制成号签;
③将得到的号签放在一个不透明的盒子里,搅拌均匀;
④从盒子中逐个抽取6个号签,并记录上面的编号,如02,21,26,08,45,17;
⑤对应上面6个编号的同学就是参加座谈会的同学.
方法归纳
抽签法的优点是:简单易行.当总体的个体数较少时,“均匀搅拌”易操作,能使每个个体都有均等机会被抽中,从而能够保证样本的代表性.
缺点是:仅适用于个体数较少的总体,当总体容量较大时,费时费力不方便,也不易搅拌均匀,可能导致抽样不公平.
知识点二
简单随机抽样——随机数表法
例2
我们要从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,写出操作步骤.
思路分析:因为共有800袋牛奶,数量比较多,要全部抽签的话比较烦琐,故必须用随机数表法.
解:可以按照下面的步骤操作:
第一步:将800袋牛奶编号,号码为000,001,……,799;
第二步:在随机数表中任选一个数作为开始,如选出第8行第7列的数7;
第三步:从选定的数7开始向右读,得到的数码若不在编号000—799中,则跳过;若在编号中,则取出.得到的数码若在前面已经取出,也跳过.如此进行下去,直到取满为止;
第四步:根据选定的号码抽取样本.
误区警示
对个体进行编号时,号码位数必须相同.这里的起始号是000,而不是001.
例3
为了检验某种作业本的印刷质量,决定从一捆(40本)中抽取10本进行检查,利用随机数表抽取这个样本时,应按怎样的步骤进行?
思路分析:随机数表法的步骤:第一步,编号;第二步,在随机数表中按一定的规律选出所需号码;第三步,根据所选号码取出样本.
解:严格按照随机数表法的步骤进行就可以:
第一步,先将40本作业本编号,可编为00,01,02,…,39.
第二步,在附录1随机数表中任选一个数作为开始.如从第8行第5列的数59开始.为了便于说明,现将附录1中的第6行至第10行摘录如下.
16
22
77
94
39
49
54
43
54
82
17
37
93
23
78
87
35
20
96
43
84
26
34
91
64
84
42
17
53
31
57
24
55
06
88
77
04
74
47
67
21
76
33
50
25
83
92
12
06
76
63
01
63
78
59
16
95
55
67
19
98
10
50
71
75
12
86
73
58
07
44
39
52
38
79
33
21
12
34
29
78
64
56
07
82
52
42
07
44
38
15
51
00
13
42
99
66
02
79
54
57
60
86
32
44
09
47
27
96
54
49
17
46
09
62
90
52
84
77
27
08
02
73
43
28
第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,由于16<39,将它取出;继续下去,可得到19,10,12,07,39,38,33,21,后面一个是12,由于在前面12已经取出,将它去掉;再继续读,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是
16,19,10,12,07,39,38,33,21,34.
巧解提示
随机数法的特点:
优点:简单易行.它很好地解决了用抽签法当总体中的个体数较多时制签难的问题.
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数法抽取样本仍不方便.
例4
高一(1)班有学生60人,为了了解学生对目前高考制度的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.
思路分析:简单随机抽样方法有抽签法和随机数表法.注意到该问题中总体的个体数不多,所以采用抽签法或随机数表法都能获取样本,从而有以下两种解法:
(1)采用抽签法,进行如下操作即可获得所需样本.
①编号,即对这60名学生编号;
②写签制签,即将这60个号码分别写在60张相同纸片上;
③搅拌均匀,即放到一盒子里搅匀;
④抽签,逐个抽取,记下号码,到10个终止.
(2)采用随机数表法,需完成以下三步:
①编号;
②选定随机数表中的起始数;
③从选定的起始数开始读下去,直到取满10个为止.
解法一(抽签法):
(1)将这60名学生按学号编号,分别为1,2,…,60;
(2)将这60个号码分别写在60张相同纸片上;
(3)将这60张相同纸片,放到一个盒子里搅拌均匀;
(4)抽出一张,记下上面的号码,然后再搅拌均匀,接着抽取第二张,记下号码.重复这个过程直到取到10个号码为止.
这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
解法二(随机数表法):
①将60名学生编号,可以编为00,01,02,…,59.
②选定随机数表中的起始数,如指定从随机数表中的第2行第2列的数74开始.
③从选定的起始数74开始向右读下去,得到24,下一个是67,由于67>59,跳过去,继续,下一个是62,由于62>59,再跳过去,继续读,得到下一个42,
…如此下去,又得到14,57,20,53,32,37,27,07(后重复出现的跳过去),至此,10个样本号码已经取满.
于是所要抽取的样本号码是24,42,14,57,20,53,32,37,27,07,这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
方法归纳
判断抽样方法是否是简单随机抽样,可依据简单随机抽样所具备的4个特点进行.
采用简单随机抽样(抽签法或随机数表法)时,必须先对所有个体进行编号.用抽签法时,注意“搅匀”;用随机数表抽样时,开始数和读数方向是任意的.
问题·探究
方案设计探究
问题
假定一个总体含有6个个体,要通过逐个抽取的办法从中抽取一个容量为2的样本,在整个抽样过程中每个个体被抽到的机会是否均等?
探究过程:
回答是肯定的.事实上,对于总体中的任一指定个体a来说,在抽取第一个个体时,它被抽到的几率是,同样可以证明,个体a第一次未被抽到,而第二次被抽到的几率也是,因此个体a被抽到的几率是+=.说明在抽样过程中每个个体被抽到的可能性都是.
探究结论:通过这个问题同样可以说明在日常生活中抽签法是公平的,即先抽后抽可能性相等.2.1.2 系统抽样
庖丁巧解牛
知识·巧学
一、系统抽样的概念
当总体中个体数较多时,样本容量就不宜太小,采用简单随机抽样抽取样本,就显得费事.这时可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取1个个体,得到所需样本,这种抽样方法叫做系统抽样.
在系统抽样中,由于抽样的间隔相等,因此系统抽样也被称作等距抽样(或叫机械抽样).
从元素个数为N的总体中抽取容量为n的样本,如果总体容量能被样本容量整除,则设k=,分为n组,每组k个,然后在第一组的1到k中随机抽出一个数s作为起始数,再顺次抽取第s+k,s+2k,…,s+(n-1)k个数,这样就得到了容量为n的样本.
系统抽样有以下特征:
(1)当总体容量N较大时,采用系统抽样.
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[].
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
二、系统抽样的一般步骤
一般地,从容量为N的总体中抽取容量为n的样本,用系统抽样的一般步骤是:
(1)采用随机的方式将总体中的个体编号(编号方式可酌情考虑,为方便起见,有时可直接利用个体所带有的号码,如学生的准考证号、街道门牌号等);
(2)确定分段间隔k,对总体编号分段,
①当是整数时,取k=;
②当不是整数时,通过从总体中随机剔除一些个体使剩余个体数N′能被n整除,这时k=;
(3)在第一段用简单随机抽样确定第一个个体编号l;
(4)按照事先确定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获得整个样本.
误区警示
上述过程中,总体中的每个个体被取出(或被剔除)的可能性相等,也就是每个个体不被选取(或不被剔除)的可能性也相等,另外在第一段抽样时,采用的是简单随机抽样,每个个体被抽到的可能性均等,所以在整个抽样过程中每个个体被抽取的机会仍然都相等,这说明使用系统抽样法抽取样本的过程是公平的.
三、系统抽样与简单随机抽样的联系
类别
特点
相互联系
适用范围
共同点
简单随机抽样
从总体中逐个抽取
抽签法和随机数表法
总体中的个体数较少
抽样过程中每个个体被抽到的可能性相等
系统抽样
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
典题·热题
知识点一
随机抽样与系统抽样的区别
例1
从编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是(
)
A.5,10,15,20,25
B.3,13,23,33,43
C.1,2,3,4,5
D.2,4,6,16,32
思路分析:可分为5组,每组10枚,采用系统抽样,所选的号码应该间隔相等且间隔为10.
答案:B
例2
下列抽样实验中,最适宜用系统抽样法的是(
)
A.某市的4个区共有2
000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.从某厂生产的2
000个电子元件中随机抽取5个入样
C.从某厂生产的2
000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
思路分析:A中总体有明显层次,不适用系统抽样法;B中样本容量很小,适宜用简单随机抽样法中的随机数表法;D中总体数很小,故适宜用抽签法.只有C比较符合适用系统抽样法.
答案:C
方法归纳
简单随机抽样适用于总体中的个体数较少时,系统抽样适用于总体元素个数较多的抽样.
知识点二
系统抽样的抽样方法与过程
例3
为了了解济南市高一学生实行新课标后期末考试数学科的成绩,拟从参加考试的15
000名学生的数学成绩中抽取容量为150的样本.请用系统抽样法写出抽样的过程.
思路分析:由于总体容量恰能被样本容量整除,所以分段间隔k==100;以下按系统抽样的4个步骤抽取样本.
解:用系统抽样法抽取样本的过程如下:
①对全体学生的数学成绩进行编号:1,2,3,…,15
000;
②分段:由于样本容量与总体容量的比是1∶100,所以我们可将总体平均分为150个部分,其中每一部分包含100个个体;
③在第一部分,即1号到100号中用简单随机抽样,抽取一个号码,比如是56;
④以56作为起始数,然后顺次抽取156,256,356,…,14
956.这样就得到容量为150的一个样本.
方法归纳
从上面的分析,可以发现系统抽样有以下特点:
(1)适用于个体数较多,但均衡的总体;
(2)系统抽样与简单随机抽样的联系在于:在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
(3)在整个抽样过程中,每个个体被抽取的几率都是.
例4
海滨中学有职工1
021人,其中管理人员20人.现从中抽取非管理人员40人,管理人员4人组成代表队参加某项活动.你认为应如何抽样?
思路分析:由于样本来自不同层次,所以适宜分别用不同的抽样方法.从1
001名非管理人员中抽取40人,适宜用系统抽样法;从20名管理人员中抽取4人,适宜用抽签法.
解:首先在1
001名非管理人员中抽取40人,用系统抽样法抽样过程如下:
第一步:将1
001名职工用随机方式编号;
第二步:从总体中剔除1人,将剩下的1
000名职工重新编号(分别为001,002,…,1
000),并分成40段,每段25人;
第三步:在第一段001,002,…,025这25个编号中,用简单随机抽样法抽出一个(如003)作为起始号码;
第四步:将编号为003,028,053,…,978的个体抽出.
然后再从20人中,抽取4人,用抽签法,其操作过程如下:
第一步:将20名管理人员用随机方式编号,编号为01,02,…,20;
第二步:将这20个号码分别写在一个小纸条上,揉成小球,制成号签;
第三步:把得到的号签放入一个不透明的盒子里,充分搅匀;
第四步:从盒子中逐个抽取4个号签,并记录上面的编号;
第五步:从总体中将与抽到的号签的编号相一致的个体取出.
由以上两类方法得到的个体便是代表队队员.
方法归纳
(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本.
(2)系统抽样所得到的样本的代表性和具体的编号有关;而简单随机抽样抽取的样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如,如果学号按照男生单号女生双号的方法编排,那么用系统抽样的方法抽取的样本就会是全部为男生或全部为女生,因此在编号时一定要采用随机编号.
(3)从对总体的代表性看,系统抽样方法的第一段是简单随机抽取,而以后为等距离抽取,不如简单随机抽样中所有个体都是相互独立的被选机会那样有更强的代表性;但从抽取个体在总体中分布的均匀看,系统抽样的个体比简单随机抽样在总体中的分布更均匀,即从不同角度,两种方法各有优越性.
由此可见,采用系统抽样法抽取样本,与用简单随机抽样法抽取样本相比虽不能提高样本的代表性,但抽样过程操作起来方便很多.
问题·探究
交流讨论探究
问题
在系统抽样的过程中,哪些因素容易使抽取的样本不具有代表性?该怎样避免此类偏差的产生呢?
探究过程:人物甲:我们在研究咱们班同学身高的时候发现了这样一个问题,由于我们班每排有8个人,我们采用系统抽样的时候抽样距是8,结果我们计算结果总是不太合乎常理,后来我们发现主要是由于抽样距规定的恰好与每排的人数相同,这样我们在抽取的样本很容易偏高或偏低,所以我们的结果误差较大.
人物乙:我也想到一种情况:比如我们想了解某一时刻公交车上的人数,若我们选择的每隔7天抽样一次的话,可能也会产生较大的误差,因为一周有7天,这样做的话就不能合理地调查一周当中其他时间的乘车人数,所以不准确.
人物丙:若个体的编号是按某种顺序进行编排的,那么再利用系统抽样的方法进行抽样时,就很可能产生偏高或偏低的情况,这样统计的结果是不准确的,因为这样所抽取的样本已不能很好地代表总体的水平.
人物丁:这样行不行呢?在应用时,若总体的编号是按某种顺序进行的,则我们可以试着打乱编号的顺序,重新编号,再进行系统抽样;若总体的编号具有一定的周期性时,除了打乱编号的顺序重新编号外,也可以适当地改变抽样距进行抽样.
探究结论:系统抽样所得样本的代表性和具体的编号有关,如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性差.2.1.1 简单随机抽样
案例探究
假设你作为一个产品质量检查员,要考察某公司生产的一批300克袋装牛奶的质量是否达标,你准备怎样做?
分析:显然,你只能从中抽取一定数量的牛奶作为检验的样本(为什么?).那么应当怎样获取样本呢?
设计抽样方法时,在考虑样本代表性的前提下,应尽量使抽样过程简便易行.
获得样本牛奶的一个方法就是,将这批袋装牛奶“搅拌均匀”,然后不放回的摸取(以保证每袋牛奶被抽中的机会相等)这样我们就可以得到一个简单的随机样本,这样的抽样方法就是简单随机抽样.
一般地,设一个总体的个体总数为N,如果通过逐个抽取的方法从中抽取样本,且每次抽取时总体的各个个体被抽到的机会都相等,就称这样的抽样为简单随机抽样.
事实上:用简单随机抽样的方法从个体数为N的总体中逐次抽取一个容量为n的样本,那么每次抽取时,各个个体被抽到的机会相等,在整个抽样过程中每个个体被抽到的机会都等于.
由于简单随机抽样体现了抽样的客观性和公平性,且这种抽样方法比较简单,所以成为一种基本的抽样方法.如何实施简单抽样呢?下面介绍两种常用方法.
(1)抽签法
先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等.
(2)随机数表法
下面举例说明如何用随机数表来抽取样本.
为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:
第一步,先将40件产品编号,可以编为00,01,02,…,38,39;
第二步,在附录1随机数表中任意选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下:
16
22
77
94
39 49
54
43
54
82
17
37
93
23
78 87
35
20
96
43
84
26
34
91
64
84
42
17
53
31 57
24
55
06
88
77
04
74
47
67 21
76
33
50
25
83
92
12
06
76
63
01
63
78
59 16
95
55
67
19
98
10
50
71
75 12
86
73
58
07
44
39
52
38
79
33
21
12
34
29 78
64
56
07
82
52
42
07
44
38 15
51
00
13
42
99
66
02
79
54
57
60
86
32
44 09
47
27
96
54
49
17
46
09
62 90
52
84
77
27
08
02
73
43
28
第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.
至此,10个样本号码已经取满,于是,所要抽取的样本号码是16 19 10 12 07 39 38 33 21 34.
注:将总体中的N个个体编号时可以从0开始,例如N=100时编号可以是00,01,02,…,99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表.
当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.在上面每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.由于随机数表中每个位置上出现哪一个数字是等可能的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等可能的.因而利用随机数表抽取样本保证了各个个体被抽取的可能性相等.
自党导引
1.在统计中,总体、个体、样本、样本容量分别指的是什么?为什么通常是从总体中抽取一个样本,通过样本来研究总体?
答案:在统计中,所有考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.由于我们所要考察的总体中的个体数往往很多,且有时虽然总体中的个体数目不是很多,但考察时带有破坏性,因此通常是从总体中抽取一个样本,通过样本来研究总体.
2.为了了解某校高一学生在2005~2006学年度第二学期期末考试情况,要从该年级800名学生中抽取200名进行数据分析,则在这次考察中,考察的总体数为800,样本容量为200.
3.某地有2
000人参加自学考试,为了解他们的成绩,从中抽取一个样本,若每个考生被抽到的机率都是百分之四,则这个样本的容量是80.
4.下列抽取样本的方式是否属于简单随机抽样?说明理由.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有100个零件,从中选取8个零件进行质量检测,在抽样操作时,从中任意抽取一个零件进行检测后再把它放回盒子里.
答案:(1)不是简单随机抽样,由于被抽去样本的总体的个数是无限的,而不是有限的.(2)不是简单随机抽样,由于它是放回抽样.
5.为了检验某种产品个体质量,决定从60件产品中抽取15件进行检查,请利用随机数表法进行抽选,并写出抽样过程.
分析:依据随机数表抽去样本的三个步骤.
解:第一步,现将60件产品编号,可以编为00,01,02,03,…,58,59.
第二步,在随机数表中任选一个数,例如选出第7行第9列的数3.
第三步,从选定的数3开始向右读(读数的方向也可以是向左、向上、向下),两位、两位地读,得到一个两位数字31.由于31<59,说明号码31在总体内,将它取出;继续向右读数,又取出57、24、55、06当读到88时,由于88>59,将它去掉,再依次取下去,77>59,也将它去掉,依次再取出04、47、21、33、50、25、12当读到06时,它与前面的重复,将它取掉,再继续取下去,直到样本的15个号码全部取出.这样我们就得到一个样本容量为15的样本.
疑难剖析
1.随机抽样:
在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性.因此抽样时要保证每一个个体都可能被抽到,而且每一个个体被抽到的机会是均等的.满足这样条件的抽样是随机抽样.
2.简单随机抽样的特点:
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
(2)它是从总体中逐个地进行抽取.这样便于在抽样实践中进行操作.
(3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
(4)它每次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性.
【例1】
下面抽取样本的方式是简单随机抽样吗?为什么?
(1)从100个个体中一次性抽取10
个个体作为样本.
(2)从无限多个个体中抽取30个作为样本.
(3)盒子里共有80枝钢笔,今从中选取8个进行检测,在抽样操作时,从中任意的拿出一个钢笔进行质量检测后再把它放回箱子里.
思路分析:考查对简单随机抽样的定义及特点的理解和掌握.第(1)题中的“一次性”抽取不符合简单随机抽样的定义.第(2)题中的样本总体个数不是有限个.第(3)题中“放回抽样”不符合简单随机抽样的“不放回抽样”的特点.
解:(1)不是简单随机抽样,它是一次性抽取,不是逐个抽取,不符合简单随机抽样的定义.
(2)不是简单随机抽样,因为抽取的样本的总体的个数是无限的而不是有限的.
(3)不是简单随机抽样,因为它是放回抽样,这不符合简单随机抽样“不放回抽样”的特点.
思维启示:“一次性”抽取和“逐个”抽取不影响个体抽到的可能性,但“一次性“抽取不符合简单随机抽样的定义.这就要求我们必须搞清楚简单随机抽样的定义.
3.抽签法的优缺点:
优点:简单易行,当总体中的个体数不多时,使总体处于搅拌均匀的状态比较容易,这时每个个体有均等的机会被抽到,即抽签法能保证每一个个体入选样本的机会都相等,从而能保证样本的代表性.(得到样本是简单随机抽样).?
缺点:(1)当总体的个数较多时,对个体编号的工作量太大,制作号签的成本将会增加,使得抽签法成本高(费时、费力).(2)
号签很多时把它“搅拌均匀”就很困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加.?
【例2】
某车间有80名工人,为了了解该车间工人工作能力、态度等各个方面的情况,要从中抽取一个容量为20的样本,用抽签法确定抽取的工人.
思路分析:考查抽签法抽取样本步骤及特点:这是一个用抽签法从容量为80的总体中抽取一个容量为20的样本的案例,用抽签法的步骤设计.
解:(1)将80名工人编号,分别为1、2、3、…80.
(2)将这80个号码分别写在相同的80张纸片上.
(3)将这80张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满20个号码时终止.于是和这20个号码对应的20个工人就构成了一个简单随机抽样.
思维启示:抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.
4.随机数表法抽取样本的优点和缺点:
优点:与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间.
缺点:产生的样本不是真正的简单样本.
拓展迁移
【拓展点1】
从某电动车厂生产的30辆电动车中,随机的抽取3辆进行测试,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较小,样本容量也较小,可用抽签法进行抽样.
解析:(1)将30辆电动车用随机方式编号,分别为01、02、03、…30.
(2)将这30个号码分别写在相同的30张纸片上.
(3)将这30张纸片放在一个盒子里搅拌均匀,抽出一张纸片记下上面的号码,然后再搅拌均匀,继续抽出第二张纸片,记下号码.重复这个过程直到取满3个号码时终止.
(4)从总体中将与抽到的号签的编号相一致的个体取出.这样就得到了所要抽取的样本.
思维启示:一个抽样试验能否用抽签法,关键看两点:一是制签是否方便,二是号签是否容易搅拌均匀.一般地,当总体容量较小,样本容量也较小时,可用抽签法.
【拓展点2】从某电动车厂生产的3
000辆电动车中,随机的抽取10辆进行测试,请合理选择抽样方法进行抽样,并写出抽样过程.
思路分析:因为总体容量较大,若用抽签法,制签复杂,将号签搅匀也不容易,所以可用随机数法进行抽样.
解析:第一步:将3
000辆电动车用随机方式编号,分别为0
001、0
002、03、…3
000.
第二步:在随机数表中任选一个数,例如选出第1行第26列的数“3”.
第三步:从选定的数“3”开始向右读(读数的方向也可以是向左、向上、向下),每次读4位,凡不在0
001—3
000中的数跳过去不取,遇到已经读过的数也不取,便可依次得到2
616,1
410,1
457,2
042,2
707,1
676,1
012,0
372,1
014,2
188;这10个号码对应的10辆汽车就是要抽去的对象.
思维启示:当总体容量较大,样本容量也较大时,可用随机数法进行抽样.2.1.3 分层抽样
案例探究
某个公司的员工有300人,其中不到35岁的有95人,35岁至49岁的有135人,50岁以上的有70人,为了了解这个公司员工与身体状况有关的某项指标,要从中抽取60名员工作为样本,员工年龄与这项指标有关,应该怎样抽取?
分析:为了使抽出的60名员工更充分地反映公司员工的整体情况,在各个年龄段可按这部分员工人数与员工总数的比进行抽样.
因为抽取人数与员工总数的比为60∶300=1∶5,
所以在各年龄段抽取的员工人数依次是,,,即19,27,14.
在各个年龄段分别抽取时,可采用前面介绍的简单随机抽样的方法,将各年龄段抽取的职工合在一起,就是所要抽取的60名员工.
像这样,当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成互不交叉的几部分,然后按照各部分在总体中所占的比例,从各部分中独立的抽取一定数量的个体,将各部分取出的个体合在一起作为样本,这种抽样方法叫做分层抽样,其中所分成的各部分叫做层.
可以看到,由于各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,分层抽样时,每一个个体被抽到的概率都是相等的.
由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着广泛的应用.
自学导引
1.当总体由差异明显的几部分组成时,通常采用分层抽样方法抽取样本.
2.某农场在三块地种有小麦,其中平地种有120
亩,河沟地种有30亩,坡地种有90亩,估产时,可按照4∶1∶3的比例从各块地中抽取样本.
3.某学校有教师180人,后勤服务人员40人,行政管理人员20人,要从中抽选24人参加学区召开的职工代表大会,为了使所抽的人员更具有代表性,分别应从上述人员中抽选教师18人,后勤服务人员4人,行政管理人员2人.
4.为了解初一学生的身体发育情况,打算在初一年级10个班的某两个班按男女生比例抽取样本,正确的抽样方法是( )
A.随机抽样
B.分层抽样
C.先用抽签法,再用分层抽样
D.先用分层抽样,再用随机数表法
答案:C
5.在简单随机抽样、系统抽样和分层抽样中,每个个体被抽到的可能性都相同的方法有( )
A.1种
B.2种
C.3种
D.0种
答案:C
疑难剖析
1.采用分层抽样方法抽取样本的步骤:
(1)分层;
(2)按比例确定每层抽取个体的个数;
(3)各层抽样(方法可以不同);
(4)汇合成样本.
2.采用分层抽样方法抽取样本的注意点:
(1)分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可以按各层个体数在总体上所占比例抽取,分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,只要分层恰当,一般说来抽样结果就比简单随机抽样更能反映总体情况.
(2)将总体分成几层,分层抽取时采用简单随机抽样和系统抽样.
【例1】
某校高中部有学生950人,其中高一年级学生350人,高二年级学生400人,其余为高三年级学生,若采用分层抽样从高中部所有学生抽取一个容量为190的样本,则每个年级应抽取多少人?
思路分析:考查分层抽样的抽取规则:按照各部分所占的比进行抽取.
总体个数N=950,样本容量n=190,n∶N=1∶5,各年级按照此比例即可得到应抽取的人数.
解:由题意知:高一、高二、高三年级学生数分别为350人,400人和200人.由于总体个数N=950,样本容量n=190,n∶N=1∶5,所以,高一年级应抽取的学生数为:350×=70;高二年级应抽取的学生数为:400×=80;高三年级应抽取的学生数为:200×=40.
答:高一、高二、高三年级应抽取的学生数分别为70人,80人和40人.
思维启示:当总体由差异明显的几部分组成时,采用分层抽样.抽取时要按照各部分所占的比进行抽取.各层抽样时可采用简单随机抽样或系统抽样.?
【例2】
某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12
000人,其中持各种态度的人数如下表所示:
很喜爱
喜爱
一般
不喜爱
2
435
4
567
3
926
1
072
电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中各应抽选出多少人?
思路分析:总体个数N=12
000,样本容量n=60,
n∶N=1∶200,各种态度的人按照这个比例即可得到应抽取的人数.
解:由题意知:很喜欢、喜欢、一般、不喜欢的人数分别为2
435人,4
567人,3
926人和1
072人.由于总体个数N=12
000,样本容量n=60,n∶N=1∶200,所以,应抽取很喜欢的人数为:2
435×≈12;应抽取喜欢的人数为:4
567×≈23;应抽取很一般的人数为:3
926×≈20;应抽取不喜欢的人数为:1
072×≈5.
答:应抽取很喜欢、喜欢、一般和不喜欢的人数分别为12人,23人,20人和5人.
思维启示:分层抽样的两个步骤:①先求出样本容量与总体的个数的比值;②按比例分配各层所要抽取的个体数.但应注意有时计算出的个体数可能是一个近似数,这并不影响样本的容量.
【例3】
一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法从这批产品中抽取容量为20的样本.
思路分析:系统抽样方法:将200件产品随机的分成20组,每组10个产品,每组用抽签的方法从中抽取一个产品,这样就得到了一个容量为20的样本.
分层抽样法:总体个数N=200,样本容量n=20,
n∶N=1∶10,各个级别的产品按照这个比例即可得到应抽取的产品数.
解:系统抽样方法:首先将这200件产品001,002,003,…,200进行编号,然后按号码顺序以一定的间隔进行抽取,由于200∶20
=10,这个间隔可以定为10,即从号码为001~010的第一个间隔中随机的抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到6,16,26,36,46,56,66,76,86,96,106,116,126,136,146,156,166,176,186,196,这样就得到了一个容量为20的样本.
分层抽样:由题意知:一级品,二级品,三级品分别有100个、60个、40个,由于总体个数N=200,样本容量n=20,n∶N=1∶10,所以,需要从一级产品中抽取100×=10;需要从二级产品中抽取60×=6;需要从三级产品中抽取40×=4;将一级品的100个产品按00,01,02,…,99编号,将二级品的60个产品按00,01,02,…,59编号,将三级品的40个产品按00,01,02,…,39编号,采用随机数表法,分别从中抽取10个、6个、4个,这样就得到了一个容量为20的样本.
思维启示:两种抽样方法都各有自己的优点,而分层抽样对本题来说更能体现实际情况.
拓展迁移
【拓展点1】某车运公司有货车1
201辆,客车
800辆,从中抽取1/10调查车辆的使用和保养情况,请给出抽样过程.
解析:第一步:明确货车和客车各应抽取多少辆,货车应抽取1
201×1/10≈120,客车应抽取800×1/10=80.第二步:用随机数表法剔除一辆货车.第三步:用系统抽样方法分别抽取货车120辆、客车80辆.这些货车和客车便组成了所要抽取的样本.
【拓展点2】
某单位有45名女职工,30名男职工,现调查平均工作量,准备抽取1/15,已知男女职工工作量有明显不同,应如何抽样?
解析:第一步:明确男女职工各应抽取多少名,男职工应抽取30×1/15=2,女职工应抽取45×1/15=3.第二步:抽取2名男职工和3名女职工,因为男职工30人抽出2人,女职工45人抽出3人,所以可用抽签法分别抽出2名男职工,3名女职工.这样便得到所要抽的样本.
思维启示:分层后,各层的个体数不大,所要抽的个体数也不多,可采用抽签法.