【课标要求】
1.掌握系统抽样的方法和操作步骤,会用系统抽样法进行抽样.
2.理解分层抽样的必要性,掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样,并亲自经历分层抽样法抽样的过程.
调查问卷的设计
分层抽样和系统抽样
自学导引
1.调查问卷的设计
调查问卷一般由一组 、有系统、 的题目组成.在调查问卷中,设计题目应注意符合以下要求:
(1)提问的内容要 .提问太长,会给回答带来困难和引起被调查者的反感,不利于得到正确的回答.
(2)用词要 , , 和 .
有目的
有顺序
简单明确
确切
通俗易懂
有礼貌
不用引导用词
2.分层抽样
(1)分层抽样的概念
分层抽样就是把总体A分成L个 :A=A1+A2+…+AL.
称这些子总体为层,称Ai为第i层.然后在每层中独立地进行 .
用N表示总体A的个体总数,用Ni表示第i层的个体总数时,有N= .
互不相交子总体
简单随机抽样
N1+N2+…+NL
层权
简单估计
(2)分层抽样有如下特点
①分层抽样在获得总体均值估计的同时,也得到各层的均值估计.
②将差别不大的个体分在同一层,使得分层抽样得到的样本更具有 ,从而提高估计的准确度.
③抽样调查的实施更加方便,调查数据的收集、处理也更加方便.
代表性
3.系统抽样
(1)系统抽样的概念
如果总体中的个体按一定的方式排列,在规定的范围内随机抽取 个体,然后按照 确定其他个体的抽样方法称为系统抽样方法(systematic sampling method).
最简单的系统抽样方法是取得一个个体后,按 的间隔抽取其他个体.
(2)系统抽样方法的主要优点是 ,只需要先随机抽取第一个个体,以后按规定抽取就可以了.系统抽样法不像随机抽样方法,随机抽样方法每次都要随机抽取个体.
一个
制定好的规则
相同
实施简单
自主探究
1.利用系统抽样从1 000多名学生中抽取50名参加数学竞赛,每个个体被抽到的可能性是多少?
2.应用分层抽样应遵循的要求是什么?
答案 (1)将相似的个体归为一类,即为一层,分层时要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于样本容量与总体个数之比.
预习测评
1.要采用分层抽样方法从100道选择题,50道判断题,50道填空题,20道解答题中选取22道题组成一份试卷,则从中选出填空题的道数是( ).
A.10 B.5 C.2 D.20
答案 B
2.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本.那么总体中应随机剔除的个体数目是( ).
A.2 B.4 C.5 D.6
解析 因为1 252=50×25+2,所以应随机剔除2个个体.
答案 A
3.从111个总体中抽取10个个体的样本,则每个个体入样的可能性为________;若采用系统抽样的方法抽样,则分段间隔k是________.
4.有A、B、C三种零件,分别为a个,300个,200个,采取分层抽样法抽取一个容量为45的样本,A种零件被抽取20个,则此三种零件共有________个.
答案 900
如果N不能被n整除,则可用简单随机抽样的方法从总体中剔除几个个体.使得总体中剩余的个体数能被样本容量整除.然后再编号、分段确定样本.这样每个个体被抽到的可能性还是一样的.
所以,系统抽样是公平的.
编号
第四步,按照一定的规则抽取样本.通常是将s加上间隔k得到第2个个体编号s+k,再加k得到第3个个体编号s+2k,依次进行下去,直到得到容量为n的样本.
3.分层抽样应注意的问题
(1)使用分层抽样的前提是总体可以分层,层与层之间有明显区别,而各层内个体间差异较小,每层中所抽取的个体数可按各层的个体数量在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,只要分层恰当,一般说来抽样结果比简单随机抽样更能反映总体情况.
(2)分层的标准要一致,层与层之间应互不重叠.
(3)分层抽样和简单随机抽样与系统抽样的关系:将总体分成几层,各层抽样时可采用简单随机抽样或系统抽样.
5.三种抽样方法的比较
(1)简单随机抽样
简单随机抽样是最基本的抽样方法,在其他的各种随机抽样方法中,大都会以某种形式引用它.
(2)系统抽样
①系统抽样比其他随机抽样方法更容易施行,可节约抽样成本.
②系统抽样所得样本的代表性和具体的编号有关(简单随机抽样所得样本的代表性与个体的编号无关),如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.
③系统抽样比简单随机抽样的应用范围更广,它可以应用到个体有自然编号,但是总体中个体的数目却在抽样时无法确定的情况(如生产线上产品的质量检验).
(3)分层抽样
充分利用了已知的总体信息,得到的样本比前两种方法有更好的代表性,并且可得到各层的子样本以估计各层的信息.
(4)应注意的问题
简单随机抽样、系统抽样、分层抽样的共同特点是在抽样过程中每一个个体被抽取的机会相等,体现了这些抽样方法的客观性和公平性.其中简单随机抽样是最简单和最基本的抽样方法,在进行系统抽样和分层抽样时都要用到简单随机抽样方法.抽样方法经常交叉起来应用,对于个体数量很大的总体,可采用系统抽样,系统中的每一均衡部分,又可采用简单随机抽样.
典例剖析
题型一 系统抽样的应用
【例1】 从2 004名同学中,抽取一个容量为20的样本.试叙述系统抽样的步骤.
解 第一步:采用随机的方式给个体编号:1,2,…,2 004;
第二步:随机剔除4个个体并重新给剩下的个体编号.
第三步:分段:由于20∶2 000=1∶100,故将总体分为20个部分,其中每一部分100个个体;
第四步:在第一部分随机抽取一个号码,比如66号;
第五步:“起始号”+“间隔”确定样本中的各个个体,如166,266,…,1 966.
第六步:将编号为66,166,…,1 966的个体抽出,即得到要抽取的样本.
方法点评 上述过程中,总体中的每个个体被剔除的可能性相等,也就是每个个体不被剔除的可能性相等,可知在整个抽样过程中每个个体被抽取的可能性仍然相等.
1.从已编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ).
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32
答案 B
题型二 分层抽样的应用
【例2】 一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,并写出过程.
解 三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.故业务人员、管理人员、后勤服务人员抽取的个体数分别为14,2和4.
对112名业务人员按系统抽样分成14个部分,其中每个部分包括8个个体,对每个部分利用简单随机抽样抽取个体.若将160名人员依次编号为1,2,3,…,160.那么在1~112名业务人员中第一部分的个体编号为1~8.从中随机取一个号码,如它是4号,那么可以从第4号起,按系统抽样法每隔8个抽取1个号码,这样得到112名业务人员被抽出的14个号码依次为4,12,20,28,36,44,52,60,68,76,84,92,100,108.
同样可抽出的管理人员和后勤服务人员的号码分别为116,124和132,140,148,156.
将以上各层抽出的个体合并起来,就得到容量为20的样本.
方法点评 弄清三种抽样方法的实质,是灵活选用抽样方法的前提和基础.选择分层抽样的依据是总体由有明显差异的几部分组成.各层抽取个体数依各层个体数之比来分配,在层内抽取时一般利用简单随机抽样或系统抽样.
2.要从1 000个球中抽取100个进行抽样分析,其中红球共有50个,如果用分层抽样的方法对球进行抽样,则应抽取红球( ).
A.33个 B.20个 C.5个 D.10个
答案 C
题型三 抽样方法的选择
【例3】 对于下列的几个问题,请选择合适的抽样方法抽样,并写出抽样过程.
(1)30个电子元件,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样;
(2)有甲厂生产的30个电子元件,其中一袋21个,另一袋9个,抽取3个入样;
(3)有甲厂生产的300个电子元件,抽取10个入样;
(4)有甲厂生产的300个电子元件,抽取30个入样.
(2)总体容量较小,用抽签法.
第一步:将30个电子元件编号,编号为00,01,…,29;
第二步:将以上30个编号分别写在30张小纸条上,揉成小球,制成号签;
第三步:把号签放入一个不透明的袋子中,充分搅匀;
第四步:从袋子中逐个抽取3个号签,并记录上面的号码;
第五步:找出和所得号码对应的电子元件.
(3)总体容量较大,样本容量较小宜用随机数表法.
第一步:将300个电子元件用随机方式编号,编号为001,002,003,…,299,300;
第二步:在随机数表中随机地确定一个数作为开始,如从第8行第29列的数“7”开始,任选一个方向作为读数方向,比如向右读;
第三步:从数“7”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到286,211,234,297,013,027,086,284,281,156这10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大宜用系统抽样法.
第一步:将300个电子元件用随机方式编号,编号为000,001,002,…,299,并分成30段;
第二步:在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;
第三步:将编号为002,012,022,…,292的个体抽出,组成样本.
点评 应结合三种抽样方法的使用范围和实际情况灵活使用各种抽样方法解决问题.
3.有以下两个问题:
①某社区有1 000个家庭,其中高收入家庭250户,中等收入家庭560户,低收入家庭190户,为了了解社会购买力的某项指标,要从中抽取一个容量为200的样本;
②从20人中选6人参加座谈会.
给出下列抽样方法:
a.简单随机抽样 b.系统抽样 c.分层抽样
其问题与抽样方法配对正确的是( ).
A.①b,②a B.①c,②b
C.①a,②c D.①c,②a
解析 由问题特点可知①应采用分层抽样;②应采用简单随机抽样.
答案 D
误区警示 系统抽样中不等距分段而致误
【例4】 要从某学校的10 013名学生中抽取100名进行健康检验,采用哪种抽样方法较好?写出抽样过程.
[错解] 由于总体个数为10 013,数量较大,而且都是学生,差别不大,因而应采用系统抽样法.具体过程如下:由系统抽样的步骤先分为100段,其中前87段每段100人,后13段每段101人,再在第一段中用简单随机抽样确定起始个体编号i;最后将i+100,i+200,…,i+9 900分别抽出,从而获得整个样本.
错因分析 上面的解法违背了系统抽样的等距均分原理,前87段与后13段个体数不一样,导致抽样的不公平性,所以解法是错误的.
纠错心得 在利用系统抽样方法时要注意:在等距均分时,如果总体个体不是样本容量的倍数,可用简单随机抽样在总体中先剔除一些个体,使剩余的个体数能被样本容量整除,再等距分组.
课堂总结
三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机
抽样
抽样过程中每个个体被抽取
的机会均等
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均匀分成几部分,按事先确定的规则在各部分中抽取
在起始部分抽样时采用简单随机抽样
总体的个体数较多
分层抽样
将总体分成几层,分层进行抽取
在各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成