1.2.2 分层抽样与系统抽样
学案
[读教材·填要点]
1.分层抽样的概念
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
2.系统抽样的概念
系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本.
系统抽样又叫等距抽样或机械抽样.
[小问题·大思维]
1.分层抽样时为什么要将总体分成互不重叠的层?
提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理,更具有代表性,所以将总体分成互不重叠的层,而后独立地抽取一定数量的个体.
2.系统抽样的第二步中,当不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?
提示:剔除一些个体可以用简单随机抽样抽取,不影响系统抽样的公平性.
[研一题]
[例1] 某企业共有3
200名职工,其中青、中、老年职工的比例为3∶5∶2.若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?
[自主解答] 因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理.
因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:
青年职工400×=120(人);中年职工400×=200(人);
老年职工400×=80(人).
由样本容量为400,总体容量为3
200可知,抽样比是=,所以每人被抽到的可能性相同,均为.
[悟一法]
分层抽样的步骤:
(1)根据已经掌握的信息,将总体分成互不重叠的层;
(2)根据总体中的个体数N和样本容量n计算抽样比
k=;
(3)确定第i层应该抽取的个体数目ni=Ni×k(Ni为第i层所包含的个体数),使得各ni之和为n;
(4)在各层中,按步骤(3)中确定的数目在各层中随机地抽取个体,合在一起得到容量为n的样本.
[通一类]
1.某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
解:第一步:样本容量与总体容量的比为=;第二步:确定各种商店要抽取的数目:大型商店:20×=2(家),中型商店:40×=4(家),小型商店:150×=15(家);第三步:采用简单随机抽样在各层中分别抽取大型商店2家,中型商店4家,小型商店15家,综合每层抽样即得样本.
[研一题]
[例2] 相关部门对某食品厂生产的303盒月饼进行质量检验,需要从中抽取10盒,请用系统抽样法完成对此样本的抽取.
[自主解答] 第一步 将303盒月饼用随机的方式编号.
第二步 从总体中剔除3盒月饼,将剩下的300盒月饼重新编号(分别为000,001,…,299),并分成10段.
第三步 在第一段中用简单随机抽样抽取起始号码l.
第四步 将编号为l,l+30,l+2×30,…,l+9×30的个体取出,组成样本.
[悟一法]
1.当总体容量能被样本容量整除时,分段间隔k=;当用系统抽样抽取样本时,通常是将起始数s加上间隔k得到第2个个体编号(s+k),再加k得到第3个个体编号(s+2k),依次进行下去,直到获得整个样本.
2.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本.
[通一类]
2.为了了解某地区今年高一学生期末考试数学学科的成绩,拟从参加考试的15
000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.
解析:(1)对全体学生的数学成绩进行编号:1,2,3,…,15
000.
(2)分段:由于样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包含100个个体.
(3)在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.
(4)以56作为起始数,然后依次抽取156,256,
356,…,14
956,这样就得到容量为150的一个样本.
[研一题]
[例3] 选择恰当的抽样方法,并写出抽样过程.
(1)有30个篮球,其中,甲厂生产的有21个,乙厂生产的有9个,现抽取10个作样品;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,现取出3个作样品;
(3)有甲厂生产的300个篮球,抽取10个作样品;
(4)有甲厂生产的300个篮球,从中抽取30个作样品.
[自主解答] (1)因总体是由差异明显的几部分构成,可采用分层抽样的方法抽取.
第一步 确定抽取个数.因为=,所以甲厂生产的应抽取21×=7(个),乙厂生产的应抽取9×=3(个);
第二步 用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(2)总体容量较小,用抽签法.
第一步 将30个篮球编号,编号为00,01,…,29;
第二步 将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
第三步 把号签放入一个不透明的袋子中,充分搅匀;
第四步 从袋子中逐个抽取3个号签,并记录上面的号码;
第五步 找出与所得号码对应的篮球.
(3)总体容量较大,样本容量较小,适宜用随机数法.
第一步 将300个篮球用随机方式编号,编号为001,002,…,300;
第二步 在随机数表中随机的确定一个数作为开始,如第3行第5列的数“3”开始.任选一个方向作为读数方向,比如向右读;
第三步 从数“3”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到241,242,232,283,039,101,158,272,266,166这10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大,适宜用系统抽样法.
第一步 将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段;
第二步 在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;
第三步 将编号为002,012,022,…,292的个体抽出,组成样本.
[悟一法]
1.三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有密切联系.在应用时要根据实际情况选取合适的方法.
2.三种抽样中每个个体被抽到的可能性都是相同的.
[通一类]
3.某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户.为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③.为完成上述三项抽样,则应采取的抽样方法是( )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①分层抽样,②简单随机抽样,③系统抽样
C.①简单随机抽样,②分层抽样,③系统抽样
D.①分层抽样,②系统抽样,③简单随机抽样
解析:对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;
对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;
对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样.
答案:B
一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,试确定业务人员、管理人员、后勤服务人员各抽取的人数是多少?
[解] 法一:三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.故业务人员、管理人员、后勤服务人员抽取的个体数分别为14,2和4.
法二:由160÷20=8,所以可在各层人员中按8∶1的比例抽取,又因为112÷8=14,16÷8=2,32÷8=4,所以业务人员14人,管理人员2人,后勤服务人员4人.
法三:因为共有职工160人,所抽取的人数为20,所以样本容量与总体容量之比为=,
则业务人员应抽取112×=14人,管理人员应抽16×=2人,后勤服务人员应抽32×=4人.
1.简单随机抽样、系统抽样、分层抽样之间的共同点是( )
A.都是从总体中逐个抽取
B.将总体分成几部分,按事先确定的规则在各部分中抽取
C.抽样过程中每个个体被抽取的机会相同
D.将总体分成几层,分层进行抽取
解析:简单随机抽样、系统抽样、分层抽样的共同点是:在抽样过程中每个个体被抽取的概率是相同的.
答案:C
2.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,
115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )
A.抽签法
B.随机数法
C.系统抽样法
D.其他的抽样方法
解析:上述抽样方法是将发票平均分成若干组,每组50张.从第一组中抽取15号,以后各组抽取15+50n(n∈N
)号,符合系统抽样的特点.
答案:C
3.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )
A.简单随机抽样法
B.抽签法
C.随机数表法
D.分层抽样法
解析:样本由差异明显的几部分组成,抽取的比例由每层个体占总体的比例确定,即为分层抽样法.
答案:D
4.将一个总体分为A、B、C三层,其个体数之比为5∶3∶2,若用分层抽样方法抽取容量为100的样本,则应从C中抽取的个体数为________.
解析:×100=20.
答案:20
5.将参加数学夏令营的100名同学编号为001,002,…,100.现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为________.
解析:抽样距为4,第一个号码为004,故001~100中是4的整数倍的数被抽出,在046至078号中有048,052,056,060,064,068,072,076,共8个.
答案:8
6.某中学有教职工300人,分为教学人员、管理人员、后勤服务人员三部分,其组成比例为8∶1∶1.现用分层抽样从中抽取容量为20的样本,请写出抽样的过程.
解:抽样过程如下:
(1)确定抽样比=;
(2)确定各层抽样数目为=16,
=2,=2;
(3)用系统抽样法从教学人员中抽取16人,用简单随机抽样法分别从管理人员和后勤服务人员中各抽取2人;
(4)将上述各层所抽的个体合在一起即为所要抽取的样本.
一、选择题
1.某牛奶生产线上每隔30分钟抽取一袋进行检验,该抽样方法记为①;从某中学的30名数学爱好者中抽取3人了解学业负担情况,该抽样方法记为②.那么( )
A.①是系统抽样,②是简单随机抽样
B.①是简单随机抽样,②是简单随机抽样
C.①是简单随机抽样,②是系统抽样
D.①是系统抽样,②是系统抽样
解析:对于①,因为每隔30分钟抽取一袋,是等间距抽样,故①为系统抽样;对于②,总体数量少,样本容量也小,故②为简单随机抽样.
答案:A
2.(2012·四川高考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101
B.808
C.1
212
D.2
012
解析:依题意得知,甲社区驾驶员的人数占总人数的=,因此有=,解得N=808.
答案:B
3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9
B.9,12,12,7
C.8,15,12,5
D.8,16,10,6
解析:由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×=8,40×=16,40×=10,40×=6.
答案:D
4.下列抽样中不是系统抽样的是( )
A.从标有1~15号的15个球中,任选3个作为样本.将15个球按从小号到大号排序,随机选i0号作为起始号码,以后选i0+5,i0+10(超过15则从1再数起)号入样
B.工厂生产的产品,在用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽取一件产品进行检验
C.进行某一市场调查时,规定在商场门口随机抽取一个人进行询问调查,直到调查到事先规定的调查人数为止
D.在报告厅对与会听众进行调查,通知每排(每排人数相等)座位号为14的听众留下来座谈
解析:分析各选项中抽样的特点,与系统抽样的概念、特点进行比较.A、D显然是系统抽样.B项中,传送带的速度是恒定的,实际上是将某一段时间内生产的产品分成一组,且可以认为这些产品已经排好,又总在某一位置抽取样品,这正好符合系统抽样的概念.选项C因事先不知道总体的个数,而且抽样时不能保证每个个体等可能入样,因此它不是系统抽样.
答案:C
5.某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为了了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依次为简单随机抽样、系统抽样、分层抽样顺序的是( )
方法1:将140人从1~140编号,然后制作出编号1~140的形状、大小相同的号签,并将号签放入同一箱子里均匀搅拌,然后从中抽取20个号签,编号与号签相同的20个人被选出;
方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k号(1≤k≤7),其余各组k号也被抽出,20个人被选出;
方法3:按20∶140=1∶7的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用随机数法,可抽到20人.
A.方法2,方法1,方法3
B.方法2,方法3,方法1
C.方法1,方法2,方法3
D.方法3,方法1,方法2
解析:结合简单随机抽样、系统抽样、分层抽样的定义判断.
答案:C
二、填空题
6.(2012·浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.
解析:由分层抽样得,此样本中男生人数为560×=160.
答案:160
7.(2013·日照高一检测)某学校高一、高二、高三三个年级共有学生3
500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为________.
解析:若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3
500,解得x=1
600.故高一学生数为800,因此应抽取高一学生数为=8.
答案:8
8.(2013·中山高一检测)一个总体中有100个个体,随机编号为0、1、2、…、99,依编号顺序平均分成10个小组,组号依次为1、2、3、…、10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是________.
解析:第k组的号码为(k-1)10,(k-1)10+1,…,(k-1)·10+9,当m=6、k=7时,第k组抽取的号码m+k的个位数字为3,所以(7-1)×10+3=63.
答案:63
三、解答题
9.为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题?应当怎样改进?如果是调查一年的车流量情况呢?
解:交警所统计的数据以及由此所推断出来的结论,只能代表星期日的交通流量.由于星期日是休息时间,很多人不上班,不能代表其他几天的情况.
改进方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样,或者使用简单随机抽样来抽样亦可.
如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本距改为8.
10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,则有=47.5%,
=10%.
解得b=50%,c=10%.
故a=1-50%-10%=40%.
即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.
(2)游泳组中,抽取的青年人人数为200××40%=60;
抽取的中年人人数为200××50%=75;
抽取的老年人人数为200××10%=15.