1285875-3028959.1 随机抽样
9.1 随机抽样
简单的随机抽样
一般地,设一个总体含有N?(N为正整数)个个体,从中逐个抽取n?(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
抽签法
(1)概念
先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,知道抽足样本所需要的个数
(2)优缺点
优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性
缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平
随机数法
(1)概念
对总体中的N个个体编号,用随机数工具产生编号范围内的整体随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,知道抽足样本所需要的个数,如果生产的随机数有重复,即统一编号被多次抽到,可以剔除重复的编号并产生随机数,直到产生的不同编号个数等于样本所需要的个数
(2)优缺点
优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题
缺点:当总体较大时,需要的样本容量较大时,不太方便
一般地,总体中有N个个体,它们的变量值分别为false,false,?.,false,则称
false=false=falsefalse
为总体均值,又称总体平均数,如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记?为false,false,?...false,其中false;出现的频数false:?(i=1,?2,?....k),则总体均值还可以写成加权平均数的形式
false=falsefalse
如果从总体中抽取-一个容量为n的样本,它们的变量值分别?为false,false,...?false,则称
false
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数false.
分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
例1.某工厂利用随机数学对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700,从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第8个样本标号是( )
A.623 B.368 C.253 D.072
【答案】B
【解析】依题意从false开始向右每次读取3位数,重复的或者不在编号内的3位数舍去,则得到的前8个样本标号为:false,则得到的第8个样本标号是false.
故选:B
例2.“二万五千里长征”是1934年10月到1936年10月中国工农红军进行的一次战略转移,是人类历史上的伟大奇迹,向世界展示了中国工农红军的坚强意志,在期间发生了许多可歌可泣的英雄故事.在中国共产党建党100周年之际,某中学组织了“长征英雄事迹我来讲”活动,已知该中学共有高中生2700名,用分层抽样的方法从该校高中学生中抽取一个容量为45的样本参加活动,其中高三年级抽取了14人,高二年级抽取了15人,则该校高一年级学生人数为( )
A.720 B.960 C.1020 D.1680
【答案】B
【解析】由题意高一抽取的学生为false.
设高一学生数为false,则false,解得false.
故选:B.
1.某小区人数约30000人,创城期间,需对小区居民进行分层抽样调查,样本中有幼龄120人,青壮龄330人,老龄150人,则该小区老龄人数的估计值为( )
A.3300 B.4500 C.6000 D.7500
2.某中学有300名教师,其中初级教师60名,中级教师150名,高级教师90名.考虑采用分层抽样或系统抽样方法,从全校教师中抽取10人参加一个网络教学座谈会.采用分层抽样时,将初级教师随机编号为1~60,中级教师随机编号为61~210,高级教师随机编号为211~300;采用系统抽样时,将全校教师统一随机编号为1,2,…,300,并将整个编号从小到大依次均分为10组.
给出下列两组样本号码:①7,34,61,88,115,142,169,223,250,288;②26,32,90,100,138,172,188,211,254,297.
则下列结论中错误的是( )
A.样本①可能为分层抽样
B.样本②可能为分层抽样
C.样本①可能为系统抽样
D.样本②可能为系统抽样
3.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先了解到该地区老中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健走”活动情况差异不大,在下面的抽样方法中,最合理的抽样方法是( ).
A.简单随机抽样 B.按性别分层抽样 C.按年龄段分层抽样 D.随机数表抽样
4.某企业有职工false人,其中高级职称有false人,中级职称有false人,一般职员有false人,现抽取false人,进行分层抽样,则各职称人数分别为( )
A.false,false,false B.false,false,false C.false,false,false D.false,false,false
5.某学校高三、高二、高一年级学生人数分别为600、400、300人,现采用分层抽样的方法从全校学生中抽取52人进行调查,则从高二年级中抽取的人数为( )
A.12 B.16 C.18 D.24
6.某校共有学生2000名,各年级男、女生人数如下表所示:现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
一年级
二年级
三年级
女生
373
380
y
男生
377
370
z
A.12 B.16 C.18 D.24
7.某班有男生36人,女生18人,用分层抽样的方法从该班全体学生中抽取一个容量为9的样本,则抽取的女生人数为________.
8.某工厂生产的30个零件编号为01,02,…,29,30,现利用如下随机数表从中抽取5个进行检测,若从表中第1行第5列的数字开始,从左往右依次读取数字,则抽取的第5个零件的编号为__________.
34 57 07 86 36 04 68 96 08 23 23 45 78 89 07 84 42 12 53 31 25 30 07 32 86
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
9.人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序拿牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是不是简单随机抽样?为什么?
10.据报道,某公司的33名职工的月工资(以元为单位)如下:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5500
5500
3500
3000
2500
2000
1500
(1)求该公司职工月工资的平均数(精确到元);
(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数又是什么?(精确到元)
(3)你认为工资的平均数能反映这个公司员工的工资水平吗?结合此问题谈一谈你的看法.
1.D
【解析】由题意,其中小区中老龄人数所占比例为false,
所以该小区老龄人数的估计值为false人.
故选:D.
2.C
【解析】若采用分层抽样,则抽样比例为false,
从而初,中,高级教师抽取的人数分别为2,5,3,
所以在编号1~60内抽取2个号码,在编号61~210内抽取5个号码,
在编号211~300内抽取3个号码,样本①,②都符合.
若采用系统抽样,则每30个编号抽取1个号码,
即在编号1~30,31~60,61~90,…,271~300内各抽取1个号码.
因为61,88都在编号61~90范围内,则样本①不符合,
但样本②符合,
故选:C.
3.C
【解析】根据该地区老中、青三个年龄段人员的“微信健步走”活动情况有较大差异,
而男女“微信健走”活动情况差异不大,最合理的抽样方法是按年龄段分层抽样,
这种抽样分式,更具有代表性,比较合理.
故选:C.
4.B
【解析】false,即应按照false的比例来抽取,
false高级职称应抽取false(人);中级职称应抽取false(人);一般职员应抽取false(人).
故选:B.
5.B
【解析】设从高二年级抽取的人数为false,则false,解得:false.
故选:B.
6.B
【解析】依题意可知,高一年级人数false人,高二年级人数为false人,故高三年级学生人数为false人,
即总体中各年级的人数比例为false,
故用分层随机抽样抽取高三年级学生人数为false.
故选:B.
7.3
【解析】解:由题意得,抽取的女生人数为false,
故答案为:3
8.12
【解析】从07开始,两个一组抽取,只抽取01-30之内的不重复的数字,数到第五组得12,
故答案为:12.
9.不是,原因见解析
【解析】不是简单随机抽样,因为简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始的一张,其他各张牌虽然是被逐张拿取的,但是各张在谁手里已被确定,所以不是简单随机抽样.
10.(1)2091元 (2)3288元 (3)不能反映这个公司员工的工资水平.见解析
【解析】解:(1)平均数是
false
false(元).
(2)平均数是
false
false(元).
(3)在这个问题中,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司员工的工资水平.