2020版高中数学新人教B版必修3第二章统计2.1.2系统抽样2.1.3分层抽样2.1.4数据的收集学案(含解析)

文档属性

名称 2020版高中数学新人教B版必修3第二章统计2.1.2系统抽样2.1.3分层抽样2.1.4数据的收集学案(含解析)
格式 zip
文件大小 140.5KB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-06-03 15:29:40

图片预览

文档简介

2.1.2 系统抽样2.1.3 分层抽样2.1.4 数据的收集
学习目标 1.理解并掌握系统抽样、分层抽样.2.会用系统抽样、分层抽样从总体中抽取样本.3.理解三种抽样的区别与联系.
知识点一 系统抽样
思考1 当总体中的个体数较多时,为什么不宜用简单随机抽样?
答案 因为个体较多,采用简单随机抽样如制作号签等工作会耗费大量的人力、物力和时间,而且不容易做到“搅拌均匀”,从而使样本的代表性不强.
思考2 用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?
答案 用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.
梳理 系统抽样
(1)定义:要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.
(2)步骤:
①先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
②确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;当不是整数时,先从总体中随机剔除几个个体,再重新编号,然后分段;
③在第1段用简单随机抽样确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
知识点二 分层抽样
思考1 当所研究的总体由差异明显的几部分组成时,还可用系统抽样吗?
答案 不可以.
思考2 分层抽样的总体具有什么特性?
答案 分层抽样的总体由差异明显的几部分构成,也就是说当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样.
思考3 系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样,这种说法对吗?
答案 不对,因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取是按事先确定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.
梳理 分层抽样
(1)定义
一般地,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
分层抽样尽量利用了调查者对调查对象(总体)事先所掌握的各种信息,并充分考虑了保持样本结构与总体结构的一致性,这对提高样本的代表性是非常重要的.
(2)分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比=.
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.
知识点三 三种抽样方法的比较
方法类别
共同特点
抽样特征
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的可能性相等
从总体中逐个不放回抽取
简单随机抽样是基础
样本容量较小
系统抽样
将总体分成均衡的几部分,按规则关联抽取
用简单随机抽样抽取起始号码
总体中的个体数较多
分层抽样
将总体分成几层,按比例分层抽取
用简单随机抽样或系统抽样对各层抽样
总体由差异明显的几部分组成  
知识点四 数据收集的几种常见方式
1.做试验
根据调查项目的要求来设计一些合适的试验,能够直接地获得样本数据.试验时要注意准备好试验的用具(或组织好观测的对象)、指定专门的记录人员等.
做试验的优点是:通常能得到可靠的数据资料;缺点是:花费人力、物力、时间较多.
2.查阅资料
有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等办法获得所需或相关的数据.
3.设计调查问卷
做实际调查时往往要设计调查问卷.调查问卷一般由一组有目的、有系统、有顺序的题目组成.问题由调查人员根据调查的目的、项目进行设计.
1.系统抽样和分层抽样都是等可能抽样.( √ )
2.系统抽样中,当总体容量不能被样本容量整除时,余数是几就剔除前几个数.( × )
3.分层抽样是按一定的比例从各层抽取个体组成样本的抽样.( √ )
题型一 系统抽样及应用
例1 为了了解参加某种知识竞赛的1000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.
解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.
引申探究
在本例中,如果总体是1002,其余条件不变,又该怎么抽样?
解 (1)将每个学生编一个号,由1至1002.
(2)利用随机数表法剔除2个号.
(3)将剩余的1000名学生重新编号1至1000.
(4)按编号顺序均分成50个部分,每部分包括20个个体.
(5)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(6)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.
反思与感悟 当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.由于剔除方法采用简单随机抽样,所以即使是被剔除的个体,在整个抽样过程中被抽到的机会和其他个体是一样的.
跟踪训练1 某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.
解 (1)将每个工人随机编一个号,由0001至1003.
(2)利用随机数表法找到3个号将这3名工人剔除.
(3)将剩余的1000名工人重新编号0001至1000.
(4)分段,取间隔k==100,将总体均分为10组,每组100个工人.
(5)从第一段即0001号到0100号中随机抽取一个号l.
(6)按编号将l,100+l,200+l,…,900+l,共10个号选出.
这10个号所对应的工人组成样本.
题型二 分层抽样及应用

例2 某地区有高中生2400人,初中生10900人,小学生11000人.当地教育部门为了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
解 (1)从总体来看,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具有较好的代表性,应该分高中、初中、小学三个层次分别抽样.
(2)从三类学生的数量来看,人数较多,所以在各层抽样时可以采用系统抽样.
(3)采用系统抽样分好组之后,确定第一组人选时,可以采用简单随机抽样.
反思与感悟 分层抽样实质是利用已知信息尽量使样本结构与总体结构相似.在实际操作时,并不排斥与其他抽样方法联合使用.
跟踪训练2 在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法1:采用简单随机抽样的方法,将零件编号为00,01,02,…,99,用抽签法抽取20个.
方法2:采用系统抽样的方法,将所有零件分为20组,每组5个,然后在第1组用简单随机抽样确定第一个个体编号,依次得到余下的19个个体编号.
方法3:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法正确的是(  )
①不论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是;
②采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同;
③在上述三种抽样方法中,方法3抽到的样本比方法1和方法2抽到的样本更能反映总体特征;
④在上述抽样方法中,方法2抽到的样本比方法1和方法3抽到的样本更能反映总体的特征.
A.①② B.①③ C.①④ D.②③
答案 B
解析 根据三种抽样的特点知,不论哪种抽样,总体中每个个体入样的可能性都相等,都是,故①正确,②错误.由于总体中有差异较明显的三个层(一级品、二级品和三级品),故方法③抽到的样本更有代表性,③正确,④错误.故①③正确.

例3 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.
解 抽样过程如下:
第一步,确定抽样比,
样本容量与总体容量的比为=.
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);
从教师中抽取112×=14(人);
从后勤人员中抽取32×=4(人).
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.
反思与感悟 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练3 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,则在不到35岁的职工中抽取125×=25(人);
在35岁至49岁的职工中抽取280×=56(人);
在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层分别按系统抽样或随机数表法抽取样本.
(4)汇总每层抽样,组成样本.
1.检测员每10分钟从匀速传递的新产品生产流水线上抽取一件新产品进行某项指标检测,这样的抽样方法是(  )
A.系统抽样法 B.抽签法
C.随机数表法 D.其他抽样方法
答案 A
解析 根据系统抽样的定义和性质进行判断即可.
2.交通管理部门为了了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(  )
A.101 B.808 C.1 212 D.2 012
答案 B
解析 根据分层抽样,得N×=96,解得N=808,故选B.
3.为了调查某省各城市PM2.5的值,按地域把36个城市分成甲、乙、丙三组,对应的城市数分别为6,12,18.若用分层抽样的方法抽取12个城市,则乙组中应抽取的城市数为________.
答案 4
解析 乙组城市数占总城市数的比例为=,样本容量为12,故乙组中应抽取的城市数为12×=4.
4.某班级有50名学生,现要采用系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并均匀分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.
答案 37
解析 因为12=5×2+2,所以第n组中抽得号码为5(n-1)+2的学生.所以第八组中抽得号码为5×7+2=37的学生.
5.一批产品中有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法从这批产品中抽取一个容量为20的样本,写出抽样过程.
解 系统抽样法:将200个产品编号为1~200,然后将编号均分成20个部分,在第1部分中用简单随机抽样法抽取1个编号.如抽到5号,那么得到编号为5,15,25,…,195的个体,即可得到所需样本.
分层抽样法:因为100+60+40=200,所以=,
所以100×=10,60×=6,40×=4.
因此在一级品、二级品和三级品中分别抽取10个、6个和4个,将一级品的100个产品按00,01,02,…,99编号;
将二级品的60个产品按00,01,02,…,59编号;
将三级品的40个产品按00,01,02,…,39编号,采用随机数表法,分别从中抽取10个,6个,4个,即可得到所需样本.
1.系统抽样有以下特点:
(1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都要用简单随机抽样,因而与简单随机抽样有密切联系;
(3)是等可能抽样,每个个体被抽到的可能性都是,其中N为总体容量,n为样本容量;
(4)是不放回抽样.
在抽样时,只要第一段抽取的个体确定了,后面各段中要抽取的个体依照事先确定好的规律就自动地被抽出,因此简单易行.
2.总体容量小时,用简单随机抽样;总体容量大时,用系统抽样;总体差异明显时,用分层抽样.在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.
一、选择题
1.为了抽查某城市小轿车年检情况,在该城市采取抽车牌末位数字为6的小轿车进行检查,这种抽样方法是(  )
A.随机数表法 B.抽签法
C.系统抽样法 D.其他抽样方法
答案 C
解析 由于每个车牌的末位数字为0,1,2,…,9十个数字之一,某辆车车牌末位数字为6是随机的,这相当于将所有汽车分成若干组,每组10个(车牌的末位数字依次为0,1,2,…,9),取每一组中的第6个,故为系统抽样.
2.某校三个年级共有24个班,学校为了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为(  )
A.2 B.3 C.4 D.5
答案 B
解析 由题意得系统抽样的抽样间隔为=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)=48,所以x=3,故选B.
3.某中学有高中生3500人,初中生1500人,为了了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为(  )
A.100 B.150 C.200 D.250
答案 A
解析 由题意得,=,解得n=100,故选A.
4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种及20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(  )
A.4 B.5 C.6 D.7
答案 C
解析 四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×=2,抽取的果蔬类的种数为20×=4,二者之和为6,故选C.
5.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则(  )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
答案 D
解析 因为采取简单随机抽样、系统抽样和分层抽样抽取样本时,总体中每个个体被抽中的概率相等,故选D.
6.某学校高一、高二、高三三个年级共有学生3500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为(  )
A.8 B.11 C.16 D.10
答案 A
解析 若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3500,解得x=1600.故高一学生数为800,因此应抽取高一学生数为=8.
7.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为(  )
A.11 B.12 C.13 D.14
答案 B
解析 由于=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为==12.
8.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是(  )
A.13 B.19 C.20 D.51
答案 C
解析 由系统抽样的原理可知,抽样的间隔k==13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,从而可知C项正确.
二、填空题
9.某企业共有职工150人,其中高级职称15人,中级职称45人,低级职称90人,现采用分层抽样来抽取30人,则抽取的高级职称的人数为________.
答案 3
解析 由题意得抽样比为=,所以抽取的高级职称的人数为15×=3.
10.某工厂生产A,B,C三种不同型号的产品,产品数量之比为2∶3∶5.现用分层抽样的方法抽出一个容量为n的样本,其中A种型号产品有16件,那么此样本的容量n=________.
答案 80
解析 16÷=80.
11.将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.
答案 20
解析 由题意可设A,B,C中个体数分别为5k,3k,2k,所以C中抽取个体数为×100=20.
12.某班共有学生52人,现根据学生的学号用系统抽样的方法抽取一个容量为4的样本,已知学号为6号、32号、45号的同学在样本中,那么样本中剩下的一个同学的学号是_____号.
答案 19
解析 ∵45-32=13,∴抽样间隔为13,故抽取学生的学号依次为6,19,32,45,故填19.
三、解答题
13.为了对某课题进行研究,分别从A,B,C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0<m≤72≤n).
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解 (1)∵0<m≤72≤n,A,B两所高校中共抽取3名教授,∴B高校中抽取2人,∴A高校中抽取1人,C高校中抽取3人,
∴==,解得m=36,n=108.
(2)∵高校B中抽取的教授数是高校A和C中抽取的教授数的,
∴(m+n)=72,解得m+n=108,
∴三所高校的教授的总人数为m+n+72=180.
四、探究与拓展
14.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.
答案 37 20
解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则=,解得x=20.
15.某单位有职工72人,现需用系统抽样法从中抽取一个样本,若样本容量为n,则不需要剔除个体,若样本容量为n+1,则需剔除2个个体,则n=________.
答案 4或6或9
解析 由题意知n为72的约数,n+1为70的约数,其中72的约数有1,2,3,4,6,8,9,12,18,24,36,72,其中加1能被70整除的有1,4,6,9,其中n=1不符合题意,故n=4或6或9.