课件43张PPT。第二章 统计2.1 随机抽样
2.1.3 分层抽样互不交叉 一定的比例 各层独立地 各层 差异明显 各层总的个体数×抽样比 简单随机抽样分层抽样的概念 分层抽样的设计及应用 抽样方法的选择 点击右图进入…Thank you for watching !2.1.3 分层抽样
学 习 目 标
核 心 素 养
1.记住分层抽样的特点和步骤(重点)
2.会用分层抽样从总体中抽取样本.(重点、难点)
3.给定实际抽样问题会选择合适的抽样方法进行抽样.(易错易混点)
1.通过分层抽样的学习,培养数学运算素养.
2.借助多种抽样方法的选择,提升逻辑推理素养.
1.分层抽样
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.
当总体是由差异明显的几部分组成时,往往选用分层抽样的方法.
2.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比=.
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.
思考:什么情况下适用分层抽样?
[提示] 当总体中个体之间差异较大时可使用分层抽样.
1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
C [依据题意,了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大,故要了解该地区学生的视力情况,应按学段分层抽样.]
2.为了保证分层抽样时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.按每层所含个体在总体中所占的比例抽样
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
C [分层抽样为等比例抽样.]
3.某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是( )
A.8,8 B.10,6
C.9,7 D.12,4
C [抽样比=,则一班被抽取人数为54×=9人,二班被抽取人数为42×=7人.]
4.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有________个.
三 [三种抽样方法均为不放回抽样.]
分层抽样的概念
【例1】 下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
B [A中总体个体无明显差异且个数较少,适合用简单随机抽样;C中,D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.]
分层抽样的特点
(1)适用于总体由差异明显的几部分组成的情况.
(2)样本能更充分地反映总体的情况.
(3)等可能抽样,每个个体被抽到的可能性都相等.
1.某校有在校高中生共1 600人,其中高一学生520人,高二学生500人,高三学生580人.如果想通过抽查其中的80人来调查学生的消费情况,考虑到学生的年级高低消费情况有明显差别,而同一年级内消费情况差异较小,问:应采用怎样的抽样方法?高三学生中应抽查多少人?
[解] 因为不同年级的学生消费情况有明显差别,所以应采用分层抽样.
因为520∶500∶580=26∶25∶29.
所以将80分成26∶25∶29的三部分.
设三部分各抽取的个体数分别为26x,25x,29x,
由26x+25x+29x=80得x=1,
所以高三学生中应抽查29人.
分层抽样的设计及应用
[探究问题]
1.怎样确定分层抽样中各层入样的个体数?
[提示] 在实际操作时,应先计算出抽样比=,获得各层入样数的百分比,再按抽样比确定每层需要抽取的个体数:抽样比×该层个体数目=×该层个体数目.
2.计算各层所抽个体的个数时,如果算出的个数值不是整数怎么办?
[提示] 可四舍五入取整,也可先将该层等可能地剔除多余个体.
3.分层抽样公平吗?
[提示] 分层抽样中,每个个体被抽到的可能性是相同的,与层数、分层无关.
如果总体的个数为N,样本容量为n,Ni为第i层的个体数,则第i层抽取的个体数ni=n·,每个个体被抽到的可能性是=·n·=.
【例2】 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
思路点拨:观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→样本
[解] ∵机构改革关系到每个人的不同利益,故采用分层抽样方法较妥.
∵=5,
∴=2,=14,=4.
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.
因副处级以上干部与工人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人进行00,01,…,69编号,然后用随机数表法抽取14人.这样便得到了一个容量为20的样本.
1.(变条件)某大型工厂有管理人员1 200人,销售人员2 000人,车间工人6 000人,若要了解改革意见,从全厂人员中抽取一个容量为46的样本,试确定用何种方法抽取,请具体实施操作.
[解] 改革关系到每个人的利益,采用分层抽样较好.抽样比:=.
∵1 200×=6(人),2 000×=10(人),6 000×=30(人).
∴从管理人员中抽取6人,从销售人员中抽取10人,从车间工人中抽取30人.
因为各层中个体数目均较多,可以采用系统抽样的方法获得样本.
2.(变结论)在本例中的抽样方法公平合理吗?请说明理由.
[解] 从100人中抽取20人,总体中每一个个体的入样可能性都是=,即抽样比,按此比例在各层中抽取个体;副处级以上干部抽取10×=2人,一般干部抽70×=14人,工人抽20×=4人,以保证每一层中每个个体的入样可能性相同,均为,故这种抽样是公平合理的.
分层抽样的步骤
抽样方法的选择
【例3】 ①教育局督学组到校检查工作,临时需在每班各抽调两人参加座谈;②某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为( )
A.分层抽样,分层抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
思路点拨:根据各抽样方法的特征、适用范围判断.
D [①每班各抽两人需用系统抽样.②由于学生分成了差异比较大的几层,应用分层抽样.③由于总体与样本容量较小,应用简单随机抽样.故选D.]
抽样方法的选取
(1)若总体由差异明显的几个层次组成,则选用分层抽样;
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样;
2.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查.事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按年龄分层抽样 D.系统抽样
C [因为不同年龄段人员的“微信健步走”活动情况有较大差异.而男女对此活动差异不大,所以按年龄段分层抽样最合理.]
1.对于分层抽样中的比值问题,常利用以下关系式[解]
(1)=;
(2)总体中各层容量之比=对应层抽取的样本数之比.
2.选择抽样方法的规律
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本容量较小时,可采用随机数法.
(3)当总体容量较大,样本容量也较大时,可采用系统抽样法.
(4)当总体是由差异明显的几部分组成时,可采用分层抽样法.
1.判断下列结论的正误(正确的打“√”,错误的打“×”)
(1)当总体由差异明显的几部分组成时,往往采用分层抽样. ( )
(2)由于分层抽样是在各层中按比例抽取,故每个个体被抽到的可能性不一样. ( )
(3)分层抽样中不含系统抽样和简单随机抽样. ( )
[答案] (1)√ (2)× (3)×
2.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )
A.30人、30人、30人 B.30人、45人、15人
C.20人、30人、40人 D.30人、50人、10人
B [根据各校人数比例有3 600∶5 400∶1 800=2∶3∶1,由于样本容量为90,不难求出甲校应抽取30人、乙校应抽取45人、丙校应抽取15人.]
3.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到的抽样方法有( )
①简单随机抽样;②系统抽样;③分层抽样
A.②③ B.①③
C.③ D.①②③
D [由三种抽样方法的特点知,应先采用分层抽样对农民家庭需用系统抽样得到样本,对工人家庭需用简单随机抽样.]
4.一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
[解] 因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.
具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层.
(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.
(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.
(4)将300人合到一起,即得到一个样本.
W
课时分层作业(十一) 分层抽样
(建议用时:60分钟)
[基础达标练]
一、选择题
1. 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是( )
A.简单随机抽样
B.系统抽样
C.直接运用分层抽样
D.先从老年人中剔除1人,再用分层抽样
C [因为总体由差异明显的三部分组成,所以考虑用分层抽样.]
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
A [由题意得,=,解得n=100.]
3.一批灯泡400只,其中20 W、40 W、60 W的数目之比是4∶3∶1,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为( )
A.20,15,5 B.4,3,1
C.16,12,4 D.8,6,2
A [40×=20.40×=15,40×=5.]
4.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2
C.p1=p3D [不管是简单随机抽样、系统抽样还是分层抽样,它们都是等可能抽样,每个个体被抽中的概率均为.]
5.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( )
A.60 B.80
C.120 D.180
C [11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,抽样比为,因为分层抽取样本的容量为300,故回收问卷总数为=900份,故x=900-120-180-240=360份,360×=120份.]
二、填空题
6.在120个零件中,一级品24个,二级品36个,三级品60个,用分层抽样的方法从中抽取容量为20的样本,则每个个体被抽取的可能性是________.
[在分层抽样中,每个个体被抽取的可能性相等,且为.所以每个个体被抽取的可能性是=.]
7.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类型
A
B
C
产品数量(件)
1 300
样本容量
130
由于不小心,表格中A,C两种产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________件.
800 [抽样比130∶1 300=1∶10,即每10个产品中取1个个体,又A产品的样本容量比C产品的多10,故A产品比C产品多100件,故(3 000-1300-100)=800(件)为C产品数量.]
8.下列问题中,采用怎样的抽样方法较为合理?
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本;
(3)体育彩票000 001~100 000编号中,凡彩票号码最后三位数为345的中一等奖.
(1)________ (2)________ (3)________.
(1)抽签法 (2)分层抽样 (3)系统抽样
题号
判断
原因分析
(1)
抽签法
总体容量较小,宜用抽签法
(2)
分层抽样
由于学校各类人员对这一问题的看法可能差异较大,用分层抽样
(3)
系统抽样
总体容量大,样本容量较大,等距抽取,用系统抽样
三、解答题
9.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
人数
管理
技术开发
营销
生产
合计
老年
40
40
40
80
200
中年
80
120
160
240
600
青年
40
160
280
720
1 200
合计
160
320
480
1 040
2 000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
[解] (1)按老年、中年、青年分层抽样,
抽取比例为=.
故老年人,中年人,青年人各抽取4人,12人,24人,
(2)按管理、技术开发、营销、生产进行分层,用分层抽样,抽取比例为=,
故管理,技术开发,营销,生产各抽取2人,4人,6人,13人.
10.为了考察某校的教学水平,抽查了该学校高三年级部分学生的本年度考试成绩.为了全面地反映实际情况,采取以下三种考察方式(已知该校高三年级共有14个教学班,并且每个班内的学生都已经按随机方式编好了学号,假定该校每班人数都相同).
①从全年级14个班中任意抽取一个班,再从该班中任意抽取14人,考察他们的学习成绩;
②每个班都抽取1人,共计14人,考察这14个学生的成绩;
③把该校高三年级的学生按成绩分成优秀,良好,普通三个级别,从中抽取100名学生进行考查(已知若按成绩分,该校高三学生中优秀学生有105名,良好学生有420名,普通学生有175名).
根据上面的叙述,试回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式各自采用何种抽取样本的方法?
(3)试分别写出上面三种抽取方法各自抽取样本的步骤.
[解] (1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;第二种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.
(2)第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法.
(3)第一种方式抽样的步骤如下:
第一步:在这14个班中用抽签法任意抽取一个班;
第二步:从这个班中按学号用随机数表法或抽签法抽取14名学生,考察其考试成绩.
第二种方式抽样的步骤如下:
第一步:在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为x;
第二步:在其余的13个班中,选取学号为x+50k(1≤k≤12,k∈Z)的学生,共计14人.
第三种方式抽样的步骤如下:
第一步:分层,因为若按成绩分,其中优秀生共105人,良好生共420人,普通生共175人,所以在抽取样本中,应该把全体学生分成三个层次;
第二步:确定各个层次抽取的人数,因为样本容量与总体数的比为100∶700=1∶7,所以在每个层抽取的个体数依次为,,,即15,60,25;
第三步:按层分别抽取,在优秀生中用简单随机抽样法抽取15人,在良好生中用简单随机抽样法抽取60人,在普通生中用简单随机抽样法抽取25人.
第四步:将所抽取的个体组合在一起构成样本.
[能力提升练]
1.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
A [该地区中小学生总人数为
3 500+2 000+4 500=10 000人,
则样本容量为10 000×2%=200人,其中抽取的高中生近视人数为2 000×2%×50%=20.]
2.某初级中学共有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为001,002,003,…,270;使用系统抽样时,将学生统一随机编号为001,002,003,…,270,并将整个编号平均分为10段.如果抽得的号码有下列四种情况:
①007,034,061,088,115,142,169,196,223,250;
②005,009,100,107,111,121,180,195,200,265;
③011,038,065,092,119,146,173,200,227,254;
④036,062,088,114,140,166,192,218,244,270.
关于上述样本的下列结论中,正确的是( )
A.②③都不能为系统抽样
B.②④都不能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样
D [系统抽样又称为“等距抽样”,做到等距的有①③④,但只做到等距还不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在001~027范围内,结果发现④不符合,同时,若为系统抽样,则分段间隔k==27,④也不符合这一要求,所以可能是系统抽样的为①③,因此排除A,C;若采用分层抽样,一、二、三年级的人数比例为4∶3∶3,由于共抽取10人,所以三个年级应分别抽取4人、3人、3人,即在001~108范围内要有4个编号,在109~189和190~270范围内要分别有3个编号,符合此要求的有①②③,即它们都可能为分层抽样(其中①③在每一层内采用了系统抽样,②在每一层内采用了简单随机抽样),所以排除B.]
3.某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
高一年级
高二年级
高三年级
泥塑
a
b
c
剪纸
x
y
z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.
6 [因为“泥塑”社团的人数占总人数的,故“剪纸”社团的人数占总人数的,所以“剪纸”社团的人数为800×=320.因为“剪纸”社团中高二年级人数比例为==,所以“剪纸”社团中高二年级人数为320×=96.由题意知,抽样比为=,所以从高二年级“剪纸”社团中抽取的人数为96×=6.]
4.某机关老年、中年、青年的人数分别为18,12,6,现从中抽取一个容量为n的样本,若采用系统抽样和分层抽样,则不用剔除个体.当样本容量增加1时,若采用系统抽样,需在总体中剔除1个个体,则样本容量n=________.
6 [当样本容量为n时,因为采用系统抽样时不用剔除个体,所以n是18+12+6=36的约数,n可能为1,2,3,4,6,9,12,18,36.因为采用分层抽样时不用剔除个体,所以×18=,×12=,×6=均是整数,所以n可能为6,12,18,36.又因为当样本容量增加1时,需要剔除1个个体,才能用系统抽样,所以n+1是35的约数,而n+1可能为7,13,19,37,所以n+1=7,所以n=6.]
5.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?
(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?
(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?
[解] (1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.
因为样本容量为120,总体个数为500+3 000+4 000=7 500,则抽样比:=,
所以有500×=8,3 000×=48,
4 000×=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8,48,64.
分层抽样的步骤是
①分层:分为教职员工、初中生、高中生,共三层.
②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8,48,64.
③各层分别按简单随机抽样或系统抽样的方法抽取样本.
④综合每层抽样,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评价结论.
(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3 000个号签,费时费力,因此采用随机数法抽取样本,步骤是
①编号:将3 000份答卷都编上号码:0 001,0 002,0 003,…,3 000.
②在随机数表上随机选取一个起始位置.
③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.
(3)由于4 000÷64=62.5不是整数,则应先使用简单随机抽样从4 000名学生中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,271,333,395,457,…,3 929.