9.1.2 分层随机抽样
【学习目标】
1.通过具体实际问题情境体会分层随机抽样的必要性及特点,了解分层随机抽样的特点和使用范围,掌握各层样本量比例分配的方法.
2.经历分层随机抽样的样本平均数的推导过程,会求具体问题的分层随机抽样的样本平均数,并能解释它在实际问题中的意义.
◆ 知识点一 分层随机抽样的概念
1.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行 ,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样,每一个子总体称为 .
2.比例分配
在分层随机抽样中,如果每层样本量都与层的大小成 ,那么称这种样本量的分配方式为 .
3.分层随机抽样的优点
(1)在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的组织实施效果一定好于简单随机抽样,也好于其他抽样方法.
(2)分层随机抽样除了能得到总体的估计外,还能得到每层的估计.
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)在比例分配的分层随机抽样中,个体数量较少的层抽取的样本数量较少,这是不公平的. ( )
(2)从全班50名同学中抽取5人调查作业完成情况,适合用比例分配的分层随机抽样. ( )
(3)某班有男生36人,女生18人,用比例分配的分层随机抽样的方法,从该班全体学生中抽取一个样本量为9的样本,则抽取的女生人数为3. ( )
(4)采用比例分配的分层随机抽样的方法对甲、乙、丙三种个体进行抽样调查,若甲、乙、丙的个体数之比为3∶1∶2,且抽取的甲的个体数为9,则样本容量为30. ( )
◆ 知识点二 分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值.
1.第1层的总体平均数和样本平均数分别为== ,== .
2.第2层的总体平均数和样本平均数分别为== ,== .
3.总体平均数和样本平均数分别为=,=.
4.由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此我们可以用=+估计总体平均数.在比例分配的分层随机抽样中,== ,可得+=+=.
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)在分层随机抽样中,==. ( )
(2)在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数. ( )
◆ 探究点一 分层随机抽样的概念
例1 (1)为了保证比例分配的分层随机抽样中每个个体等可能地被抽取,必须要求 ( )
A.每层不等可能抽样
B.每层抽取的个体数相等
C.每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i=1,2,…,k)个个体(其中k是层数,n是抽取的样本量,Ni是第i层中个体的个数,N是总体中个体的个数)
D.只要抽取的样本量一定,每层抽取的个体数没有限制
(2)下列问题中,最适合用比例分配的分层随机抽样的方法抽样的是 ( )
A.某报告厅有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8000亩、丘陵12 000亩、平地24 000亩、洼地4000亩,现抽取农田480亩,估计全乡农田平均产量
D.从50个零件中抽取5个进行质量检验
变式 (多选题)下列说法中正确的是 ( )
A.从10名同学中抽取3人参加座谈会,宜采用简单随机抽样的方法
B.某高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个样本量为20的样本,宜采用比例分配的分层随机抽样的方法
C.某社区有500个家庭,其中高收入的家庭有125个,中等收入的家庭有280个,低收入的家庭有95个,为了了解生活购买力的某项指标,要从中抽取一个样本量为100的样本,宜采用比例分配的分层随机抽样的方法
D.从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个,宜采用简单随机抽样的方法
[素养小结]
用比例分配的分层随机抽样的方法应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
◆ 探究点二 分层随机抽样的应用
例2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与年龄有关的某项指标,要从中抽取100名职工作为样本,应该怎样抽取
变式 (1)某市教育局想了解全市所有学生对某电影的评价,决定从全市所有学校中选取3所学校按学生人数用比例分配的分层随机抽样的方法抽取一个样本,若3所学校的学生人数之比为2∶3∶4,且从学生人数最少的一个学校抽出120人,则样本量为 ( )
A.560 B.540
C.450 D.400
(2)从某景区某日的游客中随机抽取100人,对他们的出行方式进行统计,统计结果如下表:
出行方式 高铁 自驾 飞机 其他
人数 27 16 28 29
若采用比例分配的分层随机抽样的方法再从这100人中抽取25人,则应从选择飞机出行的人中抽取 人.
[素养小结]
用比例分配的分层随机抽样的方法抽取样本的一般步骤:
◆ 探究点三 分层随机抽样中用样本平均数估计总体平均数
例3 某学校高一年级有男生610人,高二年级有男生590人,李梅按照高一、高二年级进行分层,通过分层随机抽样的方法,得到高一年级男生、高二年级男生的平均身高分别为169 cm和171 cm.
(1)如果李梅是按比例分配的方式抽取的样本,总样本量为120,那么在高一、高二年级中分别抽取了多少名男生
(2)在(1)的情况下,请估计高一年级与高二年级全体男生的平均身高(结果保留两位小数).
变式1 (多选题)某校高二年级有男生490人、女生510人,按性别进行分层,通过分层随机抽样的方法,得到男、女生的平均身高分别为170.2 cm和160.8 cm,则下列说法正确的是 ( )
A.若采用比例分配的分层随机抽样的方法共抽取100人,则可用×170.2+×160.8≈165.4(cm)来估计总体均值
B.若从男、女生中分别抽取30人和70人,则可用×170.2+×160.8≈165.4(cm)来估计总体均值
C.若从男、女生中分别抽取30人和70人,则可用×170.2+×160.8≈163.6(cm)来估计总体均值
D.仅根据男、女生的样本均值,无法计算出总体均值
变式2 在例3中,如果李梅从高一、高二年级男生中抽取的样本量分别为40和80,那么在这种情况下,如何估计高一年级与高二年级全体男生的平均身高
[素养小结]
进行比例分配的分层随机抽样的相关计算时,常用到的三个关系如下:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;
(3)样本的平均数和各层的样本平均数的关系为
=+=+.
9.1.2 分层随机抽样
【课前预习】
知识点一
1.简单随机抽样 总样本 层
2.比例 比例分配
诊断分析
(1)× (2)× (3)√ (4)× [解析] (1)比例分配的分层随机抽样是按比例抽取的,每个个体被抽到的可能性相同,这是公平的.
(2)没有明显的层,不适合用比例分配的分层随机抽样.
(3)抽取的女生人数为18×=3.
(4)依题意,样本容量为=18.
知识点二
1.Xi xi
2.Yi yi 4.
诊断分析
(1)× (2)√ [解析] (1)在比例分配的分层随机抽样中,才有==.
【课中探究】
探究点一
例1 (1)C (2)C [解析] (1)易知A,D不正确;对于B,由于每层中的个体数不一定相等,若每层抽取同样多的个体数,则从整个总体来看,各层之间的个体被抽取的可能性就不一样了,故B不正确;对于C,符合比例分配的分层随机抽样的特点,能够保证每个个体等可能地被抽取,故C正确.故选C.
(2)A中的个体没有呈现出较大差异,不适合用比例分配的分层随机抽样的方法;B和D中总体的个体数较小,用简单随机抽样的方法比较方便;C中总体的个体数较大,且各类农田的差别很大,宜采用比例分配的分层随机抽样的方法.
变式 ABC [解析] A中总体的个体无明显差异且个体数较小,适合用简单随机抽样的方法;B,C,D中总体的个体差异明显,适合用比例分配的分层随机抽样的方法.故A,B,C正确,D错误.故选ABC.
探究点二
例2 解:用比例分配的分层随机抽样的方法来抽取样本,步骤如下:
(1)分层,按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数,抽样比为=,则在不到35岁的职工中抽取125×=25(人);在35岁至49岁的职工中抽取280×=56(人);在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层中分别按简单随机抽样的方法抽取样本.
(4)汇总每层抽取的样本,组成总体的样本.
变式 (1)B (2)7 [解析] (1)设样本量为n,依题意得=,解得n=540,即样本量为540.故选B.
(2)由题意,应从选择飞机出行的人中抽取25×=7(人).
探究点三
例3 解:(1)根据题意,在高一年级中抽取了×120=61(名)男生,在高二年级中抽取了×120=59(名)男生.
(2)估计高一年级与高二年级全体男生的平均身高为×169+×171=≈169.98(cm).
变式1 ABD [解析] 对于A,由题意得样本均值为×170.2+×160.8≈165.4(cm),由此可以估计总体均值约为165.4 cm,故A正确;对于B,C,可用×170.2+×160.8≈165.4(cm)来估计总体均值,故B正确,C错误;对于D,仅根据男、女生的样本均值,可以估计出总体均值,但不能计算出准确的总体均值,故D正确.故选ABD.
变式2 解:因为高一年级和高二年级的男生人数分别是610与590,而抽取的样本量分别为40和80,所以没有按照比例分配的方式进行抽样,不能直接用样本平均数估计总体平均数,需要使用样本平均数以及总体中各层的人数估计总体平均数,可估计高一年级与高二年级全体男生的平均身高为×169+×171=≈169.98(cm).