(共17张PPT)
9.1.2 分层随机抽样
1.了解分层随机抽样的特点、适用范围及必要性
2.掌握各层样本量比例分配的方法和分层随机抽样的样本均值
问题1:在简单随机抽样中,会不会出现全是高个子或全是矮个子的样本呢?
知识点1:分层随机抽样的概念
问题2:在样本量相同且样本量不大时,总体中个体差异的大小对估计效果有什么影响?
问题3:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本,如何抽取比较合理?
分组抽样,减少组内差距
把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本.
高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小.
思考:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?
无论是男生还是女生,每个学生被抽到的可能性相等.
合在一起就可以得到一个容量为50的样本.
男生样本量=
男生人数
全体学生人数
×总样本量
女生样本量=
女生人数
全体学生人数
×总样本量
n女=
n男=
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0
167.0 170.0 175.0
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 151.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
按上述方法抽取了一个容量为50的样本,其观测数据(单位:cm)如下:
男生
女生
问题2:如何计算总体平均数?
通过计算得出男生和女生身高的样本平均数分别为170.6,160.6.
总体平均数
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
每层样本量都与层的大小成比例,这种样本量的分配方式称为比例分配.
每一个子总体称为层.
要点辨析
分层随机抽样的特点
2.分层抽样是等可能抽样,用分层抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于
3.分层抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也更广泛.
1.从分层抽样的定义可看出,分层抽样适用于总体由差异明显的几个部分组成的情况.
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
使用分层随机抽样应遵循的原则
利用比例分配的分层随机抽样抽取样本的操作步骤
分层
按某种特征将总体分成若干部分(层)
计算抽样比
定数
抽样比k=
样本数
总体个数
抽样
成样
按抽样比确定每层抽取的个体数
各层分别按简单随机抽样的方法抽取样本
综合各层抽样,组成样本
知识点2:分层随机抽样的平均数
问题:在按比例的分层随机变量中,样本平均数与总体平均数之间有什么关系?
用X1,X2,…,XM表示第1层各个体的变量值,用x1,x2,…,xm表示第1层样本的各个体的变量值用Y1,Y2,…,YN表示第2层各个体的变量值;用y1,y2,…,yn表示第2层样本的各个体的变量值,
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.
总体平均数 样本平均数
第1层
第2层
总体
由于用第一层的样本平均数 可以估计第1层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数 ,
估计总体平均数
因此可以用
当每一层的样本量按比例分配确定时,有
所以
从而
可以直接用样本平均数估计总体平均值
思考:从样本均值估计总体均值的角度,比例分配的分层随机抽样的估计效果是否一定比简单随机抽样的效果更好?
阅读教材P183探究
分层随机抽样的结果并不是每一次都优于简单随机抽样
分层随机抽样的样本平均数波动幅度更均匀
归纳总结
在个体差异较大的情形下,只要选取的分层变量合适,使得各层差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样.
要点概括整合
分层随抽样
概念
步骤
公式