9.1.2分层随机抽样
1.简单随机抽样的概念:
一般地,设一个总体含有N个个体,从中逐个地抽取n个个体作为样本 (n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,
这种抽样方法叫做简单随机抽样.
简单随机抽样的特点:①有限性;②逐一性;③等可能性.
2.简单随机抽样的常用方法:
抽签法:①编号;②制签;③抽签;④取样.
随机数表法:①编号;②产生随机数;③记录样本编号;④取样.
3.总体均值与样本均值:(用样本平均数估计总体平均数)
复习导入
????=????1+????2+…????????????=1????????=1????????????
?
????=????1+????2+…????????????=1????????=1????????????
?
抽样调查最核心的问题是什么?
会不会出现样本中50个个体大部分来自高个子或矮个子的情形?
为什么会出现这种“极端样本”?
如何避免这种“极端样本”?
样本的代表性
会
抽样结果的随机性个体差异较大
分组抽样,减少组内差距
问题1:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本。
新知探究
性别是一个主要因素
高一阶段,影响学生身高的主要因素是什么呢?
问题1:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本.
无论是男生还是女生,每个学生被抽到的可能性相等.
合在一起就可以得到一个容量为50的样本.
新知探究
思考1:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?
新知探究
分层随机抽样的定义:
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
新知探究
分层随机抽样步骤:(比例分配)
分层
按某种特征将总体分成若干部分(层)
计算
抽样比
抽样比=?样本容量??总体容量?
?
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
汇总
综合各层抽样,组成样本
新知探究
分层随机抽样的特点:
问题2:分层随机抽样有什么特点呢?
①分层随机抽样适用于总体有差异明显的几个部分组成的情况。
②比例分配的分层随机抽样是等可能抽样,如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本数分别????和????。
?
注意:
当总体是由差异明显的几个部分组成时, 往往选用分层随机抽样的方法.
问题3:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本.
如果在各层中按比例分配样本,那么男生、女生中分别抽取了多少名?
新知探究
男生:23; 女生27.
?
按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下:
?
173.0???174.0???166.0???172.0???170.0???165.0???165.0???168.0??184.0
173.0???172.0???173.0???175.0???168.0???170.0???172.0??176.0???175.0
168.0???173.0???167.0???170.0???175.0
?
163.0???164.0???161.0???157.0???162.0???165.0???158.0???155.0???164.0
162.5???154.0???154.0???164.0???149.0????159.0??161.0???170.0???171.0
155.0???148.0???172.0???162.5????158.0???155.5???157.0??163.0???172.0
?
男生:
女生:
新知探究
按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下:
?
173.0???174.0???166.0???172.0???170.0???165.0???165.0???168.0??184.0
173.0???172.0???173.0???175.0???168.0???170.0???172.0??176.0???175.0
168.0???173.0???167.0???170.0???175.0
?
163.0???164.0???161.0???157.0???162.0???165.0???158.0???155.0???164.0
162.5???154.0???154.0???164.0???149.0????159.0??161.0???170.0???171.0
155.0???148.0???172.0???162.5????158.0???155.5???157.0??163.0???172.0
?
男生:
女生:
思考2:如何估计整个高一年级学生身高的平均数?
平均数为170.6
平均数为160.6
男生身高的样本平均数为170.6
女生身高的样本平均数为160.6
男生身高的总体平均数约为170.6
女生身高的总体平均数约为160.6
估计
新知探究
按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下:
?
173.0???174.0???166.0???172.0???170.0???165.0???165.0???168.0??184.0
173.0???172.0???173.0???175.0???168.0???170.0???172.0??176.0???175.0
168.0???173.0???167.0???170.0???175.0
?
163.0???164.0???161.0???157.0???162.0???165.0???158.0???155.0???164.0
162.5???154.0???154.0???164.0???149.0????159.0??161.0???170.0???171.0
155.0???148.0???172.0???162.5????158.0???155.5???157.0??163.0???172.0
?
男生:
女生:
思考2:如何估计整个高一年级学生身高的平均数?
平均数为170.6
平均数为160.6
在分层随机抽样中,如果分2层,第1层和第2层人数分别为????和????.抽取的样本量分别是????和????.
我们用????1,????2...????????表示第1层各个个体的变量值,用????1,????2...????????表示第1层样本的各个个体的变量值。
用????1,????2...????????表示第2层各个个体的变量值,用????1,????2...????????表示第2层样本的各个个体的变量值。
?
新知探究
{22838BEF-8BB2-4498-84A7-C5851F593DF1}
总体平均数
样本平均数
第1层
第2层
总体
分层随机抽样估计总体平均数的方法:
????=????????+????????+????????+????????
?
②特例:在比例分配的分层随机抽样中
????=????????+????????+????????+????????=????????+????????+????????+????????=????
?
可以直接用样本平均数估计总体平均值
样本平均数的加权平均数
新知探究
①常规做法:
新课学习
探究思考:与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10 个样本量为50的样本,计算出样本平均数如下表所示.与上一小节"探究"中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现.你是否也有所发现?
抽样序号
1
2
3
4
5
6
7
8
9
10
男生样本的平均数
170.0
170.7
169.8
171.7
172.7
171.9
171.6
170.6
172.6
170.9
女生样本的平均数
162.2
160.3
159.7
158.1
161.1
158.4
159.7
160.0
160.6
160.2
总样本的平均数
165.8
165.1
164.3
164.3
166.4
164.6
165.2
164.9
166.1
165.1
新知探究
思考3:小明想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,小明有了一个重要发现.你是否也有所发现?
新知探究
我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数.
发现3:在总体差异较大时,分层随机抽样的效果一般会优于简单随机抽样。
发现1:分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样。
发现2:相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有偏离总体平均数幅度比较大的极端数据。
简单随机抽样和分层随机抽样异同:
{22838BEF-8BB2-4498-84A7-C5851F593DF1}
简单随机抽样
分层随机抽样
方法
要点
随机→“搅拌均匀”→抽取
分层→比例→抽取
共同点
①抽样过程中每个个体被抽到的可能性相等
②每次抽出个体后不再放回,即不放回抽样
不同
点
从总体中逐个随机抽取
将总体分成不交叉的若干层,各层中按比例抽取
相互
联系
各层的抽样可采用简单随机抽样
适用
范围
总体中的个体总数较少
总体由差异明显的几个部分组成
小结
阅读课本,自主完成
获取数据的途径
1.通过调查获取数据
2.通过试验获取数据
3.通过观察获取数据
4.通过查询获得数据