(共29张PPT)
9.1.2 分层随机抽样
高一下学期
1、通过实例了解分层随机抽样的概念、特点和操作步骤;
2、了解分层随机抽样的必要性;
3、掌握各层样本量化比例分配的方法;
4、掌握分层抽样中样本平均数与总体平均数的计算方法.
重点:分层随机抽样的概念与步骤
难点:各层样本量化比例分配的方法、样本平均数与总体平均数的计算
思考:在上一节对树人中学高一年级学生身高的调查中,我们使用简单随机抽样抽取一个容量为50的样本,使总体中每一个个体都有相等的机会被抽中,计算得到平均数为176cm,由此估计该学校高一学生的平均身高为176cm,请问这样的结果合理吗?为什么会出现这样的结果?
因为抽样的随机性,有可能会出现比较“极端”的样本.可能出现样本中50个个体大部分来自高个子或矮个子的情形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.
追问:能否利用总体中的一些额外信息改进一下抽样方法吗?
探究:已知树人中学高一年级有712名学生,其中男生有326名, 女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
性别是影响身高的其中一个主要因素.
高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小.
我们可利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本。
追问:已知树人中学高一年级有712名学生,其中男生有326名, 女生有386名.
抽取一个容量为50的简单随机样本,应如何分配?
为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些.
即可按男生、女生在全体学生中所占的比例进行分配:
无论是男生还是女生,每个学生抽到的概率都相等.
均为
思考:每个学生被抽到的概率相等吗?
一、分层随机抽样
一般地,按 变量把总体划分成若干个 ,每个个体 一个子总体,在每个子总体中独立地进行 ,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样.
每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为 .
一个或多个
子总体
属于且仅属于
简单随机抽样
总样本
比例分配
按照性别变量
高一年级的学生
男生
女生
男生样本
女生样本
抽样
抽样
总样本
子总体1
子总体2
抽样比
总体
例题:某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,并写出抽样过程.
解:第一步:确定抽样比,样本容量与总体容量的比为,
第二步:确定分别从三类人员中抽取的人数,
从行政人员中抽取(人),
从教师中抽取(人),
从后勤人员中抽取(人);
第三步:用简单随机抽样方法抽取行政、教师、后勤人员为2人,14人,4人.
第四步,把抽取的个体组合在一起构成所需样本.
分层
计算抽样比
定数
抽样汇总
分层随机抽样的步骤:
分层
按某种特征将总体分成若干部分(层)
计算
抽样比
抽样比
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
汇总
综合各层抽样,组成样本
1、某学校为了了解三年级、六年级、九年级这三个年级学生的课业负担情况,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ).
A.抽签法 B.简单随机抽样 C.分层随机抽样 D.随机数法
C
2、甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个样本量为90的样本,应在甲、乙、丙三校分别抽取的学生人数为( ).
A.30,30,30 B.30,45,15 C.20,30,40 D.30,50,10
B
3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为n的样本,每个学生被抽到的可能性均为0.2, 则n= .
360
解:(1)由题意,解得,
所以.
练习:某网站针对“2019年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:
支持A方案 支持B方案 支持C方案
35岁以下的人数 210 400 800
35岁以上(含35岁)的人数 100 100 400
(1)从所有参与调查的人中,用分层随机抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;
(2)从支持B方案的人中,用分层随机抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?
(2)35岁以下的人数为,35岁以上(含35岁)的人数为.
探究:我们按上述方法抽取了容量为50的样本,其观测数据(单位)如下:
男生:173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0
164.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0
176.0 175.0 168.0 173.0 167.0 170.0 175.0
女生:163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0
164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0
170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5
157.0 163.0 172.0
思考1:如何估计整个高一年级学生身高的平均数?
思考2:若通过计算得出男生和女生身高的样本平均数分别为170.6,160.6,如何估计整个高一年级学生身高的平均数?
思考2:若通过计算得出男生和女生身高的样本平均数分别为170.6,160.6,如何估计整个高一年级学生身高的平均数?
男生身高的样本平均数为170.6
女生身高的样本平均数为160.6
根据男生、女生身高的样本平均数以及它们各自的人数,
即估计树人中学高一年级学生的平均身高在165.2cm左右.
则总体平均数为
男生身高的总体平均数约为170.6
女生身高的总体平均数约为160.6
估计
总体平均数 样本平均数
第1层
第2层
总体
在分层随机抽样中,如果层数分别为2层,
第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.
●第1层总体的各个个体的变量值为:,…,;
第1层样本的各个个体的变量值为:,…,;
●第2层总体的各个个体的变量值为:,…,;
第2层样本的各个个体的变量值为:,…,.
由于用第1层的样本平均数可以估计第1层的总体平均数,
用第2层的样本平均数可以估计第2层的总体平均数,
因此我们可以用: 估计总体平均数.
在比例分配的分层随机抽样中,
可得
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数
思考:在简单随机抽样中如何估计总体平均数?
用样本平均数估计总体平均数
追问:那么在分层随机抽样中,还能用样本平均数估计总体平均数吗?
例题:将一个总体分为A,B,C三层,其个体数之比依次为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则A,B,C三层的样本的平均数分别为15,30,20.(1)求样本的平均数; (2)估计总体平均数.
解析:(1)样本平均数. (2)总体平均数约为20.5.
例题:为了对某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解:(1)∵0(2)∵高校B中抽取的教授数是高校A和C中抽取的教授总数的,
∴(m+n)=72,解得m+n=108,∴三所高校的教授的总人数为m+n+72=180.
练习:为了了解某社区居民有无收看“奥运会开幕式”的情况,某记者分别从该社区60~70岁,40~50岁,20~30岁的三个年龄段中的160人,240人,x人中,采用分层抽样的方法共抽取了30人进行调查,若在60~70岁这个年龄段中抽查了8人,则x为( ).
A.90 B.120 C.180 D.200
D
解:从60~70岁,40~50岁,20~30岁的三个年龄段中的160人,240人,x人中抽取30人,每个个体被抽到的概率为,
∵在60~70岁这个年龄段中抽查了8人,∴,解得x=200.
(1)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比,
即;
(2)样本量在总体的占比等于每一层样本量在每一层个体中的占比,
即;
(3)每一层个体量在总体的占比等于每一层样本量在总样本量中的占比,
即;
练习:某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团。已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团。各年级参加社团的人数情况如下表:
其中::=5:3:2,且“泥塑”社团的人数占两个社团总人数的3/5。为了了解学生对两个社团活动的满意程度,若从中抽取一个样本量为50的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取____人。
高一年级 高二年级 高三年级
泥塑
剪纸
6
探究:与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如表所示,与上一小节“思考”中相同样本量的简单随机抽样的结果比较,小明有一个重要的发现,你是否也有所发现?
我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数.
发现1:分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样.
发现2:分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个(第2个)偏离总体平均数的幅度比较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.
实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他的抽样方法,有时层内还需要再进行分层,等等.
解:这种说法有道理. 因为一个好的抽样方法,一般随着样本量的增加,抽样调查结果会越来越接近于普查的结果. 因此,只要根据误差控制范围的要求取相应的样本量进行调查,就可以节省人力、物力和财力.
2、有人说:“如果抽样方法设计得好,用样本进行视力调查与对24300名学生进行视力普查的结果差不多,而且对于想要掌握学生视力状况的教育部门来说,节省了人力、物力和财力,抽样调查更可取.”你认为这种说法有道理吗 为什么
教材P184
3、高二年级有男生490人,女生510人,张华按男、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8 cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名 在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理
解:(1)男生应抽取人,女生应抽取人,
∴样本平均数为.
(2)应按(1)的方法进行改进更合理,即高二年级全体学生的平均身高估计为:
.
教材P184
1、分层随机抽样定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
●比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
(1)
(2)
2、分层随机抽样的步骤:
分层
按某种特征将总体分成若干部分(层)
计算
抽样比
抽样比
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
定数
综合各层抽样,组成样本
3.样本平均数的计算公式:
在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,样本平均数分别为,,总体的样本平均数为,则.
我们可以用样本平均数估计总体平均数.
4、简单随机抽样和分层随机抽样异同:
简单随机抽样 分层随机抽样
方法 要点 随机→“搅拌均匀”→抽取 分层→比例→抽取
共同点 ①抽样过程中每个个体被抽到的可能性相等 ②每次抽出个体后不再放回,即不放回抽样
不同 点 从总体中逐个随机抽取 将总体分成不交叉的若干层,各层中按比例抽取
相互 联系 各层的抽样可采用简单随机抽样
适用 范围 总体中的个体总数较少 总体由差异明显的几个部分组成