9.1.2 分层抽样 课件(共22张PPT)

文档属性

名称 9.1.2 分层抽样 课件(共22张PPT)
格式 zip
文件大小 366.6KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-04-02 09:53:55

图片预览

文档简介

(共22张PPT)
9.1.2 分层抽样
一、复习回顾
抽签法
2.最常用的简单随机抽样
随机数法(随机试验、信息技术)
1.简单随机抽样的概念
3.总体均值与样本均值
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本。
抽样调查最核心的问题就是样本的代表性.
例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或者矮个子的情形。这种“极端”样本的平均数会大幅度偏离总体平均数,从而使得估计出现较大的误差。
能否利用总体中的一些额外信息对抽样方法进行改进呢?
问题3 在树人中学高一年级有712名学生,其中男生有326名, 女生有386名. 能否利用这个辅助信息改进简单随机抽样方法 , 减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
我们知道,影响身高的因素有很多,性别是其中一个主要因素。高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小。
我们可以利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本。
由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本。
思考? 对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?
显然, 为了使样本的结构与总体的分布相近,人数多的群体应多抽一些 , 人数少的群体应少抽一些.
因此,按男生、女生在全体学生中所占的比例进行分配是一种比较合理的方式,即
这样无论是男生还是女生,每个学生抽到的概率都相等。
问题3 在树人中学高一年级有712名学生,其中男生有326名, 女生有386名. 抽取一个容量为50的样本,估计整个年级平均身高.
当总样本量为50时 , 可以计算出从男生、女生中分别应抽取的人数为
我们按上述方法抽取的一个容量为50的样本,其观测数据(单位:cm)如下:
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 184.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0
167.0 170.0 175.0
男生
男生身高的样本平均数为170.6 .
男生身高的样本平均数为170.6 .
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
女生
女生身高的样本平均数为160.6 .
根据男生、女生身高的样本平均数以及它们各自的人数,可以估计总体平均数为
即估计树人中学高一年级学生的平均身高在165.2cm左右。
上面我们按照性别变量,把高一年级学生划分为男生、女生两个身高差异较小的子总体分别进行抽样,进而得到总体的估计。
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。
二、分层随机抽样
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n . 我们用X1,X2 ,···,XM 表示第1层各个个体的变量值,用x1,x2,··· ,xm 表示第1层样本的各个个体的变量值;
则第1层的总体平均数和样本平均数分别为
则第2层的总体平均数和样本平均数分别为
用Y1,Y2,···,YN 表 示 第2层各个个体的变量值,用y1,y2,··· ,yn表示第2层样本的各个个体的变量值,
总体平均数和样本平均数分别为
探究! 与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上上一节“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要发现 . 你是否也有所发现
我们把分层随机抽样的平均数与上一节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数。
从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样.
但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个(第2个)偏离总体平均数的幅度比较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.
实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.
分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用 . 例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他的抽样方法,有时层内还需要再进行分层,等等.
解:
六年级占
初三年级占
高三年级占
例. 某校小学六年级、初中三年级和高中三年级分别有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本,你认为应当怎样抽取样本较为合理?
应取 名;
应取 名;
应取 名.
1、某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户.为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;为完成上述两项抽样,则应采取的抽样方法是(  )
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样,
C.①简单随机抽样,②简单随机抽样
D.①分层抽样,②分层抽样.
知识迁移
B
2. 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,20
D
3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=(  )
A.9 B.10 C.12 D.13
D
192
4.某校有老师200人 , 男学生1200人 , 女学生1000人. 现用分层抽样的方法从所有师生中抽取一个容量为n的样本 , 已知从女学生中抽取的人数为80人 , 则n= _____ .
5、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=_____.
360
8
6、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为_____人。
7、有A , B , C三种零件,分别为a个,300个,b个 . 采用分层抽样法抽取一容量为45的样本,A种零件被抽取20个,C中零件被抽取10个,则此三种零件一共有______个。
900
三、归纳小结
(1)分层 根据已经掌握的信息,将总体分成互
不相交的层;

(3)定数 确定每一层应抽取的个体数目,并使每一
层应抽取的个体数目之和为样本容量n;
(4)抽样 按步骤3确定的数目在各层中随机抽取
个体,合在一起得到容量为n样本.
1、分层抽样的具体步骤
2、简单随机抽样和分层随机抽样的异同
类 别 共同点 各自特点 联 系 适 用 范 围
简 单 随 机 抽 样 (1)抽样过程中每个个体被抽到的可能性相等 (2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 各层抽样时采用简单随机抽样 总体个数较少
分 层随 机 抽 样 将总体分成几层,分层进行抽取 总体由差异明显的几部分组成