(共27张PPT)
第九章
9.1.2 分层随机抽样
人教A版(2019)
教学目标
学习目标 数学素养
1.理解分层随机抽样的概念,弄清分层随机抽样的特点、适用范围及必要性. 1.数学抽象素养.
2.掌握各层样本量比例分配的方法和分层随机抽样的样本均值. 2.数学抽象素养和运算素养.
温故知新
1.简单随机抽样的特点
①总体容量较小;
②逐个抽取;
③不放回抽取;
④每个个体被抽到的机会相等
2.最常用的简单随机抽样
⑴抽签法
⑵随机数法
3.用样本平均数估计总体平均数
总体平均数:
样本平均数:
知新引入
抽样调查最核心的问题是样本的代表性. 简单随机抽样是使总体中每一个个体都有相等的机会被抽中, 但因为抽样的随机性, 有可能会出现比较“极端”的样本. 例如, 在对树人中学高一学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形. 这种“极端”样本会大幅度地偏离总体的平均数,从而使得估计出现较大的误差.
能否利用总体中的一些额外信息对抽样方法进行改进呢?
问题1:在简单随机抽样中,会不会出现全是高个子或全是矮个子的样本呢?
问题2:在样本量相同且样本量不大时,总体中个体差异的大小对估计效果有什么影响?
知新探究
问题3 在树人中学高一年级的712名学生中,男生有326名,女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
我们知道,影响身高的因素有很多,性别是一个主要因素.高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小.
我们可以利用性别和身高的这种关系, 把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样, 然后汇总作为总体的一个样本.由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.
对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?
自然地,为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的应少抽一些.
知新探究
因此,按男生、女生在全体学生中所占的比例进行分配是比较合理的方式. 即
男生样本量=×总样本量
女生样本量=×总样本量
这样无论是男生还是女生,每个学生被抽到的概率都相等.
当总样本量为50时,可以计算出从男生、女生分别应抽取的人数为
知新探究
我们按照上述方法抽取了一个容量为50的样本,其观测数据(单位:cm)如下:
男生
女生
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
通过计算,得出男生和女生身高的样本平均数分别为170.6,160.6.根据男生、女生身高的样本平均数以及它们各自的人数,可以估计总体平均数为
所以树人中学高一年级学生的平均身高大约在165.2cm左右.
知新探究
上面我们按照性别变量,把高一学生划分为男生、女生两个身高差异较小的子总体分别进行抽样,进而得到总体的估计.
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
分层随机抽样的特点
1.从定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
2.分层抽样是等可能抽样,用分层抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
3.分层抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也更广泛.
知新探究
使用分层随机抽样应遵循的原则
⑴将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
⑵分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
利用比例分配的分层随机抽样抽取样本的操作步骤
分层
按某种特征将总体分成若干部分(层)
计算抽样比
抽样比k=
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
成样
综合各层抽样,组成样本
知新探究
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个体的变量值,用x1,x2,…,xm表示第1层样本的各个体的变量值;用Y1,Y2,…,YN表示第2层各个体的变量值,用y1,y2,…,yn表示第2层样本的各个体的变量值,则
总体平均数 样本平均数
第1层
第2层
总体
新知探究
由于用第一层的样本平均数可以估计第1层的总体平均数,第二层的样本平均数可以估计第2层的总体平均数,因此我们可以用
.
估计总体平均数.
在比例分配的分层随机抽样中,
.
可得
.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
新知探究
与考察简单随机抽样估计效果类似, 小明也想通过多次抽样考察一下分层随机抽样的估计效果. 他用比例分配的分层随机抽样, 从高一年级的学生中抽取了10个样本量为50的样本, 计算出样本平均数如下表所示. 与上一节“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现. 你是否也有所发现?
抽样序号 1 2 3 4 5 6 7 8 9 10
男生样本的平均数 170.0 170.7 169.8 171.7 172.7 171.9 161.6 170.6 172.6 170.9
女生样本的平均数 162.2 160.3 159.7 158.1 161.1 158.4 159.7 160.0 160.6 160.2
总体样本的平均数 165.8 165.1 164.3 164.3 166.4 164.6 165.2 164.9 166.1 165.1
新知探究
我们把分层随机抽样的平均数与上一节样本量为50的简单随机抽样的平均数用图形表示(如图),其中红线表示整个年学生身高的平均数.
从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样.但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了(第2个)偏离总体平均数的幅度较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.
新知探究
实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.
分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.
类 别 共同点 各自特点 联 系 适 用 范 围
简单随机抽 样 ⑴抽样过程中每个个体被抽到的可能性相等; ⑵每次抽出个体后不再将它放回,即不放回抽样. 从总体中逐个抽取 各层抽样时采用简单随机抽样 总体个数较少 分层随机抽样 将总体分成几层,分层进行抽取 总体由差异明显的几部分组成
新知探究
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用.在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他的抽样方法,有时层内还需要再进行分层,等等.
如果要了解某电视节目在你所在地区(城市、乡镇或村庄)的收视率,你能帮忙设计一个抽样方案吗?结合你所在地区的实际情况,和同学展开交流.
新知探究
【例1】下列问题中,采用怎样的抽样方法较为合理?
⑴从10台冰箱中抽取3台进行质量检查;
⑵某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本;
⑶某学校有160名教职工 ,其中教师 120名,行政人员16名,后勤人员24名.为了了解教职工对校务公开方面的意见,拟抽取一个容量为20的样本.
解:
⑴总体容量比较小,用抽签法或随机数表法都很方便.
⑵总体个体差异明显,适合用分层抽样.
⑶由于学校各类人员对这一问题看法差异可能很大 ,故应采用分层抽样方法.
新知探究
【例2】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解:
⑴分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工..
⑵确定每层抽取个体的个数.抽样比为,则
⑶在各层分别按随机数法抽取样本.
在不到35岁的职工中抽取125×=25(人);
在35岁至49岁的职工中抽取280×=56(人);
在50岁及50岁以上的职工中抽取95×=19(人).
⑷汇总每层抽样,组成样本.
新知探究
【例3】某企业三月中旬生产A、B、C三种产品共3000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
由于不小心,表格中A、C产品的有关数据已被污染,看不清楚了统计员只记得A产品的样本量比C产品的样本量多10.根据以上信息,可得C产品共生产了______件.
解:
∴A产品和C产品在样本中共有300-130=170(件).
设C产品的样本量为y,则
设总的样本量为
∴C产品共生产了(件).
∴x=300.
y+ y+10=170, 即y=80.
800
初试身手
1.下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
解:
B中总体所含个体差异明显,适合用分层随机抽样.故选B.
A中总体所含个体无差异且个数较少,适合用简单随机抽样;
C和D中总体所含个体无差异且个数较多,不适合用分层随机抽样;
B
初试身手
2.某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
解:
第1步,确定抽样比,样本容量与总体容量的比为.
第2步,确定分别从三类人员中抽取的人数,
从行政人员中抽取16×=2(人);
从教师中抽取112×=14(人);
从后勤人员中抽取32×=4(人).
第3步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第4步,把抽取的个体组合在一起构成所需样本.
抽样过程如下:
初试身手
3.某校有初中、高中两个部门,其中初中有学生850人,高中有学生650人,小军想要进行一个视力调查,对学校按部门进行按比例分配分层随机抽样,得到初中生、高中生平均视力分别为1.0,0.8,其中样本量为60,则在初中部、高中部各抽取多少人?整个学校平均视力是多少?
解:
高中部抽取人数为60×=26,
学校平均视力为×1.0+×0.8≈0.91,
所以在初中部、高中部各抽取34,26人,学校平均视力约为0.91.
初中部抽取人数为60×=34,
课堂小结
1.分层随机抽样的定义
2.分层随机抽样中,总体容量、样本容量、各层的个体数、各层抽取的样本数这四者之间有的关系.
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
设总体容量为N,样本容量为n,第i(i=1,2,…,k)层的个体数为Ni,各层抽取的样本数为ni,则,这四者中,已知其中三个可以求出另外一个.
课堂小结
3.分层随机抽样的步骤
分层
按某种特征将总体分成若干部分(层)
计算抽样比
抽样比k=
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
成样
综合各层抽样,组成样本
作业布置
作业: P183 练习 第2,3题 P188 习题9.1 第5,7题.
尽情享受学习数学的快乐吧!
我们下节课再见!
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
兼职招聘:
https://www.21cnjy.com/recruitment/home/admin