9.1.2 分层随机抽样
第九章 统计
复习回顾
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}概念
公式
总体均值(总体平均数)
样本均值(样本平均数)
用样本估计总体
探究 上节课的例子中,小明由高一年级学生身高的所有数据,计算出整个年级学生的 平均身高为165.0cm . 然后,用简单随机抽样的方法,从这些
数据中抽取了样本量为50和100的样本各10个,分别计算出样本平均数.
探究新知
{5940675A-B579-460E-94D1-54222C63F5DA}
10个样本序号
1
2
3
4
5
6
7
8
9
10
样本量为50的平均数
165.2
162.8
164.4
164.4
165.6
164.8
165.3
164.7
165.7
165.0
样本量为100的平均数
164.4
165.0
164.7
164.9
164.6
164.9
165.1
165.2
165.1
165.2
为了方便观察分析样本平均数的特点以及与总体平均数的关系,把这20次试验的平均数用图形表示出来,如下图.
思考:
(1)为什么有的样本平均数大幅度地偏离了总体平均数?
(2)为什么会出现“极端”样本?
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,抽样有随机性
探究新知
样本中的个体中
有大量的矮个子
“极端”样本
估计出现
较大误差
探究新知
问题3 在树人中学高一年级的712名学生中,男生有326名,女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
性别是影响身高的一个主要因素.
我们可以把高一年级学生分成男生和女生两个身高有明显差异的群体,
对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本.
按照性别变量
高一年级的学生
男生
女生
男生样本
女生样本
抽样
抽样
总样本
子总体1
子总体2
总体
探究新知
思考 男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?
按男生、女生在全体学生中所占的比例进行分配.
当总样本量为50时,可以计算出从男生、女生分别应抽取的人数为:
女生样本量=
女生人数
全体学生数
×总样本量
男生样本量=
男生人数
全体学生数
×总样本量
追问 每个学生被抽到的可能性(概率)相等吗?
无论是男生还是女生,每个学生抽到的概率都相等.
均为 = ???????????????????? .
?
男生
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0
女生
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:????????)如下:
?
男生身高的样本平均数为170.6
男生身高的总体平均数约为170.6
女生身高的样本平均数为160.6
女生身高的总体平均数约为160.6
估计
根据男生、女生身高的样本平均数以及它们各自的人数,可以估计总体平均数为
所以树人中学高一年级学生的平均身高大约在165.2cm左右.
探究新知
分层随机抽样
一般地,按 变量把总体划分成若干个 ,每个个体属且仅属于一个子总体,在每个子总体中独立地进行 ,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样.
每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为 .
一个或多个
子总体
简单随机抽样
总样本
比例分配
讲授新知
按照某种变量
高一年级的学生
男生
女生
男生样本
女生样本
抽样
抽样
总样本
子总体1
子总体2
总体
讲授新知
每一层抽取的样本数=
×总样本量
该层个体数
总体个体数
= 抽样比例
×该层个体数
思考1 如何计算每层应抽的样本数?
注:比例分配的分层随机
抽样是等可能抽样
1. 某学校的学生由小学部、初中部、高中部构成,其中小学部与初中部共有700人,该校领导采用按比例分配的分层随机抽样的方法抽取12名学生进行家访,若高中部抽取了5名学生,则该校高中部有_____名学生.
????????????
?
2. 某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为????的样本,每个学生被抽到的
可能性均为0.2,则????=_______.
?
????????????
?
课堂练习
讲授新知
思考2 归纳出分层随机抽样的步骤.
分层
按某种特征将总体分成若干互不交叉的层
计算
抽样比
抽样比=样本容量总体容量
?
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
汇总
综合各层抽样,组成样本
注:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样的方法.
讲授新知
思考3 在分层随机抽样中,如何用样本平均数估计总体平均数?
在分层随机抽样中,如果层数分别为2层,
第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.
第1层总体的各个个体的变量值为:X1,X2,…,XM;平均数:????
第1层样本的各个个体的变量值为:x1,x2,…,xm; 平均数:????
第2层总体的各个个体的变量值为:Y1,Y2,…,YN; 平均数:????
第2层样本的各个个体的变量值为:y1,y2,…,yn. 平均数:????
?
总样本平均数:????
?
总样本平均数:????
?
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}
总体平均数
样本平均数
第1层
第2层
总体
????=????????+????????+…+????????????
?
????=????????+????????+…+????????????
?
????=????????+????????+…+????????????
?
????=????????+????????+…+????????????
?
=????????????=????????????????
?
=????????????=????????????????
?
=????????????=????????????????
?
=????????????=????????????????
?
讲授新知
????=????=????????????????+????=????????????????????+????
?
????=????=????????????????+????=????????????????????+????
?
=????????+????????????+????
?
=????????+????????????+????
?
用样本平均数???? 估计总体平均数????
?
思考:1. 若小明同学期中考试????????分,期末考试????????分,则两次考试小明的平均分是多少?
2. 若小明同学期中考试????????分,期末考试????????分,按学校规定,期中考试占????????%,而期末考试占????????%,则两次考试小明的平均分是多少?
?
1. (????????+????????)÷????=???????? 分
?
2. ????????×????.????+????????×????.????=?????? 分
?
课堂练习
探究 与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果. 他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上一小节P179的“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现. 你是否也有所发现?
探究新知
{5940675A-B579-460E-94D1-54222C63F5DA}
10个样本序号
1
2
3
4
5
6
7
8
9
10
男生样本的平均数
170.0
170.7
169.8
171.7
172.7
171.9
171.6
170.6
172.6
170.9
女生样本的平均数
162.2
160.3
159.7
158.1
161.1
158.4
159.7
160.0
160.6
160.2
总样本的平均数
165.8
165.1
164.3
164.3
166.4
164.6
165.2
164.9
166.1
165.1
1. 分层随机抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。
2. 相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。
3. 在总体差异较大时,分层随机抽样的效果一般会优于简单随机抽样。
探究新知
发现:
书P184
证明:
课堂练习
书P184
3. 高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2 cm和160. 8 cm.
(1) 如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2) 如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
课堂练习
1. 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个样本容量为36的样本,则合适的抽样方法是( )
????. 抽签法 ????. 随机数法
????. 分层随机抽样 ????. 其他抽样方法
?
????
?
巩固提升
2. 某单位共有老年、中年、青年职工320人,其中青年职工150人,老年职工与中年职工的人数之比为7∶10.为了了解职工的身体情况,现采用按比例分配分层随机抽样的方法进行调查,抽取的样本中有青年职工30人,则抽取的老年职工的人数为( )
????.14 ????.20 ????.21 ????.70
?
????
?
巩固提升
3. 某校有初中、高中两个部门,其中初中有学生850人,高中有学生650人,小军想要进行一个视力调查,对学校按部门进行按比例分配分层随机抽样,得到初中生、高中生平均视力分别为????.???? , ????.????,其中样本量为60,
则在初中部、高中部各抽取多少人?整个学校平均视力是多少?
?
解:
所以在初中部、高中部各抽取34,26人,整个学校平均视力约为0.91.
巩固提升
下次课见!
第九章 统计