(共22张PPT)
9.1随机抽样
9.1.2 分层随机抽样
第九章 统计
导
学习目标
1、准确理解分层抽样的定义、原理和特点,明白为什么要采用分层抽样以及它与其他抽样方法的区别;
2、能够熟练掌握实施分层抽样的具体步骤;
3、学会分析在何种情况下分层抽样是合适的选择,能根据实际问题判断是否应该采用分层抽样.
导
问题引入
问题:在高一年级的712名学生中.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本,可以采取简单随机抽样的方式.
会不会出现样本中50个个体大部分来自高个子或矮个子的情形?
为什么会出现这种“极端样本”?
如何避免这种“极端样本”?
会
(1)抽样结果的随机性(2)个体差异较大
减少总体中个体的差异性
抽样调查最核心的问题是什么?
样本的代表性
思
新知探究
思考:针对以上的不足,能否利用一些额外信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢
高中阶段性别是影响身高的一个主要因素
问题:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本.
思考:如何分配样本量才更合理 理由是什么
按比例分配
思
新知探究
问题:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本.
无论是男生还是女生,每个学生被抽到的可能性相等.
合在一起就可以得到一个容量为50的样本.
思
概念生成
分层随机抽样的定义:
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
思
概念生成
比例分配:=
每层抽取的样本量 =
抽样比例
×该层个体数
第1层样本量
第1层个体数
第2层样本量
总样本量
第2层个体数
总体的个体数
如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本数分别和,
思
概念生成
分层随机抽样步骤:(比例分配)
分层
按某种特征将总体分成若干部分(层)
计算
抽样比
抽样比
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
汇总
综合各层抽样,组成样本
每层抽取的样本量 =
抽样比例
×该层个体数
注意:
当总体是由差异明显的几个部分组成时, 往往选用分层随机抽样的方法.
思
典例解析
例1 1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ).
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
C
思
典例解析
2.某校高一、高二、高三年级各有学生数分别为800,1000,800 (单位:人),现用分层抽样的方法抽取一个容量为n的样本了解网课学习情况,样本中高一学生的人数为48人,那么此样本的容量n为( )A.108 B.96 C.156 D.208
思
新知探究
按上述方法抽取一个容量为的样本,其观测数据(单位:)如下:
男生:
女生:
思考:如何估计整个高一年级学生身高的平均数?
平均数为170.6
平均数为160.6
思
新知探究
在分层随机抽样中,如果分层,第层和第层人数分别为和.抽取的样本量分别是和.
我们用表示第层各个个体的变量值,用表示第层样本的各个个体的变量值。
用表示第层各个个体的变量值,用表示第层样本的各个个体的变量值。
分层随机抽样的平均数
思
新知探究
总体平均数
样本平均数
第1层
第2层
总体
思
新知探究
在比例分配的分层随机抽样中:
在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均值
对各层样本平均数加权(层权)求和
进行比例分配的分层随机抽样的相关计算时,常用到的3个关系
思
新知探究
思
典例解析
例2.某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.若样本中3个区的高中学生的平均视力分别4.8,4.8,4.6,试估计该市高中学生的平均视力.
思
新知探究
思考:小明想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,小明有了一个重要发现.你是否也有所发现
思
新知探究
我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数.
发现3:在总体差异较大时,分层随机抽样的效果一般会优于简单随机抽样。
发现1:分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样。
发现2:相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有偏离总体平均数幅度比较大的极端数据。
1.下列实验中最适合用分层抽样法抽样的是( )A.从一箱3 000个零件中抽取5个入样B.从一箱3 000个零件中抽取600个入样C.从一箱30个零件中抽取5个入样D.从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个入样2.一批灯泡400只,其中20 W、40 W、60 W的数目之比是4∶3∶1,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为( )A.20,15,5 B.4,3,1 C.16,12,4 D.8,6,23.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为( ) A.7,5,8 B.9,5,6 C.7,5,9 D.8,5,7
检
练习巩固
D
A
B
检
练习巩固
4.(多选)某运动队由足球运动员18人,篮球运动员12人,乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若采用分层随机抽样的方法,且不用删除个体:则样本量n的取值不可能是( )A.5 B.6 C.20 D.24
AC
检
本节课我们学习了哪些内容?
课堂小结
1.知识点:
(1)分层随机抽样.
2.方法归纳:数据分析.
3.易错点:在分层随机抽样中,每个个体被抽到的可能性相等,与层数及分层无关,每一层的抽样一般采用简单随机抽样.
(2)有关的计算公式
(3)获取数据的途径.
课本P177练习1、2、3、4.
练
课后作业