第9章 统计
9.1.2 分层随机抽样
9.1.3 获取数据的途径(1)
高中数学人教A版(2019)必修 第二册
分层随机抽样的概念及特点
分层随机抽样的概念
一般地,按一个或多个变量,把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起,作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配
探究新知
分层随机抽样的概念及特点
分层随机抽样的概念
各部分之间有明显的差异,是选择分层随机抽样的依据,各层内可以采用简单随机抽样
相似的个体归入一类,即为一层,分层时要求每层的各个个体之间互不交叉,遵循不重复,不遗漏的原则.
将总体合理分层
探究新知
分层随机抽样的概念及特点
分层随机抽样的特点
层与层的关系:分成的各层之间互不交叉;
适用范围:总体由差异明显的几部分组成;
各层比例:各层抽取的比例都等于样本量与总体容量的比;
可能性:是等可能抽样,每个个体被抽到的可能性相等;
样本:分层随机抽样充分利用了已知信息,使样本具有较好的代表性.
探究新知
分层随机抽样的概念及特点
对分层抽样的层的理解
在分层抽样中,将具有某种共同特征的对象归为同一层,不同层之间的对象要有明显的差异,并且这些特征的差异应该是对所研究的问题有影响的.例如要从某中学抽取一些学生构成一个样本,如果研究他们的视力情况,那么应该按照年龄分层或按照年级分层,都是合理的分层方式.但如果按照性别分层就不合适了,因为性别对视力的影响的可能是很小的,如果研究他们对篮球运动的兴趣,那么按照性别分层就比按年龄分层或年级分层更合理.在实际中,对于一些复杂的问题。可能还需要对层内再进一步细分层.
探究新知
分层随机抽样的步骤
求各层抽样数:按比例确定每层抽取个体的个数
分层,确定抽样比:抽样比 ????=????????(?????为样本量,?????为总体容量)
?
各层抽样:各层分别用简单随机抽样抽取个体
组成样本:综合每层抽取的个体,组成样本
????????=????????×?????(?????????为第??????层中的个体数)
?
探究新知
分层随机抽样的步骤
各层抽样数由每层个体数占总体数量
的比例确定
分层随机抽样中分多少层、如何分层、要视具体情况而定,总的原则是每层内个体的差异要小,不同层之间的个体的差异要大,且互不重叠
各层抽样按简单随机抽样进行
分层随机抽样的注意点
探究新知
两种抽样方法的比较
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}累别
简单随机抽样
分层随机抽样
各自特点
从总体中逐个抽取
将总体分成几层,分层进行抽取
相互联系
在各层抽样时采用简单随机抽样
适用范围
样本中的个体数较少
总体由存在明显差异的几部分组成
共同点
①抽样过程中每个个体被抽到的可能性相等
②每次抽出个体后不再放回,即不放回抽样
探究新知
两种抽样方法的比较
简单随机抽样和分层随机抽样的区别与联系
分层随机抽样应用最广泛,它充分利用总体信息,得到的样本比简单随机抽样得到的样本更具有代表性
简单随机抽样是最基本的抽样方法,可应用于分层随机抽样中,简单随机抽样所得样本的代表性与个体编号无关
简单随机抽样是最简单最基本的抽样方法,在进行分层随机抽样时也要用到简单随机抽样,因此抽样方法经常交叉起来应用
探究新知
分层随机抽样的平均数
总体平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本量分别为????和????,我们用????????, ????????,…,???????? 表示第1层各个个体的变量值,用 ????????, ????????,…,???????? 表示第1层样本的各个个体的变量值;用 ????????,????????,…,???????? 表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值——
?
????=????????+????????+···+????????????=??????????????????????
?
?=????
?
????
?
则第1层的总体平均数和样本平均数分别为
????=????????+????????+···+????????????=??????????????????????
?
?=????
?
????
?
探究新知
总体平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本量分别为????和????,我们用????????, ????????,…,???????? 表示第1层各个个体的变量值,用 ????????, ????????,…,???????? 表示第1层样本的各个个体的变量值;用 ????????,????????,…,???????? 表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值——
?
????=????????+????????+···+????????????=??????????????????????
?
?=????
?
????
?
第2层的总体平均数和样本平均数分别为
????=????????+????????+···+????????????=??????????????????????
?
?=????
?
????
?
分层随机抽样的平均数
探究新知
分层随机抽样的平均数
总体平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本量分别为????和????,我们用????????, ????????,…,???????? 表示第1层各个个体的变量值,用 ????????, ????????,…,???????? 表示第1层样本的各个个体的变量值;用 ????????,????????,…,???????? 表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值——
?
总体平均数和样本平均数分别为
????=?????????????+?????????????????+????
?
?=????
?
????
?
?=????
?
????
?
????=?????????????+?????????????????+????
?
?=????
?
????
?
?=????
?
????
?
探究新知
分层随机抽样的平均数
总体平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本量分别为????和????,我们用????????, ????????,…,???????? 表示第1层各个个体的变量值,用 ????????, ????????,…,???????? 表示第1层样本的各个个体的变量值;用 ????????,????????,…,???????? 表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值——
?
在比例分类的分层随机抽样中,可以直接用样本平均数 ???? 估计总体平均数 ????,即
?
????=????????+???? ????+????????+?????????=????????+?????????+????????+?????????=????
?
探究新知
获取数据的途径
在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:
通过调查获取数据:设计调查问卷——调查问卷一般由一组有目的,有系统,有顺序的题目组成,问题由调查人员根据调查的目的、项目进行设计.
设计调查问卷的注意事项:①问题要具体有针对性,使受调查者能够容易作答;②语言简单准确、含义清楚,避免出现有歧义或意思含混的句子;③题目不能出现引导受调查者答题倾向的语句;④设计问题时要注意如何得到敏感性问题的诚实回答
探究新知
获取数据的途径
在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:
通过试验获取数据——
根据调查项目的要求,设计一些合适的试验,能够直接的获得样本数据.试验时,要注意准备好试验用具或组织好观测的对象,指定专门的记录人员等.做试验通常能得到可靠的数据资料,但需花费的人力、物力、时间较多,有时带有破坏性
探究新知
获取数据的途径
在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:
通过观察获取数据——
对于有些现象不能用试验或者抽样等方法来获取数据,只能通过长久持续的观察获取.主要是一些自然现象,如地震、降水、大气污染、宇宙射线等.一般通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,需要通过统计学理论和方法来挖掘
探究新知
获取数据的途径
在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:
通过查询获得数据——
有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等方法获得所需或相关的数据,比如全国历次人口普查的数据,都可以在统计年鉴中查阅到,还可以通过互联网上的资源得到数据资料.
探究新知
谢谢聆听