9.1.2分层随机抽样、9.1.3获取数据的途径-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册课件(共22张PPT)

文档属性

名称 9.1.2分层随机抽样、9.1.3获取数据的途径-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册课件(共22张PPT)
格式 ppt
文件大小 959.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-24 21:35:01

图片预览

文档简介

(共22张PPT)
9.1.2分层随机抽样
一、复习回顾
1、简单随机抽样的特点:
②逐个不放回抽取;
③等可能入样;
④总体容量较小。
2、简单随机抽样的常用方法:
①抽签法;
②随机数法。
①总体个数有限;
3、抽样调查的根本目的是什么?核心问题是?
用样本估计总体,核心问题是样本具备代表性
二、探究:
思考:在树人中学高一年级的712名学生中,男生有326名、女生有
386名.现需了解该校学生的身高情况,从中抽取容量为50
的样本,你认为应当怎样抽取样本较为合理?
(1)能否在这712名学生中随机抽取50名学生?为什么?
抽样的随机性,有可能会出现比较“极端”的样本.随机抽取可能样本不具备代表性。
(2)影响身高因素哪些?最主要因素是什么?
性别
(3)如何抽取才能保证抽样的合理性?
将全体学生按性别分别抽样
能否在男女生中平均抽取?
(4)
如何确定男女生所要抽取的人数?
计算样本容量与总体容量的比值,再按比例分配给男女生,得男女生所要抽取的个体数。
二、探究:
思考:在树人中学高一年级的712名学生中,男生有326名、女生有
386名.现需了解该校学生的身高情况,从中抽取容量为50
的样本,你认为应当怎样抽取样本较为合理?
男生样本量=
×总样本量
女生样本量=
×总样本量
分析:
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:
cm)如下:
男生
173.0
174.0
166.0
172.0
170.0
165.0
165.0
168.0
164.0
173.0
172.0
173.0
175.0
168.0
170.0
172.0
176.0
175.0
168.0
173.0
167.0
170.0
175.0
女生
163.0
164.0
161.0
157.0
162.0
165.0
158.0
155.0
164.0
162.5
154.0
154.0
164.0
149.0
159.0
161.0
170.0
171.0
155.0
148.0
172.0
162.5
158.0
155.5
157.0
163.0
172.0
通过计算,得出男生和女生身高的样本平均数分别为170.6、160.6.
根据男生、女生身高的样本平均数以及他们各自的人数,可以估计总体平均数为
165.2,
即估计树人中学高一年级学生的平均身高在165.2cm左右.
这样我们按性别变量,把高一学生划分为男生、女生两个身高差异较小的子总体分别进行抽样,进而得到总体的估计.
二、基础知识讲解
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
1.分层随机抽样的概念:
分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等或相近.
2.注意:
3、分层抽样的一般步骤:
(1)将总体按一定的标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
(5)综合每层抽样,组成样本.
(4)在每一层进行抽样;(可用简单随机抽样)
开始
分层
计算比
定层抽取容量
抽样
组样
结束
(3)当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法。
4、关于分层抽样的几点说明:
(1)在步骤1—分层中,通常是根据总体的特征指标的差异来分层。
(2)在实际应用中,常按地理区域或行政管理单位来分层。这样可以使得抽样过程的组织管理及数据汇总都比较方便,还可以得到各个层的分析结果。
(4)优点:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
5、平均数的计算
第1层的总体平均数和样本平均数分别为
第1层的总体平均数和样本平均数分别为
例1、总体由100人组成,按以往收入情况分成两层,第一层(高收入层)20人;第二层(低收入层)80人.从第一层随机抽2人,得月收入的平均数为14
000元;从第二层抽8人,得月收入的平均数为3
500元,估计100人的月收入的平均数.
二、基础知识讲解
探究:与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上一小节“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现.你是否也有所发现?
抽样序号
1
2
3
4
5
6
7
8
9
10
男生样本的平均数
170.0
170.7
169.8
171.7
172.7
171.9
171.6
170.6
172.6
170.9
女生样本的平均数
162.2
160.3
159.7
158.1
161.1
158.4
159.7
160.0
160.6
160.2
总样本的平均数
165.8
165.1
164.3
164.3
166.4
164.6
165.2
164.9
166.1
165.1
我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用下图形进行表示,其中粉红线表示整个年级学生身高的平均数.
从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单随机抽样.但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个(第2个)偏离总体平均数的幅度比较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.
抽样序号
样本平均数
二、基础知识讲解
实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用.
例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他的抽样方法,有时层内还需要再进行分层,等等.
二、基础知识讲解
例2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员有
(  )
A.3人   B.4人
C.7人
D.12人
三、例题讲解
B
例3、某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个样本量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
三、例题讲解
解:由题意知,该抽样为比例分配的分层随机抽样,抽样过程如下:
1、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=_____
360
2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为____人
8
四、课堂练习
3.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
答案 60
四、课堂练习
4.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________.
解析 因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.
答案 简单随机抽样
四、课堂练习
9.1.3获取数据的基本途径
获取数据的基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
五、课堂小结