(共21张PPT)
9.1.2-3
分层随机抽样和
高一数学必修第二册 第九章 统计
获取数据的途径
学习目标
1.通过实例,了解分层随机抽样的特点和适应范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法;
2.在简单的实际情景中,能根据实际问题的特点,设计恰当的抽样方法解决问题.
3.知道获取数据的途径, 包括统计报表和年鉴、 社会调查、试验设计、普查和抽样、互联网等.
4.核心素养: 数据分析、数学抽象、数学运算.
抽签法
2.最常用的简单随机抽样
随机数法(随机试验、信息技术)
一般地, 设一个总体含有N个个体 ,从中逐个地抽取n个个体作为样本 (n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样.
1.简单随机抽样的概念
3.总体均值与样本均值
一、回顾旧知
二、探究新知
1.问题3.
在树人中学高一年级的712名学生中, 男生有326名、女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少"极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
当总体样本量为50时,可以计算出从男生、女生中分别应抽取的人数为
在树人中学高一年级的712名学生中, 男生有326名、女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少"极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
1.问题3.
我们按上述方法抽取的一个容量为50的样本,其观测数据(单位:cm)如下:
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 184.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0
167.0 170.0 175.0
男生
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
女生
2.分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个总体,在每个子总体中独立地进行简单随机抽样,在把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本都与层的大小
成比例,那么称这种样本量的分配方式为比例分配.
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,我们用X1,X2, ···,XM 表示第1层各个个体的变量值,用 表示第1层样本的各个个体的变量值;用 Y1,Y2,···,YN 表 示 第2层 各 个 个体 的变量 值,用 表示第1层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
第2层的总体平均数和样本平均数分别为
总体平均数和样本平均数分别为
在比例分配的分层随机抽样中
3.探究:在与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上上一节“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要发现.你是否也有所发现
抽样序号
1 2 3 4 5 6 7 8 9 10
男生样本平均数 170.0 170.7 169.8 171.7 172.7 171.9 171.6 170.6 172.6 170.9
女生样本平均数 162.2 160.3 159.7 158.1 161.1 18.4 159.7 160.0 160.6 160.2
总样本的平均数 165.8 165.1 164.3 164.3 166.4 164.6 165.2 164.9 166.1 165.1
4.分层随机抽样的特点
1).适用于总体由差异明显的几部分组成的情况;
2).按比例确定每层抽取个体的数量;
3).在每一层进行抽样时,采用简单随机抽样的方法;
4).分层抽样能充分利用已掌握的信息,使样本具有
良好的代表性;
5).分层随机抽样也是等概率抽样,每个个体被抽到的
1.例1.某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名足球运动员,要从中选出3人调查学习负担情况,记作②,则完成上述2项应采用的抽样方法是____________
三、巩固新知
①用分层随机抽样, ②用简单随机抽样,
2.例2.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了了解学校机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取并写出抽样过程.
解:因为本题样本总体分成三类:行政人员、教师、后勤人员,符合分层随机抽样的特点,故选用分层随机抽样方法.
因为
所以从行政人员中抽取
从教师中抽取
从后勤人员中抽取
因为行政人员和后勤人员较少,可将他们分别按1~16和1~32编号,然后采用抽签法分别抽取2人和4人,对教师000,001,…,111编号,然后用随机数法抽取14人,
这样就得到了符合要求的容量为20的样本
步骤1:根据已经掌握的信息,将总体分成互不相交的层
步骤2:根据总体的个体数N和样本容量n计算抽样比k=
步骤3:确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n
步骤4:按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n样本
分层
求比
定数
抽样
分层抽样的具体步骤
n︰N
3.变式训练1
某高中三个年级共有3000名学生,现采取分层随机抽样的方法从高一、高二、高三年级的全体学生中抽取一个容量为30的样本进行视力健康检查,若抽取到的高一年级学生人数与高二年级学生人数之比为3:2,抽取到高三年级学生10人,则该校高二年级学生的人数为( )
A.600 B.800 C.1000 D.200
B
4.变式训练2
在考察某高中的学生身高时,如果采用分层随机抽样的方法,得到了男生身高的平均数为172,女生身高的平均数为162.
(1)如果没有其它信息,怎样估计总体平均数?
(2)如果知道抽取的样本中,男生有20人,女生有15人,怎样估计总体平均数?
解:
候选人 预测结果 (%) 选举结果 (%)
兰顿 57 38
罗斯福 43 62
5.在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿 和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎.于是此杂志预测兰顿将在选举中获胜。 实际选举结果正好相反,最后罗斯福在选举中获胜。
其数据如下:
6.获取数据的途径
1).通过调查获取数据
一般通过抽样调查或普查的方法获得数据
2).通过试验获取数据
3).通过观察获取数据
大数据时代
4).通过查询获得数据
通过互联网获取数据
必须“清洗”数据
“清洗”掉不完整的数据、错误的数据、重复的数据
7.例3.
8.变式训练3
四、课堂小结
1.分层随机抽样的概念.
3.获取数据的途径.
(4)通过查询获得数据
(3)通过观察获取数据
(1)通过调查获取数据
(2)通过试验获取数据
在分层随机抽样中,如果每层样本都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
作业: 课本P188 习题9.1 5、6题