(共28张PPT)
抽样技术
Sampling
Technology
什么是统计?
Statistics
is
the
study
of
the
collection,
organization,
analysis,
interpretation,
and
presentation
of
data.
——The
Random
House
College
Dictionary
统计学是对用数字表示的事实或数据进行收集、分类、分析以及解释的科学.
——《兰登书屋大学字典》
生活中的数据
年份
销售额
(亿元)
2010年
9.36
2011年
33.6
2012年
191
2013年
362
2014年
571
2015年
912
2016年
1207
2017年
1682
均值
621.00
方差
315927.66
标准差
562.07
1.全国人口调查
2.新生入学体检
3.2018年1-3月,全国城镇失业率
4.某品牌灯泡的寿命
普查:收集总体全部数据的调查过程.
抽样:收集样本数据的调查过程.是一种非全面性的调查,它是指从研究对象的全体(即总体)中抽取一部分单位作为样本,根据对所抽取的样本进行调查.
普查or抽样?
生活中的调查
抽样调查的作用
普查:收集总体全部数据的调查过程.
抽样:收集样本数据的调查过程.是一种非全面性的调查,它是指从研究对象的全体(即总体)中抽取一部分单位作为样本,根据对所抽取的样本进行调查.
与普查相比,抽样调查的作用主要有以下几个方面:
1.节约费用.
2.节省时间.
3.可以承担普查无法胜任的项目.有一些事物或者客观现象,不可能进行普查,这时必须采用抽样调查,如居民的家庭收入情况、电视节目的收视率,以及具有破坏性的观测或测试,比如灯泡的寿命,这些项目的调查只能采用抽样调查的方法.
抽样界的泰坦尼克事件
共和党
兰登
Alf
Landon
民主党
罗斯福
Franklin
Roosevelt
1936年美国总统选举:Alf
Landon(当时任堪萨斯州州长)和Franklin
Roosevelt(当时的总统)
1936年1月,美国权威的《文学摘要》(Literary
Digest)杂志社进行了美国历史上规模最大的民意测验.他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封.
候选人
预测结果
选举结果
罗斯福
43%
67%
兰登
57%
38%
提示:
1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.
1929~1933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民却从中得到了好处.
Q:哪里出错了?
从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性
样本的代表性:
选取的样本能客观地反映总体的情况,没有人为的主观偏向.
01
高二H2班(学生人数为30人)
某导师组同学对“学习数学的兴趣和现状”
做一次调查(总体为以下情况之一)
抽取8人
简单随机抽样:
一般地,设一个总体含有N个个体,从中不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
简单随机抽样
01
高二H2班
学习数学的兴趣和现状(学生人数为30人)
某导师组同学对“学习数学的兴趣和现状”
做一次调查(总体为以下情况之一)
抽取8人
抽样
抽签法
开始
30名同学从1到30编号
制作1到30个号签
将30个号签搅拌均匀
随机从中抽出8个签
结束
编号→写签→搅匀→获取样本
抽签法
逐个抽取
不能一抓一大把,否则抽到的样本扎堆代表性可能很差
保证签的大小质地均匀,各个特征都要尽量相同,否则会出现作弊的情况
欧冠抽签冷热球
如何制作签?
随机数表法
一个有效的办法是制作一个表
,是由0到9十个数字所组成的数表,每个数字在表中出现的次数是大致相同的,它们出现在表上的顺序是随机的,这样的表称为随机数表.于是,我们只要按一定的规则到随机数表中选取号码就可以了.这种抽样方法叫做随机数表法.
随机数表法
编号→选取始数→读数→获取样本
简单随机抽样:
一般地,设一个总体含有N个个体,从中不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
简单随机抽样主要特点:
(1)总体个数有限;
(2)逐个抽取;
(3)不放回;
(4)每个个体被抽到的机会相等.
简单随机抽样
01
高二H2班
学习数学的兴趣和现状(学生人数为30人)
某导师组同学对“学习数学的兴趣和现状”
做一次问卷调查.如何发放问卷?(总体为以下情况之一)
02
复旦附中青浦分校高二年级学生
学习数学的兴趣和现状(人数为120人)
抽取40人
系统抽样
系统抽样
第四步,按照一定的规则抽取样本.
第一步,将总体的N个个体编号.
第三步,在第1段用简单随机抽样确定起始个体编号l.
第二步,确定分段间隔k,对编号进行分段.
编号→定间隔分段→在第一段内定起始号
→加间隔的每段号码→获取样本
01
高二H2班
学习数学的兴趣和现状(学生人数为30人)
某导师组同学对“学习数学的兴趣和现状”
做一次问卷调查.如何发放问卷?(总体为以下情况之一)
02
复旦附中青浦分校高二年级学生
学习数学的兴趣和现状(人数为120人)
抽取40人
H1:30人,H2:30人,S:60人
分层抽样
分层抽样
分层→确定各层抽取的个数
→在每一层中抽样→获取样本
1、根据总体的差异将总体分为互不交叉的层.
3、合成样本.
2、按比例
在各层中抽取个体.
01
02
03
04
高二H2班
学习数学的兴趣和现状(学生人数为30人)
复旦附中青浦分校高二年级学生
学习数学的兴趣和现状(人数为120人)
青浦区高二年级学生
学习数学的兴趣和现状(人数为1968人)
上海市高二年级学生
学习数学的兴趣和现状(人数为53440人)
某导师组同学对“学习数学的兴趣和现状”
做一次问卷调查.如何发放问卷?(总体为以下情况之一)
样本容量的确定
常用的样本容量经验值
总体
抽样比例
样本数
小
<1000
30%
300
中
10000
10%
1000
大
>150000(15万)
1%
1500
特大
>10000000(1000万)
0.025%
2500
参考书目:(美)劳伦斯﹒纽曼(W.
Lawrence
Neuman)著,郝大海译.社会研究方法:定性和定量的取向[M].北京:中国人民大学出版社,2008.
比较各种抽样方法
【1】从总体中逐个抽取;
【2】适用于总体个数比较少;
【3】将总体分成几层,分层进行抽取;
【4】在起始部分抽样时采用随机抽样;
【5】适用于总体由差异明显的几部分组成;
【6】每层抽样时采用随机抽样或者系统抽样;
【7】抽样过程中每个个体被抽到的可能性都是相等;
【8】每次抽出的个体后不再将它放回,即不放回抽样;
【9】将总体均分成几个部分,按预定的规则在各部分抽取.
【10】适用于总体内部差异不是很大,若总体存在某些趋势或周期,会造成严重的误差.
【9】
将总体均分成几个部分,按预定的规则在各部分抽取.
【1】
从总体中逐个抽取;
【7】
抽样过程中每个个体被抽到的可能性都是相等;
【8】每次抽出的个体后不再将它放回,即不放回抽样;
【3】
将总体分成几层,分层进行抽取;
【2】
适用于总体个数比较少;
【5】
适用于总体由差异明显的几部分组成;
【10】
适用于总体内部差异不是很大,若总体存在某些趋势或周期,会造成严重的误差.
【4】
在起始部分抽样时采用随机抽样;
【6】
每层抽样时采用随机抽样或者系统抽样;
下列抽取样本的方式是属于简单随机抽样的是(
)
①从无限多个个体中抽取100个个体作样本;
②从20个零件中逐个不放回地取出3个进行质量检查;
③一儿童从玩具箱中的20个玩具中随意拿出一件来玩,玩完后放回再拿出一件,连续玩了5件;
④某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
A.①
B.②
C.③
D.以上都不对
四个特点:①总体个数有限;②逐个抽取;③不放回;④每个个体机会均等,与先后无关.
B
达标检测
2.
假定一个有限总体有350项,用下面5位随机数的后3位(601,022,448,…),确定被选入简单随机样本的前4项.
98601
73022
83448
02147
34229
27553
84147
93289
14209
达标检测
2.
从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,采用系统抽样方法,所选取的5枚导弹的编号可能是
A.
5,10,15,20,25
B.
3,13,23,33,43
C.
1,2,3,4,5
D.
2,4,6,16,32
B
达标检测
3.一个地区共有5个乡镇,人口3万人,其中人口比例为
3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病发病率与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
达标检测
5.
判断下列抽样方法是不是系统抽样
工厂生产的产品,用传送带将产品送入包装车间内,检验人员从传送带上每隔五分钟抽一件产品检验;
进行某一市场调查,规定在商场门口随机抽取一个人进行询问,直到调查到事先规定的调查人数为止;
电影院调查观众的满意率,通知每排(每排人数相等)座位号为14的观众留下来座谈.
达标检测
中国部分地区红色革命历史文化传承情况现状及影响因素的研究——以安徽省金寨县和上海市为例
金寨卷(村民版、学生版)
上海卷(居民版、学生版)
生活中的抽样调查
高中生流行语使用情况调查
(选取学伴所在班级发放问卷,收集到来自山东济宁、安徽金寨、贵州松桃约200份问卷)
松桃居民移动通讯设备(手机)的使用情况
(年龄、性别、职业)
数据来源:http://www.stats.gov.cn/tjsj/zxfb/201804/t20180417_1594342.html
调查方法
?
全国及分城乡居民收支数据来源于国家统计局组织实施的住户收支与生活状况调查,按季度发布.
?
国家统计局采用分层、多阶段、与人口规模大小成比例的概率抽样方法,在全国31个省(区、市)的1650个县(市、区)随机抽选16万个居民家庭作为调查户.
生活中的抽样调查
一勺汤,而尝满锅之香.
一叶落,而知天下之秋.