§18.2抽样技术
——教学设计
教学设计
一.任务分析
1.教材分析:(含单元分析)
本课选自上海教育出版社高三年级第18章基本统计方法的第2节.《数学学科教学基本要求(试用本)》中对于抽样技术的学习要求为掌握随机抽样、系统抽样和分层抽样等常用抽样方法.统计方法是处理自然界和社会中随机现象的一般方法.学习随机抽样,样本估计总体,体会统计思维与确定性思维的差异,提高学生解决问题的能力,而且为学生更加全面地认识社会,认识世界提供思想方法.
统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据.抽样调查是根据调查的目的和任务要求,从总体中抽取部分个体作为样本进行观察,然后用所得到的样本数据来推断总体的情况,其中蕴含着部分估计总体的统计思想.概率论的实验基础是统计,而统计学的理论基础是概率论,抽样检验的理论依据是随机现象的统计规律性,由于样本的分布与总体的分布有密切的关系,因此用样本来估计总体.
2.学情分析:
复旦大学附属中学青浦分校是一所实验性示范性高中,高二开始数学采取分层教学,所教班级为高水平班(H2班),学习氛围良好,课堂气氛活跃,学生们学习目的性强,思维的独立性强,自觉性高.总体数学基础较好,有一部分同学对数学有极高的热情及兴趣.基本作业之外经常针对性地给学生布置课外探究小课题,培养学生的数学思维能力和探索能力,本节课给学生布置关于来自无限总体的抽样、抽样设计和调查具有敏感性问题的方法3个课后研究性问题.
对学生来说,初中已经学习过中位数、众数、方差、标准差等概念,会画频数分布直方图和频率分布直方图.本节课在学习了总体和抽样之后进一步学习抽样方法,让学生感受抽样调查的必要性,掌握随机抽样、系统抽样和分层抽样等常用抽样方法,初步体会用样本估计总体的统计思想.
二.教学目标
1.
掌握抽样调查及相关概念,理解抽样的必要性和原则;
2.
掌握简单随机抽样、系统抽样和分层抽样等常用抽样方法;
3.
通过身边事例的研究,体会抽样调查在生活中的应用.
三.教学重点和难点
重点:掌握简单随机抽样、系统抽样和分层抽样等常用抽样方法;
难点:挑选合适的抽样方法实施抽样调查.
四.教学技术与学习资源应用
多媒体辅助教学
五.教学过程
教学环节
教学活动
设计意图
设
置
情
景
,
引
入
课
题
1
2
3
数学来源于生活也应用于生活,在我们生活中有形形色色的数据,比如说产品的合格率、农作物的产量、商品的销售量、某电视台的收视率等等.在我们初中的时候,我们学习了如何处理数据,比如说制作成图表、求平均值方差等,然而并没有告诉我们如何统计收集这些数据,那么接下来就来学习一下如何收集数据.
给出普查和抽样的定义.通过4个例子区分普查和抽样.
(1)全国人口调查
(2)新生入学体检
(3)2018年1-3月,全国城镇失业率
(4)某品牌灯泡的寿命
例4能不能普查?
教师提问:我们抽样的目的就是想通过抽样得到的样本情况来反映总体情况.那么如何设计科学严谨的抽样方法?单纯地追求样本量是否可以?
1936年,美国进行总统选举,竞选的是民主党的罗斯福和共和党的兰登,罗斯福是在任的总统.美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,调查统计结果兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统.
教师提问:抽样的原则是什么?
初步感受生活中的数据无处不在,回顾初中阶段对数据的处理,引出如何收集数据.
了解抽样、普查的概念,发现抽样的优点和缺点.通过身边的实例使学生明白全面调查方法在某些调查中不可行或并不必要,体会抽样调查的必要性.
学生通过了解历史上的这次调查事件,增加对数学学习的兴趣,并且感受到抽样调查中,要使样本有足够的代表性需要足够的样本量,并使每个个体被抽到的机会均等.
探
究
新
知
,
提
炼
概
念
4
5
6
7
8
课堂探究:某导师组同学对“学习数学的兴趣和现状”
做调查.(总体为以下情况之一)
若总体为①
高二H2班学习数学的兴趣和现状(学生人数为30人)抽取8个人去参加座谈会.如何抽取每个个体抽到的机会均等?
抽签法操作要点:编号→写签→搅匀→获取样本
随机数表法操作要点:编号→选取始数→读数→获取样本
引出简单随机抽样的概念:一般地,设一个总体含有N个个体,从中不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
若总体为②
复旦附中青浦分校高二年级学生学习数学的兴趣和现状(人数为120人)从120人中抽取40人发放问卷?
系统抽样(等距抽样)操作要点:编号→定间隔分段→在第一段内定起始号→加间隔的每段号码→获取样本
教师提问:如果总体变为121人,121无法被40整除,怎么办?
教师提问:高二开始数学进行分层教学,有没有更好地选取样本的方法?
分层抽样操作要点:分层→确定各层抽取的个数→在每一层中抽样→获取样本
若总体为③
青浦区高二年级学生学习数学的兴趣和现状(人数约为2000人)
④
上海市高二年级学生学习数学的兴趣和现状(人数约为5万人)
教师提问:在实际的调查问题中如何确定样本数?
给出常用的样本容量经验值.
总体抽样比例小<100030%中1000010%大>150000(15万)1%特大>10000000(1000万)0.025%
让学生在实例中感受简单随机抽样,预设学生会想到抽签法和计算器(机)产生随机数法.教师介绍随机数表法.
抠出概念的每个细节,并解释这样做的目的.
从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.
结合学校数学分层教学情况,引导学生进行分层抽样.
组织学生讨论交流,提炼对简单随机抽样、系统抽样和分层抽样等常用抽样方法的理解.
目
标
检
测
,
及
时
反
馈
例1
例2
例3
下列抽取样本的方式是属于简单随机抽样的是(
)
①从无限多个个体中抽取100个个体作样本;
②从20个零件中逐个不放回地取出3个进行质量检查;
③一儿童从玩具箱中的20个玩具中随意拿出一件来玩,玩完后放回再拿出一件,连续玩了5件;
④某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
A.①
B.②
C.③
D.以上都不对
从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,采用系统抽样方法,所选取的5枚导弹的编号可能是
A.
5,10,15,20,25
B.
3,13,23,33,43
C.
1,2,3,4,5
D.
2,4,6,16,32
一个地区共有5个乡镇,人口3万人,其中人口比例为
3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病的发病率与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
通过例1考察学生对简单随机抽样的理解.
通过例2考察学生对系统抽样的理解.
通过例3考察学生对分层抽样的理解.
结
合
实
际
,
巩
固
概
念
9
10
(备用)
情景:2019届学生至山东济宁、贵州松桃和安徽金寨开展的社会调查课题:
(1)中国部分地区红色革命历史文化传承情况现状及影响因素的研究——以安徽省金寨县和上海市为例;
(2)高中生流行语使用情况调查;
(3)贵州居民移动通讯设备(手机)的使用情况.
小组讨论:
完成三种抽样方法的比较,将如下10条填入《学习反馈单》中的表格:
从总体中逐个抽取;
适用于总体个数比较少;
将总体分成几层,分层进行抽取;
在起始部分抽样时采用随机抽样;
适用于总体由差异明显的几部分组成;
每层抽样时采用随机抽样或者系统抽样;
抽样过程中每个个体被抽到的可能性都是相等;
每次抽出的个体后不再将它放回,即不放回抽样;
将总体均分成几个部分,按预定的规则在各部分抽取;
适用于总体内部差异不是很大,若总体存在某些趋势或周期,会造成严重的误差.
通过学生至山东济宁、贵州松桃和安徽金寨开展的社会调查课题,让学生对自己以往的抽样进行优化.
组织学生讨论交流,三种常用的随机抽样方法的联系与区别.
小结
1.
三种常用的随机抽样方法:简单随机抽样,系统抽样,分层抽样.
2.
简单随机抽样,系统抽样,分层抽样各自的特点,以及适用范围.
3.
三种常用的随机抽样方法的联系与区别.
养成及时回顾、反思与梳理的习惯,提高归纳、总结的能力.
作业布置
作业:导学《18.2抽样设计》(P104-105)
课后研究性问题(3个)
根据实际情况分层布置,满足各层次学生需求.
【板书设计】
18.2抽样设计
简单随机抽样
抽签法
随机数表法
系统抽样
分层抽样
PPT
例题分析
9
§18.2
抽样技术
——学习反馈单
姓名
班级
学号
【学习目标】
1.
掌握抽样调查及相关概念,理解抽样的必要性和原则;
2.
掌握简单随机抽样、系统抽样和分层抽样等常用抽样方法;
3.
通过身边事例的研究,体会抽样调查在生活中的应用.
【学习重点及难点】
重点:掌握简单随机抽样、系统抽样和分层抽样等常用抽样方法;
难点:挑选合适的抽样方法实施抽样调查.
1.
统计学的概念
根据《兰登书屋大学字典》(The
Random
House
College
Dictionary),统计学是“对数字表示的事实或数据进行收集、分类、分析以及解释的科学”.Statistics
is
the
study
of
the
collection,
organization,
analysis,
interpretation,
and
presentation
of
data.
2.
统计分析步骤
3.
相关概念
抽样调查:
普查:
简单随机抽样特点:①
②
③
④
抽签法操作要点:
编号
→
写签
→
搅匀
→
获取样本
随机数表法操作要点:编号
→
选取始数
→
读数
→
获取样本
系统抽样(等距抽样)操作要点:
编
号→定间
隔段→在第一段
内定
起号→加间隔
的
号码→获取样本
分层抽样操作要点:
分
层→确定各层抽
取
的个
数→在每一
层
中
样→获取样本
4.
常用的样本容量经验值
总体
抽样比例
样本数
小
<1000
中
10000
大
>150000(15万)
特大
>10000000(1000万)
5.
各种抽样方法比较
类别
步骤
共同点
各自特点
联系
适用范围
简单随机抽样
抽
签
法
将总体的个体编号
连续抽签获取样本号码
----------
随
机
数(表)法
将总体的个体编号
利用计算器(机)产生随机数获取样本号码(在随机表中选择开始的数字,读数的方法获取样本号码)
系统抽样
将总体的个体编号
将整体按编号分段,确定分段间隔k=N/n
在第一段用随机抽样确定起始个体的编号L(L
<=k)
按照一定的抽样规则抽取样本,L+k,L+2k,…
分层抽样
按某种特征将总体分成若干部分
按比例确定每层抽取个体的个数
各层分别按随机抽样的方法抽取
综合每层抽样,组成样本
从总体中逐个抽取;
适用于总体个数比较少;
将总体分成几层,分层进行抽取;
在起始部分抽样时采用随机抽样;
适用于总体由差异明显的几部分组成;
每层抽样时采用随机抽样或者系统抽样;
抽样过程中每个个体被抽到的可能性都是相等;
每次抽出的个体后不再将它放回,即不放回抽样;
将总体均分成几个部分,按预定的规则在各部分抽取.
适用于总体内部差异不是很大,若总体存在某些趋势或周期,会造成严重的误差.
【达标检测】
1.
下列抽取样本的方式是属于简单随机抽样的是(
)
①从无限多个个体中抽取100个个体作样本;
②从20个零件中逐个不放回地取出3个进行质量检查;
③一儿童从玩具箱中的20个玩具中随意拿出一件来玩,玩完后放回再拿出一件,连续玩了5件;
④某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
A.①
B.②
C.③
D.以上都不对
2.
从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,采用系统抽样方法,所选取的5枚导弹的编号可能是
A.
5,10,15,20,25
B.
3,13,23,33,43
C.
1,2,3,4,5
D.
2,4,6,16,32
3.
一个地区共有5个乡镇,人口3万人,其中人口比例为
3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病的发病率与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
【课后研究性问题】
1.
来自无限总体的抽样
在某些情况下,总体数目无限或太大以致在实际应用中必须视为无限的对待.例如,一个快餐店通过选择顾客组成一个简单的随机样本并要求每个顾客完成一个简短的问卷调查的方式获得其顾客的基本资料.在这种情况下,光临该快餐店的顾客是一个正在进行中的过程,可以将其看作自一个无限总体.
如果一个来自无限总体的样本满足1.
每个个体来自同一总体
2.
各个个体的选择是独立的,则称该样本为简单随机样本(无限总体).
无限总体总是与正在进行的随时间不断运转的过程相联系.例如,生产线上生产的产品、银行发生的交易、技术支持中心接到的电话以及进入商店的顾客都可以看作来自无限总体.
在光顾快餐店的顾客抽取简单随机样本的问题中,我们发现定义中的第一个条件被满足了.第二个条件通过独立挑选顾客来满足.第二个条件的目的是防止选择的偏差.选择偏差是可能发生的,例如,连续选择一起到达的5名顾客是朋友,我们可以预见这些顾客将表现出相近的特性.通过确保某一顾客的入选并不影响其他顾客的入选,可以避免选择偏差.换而言之,顾客的选择必须是独立的.
快餐店的巨头——麦当劳恰好在这种情况下进行了一次简单随机抽样.你觉得如何抽样?
2.
抽样设计
想要研究上海市高二年级学生对“数学学习的兴趣和现状”,如何实施抽样调查?现提供2018年2月出版的2017上海教育统计年鉴上关于分区高中分年级在校生情况的2016年的数据.
除了按区域分层抽样,是否还有其他的抽样办法?
分区高中分年级在校生情况
指标
毕业生数
招生数
高中在校生数
一年级
二年级
三年级
全市合计
51889
53066
157806
53440
53014
51352
黄浦区
3149
3063
9677
3069
3342
3266
徐汇区
3635
4354
12315
4371
4180
3764
长宁区
1662
1557
4802
1567
1642
1593
静安区
3801
3649
11000
3655
3733
3612
普陀区
2678
2641
8033
2694
2682
2657
虹口区
2381
2175
6716
2205
2239
2272
杨浦区
3604
3632
10813
3650
3736
3427
闵行区
3641
4259
12143
4269
3955
3919
宝山区
3455
3431
10257
3446
3416
3395
嘉定区
2044
2210
6639
2244
2242
2153
浦东新区
11557
11789
34982
11845
11704
11433
金山区
2076
2155
6196
2221
2027
1948
松江区
2384
2601
7620
2627
2542
2451
青浦区
1935
1959
5682
1968
1878
1836
奉贤区
1971
2083
6000
2094
2029
1877
崇明区
1916
1508
4931
1515
1667
1749
3.
调查具有敏感性问题的方法
市场调查是企业获取市场信息、掌握市场动态、进行生产决策、开展市场营销的重要手段,但在实践中常因碰到敏感性问题而使调查陷于僵局状态.所谓敏感性问题“是指在一定时期或一定调查目的的基础上为获取信息所提出涉及被调查者秘密、禁忌而不愿或不便于公开表态或陈述的问题”.例如私人财产、不轨行为、考试中的作弊现象,社会上的赌博吸毒、偷税漏税等现象.
随机应答技术(randomized
response
technique,
rrt)它是60年代以来兴起的一种对敏感问题调查的技术.当调查的主要目的在于估计某种行为(使用违禁药物、考试作弊等)的概率时,随机化回答模型是比较理想的方法.所谓随机化回答模型就是采用一种既能保护被调查者个人秘密,又能使其讲实话,并在敏感性问题调查中获得某类人数所占比例或某敏感指标均值的估计量的方法.常用的为Warner模型和Simmons模型(具体详见书本P103).