9.1.1
简单随机抽样
简单随机抽样.其主要内容是介绍简单随机抽样的概念以及如何实施简单随机抽样.数理统计学包括两类问题,一类是如何从总体中抽取样本,另一类是如何根据对样本的整理、计算和分析,对总体的情况作出一种推断.可见,抽样方法是数理统计学中的重要内容.简单随机抽样作为一种简单的抽样方法,又在其中处于一种非常重要的地位.因此它对于学习后面的其它较复杂的抽样方法奠定了基础,同时它强化对概率性质的理解,加深了对概率公式的运用.因此它起到了承上启下的作用,在教材中占有重要地位.
课程目标
1.了解总体、样本、样本容量的概念,了解数据的随机性.
2.通过实例,了解简单随机抽样的含义及其解决问题的过程.
3.掌握两种简单随机抽样.
4.会计算样本均值,了解样本与总体的关系.
数学学科素养
1.数学抽象:随机抽样的相关概念;
2.数据分析:利用抽签法,随机数法解决实际问题;
3.数学运算:计算样本均值.
重点:简单随机抽样的定义,抽样方法,各种方法适用情况,及对比.
难点:简单随机抽样中的等可能性及简单随机抽样的特点,随机数表法应用.
教学方法:以学生为主体,小组为单位,采用诱思探究式教学,精讲多练。
教学工具:多媒体。
情景导入
新闻链接:?教育部:截至本月全国毕业生就业率72.2%。?现实生活中的问题如何进行研究?要求:让学生自由发言,教师不做判断。而是引导学生进一步观察.研探.
二、预习课本,引入新课
阅读课本173-180页,思考并完成以下问题
1、统计有哪些概念?
2、什么是简单随机抽样?简单随机抽样有哪几种方法?
3、抽签法和随机数法怎样定义?
4、什么总体均值、样本均值?
要求:学生独立完成,以小组为单位,组内可商量,最终选出代表回答问题。
三、新知探究
1.统计的相关概念
(1)普查
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.
(4)样本、样本量
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.
2.简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n3.简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数.
4.总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称获取数据的途径
本节《普通高中课程标准数学教科书-必修二(人教A版)第九章《9.1.3
获取数据的途径》,本节的主要内容在本章的结构上,通过大背景的“串联”,从大背景中不断提出新问题,从而通过问题链进行探究学习,让学生理解获取数据的重要性,及常见的获取数据的基本途径。从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
课程目标
学科素养
A.了解常用的获取数据的基本方法。
B.进一步体会统计学的基本思想方法。
1.数学建模:合理选择获取数据的方法;
2.逻辑推理:理解数据获取方法选择的必要性;
3.数学运算:能发现获取数据中的异常数据
1.教学重点:掌握常用的获取数据的基本方法;
2.教学难点:
获取数据的基本方法的准确选择;
多媒体
教学过程
教学设计意图
核心素养目标
一、温故知新
1、简单随机抽样的概念:
设一个总体含有有限个个体,并记其个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.
2、简单随机抽样的特点:
①总体个数有限;②逐个进行抽取;③机会均等抽样.
3、简单随机抽样的常用方法:
①抽签法;
②随机数表法.
抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,
设一个总体含有有限个个体,并记其个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.
4、分层抽样的定义。
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified
random
sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
每一层抽取的样本数=×总样本量
分层抽样的步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
分层随机抽样如何估计总体平均数
在比例分配的分层随机中抽样中
1.分层抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。
2.相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。
3.分层随机抽样的结果并不是每一次都优于简单随机抽样。
方法
类别
共同
特点抽样特征相互联系适应范围
简单随机抽样;分层抽样;将总体分成几层,按比例分层抽取
总体中的个体差异较小;总体由差异明显的几部分组成
从总体中逐个抽取;用简单随机抽样对各层抽样;抽样过程中每个个体被抽到的可能性相等
二、情境与问题
统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,是统计学研究的重要内容.
在实践中,获取数据的途径多种多样,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的.下面介绍获取数据的些基本途径.
1.通过调查获取数据
对于有限总体问题,如人口总数、城乡就业状况、农村贫困人口脱贫状况、生态环境改善状况、青少年受教育状况、高中生近视的比例、产品合格率、高中生日平均上网时间等问题,我们一般通过抽样调查或普查的方法获取数据.
针对不同问题的特点,为了有效收集所需数据,专家发明了各种不同的抽样方法.除了我们已经学过的简单随机抽样和分层随机抽样,还有系统抽样、整群抽样、不等慨率抽样、自适应抽样、两阶段抽样等很多其他的方法,在实际应用中,关键在于是否能充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.在前面的学习中,我们对此有了一定的认识.
2.通过试验获取数据
试验是获取样本观测数据的另一种重要途径.
例如,要判断研制的新药是否有效、培育的小麦新品种是否具有更高的产量等情况,没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.又如特种钢、轮胎的配方和产品质量等,也需要通过试验获取样本观测数据.
通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.在统计学中,这种安排试验的学问叫做“试验设计”,感兴趣的同学可以查阅试验设计教科书.
在现实生活中,我们感兴趣的很多自然现象都不能被人类所控制,如地震、降水、大气污染、宇宙射线等,自然现象会随着时间的变化而变化,不能用我们已经学过的有限总休来刻画,也就不能用抽样的方法获取观测数据;另一方面,由于自然现象不能被人为控制,也不能通过试验获取观测数据.
研究这类现象,只能通过长久的持续观察获取数据.
3.通过观察获取数据
对于各个不同的行业,往往需要专业测量设备获取观测数据.随着科技水平的提高,专业测量设备的自动化程度越来越高,通过观测获取和存储数据的成本越来越低,这成为大数据产生的根源.
一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.
我们感兴趣的问题,可能有众多专家研究过,他们在研究中所收集的样本观测数据可能存储于学术论文、专著、新闻稿、公报或互联网上,这些数据是宝贵的财富,我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据叫做二手数据.国家统计局是我国最主要的统计数据收集和发布的部门,调查统计的数据涉及经济、社会、民生的方方面面.国家统计局的统计数据通过多种形式进行公布,例如定期发布新闻稿、举办新闻发布会、发布统计公报、出版各类统计资料等.统计公报有年度统计公报、经济普查公报、人口普查公报、农业普查公报等;统计资料出版物有《中国统计摘要》、以《中国统计年鉴》为代表的统计年鉴系列等.
4.通过查询获得数据
2014年全国交通事故情况
类型发生数/起死亡人数/人受伤人数/人直接财产
损失/万元机动车18032154944194887103386.0非机动车141752311157372719.4行人乘车人2242124711671403.5其他74219134.1总计19681258523211882107543
例如,我们想了解2014年全国的交通事故情况,通过查找《中国统计年鉴》可以得到如下表所示的数据.如果我们关心机动车交通事故逐年变化的情况,那么需要通过查找每年的数据表,并把它们合并整理.
随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.例如,可以从国家统计局的官方网站查询得到国家统计局公布的各种统计数据.在网络上,也有专门提供数据服务的公司,它们提供政府部门允许公开的各类数据.
当然,互联网的最大优势是,人们可以利用强大的搜索功能,在整个网络上查找所需要的数据.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础.
通过试验获取数据没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真
由生活中的问题出发,提出问题,让学生感受到数据获取的多做途径。发展学生数学抽象、直观想象和逻辑推理的核心素养。
通过具体问题,让学生感受合理选择获取数据的途径和方法,发展学生数学抽象、逻辑推理的核心素养。
通过实例分析,让学生掌握获取数据的常见方法和基本步骤,并熟悉的应用能力,提升推理论证能力,提高学生的数学抽象、数学建模及逻辑推理的核心素养。
三、达标检测
1.判断正误
(1)要了解一批节能灯的使用寿命,可以采用普查的方式.(
)
(2)农科院获取小麦新品种的产量可以通过查询获取数据.(
)
(3)普查获取的资料更加全面、系统,抽样调查更方便、快捷.(
)
【答案】×;×;√
2.下列哪些数据一般是通过试验获取的(
)
A.1988年济南市的降雨量
B.2019年新生儿人口数量
C.某学校高一年级同学的数学测试成绩
D.某种特效中成药的配方
【答案】D
【解析】易知特效中成药的配方是通过实验获取数据,故选D
3.“中国天眼”为500米口径球面射电望远镜(Five
hundred
meters
Aperture
Spherical
Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是(
)
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
【答案】C
【解析】易知“中国天眼”是通过观察获取数据,故选C
4.小明从网上查询得到某贫困地区10户居民家庭年收入(单位:万元)如下所示:
根据以上数据,我们认为有一个数据是不准确的,需要剔除,这个数据是
.
编号12345678910年收入1.21.31.82.04.61.70.92.11.01.6
【答案】4.6
【解析】通观察分析获取的数据,编号为5,对应收入为4.6万为异常数据,应剔除。
5.为了了解我国电视机的销售情况,小张在某网站上下载了下图:
(1)小张获取数据的途径是什么?
(2)由图可知,电视机的销售总量在2012年达到最大值,你认为电视机销售总量出现下滑的主要原因是什么?
【解析】(1)小张获取数据的途径是通过查询获得数据.
(2)结合我国的经济发展水平可知,从2012年开始,
电视机销售总量出现下滑的主要原因是市场的饱和.
6.为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?
【解析】(1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.
(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.
通过练习巩固本节所学知识,通过学生解决问题,发展学生的数学抽象、逻辑推理、数学运算、数学建模的核心素养。
四、小结
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.
五、课时练
通过总结,让学生进一步巩固本节所学内容,提高概括能力。
本节的主要内容在本章的结构上,通过大背景的“串联”,从大背景中不断提出新问题,从而通过问题链进行探究学习,让学生理解获取数据的重要性,及常见的获取数据的基本途径。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。教学中要注重学生的主体地位,调动学生积极性,使数学教学成为数学活动的教学。分层随机抽样
本节是在学习了简单随机抽样的基础上,结合随机抽样特点和适用范围,针对总体的复杂性,为提高样本的代表性,有学习掌握分层抽样这种随机抽样的必要性;为下节“用样本估计总体”的学习打下了基础.因此本节内容具有承前启后的作用,地位重要.
课程目标
1.理解分层抽样的基本思想和适用情形.
2.掌握分层抽样的实施步骤.
3.了解两种抽样方法的区别和联系.
数学学科素养
1.数学抽象:分层抽样的相关概念;
2.数据分析:分层抽样的应用;
3.数学运算:分层抽样中各层样本容量的计算.
重点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本.
难点:选择合适的抽样方法解决现实生活中的抽样问题.
教学方法:以学生为主体,小组为单位,采用诱思探究式教学,精讲多练。
教学工具:多媒体。
情景导入
由上一节知道,简单随机抽样抽取样本会出现极端现象,那么有没有一种抽取方式可以规避这种情况?
要求:让学生自由发言,教师不做判断。而是引导学生进一步观察.研探.
二、预习课本,引入新课
阅读课本181-184页,思考并完成以下问题
1、什么情况下适用分层抽样?分层抽样的步骤是?
2、简单随机抽样和分层抽样有什么区别与联系?
要求:学生独立完成,以小组为单位,组内可商量,最终选出代表回答问题。
三、新知探究
1.定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
2.适用范围
当总体是由差异明显的几个部分组成时,往往采用分层抽样.
3.分层抽样的步骤
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比k=.
(3)根据抽样比k计算出各层中应抽取的个体数:·Ni
(其中Ni为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
探究:
计算各层所抽取个体的个数时,若Ni·的值不是整数怎么办,分层抽样公平吗?
答案
为获取各层的入样数目,需先正确计算出抽样比,若Ni·的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多余的个体.分层抽样中,每个个体被抽到的可能性是相等的,与层数、分层无关.
4.
两种抽样方法的区别和联系
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中各个个体被抽到的机会相等,且都是不放回抽取
从总体中逐个抽取
最基本的抽样方法
总体容量较少
分层抽样
抽样过程中各个个体被抽到的机会相等,且都是不放回抽取
将总体分成几部分,每一部分按比例抽取
每层抽样时采用简单随机抽样
总体由差异明显的若干部分组成
四、典例分析、举一反三
题型一
分层抽样的概念
例1为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.无法确定
【答案】C
【解析】由于该地区的中小学生人数比较多,不能采用简单随机抽样,所以排除A项;由于该地区小学、初中、高中三个学段学生的视力情况有较大差异,可采取按照学段进行分层抽样,而男女生视力情况差异不大,不能按照性别进行分层抽样,所以排除B,D项.
解题技巧(分层抽样的依据)
(1)适用于总体由差异明显的几部分组成的情况.
(2)样本能更充分地反映总体的情况.
(3)等可能抽样,每个个体被抽到的可能性都相等.
跟踪训练一
1.下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本
C.从1
000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
【答案】B.
【解析】A项中总体所含个体无差异且个数较少,适合用简单随机抽样;C项和D项中总体所含个体无差异,不适合用分层抽样;B项中总体所含个体差异明显,适合用分层抽样.
题型二
分层抽样中各层样本容量的计算
例2 某企业三月中旬生产A,B,C三种产品共3
000件,根据分层抽样的结果,该企业统计员制作了如下的统计表.
产品类别
A
B
C
产品数量/件
x
1
300
y
样本容量
m
130
n
由于不小心,表格中A,C产品的有关数据丢失,统计员记得A产品的样本容量比C产品的样本容量多10.根据以上信息,可得C产品的数量是________件.
【答案】800.
【解析】因为C产品的数量为y,则A产品的数量为x=3
000-1
300-y=1
700-y,又C产品的样本容量为n,则A产品的样本容量为m=10+n,由分层抽样的定义可知===,解得y=800.
解题技巧
(分层抽样中每层抽取的个体数的确定方法)
(1)已知总体容量、样本容量及各层的个体数时,首先确定抽样比,其中N为总体容量,n为样本容量;然后确定每层抽取的个体的个数ni=Ni×,其中Ni为第i(i=1,2,…,k)层的个体数,ni为第i层应抽取的个体数.
(2)已知各层个体数之比为m1∶m2∶…∶mk,样本容量为n时,每层抽取的个体数为ni=n×(i=1,2,…,k).
跟踪训练二
1.某中学有高中生3
500人,初中生1
500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100
B.150
C.200
D.250
【答案】A.
【解析】 n=(3
500+1
500)×703
500=100.故选A项.
题型三
分层抽样的应用
例3
一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解与身体状况有关的某项指标,要从所有职工中抽取100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?
【答案】见解析
【解析】 用分层抽样来抽取样本,步骤是:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工,35岁至49岁的职工,50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,则在不到35岁的职工中抽125×=25(人);在35岁至49岁的职工中抽280×=56(人);在50岁以上的职工中抽95×=19(人).
(3)在各层分别按抽签法或随机数法抽取样本.
(4)综合每层抽样,组成样本.
解题技巧(分层抽样注意事项)
(1)分层抽样实质是利用已知信息尽量使样本结构与总体结构相似.在实际操作时,并不排斥与其他抽样方法联合使用.
(2)在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练三
1.在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
【答案】见解析.
【解析】先将产品按等级分成三层;第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为=,所以应在第一层中抽取产品20×=6(个),在第二层中抽取产品30×=9(个),在第三层中抽取产品50×=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.
五、课堂小结
让学生总结本节课所学主要知识及解题技巧
六、板书设计
(
9.
1.
2
分层随机抽样
1.
定义
例
1
例2
例
3
2.适用范围
3.步骤
4.
两种抽样的区别与联系
)
七、作业
课本184页练习,188页习题9.1的5、7题.
本班学生对本章节的基本知识、基本技能掌握情况良好,具体表现在:概念比较清晰,基础扎实,掌握情况总体不错。大部分学生掌握了一定的解题技巧,具有一定的分析问题、解决问题的能力。但也存在着以下缺失:书写不认真,数字抄错,提取有效信息的能力有待加强。