(共31张PPT)
9.1.1 简单随机抽样
第九章 统计
1.了解调查的方法:全面普查和抽样调查.
2.理解简单随机抽样中的抽签法、随机数法.
学习目标
例如,为了准确掌握全国的人口数据,我们国家每十年要进行一次人口普查,上一次人口普查是2010年. 像人口普查这样,对每一个调查调查对象都进行调查的方法,称为全面调查,又称普查.
在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体. 为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
统计学:
是通过收集数据和分析数据来认识未知现象的一门科学.
统计的研究对象是数据,核心是通过数据分析研究和解决问题.
但是由于人口普查需要花费巨大的财力、物力,因而不宜经常进行. 为了及时掌握全国人口变动状况,我国每年还会进行一次人口变动情况的调查,就是根据抽取的居民情况来推断总体的人口变动情况.
像这样,根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和判断的方法,称为抽样调查(或称抽查).
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量. 调查样本获得的变量值称为样本的观测数据,简称样本数据.
问题1 抽查的目的是什么?
例如,抽样调查一批待售袋装牛奶的细菌数量是否超标,其目的是要了解整批牛奶的细菌含量是否超标,而不只是局限在抽查到的那几袋牛奶的情况.
因此,通过抽样调查了解总体的情况,自然希望抽取的样本数据能很好的反映总体的情况,即样本含有和总体基本相同的信息.
抽取出的样本要客观、公正、具有代表性.
问题2 抽取的样本具有什么特点?
抽查的目的是为了了解总体的情况.
问:试将普查和抽样调查进行比较,说说它们的优点、缺点和适应范围.
方法 特点 普查 抽样调查
优点
缺点
适应范围
调查结果全面、系统
花费少,效率高
工作量大,有时费时费力
1.调查对象少
2.调查对象多,但调查结果要求必须全面、系统、准确
调查结果不如普查全面、系统
1.调查对象太多,且不必要普查
2.调查方式有破坏性
解:(1) 总体是这个班级的全体学生;个体是这个班级的每一个学生;适合用全面调查.
(2) 总体是这个地区全体居民;个体是这个地区每一位居民;适合用抽样调查.
(3) 总体是这批所有炮弹的杀伤半径;个体是这批炮弹中每一发炮弹的杀伤半径;适合用抽样调查.
(4) 总体是这个水库里的所有鱼;个体是这个水库里的每一条鱼;适合用抽样调查.
1. 在以下调查中,总体、个体各是什么 哪些适合用全面调查 哪些适合用抽样调查
(1) 调查一个班级学生每周的体育锻炼时间;
(2) 调查一个地区结核病的发病率;
(3) 调查一批炮弹的杀伤半径;
(4) 调查一个水库所有鱼中草鱼所占的比例.
练习
- - - - - - - - - -
教材177页
抽样调查的结果一定可行吗?
案例:一工作人员对将要来临的选举做了一次民意调查。为了了解公众意向,调查者通过电话薄和车辆登记薄上的名单给一大批人发了调查表,你认为该调查获得的样本有代表性吗?
如何抽样才能使得样本更好,下面我们研究两种基本的抽样方法——简单随机抽样和分层抽样。首先学习的是简单随机抽样。
我们可以从袋中随机摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复n次. 根据初中的概率知识可知,随着摸球次数的增加,摸到红球的频率会逐渐稳定于摸到红球的概率,即口袋中红球所占的比例.
问题3 假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同,你能通过抽样调查的方法估计袋中红球所占的比例吗?
因此,可以通过放回摸球,用频率估计出红球的比例.
本题的总体和个体是什么?关心的变量是什么?调查的目的是什么?
结合初中已有经验,可以通过哪些方式获取样本?
问题4 放回摸球有什么不足吗?你还有其他的方法吗?
在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是每次摸到同一个小球,而被重复的小球只能提供同一个小球颜色信息. 这样的抽样结果误差较大.
我们可以采用不放回摸球,即从袋中随机摸出一个球后不再放回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免同一个小球被重复摸中.
特别地,当样本量n=1000时,不放回摸球已经把袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸球一般还不能对袋中红球的比例做出准确的判断.
以上两种抽样方法均称为简单随机抽样.
简单随机抽样定义:
一般地,设一个总体含有N (N为正整数)个个体,从中逐个抽取n (1≤n如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率是相等的,我们把这样的抽样方法叫做不放回简单随机抽样.
我们把放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样. 通过简单随机抽样获得的样本称为简单随机样本.
注意:从总体中,逐个不放回地随机抽取n个个体作为样本和一次性批量随机抽取n个个体作为样本是等价的.
问题6 简单随机抽样有哪些特点?
3. 每个个体被抽到的机会都相等,抽样具有公平性.
2. 样本的抽取是逐个进行的,每次只抽取一个个体;
1. 总体的个体数有限,样本数n小于等于样本总体的个数N ;
问题5 放回简单随机抽样和不放回简单随机抽样哪个效率高?
不放回简单随机抽样的效率更高.
因此实践中人们更多采用不放回简单随机抽样. 除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.
解:简单随机抽样要求:被抽取的样本的总体个数确定且较少,抽取样本时要求逐个抽取,每个个体被抽取的可能性一样.
(1) 不是,因为是一次性抽取不是逐个抽取.
(2) 不是,被抽取的样本的总体个数不确定.
(3) 不是,班主任的指定不能保证班级里的每一个学生被抽取的可能性一样.
(4) 是,它属于简单随机抽样.
例1 下面的抽样方法是简单随机抽样吗 为什么
(1) 某工厂的质检员从一袋30个螺母中一次性取出5个进行质量检测;
(2) 某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品;
(3) 某班有4个小组,每组共有12个同学,班主任指定每组坐在第一张桌子边的8位同学为班干部;
(4) 中国福利彩票30选7,得到7个彩票中奖号码.
问题7 在简单随机抽样中,如何才能实现各个个体被抽中的概率都相等呢?
案例:一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本?
在这个问题中,我们知道树人中学全部高一年级学生的身高情况是总体,树人中学每一位学生的身高情况是个体,学生的身高调查的变量.
所以要调查高一年级学生的平均身高情况,我们可以用简单随机抽样,就是从712名学生中不放回的逐个抽取样本,用抽出的样本的平均身高估计高一年级学生的平均身高.
如何设计具体的抽样实施方案?
抽签法:
(1) 给712名学生编号,例如1~712进行编号;
(2) 把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌;
(3) 从盒中不放回地逐个抽取号签,使与号签上的编号对应的学生进入样本,直到抽足样本所需要的人数.
注意:(1) 给学生编号时,可用用学号作为编号,因为学号与学生之间也是一一对应的. 还可以用字母+数字进行区分,例如:a1、a2等等. 如果学生没有重名,还可以用姓名进行区分.
2. 简单随机抽样(一) —— 抽签法
(2) 抽签法简单易行,但当总体较大时,操作起来比较麻烦. 因此,抽签法一般适用于总体中个体数不多的情形.
抽签法的步骤:
抽签法的优缺点:
第一步:编号——将总体中的所有个体编号;
第四步:抽签——每次从中不放回抽取一个号签,直到抽取到足够的样本量.
第二步:制签——把号码写在形状、大小相同的号签上;
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
第三步:搅匀——将号签放在一个不透明容器中,并搅拌均匀;
练习 高一(1)班有50名同学,现从中抽出8名同学去参加一个座谈会,每位同学的机会均等. 请你设计一个抽样方法,并说明其合理性.
解:可以采用抽签法进行选取.
首先,我们可以把50名同学的学号写在小纸条上,揉成小球;
然后,放到一个不透明的袋子中,充分搅拌;
最后从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.
因为这样的抽取方法使得大家的机会是均等的,因此抽取结果也非常合理.
练习 高一(1)班有50名同学,现从中抽出8名同学去参加一个座谈会,每位同学的机会均等. 请你设计一个抽样方法,并说明其合理性.
解:可以采用抽签法进行选取.
首先,我们可以把50名同学的学号写在小纸条上,揉成小球;
然后,放到一个不透明的袋子中,充分搅拌;
最后从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.
因为这样的抽取方法使得大家的机会是均等的,因此抽取结果也非常合理.
问题8 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高. 应该怎么抽取样本?
3. 简单随机抽样(二) —— 随机数法
接下来,我们用随机数法进行抽查.
阅读教材P75-P176
(1) 用随机试验产生随机数;
(2) 用信息技术生成随机数
① 用计算器生成随机数;
② 用电子表格软件生成随机数;
③ 用R统计软件生成随机数.
随机数的产生:
探究新知
(2) 用信息技术生成随机数
①用计算器生成随机数
random随机的
integer
整数
该方法生成的随机数可能重复
探究新知
(2) 用信息技术生成随机数
②用电子表格软件生成随机数
该方法生成的随机数可能重复
探究新知
(2) 用信息技术生成随机数
样本
不放回
该方法生成的随机数不重复
有放回
该方法生成的随机数可能重复
③用R统计软件生成随机数
1. 随机数法的步骤:
第一步:编号——将总体中的所有个体编号(每个号码位数一致);
第三步:抽取样本——从选定的数开始依次向右(或向左、向上、向下)读,将编号范围内的数取出,编号范围外和重复的数去掉,直到取满样本容量的样本.
第二步:选起始数——在随机数表中任选一个数作为起始数;
2. 用随机数法抽样时需注意:
(1)不重复抽样;
(2)编号要求数位相同;
(3)第一个数字的抽取是随机的;
(4)读数的方向是任意的,且是事先规定好的.
3. 随机数法的优缺点:
缺点:起始位置及抽取方向是人为确定的,不同的人选取出的样本会有差距.
优点:随机数表数字较多,因此当总体容量较多时,抽取较为便利;
因此,随机数法一般适用于总体中个体数较多的情形.
归纳总结:
思考1 对比抽签法与随机数法,如何选取合适的方法?
当总体容量较小时,选择抽签法;
当总体容量较大时,选择随机数法.
思考2 用简单随机抽样方法抽取样本,样本量是否越大越好?
在重复试验中,试验次数越多,频率越接近概率的可能性越大. 与此相似,用简单随机抽样的方法抽取样本,样本量越大,结果越准确. 一般来说,样本量大的要比样本量小的好,增加样本量可以较好地提高估计的效果.
但在实际情况中,样本量会导致人力、费用、时间等成本的增加.
因此,抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好.
227, 267, 107, 329
D
变式 某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002, ,599 ,600从中抽取60个样本,如下提供随机数表的第4行到第6 :
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号是( )
A. 522 B. 324 C. 535 D. 578
2. 如图,由均匀材质制成的一个正20面体(每个面都是正三角形),将20个面平分成10组,第1组标上0,第2组标上1, ,第10组标上9.
(1) 投掷正20面体,若把朝上一面的数字作为投掷结果,则出现0, 1, 2, , 9是等可能的吗
(2) 三个正20面体分别涂上红、黄、蓝三种颜色,分别代表百位、十位、个位,同时投掷可以产生一个三位数(百位为0的也看作三位数),它是000~999范围内的随机数吗
练习
- - - - - - - - - -
教材177页
解:(1) 是等可能的;
(2) 是.
3. 实验室的笼子里共有100只小白鼠,现要从中抽取10只作试验用. 下列两种情况是否属于简单随机抽样 请说明理由.
(1) 每次不经任何挑选地抓一只,抓满10只为止;
(2) 将笼中的100只小白鼠按1~100编号,任意选出编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠.
练习
- - - - - - - - - -
教材177页
解:两种情况都属于简单随机抽样,因为每次抽取时总体内的各个个体被抽到的概率都相等.
解:记[0,1)内的随机数为r.
设b为712r+1的整数部分,则b就是1~712范围内的整数随机数.
设a为100r+1的整数部分,则a就是1~100范围内的整数随机数.
解:随机抽样的优点是可以避免人为因素的干扰,使得样本更加客观.
缺点是不能充分利用已有的有关总体的信息.
练习
- - - - - - - - - -
教材177页
4. 如果计算器只能生成[0,1)内的随机数,你有办法把它转化为1~100范围内的整数随机数吗?转化为1~712范围内的整数随机数呢
5. 在抽样调查中,请你说说通过“随机”选择样本的优、缺点.
课堂小结
一、知识内容:
二、核心素养:
1.简单随机抽样的概念
2.简单随机抽样的特点
3.简单随机抽样的常用方法
数据分析、
数学抽象、逻辑推理
简单随机抽样的优缺点:
在实际应用中,简单随机抽样有一定局限性.
例如,当总体很大时,编号等准备工作耗费时间、人工,甚至难以做到;抽中个体较为分散,要找到样本中的个体进行调查会遇到很多困难;简单随机抽样没有其他辅助信息,估计效率不是很高.
简单随机抽样方法简单、直观,用样本平均数估计总体平均数也比较方便. 简单随机抽样是一种基本抽样方法,是其他抽样方法的基础.
因此,在规模较大的调查中,直接采用简单随机抽样的并不多,一般是把简单随机抽样和其他抽样方法组合使用.
优点:
缺点: