(共27张PPT)
9.1.1 简单随机抽样(1)
主题一
人口普查需要花费巨大的财力、物力,因而不宜经常进行,抽样调查具有不可替代的作用。根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.
统计的相关概念
名称 定义
总体 所要 的全体叫作总体
样本 从总体中抽取出的 组成的集合叫作总体的一个样本
个体 总体中的每一个考察对象叫作个体
样本容量 样本中个体的 叫作样本容量
考察对象
若干个个体
数目
[讨论] 样本与样本容量有什么区别
解:样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.
一、选择题
1.医生要检验人血液中血脂的含量,采取的调查方法应该是( )
A.普查 B.抽样调查 C.既不能普查也不能抽样调查D.普查与抽样调查都可以
2.若要调查某城市家庭的收入情况,在该问题中,总体是( )
A.某城市 B.某城市的所有家庭的收入
C.某城市的所有人口 D.某城市的工薪阶层
3.抽样调查在抽取调查对象时( )
A.按一定的方法抽取 B.随便抽取
C.全部抽取 D.根据个人的爱好抽取
B
B
A
小试牛刀
如何设计抽样方法,使抽取的样本能真正代表总体?
如怎么判断一锅汤的味道如何?
高质量的数据来自“搅拌均匀”的总体,使每个个体有同样的机会被抽中.
抽样调查的目的是为了了解总体的情况.例如自然希望抽取的样本数据能很好地反映总体的情况,即样本含有和总体基本相同的信息.
抽取出的样本要客观、公正、具有代表性。
探究 假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同,你能通过抽样调查的方法估计袋中红球所占的比例吗?
这里袋中所有小球是调查的总体,每一个小球是个体,小球的颜色是所关心的变量.
我们可以从袋中随机摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复n次。
根据初中的概率知识可知,随着摸球次数的增加,摸到红球的频率会逐渐稳定于摸到红球的概率,即口袋中红球所占的比例。
因此,可以通过放回摸球,用频率估计出红球的比例。
问题:放回摸球有什么不足吗?你还有其他的方法吗?
在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是每次摸到同一个小球,而被重复的小球只能提供同一个小球颜色信息。这样的抽样结果误差较大。
我们可以采用不放回摸球,即从袋中随机摸出一个球后不再放回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免同一个小球被重复摸中。
特别地,当样本量n=1000时,不放回摸球已经把袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸球一般还不能对袋中红球的比例做出准确的判断。
简单随机抽样定义:
一般地,设一个总体含有N (N为正整数)个个体,从中逐个抽取n (1≤n如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率是相等的,我们把这样的抽样方法叫做不放回简单随机抽样.
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样. 通过简单随机抽样获得的样本称为简单随机样本.
与放回简单随机抽样比较,不放回简单随机抽样效率更高因此实践中人们更多采用不放回简单随机抽样. 除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.
思考:一般地,一个总体的个数为N,从中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?
N
n
(1)被抽取样本的总体的个体数有限;
(2)从总体中逐个进行抽取;
(3)一种不放回抽样;
(4)每个个体能被选入样本的可能性是相同的。
简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。
简单随机抽样有哪些主要特点?
问题1 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度.已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本
首先我们要明确总体,个体和变量
问题1 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本?
树人中学全部高一年级的学生构成调查的总体,
每一位学生是个体,
学生的身高是调查的变量.
我们可以对高一年级进行简单随机抽样,用抽出的样本的平均身高估计高一年级学生的平均身高.实现简单随机抽样的方法有很多,我们如何设计呢?如何实现对总体“搅拌均匀”呢?
把总体中的N个个体编号,并把号码写在形状、大小相同的号签上,将号签放在同一个容器里,搅拌均匀后,每次从中抽出1个号签,连续抽取n次,得到一个容量为n的样本。
简单随机抽样 ——1. 抽签法
先给712名学生编号,例如1~712进行编号;
然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌;
最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的学生进入样本,直到抽足样本所需要的人数。
问题:为什么要给学生编号?编号用学号可以吗?
编号是为了将每名学生能明确区分开.因此,用学号也可以,学号与学生之间也是一一对应的。
还可以用字母+数字进行区分。例如:a1、a2等等。
如果没有学生没有重名,还可以用姓名进行区分。
接下来用抽签法进行简单随机抽样。
简单随机抽样 ——1. 抽签法
问题:抽签法的步骤是什么?
第一步:将总体中的所有个体编号;(编号)
第二步:并把号码写在形状、大小相同的号签上;将号签
放在一个不透明容器中,并搅拌均匀.(制签)
第三步:每次从中不放回抽取一个号签,直到抽取到足够
的样本量。(抽取)
问题:抽签法的优缺点是什么?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
因此,抽签法一般适用于总体中个体数不多的情形。
(1) 用随机试验产生随机数;
(2) 用信息技术生成随机数
① 用计算器生成随机数;
② 用电子表格软件生成随机数;
③ 用R统计软件生成随机数.
随机数的产生:
随着信息技术的发展,人们越来越多地利用计算器、数学软件、统计软件等工具来生成随机数.用信息技术工具产生随机数最大的优点是方便、快捷.
简单随机抽样—— 2.随机数法
问题1 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高. 应该怎么抽取样本?
(1)先给712名学生编号,例如按1~712进行编号;
(4) 如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的人数.
(2)用随机数工具产生1~712范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本;
(3) 重复上述过程,直到抽足样本所需要的人数;
简单随机抽样—— 2.随机数法
读数获取样本号码
①在随机数表中任选一个数作为起始数;(选起始数)
②从选定的数开始依次向右(或向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满样本容量的样本.(抽取样本)
随机数法的优缺点是什么?
优点:随机数表数字较多,因此当总体容量较多时,抽取较为便利;
缺点:起始位置及抽取方向是人为确定的,不同的人选取出的样本会有差距。
因此,随机数法一般适用于总体中个体数较多的情形。
227, 267, 107, 329
问题:比抽签法与随机数法,如何选取合适的方法?
当总体容量较小时,选择抽签法;
当总体容量较大时,选择随机数法。
问题:用简单随机抽样方法抽取样本,样本量是否越大越好?
在重复试验中,试验次数越多,频率越接近概率的可能性越大。与此相似,用简单随机抽样的方法抽取样本,样本量越大,结果越准确。一般来说,样本量大的要比样本量小的好,增加样本量可以较好地提高估计的效果。
但在实际情况中,样本量大会导致人力、费用、时间等成本的增加。
因此,抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好。
课堂练习
教材P177 练习1~4
1.在以下调查中,总体、个体各是什么?哪些适合用全面调查?哪些适合用抽样调查?
(1) 调查一个班级学生每周的体育锻炼时间;
(2) 调查一个地区结核病的发病率;
(3) 调查一批炮弹的杀伤半径;
(4) 调查一个水库所有鱼中草鱼所占的比例.
总体:全班学生,个体:这个班的每一位学生,
适合用全面调查.
总体:整个地区的居民,个体:这个地区的每一位居民,
适合用抽样调查.
总体:这批炮弹,个体:这批炮弹的每一个炮弹,
适合用抽样调查.
总体:这个水库里所有的鱼,个体:这个水库里的每一条鱼,
适合用抽样调查.
2.如图,由均匀材质制成的一个正20面体(每个面都是正三角形),将20个平面平分成10组,第1组标上0,第2组标上1,…,第10组标上9.
是;
是.
投掷正20面体,若把朝上一面的数字作为投掷结果,则出现0,1,2,…,9是等可能的吗?
(2) 三个正20面体分别涂上红、黄、蓝三种颜色,分别代表百位、十位、个位,同时投掷可以产生一个三位数(百位为0的也看作三位数),它是000~999范围内的随机数吗?
课堂练习
教材P177 练习1~4
教材P177 练习1~4
3.实验室的笼子里共有100只小白鼠,现要从中抽取10只作试验用.下列两种情况是否属于简单随机抽样?请说明理由.
(1) 每次不经任何挑选地抓一只,抓满10只为止;
(2) 将笼中的100只小白鼠按1~100编号,任意选出编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠.
是,
每次抽取时,没进入样本的各个个体被抽到的概率相同,
不放回简单随机抽样;
是,
该抽样方法类等同于简单随机抽样中的抽签法.
课堂练习
课堂小结
1.简单随机抽样常用的方法:
(1)抽签法; (2)随机数表法
2.抽签法的步骤
3.随机数表法的步骤
4.简单随机抽样适用范围
1.编号
2.制签
3.搅拌
4.抽签
5.取样
①将总体的个体编号;
②在产生的随机数选择数字;
③读数获取样本号码