(共61张PPT)
第二章 统 计
2.1.1 简单随机抽样
2.1 随机抽样
问题提出
1.我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.
2.要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?
将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.
知识探究(一):简单随机抽样的基本思想
思考1:从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?
思考2:从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?
思考3:一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?
思考4:食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,打算从中抽取一定数量的饼干作为检验的样本.其抽样方法是,将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回抽取若干包,这种抽样方法就是简单随机抽样.那么简单随机抽样的含义如何?
一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.
简单随机抽样的含义:
思考5:根据你的理解,简单随机抽样有哪些主要特点?
(4)每个个体被抽到的机会都相等,抽样具有公平性.
(3)抽取的样本不放回,样本中无重复个体;
(2)样本的抽取是逐个进行的,每次 只抽取一个个体;
(1)总体的个体数有限;
思考6:在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?
知识探究(二):简单随机抽样的方法
思考1:假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选
思考2:用抽签法(抓阄法)确定人选,具体如何操作?
用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.
思考3:一般地,抽签法的操作步骤如何?
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
第二步,将号签放在一个容器中,并搅拌均匀.
思考4:你认为抽签法有哪些优点和缺点?
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
思考5:从0,1,2,…,9十个数中每次随机抽取一个数,依次排列成一个数表称为随机数表(见教材P103页),每个数每次被抽取的概率是多少?
思考6:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?
第一步,将800袋牛奶编号为000,001,002,…,799.
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数).
思考7:如果从100个个体中抽取一个容量为10的样本,你认为对这100个个体进行怎样编号为宜?
思考8:一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.
理论迁移
例1 为调查央视春节联欢晚会的收视率,有如下三种调查方案:
方案一:通过互联网调查.
方案二:通过居民小区调查.
方案三:通过电话调查.
上述三种调查方案能获得比较准确的收视率吗?为什么?
例2 为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,试利用简单随机抽样法抽取样本,并简述其抽样过程.
方法一:抽签法;
方法二:随机数表法.
例3 利用随机数表法从500件产品中抽取40件进行质检.
(1)这500件产品可以怎样编号?
(2)如果从随机数表第10行第8列的数开始往左读数,则最先抽取的5件产品的编号依次是什么?
1.简单随机抽样包括抽签法和随机数表法,它们都是等概率抽样,从而保证了抽样的公平性.
3. 抽签法和随机数表法各有其操作步骤,首先都要对总体中的所有个体编号,编号的起点不是惟一的.
2.简单随机抽样有操作简便易行的优点,在总体个数较小的情况下是行之有效的抽样方法.
小结作业
问题提出
1.简单随机抽样有哪两种常用方法?其操作步骤分别如何?
第二步,将号签放在一个容器中,并搅拌均匀.
抽签法:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
第一步,将总体中的所有个体编号.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.
第二步,在随机数表中任选一个数作为起始数.
随机数表法:
知识探究(一):简单随机抽样的基本思想
思考1:某中学高一年级有12个班,每班50人,为了了解高一年级学生对老师教学的意见,教务处打算从年级600名学生中抽取60名进行问卷调查,那么年级每个同学被抽到的概率是多少?
思考2:你能用简单随机抽样对上述问题进行抽样吗?具体如何操作?
思考3:联想到学校每学期选派学生评教评学时的做法,你还有什么方法对上述问题进行抽样?你的抽样方法有何优点?体现了代表性和公平性吗?
思考4:如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作?
2.1.2 系统抽样
第二步,将总体平均分成60部分,每一部分含10个个体.
第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为60的样本.
(如8,18,28,…,598)
第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).
第一步,将这600件产品编号为1,2,3,…,600.
思考5:上述抽样方法称为系统抽样,一般地,怎样理解系统抽样的含义?
将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.
知识探究(二):系统抽样的操作步骤
思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?
将总体中的所有个体编号.
思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?
先从总体中随机剔除5个个体,再均衡分成60部分.
思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?
思考4:如果N不能被n整除怎么办?
从总体中随机剔除N除以n的余数个个体后再分段.
思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?
总体中的个体数N除以样本容量n所得的商.
用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.
思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?
思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?
第四步,按照一定的规则抽取样本.
第一步,将总体的N个个体编号.
第三步,在第1段用简单随机抽样确定起始个体编号l.
第二步,确定分段间隔k,对编号进行分段.
思考8:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?
总体中个体数比较多;系统抽样更使样本具有代表性.
思考9:我校共有360名老师,为了支持富阳的教育事业,现要从中随机抽取40名老师到其它中学任教,用系统抽样选取奔赴其它中学的教师团合适吗?
思考10:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法.下列广告中的数据可靠吗?
“现代研究证明,99%以上的人皮肤感染有螨虫…….”
“……美丽润肤膏,含有多种中药成分,可以彻底清除脸部皱纹,只需10天,就能让你的肌肤得到改善.”
“……瘦体减肥灵真的灵,其减肥的有效率为75%.”
理论迁移
例1 某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?
第一步,随机剔除2名学生,把余下的320名学生编号为1,2,3,…320.
第四步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.
第三步,在第1部分用抽签法确定起始编号.
第二步,把总体分成40个部分,每个部分有8个个体.
例2一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10组,组号依次为1,2,3,…,10,现用系统抽样抽取一个容量为10的样本,并规定:如果在第一组随机抽取的号码为m,那么在第k(k=2,3,…,10)组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,求该样本的全部号码.
6,18,29,30,41,
52,63,74,85,96.
2.系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便.
小结作业
1.系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.
2.1.3 分层抽样
问题提出
1.系统抽样的基本含义如何?系统抽样的操作步骤是什么?
将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.
含义:
第二步,确定分段间隔k,对编号进行 分段.
步骤:
第四步,按照一定的规则抽取样本.
第三步,在第1段用简单随机抽样确定起始个体编号l.
第一步,将总体的所有个体编号.
2.设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.
知识探究(一):分层抽样的基本思想
思考1:从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?
某地区有高中生2400人,初中生10800人,小学生11100人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.
思考2:从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?
样本容量与总体个数的比例为1:100,则
高中应抽取人数为2400*1/100=24人,
初中应抽取人数为10800*1/100=108人,
小学应抽取人数为11100*1/100=111人.
思考3:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?
思考4:在上述抽样过程中,每个学生被抽到的概率相等吗?
思考5:上述抽样方法不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.一般地,分层抽样的基本思想是什么?
若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.
思考6:若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?
高中生8人,初中生36人,小学生37人.
知识探究(一):分层抽样的操作步骤
某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本.
思考1:该项调查应采用哪种抽样方法进行?
思考2:按比例,三个年龄层次的职
工分别抽取多少人?
35岁以下25人,35岁~49岁56人,
50岁以上19人.
思考3:在各年龄段具体如何抽样?怎样获得所需样本?
思考4:一般地,分层抽样的操作步骤如何?
第一步,计算样本容量与总体的个体数之比.
第四步,将各层抽取的个体合在一起,就得到所取样本.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
思考5:在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何计算?
思考6:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?
调节样本容量,剔除个体.
思考7:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,根据下表,你能对三种抽样方法作一个比较吗?
方法
类别 共同
特点 抽样特征 相互联系 适应范围
简单随
机抽样
系统
抽样
分层
抽样
抽样过程中每个个体被抽取的概率相等
将总体分成均衡几部分,按规则关联抽取
将总体分成几层,按比例分层抽取
用简单随机抽样抽取起始号码
总体中的个体数较少
总体中的个体数较多
总体由差异明显的几部分组成
从总体中逐个不放回抽取
用简单随机抽样或系统抽样对各层抽样
例1 某公司共有1000名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容量为80的样本,已知策划部被抽取4个员工,求策划部的员工人数是多少?
50人.
理论迁移
例2 某中学有180名教职员工,其中教学人员144人,管理人员12人,后勤服务人员24人,设计一个抽样方案,从中选取15人去参观旅游.
用分层抽样,抽取教学人员12人,管理人员1人,后勤服务人员2人.
例3 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,完成这两项调查宜分别采用什么方法?
①用分层抽样,②用简单随机抽样.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):
学段 城市 县镇 农村
小学 357 000 221 600 258 100
初中 226 200 134 200 11 290
高中 112 000 43 300 6 300
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):
学段 城市 县镇 农村
小学 357 000 221 600 258 100
初中 226 200 134 200 11 290
高中 112 000 43 300 6 300
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):
学段 城市 县镇 农村
小学 357 000 221 600 258 100
初中 226 200 134 200 11 290
高中 112 000 43 300 6 300
小结作业
2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.
1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.
3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.