课件32张PPT。9.1.2 分层随机抽样 9.1.3 获取数据的途径 1、简单随机抽样的概念:2、简单随机抽样的特点:3、简单随机抽样的常用方法:③机会均等抽样. ①总体个数有限;②逐个进行抽取;①抽签法; ②随机数表法. 设一个总体含有有限个个体,并记其个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样. 复习回顾抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,
例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.
能否利用总体中的一些额外信息对抽样方法进行改进呢?新课引入学习新知在对树人中学高一年级学生身高的调查中, 采取简单随机抽样的方式抽取了50名学生。1.抽样调查最核心的问题是什么?2.会不会出现样本中 50 个个体大部分来自高个子或矮个子的情形?3.为什么会出现这种“极端样本”?4.如何避免这种“极端样本”?样本代表性会抽样结果的随机性个体差异较大分组抽样,减少组内差距在树人中学高一年级的 712 名学生中, 男生有 326 名、女生有 386 名学习新知样本量在男生、女生中应如何分配? 假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?你认为哪些因素影响学生视力?抽样要考虑哪些因素?分析:考察对象的特点是由具有明显差异的几部分组成。学习新知一、分层抽样的定义。 一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.学习新知每一层抽取的样本数=×总样本量学习新知应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。分层随机抽样的特点1.从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况。2.比例分配的分层随机抽样是等可能抽样 ,如果层数分为 2层,第 1 层和第 2 层包含的个体数分别为M 和N,抽取的样本数分别 m 和n。第一步,计算样本容量与总体的个体数之比.第四步,将各层抽取的个体合在一起,就得到所取样本.第三步,用简单随机抽样在各层中抽取相应数量的个体.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 分层抽样的步骤:学习新知注意事项: 1.分层抽样法适用于总体中个体差异明显的抽样;
2.分层是按总体中个体的明显差异进行分类;
3.分层抽样是按各层中含个体在总体中所占的比例,确定层抽样的个体个数进行随机抽样.学习新知 某地区有高中生2400人,初中生10800人,小学生11100人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.样本容量与总体个数的比例为1:100,则
高中应抽取人数为2400*1/100=24人,
初中应抽取人数为10800*1/100=108人,
小学应抽取人数为11100*1/100=111人.典型例题变式1:若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?高中生8人,初中生36人,小学生37人.某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本.思考1:该项调查应采用哪种抽样方法进行?典型例题思考2:按比例,三个年龄层次的职工分别抽取多少人?35岁以下25人,35岁~49岁56人,
50岁以上19人.思考3:在各年龄段具体如何抽样?怎样获得所需样本?1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D15,10,20D 巩固练习2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。巩固练习解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。
(3)将300人组到一起,即得到一个样本。3.某公司共有1000名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容量为80的样本,已知策划部被抽取4个员工,求策划部的员工人数是多少?50人.巩固练习4. 某中学有180名教职员工,其中教学人员144人,管理人员12人,后勤服务人员24人,设计一个抽样方案,从中选取15人去参观学习. 用分层抽样,抽取教学人员12人,管理人员1人,后勤服务人员2人.5. 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;
在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,
完成这两项调查宜分别采用什么方法?①用分层抽样,②用简单随机抽样.巩固练习请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.6.某地区中小学生人数的分布情况如下表所示(单位:人):巩固练习7、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。8552巩固练习8、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为n的样本,每个学生被抽到的可能性均为0.2, 则n= .36010、某校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生中抽取的人数为80,则n=1929、某单位有职工160人,其中业务员有104人,管理人员32人,后勤24人,现用分层抽样从中抽取一容量为20的样本,则抽取管理人员( )人
A、3 B、4 C、7 D、12B巩固练习11、某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量为200人的样本,则应抽取三年级的学生为( )人。
A、80 B、40 C、60 D、20B巩固练习思考:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理? 调节样本容量,剔除个体. 学习新知某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是
A.简单随机抽样 B.系统抽样
C.分层抽样 D.先从老人中剔除1人,然后再分层抽样D 学习新知四、分层随机抽样的平均数1.在简单随机抽样中如何估计总体平均数?2.那么在分层随机抽样中如何估计总体平均数呢?是否也可以直接用样本平均数进行估计?学习新知第1层的总体平均数和样本平均数为:第2层的总体平均数和样本平均数为:总体平均数和样本平均数为:学习新知由于用第一层的样本平均数 可以估计第1层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数 ,因此我们可以用
估计总体平均数对各层样本平均数加权(层权)求和学习新知分层随机抽样如何估计总体平均数在比例分配的分层随机中抽样中典型例题在树人中学高一年级的 712 名学生,男生有 326 名、女生有 386 名,分别抽取的男生23名男生、27名女生样本数据如下样本女生平均身高=160.6,样本男生平均身高=170.6巩固练习高一年级有男生490人,女生510人,张华按照男生女生进行分层,得到男生女生平均身高分别为170.2cm和160.8cm。(1)如果张华在各层中按比例分配样本,总样本量为100.那么男生、女生中分别抽取了多少名?在这种情况下,请估计高一年级全体学生的平均身高。(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高一全体学生的平均身高。深入思考小明用比例分配的分层抽样方法,从高一年级的学生中抽取了十个样本量为50的样本,计算出样本平均数。与相同样本量的简单随机抽样的结果比较1.分层抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。2.相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。3.分层随机抽样的结果并不是每一次都优于简单随机抽样。发现结论课堂小结 1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。
(3)在每层抽样时,应采用简单随机抽样的方法进行抽样。
2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
3.分层随机抽样中如何用样本估计总体平均值。简单随
机抽样分层
抽样将总体分成几层,按比例分层抽取总体中的个体差异较小总体由差异明显的几部分组成从总体中逐个抽取用简单随机抽样对各层抽样抽样过程中每个个体被抽到的可能性相等
2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.3.简单随机抽样是基础,分层抽样是发展,二者相辅相成,对立统一.课堂小结