课件31张PPT。9.1 随机抽样
9.1.1 简单随机抽样第九章 统计1.了解普查与抽样调查的概念,知道两种调查方法的优缺点,能结合实际问题选择恰当的数据调查方法.
2.了解总体、样本、样本量的概念,了解抽样调查的随机性.
3.结合具体的实际问题情境,了解随机抽样的必要性和重要性.
4.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本.
5.能从样本数据中提出基本的数字特征——平均数,并给出合理的解释重点:1.普查与抽样调查的意义. 2.总体与样本的意义.
?? 3.简单随机抽样及其应用. 4.数据的平均数的概念及意义.
难点:1.简单随机抽样的应用.2.平均数的意义.普查:对每一个调查对象都进行调查的方法,称为全面调查(overall survey),又称普查.在一个调查中,我们把调查对象的全体称为总体(population),组成总体的每一个调查对象称为个体(individual).
抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查(sampling survey).我们把从总体中抽取的那部分个体称为样本(sample),样本中包含的个体数称为样本量.一、普查与抽样调查二、 普查和抽样调查的对比例1一 抽样调查的有关概念常考题型给出以下调查:
①了解一批汽车驾校训练班学员的训练成绩是否达标;
②了解一批炮弹的杀伤力;
③某饮料厂对一批产品质量进行检查;
④调查对2019年央视春晚节目的满意度;
⑤检验航天设备中各零件产品的质量.
其中适宜用抽样调查的是 .(将正确答案的序号全填上)【解析】若调查的目的必须通过普查才能实现,一般用普查,但若存在一定的破坏性则用抽样调查,关键还是看实际需要.驾校训练的司机直接影响驾驶安全,必须普查;炮弹的杀伤力调查具有破坏性,只能采用抽样调查;饮料质量的调查也具有破坏性,应该采用抽样调查;央视春晚节目的满意度调查比较复杂,普查成本高,也没必要,适宜用抽样调查;航天设备不能有一点疏忽,每一个零件的质量都需要检查.
【答案】 ②③④例2[2018·北京临川学校高一检测]某工厂为了了解其加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )
A.总体 B.个体
C.总体的一个样本 D.样本量【解析】总体是这批零件的长度,个体是这批零件中每个零件的长度,抽取的200个零件的长度是样本,样本量是200.
【答案】 C训练题1.[2018·深圳南山区校级测试]下列调查适合用抽样调查的是 .
①了解某电视机厂生产的电视机的质量;
②语文老师要检查某个学生作文中的错别字;
③某部门要了解某湖的水质情况;
④调查某市高中生对健康知识的了解情况.①③④ 解析:①某电视机厂生产的电视机很多,普查费时费力,应采用抽样调查;②错别字是必须纠正的,应采用普查;③湖水不能全部分析,应采用抽样调查;④高中生较多,调查结果不需要非常精确,应采用抽样调查.2.[2019·湖北宜昌一中高二检测]某公司有350名员工参加了今年的年度考核.为了了解这350名员工的考核成绩,该公司决定从中抽取50名员工的考核成绩进行统计分析.在这个问题中,50名员工的考核成绩是 ( )
A.总体 B.样本量 C.个体 D.样本D1.简单随机抽样的定义:如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(simple random sampling).三、简单随机抽样2.简单随机抽样的特点
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析.
(2)逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获
取和一些相关的计算.
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性. ?例3 二 、简单随机抽样的概念常考题型已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中不放回地依次抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的个数是 ( )
A.1 B.2 C.3 D.4【解题提示】 根据简单随机抽样的特征:有限性,逐一性,不放回性,等可能性判断即可.
【解析】 ①不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;②不是简单随机抽样,原因是本章讲的简单随机抽样是不放回抽取,而题中是放回的;③是简单随机抽样,符合本章讲的简单随机抽样的特征;④不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样.
【答案】 C简单随机抽样必须具备下列特征
(1)被抽取样本的总体中的个体数N是有限的;
(2)抽取的样本是从总体中逐个抽取的;
(3)简单随机抽样是一种不放回抽样;
(4)简单随机抽样是一种等可能的抽样.
如果四个特征有一个不满足,就不是简单随机抽样.训练题1.C[2019·太原高一期末]下列抽样方法是简单随机抽样的是( )
A.坛子中有1个大球,4个小球,搅均匀后,随机取出一个球
B.在校园里随意选三名同学进行调查
C.在剧院里为抽取三名观众调查,将所有座号写在同样的纸片上,放入箱子搅匀后逐个抽取,共取三张
D.买彩票时随手写几组号2下列问题中,适合用简单随机抽样方法抽样的是( )
A.某报告厅有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下每排32号听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本
D.某乡农田有山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量B1.抽签法的操作步骤:
第一步,编号:将N个个体编号(号码可以从1到N,也可以使用已有的号码).
第二步,写签:将N个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取n次,并记录其编号.
第四步,定样:从总体中找出与号签上的号码对应的个体,组成样本.
提示:(1)给个体编号时可利用已有编号,如学号、考号、标签号等;
(2)制作号签时,所使用的工具(如纸条、小球等)形状、大小应当都一样,以确保每个号签被抽到的可能性相等;
(3)在抽签法中,搅拌均匀的目的是让每个号签被抽到的机会均等.四、抽签法与随机数法2.随机数法的步骤
(1)先给N个个数编号,例如按1~N进行编号;
(2)用随机数工具产生1~N范围内的整数随机数;
(3)把产生的随机数作为抽中的编号,使与编号对应的学生进入样本;
(4)重复上述过程,直到抽足样本所需要的人数.3.抽签法与随机数法的比较
(1)抽签法与随机数法的相同点
①抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总 体的个数有限;
②抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样.
(2)抽签法与随机数法的不同点
随机数法更适用于总体个数较多的时候,而抽签法适用于总体个数较少时.例4 三 、抽签法的应用常考题型要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.【解题提示】 已知N=30,n=3,抽签法抽样时编号1,2,…,30,抽取3个编号,对应的汽车组成样本.
【解】 应使用抽签法,步骤如下:
①将30辆汽车编号,号码是1,2,3,…,30;
②将1~30这30个编号写在大小、形状都相同的号签上;
③将写好的号签放入一个不透明的容器中,并搅拌均匀;
④从容器中每次抽取一个号签,连续抽取3次,并记录上面的编号;
⑤所得号码对应的3辆汽车就是要抽取的对象.应用抽签法的4个注意点
(1)编号.如果已有编号可不必重新编号.
(2)号签要求大小、形状完全相同.
(3)号签要均匀搅拌.
(4)要逐一不放回地抽取.
【注意】
一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;
二是个体之间差异不明显.
一般地,当样本容量和总体容量较小时,可用抽签法.训练题1.B[2019·河南信阳高一联考]下列抽样试验中,用抽签法方便的是( )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验2[2019·安徽合肥一六八中学高一检测]某中学从40名学生中选1人作为男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是 .
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.①例4 四 、随机数法的应用常考题型现有120台机器,请用随机数法抽取10台机器,写出抽样过程.【解题提示】 已知N=120,n=10,用随机数法抽样时编号000,001,002,…,119,抽取10个编号(都是三位数),对应的机器组成样本.
【解】 第一步,先将120台机器编号,可以编为000,001,002,…,119;
第二步,利用工具(转盘、科学计算器或计算机等)产生000,001,002,…,119中的随机数,产生的数是几,就选第几号个体;
第三步,重复第二步,若生成的随机数重复,则剔除重复的编号并重新产生随机数,凡不在000~119中的数跳过去不取,直至选到预先设定的样本容量.应用抽签法的4个注意点
(1)编号.如果已有编号可不必重新编号.
(2)号签要求大小、形状完全相同.
(3)号签要均匀搅拌.
(4)要逐一不放回地抽取.
【注意】
一个抽样试验能否用抽签法,关键看两点:
一是制签是否方便;
二是个体之间差异不明显.
一般地,当样本容量和总体容量较小时,可用抽签法.训练题B[2019·甘肃兰州一中高一检测]总体由编号为01,02,…,39,40的40个个体组成,从中选取5个个体.利用科学计算器依次生成一组随机数如下,则选出来的第5个个体的编号为 ( )
66 06 58 61 54 35 02 42 35 48 96 32 14 52 41 52 48
A.54 B.14 C.35 D.32?五、简单随机抽样中的两类特征数例5 四 、简单随机抽样的总体平均数和样本平均数常考题型从某项综合能力测试成绩表中抽取100人的成绩,统计如下,则这100人的成绩的平均数为 ( )
A.3 B.2.5 C.3.5 D.2.75
?训练题71.[2019·浙江宁波高一检测]某校组织了一次知识竞赛.在参加的同学中随机抽取100位同学的回答情况进行统计,答对的题数如下:答对5题的有10人,答对6题的有30人,答对7题的有30人,答对8题的有15人,答对9题的有10人,答对10题的有5人.则可以估计在这次知识竞赛中这所学校的每位学生答对的题数为 .2.[2019·广东东莞高一期末]某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图如图9-1-1,根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( )
图9-1-1
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
B1对普查与抽样调查的理解
(1)普查是一项非常艰巨的工作,它要对所有的对象进行调查,当检验对象数量很大或对检验对象具有破坏性时,采用普查的方式是行不通的,要进行抽样调查.
(2)普查与抽样调查的适用条件是不同的,在具体问题中,用普查还是抽样调查的方式,要根据它们的特点和适用范围进行判断.2.统计的基本概念
(1)总体:调查对象的全体.
(2)个体:组成总体的每一个调查对象.
(3)样本:从总体中抽取的那部分个体.
(4)样本量:样本中包含的个体数.3.(不放回)简单随机抽样必须具备下列特征
(1)被抽取样本的总体中的个体数N是有限的;
(2)抽取的样本是从总体中逐个抽取的;
(3)简单随机抽样是一种不放回抽样;
(4)简单随机抽样是一种等可能的抽样.4.总体平均数与样本平均数的概念课件33张PPT。9.1 随机抽样
9.1.2分层随机抽样
9.1.3获取数据的途径第九章 统计1.通过实例了解分层随机抽样的特点和适用范围.
2.了解分层随机抽样的必要性.
3.掌握各层样本量化比例分配的方法.重点:分层随机抽样的方法及计算.
难点:实际问题中抽样方法的选择与操作. 一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.一、分层随机抽样的概念二、分层随机抽样的特点(1)从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
(2)分层随机抽样是等可能抽样.用分层随机抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于 .
(3)分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也更广泛.三、分层随机抽样的实施步骤(1)根据已经掌握的信息,将总体分成互不相交的层;
(2)根据总体中的个体数N和样本量n计算抽样比k= ;
(3)确定第i层应该抽取的个体数目ni≈Ni×k(Ni为第i层所包含的个体数),使得各ni之和为n;
(4)在各个层中,按步骤(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本. ?例1一 分层随机抽样的判断常考题型[2019·淮北一中高一检测]某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是 ( )
A.抽签法 B.随机数法
C.简单随机抽样法 D.分层随机抽样法【解析】 显然男、女学生在学习兴趣与业余爱好方面存在明显差异,应当分层抽取,故宜采用分层随机抽样法.
【答案】 D分层随机抽样的一个前提和遵循的两个原则
(1)前提:分层随机抽样的适用前提是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
(2)遵循的两个原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.选择抽样方法的思路
(1)若总体由差异明显的几个层次组成,则选用分层随机抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样.当总体中的个体数较小时,宜用抽签法;当总体中的个体数较大、样本量较小时,宜用随机数法.训练题1.[2019·海南海口高三检测]某地区的高一新生中,来自东部平原地区的学生有2 400人,中部丘陵地区的学生有1 600人,西部山区的学生有1 000人.计划从中选取100人调查学生的视力情况,现已了解到来自东部、中部、西部三个地区学生的视力情况有较大差异,而这三个地区男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是 ( )
A.简单随机抽样 B.按性别分层随机抽样
C.抽签法 D.按地区分层随机抽样D 解析:由于该地区东部、中部、西部三个地区学生的视力情况有较大差异,而这三个地区男女生视力情况差异不大,故按地区分层随机抽样.
2.问题:①有1 000个乒乓球分别装在3个箱子内,其中红色箱子内有500个,蓝色箱子内有200个,黄色箱子内有300个,现从中抽取一个容量为100的样本;②从20名学生中选出3名参加座谈会.
方法:Ⅰ简单随机抽样;Ⅱ分层随机抽样.
其中问题与方法能配对的是( )
A.①Ⅰ,②Ⅱ B.①Ⅱ,②Ⅰ
C.①Ⅱ,②Ⅱ D.①Ⅰ,②ⅠB解析:对于①,由于箱子颜色差异较为明显,可采用分层随机抽样方法抽取样本;对于②,由于总体中的个体数、样本量都较小,宜采用简单随机抽样.例2二 分层随机抽样的相关计算常考题型某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,若在抽取的样本中有青年职工32人,则该样本中的老年职工人数为 .?例3[2019·天津河北区高三二模]相关部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N的值为 .???训练题1.[2019·山东青岛高三检测]某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取 辆、 辆、 辆. 6 ?30 10 2.[2019·河南新乡高三三模]某校有高一学生n名,其中男生数与女生数之比为6∶5,为了解学生的视力情况,现要求按分层随机抽样的方法抽取一个样本量为 的样本,若样本中男生比女生多12人,则n= .1320 ?例4三 分层随机抽样的方案设计常考题型一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取??分层随机抽样的步骤
(1)将总体按一定标准进行分层;
(2)计算各层的个体数与总体的比;
(3)按各层的个体数与总体的比确定各层应抽取的样本量;
(4)在每一层进行抽样(可用简单随机抽样抽取个体);
(5)最后将每一层抽取的样本合成总样本.
训练题某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.??二、分层随机抽样中的平均数例5四 分层随机抽样的平均数常考题型[2019·广西柳州高二检测]为了了解全区科级干部“党风廉政知识”的学习情况,按照分层随机抽样的方法,从全区320名正科级干部和1 280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行预测.经过预测后,两组各自将预测成绩统计分析如下表?.???训练题假设某大学有2万名学生,其中女生占70%,按性别分层随机抽样,并分别在男生、女生层中各随机抽取100人进行调查,得到男生的月平均消费水平为1 200元,女生的月平均消费水平为1 000元,试估计全校学生月平均消费水平.解:用样本均值估计总体均值:30%×1 200+70%×1 000=1 060(元).1.通过调查获取数据:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.
2.通过试验获取数据:通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.
三、数据获取途径3.通过观察获取数据:通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.
4.通过查询获得数据:我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据叫做二手数据.随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础.
1.分层随机抽样的一个前提和遵循的两个原则
(1)前提:分层随机抽样的适用前提是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
(2)遵循的两个原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.2.确定各层样本量的方法4.分层随机抽样平均数的计算3.分层随机抽样的步骤5.数据获取途径