5.1.1数据的收集 课件(共30张PPT)

文档属性

名称 5.1.1数据的收集 课件(共30张PPT)
格式 pptx
文件大小 766.7KB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2022-05-01 08:42:59

图片预览

文档简介

(共30张PPT)
5.1.1数据的收集
引入:
统计学是一门利用数据帮助人们决策的科学,数据的收集往往是统计活动的基础,现代社会里,获取数据的途径很多.
从互联网上可以获得大量的统计数据,比如从国家统计局的网站(如图),通过数据查询等,可以得到各种权威的国家宏观统计数据.
再比如,通过正式出版的统计报表和年鉴,也可获得权威的统计数据。
当然,也可以通过向专业人士请教来获得现成的数据.我们还可以自己动手收集数据,例如,通过社会调查了解热门对环境保护的看法,通过试验设计掌握种子的发芽率,等等.通过每天的实时记录,也能得到有用的数据,例如,通过记录自己每天在每个学科上的学习时间,能了解自己是否偏科、是否需要调整各学科的学习时间。
引例:育才中学想在高一年级下学期举办3场心理健康讲座,备选的主题有6个,高一学生共有1356人,学校将备选的6个主题一一列出,做成了调查问卷,为了宣传最能满足大家需要的3个主题,以下两种方案各自的优点和缺点是什么?
(1)请各位高一学生完成调查问卷,然后统计相关结果;
(2)随机抽取50位高一学生完成调查问卷,然后统计有关结果.
问题1:总体与样本
总体与样本的概念:
考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
普查与抽样的概念:
一般地,对总体中每个个体都进行考查地方法称为普查(也称为全面调查),只抽取样本进行考查的方法称为抽样调查,前述情境与问题中的方案(1)是普查,方案(2)是抽样调查.
普查能够了解总体中每个个体的情况,从而能准确的掌握总体的特征,因此,在总体包含的个体总数不大,或有特殊需要的情况下,可以采用普查地方法,例如:
(1)为了订购集体活动地服装,需要了解班内每位同学的身高、腰围等,应该使用普查地方法;
(2)为了全面地了解我们人口的状况,从1949年至2017年,我们已经进行了6此全国性人口普查;
(3)为了掌握国民经济第二产业,第三产业地发展规模、结构、效益等信息,我国于2004年、2008年、2013年进行了三次经济普查,而且自2013年以后,计划逢3和逢8的年份都要进行经济普查.
然而,普查的方法有时会因为各种原因而无法实施,例如成本太高,时间上不容许,考查方法具有破坏性等,此时抽样调查成了不二选择,例如:
(1)想了解潜在顾客对新开发的产品包装意见时,由于潜在顾客难以界定以及经济上的原因,只能采用抽样调查;
(2)想实时了解收看时政新闻的人数等情况,因为经济成本于时间的原因,只能采用抽样调查;
(3)国家食品药品监督管理部门想了解各超市正在出售的牛奶里细菌含量是否超标,公司质检部门想测试电子产品的防水性能,因为考查方法都具有破坏性,只能采用抽样调查。
事实上,我们在日常生活中也经常运用抽样的思想,例如:
(1)早晨起床的时候,如果发现天气变了,你可能会把手伸出窗外感受一下,然后再决定是否要穿厚一点的衣服;
(2)在大口喝杯子里的热水之前,你一定会先喝一小口,试一下温度;
(3)去买橘子的时候,如果有可能的话,你会先尝一下,然后再决定买还是不买。
   普查 抽样调查
优点 调查结果全面、系统 (1)迅速及时;
(2)节约人力、物力和财力
缺点 工作量大,有时费时费力 调查结果不如普查全面、系统
适用范围 1.调查对象少;2.调查对象多,但是调查结果要求必须全面、系统、准确时 1.调查对象太多,且不必要普查的;
2.调查方式有破坏性时
例1. 给出以下调查:
①了解一批汽车驾校训练班学员的训练成绩是否达标;
②了解一批炮弹的杀伤力;
③某饮料厂对一批产品质量进行检查;
④调查对2019年央视春晚节目的满意度;
⑤检验航天设备中各零件产品的质量.
其中适宜用抽样调查的是    .(将正确答案的序号全填上)
【答案】 ②③④
例2.某工厂为了了解其加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 (   )
A.总体 B.个体
C.总体的一个样本 D.样本量
【答案】 C
问题2:简单随机抽样
在初中我们已经接触了简单随机抽样,知道在进行简单随机抽样时,总体中的每一个个体都有相等的机会被抽到。一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组,划类、排队等,完全随机地抽取个体。简单随机抽样是其他各种抽样方法的基础,当总体中的个体之间差异程度最小和总体中个体数目较少时,采用这种方法.
1.简单随机抽样的定义:
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
2.简单随机抽样必须具备下列特点:
(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
常见的简单随机抽样方法有抽签法和随机数表法.
抽签法类似于从如图所示的抽奖箱里抽奖.
例如,若要从90个节能灯中抽签法抽出5个来进行检验,可以先给这90个节能灯编号,然后将编号写在90张纸片(或小球)上,再把纸片放在一个容器中,搅拌均匀后,随机从中抽取5个号码,找出这5个号码对应的节能灯即可.
1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
2.抽签法的一般步骤:
(1)将总体中的N个个体编号(号码从1到N);
(2)将这N个号码写在形状、大小相同的号签上;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;
(5)将总体中与抽到的号签编号一致的n个个体取出。
例3.下列抽取样本的方式是属于简单随机抽样的是( )
①从无限多个个体中抽取100个个体作样本;
②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;
③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)
A.① B.② C.③ D.以上都不对
答案:C
抽签法的优点是简单易行,但当总体的容量非常大,操作起来就比较麻烦,而且如果抽取之前搅拌不均匀,可能导致抽取的样本不具有代表性,使用随机数表可在一定程度上解决这个问题.
3.随机数表
随机数表是由随机数(通常为0,1,2,…,9)相乘的数表,表中的每一个位置出现的数是随机的下列是一个随机数表的一部分.
4.随机数表进行简单随机抽样的一般步骤为:
(1)对总体进行编号;
(2)在随机数表中任意指定一个开始选取的位置,位置的确定可以闭着眼睛用手指随机确定,也可用其他方式随机确定;
(3)按照一定规则选取编号。
例如,若编号是两位数,规则可以是每次从左往右选取两个数字,也可以是每次只选取每一组的前两个数字,还可以是只选取下面一行同一位置对应的两个数字,等等。规则一旦确定,就不能更改,在选取的过程中,遇到超过编号范围或已经选取了的数字,应该放弃.
(4)按照得到的编号,找到对应的个体.
例如,仍以从90个节能灯中抽取5个为例,将90个节能灯编号为01,02,…,90:
(1)若指定从第三行第五组的第一个数字开始,每次从左往右选取两个数字,则可得5个编号为:
38,65,45,26,20
(2)若指定从第五行第一组的第一个数字开始,每次只选取每一组前两个数字,则可得5个编号为:
18,13,68,89,67
例4.已知总体容量为106,若用随机数表法抽取一个容量为10的样本,下面对总体的编号正确的是( )
A.1,2,…,106 B.01,02,…,105
C.00,01,…,105 D.000,001,…,105
答案:D
例5.总体有编号为01,02,…,19,20的20个个体组成。利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
A.08 B.07 C.02 D.01
答案:D
问题3:分层抽样
某高中高一新生共有900人,其中男生500人,女生400人,学校现在想了解高一新生对文史类课程的想法,以便开设有关选修课程,准备从高一新生中抽取45人进行访谈:
(1)如果直接采用简单随机抽样,会有什么缺点?
(2)采用怎样的抽样方法较好?
如果相对于要考查的问题来说,总体是由有明显差别的几部分组成时,直接采用简单随机抽样得出的样本,可能并不具有代表性。
例如,上述尝试与发现中,一般来说,男生与女生对文史类课程的看法存在差别,如果采用简单随机抽样,得到的样本中,男生(女生)所占比例与总体中的男生(女生)所占比例可能存在较大差异,从而导致最后得到的结果不能很好反映总体的情况.
5.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的,互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称分层抽样)
注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
6、分层抽样的步骤
(1)分层:按某种特征将总体分成若干部分。
(2)按比 例确定每层抽取个体的个数。
(3)各层分别按简单随机抽样的方法抽取。
(4)综合每层抽样,组成样本。
注意:
(1)分层需遵循不重复、不遗漏的原则。
(2)抽取比例由每层个体占总体的比例确定。
(3)各层抽样按简单随机抽样进行。
例6.某科研院所共有科研人员800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有240人,无职称的有80人,欲了解该科研院所科研人员地创新能力,决定抽取100名科研人员进行调查,应该怎样抽取?
例7、分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体成样本,所以分层抽样为保证每个个体等可能入样,必须进行( )
A、每层等可能抽样
B、每层不等可能抽样
C、所有层按同一抽样比等可能抽样
简析:保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C。
简析:根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选 C。
例9、某高中共有900人,其中高一年级300人,高二年 级200人,高三年级400人,现采用分层抽 样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为
A.15,5,25 B.15,15,15 C.10,5 ,3 0 D15,10,20
简析:因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5 ,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D。
例10、一个地区共有5个乡镇,人口3万人,其中人口比例为3: 2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。
简析:采用分层抽样的方法。
因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人 分为5层,其中一 个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
各乡镇抽取人数分别为60人、40人、100人、40人、60 人。
(3)将300人组到一起,即得到一个样本 。
小结:
类 别 共同点 各自特点 联 系 适 用
范 围
简 单 随 机 抽 样 (1)抽样过程中每个个体被抽 到的可能性相等 (2)每次 抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 总体个数较少
分 层 抽 样 将总体分成几层,分层进行抽取 分层抽样时采用简单随机抽样 总体由差异明显的几部分组成