(共27张PPT)
2.1.1简单的随机抽样
我们知道,工厂生产的产品必须经过检验,只有合格产品才能进入市场流通。而有些检验带有极大的破坏性,那么我们应该如何解决既要确保出厂的产品必须合格,又不能对其造成大面积破坏的矛盾呢?
某校有高中学生900人,校医务室想对全校高中学生的身高作一次调查,为不影响正常的教学准备抽取50名学生作为调查对象,应该怎样设计方案?
每年高考过后,考试中心的工作人员需要对考生的答卷进行分析,总结经验,找出问题,以利于下一年度的高考命题,指导下一届考生备考。而调研每位考生答卷的工作量太大,那么应如何科学地进行调研呢? .
总之,无论是生活、工作、学习,我们每时每刻都要同数据打交道,那么如何从众多的数据中科学地提取有效数据,又如何科学地对数据进行分析,从而使我们能够作出科学的决策,这正是统计的内涵.
本章先介绍了简单随机抽样、系统抽样、分层抽样这三种常用的抽样方法。
接着介绍如何用样本估计总体,一是如何用样本的频率分布估计总体分布;二是如何用样本的某种特征数去估计总体的相应的特征数。
最后介绍了两个变量之间的关系,除了函数关系这种确定性的关系以外,还存在因变量的取值带有一定随机性的两个变量之间的关系——相关性。
统计是研究如何合理地收集、整理、分析数据的学科,它可以为人们制定决策提供依据。在日常生活中,人们常常需要收集数据,根据所获得的数据提取有价值的信息,作出合理的决策。
在本章中通过对数据的收集、整理和分析,可以增强我们的社会实践能力,培养我们解决问题的能力,增强我们学习数学的兴趣。
2.1.1简单随机抽样
在一次考试中,考生有2万名,如果为了了解这些考生的数学主观题的得分情况,而将他们所有的考卷加以统计,那将是十分麻烦的,怎么才能了解这些学生的主观题的得分情况呢?
今有某灯泡厂生产的灯泡10000只,怎样才能了解这批灯泡的使用寿命呢?
一. 统计的有关概念及统计的基本思想
1.总体、个体、样本
(1)总体:一般把所考察对象的某一数值指标的全体构成的集合看作是总体;
(2)个体:构成总体的每一个元素叫做个体;
(3)样本:从总体中抽出的若干个个体所组成的集合叫做样本;
(4)样本容量:样本中个体的个数叫做样本容量。
2.随机抽样
抽样时保证每一个个体都可能被抽到,并且每一个个体被抽到的机会是均等的,满足这样的条件的抽样就是随机抽样。
3.统计的基本思想方法
统计的基本思想方法就是用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。
在1936年的美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)谁将当选下一届总统。为了了解公众意向,调查者根据电话簿和俱乐部的车辆登记簿上的名单,统一给大批人发了调查表。 通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:
你认为预测结果出错的原因是什么?
分析:当时的访问对象是从电话号码簿和俱乐部会员名册上选取的,但在1936年,美国家庭电话尚未普及,只有100万部左右,尤其是有条件参加俱乐部的人,大多数是经济上富有,政治上保守,倾向于共和党的选民,这就造成了显著的系统误差.
本例说明了抽样方法的重要性,只有正确的抽样方法才能使其样本代表总体。 也就是“一个好的抽样调查胜过一次蹩脚的普查”(尽管普查耗费了大量的人力、物力、财力),因此,我们必须掌握科学的抽样方法,首先在抽样时,必须将总体“ 搅拌均匀”;其次还要掌握几个常用的抽样方法,如本章所学习的简单随机抽样、系统抽样、分层抽样。
二、简单随机抽样
一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样的特点 :
(1)它要求被抽取的样本的个数有限,这样,便于通过随机抽取的样本对总体进行分析;
(2)它是从总体中逐个地进行抽取。 这样,便于在抽样实践中进行操作;
(3)它是一种不放回抽样。 由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算。
(4)它每一次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性。
问题:下面的抽样方法是简单随机抽样吗,为什么?
(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动。
(2)从20个零件中一次性抽出3个进行质量检验。
(3)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿下一件,连续玩了5件。
三、抽签法
抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,记下号签上的号码,就得到一个容量为n的样本
抽签法的优点和缺点 :
优点:抽签法能够保证每个个体入选样本的机会都相等(得到的样本是简单随机样本);
缺点:(1)当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法成本高(费时、费力);
(2)号签很多时,把它们“搅拌均匀”就比较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加。
某班有学生40人,为了了解学生各方面的情况,需要从中抽取一个容量为10的样本,用抽签法确定要抽取的学生
解:注意抽签法的要求:
S1 将这40名学生按学号编号,分别为1,
2,……,40;
S2 将这40个号码分别写在相同的40张纸片上;
S3 将这40张纸片放在一个盒子里搅拌均匀,抽出一张纸片,记下上面的号码,然后再搅拌均匀,继续抽取第2张纸片,记下号码;重复这个过程直到取到第10个号码时终止。
于是,和这10个号码对应的10个学生就构成了一个简单随机样本 。
四、随机数表法
随机数表由数字0,1,2,3,……,9 这10个数字组成,并且每个数字在表中各个位置上出现的机会一样。通过随机数生成器,例如计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表.
通过随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后抽取样本。
例如要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验。用随机数表抽取的步骤如下:
(1) 对850颗种子进行编号:可以编为001,002,……,850.
(2) 给出的随机数表是5个数一组,使用各个5位数组的前3位,从各组数中任选一个前3位小于或等于850的数作为起始号码,例如从第1行第7组开始,取出530作为抽取的第1个代号;
(3) 继续向右读,由于987>850,跳过这组数不取,继续向右读,得到415作为第2个代号。数组的前3位数不大于850且不与前面取出的数重复,就把它取出,否则跳过不取,取到一行末尾时转到下一行从左到右继续读,如此下去,直到得到在001~850之间的50个三位数。
上面我们是从左到右读数,也可以从上到下读数或其它有规则的读数方法。
用随机数表法抽取样本的步骤:
S1 将总体中的所有个体编号(每个号码位数一致);
S2 在随机数表中任选一个数作为开始;
S3 从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过;若在编号中,则取出。得到的号码若在前面已经取出,也跳过,如此进行下去,直到取满为止;
S4 根据选定的号码抽取样本。
用随机数表法抽取样本的优缺点:
优点:简单易行。 它很好地解决了用抽签法时,当总体中的个体数较多时制签难的问题。
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取样本仍不方便。
例1.从30个灯泡中抽取10个进行质量检测,说明利用随机数表法抽取这个样本的步骤。 (随机数表见本章末第87页附表)
解:S1 将30个灯泡编号:00,01,02,03,……,30;
S2 在随机数表中任取一组数作为开始。 如从第5行第5组的数12开始;
S3 从12开始向右读,依次选出12,22,13,09,26,25,21,20,30,19这10个编号的灯泡。
例2.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程。
解:本题总体容量较小,样本容量也较小,可用抽签法。
S1 将30辆汽车编号,号码是01, 02,
…,30;
S2 将号码分别写在一张纸条上,揉成团,制成号签;
S3 将得到的号签放入一个不透明的袋子中,并充分搅匀;
S4 从袋子中依次抽取3个号签,并记录上面的编号;
S5 所得号码对应的3辆汽车就是要抽取的对象。