课件27张PPT。 本 章 引 言 数字化的时代产品的合格率农作物的产量产品的销售量某地的气温就业状况电视台的收视率 我国是世界上的第13个贫水国,人均淡水占量排世界第109位我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174000平方公里,并以每年3400平方公里的速度扩张。 你知道这些数据是怎么来的吗?通过调查获得的。 怎么调查?是对考察对象进行全面调查还是抽样调查?问题情境1、灯泡厂要了解生产的灯泡的使用寿命,需要将所有灯泡逐一测试吗?
2、有一段时间,食品添加剂中“苏丹红”事件闹得沸沸扬扬,国家卫生部要对食品中的添加剂“苏丹红”含量进行检测,怎样获得相关数据?
3、国际奥委会2003年6月29日决定,2008年北京奥运会的举办日期将比原定日期推迟两周,改在8月8日至8月24日举行。原因是7月末8月初北京地区的气温高于8月中上旬。这一结论是如何得到的?统计学是干什么的?现代社会是信息化的社会,人们常常需要收集数据,根据所获得的数据提取有价值的信息,作出合理的决策。统计学是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。统计的基本思想方法是什么?统计的基本思想方法是用样本估计总体,即当总体数量很大或检测过程具有一定的破坏性时,不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。
如何进行合理的抽样呢? 例如,为了了解一批计算器的寿命,我们能将它们逐一测试吗?很明显,这既不可能也没必要。实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况。 进一步,从节约费用的角度考虑,在保证样本估计总体达到一定的精度的前提下,样本中包含的个体数越少越好。 于是,如何设计抽样方法,使抽取的样本能够真正代表总体,就成为我们要关注的一个关键问题。否则,如果样本的代表性不好,那么对总体的判断就会出现错误。因此科学合理地采集样本才能作出客观的统计推断。 品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴涵的道理吗?生活中的“数学” 高质量的样本数据来自“搅拌均匀”的总体。如果我们能够设法将总体“搅拌均匀”,那么从中任意抽取一部分个体的样本,它们含有与总体基本相同的信息。一个著名的案例 在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:你认为预期结果出错的原因是什么? 原因:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。 像本例中这样容易得到的样本称为方便样本。如果使用“方便样本”,那么得出与事实不符的结论的可能性就会大大增加。 结论:在抽样时不能只图方便。如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个“方便样本”,“方便样本”的代表性差,基本上这种方便样本得出的结论就会与事实不符。 那么,怎样从总体中抽取样本呢?如何表示样本数据?如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢?这些正是本章要解决的问题。在抽样调查中要注意什么问题?思考: 要了解全国高中生的视力情况,调查方法:在全国
①按东、西、南、北、中分片,
②每个区域各抽3所中学,
③对这15所中学的全部高中生15000人进行视力测试。考察对象是什么?在统计中,我们把所要考察的对象的全体叫做总体全国每位高中学生的视力情况。把组成总体的每一个考察的对象叫做个体这15000名学生的视力情况又组成一个集体从总体中取出的一部分个体的集体叫做这个总体的一个样本。15000样本中的个体的数目叫做样本的容量。全国所有高中学生的视力情况。问题一:“为了解我校1600名学生的身体情况,最近组织学生体检,并抽样调查了高二(8)班54名学生的身体情况。”这个调查中,总体、个体、样本、样本容量各是什么?
问题二:对于一个确定的总体,其样本是唯一的吗?总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总
体的一个样本。
样本容量:样本中个体的数目。总体、个体、样本、样本容量议一议 中央电视台需要在我市调查“春节联欢晚会”的收视率。
(1)每个看电视的人都要被问到吗?
(2)对我校学生的调查结果能否作为该节目的收视率?
(3)你认为对不同社区、年龄层次、文化背景的人所做调查的结 果会一样吗?答(1)中央电视台在调查时不可能问到每一个看电视的人。(2)对一所中学学生的调查结果不能作为该节目的收视率,因为只有中学生,缺乏代表性。(3)不同社区、年龄层次、文化背景的人所做调查的结果 不一样,因为他们的兴趣、爱好等方面情况相距甚远。 为了了解学生对学校伙食的满意程度,小红访问了50名女生;小聪访问了50名男生;小明访问了24名男生和24名女生,其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、小明三人的不同抽样方法哪一种最好?为什么?学习致用答:小明的方法最好。小明抽得样本既有男生,又有女生,而均匀分布在各年级,这样的抽样较具有代表性,反映的情况具有普遍意义。1.我们常常根据样本得到结果来推测总体的结果。不同的抽样可能得到不同的结果。2.为了使结果更具准确性,抽样时,样本的容量要合理,样本的个体要有代表性。 抽样才具有普遍意义温馨提醒2.1 随机抽样2.1.1 简单随机抽样简单随机抽样的特点: (1)总体的个体数有限; (2)它是从总体中逐个地进行抽取; (3)它是一种不放回抽样;(4)它是一种等概率抽样。 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N)。如果每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样为简单随机抽样。简单随机抽样例 下列抽取样本的方式是否属于简单随机抽样?说明理由。(1)从无限多个个体中抽取10个个体作样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验。在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里。1.抽签法例:某单位对口支援西部开发,现从报名的18名
志愿者中选取6人组成志愿小组到西藏工作3年,
请用抽签法设计抽样方案。第一步:将18名志愿者编号,号码是1,2,…,18; 第二步:将号码分别写在一张纸上,制成号签;第三步:将得到的号签放入一个容器中,并充分搅匀;第四步:从容器中逐个不放回地依次抽取6个号签,并记录上面的编号;第五步:所得的号码对应的志愿者就是支援小组的成员。抽签法 先将总体中的所有个体(共有N个)编号(号
码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出一个号签,连续抽取n次,就得到一个容量为n的样本。简记:编号、制签、搅拌、抽样2.随机数法例:从800袋牛奶中抽取60袋进行质量检查,利用
随机数表法设计抽样方案。第一步:将800袋牛奶编号,号码是000,001,…,799; 第二步:在随机数表中任选一个数作为开始,例如选出第8行第7列的数“7”;第三步:从数“7”开始,向右读,得到一个三位数785,由于785<799,说明号码785在总体编号内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507, …,依次下去,直到样本的60个号码全部取出;第四步:以上号码对应的60袋牛奶就是要抽取的对象。用随机数表法抽取样本的步骤:①将总体中的所有个体编号(每个号码位数一致);②在随机数表中选定开始的数字(确定行数列数);③从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;④根据选定的号码抽取样本。简记:编号、选数、取号、抽样练习:要从某厂生产的300台机器中用随机数表法
抽出10台作为样本,试设计抽样方案。第一步:将300台机器编号,号码是000,001,…,299; 第二步:在随机数表中任选一个数作为开始,例如选出第3行第2列的数“6”;第三步:从数“6”开始,向右读,每次读取3位,凡不在000~299中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到:026,141,012,269,050,101,243,099,006,184;第四步:以上号码对应的10台机器就是要抽取的对象。抽签 法 2.简单随机抽样的方法:随机数表法注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素.小结1.简单随机抽样的概念和特点适用范围:总体的个体数不多时