课件21张PPT。第二章 统 计2.1.1 简单随机抽样2.1 随机抽样问题提出 1.我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题. 2.要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断? 3.将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.简单随机抽样知识探究(一):简单随机抽样的基本思想思考1:从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少? 思考2:从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?思考3:一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?思考4:食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,打算从中抽取一定数量的饼干作为检验的样本.其抽样方法是,将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回抽取若干包,这种抽样方法就是简单随机抽样.那么简单随机抽样的含义如何? 一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.简单随机抽样的含义:思考5:根据你的理解,简单随机抽样有哪些主要特点?(4)每个个体被抽到的机会都相等,抽样具有公平性.(3)抽取的样本不放回,样本中无重复个体;(2)样本的抽取是逐个进行的,每次 只抽取一个个体;(1)总体的个体数有限; 思考6:在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?知识探究(二):简单随机抽样的方法 思考1:假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?思考2:用抽签法(抓阄法)确定人选,具体如何操作? 用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.思考3:一般地,抽签法的操作步骤如何?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.第二步,将号签放在一个容器中,并搅拌均匀.思考4:你认为抽签法有哪些优点和缺点?缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.思考5:从0,1,2,…,9十个数中每次随机抽取一个数,依次排列成一个数表称为随机数表(见教材P103页),每个数每次被抽取的概率是多少?思考6:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作? 第一步,将800袋牛奶编号为000,001,002,…,799. 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数).思考7:如果从100个个体中抽取一个容量为10的样本,你认为对这100个个体进行怎样编号为宜?思考8:一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何? 第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.理论迁移 例1 为调查央视春节联欢晚会的收视率,有如下三种调查方案:
方案一:通过互联网调查.
方案二:通过居民小区调查.
方案三:通过电话调查.
上述三种调查方案能获得比较准确的收视率吗?为什么? 例2 为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,试利用简单随机抽样法抽取样本,并简述其抽样过程.方法一:抽签法;方法二:随机数表法. 例3 利用随机数表法从500件产品中抽取40件进行质检.
(1)这500件产品可以怎样编号?
(2)如果从随机数表第10行第8列的数开始往左读数,则最先抽取的5件产品的编号依次是什么? 1.简单随机抽样包括抽签法和随机数表法,它们都是等概率抽样,从而保证了抽样的公平性. 3. 抽签法和随机数表法各有其操作步骤,首先都要对总体中的所有个体编号,编号的起点不是惟一的. 2.简单随机抽样有操作简便易行的优点,在总体个数较小的情况下是行之有效的抽样方法.小结作业作业:
P57练习:1,2,3,4.2、1、2系统抽样
选择题
1、要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法,确定所选取的5枚导弹的编号可能是( )
A、5、10、15、20、25 B、3、13、23、33、43
C、1、2、3、4、5 D、2、4、8、16、22
2、人们打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌,这时,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本。问这种抽样方法是( )
A.系统抽样 B.分层抽样
C.简单随机抽样 D.非以上三种抽样方法
3、某营院有50排座位,每排30个座位,一次报告会后,留下所有座号为8的听众50人进行 座谈。则采用这一抽样方法的是( )
A.系统抽样 B.分层抽样
C.简单随机抽样 D.非以上三种抽样方法
4、如果采用系统抽样,从个体为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的概率为 ( )
A、B、C、D、
5、了了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段间隔为 ( )
A、40 B、30 C、20 D、12
6、了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中随机剔除个体的数目是( )
A、2 B、3 C、4 D、5
7、5 0件产品 编号为0到49,现从中抽取5个进行检验,用系统抽样的方法虽抽样本的编号可以为( )
A、5,10,15,20,25 B、5,13,21,29,37
C、8,22,23,1,20 D、1,10,20,30,40
8、对某商场做一简单统计:从某本50张的发票存根中随机抽取一张,如15号,然后按次序将65,115,165,……发票上的销售额作为一个样本,这种抽取方法为( )
A、简单随机抽样 B、系统抽样 C、分层抽样 D、其他
9、次商品促销活动中,某人可得到4件不同的奖品,这些奖品要从40件不同的奖品中抽取得到,用系统抽样的方法确定此人的所得的奖品的编号的,可能为( )
A、4,10,16,22 B、1,12,22,32 C、3,12,21,40 D、8,20,32,40
10、在一个容量为1003的总体中,要利用系统抽样抽取一个容量为50的样本,那么总体中的每个个体被抽到的概率为( )
A、 B、 C、 D、
11、N个编号中,用系统抽样抽取一个容量为n的样本,抽样间距为( )
A、B、C、D、
12、市为检查汽车尾气排放执行标准,在城市主干道上采取抽取车牌号码末尾为8的汽车检查,这种方法采用了( )
简单随机抽样B、系统抽样C、抽签法D、分层抽样
二、填空题
13、当总体的个体数较多时,采用简单随机抽样显得较为费事,这是可以将总体分为几个部分,然后按照预先定出的规则,从每一个部分抽取_________个体,得到随需要的样本,这种方法叫_________
三、解答题
14、采用系统抽样法,从121人中抽取一个容量为12的样本,求每个人被抽取的概率.
15、在1000个有机会中奖的号码(000-999)中,按照随机抽取的方法确定最后两位数为88的号码,为中奖号码,这是运用哪种抽样方法?并写出号码。
答案:
一、选择题
1、B 2、A 3、A 4、B 5、A
6、A 7、C 8、B 9、D 10、A 11、C 12、B
二、填空题
13、1个 系统抽样
三、解答题
14、解:用系统抽样法,要先从121中剔除1人,然后将120人分为12组,每组10人,在每组中抽1人,则不被剔除的概率为 120 /121 ,分组后被抽取的概率为 1 /10 ,?
∴ 被抽取的概率为?
15、解:运用剔除4个个体
分段,将总体分为20个部分,其中每一个部分有100个个体
在第一部分中随机抽取一个个体,比如66
这个号码加100得到其他的号码比如,166,266,…………
课件23张PPT。2.1.2 系统抽样问题提出 1.简单随机抽样有哪两种常用方法?其操作步骤分别如何?第二步,将号签放在一个容器中,并搅拌均匀.抽签法:第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.第一步,将总体中的所有个体编号.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.第二步,在随机数表中任选一个数作为起始数.随机数表法: 2.当总体中的个体数很多时,用简单随机抽样抽取样本,操作上并不方便、快捷. 因此,在保证抽样的公平性,不降低样本的代表性的前提下,我们还需要进一步学习其它的抽样方法,以弥补简单随机抽样的不足.简单随机抽样知识探究(一):简单随机抽样的基本思想思考1:某中学高一年级有12个班,每班50人,为了了解高一年级学生对老师教学的意见,教务处打算从年级600名学生中抽取60名进行问卷调查,那么年级每个同学被抽到的概率是多少? 思考2:你能用简单随机抽样对上述问题进行抽样吗?具体如何操作? 思考3:联想到师大附中每学期选派学生评教评学时的做法,你还有什么方法对上述问题进行抽样?你的抽样方法有何优点?体现了代表性和公平性吗?思考4:如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作? 第二步,将总体平均分成60部分,每一部分含10个个体.第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为60的样本.
(如8,18,28,…,598)第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).第一步,将这600件产品编号为1,2,3,…,600.思考5:上述抽样方法称为系统抽样,一般地,怎样理解系统抽样的含义? 将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.知识探究(二):系统抽样的操作步骤 思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?将总体中的所有个体编号.思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理? 先从总体中随机剔除5个个体,再均衡分成60部分.思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?思考4:如果N不能被n整除怎么办? 从总体中随机剔除N除以n的余数个个体后再分段.思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?总体中的个体数N除以样本容量n所得的商. 用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?第四步,按照一定的规则抽取样本.第一步,将总体的N个个体编号.第三步,在第1段用简单随机抽样确定起始个体编号l.第二步,确定分段间隔k,对编号进行分段.思考8:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?总体中个体数比较多;系统抽样更使样本具有代表性. 思考9:我校共有360名老师,为了支持海南的教育事业,现要从中随机抽取40名老师到湖南师大海口中学任教,用系统抽样选取奔赴海南的教师团合适吗?思考10:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法.下列广告中的数据可靠吗?“现代研究证明,99%以上的人皮肤感染有螨虫…….”“……美丽润肤膏,含有多种中药成分,可以彻底清除脸部皱纹,只需10天,就能让你的肌肤得到改善.”“……瘦体减肥灵真的灵,其减肥的有效率为75%.”理论迁移 例1 某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?第一步,随机剔除2名学生,把余下的320名学生编号为1,2,3,…320.第四步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.第三步,在第1部分用抽签法确定起始编号. 第二步,把总体分成40个部分,每个部分有8个个体. 例2一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10组,组号依次为1,2,3,…,10,现用系统抽样抽取一个容量为10的样本,并规定:如果在第一组随机抽取的号码为m,那么在第k(k=2,3,…,10)组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,求该样本的全部号码. 6,18,29,30,41,
52,63,74,85,96. 例3 用简单随机抽样和系统抽样,设计一个调查长沙市城区一年内空气质量状况的方案,并比较哪一种方案更便于实施.2.系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便.小结作业1.系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.作业:
P59练习:1,2,3.
P64习题2.1A组:3.2. 1.3分层抽样教案
【教学目标】
1.通过实例知道分层抽样的概念,意义及分层抽样适用的情景.
2.通过对现实生活中实际问题会用分层抽样的方法从总体中抽出样本,并能写出具体问题的分层抽样的步骤.
3.知道分层抽样过程中总体中的各个个体被抽取的机会相等.
4.区分简单随机抽样?系统抽样和分层抽样,并选择适当正确的方法进行抽样.
【教学重难点】
教学重点: 正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题.
教学难点:应用分层抽样解决实际问题, 并恰当的选择三种抽样方法解决现实生活中的
抽样问题.
【教学过程】
复习回顾.
系统抽样有什么优缺点?它的一般步骤是什么?
答:优点是比简单随机抽样更易操,缺点是系统抽样有规律性,样本有可能代表性很差;
(1)将总体的N个个体编号
(2)确定分段间隔k,对编号进行分段,当(n是样本容量)是整数,取k=; 不是整数时,先从总体中随机的剔除几个个体,使得总体中剩余的个体数能被样本
容量整除.
(3)在第一段用简单随机抽样确定起始个体的编号L(L≤k)
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+k,
再加上k得到第3个个体编号L+2k,这样继续下去,直到获取整个样本.
二.创设情境.
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
答: 高中生2400×1%=24人,初中生10900×1%=109人,小学生11000×1%=110人,作为样本.这样,如果从学生人数这个角度来看,按照这种抽样方法所获得样本结构与这一地区全体中小学生的结构是基本相同的.
三.探究新知.
(一)分层抽样的定义.
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样?
【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复?不遗漏的原则?
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等,即保持样本结构与总体结构一致性?
(二)分层抽样的步骤:
(1)分层:按某种特征将总体分成若干部分?
(2)按比例确定每层抽取个体的个数?
(3)各层分别按简单随机抽样或系统抽样的方法抽取?
(4)综合每层抽样,组成样本?
【说明】
(1)分层需遵循不重复?不遗漏的原则?
(2)抽取比例由每层个体占总体的比例确定?
(3)各层抽样按简单随机抽样或系统抽样的方法进行?
探究交流
(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( )
A?每层等可能抽样
B?每层不等可能抽样
C?所有层按同一抽样比等可能抽样
(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n
样本,那么每个个体被抽到的可能性为 ( )
A. B. C. D.
点拨:
(1)保证每个个体等可能入样是简单随机抽样?系统抽样?分层抽样共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C?
(2)根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选C?
(三)? 简单随机抽样?系统抽样?分层抽样的比较
类 别
共同点
各自特点
联 系
适用范围
简单随机抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部 分,按预先制定的规则在各部分抽取
在起始部分样时采用简随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【例题精析】
例1某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为
A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20
[分析]因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D。
例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程?
[分析]采用分层抽样的方法?
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层?
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本?
300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),
因此各乡镇抽取人数分别为60人?40人?100人?40人?60 人?
(3)将300人组到一起,即得到一个样本?
【说明】若整除不尽采用四舍五入计算.
练一练:
一支田径队有男运动员56人,女运动员42人,用分层抽样的方法从运动员中抽出一个容量为28的样本?
解析:男:女=4:3,由,男生抽取4×4=16(人),女生抽取4×3=12(人)?
【课堂练习】见导学案
【课堂小结】
1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异
要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
【作业布置】导学案
板书设计
一.复习回顾. (三)? 简单随机抽样?系统抽样?分层抽样的比较
系统抽样有什么优缺点? 例题精析
它的一般步骤是什么?例1例2
创设情境. 课堂小结
三.探究新知. 作业布置
(一)分层抽样的定义.
【说明】
(二)分层抽样的步骤:
【说明】
探究交流
点拨
三中数学组 编写人:耿华丽 审稿人: 郭振宇 李怀奎
2.1.3分层抽样
课前预习学案
一.预习目标
1.通过对现实生活中实际问题会用分层抽样的方法从总体中抽出样本,并能写出具体问题的分层抽样的步骤.
2. 区分简单随机抽样?系统抽样和分层抽样,并选择适当正确的方法进行抽样.
二.预习内容
三. 完成下列问题:
1.什么情况下进行分层抽样?应遵循什么要求?步骤有哪些?
2.对于简单随机抽样?系统抽样?分层抽样你能找出哪些异同?
课内探究学案
学习目标
1.通过实例知道分层抽样的概念,意义及分层抽样适用的情景.
2.通过对现实生活中实际问题会用分层抽样的方法从总体中抽出样本,并能写出具体问题的分层抽样的步骤.
3.知道分层抽样过程中总体中的各个个体被抽取的机会相等.
4.区分简单随机抽样?系统抽样和分层抽样,并选择适当正确的方法进行抽样.
重点:灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题.
难点:灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题.
学习过程
一、复习回顾.
系统抽样有什么优缺点?它的一般步骤是什么?
二.创设情境.
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
三.自主学习
(一)分层抽样的定义.
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样?
【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(二)分层抽样的步骤:
探究交流
(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( )
A?每层等可能抽样
B?每层不等可能抽样
C?所有层按同一抽样比等可能抽样
(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n
样本,那么每个个体被抽到的可能性为 ( )
A. B. C. D.
反思:
(三)? 简单随机抽样?系统抽样?分层抽样的比较
类 别
共同点
各自特点
联 系
适用范围
简单随机抽样
系统抽样
分层抽样
四.典型例题
例1某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,
现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为
A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20
反思:
例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程?
反思:
练一练:
一支田径队有男运动员56人,女运动员42人,用分层抽样的方法从运动员中抽出一个容量为28的样本?
五.当堂检测
1.一个公司共有500名员工,下设一些部门,要采用分层抽样的方法从全体员工中抽取一个容量为50人的样本,已知某部门有员工100人,则该部门抽取的员工人数为( )
A.50人 B. 10人 C. 25人 C.5人
2.总体数为M个,其中带有标记的是N,要从中抽取K个入样,用随机抽样的方法进行抽取,则抽取的样本中带有标记的应为( )个
A. NK∕M B.KM∕N C.MN∕K D.N
3.在某班元旦晚会上,现场的一个游戏要求从观众中选出5人参与,下列抽样方法最合适的是( )
A.分层抽样 B.系统抽样 C.抽签法 D.随机数法
4.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老人中剔除1人,然后再分层抽样
5.一个年级有12个班,每个班同学从1~50排学号,为了交流学习经验,要求每班学号为14的同学参加交流活动,这里运用的是什么抽样方法( )
A.分层抽样 B.抽签法 C.随机数法 D.系统抽样
6.某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人.
7.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=
六.反思总结
课后练习与提高
1.下列问题与方法配对正确的是( )
问题⑴某社会团体有500个家庭,其中高收入家庭125个,中等收入家庭280个,低
收入家庭95个,为了了解社会购买力的某项指标,要从中抽取一个容量为100的样本.
问题(2)从10名同学中抽取3人参加座谈会.
方法Ⅰ: 简单随机抽样方法
方法Ⅱ: 系统抽样方法
方法Ⅲ: 分层抽样方法
A(1) Ⅲ,(2)Ⅰ B (1)Ⅰ,(2)Ⅱ C (1)Ⅱ,(2)Ⅲ D(1)Ⅲ,(2)Ⅱ
2.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法从中抽取20人,各年龄阶段各抽取多少人( )
A.7,5,8 B.9,5,6 C.6,5,9 D.8,5,7
3.某班有30名男生。现调查平均身高,已知男女身高有明显不同,用分层抽样法抽出男生3人,女生有2人,则该班女生有( )人
A.15 B.5 C.20 D.10
4.有A,B,C三种零件,分别为a个,300个,b个.采用分层抽样法抽取一个容量为45的样本,A种零件被抽取20个,C种零件被抽取10个,这三种零件共( )个
A.900 B.850 C.800 D.750
15.计划从三个街道20000人中抽取一个200人的样本,现已知三个街道人数之比为2:3:5,采用分层抽样的方法抽取,应分别抽取( )人
A.20,30,150 B.30,35,135 C.40,60,80 D. 40,60,100
6.调查某单位职工健康情况,已知青年人为300,中年人为K,老年人为100,用分层抽样抽取容量为22的样本,已知抽取的青年与老年的人数分别为12和4,那么中年人数K为
7.某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为2:3:5,现用分层抽样方法抽出一个容量为n的样本,样本中型号产品有16件,那么此样本的容量n=
8.某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个容量为36的样本,用分层抽样法应分别从老年人,中年人,青年人中各抽取
人, 人, 人。
9.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法,从这批产品中抽取一个容量为20的样本。
10.对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
任职年限
5年以下
5年至10年
10年以上
人数
300
500
200
试利用上述资料设计一个抽样比为1/10的抽样方法。
当堂检测 B A C D A 8 5 5 2 360
课后练习与提高
D B C A D 150 80 6 12 18;
9. 系统抽样法:将200件产品编号为1~200,然后将编号分为20个部分,在第1部分中用简单随机抽样法取一件产品.如抽到5号,那么得到的20个编号为5号,15号,25号,…,195号的样本.分层抽样法:因为100+60+40=200,20/200=1/10,所以100×1/10=10,60×1/10=6,40×1/10=4.因此在一,二.三级品中分别抽取10件,6件,4件,即得到所需样本.
10.在这个问题中,总体是某单位的1000名职工,并且已经知道人数的总体分布情况,可以用分层抽样法抽取样本。把总体分三层,任职5年以下抽取个体数300/10=30,任职5-10年的抽取个体500/10=50,任职10年以上的抽取个体200/10=20,用系统抽样方法或简单随机抽样方法在各层中抽取以上数目的样本。
课件22张PPT。2.1.3 分层抽样 问题提出 1.系统抽样的基本含义如何?系统抽样的操作步骤是什么? 将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.含义:第二步,确定分段间隔k,对编号进行 分段.步骤:第四步,按照一定的规则抽取样本.第三步,在第1段用简单随机抽样确定起始个体编号l.第一步,将总体的所有个体编号. 2.设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.分层抽样知识探究(一):分层抽样的基本思想思考1:从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少? 某地区有高中生2400人,初中生10800人,小学生11100人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.思考2:从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?样本容量与总体个数的比例为1:100,则
高中应抽取人数为2400*1/100=24人,
初中应抽取人数为10800*1/100=108人,
小学应抽取人数为11100*1/100=111人.思考3:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?思考4:在上述抽样过程中,每个学生被抽到的概率相等吗?思考5:上述抽样方法不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.一般地,分层抽样的基本思想是什么? 若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.思考6:若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?高中生8人,初中生36人,小学生37人.知识探究(一):分层抽样的操作步骤 某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本.思考1:该项调查应采用哪种抽样方法进行?思考2:按比例,三个年龄层次的职
工分别抽取多少人?35岁以下25人,35岁~49岁56人,
50岁以上19人.思考3:在各年龄段具体如何抽样?怎样获得所需样本?思考4:一般地,分层抽样的操作步骤如何?第一步,计算样本容量与总体的个体数之比.第四步,将各层抽取的个体合在一起,就得到所取样本.第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.思考5:在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何计算?思考6:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理? 调节样本容量,剔除个体. 思考7:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,根据下表,你能对三种抽样方法作一个比较吗?简单随
机抽样系统
抽样分层
抽样抽样过程中每个个体被抽取的概率相等将总体分成均衡几部分,按规则关联抽取将总体分成几层,按比例分层抽取用简单随机抽样抽取起始号码总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成从总体中逐个不放回抽取用简单随机抽样或系统抽样对各层抽样 例1 某公司共有1000名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容量为80的样本,已知策划部被抽取4个员工,求策划部的员工人数是多少?50人.理论迁移 例2 某中学有180名教职员工,其中教学人员144人,管理人员12人,后勤服务人员24人,设计一个抽样方案,从中选取15人去参观旅游.
用分层抽样,抽取教学人员12人,管理人员1人,后勤服务人员2人. 例3 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,完成这两项调查宜分别采用什么方法?①用分层抽样,②用简单随机抽样.例4 某地区中小学生人数的分布情况如下表所示(单位:人):请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
例4 某地区中小学生人数的分布情况如下表所示(单位:人):请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案. 例4 某地区中小学生人数的分布情况如下表所示(单位:人):小结作业2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.作业:
P64习题2.1A组:5,6.2.1 随机抽样
一、选择题
1、在简单随机抽样中,某一个个体被抽到的可能性
A、与第n次有关,第一次可能性最大
B、与第n次有关,第一次可能性最小
C、与第n次无关,与抽取的第n个样本有关
D、与第n次无关,每次可能性相等
2、对于简单随机抽样,每次抽到的概率( )
A、相等 B、不相等 C、可相等可不相等 D、无法确定
3、一个年级有12个班,每个班从1-50排学号,为了交流学习经验,要求每班的14参加交流活动,这里运用的抽样方法是( )
A、简单随抽样 B、抽签法 C、随机数表法 D、以上都不对
4、搞某一市场调查,规定在大都会商场门口随机抽一个人进行询问调查,直到调查到事先规定的调查人数为止,这种抽样方式是( )
A、系统抽样 B、分层抽样
C、简单随机抽样 D、非以上三种抽样方法
5、为了了解所加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )
A、总体 B、个体 C、总体的一个样本 D、样本容量
6、为了分析高三年级的8个班400名学生第一次高考模拟考试的数学成绩,决定在8个班中每班随机抽取12份试卷进行分析,这个问题中样本容量是( )
A、 8 B、400 C、96 D 、96名学生的成绩
二、填空题
7、为了了解某次数学竞赛中1000名学生的成绩,从中抽取一个容量威100的样本,则每个个体被抽到的概率是________
8、在统计学中所有考察的对象的全体叫做________其中_________叫做个体_____________叫做总体的一个样本,___________叫做样本容量
9、一般的设一个总体的个体数为N ,则通过逐个抽出的方法从中抽取一个样本,且每次抽取到的各个个体的概率相等 ,这样的抽样为____________________
10、实施简单抽样的方法有________、____________
11、一般的,如果从个体数为N样本中抽取一个容量为n的样本,那么每个个体被抽到的概率是__________________
三、解答题
12、从20名学生中 要抽取5名进行问卷调查,写出抽样过程
13、某个车间的工人已加工一种轴100件。为了了解这种轴的直径,要从中抽出10件在同一条件下测量,如何用简单随机抽样的方法得到样本?
14、一个总体中含有4个个体,从中抽取一个容量为2的样本,说明为什么在抽取过程中每个个体被抽取的概率都相等.
15、为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本。
参考答案
一、选择题
1、D 2、A 3、C 4、D 5、A 6、B
二、填空题
7、8、全体,每个对象,被抽取的对象,样本的个数9、简单随机抽样10、抽签法、随机数表法11、
三、解答题
12、
1)编号1到20
2)写号签
3)搅拌后逐个抽取 5个
13、
1)编号1到100
2)写号签
3)搅拌后逐个抽取10个
14、解:从总体中抽取第1个个体时,其中的任一个体a被抽取的概率;
从总体中第2次抽取个体时正好抽到a,就是个体a第1次未被抽到,而第2次被抽到的概率是;
根据相互独立事件同时发生的概率公式,个体a第2次被抽到的概率
个体a第1次被抽到与第2次被抽到是互斥事件,根据互斥事件的加法公式,在先后抽取2个个体的过程中,个体a被抽到的概率
由于a的任意性,说明在抽样过程中每个个体被抽到的概率都相等(都等于).
事实上:用简单随机抽样的方法从个体数为N的总体中逐次抽取一个容量为的样本,那么每次抽取时各个个体被抽到的概率相等,依次是,且在整个抽样过程中每个个体被抽到概率都等于。
15、可以按下面的步骤进行:
第一步,先将40件产品编号,可以编为00,01,02,,38,39。
第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是
16 19 10 12 07 39 38 33 21 34
注 将总体中的N个个体编号时可以从0开始,例如N=100时编号可以是00,01,02,
99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。
当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。
高中数学必修三学案:2.1.2系统抽样
学习目标
1. 正确理解系统抽样的概念;
2. 掌握系统抽样的一般步骤;
3. 正确理解系统抽样与简单随机抽样的关系;
学习过程
一、课前准备
1.当总体中的个体数较多时,可将总体分成 的几个部分,然后预先制定的规则,从每一部分 ,得到所需要的样本,这样的抽样叫系统抽样.
2.系统抽样的步骤:
(1)先将总体中的N个体 .
(2)确定分段的间隔,对整个的编号进行分段。当是整数时, ;当不是整数时,通过从总体中剔除些个体使剩下的总体中的个体能被n整除,这时 .
(3)在第一段用 确定起始的个体编号.
(4)按照事先确定的规则(将加上间隔)抽取样本:, ,
二、新课导学
※ 探索新知
新知1:系统抽样的定义:
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
说明:由系统抽样的定义可知系统抽样有以下特征:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[].
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考?(1)你能举几个系统抽样的例子吗?
(2)下列抽样中不是系统抽样的是( )
A.从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈.
点拨:C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。
新知2:系统抽样的一般步骤。
(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).
(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
说明:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。
※ 典型例题
例1 某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
例2 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )
A.5,10,15,20,25 B. 3,13,23,33,43
C.1,2,3,4,5 D. 2,4,6,16,32
※ 动手试试
练1.某批产品共有1563件,产品按出厂顺序编号,号码为从1——1563.检测员要从中抽取15件产品作检测,请给出一个系统抽样方案.
练2.下列抽样试验中,最适宜用系统抽样的是( )
A.从某厂生产的15件产品中随机抽取5件入样
B.从某厂生产的1 000件产品中随机抽取10件入样
C.从某厂生产的1 000件产品中随机抽取100件入样
D.搞某一市场调查,规定在商场门口随机抽一个人进行询问调查,直到调查到事先规定调查人数为止
三、总结提升
1.在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
(1)采用随机的方法将总体中个体编号;
(2)将整体编号进行分段,确定分段间隔k(k∈N);
(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;
(4)按照事先预定的规则抽取样本。
2.在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
学习评价
1.为了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( )
A.40 B.30 C.20 D.12
2.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目( )
A.2 B.4 C.5 D.6
3.用系统抽样的方法从个体数为1003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性为( )
A.1/1000 B.1/1003 C.50/1003 D.50/1000
4.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,第一部分随机抽取一个号码为0015,则抽取的第40个号码为____________
课后作业
1.从学号为1~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )
A.1,2,3,4,5 B. 5,16,27,38,49
C.2, 4, 6, 8, 10 D. 4,13,22,31,40
2.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为 ( )
A.1/8 B.10/83 C.10/85 D.1/9
3.某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。
4.中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样方法抽取,其组容量为( )
A.10 B.100 C.1000 D.10000
2-1-3分层抽样
一、选择题
1.①教育局到某学校检查工作,打算在每个班各抽调2人参加座谈;②某班其中考试有10人在85分以上,25人在60~84分,5人不及格,欲从中抽出8人参加改进教与学研讨;③某班级举行元旦晚会,要产生两名“幸运者”,则合适的抽样方法分别为( )
A.系统抽样,系统抽样,简单随机抽样
B.简单随机抽样,分层抽样,简单随机抽样
C.系统抽样,分层抽样,简单随机抽样
D.分层抽样,简单随机抽样,简单随机抽样
[答案] C
2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法依次为( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
[答案] B
[解析] 由调查①可知个体差异明显,故宜用分层抽样;调查②中个体较少,故宜用简单随机抽样.
3.某工厂为了检查产品质量,在生产流水线上每隔5分钟就取一件产品,这种抽样方法是( )
A.抽签法 B.简单随机抽样
C.系统抽样 D.随机数法
[答案] C
[解析] 由于生产流水线均匀生产出产品,且所拿出的产品中每相邻的两件的“间隔”是相同的,所以是系统抽样,故选C.
4.下列问题中,最适合用简单随机抽样方法的是( )
A.某电影院有32排座位,每排有40个座位,座位号1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8 000公顷,丘陵12 000公顷,平地24 000公顷,洼地4 000公顷,现抽取农田480公顷估计全乡农田平均产量
[答案] B
[解析] 根据简单随机抽样的特点进行判断.A的总体容量较大,用简单随机抽样法比较麻烦,易用系统抽样 ;B的总体容量较小,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法,宜用分层抽样;D总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法,宜用分层抽样.
[点评] 解答本题时,应关注两个方面的问题:(1)抽出的样本必须准确地反映总体特征;(2)操作起来比较方便.
5.某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是( )
A.8,8 B.10,6
C.9,7 D.12,4
[答案] C
[解析] 抽样比为=,则一班和二班分别被抽取的人数是54×=9,42×=7.
6.某学校高一、高二、高三三个年级共有学生3500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )
A.8 B.11
C.16 D.10
[答案] A
[解析] 若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3 500,解得x=1 600.故高一学生数为800,因此应抽取的高一学生数为=8.
7.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8
C.10 D.12
[答案] B
[解析] 设在高二年级学生中抽取的人数为x,则=,解得x=8.
8.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
[答案] B
[解析] 由题意知,青年职工人数?中年职工人数?老年职工人数=350:250:150=7:5:3.由样本中的青年职工为7人,得样本容量为15.
9.100个个体分成10组,编号后分别为第一组:00,01,02,03,…09;第二组:10,11,12,…,19;……;第十组:90,91,92,…,99.现在从第k组中抽取其号码的个位数字与(k+m-1)的个位数字相同的个体,其中m是第一组随机抽取的号码的个位数字,则当m=5时,从第七组中抽取的号码是( )
A.71 B.61
C.75 D.65
[答案] B
[解析] 第七组中的10个号码分别为60,61,62,63,64,65,66,67,68,69,我们会发觉十位数字都是6,只需确定个位数字即可.由题设可知个位数字与7+5-1=11的个位数字相同,故被抽取的号码是61.
10.某单位有老年人28人,中年人54人,青年人81人.为了调查它们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老年人中剔除1人,再用分层抽样
[答案] D
[解析] 总体总人数为28+54+81=163(人).样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36:163取样本,无法得到整解.故考虑先剔除1人,抽取比例变为36:162=2:9.则中年人取54×=12(人),青年人取81×=18(人),先从老年人中剔除1人,老年人取27×=6(人),组成容量为36的样本.
二、填空题
11.某地区有农民、工人、知识分子家庭共计2004户,其中农民家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上)
①简单随机抽样 ②系统抽样 ③分层抽样
[答案] ①②③
[解析] 为了保证抽样的合理性,应对农民、工人、知识分子分层抽样;在各层中采用系统抽样和简单随机抽样.抽样时还要先用简单随机抽样剔除多余个体.
12.防疫站对学生进行身体健康调查.红星中学共有学生1600名,采用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是________.
[答案] 760
[解析] 设该校的女生人数是x,则男生人数是1 600-x,抽样比是=,则x=(1 600-x)-10,解得x=760.
13.某地有居民100000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
[答案] 5.7%
[解析] 该地拥有3套或3套以上住房的家庭可以估计有99 000×+1 000×=5 700户,所以所占比例的合理估计是5 700÷100 000=5.7%.
14.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
[答案] 37 20
[解析] 由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第8组抽出的号码为22+(8-5)×5=37.
40岁以下年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20人.
三、解答题
15.某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人.为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.怎样抽取样本?
[分析] 由于是研究血型与色弱的关系,因此应按血型分层,用分层抽样抽取样本.
[解析] 用分层抽样抽取样本.
∵=,即抽样比为,
∴200×=8,125×=5,50×=2.
故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.
抽样步骤:
(1)确定抽样比.
(2)按比例分配各层所要抽取的个体数,O型血抽取8人,A型血抽取5人,B型血抽取5人,AB型血抽取2人.
(3)用简单随机抽样分别在各种血型的人数中抽取样本,直至抽取出容量为20的样本.
16.一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
[分析] 采用分层抽样的方法.
[解析] 因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层抽样的方法.具体过程如下:
(1)将3万人分成5层,一个乡镇为一层.
(2)按照各乡镇的人口比例随机抽取各乡镇的样本:
300×=60(人),300×=40(人),
300×=100(人),300×=40(人),
300×=60(人).
各乡镇分别用分层抽样抽取的人数分别为60,40,100,40,60.
(3)将抽取的这300人组到一起,即得到一个样本.
17.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人)
高校
相关人数
抽取人数
A
x
1
B
36
y
C
54
3
(1)求x,y;
(2)若从高校B相关的人中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.
[解析] (1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有:=?x=18,=?y=2,故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机的编号,号码为1,2,3,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.
18.为了考察某校的教学水平,将对这个学校高三年级的部分学生的本学年考试成绩进行考察,为了全面地反映实际情况,采取以下三种方式进行抽查:(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同)
(1)从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;
(2)每个班都抽取1人,共计20人,考察这20个学生的成绩;
(3)把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察.(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人)
根据上面的叙述,试回答下列问题.
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用何种抽取样本的方法?
(3)试分别写出上面三种抽取方式各自抽取样本的步骤.
[分析] 本题目主要考查数理统计中一些基本的概念和基本方法.做这种题目时,应该注意叙述的完整和条理.
[解析] (1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.
(2)上面三种抽取方式中,第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法.
(3)第一种方式抽样的步骤如下:
第一步,首先在这20个班中用抽签法任意抽取一个班.
第二步,然后从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.
第二种方式抽样的步骤如下:
第一步,首先在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为a.
第二步,在其余的19个班中,选取学号为a的学生,共计19人.
第三种方式抽样的步骤如下:
第一步,分层.
因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.
第二步,确定各个层次抽取的人数.
因为样本容量与总体魄个体数比为:100:1 000=1:10,所以在每个层次抽取的个体数依次为,,,即15,60,25.
第三步,按层次分别抽取:
在优秀生中用简单随机抽样法抽取15人;
在良好生中用系统抽样法抽取60人;
在普通生中用简单随机抽样法抽取25人.
高中数学必修三学案:2.1.3分层抽样
学习目标
1.正确理解分层抽样的概念.
2.掌握分层抽样的一般步骤.
3.能选择适当正确的方法进行抽样.
学习过程
一、课前准备
1.将总体分成_______的层,然后按照 ,从各层独立地抽取 ,将各层抽取的_______作为样本,这种抽样方法叫做_______.
2.分层抽样的步骤:
(1)将总体按一定 的进行分层;
(2)计算各层中 与 的比;
(3)按各层 确定各层应抽取的个体数量;
(4)在每层进行抽样,组成样本.
二、新课导学
※ 探索新知
新知1:分层抽样的定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
说明:应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
新知2:分层抽样的步骤:
(1)分层:按某种特征将总体分成若干部分。
(2)按比例确定每层抽取个体的个数。
(3)各层分别按简单随机抽样的方法抽取。
(4)综合每层抽样,组成样本。
说明:(1)分层需遵循不重复、不遗漏的原则。
(2)抽取比例由每层个体占总体的比例确定。
(3)各层抽样按简单随机抽样进行。
思考:1.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行( )
A.每层等可能抽样 B.每层不等可能抽样
C.所有层按同一抽样比等可能抽样
2.如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为( )
A. B. C. D.
新知3 :简单随机抽样、系统抽样、分层抽样表
类 别
共同点
各自特点
联 系
适 用
范 围
简 单
随 机
抽 样
(1)抽样
过程中每
个个体被
抽到的可
能性相等
(2)每次
抽出个体
后不再将
它放回,即
不放回抽样
从总体中逐个抽取
总体个数较少
将总体均分成几部分,按预先制定的规则在各部分抽取
在起始部分
样时采用简
随机抽样
总体个数较多
系 统
抽 样
将总体分成几层,
分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
分 层
抽 样
※ 典型例题
例1 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20
例2 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 .若用分层抽样方法,则40岁以下年龄段应抽取 人
※ 动手试试
练1.一电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
很喜爱
喜爱
一般
不喜爱
3000
3600
4000
1400
打算从中抽取60人进行详细调查,如何抽取?
练2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2).则完成(1)、(2)这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
三、总结提升
1.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2.分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
学习评价
※ 当堂检测
1.某单位有老年人45人,中年人55人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.先从老人中剔除1人,然后再分层抽样
2.某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。
3.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=
4.上海大众汽车厂生产了A、B、C三种不同型号的小轿车,产量分别1 200辆、6 000辆、2 000辆,为检验这三种型号的轿车质量,现在从中抽取46辆进行检验,那么应采用___________抽样方法,其中B型号车应抽查__________辆.
课后作业
1.某商场有四类商品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油与果蔬类食品种数之和是
A.4 B.5 C.6 D.7
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为
A.7 B. 15 C. 25 D.35
3.一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是
A.12,24,15,9 B. 9,12,12,7
C.8,15,12,5 D.8,16,10,6
4.某工厂生产A、B、C三种不同型号的产品,产品数量之比为2:3:5,现用分层抽样方法抽取一个容量为n的样本,样本中A型产品有16种,那么此样本容量n=_____.
课件37张PPT。目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出目录 退出2-2-1用样本的频率分布估计总体分布
一、选择题
1.下列关于频率分布直方图的说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
2.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )
A.10组 B.9组
C.8组 D.7组
[答案] B
[解析] 根据列频率分布表的步骤,==8.9.所以分为9组较为恰当.
3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是( )
A.14和0.14 B.0.14和14
C.和0.14 D.和
[答案] A
[解析] 第三组的频数为100-(10+13+14+15+13+12+9)=14,频率为=0.14,故选A.
4.在频率分布直方图中,中位数两侧的面积和所占比例为( )
A.1:3 B.2:1
C.1:1 D.不确定
[答案] C
[解析] 因为频率分布直方图中面积是频率,中位数左右两边的频数是相等的,所以频数一定的情况下,频数同时除以组距也是相等的,即频率是相等的,所以面积比为1?1.
5.根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据有关报道,2009年8月15日至8月28日,某地区查处酒后驾车和醉酒驾车共500人,如图是对这500人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为( )
A.25 B.50
C.75 D.100
[答案] C
[解析] 醉酒驾车的人血液酒精浓度在80 mg/100 mL(含80)以上,在频率分布直方图中可知酒精含量在80 mg/100 mL(含80)以上的频率为(0.01+0.005)×10=0.15,则属于醉酒驾车的人数约为0.15×500=75人.
6.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )
A.30辆 B.40辆
C.60辆 D.80辆
[答案] C
[解析] 车速大于或等于70 km/h的汽车数为0.02×10×300=60(辆),故选C.
7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:根据下图可得这100名学生中体重在[56.5,64.5)的学生人数是( )
A.20 B.30
C.40 D.50
[答案] C
[解析] 由频率分布直方图知体重在[56.5,64.5]的人数为(0.03+0.05×2+0.07)×2×100=40
8.某超市连锁店统计了城市甲、乙的各16台自动售货机在中午12?00至13?00间的销售金额,并用茎叶图表示如图.则有( )
A.甲城销售额多,乙城不够稳定
B.甲城销售额多,乙城稳定
C.乙城销售额多,甲城稳定
D.乙城销售额多,甲城不够稳定
[答案] D
[解析] 十位数字是3、4、5时乙明显多于甲,估计乙销售额多,甲的数字过于分散,不够稳定,故选D.
9.根据《中华人民共和国道路交通完全法》规定:车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《福州晚报》报道,2011年6月15日至6月30日,全市查处酒后驾车和醉酒驾车共2480人,如图是对这2480人血液中酒精含量进行检测所得结果的频率分布直方图,则属于酒后驾车的人数约为( )
A.372 B.1 984
C.2 108 D.2 480
[答案] C
[解析] 由频率分布直方图得酒后驾车的频率为(0.015+0.02×2+0.015+0.01+0.05)×10=0.85,所以属于酒后驾车的人数2480×0.85=2108.
10.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )
A.64 B.54
C.48 D.27
[答案] B
[解析] 前三级人数为100-62=38,第三组人数为38-(1.1+0.5)×0.1×100=22,则a=22+0.32×100=54.
二、填空题
11.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)
[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
12.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.
[答案] 84.2分 85分
[解析] 甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
13.某小学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图,3000名学生在该次数学考试中成绩小于60分的学生数是________.
[答案] 600
[解析] 在该次数学考试中成绩小于60分的共有3组,频率之和为0.02+0.06+0.12=0.2,所以在该次数学考试中成绩小于60分的学生数大约为3 000×0.2=600.
14.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.
[答案] 4
[解析] 通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.
三、解答题
15.一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75~6.05 cm之间的麦穗在这批麦穗中所占的百分比.
[分析] 依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在5.75~6.05 cm之间的麦穗在这批麦穗中所占的百分比.
[解析] 步骤是:
(1)计算极差,7.4-4.0=3.4(cm).
(2)决定组距与组数.
若取组距约为0.3 cm,由于=11,需分成12组,组数合适.于是取定组距为0.3 cm,组数为12.
(3)将数据分组.
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.哪么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表.
对各个小组作频数累计,然后数频数,算频率,列频率分布表.如下表所示:
分组
频数累计
频数
频率
3.94~4.25
1
0.01
4.25~4.55
1
0.01
4.55~4.85
2
0.02
4.85~5.15
正
5
0.05
5.15~5.45
正正
11
0.11
5.45~5.75
正正正
15
0.15
5.75~6.05
正正正正正
28
0.28
6.05~6.35
正正
13
0.13
6.35~6.65
正正
11
0.11
6.65~6.95
正正
10
0.10
6.95~7.25
2
0.02
7.25~7.55
1
0.01
合计
100
1.00
(5)画频率分布直方图,如图所示.
从表中看到,样本数据落在5.75~6.05之间的频率是0.28,于是可以估计,在这块地里,长度在5.75~6.05 cm之间的麦穗约占28%.
[点评] 本题画频率分布直方图时,小长方形的高易错用该组的频率的大小来表示.其原因是不清楚频率分布直方图纵轴的意义.由于画频率分布直方图的步骤比较繁琐,因此在实际操作的过程中要有足够的耐心.
16.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8?00~10?00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
[解析] (1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
17.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确
的人数
回答正确的人数
占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2,3,4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).
18.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录上上午8?00~11?00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
[解析] 方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
高中数学必修三学案:2.2.1用样本的频率分布估计总体分布
学习目标
1.通过实例体会分布的意义和作用。
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
学习过程
一、课前准备
1.频率分布表
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映 的表格称为频率分布表。
2.绘制频率分布直方图的一般步骤为:
(1)计算 ,即一组数据中最大值与最小值的差;
(2)决定 ;①组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出来.
②组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组.
③组距的选择.组距= ,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同).
(3)将______________________________;
(4)列 ;一般为四列:分组、频数累计、频数、频率最后一行是合计,其中频数合计应是 ,频率合计是_____________.
(5)画频率分布直方图.为将频率分布直方图中的结果直观形象的表示出来,画图时,应以横轴表示分组,纵轴表示 ,其相应组距上的频率等于该组上的长方形的面积,即每个 ,且各小长方形的面积的总和等于 。
3.频率分布折线图
连接频率分布直方图中 的中点,就得到频率分布折线图。
4.总体密度曲线
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的 图会越来越接近于一条 ,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比。
5.茎叶图
当样本数据 时,用茎叶图表示数据效果较好,它不但可以便于记录,而且统计图上没有原始数据的损失,所有的数据都可以从茎叶图中得到。
画茎叶图的步骤:
⑴将数据分为“茎”(高位)和 “叶”(低位)两部分.
⑵将最小茎和最大茎之间的数按大小次序排成一列.
⑶将数据的“叶”按大小次序写在其茎右(左)侧。
二、新课导学
※ 探索新知
新知1:频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。
其一般步骤为:
①计算一组数据中最大值与最小值的差,即求极差。
②决定组距与组数。
③将数据分组。
④列频率分布表。
⑤画频率分布直方图。
频率分布直方图的特征:
①从频率分布直方图可以清楚的看出数据分布的总体趋势。
②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉。
新知2:频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
2.总体密度曲线的定义:
在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本P60)
新知3:茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P61例子)
2.茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
※ 典型例题
例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm).试作出该样本的频率分布表.
168
165
171
167
170
165
170
152
175
174
165
170
168
169
171
166
164
155
164
158
170
155
166
158
155
160
160
164
156
162
160
170
168
164
174
171
165
179
163
172
180
174
173
159
163
172
167
160
164
169
151
168
158
168
176
155
165
165
169
162
177
158
175
165
169
151
163
166
163
167
178
165
158
170
169
159
155
163
153
155
167
163
164
158
168
167
161
162
167
168
161
165
174
156
167
166
162
161
164
166
例2 从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最后边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少? (2)列出频率分布表;
(3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率;
(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.
例3 某中学高一(1)班甲、乙两名同学自高中以来每场数学考试成绩如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.
※ 动手试试
练 P71 练习 1. 2. 3
三、总结提升
1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。
2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
学习评价
※ 当堂检测
1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n的值为
A. 640 B.320 C.240 D. 160
2.对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是(?? )
A.频率分布折线图与总体密度曲线无关??
B. 频率分布折线图就是总体密度曲线
C.样本容量很大的频率分布折线图就是总体密度曲线
D. 如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线
3.一个容量为32的样本,已知某组样本的频率为0.0625,则该组样本的频数为
A . 2 B.4 C.6 D.8
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5, 64.5) kg的学生人数是( )
A .20 B.30 C.40 D.50
5.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于 .
课后作业
有一种鱼的身体吸收汞,汞的含量超过体重的1.00ppm(即百万分之一)时就会对人体产生危害,在30条鱼的样本中发现的汞含量是:
0.07
0.24
0.95
0.98
1.02
0.98
1.37
1. 40
0.39
1.02
1.44
1.58
0.54
1.08
0.61
0.72
1.20
1.14
1.62
1.68
1.85
1.20
0.81
0.82
0.84
1.29
1.26
2.10
0.91
1.31
(1)用前两位数作为茎,画出样本数据的茎叶图。
(2)描述一下汞含量的分布特点。
(3)从实际情况看,许多鱼的汞含量超标在于有些鱼在出售之前没有被检测过,每批这种鱼的汞含量都比1.00ppm大吗?
(4)求出上述样本数据的平均数和样本标准差。
(5)有多少条鱼的汞含量在平均数与2倍标准差的和(差)的范围内?
课件28张PPT。2.2.2 用样本的数字特征估计 总体的数字特征1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
2. 理解用样本的基本数字特征来估计总体的基本数字特征.(难点)
3.会应用相关知识来解决简单的统计问题.(重点)1.对一个未知总体,我们常用样本的频率分布来估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
图、表
总体数据的数字特征 2.美国NBA在2006~2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29.
如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征来估计总体的数字特征. 1.众数的定义: 在一组数据中,出现次数最多的数据叫做这一组数据的众数.2.中位数的定义: 将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.3.平均数的定义:一组数据的和除以数据的个数所得到的数.思考1:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的中心点?众数、中位数、平均数月均用水量/t频率/组距0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?
每个小矩形的面积即为所在组的频率,中位数左边和右边的直方图的面积应该相等.从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.
0.5-0.04-0.08-0.15-0.22=0.01,
0.5×(0.01÷0.25)=0.02,所以中位数是2.02. 月均用水量/t0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 o频率/组距思考4:平均数是频率分布直方图的“重心”,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计平均数. 由此估计总体的平均数是什么?
各小矩形底边中点的横坐标为:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.
各小矩形的面积为:0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02.月均用水量/t0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 o频率/组距0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+
2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+
4.25×0.02=2.02(t).
所以平均数是2.02.
平均数与中位数相等,是必然还是巧合?
巧合思考5:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得的估计值与数据分组有关.
注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.思考6:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.
平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
甲、乙两人本次射击的平均成绩分别为多少环?标准差思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布直方图,你能说明其水平差异在哪里吗?
甲的成绩比较分散,极差较大;
乙的成绩相对集中,比较稳定.环数频率0.4
0.3
0.2
0.14 5 6 7 8 9 10 O(甲)环数频率0.4
0.3
0.2
0.14 5 6 7 8 9 10 O(乙)思考3:对于样本数据x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算? 含有绝对值,运算不方便.思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,…,xn的平均数为 ,则标准差的计算公式是:
那么标准差的取值范围是什么?标准差为0的样本数据有何特点?
s≥0,标准差为0的样本数据都相等. 计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
s甲=2,s乙≈1.095. 例1 画出下列四组样本数据的条形图,
说明它们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;解:(1)(2)(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.(3)(4)例2 甲乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):
甲:
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39
乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48
从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
说明:生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.1.10名工人某天生产同一零件,生产的件数分别是15,
17,14,10,15,19,17,16,14,12,则这一天 10名工
人生产的零件的中位数是( )
(A)14 (B)16 (C)15 (D)17
【解析】选C.把件数从小到大排列为10,12,14,14,15,15,16,17,17,19,可知中位数为15.C2.某射击运动员在四次射击中分别打出了10,x,10,8环的成绩,已知这组数据的平均数为9,则这组数据的方差是______.
【解析】由9= 得x=8.
故s2= [(10-9)2+(8-9)2+(10-9)2+(8-9)2]
= ×4=1.
答案:13.甲、乙两个班各随机选出
15名同学进行测验,所得成
绩的茎叶图如图.从图中看,
_____班的平均成绩较高.
【解析】结合茎叶图中成绩
的情况可知,乙班平均成绩较高.
答案:乙4.(2012·济南高一检测)统计某校1 000名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于60分为及格,不低于80分为优秀,则及格人数是______;优秀率为______.【解析】由已知不低于60分及格,则及格的频率为
0.025×10+0.035×10+0.01×20
=0.25+0.35+0.2=0.8.
∴及格的人数为1 000×0.8=800.
不低于80为优秀,则优秀的频率为0.01×20=0.2.
∴优秀率为20%.
答案:800 20%1.样本的数字特征:众数、中位数和平均数.2.用样本频率分布直方图估计样本的众数、中位数和平均数.(1)众数规定为频率分布直方图中最高矩形上端的中点.(2)中位数两边的直方图的面积相等.(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.2-2-2用样本的数字特征估计总体的数字特
一、选择题
1.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是( )
A.因为他们平均分相等,所以学习水平一样
B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正
C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定
D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低
[答案] C
2.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
[答案] D
3.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
[答案] D
4.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出次品数分别为甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则从平均数考试,甲、乙两台机器出次品数较少的为( )
A.甲 B.乙
C.相同 D.不能比较
[答案] B
[解析] 甲=(0+1+0+2+…+4)=1.5,
乙=(2+3+…+1)=1.2.
乙<甲.
5.已知一个样本中含有5个数据3,5,7,4,6,则样本方差为( )
A.1 B.2
C.3 D.4
[答案] B
[解析] ==5,
则方差s2=[(3-5)2+(5-5)2+(7-5)2+(4-5)2+(6-5)2]=2.
6.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )
A.63 B.64
C.65 D.66
[答案] A
[解析] 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.
7.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s2>s3>s1
[答案] B
8.某市在非典期间一手抓防治非典,一手抓经济发展,下表是利群超市5月份一周的利润情况记录:
日期
12日
13日
14日
15日
16日
17日
18日
当日利润(万元)
0.20
0.17
0.23
0.21
0.23
0.18
0.25
根据上表你估计利群超市今年五月份的总利润是( )
A.6.51万元 B.6.4万元
C.1.47万元 D.5.88万元
[答案] A
[解析] 从表中一周的利润可得一天的平均利润为
=
=0.21.又五月份共有31天,
∴五月份的总利润约是0.21×31=6.51(万元).
9.甲、乙两个数学兴趣小组各有5名同学,在一次数学测试中,成绩统计用茎叶图表示,如图所示.若甲、乙小组的平均成绩分别是甲、乙,则下列结论正确的是( )
A.甲>乙,甲比乙成绩稳定
B.甲>乙,乙比甲成绩稳定
C.甲<乙,甲比乙成绩稳定
D.甲<乙,乙比甲成绩稳定
[答案] A
[解析] 根据茎叶图可知,甲组5名同学的成绩分别是88,89,90,91,92,乙组5名同学的成绩分别是83,84,88,89,91,可得甲=90,乙=87,故有甲>乙;s=2,s=9.2,故有s>s,所以甲比乙的成绩稳定,所以选A.
10.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为( )
A.46 B.36
C.56 D.60
[答案] A
[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考虑总成绩为40+240+500+420+180=1 380,平均数==46.
二、填空题
11.已知样本101,100,99,a,b的平均数为100,方差为2,这个样本中的数据a与b的取值为________.
[答案] 102,98或98,102
[解析] 由题设知,
∴或.
12由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
[答案] 1,1,3,3
[解析] 不妨设x1≤x2≤x3≤x4,
得:x2+x3=4,x1+x2+x3+x4=8?x1+x4=4
s2=1?(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4?
①如果有一个数为0或4;则其余数为2,不合题意; ②只能取|x1-2|=1;得:这组数据为1,1,3,3.
13.某班50名学生右眼视力的检查结果如下表所示:
视力
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
1.0
1.2
1.5
人数
1
1
3
4
3
4
4
6
8
10
6
则该班学生右眼视力的众数为________,中位数为________.
[答案] 1.2 0.8
14.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图所示,则该组数据的方差为________.
[答案] 5
[解析] 由茎叶图可知,该篮球运动员6场比赛的得分分别是14,17,18,18,20,21,得分的平均数==18,根据方差公式得s2=[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.
三、解答题
15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
(1)甲、乙的平均成绩谁最好?
(2)谁的各门功课发展较平衡?
[解析] (1)甲=(60+80+70+90+70)=74,
乙=(80+60+70+80+75)=73,
故甲的平均成绩较好.
(2)s=[(60-74)2+(80-74)2+(70-74)2+(90-74)2+(70-74)2]=104,
s=[(80-73)2+(60-73)2+(70-73)2+(80-73)2+(75-73)2]=56,
由s>s,知乙的各门功课发展较平衡.
16.某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)完成所附的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解析] (1)
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了的展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
17.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
[分析] (1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.
[解析] (1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.
但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
18.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为1:1:3:6:4:2,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:
(1)样本容量是多少?
(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.
(3)估计这次数学竞赛成绩的众数、中位数和平均数.
[解析] (1)从左到右各小组的频率分别为,,,,,
样本容量为=68.
(2)成绩落在70~80之间的人数最多;频率为;频数为68×=24.
(3)众数的估计值是75,中位数的估计值是
70+×10
=≈75.83.
平均数的估计值是
×45+×55+×65+×75+×85+×95=75.
高中数学必修三学案:2.2.2用样本的数字特征估计总体的数字特征
学习目标
1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
3.会用样本的基本数字特征估计总体的基本数字特征。
学习过程
一、课前准备
1.预习众数、中位数、平均数的概念。
2.标准差、方差的概念。
(1).数据的离散程度可用极差、 、 来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的数据为,样本的平均数为,则定义
,表示方差。
(2).为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根
= ,表示样本标准差。不要漏写单位。
3.如何从频率分布直方图中估计众数、中位数、平均数呢?
①众数: 。
②中位数: 。
③平均数: 。
二、新课导学
※ 探索新知
新知1:众数、中位数、平均数
(1)众数:一组数据中重复出现次数最多的数称为这组数的众数.
(2)中位数:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数.
当数据个数为奇数时,中位数是按从小到大的顺序排列中间的那个数.
②当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的两个数的平均数.
(3)平均数:如果有n个数,那么
叫这n个数的平均数.
新知2:标准差、方差
1.标准差
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。样本数据的标准差的算法:
算出样本数据的平均数。
算出每个样本数据与样本
算出②中的平方。
算出③中n个平方数的平均数,即为样本方差。
算出④中平均数的算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
思考:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
1.从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。
2.方差
从数学的角度考虑,人们有时用标准差的平方s2(即方差)来代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
※ 典型例题
例1 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
.
例2若的平均数为8,方差为3,则的平均数为 ,方差为 .
※ 动手试试
练1.某工厂人员及工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资
2200
250
220
200
100
人数
1
6
5
10
1
23
(1)指出这个问题中周工资的众数、中位数、平均数
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?
练2.(2010·南通模拟)从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
练3.若一组数据的平均数为4,方差为2,则 的平均数为 ,标准差为 .
三、总结提升
1.用样本的数字特征估计总体的数字特征分两类:
①用样本平均数估计总体平均数。
②用样本标准差估计总体标准差。样本容量越大,估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
学习评价
※ 当堂检测
1.下列说法正确的是( )
在两组数据中,平均数较大的一组方差较大
平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
方差的求法是求出各个数据与平均数的差的平方后再求和
在记录两个人射击环数的两组数据中,方差大的表示射击水平高.
一个样本数据按从小到大的顺序排列为13,14,19
X,23,27,28,31,其中位数为22,则x=( )
A .21 B .22 C .20 D.23
3.在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.92 ,2 B.92,2.8 C.93 ,2 D.93 , 2.8
4.样本101,98,102,100,99的标准差为( )
A. B.0 C.1 D.2
5.一组数据的每一数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差为4.4,则原来数据的平均数和方差分别是 、 .
6.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下:
甲
乙
丙
丁
平均环数
8.5
8.8
8.8
8
方 差
3.5
3.5
2.1
8.7
则加奥运会的最佳人选是 .
课后作业
1.某人5次上班途中所的花时间(单位:min)分别为:x,y,10,11,9.已知这组数据的平均数是10,方差为2,则的值为( )
A.1 B.2 C.3 D.4
若数据这20个数据的平均数为;方差为0.20,则这21个数据的方差为 .
甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲
0
1
0
2
2
0
3
1
2
4
乙
2
3
1
1
0
2
1
1
0
1
分别计算两组数据的平均数与标准差,从计算结果看,哪台机床的性能较好?
高中数学必修三教学案:第二章-随机抽样
统计和概率的基础知识是一个未来公民的必备常识,它是中小学数学课程的重要内容.
?
在高中阶段,统计的学习从《必修3》第二章开始,本节课是开篇.好的开端等于成功的一半,因此本课很重要.笔者有幸承担本次课题会研究课的教学任务,在接受专家、同行的点评和指导中,对高中阶段的统计教学有了更深的认识.
?
下面分教学准备、教学设计和教后反思与大家共享我的心得.
?
教学准备
?
接到任务后,笔者首先查阅了一些统计论著.可惜,统计专业知识介绍的书籍多,统计教学的论著少之又少.这也从一个侧面反映了我国对中学统计教学研究的不足.
?
一、教什么
?
起始课究竟上什么内容?笔者征询了同事们的意见,绝大多数人认为,由于义教阶段学生对全面调查、抽样调查、样本、样本容量等概念都已很熟悉,没必要再纠缠.因此,第一堂课除了简单介绍本章学习内容以及随机抽样的必要性和重要性外,应将“2.1.1简单随机抽样”作为重点,这样整堂课就比较充实,不至于没有内容可讲.也有人认为,《教师教学用书》建议“2.1随机抽样”约为5课时,因此第一课时应只介绍随机抽样而不必涉及抽样方法.
?
笔者在听取了这些建议,经过再三思考后,决定把本课的教学内容定位于章引言和“随机抽样”的开篇,但不涉及具体抽样方法.理由如下:
?
1.章引言是整章内容的概括和介绍,既有先行组织者的作用,同时也能以此引出本课需要学习的内容.作为起始课,章引言的作用不可忽略.
?
2.虽然学生在小学、初中都学过统计,但对为什么要随机抽样,怎么进行随机抽样等的认识还不足.
?
3.作为统计的起始课,更重要的是让学生通过一些具体的实例感受随机抽样的必要性和重要性,而不是介绍一些具体的抽样方法.
?
二、怎么教
?
上述内容定位对教师提出的最大挑战就是如何寻找合适的素材,这个素材既要贴近学生的生活,又能让学生比较容易地参与到抽样活动中,在活动中体会随机抽样.几经选择后,笔者从教材中近视率的背景图中得到启发,设置了一系列关于调查学生近视率的问题串,以此开展整堂课的教学.整个教学过程分解为以下几个部分:
?
1.通过章头图提供的信息让学生感受数据,提出质疑即:这些数据是怎么来的?
?
2.让学生调查班级的近视率,感受普查的作用.
?
3.通过调查年级和全市高一学生的近视率,感受抽样调查的必要性,感受如何才能使样本具有代表性.
?
4.在小组讨论和师生交流中体会统计结果的不确定性.
?
5.在小结中结合章头图进行总结回顾,引出本章的知识框架.
?
???????教学设计
?
一、内容和内容解析
?
1.内容
?
本课主要内容是让学生了解:认识客观现象的第一步就是通过观察或试验取得观测资料,然后分析这些资料来认识此现象.获取有代表性的观测资料并正确地加以分析是正确认识未知现象的基础,也是统计所研究的基本问题.
?
2.内容解析
?
本课是高中统计的第一节课,统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据.学生在义教阶段已学了收集、整理、描述和分析数据等处理数据的基本方法.高中的统计学习将逐步让学生体会确定性思维与统计思维的差异,了解统计结果的随机性特征,知道统计推断可能出错.统计有两种:一种是把所有个体的信息都收集起来,然后进行描述,这种统计方法称为描述性统计,例如人口普查.但在很多情况下我们无法采用描述性统计对所有个体进行调查,通常是在总体中抽取一定的样本为代表,从样本的信息来推断总体的特征,这称为推断性统计.例如有的产品数量非常大,或者质量检查具有破坏性.
?
抽样调查是收集数据的一种重要途径,是一种重要的、科学的非全面调查方法.它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用样本数据来推断总体.其中蕴涵了重要的统计思想——样本估计总体.而样本代表性的好坏直接影响统计结论的准确性,所以抽样过程中,考虑的最主要原则是保证样本能很好地代表总体.而随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑.
?
本节课重点:能从现实生活或其他学科中提出具有一定价值的统计问题,理解随机抽样的必要性与重要性.
?
二、目标和目标解析
?
1.目标
?
(1)通过具体案例的分析,逐步学会从现实生活中提出具有一定价值的统计问题;
?
(2)结合实际问题情境,理解随机抽样的必要性和重要性,深刻理解样本的代表性.
?
2.目标解析
?
章引言列举了我国水资源缺乏问题、土地沙漠化问题等情境,提出了学习统计的意义.通过具体实例,引导学生尝试从实际问题中发现并提出统计问题.以培养学生从现实生活或其他学科中发现问题、提出问题的能力、意识和习惯.
?
对某个问题的调查最简单的方法就是普查,但是这种方法的局限性很大.出于费用和时间的考虑,有时一个精心设计的抽样方案,其实施效果甚至可以胜过普查.教学中要通过一定实例让学生体会随机抽样的必要性和重要性.为了使由样本到总体的推断有效,样本必须是总体的代表.在对实例的分析过程中,探讨获取有代表性的样本的方法,得到随机样本的概念,逐步理解样本的代表性与统计推断结论可靠性之间的关系.
?
三、教学问题诊断分析
?
学生在初中已有对统计活动的认识,并学习了统计图表、收集数据的方法,但对设计合理的抽样方法,以使样本具有好的代表性的意识还不强.在已有学习中,学习内容多以确定性数学为主;学生对全面调查,即普查有所了解,它在经验上更接近确定性数学;这里,我们要通过具体问题,让学生体会统计的重要思想——用样本估计总体以及统计结果的不确定性.因此,学生已有知识经验与本节要达成的教学目标之间有较大差距.主要的困难有:对样本估计总体的思想、对统计结果的“不确定性”产生怀疑,对统计的科学性有所质疑;对抽样应该具有随机性,每个样本的抽取又都落实在某个人的具体操作上不理解,因此教学中要通过具体实例的研究给学生释疑.
?
教学中,可以鼓励学生从自己的生活中提出与典型案例类似的统计问题,如每天完成家庭作业所需的时间,每天的体育锻炼时间,学生的近视率,一批灯泡的寿命等.在学生提出这些问题后,要引导学生考虑问题中的总体是什么,要观测的变量是什么,如何获取样本等,这样可以培养学生提出统计问题的能力.
?
因此,本课的教学难点是:理解怎样的抽样才是随机抽样,如何抽样才能更好地代表总体.
?
四、教学支持条件分析
?
准备一些随机抽样成功或失败的事例,利用实物投影或放映的多媒体设备辅助教学.
?
五、教学过程设计
?
(一)感悟数据、引入课题
?
问题1:请同学们看章头图中的有关沙漠化和缺水量的数据,你有什么感受?
?
师生活动:让学生充分思考和探讨,并逐步引导学生产生质疑:这些数据是怎么来的?
?
设计意图:通过一些数据让学生充分感受我们生活在一个数字化时代,要学会与数据打交道,养成对数据产生的背景进行思考的习惯.
?
问题2:我们班级有很多同学都是戴眼镜的,你知道我们班的近视率吗?你是怎么知道的?
?
设计意图:通过与学生比较贴近的案例,让他们体会统计与日常生活的关系.
?
(二)操作实践、展开课题
?
问题3:如果我想了解我校所有高一学生的近视率,你打算怎么做呢?
?
师生活动:以四人小组为单位进行讨论,每个小组派一个代表汇报方案.
?
设计意图:从这个问题中引出抽样调查和样本的概念,使学生对于如何产生样本进行一定的思考,同时也使学生认识到样本选择的好坏对于用样本估计总体的精确度是有所不同的.
?
问题4:你认为下列预测结果出错的原因是什么?
?
在1936年美国总统选举前,一份颇有名气的杂志(Literary Digest)的工作人员做了一次民意测验.调查兰顿(A.Landon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车量登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:
?
设计意图:通过案例让学生进一步体会到:在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性.
?
问题5:如果要调查下面这几个问题,你认为应该作全面调查还是抽样调查?大家对普查和抽样调查是怎么看的?普查一定好吗?请举例.
?
(1)?????? 了解全班同学每周的体育锻炼时间;
?
(2)?????? 调查市场上某个品牌牛奶的含钙量;
?
(3)?????? 了解一批日光灯的使用寿命.
? ?
?
设计意图:通过普查和抽样调查的比较,使学生感受抽样调查的必要性和重要性.
?
问题6:如果我们想了解晋中市高一学生的近视率,你认为该怎么做呢?
?
师生活动:以2人小组为单位进行讨论,说出比较可行的抽样方案.
?
问题7:是否可以用晋中市高一年级学生的近视率来估计山西省高中生的近视率?为什么?
?
师生活动:教师继续让学生进行小组讨论,引导学生从样本容量以及样本抽取需要考虑的要素,如:学生的层次(高一、高二、高三),学生生活的环境(城市、县镇、农村)等.教师对学生的回答进行归纳、整理,与学生一起讨论出比较可行的抽样方案.
?
设计意图:通过进一步的追问,加深学生对样本代表性的理解.让学生进一步认识到:在多背景下的抽样会产生偏差,以及样本的随机性与样本大小在产生有代表性的样本中的作用,同时对后面的内容进行简单介绍.
?
(三)总结拓展、提升思想
?
问题8:请你用简要的语言说说自己在本节课的收获.
?
师生活动:引导学生从怎样学会提出统计问题?抽样调查与普查的优缺点?样本的代表性与统计推断结论之间的关系等方面进行总结和回顾.教师结合章头图对这一章的框架进行简单的介绍,引导学生建构知识体系.
?
?
设计意图:总结回顾,巩固课堂知识、初步概括统计思想.
?
六、目标检测设计
?
1.某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是(??? )
?
A.在公园调查了1000名老年人的健康状况
?
B.在医院调查了1000名老年人的健康状况
?
C.调查了10名老年邻居的健康状
?
D.利用派出所的户籍网随机调查了该地区10%的老年人的健康状况.
?
设计意图:促进学生理解抽样的必要性和样本的代表性.
?
2.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是 A.总体是240?????????????? ???B.个体是每一个学生 C.样本是40名学生?? ??????????D.样本容量是40????????????????????????
?
设计意图:回顾复习相关概念.
?
3.为了了解全校学生的平均身高,王一调查了自己座位旁边的五位同学,把这五位同学的身高的平均值作为全校学生平均身高的估计值.
?
(1)王一的调查是抽样调查吗?
?
(2)如果是抽样调查,指出调查的总体、个体、样本和样本容量;
?
(3)这个调查结果能较好的反映总体的情况吗?如果不能,请说明理由.
?
设计意图:回顾抽样调查的几个基本概念,强化抽样调查中样本的代表性.
?
教学反思
?
?
上完课后,许多听课的教师都对这堂课提出了自己不同的看法,同时也促使笔者进一步思考,究竟该如何来上好这一堂课.
?
一、如何利用章引言
?
在人教A版教材中每一章的开头都有章头图和章引言,统计也不例外.对于一线教师来说,章引言的作用以及如何用好章引言都是值得探讨的问题.
?
1.章引言的作用
?
统计的章头图、章引言包括日常生活中的一些数据,如缺水量、沙漠化以及相关的一些图表等,还有对本章内容的文字介绍.这些信息的作用在哪里,如何在起始课中把这些信息传递给学生成为笔者首要考虑的问题.在与教研员和同行的探讨中,我们认为统计的章引言有以下几点作用:
?
??? (1)沙漠化的图片以及文字说明可以让学生体会到有些数据无法普查,只能通过抽样调查来得到,这还渗透着环保意识.
?
(2)十大城市缺水量的图表及相关文字既回顾了初中的统计图表,同时也为学习“用样本估计总体”埋下伏笔.
?
(3)章头图中三个章节的标题以及整个文字介绍对整章起着统领作用.
?
2.章引言的教学思考
?
鉴于上述三点作用,对于章引言的教学我们采取了以下做法:
?
(1)充分利用章头图、章引言中的数据和图片如沙漠化、我国缺水量排名等,在让学生增强环保意识的同时能更为理性地关注数据的来源及其真实性,学会质疑、通过质疑引入本节课的课题,同时也让学生体会到学习这一知识的必要性.
?
(2)由于章引言中有些概念学生尚未学习,不适宜在课堂一开始就介绍,将其放在课堂小结之后,教师引导学生进行知识框架的构建,可能效果更好.
?
3.章引言教学效果的分析
?
自我感受是章引言的作用没有很好的体现,原因在于:
?
(1)没有考虑学生已有的认知基础.笔者本以为在上课一开始给出沙漠化等数据后,学生会对数据的来源产生质疑,但是几乎全班同学都肯定地认为这个数据是通过抽样调查得到的.
?
(2)由于上课的节奏没有把握好,没能利用章引言帮助学生构建好知识框架,我自己在课堂上也没有进行很好地解读.
?
二、如何体现螺旋上升
?
上完这一节课后,部分听课教师认为这节课似乎是把初中的统计课重上了一遍.新课程实施后,学生从小学一年级就开始学习统计,到初中什么是统计,如何进行数据的收集、整理与描述已有较多的体验,什么是普查、抽样调查、样本、样本容量等概念也都已经比较清晰.而“2.1随机抽样”的教学内容也就是这一些,听课教师有此感受实属正常.
?
笔者在上这一堂课的时候也存在着这个困惑.对于高中的统计内容,从随机抽样到用样本估计总体、两个变量的相关关系以及选修IA中的统计案例,知识上的螺旋上升比较明显,但是从小学、初中、高中统计学习的螺旋上升框架却并不明晰.比如“随机抽样”中概念、内容基本上都是学生初中已学过的,甚至教材上“一个著名案例”在有些初中教材中也曾出现过.针对这个情况,笔者确定将教学重心落在让学生体会随机抽样的必要性和重要性上,通过课堂的实践操作让学生进一步体会为什么要抽样,如何进行抽样,并在对抽样的比较中体会样本的随机性和统计结果的不确定性.这些在初中的统计教学中没有得到强化,同时也成为本节课值得提升的内容.
?
课堂实践后,从听课教师的反应来看,这个螺旋上升还没有得到很好的体现,究其原因:
?
1.教学设计中各个教学环节的设计意图不够明晰.
?
2.教学过程中强调了学生的参与,教师有效的归纳、总结、提升相对缺乏.
?
3.没有将理念性的信息通过有效的载体显现,教学中的问题链未达到需要达到的教学层次.
?
三、如何渗透统计思想
?
让学生不断体会统计思想是一个重要的教学任务.随机抽样中渗透统计思想是基本任务也是主要任务.笔者在本堂课的教学中也深切体会到了教学的困难.
?
1.思想是教不会的,它是学生在参与对具体的问题的实践和分析中逐步体会得到,如何寻找恰当、适时的问题或案例让学生进行有效的体会、研究、实践是一个重要问题.笔者在本堂课中通过让学生调查班级、年级、全市、全省中学生的近视率这一条主线进行随机抽样的教学,在让学生小组讨论、全班交流的过程中渗透统计思想.从课堂效果来看,这个教学载体并不是最佳的,但是笔者至今也尚未找到更好的教学载体.
?
2.概念教学应更多地采用归纳式教学,这对教师提出了极大的挑战.教师绝大多数是在“演绎”的教学中学习长大,我们在中学时所接受的学习方式会影响自己的教学方式.笔者也不例外,从小被演绎惯了,即使有意识地要让学生自己进行实践体会并逐步归纳,但是在教学中还是时不时地“滑向”演绎.
?
3.课堂的教学时间是有限的,如何在有限的时间内既让学生充分体验、感受统计思想,又能很好完成各项教学任务,提高教学效率,这将是笔者今后的努力方向,虽然做到这一点会很难.
?
??? 最后感谢课题组专家、成员以及所有的听课教师提出的建议和意见,同时也希望这一堂课能起到抛砖引玉的作用,让更多的教师关注统计,关注统计教学,使这个现代公民必备的常识能在课堂上打下良好基础,并能促使学生学以致用.
?
高中数学必修三:22简单随机抽样 教案
教学目标:
1、知识与技能:
(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;
2、过程与方法:
(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;
(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
教学设想:
假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?
显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢?
【探究新知】
一、简单随机抽样的概念
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:
(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?
下列抽样的方式是否属于简单随机抽样?为什么?
(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
二、抽签法和随机数法
1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
【说明】抽签法的一般步骤:
(1)将总体的个体编号。
(2)连续抽签获取样本号码。
思考?
你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?
2、随机数法的定义:
利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001,…,799。
第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
87 35 20 96 43 84 26 34 91 64
21 76 33 50 25 83 92 12 06 76
12 86 73 58 07 44 39 52 38 79
15 51 00 13 42 99 66 02 79 54
90 52 84 77 27 08 02 73 43 28
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
【说明】随机数表法的步骤:
(1)将总体的个体编号。
(2)在随机数表中选择开始数字。
(3)读数获取样本号码。
【例题精析】
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法。
解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。
【课堂练习】P
【课堂小结】
1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法。
2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。
【评价设计】
1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
A.总体是240 B、个体是每一个学生
C、样本是40名学生 D、样本容量是40
2、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )
A、总体 B、个体是每一个学生
C、总体的一个样本 D、样本容量
3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 。
2.1.2 系统抽样
整体设计
教学分析
教材通过探究“学生对教师教学的意见”过程,介绍了一种最简单的系统抽样——等距抽样,并给出实施等距抽样的步骤.
值得注意的是在教学过程中,适当介绍当不是整数时,应如何实施系统抽样.
三维目标
1.理解系统抽样,会用系统抽样从总体中抽取样本,了解系统抽样在实际生活中的应用,提高学生学习数学的兴趣.
2.通过自学课后“阅读与思考”,让学生进一步了解虚假广告是淡化总体和抽样方法、强化统计结果来夸大产品的有效性,以提高学生理论联系实际的能力.
重点难点
教学重点:实施系统抽样的步骤.
教学难点:当不是整数,如何实施系统抽样.
课时安排
1课时
教学过程
导入新课
思路1
上一节我们学习了简单随机抽样,那么简单随机抽样的特点是什么?简单随机抽样是最简单和最基本的抽样方法,当总体中的个体较少时,常采用简单随机抽样.但是如果总体中的个体较多时,怎样抽取样本呢?教师点出课题:系统抽样.
思路2
某中学有5 000名学生,打算抽取200名学生,调查他们对奥运会的看法,采用简单随机抽样时,无论是抽签法还是随机数法,实施过程很复杂,需要大量的人力和物力,那么有没有更为方便可行的抽样方法呢?这就是今天我们学习的内容:系统抽样.
推进新课
新知探究
提出问题
(1)某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的?方法??
(2)请归纳系统抽样的定义和步骤.
(3)系统抽样有什么特点?
讨论结果:
(1)可以将这500名学生随机编号1—500,分成50组,每组10人,第1组是1—10,第二组11—20,依次分下去,然后用简单随机抽样在第1组抽取1人,比如号码是2,然后每隔10个号抽取一个,得到2,12,22,…,492.
这样就得到一个容量为50的样本.
这种抽样方法称为系统抽样.
(2)一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.
其步骤是:
1°采用随机抽样的方法将总体中的N个个体编号;
2°将整体按编号进行分段,确定分段间隔k(k∈N,l≤k);
3°在第1段用简单随机抽样确定起始个体的编号l(l∈N,l≤k);
4°按照一定的规则抽取样本.通常是将起始编号l加上间隔k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),这样继续下去,直到获取整个样本.
说明:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.
(3)系统抽样的特点是:
1°当总体容量N较大时,采用系统抽样;
2°将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[].
3°预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
应用示例
例1 为了了解参加某种知识竞赛的1 000名学生的成绩,应采用什么抽样方法较恰当?简述抽样过程.
解:适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2 ,3,…,1000.
(2)将总体按编号顺序均分成50部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码,比如18.
(4)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.
点评:系统抽样与简单随机抽样一样,每个个体被抽到的概率都相等,从而说明系统抽样是等概率抽样,它是公平的.系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样.
变式训练
1.下列抽样不是系统抽样的是( )
A.从标有1—15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
分析:C中,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样,所以不是系统抽样.
答案:C
2.某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
分析:按1∶5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.
解:抽样过程是:
(1)按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1—5的5名学生,第2组是编号为6—10的5名学生,依次下去,59组是编号为291—295的5名学生;
(2)采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为l(l≤5);
(3)按照一定的规则抽取样本.抽取的学生编号为l+5k(k=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.
例2 为了了解参加某种知识竞赛的1 003名学生的成绩,请用系统抽样抽取一个容量为50的样本.
分析:由于不是整数,所以先从总体中随机剔除3个个体.
步骤:
(1)随机地将这1003个个体编号为1,2,3,…,1003.
(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数?1 000?能被样本容量50整除,然后再重新编号为1,2,3,…,1000.
(3)确定分段间隔.=20,则将这1 000名学生分成50组,每组20人,第1组是1,2,3,…,20;第2组是21,22,23,…,40;依次下去,第50组是981,982,…,1000.
(4)在第1组用简单随机抽样确定第一个个体编号l(l≤20).
(5)按照一定的规则抽取样本.抽取的学生编号为l+20k (k=0,1,2,…,19),得到50个个体作为样本,如当k=2时的样本编号为2,22,42,…,982.
点评:如果遇到不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.
变式训练
1.某校高中三年级有1 242名学生,为了了解他们的身体状况,准备按1∶40的比例抽取一个样本,那么( )
A.剔除指定的4名学生 B.剔除指定的2名学生
C.随机剔除4名学生 D.随机剔除2名学生
分析:为了保证每名学生被抽到的可能性相等,必须是随机剔除学生,由于的余数是2,所以要剔除2名学生.
答案:D
2.从2 005个编号中抽取20个号码,采用系统抽样的方法,则抽样的分段间隔为( )
A.99 B.99.5 C.100 D.100.5
答案:C
例3 从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32
分析:用系统抽样的方法抽取到的导弹编号应该为k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求.
答案:B
点评:利用系统抽样抽取的样本的个体编号按从小到大的顺序排起来,从第2个号码开始,每一个号码与前一个号码的差都等于同一个常数,这个常数就是分段间隔.
变式训练
某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是_________抽样方法.
答案:系统
知能训练
1.从学号为0—50的高一某班50名学生中随机选取5名同学参加数学竞赛,采用系统抽样的方法,则所选5名学生的学号不可能是( )
A.1,2,3,4,5 B.5,15,25,35,45
C.2, 12, 22, 32, 42 D.9,19,29,39,49
答案:A
2.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为( )
A. B. C. D.不相等
答案:A
3.某单位的在岗工人为624人,为了调查工作上班时从家到单位的路上平均所用的时间,决定抽取10%的工人调查这一情况,如何采用系统抽样的方法完成这一抽样?
答案:先随机剔除4人,再按系统抽样抽取样本.
4.某学校有学生3 000人,现在要抽取100人组成夏令营,怎样抽取样本?
分析:由于总体人数较多,且无差异,所以按系统抽样的步骤来进行抽样.
解:按系统抽样抽取样本,其步骤是:
①将3 000名学生随机编号1,2,…,3000;
②确定分段间隔k==30,将整体按编号进行分100组,第1组1—30,第2组31—60,依次分下去,第100组2971—3000;
③在第1段用简单随机抽样确定起始个体的编号l(l∈N,0≤l≤30);
④按照一定的规则抽取样本,通常是将起始编号l加上间隔30得到第2个个体编号l+30,再加上30,得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为:15,45,75,…,2985.
这些号码对应的学生组成样本.
拓展提升
将参加数学竞赛的1 000名学生编号如下000,001,002,…,999,打算从中抽取一个容量为50的样本,按系统抽样方法分成50个部分,第一组编号为000,002,…,019,如果在第一组随机抽取的一个号码为015,则抽取的第40个号码为_____________.
分析:利用系统抽样抽取样本,在第一组抽取号码为l=015,分段间隔为k==20,则在第i组中抽取的号码为015+20(i-1).则抽取的第40个号码为015+(40-1)×20=795.
答案:795
课堂小结
通过本节的学习,应明确什么是系统抽样,系统抽样的适用范围,如何用系统抽样获取样本.
作业
习题2.1A组3.
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
整体设计
教学分析
教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.
由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.
三维目标
1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.
3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.
重点难点
教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
教学难点:能通过样本的频率分布估计总佒的分布.
课时安排
1课时
教学过程
导入新课
思路1
在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).
思路2
如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.
7月25日至8月10日
41.9
37.5
35.7
35.4
37.2
38.1
34.7
33.7
33.3
32.5
34.6
33.0
30.8
31.0
28.6
31.5
28.8
8月8日至8月24日
28.6
31.5
28.8
33.2
32.5
30.3
30.2
29.8
33.1
32.8
29.8
25.6
24.7
30.0
30.1
29.5
30.3
怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.
思路3
讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?
提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?
讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)
指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.
推进新课
新知探究
提出问题
(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)
(2)什么是频率分布?
(3)画频率分布直方图有哪些步骤?
(4)频率分布直方图的特征是什么?
讨论结果:
(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况.
(2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.
(3)其一般步骤为:
①计算一组数据中最大值与最小值的差,即求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(4)频率分布直方图的特征:
①从频率分布直方图可以清楚地看出数据分布的总体趋势.
②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象.
提出问题
(1)什么是频率分布折线图?
(2)什么是总体密度曲线?
(3)对于任何一个总体,它的密度曲线是否一定存在?是否可以被非常准确地画出来?
(4)什么叫茎叶图?画茎叶图的步骤有哪些?
(5)茎叶图有什么特征?
讨论结果:
(1)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
(3)实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越?精确?.
(4)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
画茎叶图的步骤如下:
①将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;
②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;
③将各个数据的叶按大小次序写在其茎右(左)侧.
(5)①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点.
频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.
应用示例
思路1
例1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表.
(2)画出频率分布条形图.
解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:
试验结果
频数
频率
参加足球队(记为1)
30
0.30
参加篮球队(记为2)
27
0.27
参加排球队(记为3)
23
0.23
参加乒乓球队(记为4)
20
0.20
合 计
100
1.00
(2)由上表可知频率分布条形图如下:
例2 为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下:(单位:cm)
154 159 166 169 159 156 166 162 158
156 166 160 164 160 157 151 157 161
158 153 158 164 158 163 158 153 157
162 159 154 165 166 157 151 146 151
160 165 158 163 163 162 161 154 165
162 159 157 159 149 164 168 159 153
列出样本的频率分布表;绘出频率分布直方图.
解:第一步,求极差:上述60个数据中最大为169,最小为146.
故极差为:169-146=23 cm.
第二步,确定组距和组数,可取组距为3 cm,则组数为,可将全部数据分为8组.
第三步,确定组限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5).
第四步,列频率分布表:
分组
个数累计
频数
频率
[145.5,148.5)
1
0.017
[148.5,151.5)
3
0.050
[151.5,154.5)
6
0.100
[154.5,157.5)
8
0.133
[157.5,160.5)
18
0.300
[160.5,163.5)
11
0.183
[163.5,166.5)
10
0.167
[166.5,169.5)
3
0.050
合计
60
1.000
第五步,根据上述数据绘制频率分布直方图如下图:
以上例1和例2两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.
我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.
例3 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.
168
165
171
167
170
165
170
152
175
174
165
170
168
169
171
166
164
155
164
158
170
155
166
158
155
160
160
164
156
162
160
170
168
164
174
170
165
179
163
172
180
174
173
159
163
172
167
160
164
169
151
168
158
168
176
155
165
165
169
162
177
158
175
165
169
151
163
166
163
167
178
165
158
170
169
159
155
163
153
155
167
163
164
158
168
167
161
162
167
168
161
165
174
156
167
166
162
161
164
166
解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;
(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,?[177.5,180.5)?;
(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:
分组
频数累计
频数
频率
[150.5,153.5)
4
4
0.04
[153.5,156.5)
12
8
0.08
[156.5,159.5)
20
8
0.08
[159.5,162.5)
31
11
0.11
[162.5,165.5)
53
22
0.22
[165.5,168.5)
72
19
0.19
[168.5,171.5)
86
14
0.14
[171.5,174.5)
93
7
0.07
[174.5,177.5)
97
4
0.04
[177.5,180.5)
100
3
0.03
合计
100
1
根据频率分布表可以估计,估计身高不小于170的同学所占的百分率为:
[0.14×+0.07+0.04+0.03]×100%=21%.
点评:一般地,编制频率分布表的步骤如下:
(1)求极差,决定组数和组距;
(2)分组,通常对组内的数值所在的区间取左闭右开区间;
(3)登记频数,计算频率,列出频率分布表.
思路2
例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158)
人数
11
6
5
20
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
分析:根据样本频率分布表、频率分布直方图的一般步骤解题.
解:(1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158)
5
0.04
合计
120
1
(2)其频率分布直方图如下:
(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:=0.08;
又因为频率=,
所以样本容量==150.
(2)由图可估计该学校高一学生的达标率约为×100%=88%.
例3 甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.
甲:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙:8,13,14,16,23,26,28,33,38,39,51.
解:画出两人得分的茎叶图如下:
从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好.
知能训练
1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )
A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分
答案:A
2.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,?18.5?], 8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )
A.91% B.92% C.95% D.30%
答案:A
3.一个容量为20的样本数据,数据的分组及各组的频数如下:
(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.
则样本在区间(10,50)上的频率为( )
A.0.5 B.0.7 C.0.25 D.0.05
答案:B
4.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭____________万盒.
快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图
答案:85
拓展提升
为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).
135
98
102
110
99
121
110
96
100
103
125
97
117
113
110
92
102
109
104
112
109
124
87
131
97
102
123
104
104
128
105
123
111
103
105
92
114
108
104
102
129
126
97
100
115
111
106
117
104
109
111
89
110
121
80
120
121
104
108
118
129
99
90
99
121
123
107
111
91
100
99
101
116
97
102
108
101
95
107
101
102
108
117
99
118
106
119
97
126
108
123
119
98
121
101
113
102
103
104
108
(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?
解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5.
频率分布表如下:
分组
频数
频率
频率/组距
[80,85)
1
0.01
0.002
[85,90)
2
0.02
0.004
[90,95)
4
0.04
0.008
[95,100)
14
0.14
0.028
[100,105)
24
0.24
0.048
[105,110)
15
0.15
0.030
[110,115)
12
0.12
0.024
[115,120)
9
0.09
0.018
[120,125)
11
0.11
0.022
[125,130)
6
0.06
0.012
[130,135]
2
0.02
0.004
合计
100
1
0.2
(2)直方图如下图:
(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.
课堂小结
总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.
总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
作业
习题2.2A组1、2.
设计感想
本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.
本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用 “数据”语言说话.
另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.
2.2.2 用样本的数字特征估计总体的数字特征
整体设计
教学分析
教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.
教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.
三维目标
1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.
2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.
3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.
重点难点
教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.
教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.
课时安排
2课时
教学过程
第1课时 众数、中位数、平均数
导入新课
思路1
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员:7,8,6,8,6,5,8,10,7,4;
乙运动员:9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题)
思路2
在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.
推进新课
新知探究
提出问题
(1)什么是众数、中位数、平均数?
(1)如何绘制频率分布直方图?
(3)如何从频率分布直方图中估计众数、中位数、平均数?
活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.
讨论结果:
(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.
(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.
(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.
请大家翻回到课本看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.
提问:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.
思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.
思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.
对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.
同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.
显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.
利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.
应用示例
思路1
例1 (1)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是___________;
(2)如果两组数x1,x2,…,xn和y1,y2,…,yn的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,…,xn+yn的平均数是___________.
活动:学生思考或交流,教师提示,根据平均数的定义得到结论.
解:(1);
(2).
例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.
甲班:
112 86 106 84 100 105 98 102 94 107
87 112 94 94 99 90 120 98 95 119
108 100 96 115 111 104 95 108 111 105
104 107 119 107 93 102 98 112 112 99
92 102 93 84 94 94 100 90 84 114
乙班:
116 95 109 96 106 98 108 99 110 103
94 98 105 101 115 104 112 101 113 96
108 100 110 98 107 87 108 106 103 97
107 106 111 121 97 107 114 122 101 107
107 111 114 106 104 104 95 111 111 110
分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.
解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班.
思路2
例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.
睡眠时间
人数
频率
[6,6.5)
5
0.05
[6.5,7)
17
0.17
[7,7.5)
33
0.33
[7.5,8)
37
0.37
[8,8.5)
6
0.06
[8.5,9)
2
0.02
合计
100
1
分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.
解法一:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),
故平均睡眠时间约为7.39 h.
解法二:求组中值与对应频率之积的和
6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
答:估计该校学生的日平均睡眠时间约为7.39 h.
例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.
分析:上述百分比就是各组的频率.
解:估计该单位职工的平均年收入为
12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).
答:估计该单位人均年收入约为26 125元.
知能训练
从甲、乙两个公司各随机抽取50名员工月工资:
甲公司:
800 800 800 800 800 1 000 1 000 1 000 1 000
1 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 200
1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200
1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 500
1 500 1 500 1 500 1 500 1 500 1 500 2 000 2 000 2 000
2 000 2 000 2 500 2 500 2 500
乙公司:
700 700 700 700 700 700 700 700 700
700 700 700 700 700 700 1 000 1 000 1 000
1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000
1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000
1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000
1 000 1 000 6 000 8 000 10 000
试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资.
答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;
乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.
拓展提升
“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.
你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?
这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.
在这里应该注意以下几点:
1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.
2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.
3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公?平性?.
4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.
课堂小结
1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;
2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;
3.形成对数据处理过程进行初步评价的意识.
作业
习题2.2A组3.
设计感想
本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.
(设计者:路 波)
第2课时 标准差
导入新课
思路1
平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)
思路2
在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员:7,8,7,9,5,4,9,10,7,4;
乙运动员:9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?
从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据——标准差.
推进新课
新知探究
提出问题
(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?
(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.
甲
110
120
130
125
120
125
135
125
135
125
乙
115
100
125
130
115
125
125
145
125
145
哪种钢筋的质量较好?
(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)
甲:600, 880, 880, 620, 960, 570, 900(平均773)
乙:800, 860, 850, 750, 750, 800, 700(平均787)
请你用所学统计学的知识,说明选择哪种品种推广更好?
(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?
(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?
讨论结果:
(1)利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)
由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.
(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.
(4)不符合实际.
样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度.
(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.
标准差:
考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,…,xn,表示这组数据的平均数.xi到的距离是|xi-|(i=1,2,…,n).
于是,样本数据x1,x2,…,xn到的“平均距离”是S=.
由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:
s=.
意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s≥0,当s=0时,意味着所有的样本数据都等于样本平均数.
标准差还可以用于对样本数据的另外一种解释.例如,
在关于居民月均用水量的例子中,平均数=1.973,标准差s=0.868,所以
+s=2.841,+2s=3.709;
-s=1.105,-2s=0.237.
这100个数据中,在区间[-2s,+2s]=[0.237,3.709]外的只有4个,也就是说,[-2s, +2s]几乎包含了所有样本数据.
从数学的角度考虑,人们有时用标准差的平方s2——方差来代替标准差,作为测量样本数据分散程度的工具:
s2=[(x1-)2+(x2-)2+…+(xn-)2].
显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.
需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.
用计算器计算运动员甲的成绩的标准差的过程如下:
即s甲=2.
用类似的方法,可得s乙≈1.095.
由s甲>s乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.
应用示例
思路1
例1 画出下列四组样本数据的条形图,说明它们的异同点.
(1)5,5,5,5,5,5,5,5,5;
(2)4,4,4,5,5,5,6,6,6;
(3)3,3,4,4,5,6,6,7,7;
(4)2,2,2,2,5,8,8,8,8.
分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.
解:四组样本数据的条形图如下:
四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.
它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.
例2 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):
甲
25.46 25.32 25.45 25.39 25.36
25.34 25.42 25.45 25.38 25.42
25.39 25.43 25.39 25.40 25.44
25.40 25.42 25.35 25.41 25.39
乙
25.40 25.43 25.44 25.48 25.48
25.47 25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47
25.31 25.32 25.32 25.32 25.48
从生产的零件内径的尺寸看,谁生产的质量较高?
分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.
解:用计算器计算可得
≈25.401,≈25.406;
s甲≈0.037,s乙≈0.068.
从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s甲点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性.
变式训练
某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:
100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.
请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格).
解:运用计算器计算得:
=79.40,
(12+30+18+24+12)÷100=96%,
所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.
思路2
例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
解:甲品种的样本平均数为10,样本方差为
[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.
因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.
天数
151—180
181—210
211—240
241—270
271—300
301—330
331—360
361—390
灯泡数
1
11
18
20
25
16
7
2
分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.
解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
这些组中值的方差为×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+ 25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2).
故所求的标准差约≈46(天).
答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.
知能训练
(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.
(2)若给定一组数据x1,x2,…,xn,方差为s2,则ax1,ax2,…,axn的方差是____________.
(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
试判断选谁参加某项重大比赛更合适?
答案:(1)9.5,0.016 (2)a2s2
(3)=33,=33,
,
乙的成绩比甲稳定,应选乙参加比赛更合适.
拓展提升
某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.
解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x条),作上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则
这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而估计全部鱼的重量,最后估计出收入.
课堂小结
1.用样本的数字特征估计总体的数字特征分两类:
用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.
用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.
2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.
作业
习题2.2A组4、5、6、7,B组1、2.
设计感想
统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.