课件21张PPT。 第二章 统计2.1 随机抽样(1)1.我们生活在一个数字化时代,时刻都在与数据打交道,你能够举出一些例子吗?产品的合格率、农作物的产量 、商品的销售量 、当地的气温 、电视台的收视率等等。2.你知道这些数据是怎么来的吗?又如何分析这些数据? 这就是我们本节课开始要学习的统计学的有关知识。统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。 全国每位高中学生的视力情况。把组成总体的每一个考察的对象叫做个体从总体中取出的一部分个体的集体叫做这个总体的一个样本。15000样本中的个体的数目叫做样本的容量。全国高中生的视力 要了解全国高中生的视力情况,在全国抽取了这15所中学
的全部高中生15000人进行视力测试。你知道考察对象是什么吗?这15000名学生的视力情况又组成一个集体在统计中,我们把所要考察的对象
的全体叫做总体统计学中的几个概念1.总体:所要考察对象的全体;2.个体:总体中的每一个对象;3.样本:从总体中抽取的一个部分;4.样本容量:样本中个体的个数。 提问:为了了解宁化二中高二400名同学在某次数学考试成绩情况,从中抽取50名同学的数学成成绩进行研究。在此问题中总体、个体、样本、样本容量分别是什么? 那么,如何从总体中抽取一个样本呢?这就是本节课开始要学习的——随机抽样。1.为了了解全国高中生的视力情况,需要将全中国
所有高中生逐一进行检查吗?为什么?容量大!2.要检查某超市销售的牛奶含菌量是否合格,需要
将该超市的所有牛奶的包装袋都打开逐一检查吗?
为什么?有破坏性!3.在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查查兰顿和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示查兰顿非常受欢迎。于是此杂志预测查兰顿将在选举中获胜。 实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:思考:你认为预测结果出错的原因是什么? 原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。在调查中,你认为抽样调查和普查有什么不同? 抽样调查的好处是可以节省人力、物力和财力,可能出现的问题是推断的结果与实际情况之间有误差。如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差。 因此,为了得到高质量的样本,使样本具有较好的代表性,设计抽样方法时,最重要的是将总体“搅拌均匀”,使每个个体有同样的机会被抽中。 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做? 显然,你只能从中抽取一定数量的饼干作为检验
的样本.(为什么?)那么,应当怎样获取样本呢?一.简单随机抽样: 设计抽样方法时,在考虑样本的代表性的前提下,应努力使抽样过程简便易行. 得到样本饼干的一个方法是,将这批小包装饼干放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取(这样可以保证每一袋饼干被抽中的机会相等),这样我们就可以得到一个简单随机样本,相应的抽样方法就是——简单随机抽样.(一)简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样.注:简单随机抽样必须具备下列特点:
(1)总体个数 N有限。
(2)样本容量n≤N .
(3)简单随机抽样是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回抽样。
(5)简单随机抽样的每个个体入样的可能性相等,均为n/N.(二)最常用的简单随机抽样方法: 如何 从高二(3)班50名同学中抽取20名同学观看表演?①编号:将总体中的N个个体编号;②写号签:将这N个号码写在形状、大小相 同的号签上;③号签均匀搅拌:将号签放在同一箱中,并搅拌均匀;④抽取号签:从箱中每次抽出1个号签,连续抽取n次;⑤取出个体:将总体中与抽到的号签编号一致的n个个体取出。50名同学从1到50编号制作1到50个号签将50个号签搅拌均匀随机从中抽出20个号签对号码一致的学生发票1.抽签法(抓阄法)(1)抽签法一般步骤:你认为抽签法有什么优点和缺点?①优点:抽签法能够保证每个个体入选样本的机会都相等②缺点:Ⅰ.当总体的个数较多时,制作号签的成本将会增加;(2)抽签法的优点、缺点Ⅱ.号签很多时,“搅拌均匀”比较困难,结果很难
保证每个个体入选样本的可能性相同.2.随机数法:(1)随机数法定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,这种抽样方法叫随机数法。在高中我们仅学习随机数表法。(2)用随机数表法抽取样本的步骤:①将总体中的所有个体编号(每个号码位数一致);②在随机数表中选定开始的数字(确定行数列数);③从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;(读取样本号码)④根据选定的号码抽取样本。假设我们要考察某公司生产的袋装牛奶的质量是否
达标,现从800袋牛奶中抽取60袋进行检验,如何
用随机数表抽取样本?③从选定的数开始向右(读数的方向可以是向左,向上,向下等),得到满足的数将它取出,继续向右读,直到样本的60个号码全部取出。①先将800袋牛奶编号,可以编为000,001,…,799;②在随机数表中任选一个数;你认为随机数表法有什么优点和缺点?优点:(1)随机数表法能够保证每个个体入选样本的机会都相等;
(2)与抽签法比,可节省人力、物力 、财力和时间,可以有效避免号签搅拌不均匀,当样本容量稍大时,比抽签法简便;缺点:所产生的样本不是真正的简单样本,当样本容量很大时,编号不方便,用随机数表法直接抽样仍然比较困难。(3)随机数表法的优点、缺点 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?解法1:(抽签法)
第一步:将100件轴编号为1,2,…,100;
第二步:做好大小、形状相同的号签,分别写上这100个数;
第三步:将这些号签放在一个容器中进行均匀搅拌,接着连续不放回地抽取10个号签,就得到一个容量为10的样本. 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?解法2:(随机数表法)
第一步:将100件轴编号为00,01,…,99;
第二步:在随机数表中任选一数,例如第21行第1列的数6;
第三步:从选定的数6开始向右读,依次取出68,34,30,13,70,55,74,77,40,44这10个编号,这10件即为所要抽取的样本. 1.关于简单随机抽样,有下列说法:
①它要求被抽取样本的总体的个数有限;
②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④它是一种等可能抽样,每次从总体中抽取一个个体时,不仅各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
其中正确的有___________(请把你认为正确的所有序号都写上).①②③④2.下列抽取样本的方式是属于简单随机抽样的是( )
①从无限多个个体中抽取100个个体作样本;
②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;
③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)
A.① B.② C.③ D.以上都不对C3.《阳光课堂》第26页例1
4.课本第263页2 本节课学习的主要内容有:
1.随机抽样的概念;
2.简单随机抽样的两种不同方法:
(1)抽签法; (2)随机数表法。
要求能够理解抽样方法。1.《阳光课堂》第26~27题组集训1~7
2.预习课本58~59页再见!课件17张PPT。 第二章 统计2.1 随机抽样(2)一.简单随机抽样:(一)简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样.(二)最常用的简单随机抽样方法:1.抽签法(抓阄法)(1)抽签法一般步骤:②写号签:将这N个号码写在形状、大小相 同的号签上;①编号:将总体中的N个个体编号;③号签均匀搅拌:将号签放在同一箱中,并搅拌均匀;④抽取号签:从箱中每次抽出1个号签,连续抽取n次;⑤取出个体:将总体中与抽到的号签编号一致的n个个体取出。(2)抽签法的优点、缺点①优点:抽签法能够保证每个个体入选样本的机会都相等②缺点:Ⅰ.当总体的个数较多时,制作号签的成本将会增加;Ⅱ.号签很多时,“搅拌均匀”比较困难,结果很难保证每个个体入选样本的可能性相同.2.随机数法:(1)随机数法定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,这种抽样方法叫随机数法。(2)用随机数表法抽取样本的步骤:①将总体中的所有个体编号(每个号码位数一致);②在随机数表中选定开始的数字(确定行数列数);③从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;(读取样本号码)④根据选定的号码抽取样本。优点:(1)随机数表法能够保证每个个体入选样本的机会都相等;
(2)与抽签法比,可节省人力、物力 、财力和时间,可以有效避免号签搅拌不均匀,当样本容量稍大时,比抽签法简便;(3)随机数表法的优点、缺点缺点:所产生的样本不是真正的简单样本,当样本容量很大时,编号不方便,用随机数表法直接抽样仍然比较困难。4.总数为N的一批零件抽取一个容量为30的样本,若每
个零件被抽取的可能性为25%,则N为( )
A、150 B、200 C、100 D、1202.从含有500个个体的总体中一次性抽取25个个体,假定
其中每个个体被抽到的概率相等,那么总体中每个个体
被抽到的概率是__________.
3.用随机数表法从100名学生(男生25人)中抽选20人,某男学生被抽到的可能性是_________.1.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是 ( ).
A.1 000名运动员是总体 B.每个运动员是个体
C.抽取的100名运动员是样本 D.样本容量是100D1/201/4D 简单随机抽样适用于个体数不太多的总体。那么当总体个体数较多时,宜采用什么抽样方法呢?某学校为了了解高一年级学生对教师教学的意见,打
算从高一年级500名学生中抽取50名进行调查。除了
用简单随机抽样获取样本外,你能否设计其他抽取样
本的方法?
我们按照下面的步骤进行抽样:第一步:将这500名学生从1开始进行编号;第二步:确定分段间隔k,对编号进行分段.由于
k=500/50=10,这个间隔可以定为10;第三步:从号码为1~10的第一段中用简单随机
抽样的方法确定第一个个体编号,假如为6号;第四步:从第6号开始,每隔10个号码抽取一个,得到
6,16,26,36,…,496.这样就得到一个样本容量为50的
样本.这种抽样方法叫系统抽样。1.系统抽样的定义:要从容量为N的总体中抽取容
量为n的样本,可将总体分成均衡的若干部分,然
后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。注:当总体容量N较大时,可采用系统抽样。二.系统抽样: 一般地,用系统抽样从含有N个个体的总体中抽
取一个容量为n的样本,其操作步骤如何?2.用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤:第一步,将总体的N个个体编号.第二步,确定分段间隔k,对编号进行分段.第三步,在第1段用简单随机抽样确定起始个体编
号l.第四步,按照一定的规则抽取样本.(编号)(分段)(在第一段抽取个体)(抽取样本)1.如果用系统抽样从505件产品中抽取50件进行质
量检查,由于505件产品不能均衡分成50部分,对此
应如何处理?答:先从总体中随机剔除5个个体,再均衡分成50
部分.2.抽取的样本号码有何特点?答:以在第一段抽取的样本号码为首项,N/n为公差的等差数列。3.系统抽样适合在哪种情况下使用?与简单随机抽
样比较,哪种抽样方法更使样本具有代表 性?答:总体中个体数比较多;系统抽样更使样本具
有代表性.4.你认为系统抽样有哪些优点与缺点?答:优点:(1)简便易行;
(2)当对总体结构有一定了解时,充分利用已有信息对总体 中的个体进行排除后再抽样,可以提高抽样效率;
(3)当总体中的个体存在自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法。缺点:在不了解样本总体的情况下,所抽出的样本可能有一定偏差。A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32 1(1)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )。B A.3,2 B.2,3 C.2,30 D.30,2(2)为了调查某产品的销售情况,销售部门从下属的92
家销售连锁店中抽取30家了解情况。若用系统抽样法,
则抽样间隔和随机剔除的个体数分别为 ( ).A(3)在第一段中抽取个体。从号码为1~7的第一段中用抽签法抽取第一个号码,如:5;(4)抽取样本。从5号开始,每隔7个号码抽取一个,得到5,12,19,26,…,110.这样就得到一个样本容量为16的样本.3.由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部是男性,所以这样获得的调查结果不能代表女性的意见,因此缺乏代表性。(2)分段。把编号分成16段,每段7个号码;解答:2.(1)编号。从总体中随机剔除6个个体,剩下112位教师,依次编号为1,2,3,…,112;2.课本第59页练习2,3 本节课学习的主要内容有:
1.了解系统抽样的概念;
2.理解系统抽样的步骤及其特点。1.《阳光课堂》课时训练(九)
2.预习课本60~61页再见!课件15张PPT。 第二章 统计2.1 随机抽样(3)第一步,将总体的N个个体编号.第二步,确定分段间隔k,对编号进行分段.第三步,在第1段用简单随机抽样确定起始个体编
号l.第四步,按照一定的规则抽取样本.(编号)(分段)(在第一段抽取个体)(抽取样本)二.系统抽样:1.系统抽样的定义2.用系统抽样步骤:3.系统抽样的优点与缺点:优点:(1)简便易行;
(2)当对总体结构有一定了解时,充分利用已有信息对总体 中的个体进行排除后再抽样,可以提高抽样效率;
(3)当总体中的个体存在自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法。缺点:在不了解样本总体的情况下,所抽出的样本可能有一定偏差。某地区有高中生2 400人,初中生10 900人,小学生
11 000人.当地教育部门为了了解本地区中小学生的
近视率及其形成原因,要从本地区的中小学生抽取
1%的学生进行调查,你认为应当怎样抽取样本?1.在此问题中总体中有几个个体?样本容量是多少?答:总体中的个体数为:2400+10900+11000=24300;
样本容量为24300×1﹪=2432.总体 中个体数较多,为了抽样方便,能不能直接用系统抽样从24300名中小学生中抽取243个个体?为什么?答:不能,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具有较好的代表性,应该分高中、初中、小学三个层次分别抽样.3.在高中,初中和小学三部分学生中都按1%的比例抽取,那么各抽取多少人? 答:高中生中抽取2 400×1%=24(人),
初中生中抽取10 900×1%=109(人),
小学生中抽取11 000×1%=110(人).答:由于样本总体较大,可以用系统抽样.我们可以按什么步骤抽取样本?第一步:确定各年龄段抽取的个体数目;高中生:2400/100=24; 初中生:10900/100=109;
小学生:11000/100=110.第二步:用系统抽样分别抽取24高中生、 109名初中生 、110名小学生作为样本;4.具体在三类学生中抽取样本时(如在10 800名初中生中抽取108人),可以用哪种抽样方法进行抽样?第三步:将被抽取的高中生、初中生、小学生汇合成所要抽取的样本。以上抽样方法就是我们本节课要学习的分层抽样。1.分层抽样定义:总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”.三.分层抽样2.分层抽样的步骤: (2)计算样本容量与总体的个体数的比;(5)综合每层抽样,组成样本.(4)在每一层进行抽样;(可用简单随机抽样或系统抽样)(分层)(计算比)(确定各层抽取的个体数)( 在每一层抽样)(组样)(1) 将总体按一定的标准分层;(3)计算各层中抽取的个体数;3.分层抽样的优点:使样本具有较强的代表性,并且抽样过程中可综合
选用各种抽样方法,因此分层抽样是一种实用、操
作性强、应用比较广泛的抽样方法。样本容量与总体的个体数之比是分层抽样的比例常数,
按这个比例可以确定各层应抽取的个体数,如果各层
应抽取的个体数不是整数该如何处理?答:可以四舍五入或将该层等可能剔除多余个体。简单随机抽样、系统抽样和分层抽样既有其共性,又
有其个性,根据下表,你能对三种抽样方法作一个比较
吗?4.简单随机抽样、系统抽样和分层抽样的区别与联系:D1.某高中共有900人,其中高一年级300人,高二年级200人,
高三年级400人,现采用分层抽样抽取容量为45的样本,那么
高一、高二、高三各年级抽取的人数分别为( )A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,202.某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。为解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
(A)9 (B)18 (C)27 (D) 36B3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.完成①②这两项调查采用的抽样方法依次为 ( ).A.分层抽样法、系统抽样法
B.分层抽样法、简单随机抽样法
C.系统抽样法、分层抽样法
D.简单随机抽样法、分层抽样法B4.一个单位的职工500人,其中不到35岁的有125人,35到49岁
的有280人,50岁以上的有95人。为了了解这个单位职工与身
体状况有关的某项指标,要从中抽取一个容量为100的样本。
由于职工年龄与这项指标有关,试问:应用什么方法抽取?解:1)确定样本容量与总体的个体数之比100:500 = 1:53)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56,19人,然后合在一起,就是所抽取的样本。 本节课学习的主要内容有:
1.了解分层抽样的概念;
2.理解系统抽样的步骤及其特点;
3.理解三种抽样方法的区别与联系。《阳光课堂》课时训练(十)再见!课件10张PPT。 第二章 统计2.1 随机抽样(4)1.某地有2000人参加自学考试,为了解他们的成绩,从中抽取
一个样本,若每个考生被抽到的概率都是0.04,则这个样本
的容量是_________802.已知总体为106,若用随机数表法抽取一个容量为10的样本.下面对总体的编号正确的是( )。
A、 1,2,…,10 B、 0,1,…,105
C、00,01,…,105 D、 000,001,…,105D3.下列抽样试验中,最适宜用系统抽样法的是 ( )。
A.某市的4个区共有2000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.从某厂生产的2000个电子元件中随机抽取5个入样
C.从某厂生产的2000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样C4.若总体中含有1645个个体,现在要采用系统抽样,从中抽取
一个容量为35的样本,编号后应均分为________段,每段
有________个个体.47355.在10 000个有机会中奖的号码(编号为0000~9999)中,有关部门按照随机抽样的方式确定后两位数字是68的号码为中奖号码.这是运用哪种抽样方法来确定中奖号码的( )。
A.抽签法 B.系统抽样法
C.随机数表法 D.其他抽样方法B6.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )。
A.2 B.4 C.5 D.6A7.一支田径运动队有男运动员56人,女运动员42人.现用分层
抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女
运动员有_________68.某单位有200名职工,现要从中抽取40名职工作样本,用系统抽
样法,将全体职工随机按1~200编号,并按编号顺序平均分为40
组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则
第8组抽出的号码应是 . 37 10.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,
现用分层抽样的方法从该校高中三个年级的学生中抽取容量
为50的样本,则应从高二年级抽取 名学生. 159.(2013年新课标I高考)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )。
A、简单随机抽样 B、按性别分层抽样
C、按学段分层抽样 D、系统抽样C11.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法1:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个.
方法2:采用系统抽样的方法,将所有零件分为20组,每组5个,然后从每组中随机抽取1个.
方法3:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法中正确的是( )。
①不论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都相等;②采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同;③在上述三种抽样方法中,方法3抽到的样本比方法1和方法2抽到的样本更能反映总体的特征;④在上述抽样方法中,方法2抽到的样本比方法1和方法3抽到的样本更能反映总体的特征.A.①② B.①③ C.①④ D.②③B12.某初级中学有学生270人,其中一年级108人,二、三
年级各81人.现要抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是( ).
A.②③都不能为系统抽样 B.②④都不能为分层抽样
C.①④都可能为系统抽样 D.①③都可能为分层抽样。D14.(2013年陕西高考) 某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, …, 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为( )
(A) 11 (B) 12 (C) 13 (D) 14B15.某初级中学共有学生2 000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率
是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三
年级抽取多少名?
解:(1)由题意,得x/2000=0.19,解得x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500.
现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为0.024×500=12.
解:(1)采用随机的方式给这2 006名同学编号为1,2,3,4,…,
2006;
(2)利用简单随机抽样的方式剔除6个个体,将剩余的学生
重新编号为1,2,3,4,…,2000;
(3)分段.由于20∶2 000=1∶100,故将总体分为20个部分,其中每一部分有100个个体;
(4)在第一部分随机抽取1个号码,比如66号;
(5)从第66号起,每隔100个抽取1个号码,这样得到一个容量为20的样本:
66,166,266,366,466,566,666,766,866,966,1066,1166,1266,1366,1466,1566,1666,1766,1866,1966.16.从2 006名同学中抽取一个容量为20的样本,试叙述用
系统抽样法抽样的步骤.再见!课件18张PPT。 第二章 统计2.2 用样本估计总体(1) 在前面我们学习了如何收集样本数据,但仅根据原始数据,仍无法作出判断。因此必须通过图、表或计算来分析样本数据,再对总体作出合理的判断,这就是我们本节课开始要学习的——用样本估计总体。 主要学习用样本的频率分布估计总体分布和用样本的数字特征估计总体的数字特征 。我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?一.用样本的频率分布估计总体分布①采用抽样调查的方式获得样本数据
②分析样本数据来估计全市居民用水量的分布情况 思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:(课本第66页) 答:最大值是4.3t,最小值是0.2t,其他在0.2~4.3t之间。 除了以上信息外,很难发现这100位居民的用水量的其他信息,因此要对数据进行整理与分析。
分析数据的基本方法是画图或用表格改变数据的排列方式。(一)频率分布直方图1.频率分布的概念:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布 我们如何画频率分布直方图?第一步: 求极差: (数据组中最大值与最小值的差距) 最大值=4.3 最小值=0.2
所以极差=4.3-0.2 =4.1第二步: 决定组距与组数: (注意取整) 当样本容量不超过100时, 按照数据的多少, 常分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t). 则 第三步: 将数据分组:( 给出组的界限) 所以将数据分成9组较合适. [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5)共9组. 第四步: 列频率分布表. 频率=频数/样本容量5.画频率分布直方图小长方形的面积=频率
各小长方形的面积之和等于1同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。 (同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断 )
通过频率分布直方图你可以发现什么?月均用水量在[2,2.5)内的居民最多,在[1.5,2)内次之,大部分居民的月均用水量在[1,3)之间。
观察直方图发现居民用量的分布有何特点?居民用水量的分布呈“单峰状”,有一定的对称性,说明大部分居民的月均用水量集中在一个中间值附近,只有少数居民的用水量很多或很少。你认为频率分布直方图有什么优点与缺点?你认为频率分布表与频率分布直方图的区别?频率分布表列出的是在各个不同区间内取值的频率。
频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。优点:能够很容易表示大量数据,非常直观的表明分布形状,
使我们能够看到在分布表中看不清楚的一些数据模式。
缺点:虽可以大致估计出总体的分布情况,但不能保留原来
的数据信息,在精确度要求较高的情况下不适用。 1.如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗 ?由表和图可看出,月用水量在3t以上的居民所占的比例为6﹪+4﹪+2﹪=12﹪ ,即大约有12﹪的居民用水量在3t以上,88﹪的居民用水量在3t以下。因此,居民用水量标准定为3t是一个可以考虑的标准。2.你认为3t这个标准一定可以保证85﹪以上的居民用水不超标吗?如果不一定,哪些环节可能会导致结论的误差?答:不一定。在抽取100位居民用水量时,不一定有很强的代表性。 下表给出了某校500名12岁男孩中用随机抽样得出的120人
的身高(单位:cm).(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率
为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人
数占总人数的19%.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.课本第81页A组2再见!课件16张PPT。 第二章 统计2.2 用样本估计总体(2)(一)频率分布直方图1.频率分布的概念:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布 2.画频率分布直方图的步骤:第一步: 求极差: (数据组中最大值与最小值的差距) 第二步: 决定组距与组数: (注意取整) 第三步: 将数据分组:( 给出组的界限) 第四步: 列频率分布表. 第五步:画频率分布直方图3.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图 由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量和分组情况的变化而变化的。课本例子中样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?样本容量越大,这种估计越精确。4.总体密度曲线:当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线。总体密度曲线月均用水量/tab (图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时,一般样本
容量越大,频率分布直方图就会无限接近总体密度曲线,就
越精确地反映了总体的分布规律,即越精确地反映了总体在
各个范围内取值百分比 可以用样本的频率分布折线图得到准确的总体密度曲线吗?详看课本第69~70页相关内容。CAD120DC5.6.7.如图是总体密度曲线,下列说法正确的是( )
(A)组距越大,频率分布折线图越接近于它
(B)样本容量越小,频率分布折线图越接近于它
(C)阴影部分的面积代表总体在(a,b)内取值的百分比
(D)阴影部分的平均高度代表总体在(a,b)内取值的百分比C 8.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)
为达标,试估计该学校全体高
一学生的达标率是多少?(2)由图可估计该学校高一学生的达标率为再见!课件20张PPT。 第二章 统计2.2 用样本估计总体(3)1.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中再用分层抽样的方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出 人252.一个高中研究性学习小组对本地区2009年至2011年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭_________万盒.85 3.(二)茎叶图 频率分布表、 频率分布直方图能帮助我们理
解数据,除此之外统计中还有一种被用来表示数据
的图叫做茎叶图。1.茎叶图概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。 甲、乙两人比赛得分记录如下:
甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39
乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39
用茎叶图表示两人成绩,说明哪一个成绩好.甲 乙0
1
2
3
4
5
2, 5
5, 4
1, 6, 1, 6, 7, 9
4, 9
0 8
4, 6, 3
3, 6, 8
3, 8, 9
1 叶 茎 叶2.画茎叶图的步骤:(3)将各个数据的叶按大小次序
写在其茎右(左)侧.(1)将每个数据分为茎(高位)和叶(低位)两部分;
在此例中,茎为十位上的数字,叶为个位上的数字;(2)将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;注:叶的数据不一定就要按大小次序排列。你认为茎叶图有哪些优点与缺点?优点:(1)茎叶图没有原始数据信息的损失,所有
数据信息都可以从茎叶图中得到;
(2)茎叶图中的数据可以随时记录,随时添加,方
便记录与表示。 缺点:茎叶图只便于表示两位或一位有效数字的数据,对位数多的数据不太容易操作;当样本数据较多时,茎叶图的枝叶很长,表示不方便。 通过例子中的茎叶图,你能够比较两个人的成绩吗?(1)乙运动员的平均成绩比甲运动员的平均成绩更好;(或乙运动员的成绩普遍比甲运动员的成绩好)(从平均值角度考虑)(2)甲运动员成绩的中位数为26,乙运动员成绩的中位数31,乙运动员的成绩较好;(从中位数角度考虑)(3)甲运动员的成绩较乙运动员的成绩分散;(乙运动员的成绩较甲运动员的成绩更稳定)(从离散程度角度考虑)(4)乙运动员的成绩基本对称,而且大多数集中在中间值附近,甲运动员的成绩大致对称,分布较均匀。(从数据分布的对称性角度考虑) 因此,从以上比较可以看出:乙运动员的成绩比甲运动员的成绩更好。1.课本第71页练习第3题解: 由茎叶图可以看出该车间30名工人的日加工零件个数稳定在120件左右。2.如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是( )(A)65 (B)64 (C)63 (D)62CAA.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分3.下图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( ).4.(2013年重庆高考)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为 ( )。
A.2,5 B.5,5 C.5,8 D.8,8C5.(2009年福建高考)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示。记分员在去掉一个最高分和一个最低分后,算的平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清。若记分员计算无误,则数字x应该是___________1 在样本的频率分布估计总体分布中学习的主要内容:
1.列频率分布表; 2.画频率分布直方图;
3.画茎叶图;
4.利用相关知识进行分析,并作出判断。1.课本第81页习题2.1A组 1.(1)(2)
2.《阳光课堂》课时训练(十一)再见!课件15张PPT。 第二章 统计2.2.2 用样本的数字特征估计总体的数字特征(1)(一) 众数、中位数、平均数1. 众数、中位数、平均数的概念(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. (2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数: 一组数据的算术平均数,即 在初中我们学过众数、中位数和平均数的有关知识,这
些数据都是反映样本信息的数字特征,它们又是如何定义的? 在一次中学生田径运动会上,参加男子跳高的17名运动员
的成绩如表所示: 这组数据的平均数是:
(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).答:17名运动员成绩的众数、中位数、平均数依次为1.75m,1.70 m,1.69 m.分别求这些运动员成绩的众数、中位数与平均数.解:由表中数据可知:1.75出现了4次,出现的次数最多,所以这组数据的众数是1.75.上表数据可看成是按从小到大的顺序排列的,其中最中间
和数据为1.70,所以这组数据的中位数是1.70; 众数应该在面积最大的矩形内,所以猜测众数2 ~2.5范围之内,一般地,取最高矩形下端中点的横坐标2.25作为众数. 在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?众数:最高矩形下端中点的横坐标 图中矩形的面积代表什么?中位数两边的图形面积有什么联系?如何用频率分布直方图估计中位数? 中位数两边的面积是相等的,都是0.5,从左至右各矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四组之和为0.49,中位数在第五组。中位数:2+0.5×(0.01/0.25)=2.02中位数:直方图面积平分线与横轴交点的横坐标. 用频率分布直方图,你能估算样本的平均数吗?0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t). 平均数等于各矩形面积与矩形底边中点的横坐标积的和。平均数:每个小矩形的面积与小矩形
底边中点的横坐标的乘积之和. 从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗? 答:频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.注: 在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.求众数、中位数、平均数有哪些不同的方法?2.众数、中位数、平均数的方法:(1)用样本数据计算;(2)用频率分布直方图估算。 根据众数、中位数、平均数各自的特点,你能分析它们对
反映总体存在的不足之处吗? 答:(1)众数体现了样本数据的最大集中点,但它对其它数据
信息的忽视使得无法客观地反映总体特征;(2)中位数是样本数据所占频率的等分线,它不受少数几个极
端值的影响,这在某些情况下是优点,但它对极端值的不敏
感有时也会成为缺点;(3)由于平均数与每一个样本的数据有关,所以任何一个样本数
据的改变都会引起平均数的改变,这是众数、中位数都不具有
的性质.也正因如此,与众数、中位数比较起来,平均数可以反映
出更多的关于样本数据全体的信息,但平均数受数据中的极端
值的影响较大,使平均数在估计时可靠性降低.注:使用者常根据自己的利益选择众数、中位数、平均数来描述数据的中心位置,从而产后一些误导。假设你是一名交通部门的工作人员。你打算向市长报告国家对本市26条公路项目投资的平均资金数额,其中一条新公路的建设投资为2 200万元人民币,另外25个项目的投资在20万与100万.中位数是25万,平均数是100万,众数是20万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?(课本第74练习)答:选择平均数更好。因为,此时的众数20万比中位数25万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征 以往的招生统计数据显示,某所大学录取的新生高考总分的中位数基本上稳定在550分.你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择。答:应立即劝这位同学查阅一下这所大学招生的其它信息。查看一下这所大学近几年招生的平均数,如果平均数低于550分,说明这所大学每年的招生中,存在只招入少数高分学生的现象,大部分学生都是低于中位数录取的,可以报报看,否则不能报。如果能查到该校每年录取的最低分数线那是最好的 (课本第81页习题2.2A组 3)某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数、中位数、众数.
(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工新的平均数、中位数和众数又是什么?
(3)你认为哪个统计量更能反映这个公司员工的工资水平?解 :(1)公司职工月工资的平均数为 若把所有数据从大到小排序,则得到:中位数是1 500元,
众数是1 500元. (2)若董事长、副董事长的工资提升后,职工月工资的平均数为∴中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的
工资水平,因为公司少数人的工资额与大多数人的工资额差
别较大,这样导致平均数与中位数偏差较大,所以平均数不
能反映这个公司员工的工资水平.小结:样本的众数、中位数和平均数常用来表示样本数据的
“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.某工厂人员及工资构成如下: (1)指出这个问题中周工资的平均数.
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?(2)因平均数为300,由表格中所列出的数据可见,只有经理
在平均数以上,其余的人都在平均数以下,故用平均数不能
客观真实地反映该工厂的工资水平.再见!课件24张PPT。 第二章 统计2.2.2 用样本的数字特征估计总体的数字特征(2)(一) 众数、中位数、平均数1. 众数、中位数、平均数的概念2.求众数、中位数、平均数的方法:(1)用样本数据计算;(2)用频率分布直方图估算。①众数:最高矩形下端中点的横坐标②中位数:直方图面积平分线与横轴交点的横坐标. ③平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数、中位数、众数.
(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工新的平均数、中位数和众数又是什么?
(3)你认为哪个统计量更能反映这个公司员工的工资水平?(1)求该公司职工月工资的平均数、中位数、众数.解 :(1)公司职工月工资的平均数为 把表格中的数据看作从大到小的顺序排列,最中间的数为
1500,所以中位数是1 500元;
在表格数据中1500出现20次,出现次数最多,所以众数是
1 500元. 解:(2)若董事长、副董事长的工资提升后,职工月工资的平
均数为中位数是1 500元,众数是1 500元.(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到
30 000元、20 000元,那么公司职工新的平均数、中位数和众
数又是什么?解:(3)在这个问题中,中位数和众数都能反映出这个公司员
工的工资水平,因为公司少数人的工资额与大多数人的工资
额差别较大,这样导致平均数与中位数偏差较大,所以平均
数不能反映这个公司员工的工资水平.(3)你认为哪个统计量更能反映这个公司员工的工资水平? 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况。因此,我们需要一个统计数字刻画样本数据的离散程度,这就是我们本节课要学习的——标准差、方差. 在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练员,如何对这二人的成绩作出评价? 如果从比较两组数据的集中趋势,我们可以从众数、中位数、平均数,但较多选择平均数。由数据可得:因此,从平均数角度不能看出二人的差异。甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数 由条形图可知:甲的成绩比较分散,乙的成绩相对集中,比较稳定. 对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度? 答:还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.1.如何用数字去刻画这种分散程度呢?答:考察样本数据的分散程度的大小,最常用的统计量
是标准差.标准差是样本数据到平均数的一种平均距离,2.所谓“平均距离”,其含义如何理解? 在统计中,我们通常用标准差来考察样本数据的离散程度,标准差是样本数据到平均数的一种平均距离。(二)标准差、方差:1.标准差:2.方差:注:在刻画样本数据分散程度上,方差s2与标准差s是一样的。但是在解决实际问题时,一般多采用标准差s 。对标准差的理解:(1)标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平均数周围的程度。标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散。(2)在实际应用中,标准差常被理解为稳定性。(3) 标准差是非负的。标准差为0意味着所有的样本数据都相等的特性,且与样本平均数也相等。∴从平均成绩看甲、乙二人的成绩无明显差异。 因此,在例子中的解答过程可表述为:解:由数据可得:∴乙比甲的射击成绩稳定∴如果我是教练员,我认为乙的成绩更好,应派乙参加比赛。1.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.小结:1.如图是某校举行的元旦诗歌朗诵比赛中,
七位评委为某位选手打出分数的茎叶统计图,
去掉一个最高分和一个最低分,所剩数据
的平均数和方差分别为( )
(A)84,4.84 (B)84,1.6
(C)85,1.6 (D)85,0.4【解析】选C.得分是79,84,84,86,84,87,93,最高分是93,最低分
是79,则去掉一个最高分和一个最低分后该选手得分是84,84,
86,84,87,计算得平均数是85,方差是1.6.3.一组数据中,每一个数都减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别为( )
(A)81.2,4.4 (B)78.8,4.4 (C)81.2,84.4 (D)78.8,75.64.从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:
甲:25、41、40、37、22、14、19、39、21、42;
乙:27、16、44、27、44、16、40、40、16、40;
(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?∴乙种玉米的苗长得高. (2)由方差公式得:∴甲种玉米的苗长得齐. 答:乙种玉米苗长得高,甲种玉米苗长得齐.解:甲品种的样本平均数为10,样本方差为乙品种的样本平均数也为10,样本方差为∵0.244>0.02
∴由这组数据可以认为甲种水稻的产量
比较稳定.2.某工厂人员及工资构成如下: (1)指出这个问题中周工资的平均数.
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?(2)因平均数为300,由表格中所列出的数据可见,只有经理
在平均数以上,其余的人都在平均数以下,故用平均数不能
客观真实地反映该工厂的工资水平.再见!课件17张PPT。 第二章 统计2.3 变量之间的相关关系(1) 在学校,老师经常对学生这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。这种说法有没有依据呢? 凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素。例如,是否喜欢物理,用在物理学习上的时间等等。当我们主要考虑数学成绩对物理成绩的影响时,就是主要考虑这两者之间的相关关系。 在现实生活中存在大量的相关关系的问题,你能举出一些例子吗?1〉商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关。2〉粮食产量与施肥量之间的关系。在一定范围内,施肥量越大,粮食产量就越高。但是,
施肥量并不是决定粮食产量的唯一因素,因为粮食产
量还要受到土壤质量、降雨量、田间管理水平等因素
的影响。 3〉人体内脂肪含量与年龄之间的关系。在一定年龄段内,随着年龄的增长,人体内的脂肪
含量会增加,但人体内的脂肪含量还与饮食习惯、
体育锻炼等有关,可能还与个人的先天体质有关。 应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”。但是,不管你经验多么丰富如果只凭经验办事,还是很容易出错的。因此,在分析两个变量之间的关系时,我们还需要有一些有说服力的方法。一.变量之间的相关关系:1.变量间相关关系的定义:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.2.相关关系与函数关系的异同点:(1)相同点:两者均是指两个变量间的关系。(2)不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量间的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.探究下面变量间的关系是函数关系还是相关关系。(1)球的体积与该球的半径;
(2)粮食的产量与施肥量;
(3)小麦的亩产量与光照;
(4)匀速行驶车辆的行驶距离与时间;
(5)角α与它的正切值1.课本第85页练习1,2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 根据以上数据你能判断人体的脂肪含量与年龄之间有怎样的关系吗?二.两个变量的线性相关:思考1:对某一个人来说,他的体内脂肪含量不一定随
年龄增长而增加或减少,但是如果把很多个体放在一
起,就可能表现出一定的规律性.观察上表中的数据,
大体上看,随着年龄的增加,人体脂肪含量怎样变化?大体上看,随着年龄的增加,人体中脂肪百分比也在增加。思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗? 思考3:上图叫做散点图,你能描述一下散点图的含义吗? 1.散点图:在平面直角坐标系中,表示具有相关关系
的两个变量的一组数据图形,称为散点图.思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系? 从散点图可看出,年龄越大,体内的脂肪含量越高。思考5:在以上散点图中,点的分布有何特点?这些点散布在从左下角到右上角的区域2.正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。思考6:如图是高原含氧量与海拔高度的相关关系的散点图,高原含氧量与海拔高度有何相关关系?点的分布有何特点?海平面以上,海拔高度
越高,含氧量越少。点散布在从左上角到右
下角的区域内。3.负相关:在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关。 画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关. 思考7:你能列举一些生活中的变量成正相关或负相关的实例吗? 以下是某地搜集到的新房屋的销售价格和房屋的
面积的数据:由散点图可知:各点散布在从左下角到右上角的区域里,因此,新房屋的销售价格与房屋的面积之间成正相关,即新房屋的房屋面积越大,销售价格越高。解:《阳光课堂》第41页题组集训1,2(1),(2) 本节课学习的主要内容:
1.变量之间相关关系的概念;
2.根据样本数据画散点图,并能得用散点图进行简单的分析。1.课本92页练习2
2.预习课本87~91页内容再见!课件23张PPT。 第二章 统计2.3 变量之间的相关关系(2)一.变量之间的相关关系:1.变量间相关关系的定义:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.2.相关关系与函数关系的异同点:(1)相同点:两者均是指两个变量间的关系。(2)不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系. 函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量间的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 二.两个变量的线性相关:1.散点图:在平面直角坐标系中,表示具有相关关系
的两个变量的一组数据图形,称为散点图.2.正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。3.负相关:在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关。 一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗? 样本点的中心的坐标为样本数据的平均数;它不一定是散点图中的点。 这些点散布在从左下角到右上角的区域内,且大致在一条直线附近. 在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?4.线性相关关系的有关概念:如果散点图中的点的分
布,从整体上看大致在一条直线附近,则称这两个变
量之间具有线性相关关系,这条直线叫做回归直线. 对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?回归直线一定通过样本点的中心.回归直线与散点图中各点的位置应具有怎样的关系? 整体上最接近 在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计. 方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。如何具体的求出这个回归方程呢?方案二: 在图中选取两点画直线,使得直线两侧的点的个数基本相同。方案三: 在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。上述三种方案均有一定的道理,但可靠性不强, 求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小”。 对一组具有线性相关关系的样本数据:
,设其回归方程为
,可以用哪些数量关系来刻画各样本点
与回归直线的接近程度?为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适? 根据有关数学原理分析,当:时,总体偏差 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程
中, 分别表示回归方程的斜率,截距。5.最小二乘法求回归直线方程:(1)公式:回归方程为:20.9% 利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少?有一个同学家开了一个小卖部,他为了研究气温对热饮销售
的影响,经过统计,得到一个卖出的热饮杯数与当天气温的
对比表: (1)画出散点图;
(2)从散点图中发现气温与热饮杯数之 间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.解:(1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因
此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出
去的热饮杯数越少 (3)从散点图可以看出,这些点大致分布在一条直线的附近。由数据可得:(4)当x=2时∴某天的气温为2℃时,这天大约可以卖出143杯热饮.答:小卖部不一定能够卖出143杯左右热饮,原因如下:(1)回归方程中的截距和斜率都是通过样本估计出来的,存
在误差,这种误差可以导致预测结果的偏差.(2)既使截距和斜率的估计没有误差,也不可能百分之百地保
证对应于x的预报值,能够与实际值y很接近.我们不能保证
点(x,y)落在回归直线上,甚至不能百分之百地保证它落在
回归直线的附近.1.课本94页习题2.3A组1
2.《阳光课堂》41~43页题组集训3~72.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.
3.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.再见!课件15张PPT。 第二章 统计用样本估计总体练习练习课1.(2013年福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50), [50,60), [60,70), [70,80),[80,90), [90,100]加以统计,得到如图所示的频率分布直方图。已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )。A.588 B.480
C.450 D.120 B2.(2013年辽宁卷高考)某学校组织学生参加英语测试,
成绩的频率分布直方图如图,数据的分组一次为若低于60分的人数是15人,则该班的学生人数是( ).A.45 B.50
C.55 D.60B0.0044703.4.(2013年四川高考)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5,将数据分组成:时,所作的频率分布直方图是( )。A5.(2013年上海高考某学校高一年级男生人数占该年级学生人
数的40%.在一次考试中,男、女生平均分数分别为75、80,则这
次考试该年级学生平均分数为________.6.(2013年湖北高考卷)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4,则
(Ⅰ)平均命中环数为_________;
(Ⅱ)命中环数的标准差为_________.78727.抽样统计甲、乙两位设计运动员的5此训练成绩(单位:环),结果如下: 则成绩较为稳定(方差较小)的那位运动员成绩的方差为 .28.(2013年山东高考)将某选手的9个得分去掉1个最高分,去
掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎
叶图后来有一个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为 ( ).B9.为了了解小学生的体能情况,抽取了某小学同年级部分学生
进行跳绳测试,将所得数据整理后,画出频率分布直方图,已
知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小
组的频数为5.(1)求第四小组的频率;
(2)问参加这次测试的学生人数是多少?
(3)问在这次测试中学生跳绳次数的中位数落在第几小组内?解:(1)第四小组的频率为1-0.1-0.3-0.4=0.2; (2)参加这次测试的学生人数为 5/0.1=50;(3)由于中位数是所有数据中的中间值,故在频率分布直方
图中体现的是中位数的左右两边频数应相等,即频率也相
等,从而就是小矩形的面积和相等.因此在频率分布直方
图中将频率分布直方图中所有小矩形的面积一分为二的直
线所对应的成绩即为所求.故这次测试中学生跳绳次数的
中位数落在第3小组内.10.一次科技知识竞赛,两组学生成绩如下表: 已经计算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由 解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,
从成绩的众数比较,甲组的成绩好一些.(2)甲、乙两组成绩的中位数、平均分都是80分,其中,甲组
成绩在80分及以上的有33人,乙组成绩在80分及以上的有26
人,从这一角度来看甲组的成绩总体较好.∴甲组的成绩比乙组的成绩稳定.(4)从成绩统计表来看,甲组的成绩不低于90分的人数为
14+6=20,乙组的成绩不低于90分的人数为12+12=24.所以乙组成绩集中在高分段的人数多,同时乙组得满分的人数比甲组得满分的人数多6人,从这一角度来看,乙组的成绩较好.11.甲、乙两人在相同条件下各射靶10次,
每次射靶的成绩情况如图所示: (1)请填写表:(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(分析谁的成绩更稳定);
②从平均数和中位数相结合看(分析谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成
绩好些);
④从折线图上两人射击命中环数的走势看(分析谁更有潜力).(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(分析谁的成绩更稳定);
②从平均数和中位数相结合看(分析谁的成绩好些);
解:(2)①∵平均数相同,∴甲的成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,
∴乙的成绩比甲好些.解:③∵平均数相同,命中9环及9环以上的次数甲比乙少,
∴乙的成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次
以后就没有比甲少的情况发生,乙较有潜力.③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);
④从折线图上两人射击命中环数的走势看(分析谁更有潜力).再见!