广西南宁市江南区江西中学人教版必修三数学课件:第二章 统计 (6份打包)

文档属性

名称 广西南宁市江南区江西中学人教版必修三数学课件:第二章 统计 (6份打包)
格式 zip
文件大小 15.8MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2016-10-03 15:40:16

文档简介

课件26张PPT。第二章 统计
2.1 随机抽样
2.1.1 简单随机抽样1.正确理解简单随机抽样的概念;(重点)
2.掌握抽签法、随机数法的一般步骤.(难点)妈妈:“儿子,帮妈妈买盒火柴去.”
妈妈:“这次注意点,上次你买的火柴好多划不着.” ……
儿子高兴地跑回来.
孩子:“妈妈,这次的火柴全划得着,我每根都试过了.”笑过之后,谈谈你的看法. 这个调查具有破坏性,不能每根试过,不能展开全面调查.我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174 000平方公里,并以每年3 400平方公里的速度扩张. 你知道这些数据是怎么来的吗?通过调查获得的. 怎么调查?统计 统计1.总体: 统计中所考察对象某一数值指标的全体2.个体:总体中的每个元素4.样本容量:样本中个体的数目3.样本:从总体中抽取的部分个体所组成的集合 从15名同学中选出5名同学参加活动请说出:
总体、 个体、 样本容量、 样本 抽样方法抽样放回抽样:每次抽取一个个体后,先将它放回总体,然后再抽下一个个体不放回抽样:每次抽取的个体不再放回总体分层抽样简单随机抽样思考:食品卫生工作人员要对校园食品店的一批小包装饼干进行卫生达标检验,打算从中抽取一定数量的饼干作为检验的样本.其抽样方法是:将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回地抽取若干包,这种抽样方法就是简单随机抽样.那么简单随机抽样的含义是什么?简单随机抽样的含义:
  一般地,设一个总体含有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 就把这种抽样方法叫做简单随机抽样.思考:根据你的理解,简单随机抽样有哪些主要特点?
(1)总体的个体数有限;
(2)样本的抽取是逐个进行的,每次只抽取一个个体;
(3)抽取的样本不放回,样本中无重复个体;
(4)每个个体被抽到的机会都相等,抽样具有公平性.简单随机抽样的方法
思考1:假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?
抽签法
思考2:用抽签法(抓阄法)确定人选,具体如何操作?
用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后从中随机逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.思考3:一般地,抽签法的操作步骤如何?
第一步:将总体中的所有个体编号分别写在形状、大小相同的号签上.
第二步:将号签放在一个容器中,并搅拌均匀.
第三步:每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.思考4:你认为抽签法有哪些优点和缺点?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本的代表性差的可能性很大.随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数法,这里仅介绍随机数法怎样利用随机数表产生样本.下面摘取了附表1的第6行至第10行思考:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?
第一步:将800袋牛奶编号为000,001,002,…,799.
第二步:在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数).
第三步:从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.思考:一般地,利用随机数法从含有N个个体的总体中
抽取一个容量为n的样本,其抽样步骤如何?
第一步:将总体中的所有个体编号.
第二步:在随机数表中任选一个数作为起始数.
第三步:从选定的数开始依次向右(或者向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.例 为调查央视春节联欢晚会的收视率,有如下三种调查方案:
方案一:通过互联网调查.
方案二:通过居民小区调查.
方案三:通过电话调查.
上述三种调查方案能获得比较准确的收视率吗?为什么?
  这三种方案都有一定的片面性,不能得到比较准确的收视率. 某大学为了支援我国西部教育事业,决定从2012年应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.
【解析】抽签法
第一步:将18名志愿者编号,编号为1,2,3,…,18;
第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;
第三步:将18个号签放入一个不透明的盒子里,充分搅匀;
第四步:从盒子中逐个抽取6个号签,并记录上面的编号;
第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数法
第一步:将18名志愿者编号,编号为01,02,03,…,18;
第二步:在随机数表中任选一数作为开始,按任意方向读数;
第三步:每次取两位,凡不在01~18中的数,或已读过的数,都跳过去不作记录,依次记录下6个符合条件的数;
第四步:找出号码与编号对应的志愿者,就是志愿小组的成员.1.一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.提升总结2.利用随机数法抽取样本的步骤
(1)编号:将每个个体编号,各号数的位数相同.
(2)选起始号码:任取某行、某组的某数为起始号码.
(3)确定读数方向:一般从左到右读取.1.某中学进行了该学年期末统一考试,该校为了了解高
一年级1 000名学生的考试成绩,从中随机抽取了100名学
生的成绩单,就这个问题来说,下面说法正确的是( )
(A)1 000名学生是总体
(B)每个学生是个体
(C)1 000名学生的成绩是一个个体
(D)样本的容量是100D解:1 000名学生的成绩是总体,其容量是1 000,100名学生的成绩组成样本,其容量是100.2.为了了解全校240名学生的身高情况,从中抽取40名学
生进行测量,下列说法正确的是( )
(A)总体是240 (B)个体是每一个学生
(C)样本是40名学生 (D)样本容量是40D4.某市为了了解本市13 850名高中毕业生的数学毕业会考
的情况,要从中抽取500名进行数据分析,那么这次考察的
总体数为______,样本容量是____.13 8505003.为了测量所加工一批零件的长度,抽测了其中200个零件,在这个问题中,200个零件的长度是( )
(A)总体 (B)总体的容量
(C)总体的一个样本 (D)样本容量C1.简单随机抽样包括抽签法和随机数法,它们都是
等概率抽样,从而保证了抽样的公平性.2.简单随机抽样有操作简便易行的优点,在总体个数较小的情况下是行之有效的抽样方法.3. 抽签法和随机数法各有其操作步骤,首先都要对总体中的所有个体编号,编号的起点不是惟一的.知识网络结构概念抽样方法方法步骤特点方法步骤特点 抽 签 法随机数法简单随机抽样奔向理想人生的征途是漫长的,但是只要坚强不屈地向前奋进,理想就一定会实现.课件24张PPT。2.1.2 系统抽样1.正确理解系统抽样的概念;(重点)
2.掌握系统抽样的一般步骤;(难点)
3.正确理解系统抽样与简单随机抽样的关系.简单随机抽样的概念 一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.用随机数法抽取样本的步骤:编号;选数;读数;取个体.适用范围:总体中个体数较少的情况,抽取的样本容量也较小时.用抽签法抽取样本的步骤:编号;制签;搅匀;
抽签;取个体.那么当总体个数较多时,适宜采用什么抽取方法?思考1:某校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?我们可以按照这样的方法来抽样:首先将这500名学生从1开始进行编号,然后按号码顺序以一定的间隔进行抽取.
由于500/50=10,这个间隔可以定为10,即从号码1-10的第一个间隔中随机地抽取一个号码,例如:抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到:6,16,26,36,… ,496.系统抽样思考2:如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作? 第一步:将这600件产品编号为1,2,3,…,600.
第二步:将总体平均分成60部分,每一部分含10个个体.
第三步:在第1部分中用简单随机抽样抽取一个号码(如8号).
第四步:从该号码起,每隔10个号码取一个号码,就得到一个容量为60的样本.
(如8,18,28,…,598)系统抽样的含义
  先将总体中的个体逐一编号,然后将号码顺序以一定的间隔k进行抽取,先从第一个间隔中随机地抽取一个号码,然后逐个抽取的号码依次增加间隔数即得到所求样本.思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?
将总体中的所有个体编号.
思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?
先从总体中随机剔除5个个体,再均衡分成60部分.思考3:用系统抽样从含有N个个体的总体中抽取一个
容量为n的样本,要平均分成多少段,每段各有多少
个号码?
平均分成n段,每段各有 个号码.
思考4:如果N不能被n 整除怎么办?
从总体中随机剔除N除以n的余数个个体后再分段.思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?
总体中的个体数N除以样本容量n所得的商.思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?
用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n 的样本,其操作步骤如何?
第一步:将总体的N个个体编号.
第二步:确定分段间隔k,对编号进行分段.
第三步:在第1段用简单随机抽样确定起始个体编号l.
第四步:按照一定的规则抽取样本.思考8:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法使样本更具有代表性?
总体中个体数比较多;系统抽样使样本更具有代表性. 从容量为N的总体中抽取容量为n的样本,用系统抽样的一般步骤为:
(1)将总体中的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)将编号按间隔k分段(k∈N);
(3)在第一段用简单随机抽样确定起始个体的编号l(l ∈N,l≤k);
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号l+k,再加上k得到第3个个体编号l+2k,这样继续下去,直到获取整个样本.系统抽样实际上是将总体均分后的每一部分进行抽样,采用的是简单随机抽样.(1)当总体容量N较大时,采用系统抽样.
(2)将总体分成均衡的若干部分指的是将总体分段,
分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[ ].提升总结
由系统抽样的定义可知系统抽样有以下特征:例 某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?
解:第一步:随机剔除2名学生,把余下的320名学生编号为1,2,3,…,320.
第二步:把总体分成40个部分,每个部分有8个个体.
第三步:在第1部分用抽签法确定起始编号.
第四步:从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.下列抽样中不是系统抽样的是( )
(A)从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10 (超过15则从1再数起)号入样
(B)工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
(C)搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
(D)电影院调查电影的某一指标,请每排(每排人数相等)座位号为14的观众留下来座谈C解:选C.C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样. 1.为了解1 200名学生对学校某项教改试验的意见,打算从
中抽取一个容量为30的样本,考虑采用系统抽样,则分段
的间隔k为( )
(A)40 (B)30 (C)20 (D)12
2.为了了解参加一次知识竞赛的1 252名学生的成绩,决定
采用系统抽样的方法抽取一个容量为50的样本,那么总体
中应随机剔除的个体数目为( )
(A)2 (B)4 (C)5 (D)6AA 3.用系统抽样的方法从个体数为1 003的总体中抽取一个容
量为50的样本,在整个抽样过程中每个个体被抽到的可能
性为( )
(A)1/1 000 (B)1/1 003 (C)50/1 003 (D)50/1 000
4.从编号为1~50的50枚最新研制的某种型号的导弹中
随机抽取5枚来进行发射试验,若采用每部分选取的号码
间隔一样的系统抽样方法,则所选取5枚导弹的编号可能
为(  )
(A)5,10,15,20,25 (B)3,13,23,33,43
(C)1,2,3,4,5 (D)2,4,6,16,32 CB(1)系统抽样适用于总体容量较大,且个体之间无明显的差异.
(2)剔除的多余个体及第一段抽样都用简单随机抽样.
(3)抽样过程中是等可能抽样,即每个个体被抽到的可能性相等.
(4)是不放回抽样.1.系统抽样的特点  系统抽样的四个步骤可简记为:
  “编号—分段—确定起始的个体编号—抽取样本”.2.系统抽样的四个步骤3.简单随机抽样与系统抽样的区别与联系无论大事还是小事,只要自己是认为办得好的,就坚定地去办,这就是性格.课件25张PPT。2.1.3 分层抽样1. 正确理解分层抽样的概念;(重点)
2. 掌握分层抽样的一般步骤;(重点)
3. 会区分简单随机抽样、系统抽样和分层抽样,并会选择适当正确的方法进行抽样.(难点)简单随机抽样、系统抽样的特点是什么?简单随机抽样:①逐个不放回抽取; ②等可能入样;③总体容量较小.系统抽样:①分段,按规定的间隔在各部分抽取;②等可能入样;③总体容量较大. 设计抽样方法时,核心是如何使抽取的样本具有代表性.因此,应充分利用对总体的了解.当已知总体由差异明显的几部分组成时,如何才能使样本能更充分地反映总体的情况? 例1 假设某地区有高中生2 400人,初中生10 900人,小学生11 000人.此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本? 你认为哪些因素可能影响学生的视力? 设计抽样方法时需要考虑这些因素吗?
学段对视力有影响 需要请问上例中的总体是什么?
该地区的所有学生
总体可看成由几部分组成?
高中生2 400人,初中生10 900人,小学生11 000人你怎么从各部分中抽取样本?请动笔试试.
样本容量与总体个数的比例为1 100,
则高中应抽取人数为 =24人,
初中应抽取人数为 =109人,
小学应抽取人数为 =110人.1%的样本是什么含义?
样本容量是总体个体数的1%,即抽取总人数的1%:思考:有人说:“如果抽样方法设计得好,用样本进行视力调查与对24 300名学生进行视力普查的结果会差不多,而且对于教育部门掌握学生视力状况来说,因为节省了人力、物力和财力,抽样调查更可取.”你认为这种说法有道理吗?
有道理分层抽样的概念
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.1.应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等或相近.2.分层抽样的步骤: (1) 将总体按一定的标准分层;(2)总体与样本容量确定抽取的比例;(3) 确定各层抽取的样本数;(5)综合每层抽样,组成样本.(4)在每一层进行抽样(可用简单
随机抽样或系统抽样);开始分层计算比例定层抽取容量抽样组样结束按程序进行3.简单随机抽样、系统抽样、分层抽样的比较(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取将总体平均分成几部分,按预先制定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中个体较少总体中个体较多总体由差异明显的几部分组成?是系统抽样和分层抽样的基础例2、一个单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,如何抽取一个容量为100的样本?
分析:因为不同年龄段有明显的差异,故利用分层抽样.解:(1)确定样本容量与总体的个数之比为:100∶500=1∶5;
(2)利用抽样比确定各年龄段应抽取的个体数.依次是
即25,56,19;
(3)利用简单随机抽样或系统抽样的方法,在各年龄段分别抽取25,56,19人,然后合在一起,就是所要抽取的样本.分层抽样是一种实用性、操作性强,应用比较广泛的抽样方法,但必须保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.提升总结1.老师在班级50名学生中,依次抽取学号为5,10,15,
20,25,30,35,40,45,50的学生进行作业检查,这
种抽样方法是( )
(A)随机抽样 (B)分层抽样
(C)系统抽样 (D)以上都不是
解:选C.由所给的数据可以看出这种抽样方法为系统抽样.C2.某单位共有老、中、青职工430人,其中有青年职工
160人,中年职工人数是老年职工人数的2倍.为了解职
工身体状况,现采用分层抽样方法进行调查,在抽取的
样本中有青年职工32人,则该样本中的老年职工人数为( )
(A)9 (B)18 (C)27 (D)36B解:选B.由已知得中年职工人数和老年职工人数共为430-160=270(人).
中年职工人数是老年职工人数的2倍,则
中年职工人数为180,老年职工人数为90,
样本的容量为
则样本中的老年职工人数为3.某工厂生产A、B、C三种不同型号的产品,相应产品数量比为2∶3∶5,现用分层抽样方法抽取一个容量为n的样本,样本中A型号产品有16件,那么样本的容量n=____.解:由已知得:
∴n=80.
答案:80804.某农场在三种地上种玉米,其中平地210亩,河沟地
120亩,山坡地180亩,估计产量时要从中抽取17亩作为
样本,则平地、河沟地、山坡地应抽取的亩数分别是
________.7,4,65.某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.解:(1)样本容量与总体的个体数的比为=
(2)确定各种商店要抽取的数目:
大型:20× =2(家),中型:40× =4(家),
小型:150× =15(家);
(3)采用简单随机抽样在各层中抽取大型:2家;中型:
4家;小型:15家;这样便得到了所要抽取的样本.1.分层抽样的定义
2.分层抽样的步骤
步骤1—分层:根据已经掌握的信息,将总体分成互不相交的层
步骤2—求比:根据总体的个体数N和样本容量n计算抽样比k=n:N步骤3—定数:确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n
步骤4—抽样:按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本当你每天醒来,口袋里便装着24小时的时间,这是属于你自己最宝贵的财产.课件32张PPT。2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布1. 通过实例体会分布的意义和作用.
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.(重点)
3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. (难点)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.2000年全国主要城市中缺水情况排在前10位的城市 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费.(1)如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做
哪些工作?3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 这些数字告诉我们什么信息? 通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表: 很容易发现的是一个居民月平均用水量的最小值时0.2t,最大值是4.3t,其他在0.2t~4.3t之间.
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.
它可以使我们看到整个样本数据的频率分布情况.频率分布表和频率分布直方图(1)求极差(一组数据中的最大值与最小值的差).例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1(t).(2)决定组距与组数.
设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1.为方便其间,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么
组数=极差÷组距=4.1 ÷0.5=8.2,
因此可以将数据分为9组,这个组数是比较合适的,于是取组距为0.5,组数为9.(4)列频率分布表.
计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)(3)将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].列频率分布表:48152225146420.040.080.150.220.250.140.060.041001.00注意频数的合计应是样本容量,频率合计应是1.0.02频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”, “频率/组距” 五列,最后一行是合计(5)画频率分布直方图.
根据频率分布表可以得到如图所示的频率分布直方图:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234提升总结:频率分布直方图
第一步:画平面直角坐标系.
第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布. 月均用水量/t频率/组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各组的频率在图中哪里显示出来?
各小长方形的面积=频率.
各小长方体的面积之和是否为定值?
各小长方形的面积之和为1.宽度:组距高度:频率
组距月均用水量/t0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?频率/组距(1)居民月均用水量的分布是呈“山峰”状的,而且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性.
频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来. 如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民在3t以下,标准可定为3t.
在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?
在实践中,对统计结论是需要进行评价的.频率分布直方图如下:月均用水量/t0.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.o频率/组距利用样本频率分布对总体分布进行相应估计:
(1)上例的样本容量为100,如果增至1 000,其频率分布直方图的情况会有什么变化?假如增至10 000呢?
(2)样本容量越大,这种估计越精确.
(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.总体密度曲线月均用水量/tab(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比).o频率/组距总体密度曲线
  总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具.
  用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比.茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:
甲运动员得分:
13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39.茎叶图甲乙0
1
2
3
4
5
2 5
5 4
1 6 1 6 7 9
4 9
08
4 6 3
6 8
3 8 9

1叶就是从茎的旁边生长出来的数,表示得分的个位数字茎是指中间的一列数,表示得分的十位数字 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定.茎叶图的优、缺点:
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便.
但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长.1.将样本容量为100的数据按从大到小的顺序分为8组如下表:912131514141310频数87654321组号则第三组的频率为( )
(A)0.14 (B)1/14 (C)0.03 (D)3/14A2.将一个容量为50的样本数据分组后,组距和频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;
[27.5,30.5),6;[30.5,33.5],3.
则估计小于或等于30的数据大约占总体的(  )
(A)94%   (B)6%   
(C)88%   (D)12%A 3.某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32岁~52岁的知识分子所占的比例约是多少.【解析】(1)极差为67-28=39,取组距为5,分为8组. 分 组 频数 频率
[27,32) 3 0.06
[32,37) 3 0.06
[37,42) 9 0.18
[42,47) 16 0.32
[47,52) 7 0.14
[52,57) 5 0.10
[57,62) 4 0.08
[62,67] 3 0.06
合 计 50 1.00样本频率分布表:(2)样本频率分布直方图:年龄0.06
0.05
0.04
0.03
0.02
0.0127 32 37 42 47 52 57 62 67O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32岁~52岁的知识分子约占70%.频率/组距1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.课件29张PPT。2.2.2 用样本的数字特征估计 总体的数字特征1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
2. 理解用样本的基本数字特征来估计总体的基本数字特征.(难点)
3.会应用相关知识来解决简单的统计问题.(重点)1.对一个未知总体,我们常用样本的频率分布来估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
图、表
总体数据的数字特征 2.美国NBA在2006~2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29.
如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征来估计总体的数字特征. 1.众数的定义: 在一组数据中,出现次数最多的数据叫做这一组数据的众数.2.中位数的定义: 将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.3.平均数的定义:一组数据的和除以数据的个数所得到的数.思考1:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的中心点?众数、中位数、平均数月均用水量/t频率/组距0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?
  每个小矩形的面积即为所在组的频率,中位数左边和右边的直方图的面积应该相等.从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.
0.5-0.04-0.08-0.15-0.22=0.01,
0.5×(0.01÷0.25)=0.02,所以中位数是2.02. 月均用水量/t0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 o频率/组距思考4:平均数是频率分布直方图的“重心”,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计平均数. 由此估计总体的平均数是什么?
各小矩形底边中点的横坐标为:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.
各小矩形的面积为:0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02.月均用水量/t0.50
0.40
0.30
0.20
0.100.5 1 1.5 2 2.5 3 3.5 4 4.5 o频率/组距0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+
2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+
4.25×0.02=2.02(t).
所以平均数是2.02.
平均数与中位数相等,是必然还是巧合?
巧合思考5:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得的估计值与数据分组有关.
注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.思考6:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.
平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
甲、乙两人本次射击的平均成绩分别为多少环?标准差思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布直方图,你能说明其水平差异在哪里吗?
    甲的成绩比较分散,极差较大;
    乙的成绩相对集中,比较稳定.环数频率0.4
0.3
0.2
0.14 5 6 7 8 9 10 O(甲)环数频率0.4
0.3
0.2
0.14 5 6 7 8 9 10 O(乙)思考3:对于样本数据x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算? 含有绝对值,运算不方便.思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,…,xn的平均数为 ,则标准差的计算公式是:
那么标准差的取值范围是什么?标准差为0的样本数据有何特点?
s≥0,标准差为0的样本数据都相等. 计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
  
  s甲=2,s乙≈1.095. 例1 画出下列四组样本数据的条形图,
说明它们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;解:(1)(2)(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.(3)(4)例2 甲乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):
甲:
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39
乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48
从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
说明:生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.1.10名工人某天生产同一零件,生产的件数分别是15,
17,14,10,15,19,17,16,14,12,则这一天 10名工
人生产的零件的中位数是( )
(A)14 (B)16 (C)15 (D)17
【解析】选C.把件数从小到大排列为10,12,14,14,15,15,16,17,17,19,可知中位数为15.C2.某射击运动员在四次射击中分别打出了10,x,10,8环的成绩,已知这组数据的平均数为9,则这组数据的方差是______.
【解析】由9= 得x=8.
故s2= [(10-9)2+(8-9)2+(10-9)2+(8-9)2]
= ×4=1.
答案:13.甲、乙两个班各随机选出
15名同学进行测验,所得成
绩的茎叶图如图.从图中看,
_____班的平均成绩较高.
【解析】结合茎叶图中成绩
的情况可知,乙班平均成绩较高.
答案:乙4.(2012·济南高一检测)统计某校1 000名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于60分为及格,不低于80分为优秀,则及格人数是______;优秀率为______.【解析】由已知不低于60分及格,则及格的频率为
0.025×10+0.035×10+0.01×20
=0.25+0.35+0.2=0.8.
∴及格的人数为1 000×0.8=800.
不低于80为优秀,则优秀的频率为0.01×20=0.2.
∴优秀率为20%.
答案:800 20%1.样本的数字特征:众数、中位数和平均数.2.用样本频率分布直方图估计样本的众数、中位数和平均数.(1)众数规定为频率分布直方图中最高矩形上端的中点.(2)中位数两边的直方图的面积相等.(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.进步是从看到自己的落后开始的;高明是从解剖自己的弱点开始的.课件38张PPT。2.3 变量间的相关关系
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关1.理解两个变量的相关关系的概念.(重点)
2.会作散点图,并利用散点图判断线性相关关系.(难点)
3.了解最小二乘法的思想及回归方程系数公式的推导过程.
4.通过实例加强回归直线方程含义的理解,能够对实际问题进行分析和预测.城门失火殃及池鱼 世界是一个普遍联系的整体,任何事物都与其他事物相联系.
我们曾经研究过两个变量之间的函数关系:一个自变量对应着惟一的一个函数值,这两者之间是一种确定关系.生活中的任何两个变量之间是不是只有确定关系呢?请同学们举例说明.数学学习与物理学习
商业销售收入与广告之间
粮食产量与施肥量之间
人体脂肪含量与年龄之间
生活中相关成语:
“名师出高徒” , “瑞雪兆丰年”
“强将手下无弱兵” “虎父无犬子” 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.
例:(1)商品销售收入与广告支出经费之间的关系;
(2)粮食产量与施肥量之间的关系;
(3)人体内脂肪含量与年龄之间的关系.变量之间的相关关系相关关系是一种非确定关系不同点:1.函数关系是一种确定的关系,是两个非随机变量之间的关系;而相关关系是一种非确定关系,是非随机变量与随机变量之间的关系.
2.两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响.
3.需要通过样本来判断变量之间是否存在相关关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系. 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?   在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. 如果两个变量呈负相关,从整体上看这两个变量的变化趋势如何?
  一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.例1 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关. /平方米售价/万元正相关解:在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
答案:②③④ 年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
这些点大致分布在一条直线附近.回归直线我们再观察它的图象发现这些点大致分布在一条直线附近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线所对应的方程叫做回归方程.
那么,我们该怎样求出这个回归方程呢?
请同学们展开讨论,能得出哪些具体的方案?方案1.先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小的位置时,测出它的斜率和截距,得到回归方程.如图:方案2.在图中选两点作直线,使直线两侧的点的个数基本相同.方案3.如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距而得到回归方程. 如图:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),
…,(xn,yn),如何求回归方程?最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. 一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?例2 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表: (1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数./℃130128132150156热饮杯数12740-5摄氏温度13012813215015612740-55476938910411636312723191554769389104116363127231915解:(1)散点图如下:/℃(2)从散点图看到,各点散布在从左上角到右下角的
区域里,因此,气温与热饮销售杯数之间成负相关,即
气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附
近,因此利用公式求出回归方程的系数.得回归方程.
= -2.352x+147.767(4)当x=2时, =143.063.因此,某天的气温为2 ℃
时,这天大约可以卖出143杯热饮.1.下列说法中正确的是( )
(A)任何两个变量都具有相关关系
(B)球的体积和球的半径具有相关关系
(C)农作物的产量和施肥量之间是一种确定关系
(D)某商品的产量和该商品的价格之间是一种非确定关系解:选D.A的说法是错误的;球的体积和球的半径具有函数关系,故B错误;C中农作物的产量和施肥量之间是一种相关关系,故C错误;D是正确的.2.已知回归直线的斜率的估计值是1.23,样本点的中心
为(4,5),则回归直线的方程是( )
(A) =1.23x+4 (B) =1.23x+5
(C) =1.23x+0.08 (D) =0.08x+1.23
解:当x=4时,y=1.23×4+0.08=5,故选C.C3.已知x,y的取值如下表所示:
如果y与x线性相关,且线性回归方程为 ,则
=( )
(A) (B) (C) (D)
解:∵ 又 ,
B【思路点拨】本题可先利用公式求出回归直线方程,再求广告费用为6万元时的销售额.5.为分析初中升学的数学成绩对高一学生学习情况的影响,
在高一年级学生中随机抽取了10名学生,他们的入学成绩与
期末考试成绩如下表:
(1)若变量之间具有线性相关关系,求出回归直线的方程;
(2)若某学生的入学成绩为80分,试估计他的期末成绩.1.在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作如下判断:
(1)如果所有的样本点都落在某一函数曲线上,变量之间就是函数关系;
(2)如果所有的样本点都落在某一函数曲线的附近,变量之间就有相关关系;(3)如果所有的样本点都落在某一直线的附近,变量之间就有线性相关关系;
(4)如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系,即两个变量之间是相互独立的.2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归直线方程.3.求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数 ,  ;
第二步,求和 ,   ;
第三步,计算
第四步,写出回归方程. 追赶时间的人,生活就会宠爱他;放弃时间的人,生活就会冷落他.