【全程复习方略】2013-2014学年北师大版高中数学必修三配套多媒体教学优质课件第一章 统计(12份)

文档属性

名称 【全程复习方略】2013-2014学年北师大版高中数学必修三配套多媒体教学优质课件第一章 统计(12份)
格式 zip
文件大小 25.0MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2014-08-11 06:47:25

文档简介

课件13张PPT。 第一章 统计
§1 从普查到抽样1. 理解“总体”和“样本”的含义.
2. 了解收集数据的两种方法.实际问题确定调查对象收集数据……1、国家的各种宏观决策2、要了解一个人的血脂含量1、全国公民2、这人的血液1、普查2、抽样普查:指一个国家或一个地区专门组织的一次大规模的全面调查.抽样:按照一定的方法从调查对象中抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断.普查与抽样调查对象的全体称“总体”;
被抽取的部分称“样本”.总体与样本“普查”与“抽样”的优劣对比:方式普查抽样优点缺点得到的信息全
面、系统迅速;及时;
节约人力、物
力、财力工作量大,时间长,
耗人力、物力、财力获得的信息不够全面、系统普查:对象很少时;抽样:对象很多,或检验对象具有破坏性.选择普查或抽样的一般原则例1:医生是如何检验人的血液中血脂的含量是否偏高 的?你觉得这样做的合理性是什么?解:医生在检验人的血液中血脂含量是否偏高时,通常是抽取少量的血样进行检验,然后由此作出推断,认为这个人的血液状况基本如此. 医生在检验时是不可能将一个人的血液都抽出来进行普查的.例2:为了缓解城市的交通拥堵情况,某城市准备出台限制私家车的政策,为此要进行民意调查.某调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?解:一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机的抽样调查,不要只关注到拥有私家车的市民.例3:广州为了制定“禁摩”(禁止摩托车上路)政策要进行民意调查,某调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?抽样时,应当注意样本是否具有代表性.调查的结果肯定是同意此政策.但此结果不具有可信性.因为调查的对象既没有摩托车司机也没有普通市民,所以调查对象不具有代表性.2.在抽样调查中,应注意什么问题?答案:注意调查对象要有代表性.1.抽样与普查相比最明显的优点有哪些?优点:(1)迅速、及时.
(2)节约人力、物力和财力.1、收集数据的常用方法“普查”和“抽样”.2、对象很少时,普查方法比较好.对象很多,并且调查有破坏性的对象时,最好用抽样的方法.3、抽样时要注意样本的“代表性”.信念是生活的太阳,面对它时,酸楚的泪滴也会折射出绚丽的色彩.课件16张PPT。 §2 抽样方法
2.1 简单随机抽样1. 正确理解随机抽样的概念,掌握抽签法、随机数法的一般步骤.
2. 理解随机抽样的必要性和重要性. 调查的方法:普查、抽样抽样简单随机抽样系 统 抽 样分 层 抽 样简单随机抽样:
一般地,设总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N) ,如果每次抽取时,每个个体被抽到的概率都相等,这种抽样方法叫作简单随机抽样.特点:1、总体的个数有限(较少)
2、从总体中逐个进行抽取
3、不放回抽样
4、每个个体被抽到的机会相等思考:下列抽取样本的方法是简单随机抽样吗?
1. 从无限多个个体中抽取50个个体作为样本.
2. 从50个个体中一次性抽取5个个体作为样本.
3. 箱子里共有100个零件,现从中选取10个零件进行检验. 在抽样操作时,从中任意拿出一个零件检验,然后再把它放回箱子里.4. 将10个写有数字1、2、3、…、10 的小球放在透明的容器中,从中选取2个小球,检验两球的数字的和是否是偶数.不是不是不是不是简单随机抽样的类型
抽签法:
把总体中的个体的代号写在形状、大小相同的签上,然后将这些签均匀搅拌,每次随机地从中抽取一个(不放回),然后将签均匀搅拌,再进行下一次抽取.如此下去,直到抽到预先设定的样本数.抽签法的步骤:1. 把总体中的N个个体编号;2. 准备“抽签”的工具,实施“抽签”;3. 对样本中每一个个体进行测量或调查.例1. 某班有50名学生,现选取6名学生参加一个讨论会,每个学生被抽到的机会相等. 请用抽签法设计一个选取方案. 解:1. 给50名学生编号,号码为1、2、3、…、50.
2. 将50名学生的编号写在50张小纸片上,并揉成小球,制成号签.5. 对应上面6个编号的学生,即为所取学生.3. 将得到的号签放在一个不透明的容器中,搅拌均匀.4. 从容器中逐个抽取6个号签,并记录上面的编号.简单随机抽样的类型
随机数法
把总体中的N个个体依次编上 0、1、2、…、N-1 的号码,然后利用工具产生 0、1、2、…、N-1 中的随机数,产生的随机数是几,就选几作为个体,并把它写在空白纸上,直到抽到预先规定的样本数,这样得到的数表叫作随机数表.用随机数法进行抽取(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的.(3)用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等.因此并不是唯一的.(2)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码.(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了个体被抽到的概率是相等的.例2. 总体由80个个体组成,利用随机数表随机地选取10个样本.解:具体做法如下:
第一步 将总体中的每个个体进行编号:00、01、…、79.
第二步 由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.
从随机数表中任意一个位置,比如从课本1-2表中第六列和第七列这两列的第四行开始选数,由上至下分别是:82,52,90,91,19,11,07,60,76,62,18,19,87,21,
33,46, 08,…其中19重复出现,82,90,91,87超过79,不能选取.这样选取的10个样本的编号分别为:52,19,11,07,60,76,62,18,21,33. 请用抽签法设计一个调查方案,调查你所在的学校,学生喜欢体育课的情况.(总体数量为N , 样本容量为n)设计方案为:
1. 给全体学生编号:1、2、…、N.
2. 把编号写在N张小纸片上,并揉成小球,制成号签.
3. 将得到的号签放在一个不透明的容器中,搅拌均匀.4. 从容器中逐个抽取n个号签,并记录上面的编号.
5. 对应上面n个编号的学生,即为所取学生.
6. 对样本的每一个个体进行调查:
(1)设计调查问卷;
(2)发放调查问卷,并回收;
(3)汇总数据,得出结论,写成调查报告.抽签法 2.简单随机抽样的方法:随机数表法注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素. 一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样方法为简单随机抽样.1.简单随机抽样的概念修凿可以使道路平直,但只有崎岖的未经修凿的道路才是天才的道路.课件19张PPT。2.2 分层抽样与系统抽样1. 正确理解分层抽样、系统抽样的概念,掌握分层抽样、系统抽样的一般步骤.
2. 掌握分层抽样、系统抽样的特点,并能根据实际问题确定选用哪种抽样方法.1、什么是简单随机抽样?2、什么样的总体适合简单随机抽样? 设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样方法为简单随机抽样. 适用范围:总体的个体数不多时.若总体个数较多时,该怎么办呢? 将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.分层抽样例1:某地农田分布在山地、丘陵、平原、洼地不同的地形上,要对这个地区的农作物产量进行调查,应当采用什么抽样方法?解:由于不同类型的农田之间的产量有较大差异,应当采用分层抽样的方法,对不同类型的农田按其占总数的比例来抽取样本.例2:某公司有1000名员工,其中:高层管理人员为50名,属于高收入者;中层管理人员为150名,属于中等收入者;一般员工为800名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽取100名员工,应当怎样进行抽样?解:我们可以采用分层抽样的方法,按照收入水平分成三层:高收入者、中等收入者、低收入者. 从题中数据可以看出,高收入者为50名,占所有员工的比例为 ,为保证样本的代表性,在所抽取的100名员工中,高收入者所占的比例也应为5%,数量为100×5%=5,所以应抽取5名高层管理人员.
同理,抽取15名中层管理人员、80名一般员工,再对收入状况分别进行调查.强调两点:(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中,每个个体被抽到的概率相等,都等于 .(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实际应用中更为广泛. 将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样. 系统抽样例3:某工厂平均每天生产某种机器零件大约10000件,要求产品检验员每天抽取50件零件,检查其质量状况.假设一天的生产时间中生产机器零件的件数是均匀的,请你设计一个调查方案.第三步 从第一个时间段中按照简单随机抽样的方法,抽取一件产品,比如是k号零件.
第四步 顺序地抽取编号分别为下面数字的零件:k+200,k+400,k+600,…,k+9800,这样就抽取了容量为50的一个样本.例4 某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其质量状况.请你设计一个调查方案.解: 我们可以采用系统抽样,按照下面的步骤设计方案.
第一步 把这些图书分成40个组,由于 的商是9,余数
是2,所以每个组有9册书,还剩2册书.这时,抽样距就是9.
第二步 先用简单随机抽样的方法从这些书中抽取2册书,
不进行检验.
第三步 将剩下的书进行编号,编号分别为0,1,...,359. 第四步 从第一组(编号分别为0,1,…,8)的书中按照简单随机抽样的方法,抽取1册书,比如说,其编号为k.
第五步 顺序地抽取编号分别为下面数字的书:k+9,k+18,k+27,…,k+39×9,这样就抽取了容量为40的一个样本.系统抽样的特点:
将总体分成均衡的几部分, 然后按照预先定出的规则,从每一部分抽取一个个体,得到所需样本的抽样.适用于:总体和样本的容量较大的情况.1、确定分段情况和抽样距;
分段数=样本数, 抽样距=2、编号;
3、采用简单随机抽样从第一段内抽取第一个样本;
4、等距抽样,顺次抽取相应编号的样本.系统抽样步骤: 为了了解参加知识竞赛的1000名学生的成绩,现从中抽取一个容量为50的样本.请按系统抽样的方式设计一个抽样过程.解:采用系统抽样方式抽样.过程如下:
1、把所有的学生分成50组,抽样距为20.
2、对所有学生编号,编号为:1、2、…、1000;
3、用简单随机抽样法从第一组(编号为1、 2、…
20)中抽取第一个样本,编号设为 k.
4、等距抽取第 k+20、k+40、…、k+49×20 个编号,
得到编号为 k、k+20、…、k+980 的样本. 将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需样本的抽样.2.系统抽样与简单随机抽样的概率一样 1.分层抽样 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫作“层”.很多时候对一个事情的判定,并不能简单地以应该不应该和好不好来区分.你什么时间做这件事,把这件事做到什么程度,会直接影响到这件事的性质.“过”和“不及”都是要尽力避免的.课件17张PPT。 §3 统计图表 通过实例使学生初步体会分布的意义和作用;
在表示数据的过程中,掌握几种常用统计图表(条形,折线,扇形,茎叶图);
能根据问题的需要选择合适的统计图表灵活进行表示. 前面我们已经介绍了收集数据的一些方法.一旦数据被收集后,我们总希望从中找出所需要的信息. 但通过收集得到的数据一般比较多,我们无法直接将其包含的全部信息统统理解并加以表达,这样就需要对这些数据进行适当的整理、分析,将其转化为可以直接利用的形式,并从中获取相应的信息,以便帮助我们作出恰当的决策. 统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果. 我们在初中阶段已经学习过条形统计图、扇形统计图和折线统计图,在这里,我们将结合一些案例进一步对统计图表的特点和选用加以具体分析. 统计活动选取调查对象普查或抽样整理并分析数据列统计表
画统计图收集数据收集数据整理分析获取信息作出决策如何整理和分析已收集的数据, 较准确的获取信息,从而作出恰当的决策.------统计学的任务问题1:下图是对50人的智商情况调查后得到的统计图表.根据图表回答下列问题:人数/人1、有多少人的智商在 90~105 之间?
2、有多少人的智商低于100 ?
3、有多少人的智商不低于100? 显然,在50人中,有38人的智商在90~105之间,29人的智商低于100,21人的智商不低于100.你还能从图中获得什么信息?问题2 下面是关于某个总体包含的所有学生的身高分布的几种表述,其中哪一种表述反映的总体信息较多?
(1) 身高在160cm以下的学生数占50%,不低于160cm的学生数占50%.
(2) 身高在150cm以下、150~160cm之间、不低于160cm的学生数分别占10%,40%,50%.
(3) 身高在150cm以下、150~160cm之间,160~170cm之间、不低于170cm的学生数分别占10%,40%,40%,10%. 从该总体包含的所有学生的身高分布的几种表述(包括文字和统计图)来看,不难发现:从(1) ~(3),反映的总体信息依次增多. 在实际问题中,我们常常根据问题的需要来选择不同的表达方式,以获得对数据适当的了解.例 有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录下上午8:00~11:00间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
你能用不同的方式分别表示上面的数据吗?解:从上面的数据不易直接看出各自的分布情况,为此,我们可以先将以上数据按照不同的方式进行表示.上述的数据可以用如图所示的图形来表示,横线下面的数字表示销售额的十位数,上面的数字分别表示各自销售额的个位数.也可以用条形统计图(如图)将上图进行简化. 上述数据中乙的销售情况还可以用图来表示,其中,竖线左边的数字分别表示各自销售额的十位数,右边的数字表示销售额的个位数. 用同样的方式也可以表示甲的销售情况.为了方便比
较,我们仍用图中竖线左边的数字表示甲销售额的十位
数,在其左边再画一条竖线,用这条竖线左边的数字分别
表示甲销售额的个位数(如图).问题:根据下列数据列出统计数表
4,5,6,1,2,8,4,7,9,8,1,5,6,4,2,7,
9,3,4,5,8,7,6,2,4,5,8,6,5,6,8,9,
8,9,6,82 3 1 5 5 6 3 7 4 掌握几种常用统计图表(条形,折线,扇形,茎叶图)的表示方法.
能根据问题的需要选择合适的统计图表灵活地进行表示.今天和明天之间有一段很长的时间,趁你还有精神的时候,学习迅速办事.
——歌德课件21张PPT。§4 数据的数字特征
4.1 平均数、中位数、众数、极差、方差
4.2 标准差 1.根据实际问题的需求,能够从数据中提取基本的数字特征,如平均数、中位数、众数、极差、方差、标准差等.
2.通过实例理解数据标准差的意义和作用.
3.学会根据不同要求选择不同的统计量来表达数据的信息. 数据的信息除了通过前面介绍的用各种统计图表来加以整理和表达之外,还可以通过一些统计量来表述,也就是将多个数据“加工”为一个数值,使这个数值能够反映这组数据的某些重要的整体特征. 小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成,工作人员由五个领工和十个工人组成.工厂经营的很顺利,需增加一个新工人,小亮需要一份工作,应征而来与小明交谈.小明说:“我们这里报酬不错,平均薪金是每周300元.你在学徒期每周75元,不过很快就可以加工资了.”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小明说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表.”工资表如下:这到底是怎么了? 1.什么叫平均数?有什么意义?
2.什么叫中位数?有什么意义?
3.什么叫众数?有什么意义?
4.什么叫极差?有什么意义?
5.什么叫方差?有什么意义?
6.什么叫标准差?有什么意义?平均数、中位数、众数、极差、方差、标准差例1 某公司员工的月工资情况如下表所示:(1)分别计算该公司员工月工资的平均数、中位数和众数.
(2) 公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢?解:(1)该公司员工的月工资平均数为
即该公司员工月工资的平均数为1373元.(2)公司经理为了显示本公司员工的收入高,采用平均数1373作为月工资的代表;而税务官希望取中位数800,以便知道目前的所得税率对该公司的多数员工是否有利;工会领导则主张用众数700,因为每月拿700元的员工最多.中位数为800元,众数为700元.例2 在上一节中,从甲、乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示,如图所示:
(1)甲、乙两组数据的中位数、众数、极差分别是多少?
(2)你能从图中分别比较甲、乙两组数据的平均数和方差的大小吗?解:(1) 观察茎叶图,我们不难看出:甲城市销售额的中位数为20,众数为10,18,30,极差为53;乙城市销售额的中位数为29,众数为23,34,极差为38.(2)从茎叶图中我们不难看出:甲城市销售额分布主要在茎叶图的上方且相对较散,而乙城市的销售额分布则相对集中在茎叶图的中部.由此,我们可以估计:甲城市销售额的平均数比乙城市的小,而方差比乙城市的大. 平均数是将所有的数据都考虑进去得到的量,它是反映数据平均水平最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数经常被使用.例3 甲、乙两台机床同时生产直径是40mm的零件.为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示分别计算上面从甲、乙两台机床抽取的10件产品直径的标准差.,并判断哪一个机床更稳定.解:从数据容易得到甲、乙两台机床生产的这10件产品直径的平均值:
我们分别计算它们直径的标准差:/mm/mm 由上面的计算可以看出:甲、乙两台机床生产的产品直径的平均值相同,而甲机床生产的产品直径的标准差为0.161mm,比乙机床的标准差0.077mm大,说明乙机床生产的零件更标准些,即乙机床的生产过程更稳定一些. 对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度.1.下表是某班40名学生参加“环保知识竞赛”的得分统计表:请参照这个表解答下列问题:
用含x,y的式子表示该班参加“环保知识竞赛”的班平均分f;若该班这次竞赛的平均分为2.5分,求x、y的值.2. 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是__________答案:-33.甲、乙两种玉米苗各抽10株,分别测得它们的株高如下(单位:cm)问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?根据实际问题的需求,能够从数据中提取基本的数字特征,如平均数、中位数、众数、极差、方差、标准差等.
理解数据标准差的意义和作用.学会根据不同要求选择不同的统计量来表达数据的信息.即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.课件24张PPT。 §5 用样本估计总体
5.1 估计总体的分布学会用样本的频率分布估计总体.
会根据样本数据画出频率分布直方图及频率分布折线图. 从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息.如人口普查得到的数据较为全面,从中可以很好地反映对象的重要信息. 但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征. 如何通过样本来估计总体的分布情况呢?这就需要我们先将样本的分布情况表示出来.例 1895年,在英国伦敦有106块男性头盖骨被挖掘出.经考证,这些头盖骨的主人死于1665~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm),请你估计在1665~1666年之间,英国男性头盖骨宽度的分布情况.解:如果把总体看作是1665~1666年之间的英国男性头盖骨的宽度,那么我们就是通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成表: 从表格中,我们就能估计出总体大致的分布情况了,如在1665~1666年之间,英国男性头盖骨宽度主要在136~149mm之间,135mm以下以及140mm以上所占的比例相对较小等.但是,这些关于分布情况的描述仍不够形象. 为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数. 我们也可以用区间上矩形的面积来反映频率,得到下图. 我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约用水,计划在本市试行居民生活用水定额管理条例,即确定一个居民月用水量标准ɑ,用水量不超过ɑ的按平价收费,超过ɑ的按议价收费.如果希望大部分居民的日常生活不受影响,那么标准ɑ定为多少比较合理?你认为为了较为合理地确定出这个标准,需要做什么工作?根据这些数据你能得出用水量其他信息吗? 由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样,我们获得了100位居民某年的月均用水量(单位:t): 从上面这些数字,我们很容易发现居民的月均用水量的最小值是0.2t,最大值是4.3t.其他在0.2至4.3之间.很难再发现其他信息.我们很难从随意记录的数据中直接看出规律.为此,我们需要对统计数据进行整理与分析.这就用到了我们今天要学习的频率分布直方图.1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围4.3-0.2=4.1(t).2、决定组距与组数(将数据分组)3、将数据分组.(8.2取整,分为9组)画频率分布直方图的步骤:4、列出频率分布表.(学生填写频率/组距一栏)5、画出频率分布直方图.组距:指每个小组的两个端点的距离.
组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组.注意(2)纵坐标为: 表2-2 100位居民月均用水量的 频率分布表
分组 频数累计 频数 频率
[0 , 0.5) 4 0.04
[0.5 , 1) 8 0.08
[1 , 1.5) 15 0.15
[1.5 , 2) 22 0.22
[2 , 2.5) 25 0.25
[2.5 , 3) 14 0.14
[3 , 3.5) 6 0.06
[3.5 , 4) 4 0.04
[4 , 4.5) 2 0.02
合计 100 1.00频率分布直方图
小长方形的面积=?频率分布直方图各小长方形的面积总和=?注:小长方形的面积=组距×频率/组距=频率
各长方形的面积总和等于1.频率分布直方图月均用水量最多的在哪个区间?频率分布直方图直方图有哪些优点和缺点?注:小长方形的面积=组距×频率/组距=频率
各长方形的面积总和等于1.根据上图可得这100名学生中体重在[56.5,64.5]的学生人数
是( )
A. 20 B. 30 C. 40 D. 501.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:C0.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 240027003000330036003900X 体重y0.0012、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为: .0.3学会用样本的频率分布估计总体.
会根据样本数据画出频率分布直方图及频率分布折线图.行动与不满足是进步的第一必需品.课件15张PPT。5.2 估计总体的数字特征1、会用频率分布直方图和频率分布折线图估计总体的分布概率.
2、会用平均值和标准差估计总体的数字特征.3、会通过对总体的估计,进行决策.众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标. 众数、中位数、平均数与频率分布直方图的关系:中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标.平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和. 平均数易受一些极端情况的影响,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲: 7 8 7 9 5 4 9 10 7 4乙: 9 5 7 8 7 6 8  6 7 7 如果你是教练,你应当如何对这次射击作出评价?如果这是一次选拔性考核,你应当如何作出选择?方差与标准差如果看两人本次射击的平均成绩,由于两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗? 直观上看,还是有差异的. 如:甲成绩比较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图、表时提到过的极差. 甲的环数极差=10-4=6, 乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略. 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是表示这组数据的平均数.于是,样本数据由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.是“平均距离”从数学的角度考虑,人们有时用标准差的平方分散程度的工具.来代替标准差作为测量样本数据探究:一个样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为2的样本:设其样本的标准差为用计算器可算出甲、乙两人成绩的标准差为:由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.显然,标准差越大,则 越大,数据的离散程度越大;标准差越小,数据的离散程度越小.参照课本P37页的数据表完成: 李丽珊的平均积分和标准差都比其他选手小,也就表明,在前7场的比赛过程中,她的成绩最优秀且最稳定.
于是我们假设之后的比赛中,他们都发挥正常,夺冠希望最大就是李丽珊. 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲 25.46, 25.32, 25.45, 25.39, 25.36
25.34, 25.42, 25.45, 25.38, 25.42
25.39, 25.43, 25.39, 25.40, 25.44
25.40, 25.42, 25.35, 25.41, 25.39乙 25.40, 25.43, 25.44, 25.48, 25.48
25.47, 25.49, 25.49, 25.36, 25.34
25.33, 25.43, 25.43, 25.32, 25.47
25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?解:用计算器计算可得: ,因此甲生产的零件内径比乙生产的稳定程度高得多,于是可以作出判断,甲生产的零件的质量比乙的高一些. 从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于 “用样本估计总体”包含:
1、用频率分布直方图和频率分布折线图估计总体的分布概率.
2、用平均值和标准差估计总体的数字特征.3、通过对总体的估计,进行决策.地球上一切美丽的东西都来源于太阳,而一切美好的东西都来源于人.
——普朗克课件13张PPT。§6 统计活动:结婚年龄的变化 1.经历“收集数据―整理数据―分析数据―作出推断”的统计活动,体验统计活动的全过程.
2.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析,为合理的决策提供一些依据;认识统计的作用,体会统计思维与确定性思维的差异.
3.形成对数据处理过程进行初步评价的意识. 在日常生活中,我们或许都有这样的感觉:人们初次结婚的年龄在随着时代的发展而逐渐增大.那么,实际情况是否的确如此呢?请大家针对这个问题设计一个调查方案并开展统计活动.1.确定调查对象
全班同学的父母辈和祖父母辈.我们可以按照如下的步骤来进行这个统计活动.2.收集数据
每位同学收集自己父母辈和祖父母辈的初次结婚年龄(例
如,调查自己的父亲、母亲、祖父、祖母的初婚年龄),
按照以下方式记录下来(如下表).3.整理数据
(1)先将本小组成员收集到的数据按下表汇总.第 小组初次结婚
年龄/岁(2)再把班上所有同学的数据按照小组进行汇总,得到下表.4.分析数据(1)将上面的数据用折线图、频率分布直方图分别表示出来.同学们之间可进行交流、讨论,确定出比较合适的统计图.(2)分别估计父辈、母辈、祖父辈、祖母辈的初次结婚年龄的平均数与标准差,并进行比较,以利于数据的分析.5.作出推断
根据上面的数据,同学们进行交流讨论,充分听取每一个同学的见解,以便更好地得出科学的结论.判断此结论与你在从事这个活动之前的猜想是否一致. 通过本节的统计活动,你能判断出随着时代的发展,人们初次结婚的年龄是否在增大? 这个结论是通过调查父母辈和祖父母辈初次结婚的年龄得到的,它反映的只是较长一个时间段内人们初婚年龄的变化趋势. 刚才从同学们调查的数据分析得到的结果,可能不太容易看出初婚年龄增大的趋势,但从全国的平均趋势来看,这种现象的确存在.为此,教科书给出了1995年~1999年全国各地区女性平均初次结婚年龄的数据.同学们再仔细分析一下是不是有那样的规律.同学们课下也可以上网或翻阅书籍查找相关的资料,看能否得到刚才的结论.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________. 9.5,0.016通过本节的学习我们掌握了统计活动遵循的一般步骤:1.从调查的问题出发,确定调查对象.
2.收集数据.
3.整理数据.
4.分析数据.
5.作出推断.在科学上进步而道义上落后的人,不是前进,而是后退. ——亚里士多德课件29张PPT。§7 相关性1. 通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.
2. 经历用不同的估算方法来描述两个变量线性相关的过程.正方形的面积y与正方形的边长x之间的关系y = x21、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间的关系就是一个函数关系.是确定性关系2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你学习物理就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?3、我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.探究1:变量之间的相关关系思考1:考查下列问题中两个变量之间的关系:
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄.
这些问题中两个变量之间的关系是函数关系吗? 思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?生活中还有很多类似的描述这种相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”等. 不是函数关系.思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何? 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫作相关关系. 例如,由人的身高并不能确定体重,但一般说来“身高者,体也重”,我们说身高与体重这两个变量具有相关关系.常见的变量与变量之间的关系有两类:一类是确定性的函数关系,像正方形的边长a和面积S的关系;另一类是相关关系,但不具备函数关系所要求的确定性,它们的关系是带有随机性的.探究2:散点图 【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.思考1:对某一个人来说,他体内的脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?思考3:上图叫作散点图,你能描述一下散点图的含义吗? 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,成为散点图.思考4:观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?人的年龄与人体脂肪含量的散点图,从整体上看,它们是线性相关的. 在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.思考5:一般地,如果两个变量成正相关,那么从整体上看,这两个变量的变化趋势如何? 一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.这就像函数中的增函数和减函数.即一个变量从小到大,另一个变量也从小到大,或从大到小. 思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点? 思考7:你能列举一些生活中的变量成正相关或负相关的实例吗? 探究3:相关关系与函数关系的异同点: (1)相同点:两者均是指两个变量的关系;(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系. 函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 相关关系是一种非确定的关系,如一块农田的水稻产量与施肥量之间的关系,事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系. 例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而学会新词并不能使脚变大,而是涉及到第三个因素——年龄,当儿童长大一些以后,他的阅读能力会提高,而且由于人长大脚也变大.探究4:如何分析变量之间是否具有相关的关系? 分析变量之间是否具有相关的关系,我们可以借助日常生活和工作经验对一些常规问题来进行定性分析,如儿童的身高随着年龄的增长而增长,但它们之间又不存在一种确定的函数关系,因此它们之间是一种非确定性的随机关系,即相关关系.但仅凭这种定性分析不够;一来定性分析有时会给我们以误导, 二来定性分析无法确定变量之间相互影响的程度有多大.因此,我们还需要进行定量分析. 如何进行定量分析呢?由于变量间的相关关系是一种随机关系,因此,我们只能借助统计这一工具来解决问题,也就是通过收集大量数据,在对数据进行统计分析的基础上,发现其中的规律,并对它们之间的关系作出推断.探究5:两个变量之间的相关关系有哪些? 从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似描述,这种近似描述的过程称为曲线拟合. 在两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.此时,我们可以用一条直线来拟合(如图),这条直线叫回归直线.从图中可以看出家庭年收入和年饮食支出之间具有相关关系,而且是线性相关.例: 5个学生的数学和物理成绩如下表:画出散点图,并判断它们是否有相关关系.具有相关关系.1、某农场经过观测得到水稻产量和施化肥量的统计数据如下:画出散点图 ,判断它们是否有相关关系,并考虑水稻的产量会不会随化肥使用量的增加而一直增加.散点图如下:具有相关关系.水稻的产量不会随化肥使用量的增加而一直增加.2、 下表给出了某校12名高一学生的身高(单位:cm)和体重(单位:kg)的统计数据画出散点图,并观察它们是否有相关关系.具有相关关系.1.对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系.2.散点图能直观地反映两个相关变量之间的大致变化趋势,利用计算机作散点图是简单可行的办法. 3.一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.在学业的峰峦上,有汗水的溪流飞淌;在智慧的珍珠里,有勤奋的心血闪光.课件26张PPT。§8 最小二乘估计1、经历用不同估算方法描述两个变量线性相关的过程;
2、知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.上节课我们讨论了人的身高与右手一柞长之间的线性关系,用了很多种方法来刻画这种线性关系,但是这些方法都缺少数学思想依据.问题1、用什么样的线性关系刻画会更好一些?想法:保证这条直线与所有点都近(也就是距离最小).最小二乘法就是基于这种想法.问题2、用什么样的方法刻画点与直线的距离会更方便有效?方法一:点到直线的距离公式
方法二:问题3、怎样刻画多个点与直线的接近程度?…………………①先来讨论3个样本点的情况利用配方法可得同样使用配方法可以得到,当从而得到直线y=ɑ+bx的系数ɑ,b,且称直线y=ɑ+bx为这3个样本点的线性回归方程.用同样的方法我们可以推导出n个点的线性回归方程的系数:思考:如果样本点只有两个,用最小二乘法得到的直线与两点式求出的直线一致吗?解:是一致的.与两点式相同.例1 在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y)与当天气温(x)之间是线性相关的.数据如下表(1)试用最小二乘法求出线性回归方程.
(2)如果某天的气温是-3℃,请预测当天小卖部可能会卖出热茶多少杯.解:(1)先画出其散点图可以求得
则线性回归方式为(2)当某天的气温是-3℃时,当天卖出热茶的杯数估计
为:1、 已知x,y之间的一组数据如下表,则y与x的线性回归方
程y=a+bx必经过点 ( ) (A)(2,2) (B)(1.5,0) (C)(1,2) (D)(1.5,4)D2、某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
(1)画出销售额和利润额的散点图;
(2)若销售额和利润额具有相关关系,计算利润额y对销售额x的线性回归方程.解:(1)(2)数据如下表:可以求得b=0.5,a=0.4
线性回归方程为:/百万元/千万元1.列表、计算.
2.代入公式求a,b.
3.写出直线方程.求线性回归方程的步骤: 利用试验数据进行拟合时,所用数据越多,拟合效果越好.但即使选取相同的样本数,得到的直线方程也可能是不相同的,这是由样本的随机性造成的,样本量越大,所估计的直线方程越能更好地反映变量之间的关系.3.下面是两个变量的一组数据:请用最小二乘法求出这两个变量之间的线性回归方程思考:哪一个对呢?y=-15+9x.所以,利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈现一定的规律性,我们再根据这个规律性进行拟合.如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的工具进行拟合.2、线性回归方程的系数:1、最小二乘法的思想一切澎湃于心,让我们真正能够在心里有所酝酿的东西,都值得我们去努力.课件19张PPT。 §5 用样本估计总体
5.1 估计总体的分布学会用样本的频率分布估计总体.
会根据样本数据画出频率分布直方图及频率分布折线图. 从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息.如人口普查得到的数据较为全面,从中可以很好地反映对象的重要信息. 但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征.一般的,总体分布是指总体中个体所占比例. 如何通过样本来估计总体的分布情况呢?这就需要我们先将样本的分布情况表示出来.例 1895年,在英国伦敦有106块男性头盖骨被挖掘出.经考证,这些头盖骨的主人死于1665~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm),请你估计在1665~1666年之间,英国男性头盖骨宽度的分布情况.解:如果把总体看作是1665~1666年之间的英国男性头盖骨的宽度,那么我们就是通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成表: 从表格中,我们就能估计出总体大致的分布情况了,如在1665~1666年之间,英国男性头盖骨宽度主要在136~149mm之间,135mm以下以及140mm以上所占的比例相对较小等.但是,这些关于分布情况的描述仍不够形象. 为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数. 我们也可以用区间上矩形的面积来反映频率,得到下图.讨论(1)头盖骨的宽度位于哪个区间的数据最多?
(2) 头盖骨的宽度位于140~145 mm的频率约是多少?
(3) 头盖骨的宽度小于140 mm的频率约是多少?
(4) 头盖骨的宽度位于137~142 mm的频率约是多少?140~14543.4%28.3%0.0416×5×3/5+0.0868×5×2/5=0.298 4,即29.84% 从频率分布表可以看出该样本宽度在140mm~145mm之间的头盖骨所占的频率为43.4%,宽度在137mm~142mm之间的头盖骨所占的频率为29.8%,由此估计,在1665年~1666年之间,英国男性头盖骨宽度在140mm~145mm之间的约为43.4%,宽度在137mm~142mm之间的约为29.8%
图中所有小矩形的面积之和,也就是头盖骨的宽度落在各宽度区间的频率之和,等于1.
当样本容量较大时,样本中落在每个区间上的样本数的频率会稳定于总体的相应区间内取值的概率,因此,我们可以用样本的频率分布去估计总体的分布.另外,当样本量增大时.用样本的频率分布去估计总体的分布就越精确.
制作频率分布表的一般步骤:
(1) 计算极差, 确定组距和组数.在确定组距和组数时,要根据极极差的大小, 数据的多少, 选择恰当的组距, 使表格不至于太长或太短;
(2)分组, 通常对组内数值所在区间取左闭右开区间, 最后一组为闭区间;
(3)计算频数、频率,列出频率分布表.
说明:组距与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的都少,常分成5~12组.在实际操作中,一般要求各组的组距相等.
为方便起见,组距的选取力求“取整”. 组数=极差/组距.
如果极差不利于分组(如不能被组数整除),可适当增大样本所对应的区间,如在左、右两端各增加适当范围. 解决频率分布直方图的相关计算, 需掌握下列关系式:
(1)
即小矩形的面积为数据落在相应区间的频率,注意纵坐标不是频率,而是频率与组距的比;
(2)各个小矩形面积的总和等于1;

(3)
此关式可变形为频数分布直方图:
列出频数分布表后,建立直角坐标系,在横轴上确定组距的长,在纵轴上截取单位长度表示频率与组距的比1.以组距为宽,各组的频率(即 )与组距(即 )的比为高(即 )做小矩形,所的图形即为频数分布直方图.
频数分布直方图的优点是能直观地体现数据个数的分布规律及分布总体势态,一般是中间高、两端地、左右对称的“峰”状结构.缺点是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.
说明:频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小,各个小矩形面积的总和等于1.在频率直方图中,按照分组原则,再在左右两边各加一个区间,从所得的各个区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线我 们称之为频率折线图,有时用它来评估总体的分情况. 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.总体在区间 内取值的概率总体密度曲线根据上图可得这100名学生中体重在[56.5,64.5]的学生人数
是( )
A. 20 B. 30 C. 40 D. 501.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:C0.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 240027003000330036003900X 体重y0.0012、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为: .0.3学会用样本的频率分布估计总体.
会根据样本数据画出频率分布直方图及频率分布折线图.
行动与不满足是进步的第一必需品.课件16张PPT。5.2 估计总体的数字特征1、会用频率分布直方图和频率分布折线图估计总体的分布概率.
2、会用平均值和标准差估计总体的数字特征.3、会通过对总体的估计,进行决策.估计众数:在频率分布直方图中,样本数据的众数近似等于最高的那个矩形底边中点的横坐标. 众数、中位数、平均数与频率分布直方图的关系:估计中位数:是使图形左右两边面积相等的竖线对应的横坐标.平均数:近似等于每个小长方形面积乘以其底边中点的横坐标之和. 平均数易受一些极端情况的影响,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲: 7 8 7 9 5 4 9 10 7 4乙: 9 5 7 8 7 6 8  6 7 7 如果你是教练,你应当如何对这次射击作出评价?如果这是一次选拔性考核,你应当如何作出选择?方差与标准差如果看两人本次射击的平均成绩,由于两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗? 直观上看,还是有差异的. 如:甲成绩比较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据. 样本平均数和样本标准差:
假设通过随机抽样得到的样本为 ,
样本平均数: ,
样本标准差:
(1)设给定一组数据 ,方差 则
的方差为
(2)设给定一组数据 ,方差 则
的方差为

特别的,当 时,则有 的方差为 ,这说明将一组数据都减去相等的一个常数,其方差是不变的,即不影响 这组数据的波动性.
标准差的意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定;标准差越小,数据的离散程度就越小,也就越稳定. 从标准差的定义可以看出,标准差 . 当 时,意味着所有的样本数据都等于样本平均数.
在刻画样本数据的离散程度上,方差与标准差是一样的. 但在解决实际问题时,一般多采用标准差.在应用平均数比较优劣,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由标准差研究其与平均数的偏离程度?帆板运动是人们通过一块近似船
型的板体和经万向接头与板体相
连接的一套帆具,借助风力作用
于帆上产生的动力进行的一种水
上运动。综合了帆船、冲浪、滑
水运动的一些技术特点。集娱乐
性、观赏性、竞技性于一本,并具有器材简单、竞赛场地要求不高,且有较高的锻炼价值,被人们称为当今世界上最时髦的体育运动。它一问世便以惊人的速度风靡于世界,成为沿海国家和地区最普及、最受人们喜爱的项目。 分析理解1996年美国亚特兰大奥运会
上中国香港风帆选手李丽珊,
以惊人的耐力和斗志,勇夺
金牌,为香港的体育史揭开
了“突破零”的新一页,前五
名在前五场的比赛积分如图
所示请你根据上表的比赛结果,预测各选手之间的成绩以及稳定情况分析:我们计算前五名选手的平均数和标准差,用他们来度量各个选手的成绩和稳定情况.由表可以看出,李丽珊的平均分和标均差都是最低的,也就是说前七场的比赛她的发挥是最为稳定的。尽管后四场比赛还没有进行,但大致可以假设几位选手在以后的几场比赛发挥大致相当,从前面的比赛可以看出,李丽珊的成绩最为优秀,而且表现最为稳定,我们就有足够的理由相信,李丽珊可以获得最后的冠军。当然事实也进一步验证了我们的推测,李丽珊凭着自己优异而稳定的发挥称为香港首位奥运会金牌得主这是1996年美国亚特兰大奥运会风帆比赛的真实情境,在比赛过程中,从已经结束的前几场比赛成绩预测最后的比赛结果,尤其是在重要的比赛中是非常有意义的.现实生活中我们也经常遇到类似的情况,在观看比赛时,解说员一般都会准备一些参赛队员各方面的信息,如身高、体重、年龄、最近比赛的成绩.通过这些信息,我们就能对其有个大致的了解.而在比赛的过程中,我们还可以从队员的临场发挥对比赛结果进行即时的预测.当然,预测必须要有一定的依据,问题的关键是通过统计的学习使自己具备这样的意识与能力. 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲 25.46, 25.32, 25.45, 25.39, 25.36
25.34, 25.42, 25.45, 25.38, 25.42
25.39, 25.43, 25.39, 25.40, 25.44
25.40, 25.42, 25.35, 25.41, 25.39乙 25.40, 25.43, 25.44, 25.48, 25.48
25.47, 25.49, 25.49, 25.36, 25.34
25.33, 25.43, 25.43, 25.32, 25.47
25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?解:用计算器计算可得: ,因此甲生产的零件内径比乙生产的稳定程度高得多,于是可以作出判断,甲生产的零件的质量比乙的高一些. 从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于 “用样本估计总体”包含:
1、用频率分布直方图和频率分布折线图估计总体的分布概率.
2、用平均值和标准差估计总体的数字特征.3、通过对总体的估计,进行决策.作业 1-5 3.地球上一切美丽的东西都来源于太阳,而一切美好的东西都来源于人.
——普朗克