用样本估计总体[下学期]

文档属性

名称 用样本估计总体[下学期]
格式 rar
文件大小 134.8KB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2005-10-20 10:54:00

图片预览

文档简介

课件18张PPT。2.2 用样本估计总体用样本估计总体(两种):
一种是:用样本的频率分布估计总体的分布。
另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。 2.2.1用样本的频率分布估计总体分布
一 频率分布图和频率分布直方图
频率分布折线图 和总体密度曲线
三 莖叶图(stem-and-leaf display)
探究:
我国是世界上严重缺水的 国家之一,城市缺水问题较为突出。某市政府为了节约用水,计划在 本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的按平价收费,超过 a的按议价收费。如果希望大部分居民的 日常生活不受影响,那么标准a定为多少比较合理?你认为,为了较为合理地确定出这个标准,需要做什么工作?
表2-2 100位居民月均用水量的 频率分布表
分组 频数累计 频数 频率
[0 , 0.5) 4 0.04
[0.5 , 1) 8 0.08
[1 , 1.5) 15 0.15
[1.5 , 2) 22 0.22
[2 , 2.5) 25 0.25
[2.5 , 3) 14 0.14
[3 , 3.5) 6 0.06
[3.5 , 4) 4 0.04
[4 , 4.5) 2 0.02
合计 100 1.00注:小长方形的面积=组距×频率/组距=频率
各长方形的面积总和等于1。频率分布折线图:连接频率分布直方图中各小长方形上 端
的中点,就得到频率分布折线图。
总体密度曲线:含义见课本p59。
图2.2-2 100位居民的月均用水量的频率分布折线图
※总体密度曲线能够很好的反映总体在各个范围内的百分比,能够提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。
?思考一下图中阴影部分的面积表示什么?注:中间的 数字表示得分的十位数字。
旁边的数字分别表示两个人得分的个位数。一、基本概念
1、平均数:一组数据的总和除以数据的个数所得
的商就是平均数。2、中位数:如果将一组数据从大到小的顺序依次
排列,当数据有奇数个时,处在最中间
的一个数;当数据有偶数个时,处在
最中间两个数的平均数,是这组数据
的中位数。3、众数:出现次数最多的数(若有两个或几个数
据出现的最多,且出现的次数一样,
这些数据都是这组数据的众数;若一组
数据中每个数据出现的次数一样,则认
为这组数据没有众数。思考1:2.03是通过频率直方图估计出来的中位数,
它与样本的中位数值2.0不一样,请解释
其中的原因? 总体的各种数值特征都可以由两种途径来估计。
直接利用样本数据或由频率分布直方图来估计。
两种方法各有利弊;比如:1、通过频率分布直方图的估计精度低;2、通过频率分布直方图的估计结果与数据分组有关;3、在不能得到样本数据,只能得到频率分布直方图
的情况下,也可以估计总体特征。思考2:中位数不受少数几个极端值的影响,这在某些
情况下是一个优点,但它对极端值的不敏感有
时也会成为缺点,试分别举例说明。注意一下几点:1、样本众数通常用来表示分类变量的中心值,容易计算,但它
只能表达样本数据中的很少一部分信息,通常用于描述分类
变量的中心位置。2、中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)
的影响,容易计算,它仅利用了数据中排在中间数据的信息。
当样本数据质量比较差,即存在一些错误数据(如数据的录入
错误、测量错误等)时,应该用抗极端数据强的中位数表示
数据的中心值。3、平均数受样本中每一个数据的影响,“越离群”的数据,对平均
数的影响越大。与众数和中位数相比,平均数代表了数据更多
的信息。4、如果样本平均数大于样本中位数,说明数据中存在许多较大的
极端值;反之,说明数据中存在许多较小的极端值。在实际应
用中,若同时知道样本中位数和样本平均数,可以使我们了解
样本信息,帮助我们作出决策。