(共28张PPT)
9.2.1总体取值规律的估计
实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适统计图表对数据进行整理和直观描述.
复习引入
我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作
问题1
每户居民月均用水量标准如果定得太低,会影响很多居民的日常生活;如果标准太高,则不利于节水、为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
问题1
由于全市居民用户很多,所以采用抽样调查的方式,通过分析样本观测数据,来估计全市居民用户的月均用水量
在这个问题中,
总体是该市的全体居民用户,个体是每户居民用户,
调查的变量是居民用户的月均用水量
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位: t):
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
将这组数据从小到大排序,易发现:最小值是1.3t,最大值是28.0t.
为了探索一组数据的取值规律,一般要先用表格对数据进行整理,或者用图将数据直观表示出来。在初中我们曾用频数分布表和频数分布直方图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数。
实际问题中,我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据
1、求极差:计算最大值与最小值
制作频率分布表与画频率分布直方图的步骤
极差为一组数据中最大值与最小值的差
样本观测数据的最小值是1.3t,最大值是28.0t,极差为
28.0-1.3=26.7
这说明样本观测数据的变化范围是26.7t
2、决定组距与组数:组数=极差/组距
制作频率分布表与画频率分布直方图的步骤
极差/组距=26.7/3=8.9
3、将数据分组:通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间
制作频率分布表与画频率分布直方图的步骤
由于组距为3,把样本观测数据以组距3分为9组:
[1.2,4.2),[4.2,7.2),… ,[25.2,28.2].
注意:组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.决定组距与组数:当样本容量不超过100时,常分成5~12组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
4、列频率分布表:
一般分4列:分组、频数累计、频数、频率,最后一行是合计,其中频数合计应是样本量,频率合计应是1.00
制作频率分布表与画频率分布直方图的步骤
第一小组的频率:
第一组频数/样本量=23/100=0.23
5、画频率分布直方图:横轴表示分组,纵轴表示频率/组距,频率/组距实际上就是频率分布直方图中各小长方形的高度
小长方形的面积=组距*频率/组距=频率
各小长方形的面积和等于1
样本数据落在整个区间的频率为1
观察频率分布表及频率分布直方图,你觉得的这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的描述吗?
(1)从频率分布直方图表可以清楚的看出数据分布的总体趋势.
(2)从频率分布直方图表得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
分别以3和27为组数,对数据进行等距离分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响
探究
对于同一组数据, 因为组距、组数不同而得到不同形状的直方图,会给人以不同的频率分布印象,这种印象有时会影响人们对总体的判断.因此,我们要注意积累数据分组、合理使用图表的经验.
直观描述各类数据占总数的比例
扇形图
直观描述不同类别或分组数据的频数和频率
条形图和直方图
描述数据随时间的变化趋势
折线图
课堂小结
谢谢观看