(共15张PPT)
用样本的频率分布
估计总体分布
(二)
画频率分布直方图的步骤:
第一步: 求极差: (数据组中最大值与最小值的差距)
第二步: 决定组距与组数: (强调取整)
第三步: 将数据分组 ( 给出组的界限)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
回忆:
绘制频率分布直方图有哪几个步骤呢?
(一)频率分布折线图:
画好频率分布图后,我们把频率分布直方图中各小长方形上端连接起来,得到的图形.
0
0.1
0.2
0.3
0.4
0.5
0.6
0.5 1 1.5 2 2.5 3 3.5 4 4.5
画出频率分布折线图.
频率/组距
月均用水量/t
(取组距中点, 并连线 )
0.08
0.16
0.3
0.44
0.5
0.3
0.1
0.08
0.04
在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
总体密度曲线:
月均用水量/t
频率
组距
0
a
b
月均用水量/t
频率
组距
0
a
b
1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?
思考
2.图中阴影部分的面积表示什么?
2.总体在范围(a,b)内取值的百分比
月均用水量/t
频率
组距
0
a
b
1.实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。
例: 甲乙两人比赛得分记录如下:
甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39
乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39
用茎叶图表示两人成绩,说明哪一个成绩好.
甲 乙
0
1
2
3
4
5
2, 5
5, 4
1, 6, 1, 6, 7, 9
4, 9
0
8
4, 6, 3
3, 6, 8
3, 8, 9
1
叶 茎 叶
(二). 茎叶图 (一种被用来表示数据的图)
茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图
画茎叶图的步骤:
1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;
2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;
3.将各个数据的叶按大小次序
写在其茎右(左)侧.
茎 叶
0 8
1 3 4 5
2 3 6 8
3 3 8 9
4
5 1
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
茎叶图的特征:
频数 茎 叶
2 10 7, 8
11 11 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0
13 12 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0
4 13 4, 2, 3, 0
下表一组数据是某车间30名工人加工零件的个数, 设计一个茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107
116 132 127 128 126 121 120 118 108 110
133 130 124 116 117 123 122 120 112 112
练习:
小结:
1.不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确.
2. 目前有:频率分布表、直方图、茎叶图.
3.当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
布置作业: