(共23张PPT)
2.2.1用样本的频率分布 估计总体分布
学习目标
1、理解并学会画频率分布表;
2、掌握频率分布直方图的画法,
并能理解在频率分布直方图
中用面积表示频率。
一、复习回顾
1.我们已经学习了哪些抽样的方法?
简单随机抽样
系统抽样
分层抽样
随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.
一般分成两种:
①用样本的频率分布估计总体的分布.
②用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
二、样本估计总体的方法
我国是世界上严重缺水的国家之一。
如何节约用水?
例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做
哪些工作?
由于城市居民较多,通常采用抽样调查的方式,通过分析样本数据来估计总体,用样本去估计总体,是研究统计问题的一个基本思想.
思考:由上表,大家可以得到什么信息?
通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:
三、样本分析
一般通过表、图、计算来分析数据,帮助我们找出样本数据中的规律,使数据所包含的信息转化成直观的容易理解的形式。
频率分布表和频率分布直方图则是从各个小组数据在样本容量中所占比例的大小的角度,来表示数据分布的规律,它可以使我们看到整个样本数据的频率分布情况。
1.求极差(即一组数据中最大值与最小值的差)
2.决定组距与组数
组数=
4.3 - 0.2 = 4.1
4.1
0.5
= 8.2
组距
极差
=
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组. 组距:指每个小组的两个端点的距离.
知识探究(一):频率分布表
4.列频率分布表
100位居民月平均用水量的频率分布表
频率=频数÷样本容量
频数=样本数据落在各小组内的个数
思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?
月均用水量/t
频率
组距
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
知识探究(二):频率分布直方图
宽度:组距
高度:
频率
组距
频率/组距
月平均用水量/t
0.50
0.40
0.30
0.20
0.10
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5
画频率分布直方图
小长方形的面积=
组距
频率
=
组距×
频率
注意:
① 这里的纵坐标不是频率,而是频率/组距;
② 某个区间上的频率用这个区间矩形的面积表示;
直方图
0.08
0.16
0.30
0.44
0.50
0.28
0.12
0.08
0.04
思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?
月均用水量/t
频率
组距
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
各小长方形的面积=对应频率
各小长方形的面积之和=1
1. 某校共有5000名学生,该校学生每月课外读物方面的支出总体上在20—60元之间其频率分布直方图如右图所示,为具体了解同学们购买课外读物的具体情况,按支出的情况进行分层抽样,抽出一个容量为100的样本进行分析,其中支出在
元
频率
组距
20
30
40
50
60
0.01
0.036
0.024
元的同学应抽取 人。
30
理论迁移
思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
月均用水量/t
频率
组距
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
月均用水量/t
频率
组距
0.5
0.4
0.3
0.2
0.1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
O
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
理论迁移 2
某地区为了了解知识分子的年龄结构,
随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32~52岁的知识分子所占的比 例约是多少.
(1)极差为67-28=39,取组距为5,分为8组.
分 组 频数 频率
[27,32) 3 0.06
[32,37) 2 0.04
[37,42) 8 0.16
[42,47) 16 0.32
[47,52) 8 0.16
[52,57) 5 0.10
[57,62) 4 0.08
[62,67] 4 0.08
合 计 50 1.00
样本频率分布表:
(2)样本频率分布直方图:
年龄
0.06
0.05
0.04
0.03
0.02
0.01
27 32 37 42 47 52 57 62 67
频率
组距
O
(3)因为0.04+0.16+0.32+0.16=0.68, 故年龄在32~52岁的知识分子约占68%.
小结:
频率分布直方图
步骤
1.求极差
2.决定组距与组数
3.将数据分组
4.列频率分布表
5.画频率分布直方图
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
必修3实验
作 业
1、课时训练 P73
2、探究咱班学生的身高
分布情况
3、探究频率分布折线图和
总密度曲线