(共29张PPT)
9.2.1用样本估计总体
调查时:
1、通过抽样来收集数据
2、数据被收集后,必须分析数据,找出数据规律,从中寻找所包含的信息,对总体作出相应的估计。
估计一般分成两种:
1、用样本的频率分布估计总体的分布
2、用样本的数据特征(如总体百分位数,平均数,标准差等)估计总体的数字特征。
1、频率分布
样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率.
频率分布的表示形式有:
①样本频率分布表(初中)
②样本频率分布条形图(初中)
③样本频率分布直方图
所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布.
二、基本概念
9.2.1总体取值规律的估计
9.0
13.6
14.9
5.9
4.0
7.1
6.4
5.4
19.4
2.0
2.2
8.6
13.8
5.4
10.2
4.9
6.8
14.0
2.0
10.5
2.1
5.7
5.1
61.8
6.0
11.1
1.3
11.2
7.7
4.9
2.3
10.0
16.7
12.0
12.4
7.8
5.2
13.6
2.6
22.4
3.6
7.1
8.8
25.6
3.2
18.3
5.1
2.0
3.0
12.0
22.2
10.0
5.5
2.0
24.3
9.9
3.6
5.6
4.4
7.9
5.1
24.5
6.4
7.5
4.7
20.5
5.5
15.7
2.6
5.7
5.5
6.0
16.0
2.4
9.5
3.7
17.0
3.8
4.1
2.3
5.3
7.8
8.1
4.3
13.3
6.8
1.3
7.0
4.9
1.8
7.1
28.0
10.2
13.8
17.9
10.1
5.5
4.6
3.2
21.6
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理的确定出这个标准,需要做那些工作?
将一批数据按要求分为若干组,各组内的数据的个数,叫做该组数据的频数,各个小组数据在样本容量中所占的比例的大小,叫做该组数据的频率。
为了解数据分布的规律,可利用频率分布表和频率分布图来分析,具体做法如下:
1、求极差(即一组数据中最大值和最小值的差)
例如,
28-1.3=26.7,
这说明这些数据的变化范围大小是26.7t。
2、决定组距和组数
例如,若取组距为3,则
故可将数据分成9组。
注:一般样本容量越大,所分组数就越多,当样本容量不超过100时,按照数据的多少,常分成5~12组。
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1.00
4、列频率分布表:
3、将数据分组:
以组距3将数据分组如下:
[1.2,4.2),
[4.2,7.2),……,[25.2,28.2
]
5、画频率分布直方图
用横轴表示月均用水量,纵轴表示频率与组距的比值,以每个组距为底,以频率除以组距的商为高,分别画出矩形,这样得到的直方图就是频率分布直方图。
思考:小矩形的面积与哪些量有关?如何表示?
月均用水量/t
频率/组距
0.02
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
所有小长方形的面积之和=1
1).求极差(即一组数据中最大值与最小值的差)
2).决定组距与组数(将数据分组)
3).
将数据分组
方法小结:画频率分布直方图的步骤
4).列出频率分布表.(填写频率/组距一栏)
5).画出频率分布直方图.
组距:指每个小组的两个端点的距离,
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组.
注意事项:
①组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).
②分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.
月均用水量/t
频率/组距
0.02
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
观察频率分布表及频率分布直方图,你觉得的这组数据中
蕴含了哪些有用的信息?你能从图表中发现居民用户月
均用水量的哪些分布规律?你能给出适当的描述吗?
(1)从频率分布直方图表可以清楚的看出数据分布的总体趋势.
(2)从频率分布直方图表得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
月均用水量/t
频率/组距
0.02
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
观察频率分布表及频率分布直方图,你觉得的这组数据中
蕴含了哪些有用的信息?你能从图表中发现居民用户月
均用水量的哪些分布规律?你能给出适当的描述吗?
大部分居民用户的月均用水量集中在一个
较低值区域
分别以3和27为组数,对数据进行等距离分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响?
对于同一组数据,
因为组距、组数不同而得到不同形状的直方图,会给人以不同的频率分布印象,这种印象有时会影响人们对总体的判断.因此,我们要注意积累数据分组、合理使用图表的经验.
练:调查某校高三年级男生的身高,随机抽取40名高三
男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;(2)画出频率分布直方图.
解:最低身高151
cm,最高身高180
cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组
频数
频率
[149.5,153.5)
1
0.025
[153.5,157.5)
3
0.075
[157.5,161.5)
6
0.15
[161.5,165.5)
9
0.225
[165.5,169.5)
14
0.35
[169.5,173.5)
3
0.075
[173.5,177.5)
3
0.075
[177.5,181.5]
1
0.025
合计
40
1
(2)频率分布直方图如图所示.
例2.
已知某市2015年全年空气质量等级如下表:
选择合适的统计图描述数据,并回答下列问题:
(1).分析该市2016年6月的空气质量情况.
(2).比较该市2016年5月和2016年6月的空气质量,那个月的空气质量较好?
(3).比较该市2016年6月与该市2015年全年的空气质量的空气质量,2016年6月的空气质量是否好于去年?
解:空气等级的频数和频率分布表
用条形图和扇形图对数据直观描述
用折线图展示空气质量指数随时间的变化情况
例2.
(2)分析该市2016年5月和6月的空气质量,哪
哪个月的空气质量较好?
6月
5月
3.例2.
(2)比较分析该市2016年5月和6月的空气质
量,哪个月的空气质量较好?
6月
5月
用复合频数条形图更直观地比较两个月的空气质量
解:
5月的空气质量略好于6月
例2.
(3)比较分析该市2016年6月与2015年全年的
的空气质量,
2016年6月的空气质量是否好于去年?
用复合频率分布条形图更直观地比较空气质量
解:
从整体上2016年6月的空气质量要好于去年
统计图表
主要应用
扇形图
直观描述各类数据占总数的比例
条形图和直方图
直观描述不同类别或分组数据的频数和频率
折线图
描述数据随时间的变化趋势
[答案] C
(1).直方图中x的值为
;
(2).在被调查的用户中,用电量落在区间[100,250)内的户数
.
课本P197-1从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350KW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,
4、有一个容量为50的样本数据的分组的频数如下:
[12.5,
15.5)
3
[15.5,
18.5)
8
[18.5,
21.5)
9
[21.5,
24.5)
11
[24.5,
27.5)
10
[27.5,
30.5)
5
[30.5,
33.5)
4
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在
[15.5,
24.5)的百分比是多少?
解:组距为3
频率/
组距
[12.5,
15.5)
3
[15.5,
18.5)
8
[18.5,
21.5)
9
[21.5,
24.5)
11
[24.5,
27.5)
10
[27.5,
30.5)
5
[30.5,
33.5)
4
0.06
0.16
0.18
0.22
0.20
0.10
0.08
0.020
0.053
0.060
0.073
0.067
0.033
0.027
分组
频数
频率
四、课时小结
1、画频率分布直方图时注意步骤,并把握好确定各小矩形高的方法与技巧.频率分布表从数值直观反映各组的频率,频率分布直方图则更形象地描绘出频率与样本分布趋势.所以通常通过两者综合考查估计样本的某些特征.
2、绘制频率分布直方图的步骤如下:
①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.
(3)频率分布表中的频数累计有时略去不写.
四、课时小结
3、频率分布直方图的性质:
①因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②在频率分布直方图中,各小矩形的面积之和等于1.
③频数/相应的频率=样本容量.