(共26张PPT)
“二战”期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里.
统计小故事
然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机很难有机会返航,而这部分数据被忽略了.事实证明,沃德是正确的.
前面研究学习了两种抽样方法来收集数据,还知道了一些常见的获取数据的途径.在随机抽样获得样本数据后,必须从中寻找蕴含的信息,以使我们能通过样本的规律估计总体的规律,进而解决相应的实际问题.但由于数据多而杂乱,所以需要通过一定的方法去处理数据.
温故知新
简单随机抽样
随机抽样
分层随机抽样
可以通过适当的统计图表描述和表示数据,获得样本的规律,进而对总体做出相应的估计.
9.2.1总体取值规律的估计
第一课时 频率分布直方图
1.会画频率分布表和频率分布直方图(重点);
2.能根据频率分布表和频率分布直方图分析具体问题;
3.结合实际,能用样本估计总体的取值规律(难点).
学习目标
问题1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准????,用水量不超过????的部分按平价收费,超出????的部分按议价收费,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
?
创设情境 明确问题
必须先了解全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:????):
?
创设情境 明确问题
易发现:居民用户月平均用水量最小值是___t,最大值是___t.
将这组数据从小到大排序:
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}1.3
1.3
1.8
2.0
2.0
2.0
2.0
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3.0
3.2
3.2
3.6
3.6
3.7
3.8
4.0
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6.0
6.0
6.4
6.4
6.8
6.8
7.0
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
8.1
8.6
8.8
9.0
9.5
9.9
10.0
10.1
10.2
10.2
10.5
10.8
11.1
11.2
12.0
12.0
12.4
13.3
13.6
13.6
13.8
13.8
14.0
14.9
15.7
16.0
16.7
16.8
17.0
17.9
18.3
19.4
20.5
21.6
22.2
22.4
24.3
24.5
25.6
28.0
创设情境 明确问题
问题2:为了更深入地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.如何探索、研究一组数据的取值规律呢?
创设情境 明确问题
在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们更清楚地知道数据分布在各个小组的个数。
创设情境 明确问题
频率分布表、
频率分布直方图
月均用水量在不同范围内的居民用户占全市居民用户的比例.
1.求极差
极差:一组数据中的最大值与最小值的差
操作实践 理解概念
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}1.3
1.3
1.8
2.0
2.0
2.0
2.0
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3.0
3.2
3.2
3.6
3.6
3.7
3.8
4.0
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6.0
6.0
6.4
6.4
6.8
6.8
7.0
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
8.1
8.6
8.8
9.0
9.5
9.9
10.0
10.1
10.2
10.2
10.5
10.8
11.1
11.2
12.0
12.0
12.4
13.3
13.6
13.6
13.8
13.8
14.0
14.9
15.7
16.0
16.7
16.8
17.0
17.9
18.3
19.4
20.5
21.6
22.2
22.4
24.3
24.5
25.6
28.0
2.确定组距和组数
操作实践 理解概念
①当样本量不超过100时,常分成5—12组.
②一般取等长组距,且组距应力求“取整”.
如果我们取所有组距为3,则
即可以将数据分为9组,这也说明这个组距是比较合适的.
3.将数据分组
由于组距为3,9个组距的长度超过极差,
?
如,可取区间为[1.2,28.2]
注:各组数值所在区间取左闭右开区间 , 最后一组取闭区间.
我们可以使
第一组的左端点略小于数据中的最小值1.3,
最后一组的右端点略大于数据中最大值28.
操作实践 理解概念
4.列频率分布表
频率=小组频数样本容量
?
计算各小组的频率
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}1.3
1.3
1.8
2.0
2.0
2.0
2.0
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3.0
3.2
3.2
3.6
3.6
3.7
3.8
4.0
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6.0
6.0
6.4
6.4
6.8
6.8
7.0
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
8.1
8.6
8.8
9.0
9.5
9.9
10.0
10.1
10.2
10.2
10.5
10.8
11.1
11.2
12.0
12.0
12.4
13.3
13.6
13.6
13.8
13.8
14.0
14.9
15.7
16.0
16.7
16.8
17.0
17.9
18.3
19.4
20.5
21.6
22.2
22.4
24.3
24.5
25.6
28.0
例如第一小组的频率?
操作实践 理解概念
4.列频率分布表
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}分组
频数
频率
[1.2,4.2)
23
[4.2,7.2)
32
[7.2,10.2)
13
[10.2,13.2)
9
[13.2,16.2)
9
[16.2,19.2)
5
[19.2,22.2)
3
[22.2,25.2)
4
[25.2,28.2]
2
100
即在频数分布表基础上
加一列频率:
0.23
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.02
1
操作实践 理解概念
频数合计为样本容量
频率和为1
最后一行是合计:
合计
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}分组
频数
频率
频率 / 组距
[1.2,4.2)
23
0.23
0.077
[4.2,7.2)
32
0.32
0.107
[7.2,10.2)
13
0.13
0.043
[10.2,13.2)
9
0.09
0.030
[13.2,16.2)
9
0.09
0.030
[16.2,19.2)
5
0.05
0.017
[19.2,22.2)
3
0.03
0.010
[22.2,25.2)
4
0.04
0.013
[25.2,28.2]
2
0.02
0.007
合计
100
1
5.画频率分布直方图
思考1:频率分布直方图与频数分布直方图有什么区别?
操作实践 理解概念
(1)每个小长方形的宽表示什么?高表示什么?
(2)每个小长方形的面积表示什么?
(3)所有小长方形的面积之和等于多少?
各小长方形的面积总和为1
组距
组距
频率
频率分布直方图以面积的形式反映了数据在各个小组的频率的大小.
思考2:观察频率分布直方图,回答以下问题:
小长方形的面积=
组距
组距
频率
=频率
×
操作实践 理解概念
思考3:观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?
比较分析 深化应用
(1)从频率分布表可以看出样本观测数据落在各个小组的比例大小.
例如,本次抽样调查月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小等等;
思考3:观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?
(2)从频率分布直方图能直观的看出数据分布的形状和总体趋势.容易看出:分布不对称,图形左高、右低,右边有一个较长的“尾巴”.这表明大部分用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中,少数用户月均用水量偏多,随着月均用水量的增加,居民用户数呈现降低趋势.
比较分析 深化应用
思考4:频率分布直方图有哪些优点呢?
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
比较分析 深化应用
根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的。
思想:用样本的频率分布估计总体的频率分布
由于样本的随机性,这种估计可能会存在一定误差.
比较分析 深化应用
分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同组数对于直方图呈现数据分布规律有什么影响?
同一组数据,组数不同,得到的直方图形状也不尽相同。
动态演示
组数少、组距大:
易看出整体分布特点,但损失较多原始数据信息,无法看出每组内的数据分布情况;
组数多、组距小:
保留较多原始数据信息,图形不规则,不易看出总体分布特点。
不同的频率分布印象有时会影响人们对总体的判断
比较分析 深化应用
小结提升 形成结构
从某小区抽取100户居民用户进行月用电量调查,发现用电量都在50~350??????????h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1) 直方图中????的值为________;
(2) 在被调查的用户中,用电量落在区间[100,250)?内的户数为_______.
?
练习巩固
达标检测
如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
通话时长在区间[15,20),[20,30) 内的次数分别为多少?
布置作业 应用迁移
(一)必做题
作业1:教科书216页习题9.2第1题(1)
(二)选做题
作业2:调查本班同学的体重(或身高)数据,画出频率分布直方图,并对本年级的情况做出估计.