(共19张PPT)
第 20章 数据的初步分析
20.1 数据的频数分布
学习目标
1.明确频数直方图制作的步骤,会绘制频数直方图.
2.能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测.
学习重难点
会绘制频数直方图.
能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测.
难点
重点
复习导入
可以清楚地表示出每个项目的具体数目
可以清楚地反映事物变化的情况
可以清楚地表示各部分在总体中所占的百分比
你还记得各个统计图的特点吗?
条形统计图
折线统计图
扇形统计图
知识讲解
知识点 数据的频数分布
问题1某校学生在假期进行“空气质量情况调查”的课题研究时,他们从当地气象部门提供的今年上半年的资料中,随意抽取了30天的空气综合污染指数,数据如下:
根据国家环保总局公布的《空气质量级别表》如下:
把数据按上述级别分成0~50,51~100,101~150,151~200,201~250共5个组,进行整理,得下表:
《空气质量级别表》
(1)根据国家公布的级别,这30天的空气质量,各级别各占多大比例?
(2)你能估计该地今年(365天)空气质量达到优级别的天数吗?
用样本的百分率估计总体的百分率.
并借助表格将分组结果及各组数据的个数进行整理,
要想从中获取所需要的信息.
然后统计出落在各个小组内数据的个数,
把相差不大的数据放在一起,
下面我们就来通过具体的例子,学习这种分析数据的分布方法
思考:根据上述问题的探究,说说面对大量的数据,如何获得它的整体分布情况?
问题 1 启示我们:
面对大量的数据,
常常先要选择好合适的统计表、图,
进行适当的分组 (例如,这里按空气质量级别分组),
便能反映出这批数据的分布规律.
这样,
40,21,35,24,40,38,23,52,35,62,
36,15,51,45,42,40,32,43,36,34,
53,38,40,39,32,45,40,50,45,40,
50,26,45,40,45,35,40,42,45,40。
为了了解这批数据反映的情况,可以对它们进行怎样的分析呢?
问题2 某校体卫组对该该校八年级学生一周内平均每天参加课外体育锻炼的时间(单位:min)有所了解,从中随机抽查了40名学生,结果如下:
一般地,可以按照下列步骤来分析:
(1) 计算这批数据中最大数和最小数的差.
(极差=最大数-最小数)
这批数据中,最大值是 ,最小值是 ,它们的差是 .
62
15
62-15=47
由此可知这批数据的变动范围.
组距通常根据问题的需要而定,
可分成5~12组,
并取组距为8,
(2) 决定组距和组数
组数=
组距
最大数-最小数
47
8
=
≈6
组距是指
将这批数据分组,
一般来说,
当数据在100以内时,
如果每组组距相同,
即把数据分成6组
每个小组的两个端点间的距离.
那么
并把第一组的起点定为比最小的数据稍小一点的数.
如把第一组的起点定为14.5,
不好决定他们究竟属于哪一组.
一般地把表示分点的数比原数据多取一位小数,
我们发现数据23,39正好落在分点上,
(3) 决定分点
55~63
将数据按照8min的组距分组,
从15开始分成
15~23,
23~31,
31~39,
39~47,
47~55,
这6组.
同学们对照数据发现什么问题?该如何解决能 ?
14.5~22.5,
为了避免这种情况,
这样所分的6个组是:
38.5~46.5,
22.5~30.5,
30.5~38.5,
46.5~54.4,
54.5~62.5
算出每个小组的频数,
称为这个组的频数.
那么 就是该组数据在这批数据中的频率。
下面请大家根据上面数据填写下频数分布表:
(4) 列频数分布表
我们把一批数据中
通常用选举时唱票的方法,对落在各个小组内的数据个数进行记录,
并制成频数分布表.
如果一批数据共有n个,
而其中某一组数据是m个,
频率
=
总数
频数÷
即
频率可用小数、分数、百分数表示.
落在某个小组内数据的个数
总数
=
频率
频数÷
频数
=
频率
总数×
各组的组距可以相同,
分的组数就越多.
组距是多少?
分组
14.5~22.5
22.5~30.5
30.5~38.5
38.5~46.5
46.5~54.5
46.5~54.5
合 计
频数统计
频数
2
3
10
19
5
1
40
40名学生平均每天锻炼时间频数分布表
编制频数分布表的关键是什么?
分组时,要注意每个数据只落在一个组内.
在编制频数分布表时,
关键是分组,
即确定分几组,
通常根据问题的需要而定.
一般来说,
数据越多,
当数据在100以内时,
可分成5~12组,
也可以彼此不同.
纵轴表示频数,
下图是根据前面的“40名学生平均每天锻炼时间频数分布表”绘制的直方图:
(5) 画频数直方图
方法:
画出相互垂直的两条直线,
用横轴表示分组情况,
绘出相应的长方形条,
就得到了频数直方图.
2
5
1
3
19
10
1、根据频数直方图,说说这40名学生平均每天参加课外锻炼时间是如何分布的.
2、如果该校八年级有500名学生,估计一下平均每天参加课外锻炼达30 min以上的有多少人?
14.5~22.5占5%,
解:
22.5~30.5占7.5%,
30.5~38.5占25%,
38.5~46.5占47.5%,
46.5~54.5占12.5%,
54.5~62.5 占 2.5%.
25%+47.5%+12.5%+2.5%=
解:
87.5%
500×87.5%
=438 (人)
交流
绘出相应的长方形条,
纵轴表示频数,
归纳总结
绘制频数分布直方图的一般步骤:
(1) 计算这批数据中最大数和最小数的差.
(5) 画频数直方图
(4) 列频数分布表
(2) 决定组距和组数
(3) 决定分点
(极差)
组距是指
每个小组的两个端点间的距离.
组数=
组距
最大数-最小数
并把第一组的起点定为比最小的数据稍小一点的数.
一般地把表示分点的数比原数据多取一位小数,
称为这个组的频数。
我们把一批数据中
落在某个小组内数据的个数
频率
=
总数
频数÷
方法:
画出相互垂直的两条直线,
用横轴表示分组情况,
就得到了频数直方图.
例 我校从七年级中任意抽取一个班,该班学生身高 (单位:cm)的频数分布如表所示:
根据所给表格回答:
(1) 身高在161.5cm以上的学生有多少?占全班人数的百分之几?
分组 136.5∽141.5 141.5∽146.5 146.5∽151.5 151.5∽156.5 156.5∽161.5 161.5∽166.6 166.5∽171.5 171.5∽176.5 合计
频数 1 4 10 15 9 8 2 1 50
(2) 估计我校八年级400名学生中身高在161.5以上的约有多少人?
(1) 身高在161.5以上的学生有:
占全班人数的百分比是:
(2) 八年级学生身高在161.5以上的学生有:
400×22%=88
解:
8+2+1=11
(人)
(人)
随堂演练
1.在频数分布表中,各小组的频数之和( )
A.小于数据总数 B.等于数据总数
C.大于数据总数 D.不能确定
2.如图是某班45名同学爱心捐款额的频数直方图(每组含前一个边界值,不含后一个边界值),则捐款人数最多的一组是( )
A.5~10元 B.10~15元
C.15~20元 D.20~25元
B
C
3.为了解某中学九年级300名男学生的身体发育情况,从中对20名男学生的身高进行了测量,结果(单位: cm)如下:
175 161 171 176 167 181 161 173 171 177
179 172 165 157 173 173 166 177 169 181
下表是根据上述数据填写的表格的一部分.
(1)请填写表中未完成的部分;
(2)该校九年级男学生身高在171.5 cm~176.5 cm范围内的人数为多少?
6
25%
300×30%=90(人)
课堂小结
频数直方图
用频数直方图表示数据
制作频数直方图
1.最大值与最小值的差
2.确定组数和组距并进行分组
3.统计每组中数据的频数
4.绘制频数直方图
从条形统计图获取信息
从频数直方图获取信息