6.3 数据的表示
北师大版 · 数学· 七年级(上)
第六章 数据的收集与整理
第3课时 频数直方图
1.明确频数直方图制作的步骤,会绘制频数直方图。
2.能从频数分布表和频数直方图中获取有关信息,作出合理的判断和预测。
学习目标
同学们想一想,你同父母一起去商店买衣服时,我们经常看到衣服上的号码标有哪些?你了解这些号码的意义吗?你觉得这种生产方法有什么优点?
S、 M、L、XL、XXL等号码.
S代表最小号,身高在150~155 cm的人适合穿S号.M号适合身高在155~160 cm的人群着装…….厂家做衣服订尺寸也并不是按所有人的尺寸定做,而是按某个范围分组批量生产.
导入新知
{5940675A-B579-460E-94D1-54222C63F5DA}158
158
160
168
159
159
151
158
159
168
158
154
158
154
169
158
158
158
159
167
170
153
160
160
159
159
160
149
163
163
162
172
161
153
156
162
162
163
157
162
162
161
157
157
164
155
156
165
166
156
154
166
164
165
156
157
153
165
159
157
155
164
156
问题:选择身高在哪个范围内的学生参加呢?
为了参加全校各年级之间的广播操比赛,七年级准备从63名同学中挑出身高相差不多的40名同学参加比赛.为此收集到这63名同学的身高(单位:cm)如下:
新知 制作频数直方图
合作探究
在上面的数据中,最小值是149,最大值是172,它们的差是23,说明身高的变化范围是23 cm.
1.计算最大值和最小值的差
为了使选取的参赛选手身高比较整齐,你知道怎样做才能知道数据(身高)的分布情况?(即在哪些身高范围的学生比较多?哪些身高范围内的学生比较少.)
2.决定组距和组数
所以要将数据分成8组:149≤x<152,152≤x<155,…,170≤x<173.这里组数和组距分别是8和3.
把所有数据分成若干组,每个小组的两个端点之间的距离称为组距.
根据问题的需要,各组的组距可以相同或不同.没有固定的标准,根据具体问题来决定.
本问题中我们作等距分组,即令各组的组距相同.如果从最小值起每隔3 cm 作为一个组,那么由于
最大值?最小值组距=????????????=7????????
?
对落在各个小组内的数据进行累计,得到各个小组内的数据的个数(叫做频数).整理可以得到频数分布表.
3.列频数分布表
从表中可以看出,身高在155≤x<158,158≤x<161,161≤x<164三个组的人数最多,一共有41人,因此可以从身高在155~164 cm(不含164 cm)的学生中选队员.
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}身高分组
149≤x<152
152≤x<155
155≤x<158
158≤x<161
161≤x<164
164≤x<167
167≤x<170
170≤x<173
频数
2
6
12
19
10
8
4
2
上面我们选取的组距是3,从而把数据分成8组,若我们选取的组距是2或4呢,那么组距分成几个组?这样能否选出需要的40名同学呢?
频数
(学生人数)
0
149
152
155
158
161
164
167
170
173
5
10
身高/cm
15
20
4.画频数分布直方图
为了更直观形象地看出频数分布的情况,可以根据频数分布表,画出频数分布直方图.
制作频数直方图大致步骤是什么?
(1)找出所给数据中的最大值和最小值,求最大值
与最小值的差确定统计量的范围.
(4)根据分组和频数,绘制频数直方图.
(3)统计每组中数据的频数.
(2)确定组数和组距并进行分组.(数据个数在100以内,
一般分5至12组).
议一议
为了了解某地区新生儿体重状况,某医院随机调取了该地区60名新生儿出生体重,结果(单位:克)如下:
3850 3900 3300 3500 3315 3800 2550 3800 4150
2500 2700 2850 3800 3500 2900 2850 3300 3650
4000 3300 2800 2150 3700 3465 3680 2900 3050
3850 3610 3800 3280 3100 3000 2800 3500 4050
3300 3450 3100 3400 4160 3300 2750 3250 2350
3520 3850 2850 3450 3800 3500 3100 1900 3200
3400 3400 3400 3120 3600 2900
例
将数据适当分组,并绘制相应的频数直方图,从图中反映出该地区新生儿体重状况怎样?
解:(1)确定所给数据的最大值和最小值:
上述 数据中最小值是1900,最大值是4160;
(2)将数据适当分组:最大值和最小值相差
4160-1900=2260,
考虑以250为组距,
2260÷250=9.04,
可以考虑分成10组;
(3)统计每组中数据出现的次数
分组
人数
分组
人数
1750~2000
3000~3250
2000~2250
3250~3500
2250~2500
3500~3750
2500~2750
3750~4000
2750~3000
4000~4250
1
1
1
3
9
7
15
10
9
4
(4)绘制频数直方图
从图中可以看出该地区新生儿体重在3250~3500g的人数最多.
银行在某储蓄所抽样调查了50名顾客,他们的等待时间(进入银行到接受受理的时间间隔,单位:min)如下:
15 20 18 3 25 34 ? 6? 0 17 24
23 30 35 42 37 24 21 1 14 12
34 22 13 34? 8 22 31 24 17 33
4 14 23 32 33 28 42 25 14 22
31 42 34 26 14 25 40 14 24 11
将数据适当分组,并绘制相应的频数直方图.
巩固新知
解:(1)最大值与最小值的差:42-0=42;
(2)组距是7时,42÷7=6,则分成6组;
等待时间:min
划记
频数
0≤x<7
4
7≤x<14
4
14≤x<21
正正
10
21≤x<28
正正
12
28≤x<35
正正
11
35≤x≤42
正
9
合计
50
表1
(3)如表1所示;
(4)如图1所示.
图1
12
10
8
6
4
2
频数
1.在频数分布表中,各小组的频数之和( )
A.小于数据总数 B.等于数据总数 C.大于数据总数 D.不能确定
2.如图是某班45名同学爱心捐款额的频数直方图(每组含前一个边界值,不含后一个边界值),则捐款人数最多的一组是( )
A.5~10元 B.10~15元
C.15~20元 D.20~25元
B
C
课堂练习
3.一个样本有100个数据,最大值为7.4,最小值为4.0,如果取组距为0.3,那么这组数据可分成( )
A.11组 B.12组 C.13组 D.以上答案均不对
B
4.一个容量为80的样本最大值为141,最小值为50,取组距
为10,则可以分成_______组.
10
制作频数直方图的步骤
1.计算所给数据的最大值与最小值的差
2.确定组数和组距并进行分组
3.统计每组中数据的频数
4.绘制频数直方图
归纳新知
B
课后练习
2.某次考试中,某班数学成绩统计图如图,下列说法错误的是( )
A.得分在70~80分之间的人数最多
B.该班的总人数为40
C.得分在90~100分之间的人数最少
D.及格(≥60分)人数是26
D
3.某班将安全知识竞赛成绩整理后绘制成频数直方图,图中从左至右前四组的百分比是4%,12%,40%,28%,第五组的频数是8.则①该班有50名同学参赛;②第五组的百分比为16%;③成绩在70~80分的人数最多;④80分以上的学生有14名.其中正确的个数有( )
A.1个 B.2个 C.3个 D.4个
C
4.为了解某中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数直方图(如图).估计该中学男生的身高在169.5 cm~174.5 cm之间的人数有( )
A.12人 B.48人 C.72人 D.96人
C
5.(2020·百色改编)某校在践行“社会主义核心价值观”演讲比赛中,对名列前20名的选手的综合分数m进行分组统计,结果如表所示:
组号
分组
频数
一
6≤m<7
2
二
7≤m<8
7
三
8≤m<9
a
四
9≤m≤10
2
若用扇形图来描述,分数在8≤m<9内所对应的扇形图的圆心角为________度.
162
6.七(1)班同学为了解去年某小区家庭月均用水情况,随机调查了该小区部分家庭,并将调查数据整理如下表(部分):
月均用水量x/m3
0<x≤5
5<x≤10
10<x≤15
15<x≤20
x>20
频数/户
12
20
3
百分比
12%
7%
若该小区有800户家庭,据此估计该小区月均用水量不超过10 m3的家庭约有__________户.
560
7.某校测量了九(1)班学生的身高(精确到1 cm),按10 cm为一段进行分组,得到如下频数直方图,则下列说法正确的是( )
A.该班人数最多的身高段的学生数为7人
B.该班身高低于160.5 cm的学生数为15人
C.该班身高最高段的学生数为20人
D.该班身高最高段的学生数为7人
D
8.(2020·温州)如图是九(1)班45名同学每周课外阅读时间的频数直方图(每组含前一个边界值,不含后一个边界值).由图可知,人数最多的一组是( )
A.2~4小时 B.4~6小时
C.6~8小时 D.8~10小时
B
9.(2019·安徽模拟)某棉纺厂为了解一批棉花的质量,从中随机抽取了20根棉花纤维进行测量,其长度x(单位:mm)的数据分布如下表,则棉花纤维长度的数据在8≤x<32这个范围的数量为( )
A
棉花纤维长度x
频数
0≤x<8
1
8≤x<16
2
16≤x<24
8
24≤x<32
6
32≤x<40
3
A.16 B.20 C.17 D.19
10.如图是某班40名学生一分钟跳绳测试成绩(次数为整数)的频数直方图,从左起第一、二、三、四四个小长方形的高的比为1∶4∶3∶2,那么该班一分钟跳绳次数是100次以上的学生有( )
A.6人 B.8人 C.16人 D.20人
D
11.(2020·聊城)为了让书籍开拓学生的视野,陶冶学生的情操,向阳中学开展了“五个一”课外阅读活动,为了解全校学生课外阅读情况,抽样调查了50名学生平均每天课外阅读时间(单位:min),将抽查得到的数据分成5组,下面是尚未完成的频数分布表:
组别
分组
频数(人数)
百分比
1
10≤t<30
16%
2
30≤t<50
20
3
50≤t<70
28%
4
70≤t<90
6
5
90≤t<110
(1)将表中空格处的数据补全,完成上表;
(2)请在给出的平面直角坐标系中画出相应的频数直方图;
(3)如果该校有1500名学生,请你估计该校共有多少名学生平均每天阅读时间不少于50 min?
解:(1)8 40% 14 12% 2
4% (2)图略 (3)根据题意得1500×(28%+12%+4%)=660(人),则该校共有660名学生平均每天阅读时间不少于50 min
12.(2020·湖州模拟)已知2019年3月份在某医院出生的20名新生婴儿的体重如下(单位:kg):
4.7 2.9 3.2 3.5 3.8 3.4 2.8 3.3 4.0
4.5 3.6 4.8 4.3 3.6 3.4 3.5 3.6 3.5
3.7 3.7
(1)若以0.4 kg为组距,对这组数据进行分组,制作了如下的“某医院2019年3月份20名新生婴儿体重的频数分布表”(部分空格未填),请在频数分布表的空格中填写相关的量;
某医院2019年3月份20名新生婴儿体重的频数分布表
组别(kg)
划记
频数
3.55~3.95
正一
6
合计
20
2.75~3.15
2
3.15~3.55
7
3.95~4.35
2
4.35~4.75
2
4.75~5.15
一
1
(2)经检测,这20名婴儿的血型的扇形统计图如图所示(不完整).
求:①这20名婴儿中是A型血的人数;
②表示O型血的扇形的圆心角度数.
再
见