中小学教育资源及组卷应用平台
第十章 数据的收集、整理与描述
10.2直方图
一、温故知新(导)
我们学习了哪些统计图用来描述数据?这些统计图有什么特点?
本节课我们将学习另一种常用来描述数据的统计图——直方图,下面我们来看看今天的学习目标和重难点.
学习目标
1、掌握用频数分布直方图描述数据分布情况的基本步骤.
2、能利用简单的频数分布直方图解释数据中蕴含的信息,对实际问题作出判断和决策,初步建立统计概念.
学习重难点
重点:明确频数直方图制作的步骤,能用频数分布表绘制频数分布直方图.
难点:组距和组数的确定.
二、自我挑战(思)
问题 为了参加全校各年级之间的广播操比赛,七年级准备从63名同学中挑出身高相差不多的40名同学参加比赛.为此收集到这63名同学的身高(单位:cm)如下:
158 158 160 168 159 159 151 158 159
168 158 154 158 154 169 158 158 158
159 167 170 153 160 160 159 159 160
149 163 163 162 172 161 153 156 162
162 163 157 162 162 161 157 157 164
155 156 165 166 156 154 166 164 165
156 157 153 165 159 157 155 164 156
选择身高在哪个范围内的学生参赛呢?
为了使选取的参赛选手身高比较整齐,需要知道数据(身高)的分布情况.哪些身高范围的学生比较多,哪些身高范围的学生比较少.为此可以通过数据适当分组来进行整理.如何进行适当的分组呢?
1、计算最大值与最小值的差
最小值是 ,最大值是 .172-149=23,说明身高的变化范围是23.
2、决定组距和组数
把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)称为 .
若从最小值起,每隔 3 作为一组,则
,
可将数据分为 8 组:149≤x<152,152≤x<155,…,170≤x<173.
因此,组数是 ,组距是 .
3、列频数分布表
对落在各小组内的数据进行累计,得到各个小组内数据的个数叫做 .
整理可得下面的频数分布表:
表10-3
身高分组 划记 频数
149≤x<152 丅 2
152≤x<155 正一 6
155≤x<158 正正丅 12
158≤x<161 正正正 19
161≤x<164 正正 10
164≤x<167 正 8
167≤x<170 4
170≤x<173 丅 2
从表10-3中可得,身高在哪三个组的人数最多?这三个组一共有多少人?
4、画频数分布直方图
如图10.2-1,为了更直观形象地看出频数分布的情况,可以根据,10-3画出频数分布直方图.
图10.2-1
在图10.2-1中,横轴表示身高,纵轴表示频数与组距的比值.容易看出:
小正方形的面积=组距=频数.
可见,频数分布直方图是以小长方形的面积来反映数据落在各个小组内的频数大小,小长方形的高是频数与组距的比值.
等距分组时,各小正方形的面积(频数)与高的比是常数(组距).
因此,画等距分组的直方图时,可用小长方形的高作为频数.例如,图10.2-1表示的等距分组问题通常用图10.2-2的形式表示.
图10.2-2
三、互动质疑(议、展)
1、组距和组数的确定没有固定的标准,要根据所研究的具体问题来决定.各组的组距可以相同或不同,上例为等距分组,各组的组距相同.通常数据越多,分成的组数也越多.例如,当数据在100个以内时,根据数据的多少,常分成 5~12 组.
2、绘制频数分布直方图的步骤:
①计算最大值与最小值的差(极差);
②决定组距和组数;
③列频数分布表;
④以横轴表示数据,纵轴表示频数,画频数分布直方图.
3、条形统计图与频数直方图有什么联系和区别?
4、实例:
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 7.0 6.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
例 为了考察某种大麦穗长的分布情况,在一块试验田里抽取了100 个麦穗,量得它们的长度如下表(单位:cm):
列出样本的频数分布表,画出频数分布直方图.
四、清点战果(评)
今天你是否完成了学习目标?你的困惑解决了没?
五、一战成名(检)
1、小明在纸上写下一组数字“20222023”这组数字中2出现的频数为( )
A. B. C.3 D.5
2、下列5个数: 、、、0.21、1.606006000中,无理数出现的频数是( )
A.2 B.3 C.0.4 D.0.6
3、一组数据有90个,其中最大值为141,最小值为40,取组距为10,则可以分成( )
A.9组 B.10组 C.11组 D.12组
4、为了解新冠肺炎疫情解封后刚复学时学生的心理健康,扬州市某区在全区7600名初中同学中随机抽查了500名同学进行问卷调查,对500个数据进行整理,在频数的统计表中各组的频数之和等于 .
5、随机抽检一批衬衣的合格情况,得到如下的频数表.
抽取件数(件) 100 150 200 500 800 1000
合格频数 90 141 189 474 760 950
合格频率 0.90 0.94 0.945 0.948 0.95 0.95
则出售这批衬衣2000件,估计次品大约有 件.
6、某班在一次班会课上,就“遇见路人摔倒后如何处理”主题进行讨论,并对全班50名学生的处理方式进行统计,得出相关统计表和统计图,请根据统计表图所提供的信息回答下列问题:
组别 A B C D
处理方式 迅速离开 马上救助 视情况而定 只看热闹
人数 m 30 n 5
(1)统计表中的m= ,n= ;
(2)补全频数分布直方图;
(3)若该校共有800名学生,请据此估计该校学生采取“马上救助”方式学生有多少人?
六、用
(一)必做题
1、已知有10个数据:13,15,17,19,16,14,15,17,16,18,其中15出现的频数是( )
A. B. C.2 D.5
2、对于实数707007000700007,其中数字7出现的频数为( )
A.5 B.10 C. D.
3、为了解某市九年级男生的身高情况,随机抽取了该市100名九年级男生,他们的身高x(cm)统计如下:
组别(cm) x≤160 160<x≤170 170<x≤180 x>180
人数 15 42 38 5
根据以上结果,全市约有3万男生,估计全市男生的身高不高于180cm的人数是( )
A.28500 B.17100 C.10800 D.1500
4、统计得到一组数据的最大值是39.最小值是23,取组距为5.可分成 组.
5、已知一组数据都是整数,其中最大值是242,最小数据是198,若把这组数据分成9个小组,则组距是 .
6、某地区为了了解七年级学生防疫知识的掌握情况,从该地区七年级学生中随机抽取部分学生进行防疫知识测试,并把学生的得分绘制了部分频数分布表和频数分布直方图(如图).已知图中从左到右第一、第二、第三、第四小组的频数的比为1:3:4:2.
分组 频数
60≤x<70
70≤x<80 15
80≤x<90
90≤x<100
(1)此次活动共抽取了多少名学生进行防疫知识测试?
(2)请将表补充完整.
(3)如果该地区七年级共有6000名学生,80分以上(含80分)的成绩为掌握防疫知识比较好,请估计该地区七年级有多少名学生掌握防疫知识比较好.
(二)选做题
7、某社区卫生中心对辖区居民卫生安全知识了解情况进行问卷调查活动,现从中随机抽取了30份问卷的成绩进行统计.成绩(满分为100分)如表1,整理得出频数分布表2和频数分布直方图的一部分,请根据图表信息,回答以下问题:
表1:
69 69 74 75 75 77 78 80 81 81
83 84 84 86 86 88 89 91 91 93
93 95 95 96 96 97 98 98 100 100
表2:
分组 频数
64≤x<70 2
70≤x<76 a
76≤x<82 5
82≤x<88 5
88≤x<94 b
94≤x≤100 9
(1)其中a= ,b= ;
(2)根据频数分布表,补全频数分布直方图;
(3)如果该社区共有3000名居民,请估计该社区居民得分93分及以上有多少人?
8、2020年初突如其来的“新冠”疫情在武汉市爆发,疫情牵动着全国人民的心,某社区响应竞秀区政府的号召,组织社区居民为武汉人民献爱心活动,为了解该社区居民捐款情况,对社区部分捐款户数进行分组统计(统计表如下),数据整理成如图所示的不完整统计图.已知A,B两组捐款户数直方图高度比为1:5,请结合图中相关数据回答下面问题.
捐款分组统计表
组别 捐款额(x)/元
A 0≤x<100
B 100≤x<200
C 200≤x<300
D 300≤x<400
E x≥400
(1)A组频数是多少?本次调查捐款容量是多少?
(2)求出C的频数?并补全频数分布直方图.
(3)若该社区有500户住户,请估计捐款金额100~200之间的户数是多少?
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
第十章 数据的收集、整理与描述
10.2直方图
一、温故知新(导)
我们学习了哪些统计图用来描述数据?这些统计图有什么特点?
我们学习了条形统计图、扇形统计图、折线统计图.条形统计图的特点:条形统计图能清楚地表示出每个项目的具体数目;扇形统计图的特点:扇形统计图能清楚地表示出各部分在总体中所占的百分比;折线统计图的特点:折线统计图能清楚地反映事物的变化情况.
本节课我们将学习另一种常用来描述数据的统计图——直方图,下面我们来看看今天的学习目标和重难点.
学习目标
1、掌握用频数分布直方图描述数据分布情况的基本步骤.
2、能利用简单的频数分布直方图解释数据中蕴含的信息,对实际问题作出判断和决策,初步建立统计概念.
学习重难点
重点:明确频数直方图制作的步骤,能用频数分布表绘制频数分布直方图.
难点:组距和组数的确定.
二、自我挑战(思)
问题 为了参加全校各年级之间的广播操比赛,七年级准备从63名同学中挑出身高相差不多的40名同学参加比赛.为此收集到这63名同学的身高(单位:cm)如下:
158 158 160 168 159 159 151 158 159
168 158 154 158 154 169 158 158 158
159 167 170 153 160 160 159 159 160
149 163 163 162 172 161 153 156 162
162 163 157 162 162 161 157 157 164
155 156 165 166 156 154 166 164 165
156 157 153 165 159 157 155 164 156
选择身高在哪个范围内的学生参赛呢?
为了使选取的参赛选手身高比较整齐,需要知道数据(身高)的分布情况.哪些身高范围的学生比较多,哪些身高范围的学生比较少.为此可以通过数据适当分组来进行整理.如何进行适当的分组呢?
1、计算最大值与最小值的差
最小值是 149 ,最大值是 172 .172-149=23,说明身高的变化范围是23.
2、决定组距和组数
把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)称为 组距 .
若从最小值起,每隔 3 作为一组,则
,
可将数据分为 8 组:149≤x<152,152≤x<155,…,170≤x<173.
因此,组数是 8 ,组距是 3 .
3、列频数分布表
对落在各小组内的数据进行累计,得到各个小组内数据的个数叫做 频数 .
整理可得下面的频数分布表:
表10-3
身高分组 划记 频数
149≤x<152 丅 2
152≤x<155 正一 6
155≤x<158 正正丅 12
158≤x<161 正正正 19
161≤x<164 正正 10
164≤x<167 正 8
167≤x<170 4
170≤x<173 丅 2
从表10-3中可得,身高在哪三个组的人数最多?这三个组一共有多少人?
身高在155≤x<158,158≤x<161,161≤x<164三个组的人数最多, 一共有:12+19+10=41 (人).
因此可以从身高在155 cm至164 cm(不含164 cm)的同学中挑选参加比赛的同学.
4、画频数分布直方图
如图10.2-1,为了更直观形象地看出频数分布的情况,可以根据,10-3画出频数分布直方图.
图10.2-1
在图10.2-1中,横轴表示身高,纵轴表示频数与组距的比值.容易看出:
小正方形的面积=组距=频数.
可见,频数分布直方图是以小长方形的面积来反映数据落在各个小组内的频数大小,小长方形的高是频数与组距的比值.
等距分组时,各小正方形的面积(频数)与高的比是常数(组距).
因此,画等距分组的直方图时,可用小长方形的高作为频数.例如,图10.2-1表示的等距分组问题通常用图10.2-2的形式表示.
图10.2-2
三、互动质疑(议、展)
1、组距和组数的确定没有固定的标准,要根据所研究的具体问题来决定.各组的组距可以相同或不同,上例为等距分组,各组的组距相同.通常数据越多,分成的组数也越多.例如,当数据在100个以内时,根据数据的多少,常分成 5~12 组.
2、绘制频数分布直方图的步骤:
①计算最大值与最小值的差(极差);
②决定组距和组数;
③列频数分布表;
④以横轴表示数据,纵轴表示频数,画频数分布直方图.
3、条形统计图与频数直方图有什么联系和区别?
联系:都可以直观地表示出具体数量.
区别:①条形统计图是直观地显示出具体数据,频数直方图是表现频数的分布情况; ②绘制的形式不同,条形统计图各条形分开,频数直方图的条形连在一起.
4、实例:
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 7.0 6.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
例 为了考察某种大麦穗长的分布情况,在一块试验田里抽取了100 个麦穗,量得它们的长度如下表(单位:cm):
列出样本的频数分布表,画出频数分布直方图.
解:(1)计算最大值与最小值的差.
在样本数据中,最大值是7.4,最小值是4.0
它们的差是:7.4-4.0=3.4.
(2)决定组距和组数.
最大值与最小值的差是3.4,取组距为0.3,那么,可分成 12 组,组数合适.即,组距为 0.3,组数为 12.
(3)列频数分布表.
(4)画频数分布直方图.
四、清点战果(评)
今天你是否完成了学习目标?你的困惑解决了没?
五、一战成名(检)
1、小明在纸上写下一组数字“20222023”这组数字中2出现的频数为( )
A. B. C.3 D.5
1、解:在这个数的所有数字中“2”出现的频数是:5,
故选:D.
2、下列5个数: 、、、0.21、1.606006000中,无理数出现的频数是( )
A.2 B.3 C.0.4 D.0.6
2、解: 、、、0.21、1.606006000中,无理数有: 、,无理数出现的频数是2.
故选:A.
3、一组数据有90个,其中最大值为141,最小值为40,取组距为10,则可以分成( )
A.9组 B.10组 C.11组 D.12组
3、解:在样本数据中最大值为141,最小值为40,它们的差是141-40=101,已知组距为10,那么由于101÷10=10.1,
故可以分成11组.
故选:C.
4、为了解新冠肺炎疫情解封后刚复学时学生的心理健康,扬州市某区在全区7600名初中同学中随机抽查了500名同学进行问卷调查,对500个数据进行整理,在频数的统计表中各组的频数之和等于 .
4、解:为了解新冠肺炎疫情解封后刚复学时学生的心理健康,扬州市某区在全区7600名初中同学中随机抽查了500名同学进行问卷调查,对500个数据进行整理,在频数的统计表中各组的频数之和等于500.
故答案为:500.
5、随机抽检一批衬衣的合格情况,得到如下的频数表.
抽取件数(件) 100 150 200 500 800 1000
合格频数 90 141 189 474 760 950
合格频率 0.90 0.94 0.945 0.948 0.95 0.95
则出售这批衬衣2000件,估计次品大约有 件.
5、解:由表格知,任意抽一件衬衣是合格品的概率为0.95;
所以估计次品的数量为2000×(1-0.95)=100(件).
故答案为:100.
6、某班在一次班会课上,就“遇见路人摔倒后如何处理”主题进行讨论,并对全班50名学生的处理方式进行统计,得出相关统计表和统计图,请根据统计表图所提供的信息回答下列问题:
组别 A B C D
处理方式 迅速离开 马上救助 视情况而定 只看热闹
人数 m 30 n 5
(1)统计表中的m= ,n= ;
(2)补全频数分布直方图;
(3)若该校共有800名学生,请据此估计该校学生采取“马上救助”方式学生有多少人?
6、解:(1)m=5,n=50-5-30-5=10,
故答案为:5,10;
(2)如图,
(3)800×=480(人),
所以可估计该校学生采取“马上救助”方式的学生有480人.
六、用
(一)必做题
1、已知有10个数据:13,15,17,19,16,14,15,17,16,18,其中15出现的频数是( )
A. B. C.2 D.5
1、解:已知有10个数据:13,15,17,19,16,14,15,17,16,18,其中15出现的频数是2,
故选:C.
2、对于实数707007000700007,其中数字7出现的频数为( )
A.5 B.10 C. D.
2、解:对于实数707007000700007,其中数字7出现的频数为7.
故选:A.
3、为了解某市九年级男生的身高情况,随机抽取了该市100名九年级男生,他们的身高x(cm)统计如下:
组别(cm) x≤160 160<x≤170 170<x≤180 x>180
人数 15 42 38 5
根据以上结果,全市约有3万男生,估计全市男生的身高不高于180cm的人数是( )
A.28500 B.17100 C.10800 D.1500
3、解:估计全市男生的身高不高于180cm的人数是30000×=28500(名),
故选:A.
4、统计得到一组数据的最大值是39.最小值是23,取组距为5.可分成 组.
4、解:在这组数据中最大值为39,最小值为23,它们的差是39-23=16,
已知组距为5,由于16÷5=3.2,
故可以分成4组.
故答案为:4.
5、已知一组数据都是整数,其中最大值是242,最小数据是198,若把这组数据分成9个小组,则组距是 .
5、解:这组数据的极差为242-198=44,
44÷9≈4.9,
所以组距为5,
故答案为:5.
6、某地区为了了解七年级学生防疫知识的掌握情况,从该地区七年级学生中随机抽取部分学生进行防疫知识测试,并把学生的得分绘制了部分频数分布表和频数分布直方图(如图).已知图中从左到右第一、第二、第三、第四小组的频数的比为1:3:4:2.
分组 频数
60≤x<70
70≤x<80 15
80≤x<90
90≤x<100
(1)此次活动共抽取了多少名学生进行防疫知识测试?
(2)请将表补充完整.
(3)如果该地区七年级共有6000名学生,80分以上(含80分)的成绩为掌握防疫知识比较好,请估计该地区七年级有多少名学生掌握防疫知识比较好.
6、解:(1)根据题意得:15÷=50(名),
则此次活动共抽取50名学生;
(2)根据题意得:50×=5(名);50×=20(名);50×=10(名),
补全表格如下:
分组 频数
60≤x<70 5
70≤x<80 15
80≤x<90 20
90≤x<100 10
(3)根据题意得:6000×=3600(名),
答:估计该地区七年级有3600名学生掌握防疫知识比较好.
(二)选做题
7、某社区卫生中心对辖区居民卫生安全知识了解情况进行问卷调查活动,现从中随机抽取了30份问卷的成绩进行统计.成绩(满分为100分)如表1,整理得出频数分布表2和频数分布直方图的一部分,请根据图表信息,回答以下问题:
表1:
69 69 74 75 75 77 78 80 81 81
83 84 84 86 86 88 89 91 91 93
93 95 95 96 96 97 98 98 100 100
表2:
分组 频数
64≤x<70 2
70≤x<76 a
76≤x<82 5
82≤x<88 5
88≤x<94 b
94≤x≤100 9
(1)其中a= ,b= ;
(2)根据频数分布表,补全频数分布直方图;
(3)如果该社区共有3000名居民,请估计该社区居民得分93分及以上有多少人?
7、解:(1)由题意知a=3,b=6,
故答案为:3,6;
(2)补全图形如下:
(3)估计该社区居民得分93分及以上有3000×=1100(人).
答:估计该社区居民得分93分及以上有1100人.
8、2020年初突如其来的“新冠”疫情在武汉市爆发,疫情牵动着全国人民的心,某社区响应竞秀区政府的号召,组织社区居民为武汉人民献爱心活动,为了解该社区居民捐款情况,对社区部分捐款户数进行分组统计(统计表如下),数据整理成如图所示的不完整统计图.已知A,B两组捐款户数直方图高度比为1:5,请结合图中相关数据回答下面问题.
捐款分组统计表
组别 捐款额(x)/元
A 0≤x<100
B 100≤x<200
C 200≤x<300
D 300≤x<400
E x≥400
(1)A组频数是多少?本次调查捐款容量是多少?
(2)求出C的频数?并补全频数分布直方图.
(3)若该社区有500户住户,请估计捐款金额100~200之间的户数是多少?
8、解:(1)A组的频数是:
(10÷5)×1=2,
调查样本的容量是:
(10+2)÷(1-40%-28%-8%)=50.
(2)C组的频数是:50×40%=20.
(3)捐款金额100~200之间的是B组,
B组捐款户数所占的百分比:(1-40%-28%-8%)×=20%,
捐款金额100~200之间的户数是:500×20%=100(户).
答:捐款金额100~200之间的户数是100户.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)