数据的表示——知识讲解
【学习目标】
1.理解扇形统计图的特点,会制作扇形统计图,并能从中获取信息;
2.了解频数等概念,会画频数分布直方图,理解频数分布直方图的意义和作用;
3.理解三种统计图各自的特点,并能根据不同问题选择适当的统计图描述数据.
【要点梳理】
要点一、组距、频数与频数分布表的概念
1.组距:每个小组的两个端点之间的距离(组内数据的取值范围).
2.频数:落在各小组内数据的个数.
3.频数分布表:把各个类别及其对应的频数用表格的形式表示出来,所得表格就是频数分布表.
要点诠释:
(1)求频数分布表的一般步骤:①计算最大值与最小值的差;②决定组距和组数;③确定分点;④列频数分布表;
(2)频数之和等于样本容量.
(3)频数分布表能清楚、确切地反映一组数据的大小分布情况,将一批数据分组,一般数据越多,分的组也越多,当数据在100个以内时,按数据的多少,常分成5~12组,在分组时,要灵活确定组距,使所分组数合适,一般组数为的整数部分+1.
要点二、频数分布直方图
1.频数分布直方图:是以小长方形的面积来反映数据落在各个小组内的频数的大小,直方图由横轴、纵轴、条形图三部分组成.
(1)横轴:直方图的横轴表示分组的情况(数据分组);
(2)纵轴:直方图的纵轴表示频数;
(3)条形图:直方图的主体部分是条形图,每一条是立于横轴之上的一个长方形、底边长是这个组的组距,高为频数.
2.作频数直方图的步骤:
(1)计算最大值与最小值的差;
(2)决定组距与组数;
(3)列频数分布表;
(4)画频数分布直方图.
要点诠释:
(1)频数分布直方图简称直方图,它是条形统计图的一种.
(2)频数分布直方图用小长方形的面积来表示各组的频数分布,对于等距分组的数据,可以用小长方形的高直接表示频数的分布.
3.直方图和条形图的联系与区别:
(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;
(2)区别:由于分组数据具有连续性,直方图中各矩形之间通常是连续排列,中间没有空隙,而条形图中各矩形是分开排列,中间有一定的间隔;直方图是用面积表示各组频数的多少,而条形图是用矩形的高表示频数.
要点三、统计图的选择
统计图:利用“条形图”、“扇形图”、“折线图”描述数据,这样做的最大优点是将表格中的数据所呈现出来的信息直观化.
要点诠释:
(1)条形统计图:用线段长度表示数据,根据数据的多少画成长短不同的长方形直条,然后按顺序把这些直条排列起来,条形统计图很容易看出数据的大小,便于比较,但不能清楚地反映各部分占总体的百分比.
(2)扇形统计图:用整个圆表示总体,用圆内各个扇形的大小表示各部分数量,从扇形上可清楚地看出各部分量和总数量之间的关系,但不能直接表示出各个项目的具体数据.
(3)折线统计图:用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来,折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况,但不能清楚地反映数据的分布情况.
【典型例题】
类型一、组距、频数与频数分布表的概念
1. (2019?天津模拟)已知一个样本中,50个数据分别落在5个组内,第一、二、三、四、五组数据的个数分别为2、8、15、20、5,则第四组的频率为( )
A.0.1 B.0.2 C.0.3 D.0.4
【答案】D.
【解析】
解:由题意得:第四组的频率是20÷50=0.4.
【总结升华】掌握频率、频数、总数三者之间的关系:频率=频数÷总数.
举一反三:
【变式】有一个样本容量为20的样本,其数据如下:29,42,58,37,53,52,49,24,37,45,42,55,40,38,50,26,54,26,44,32.根据以上数据填写下表:
分组
频数累计
频数
频率
21~30
31~40
41~50
51~60
合计1
【答案】
解:如下表:
分组
频数累计
频数
频率
21~30
4
0.20
31~40
正
5
0.25
41~50
正一
6
0.30
51~60
正
5
0.25
合计1
20
1.00
类型二、频数分布表或频数直方图
2.某地区对其所属中学八年级的英语教学情况进行期末质量调查,从中抽出的20个班级的英语期末平均成绩如下(单位:分):
80 81 83 79 64 76 80 66 70 72
71 68 69 78 67 80 68 72 70 65
试列出频数分布表并绘出频数分布直方图.
【思路点拨】按照作直方图的四个步骤进行解答.解答时,应注意每个步骤中需要注意的事项.
【答案与解析】
解:(1)计算最大值与最小值的差:83-64=19(分).
(2)决定组距与组数:
若取组距为4分,则有≈5,所以组数为5.
(3)列频数分布表:
(4)画出频数分布直方图.如图所示.
【总结升华】按步骤进行操作.因选取的组距不同,所列的频数分布表及直方图也不一样,在统计时,数据不能出现重复或遗漏的现象.
举一反三:
【变式】如图是某校九年级部分男生做俯卧撑的成绩(次数)进行整理后,分成五组,画出的频率分布直方图,已知从左到右前4个小组的频率分别是0.05,0.15,0.25,0.30,第五小组的频数为25,若合格成绩为20,那么此次统计的样本容量和本次测试的合格率分别是( ).
A.100,55% B.100,80% C.75,55% D.75,80%
【答案】B.
类型三、统计图的选择
3.某学校为了进一步丰富学生的体育活动,欲增购一些体育器材,为此对该校一部分学生进行了一次“你最喜欢的体育活动”的问卷调查(每人只选一项).根据收集到的数据,绘制成如下统计图(不完整)
请根据图中提供的信息,完成下列问题:
(1)在这次问卷调查中,一共抽查了 名学生;
(2)请将上面两幅统计图补充完整;
(3)在图1中,“踢毽”部分所对应的圆心角为 度;
(4)如果全校有1860名学生,请问全校学生中,最喜欢“球类”活动的学生约有多少人?
【思路点拨】找好扇形统计图和条形统计图之间的对应关系.
【答案】(1)200; (2)如图; (3)54; (4)744
【解析】
解:(1)8040%=200(人)
(2)如图:
(3)360°15%=54°
(4)186040%=744(人)
【总结升华】条形统计图能反映出各部分数量的大小,而扇形统计图能反映出各部分占总体的比例大小,两者结合,则此类题容易求解.
举一反三:
【变式1】某校为了了解该校初二年级学生阅读课外书籍的情况,随机抽取了该年级的部分学生,对他们某月阅读课外书籍的情况进行了调查,并根据调查的结果绘制了如下的统计图表.
请你根据以上信息解答下列问题:
这次共调查了学生多少人?E组人数在这次调查中所占的百分比是多少?
求出表1中a的值,并补全图1;
若该年级共有学生300人,请你估计该年级在这月里阅读课外书籍的时间不少于12小时的学生约有多少人.
【答案】
解:(1)这次共调查了学生50人,E组人数在这次调查中所占的百分比是%.
(2)表1中a的值是15,补全如图.
(3)54人.
【变式2】(2019?台州)某校想了解学生每周的课外阅读时间情况,随机调查了部分学生,对学生每周的课外阅读时间x(单位:小时)进行分组整理,并绘制了如图所示的不完整的频数分布直方图和扇形统计图.
根据图中提供的信息,解答下列问题:
(1)补全频数分布直方图;
(2)求扇形统计图中m的值和“E”组对应的圆心角度数;
(3)请估计该校3000名学生中每周的课外阅读时间不小于6小时的人数.
【答案】
解:(1)数据总数为:21÷21%=100,
第四组频数为:100﹣10﹣21﹣40﹣4=25,
频数分布直方图补充如下:
(2)m=40÷100×100=40;
“E”组对应的圆心角度数为:360°×=14.4°;
(3)3000×(25%+)=870(人).
即估计该校3000名学生中每周的课外阅读时间不小于6小时的人数是870人.
类型四、综合应用
4.低碳发展是今年深圳市政府工作报告提出的发展理念,近期,某区与某技术支持单位合作,组织策划了该区“低碳先锋行动”,开展低碳测量和排行活动,根据调查数据制作了频数分布直方图(每组均含最小值,不含有最大值)和扇形统计图,下图中从左到右各长方形的高度之比为2:8:9:7:3:1.
(1)已知碳排放值5≤x<7(千克/平方米·月)的单位有16个,则此次行动共调查了________个单位;
(2)在图②中,碳排放值5≤x<7(千克/平方米·月)部分的圆心角为_________度;
(3)小明把图②中碳排放值1≤x<2的都看成1.5,碳排放值2≤x<3的都看成2.5,依此类推,若每个被检查单位的建筑面积均为10000平方米,则按小明的办法,可估算碳排放值x≥4(千克/平方米·月)的被检单位一个月的碳排放总值约为________吨.
【思路点拨】
(1)先算出碳排放值在5≤x<7范围内所对应的比例,再求一共调查了多少个单位;
(2)由碳排放值在5≤x<7范围内所占的比例,可计算出圆心角度数;
(3)先计算碳排放值4≤x<5的单位、碳排放值5≤x<6的单位,碳排放值6≤x<7的单位个数,再算出碳排放值x≥4(千克/平方米·月)的被检单位一个月的碳排放总值.
【答案与解析】
解:(1)16÷=120(个),故答案为120;
(2)4÷30×360°=48°,故答案为48;
(3)碳排放值x≥4(千克/平方米·月)的被检单位是第4,5,6组,分别有28个、12个、4个单位,10000×(28×4.5+12×5.5+4×6.5)÷1000=10×(126+66+26)=2180(吨).
所以,碳排放值x≥4(千克/平方米·月)的被检单位一个月的碳排放总值约为2180吨.
【总结升华】解答本题的关键是将直方图提供的信息转化为频数分布表.这种“转化”过程对解题大有帮助,值得学习和借鉴.
举一反三:
【变式】2018年5月9日至14日,德州市订共有35000余名学生参加中考体育测试,为了了解九年级男生立定跳远的成绩,从某校随机抽取了50名男生的测试成绩,根据测试评分标准,将他们的得分按优秀、良好、及格、不及格(分别用A、B、C、D表示)四个等级进行统计,并绘制成下面的扇形图和统计表:
请你根据以上图表提供的信息,解答下列问题:
(1)m=________,n=________,x=________,y=________;
(2)在扇形图中,C等级所对应的圆心角是________度;
(3)如果该校九年级共有500名男生参加了立定跳远测试,那么请你估计这些男生成绩等级达到优秀和良好的共有多少人?
【答案】
解:(1)20,8,0.4,0.16; (2)57.6;
(3)由上表可知达到优秀和良好的共有19+20=39(人),500×(人).
【巩固练习】
一、选择题
1.为了绘出一批数据的频率分布直方图,首先计算出这批数据的变动范围是指数据的( )
A.最大值 B.最小值 C.最大值与最小值的差 D.个数
2.在频数分布直方图中,各小矩形的面积等于( ).
A.相应各组的频数 B.组数 C.相应各组的频率 D.组距
3.已知一组数据有80个,其中最大值为140,最小值为40,取组距为10,则可分成( ).
A.10组 B.9组 C.8组 D.7组
4.(2019?曲靖)某企业为了解员工给灾区“爱心捐款”的情况,随机抽取部分员工的捐款金额整理绘制成如图所示的直方图,根据图中信息,下列结论错误的是( )
A.样本中位数是200元
B.样本容量是20
C.该企业员工捐款金额的极差是450元
D.该企业员工最大捐款金额是500元
5.在样本频数分布直方图中,有11个小长方形.若中间的小长方形的面积等于其他10个小长方形面积之和的,且样本容量为160个,则中间的一组的频数为( ).
A.0.2 B.32 C.0.25 D.40
6. 如图所示为某校782名学生小考成绩的次数分配直方图,若下列有一选项为下图成绩的累积次数分配直方图,则此图为( ).
7.有40个数据,其中最大值为35,最小值为15,若取组距为4,则应该分的组数是( ).
A.4 B.5 C.6 D.7
8.学校为了解七年级学生参加课外兴趣小组活动情况,随机调查了40名学生,将结果绘制成了如图所示的频数分布直方图,则参加绘画兴趣小组的频率是( ).
A.0.1 B.0.15 C.0.25 D.0.3
二、填空题
9.(2019?温州模拟)有50个数据,共分成6组,第1~4组的频数分别为10,8,7,11.第5组的频率是0.16,则第6组的频数是 .
10.一个样本有20个数据:35 31 33 35.37 39 35 38 40 39 36 34 35 37 36 32 34 35 36 34.在列频数分布表时,如果组距为2,那么应分成________组,36立在第________组中.
11.某班50名学生参加2018年初中毕业生毕业考试,综合评价等级为A,B,C等的学生情况如扇形图所示,该学校共有500人参加毕业考试,估计该学校得A等的学生有______名.
12.某单位职工的年龄(取正整数)的频数分布直方图如图所示,根据图中提供的信息,进行填空.
(1)该单位职工共有________人;
(2)不小于38岁但小于44岁的职工人数占职工总人数的百分率是________.
13.某中学举行一次演讲比赛,分段统计参赛同学的成绩,结果如下表(分数均为整数,满分为100分):请根据表中提供的信息,解答下列各题:
(1)参加这次演讲比赛的同学共有________人;
(2)已知成绩在91~100分的同学为优胜者,那么,优胜率为________.
14.某校为了了解某个年级的学习情况,在这个年级抽取了50名学生,对某学科进行测试,将所得成绩(成绩均为整数)整理后,列出表格:
分组
50~59分
60~69分
70~79分
80~89分
90~99分
频率
0.04
0.04
0.16
0.34
0.42
(1)本次测试90分以上的人数有________人;(包括90分)
(2)本次测试这50名学生成绩的及格率是________;(60分以上为及格,包括60分)
(3)这个年级此学科的学习情况如何?请在下列三个选项中,选一个填在题后的横线上________.
A.好 B.一般 C.不好
三、解答题
15.为了了解中学生的体能状况,某校抽取了50名学生进行1分钟跳绳测试,将所得数据整理后,分成5组绘成了频数分布直方图,如图(图中数据含最低值不含最高值).其中前4个小组的频率依次为0.04,0.12,0.4,0.28.
(1)第4组的频数是多少?
(2)第5组的频率是多少?
(3)哪一组的频数最大?
(4)补全统计图,并绘出频数分布折线图.
16.为检查某工厂所产8万台电扇的质量,抽查了其中40台,这40台电扇的无故障连续使用时限如下:(单位:h)
248 256 232 243 188 278 286 292
308 312 274 296 288 302 295 208
314 290 281 298 228 287 217 329
283 327 272 264 307 257 268 278
266 289 312 198 204 254 244 278
(1)以组距20h列出样本的频数分布表,并画出频数分布直方图;
(2)估计8万台电扇中有多少台无故障连续使用时限会不少于288h?
(3)样本的平均无故障连续使用时限是多少?
(4)如果电扇的无故障正常(非连续)使用时限是无故障连续使用时限的8倍,那么这些电扇的正常使用寿命为多少小时?(精确到1h)
17.(2019?宿迁)某校为了了解初三年级1000名学生的身体健康情况,从该年级随机抽取了若干名学生,将他们按体重(均为整数,单位:kg)分成五组(A:39.5~46.5;B:46.5~53.5;C:53.5~60.5;D:60.5~67.5;E:67.5~74.5),并依据统计数据绘制了如下两幅尚不完整的统计图.
解答下列问题:
(1)这次抽样调查的样本容量是 ,并补全频数分布直方图;
(2)C组学生的频率为 ,在扇形统计图中D组的圆心角是 度;
(3)请你估计该校初三年级体重超过60kg的学生大约有多少名?
【答案与解析】
一、选择题
1. 【答案】C;
【解析】频率直方图是按照数据从小到大的顺序排列,包括所有的数据,即数据的变化范围是指数据的最大值和最小值的差.
2. 【答案】A;
【解析】频数直方图中纵坐标表示的是频数,则小长方形的高为频数,小长方形的面积=.
3. 【答案】A;
【解析】据组数=(最大值-最小值)÷组距计算,注意小数部分要进位.
4.【答案】A.
【解析】A、共2+8+5+4+1=20人,中位数为10和11的平均数,故中位数为175元,错误;
B、共20人,故样本容量为20,正确;
C、极差为500﹣50=450元,正确;
D、该企业员工最大捐款金额是500元,正确.
5. 【答案】B;
【解析】根据在频数直方图中,某一组相应的小长方形的面积与直方图中所有小矩形面积的比值即这小组的频率,求得中间一个长方形对应的频率后,再由频数、频率、总数的关系求解.
6. 【答案】A;
【解析】将一个变量的不同等级的相对频数用矩形块标绘的图表(每一矩形的面积对应于频数).因为本题求哪个是成绩的累积次数分配直方图,故累计次数作为纵坐标.
7. 【答案】B;
【解析】.
8. 【答案】D;
【解析】根据频率= .
二、填空题
9.【答案】6.
【解析】∵有50个数据,共分成6组,第5组的频率是0.16,∴第5组的频数为50×0.16=8;
又∵第1~4组的频数分别为10,8,7,11,∴第6组的频数为50﹣(10+8+7+11+8)=6.
10.【答案】5, 3;
11.【答案】100;
【解析】500×(1-30%-50%)=100.
12.【答案】 (1)50 (2)58% ;
【解析】正确读图是做题的关键.
13.【答案】 (1)20 (2)20%;
【解析】优胜率=.
14.【答案】 (1)21 ;(2)96% ;(3)A .
【解析】(1)0.42×50=21.(2)1-0.04-0.96=96%.(3)理由是优秀率和及格率都很高.
三、解答题
15.【解析】
解:(1)第4组的频数是0.28×50=14.
(2)第5组频率为1-0.04-0.12-0.4-0.28=0.16.
(3)170~180这一组频数最大.
(4)补全统计图略.
频数分布折线图如图.
16.【解析】
解:(1)频数分布表如下:
频数分布直方图如图
(2)因为这40台中不少于288h的有9+5+1=15(台),
所以8万台电扇中不少于288h的有(万台).
(3)平均无故障连续使用时限为(h).
(4)电扇的正常寿命为271.3×8≈2170(h).
17.【解析】
解:(1)这次抽样调查的样本容量是4÷8%=50,B组的频数=50﹣4﹣16﹣10﹣8=12,
补全频数分布直方图,如图:
(2)C组学生的频率是0.32;D组的圆心角=;
(3)样本中体重超过60kg的学生是10+8=18人,
该校初三年级体重超过60kg的学生=人,
故答案为:(1)50;(2)0.32;72.