5.1.3 数据的直观表示
基础过关练
题组一 柱形图、折线图、扇形图
1.某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取2%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的初中生近视人数分别为( )
图甲 图乙
A.100,50 B.100,1 050
C.200,50 D.200,1 050
2.十项全能是田径运动中全能项目的一种,是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是将由国际田径联合会制定的专门的田径运动全能评分表中各个单项成绩所得的评分加在一起得出的,总分多者为优胜者.如图,这是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是( )
A.在400米项目中,甲的得分比乙的得分低
B.甲的各项得分比乙的各项得分更均衡
C.在跳高和铁饼项目中,甲、乙水平相当
D.甲的各项得分的极差比乙的各项得分的极差大
3.(多选题)图1为某省2025年1~4月份快递业务量统计图,图2为该省2025年1~4月份快递业务收入统计图,对统计图理解正确的是( )
图1
图2
A.2025年1~4月份快递业务量3月份最高,2月份最低,差值接近
2 500万件
B.2025年1~4月份快递业务量同比增长率均超过50%,在3月份最高
C.从两图中看,业务量与业务收入变化高度一致
D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
题组二 茎叶图
4.某学校开展了“国学”系列讲座活动,为了了解活动效果,用分层抽样的方法从高一年级所有学生中抽取10人进行国学素养测试,这10名同学的性别和测试成绩(百分制)的茎叶图如图所示,则男生成绩的75%分位数为 分;已知高一年级中男生共有80人,则估计高一年级学生的总人数为 .
5.以下茎叶图记录了甲、乙两组各三名同学在期末考试中的数学成绩,其中乙组的记录中有一个数字模糊,无法确认,假设这个数字具有随机性,并在图中以a表示.
(1)当a=2时,分别求出甲、乙两组同学数学成绩的平均数以及乙组的方差;
(2)若甲组的数学平均成绩高于乙组的数学平均成绩,求a的值.
题组三 频数分布直方图与频率分布直方图
6.为了解本市7.5万名志愿者的服务时长(单位:h),做了一次随机抽样调查.将样本中个体的服务时长进行统计整理,得到如图所示的频率分布直方图.据此估计志愿者中服务时长超过32 h的有( )
A.3.45万人 B.3.48万人
C.3.82万人 D.3.91万人
7.(多选题)某市教育局和体育局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生的身高,他们的身高数据都处在A,B,C,D,E五个层次内,根据抽样结果得到如下统计图,则下面叙述正确的是( )
A.样本中女生人数多于男生人数
B.样本中B层人数最多
C.样本中E层男生人数为6
D.样本中D层男生人数多于女生人数
8.某班同学对年龄(单位:岁)在[25,55]内的人群随机抽取n人进行了生活习惯是否符合低碳观念的调查.生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到统计表和各年龄段人数的频率分布直方图,则表中p,a的值分别为( )
组数 分组 “低碳族”的人数 占本组的频率
第一组 [25,30) 120 0.6
第二组 [30,35) 195 p
第三组 [35,40) 100 0.5
第四组 [40,45) a 0.4
第五组 [45,50) 30 0.3
第六组 [50,55] 15 0.3
A.0.79,20 B.0.195,40
C.0.65,60 D.0.975,80
9.某高校土木工程系大四年级55名学生期末考试专业成绩的频率分布折线图如图,其中组距为10,且本次考试中最低分为50分,最高分为100分.
根据图中所提供的信息,给出下列说法:①成绩是75分的有20人;②成绩是100分的人数比成绩是50分的人数多;③成绩落在70~90分的有35人;④成绩落在75~85分的有35人.
其中正确的说法是 .(填序号)
10.某次数学考试后,抽取了20名同学的成绩(单位:分)作为样本并绘制了频率分布直方图如下.
(1)求频率分布直方图中a的值;
(2)求这20名同学成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(3)估计样本数据的第一四分位数和80%分位数(保留三位有效数字).
11.某中学从高一年级随机抽取50名学生进行智力测验,其得分(单位:分)如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;
(3)分析频率分布直方图,你能得出什么结论
能力提升练
题组一 柱形图、折线图、扇形图、茎叶图
1.(多选题)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生的人数为800
B.该校高一学生中选考物化政组合的人数为96
C.该校高一学生中选考物理的人数比选考历史的人数多80
D.用分层抽样方法从该校高一学生中抽取20人,则从生史地组合中抽取6人
2.在某校高中篮球联赛中,甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示,如图1所示,有部分数据丢失,甲的得分的折线图如图2所示,则下列结论正确的是( )
图1
图2
A.甲的得分的极差是18分
B.乙的得分的中位数是16.5分
C.甲的得分更稳定
D.甲的单场平均得分比乙低
3.(多选题)(2024福建厦门期末)下图是全国居民消费价格涨跌幅的统计图(月度同比增长率是指本月和上一年同月相比较的增长率,月度环比增长率是指本月和上一个月相比较的增长率),从2022年5月到2023年5月,下列说法正确的是( )
全国居民消费价格涨跌幅
A.全国居民消费价格月度同比涨跌幅的极差为1.9%
B.2023年1月份全国居民消费价格月度环比涨幅最大
C.2023年5月份全国居民消费价格比2022年5月份全国居民消费价格上涨了0.2%
D.2023年2月份开始,全国居民消费价格持续下降
题组二 频率分布直方图
4.对300名考生的数学竞赛成绩(单位:分)进行统计,将统计数据按[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,得到如图所示的频率分布直方图,则下列说法正确的是( )
A.a=0.02
B.成绩落在[80,90)内的考生人数最多
C.成绩的中位数大于80分
D.成绩的平均分落在[70,80)内
5.某校将举办秋季体育文化节,为了解该校学生的身体状况,抽取部分男生和女生了解他们的体重,将男生体重数据整理后,作出了频率分布直方图.已知图中从左到右前三个小组的频率之比为1∶2∶3,第二小组的频数为13.若全校男、女生人数之比为13∶12,则全校抽取的学生人数为( )
A.100 B.80 C.45 D.32
6.已知某班一次数学测试成绩(单位:分)的茎叶图(如图1,图中仅列出[50,60),[90,100]的数据)和频率分布直方图(如图2),则x-y= .
7.某校欲了解高一学生的睡眠情况,现从600名学生中抽取一个容量为50的样本进行问卷调查,根据抽样调查情况得到高一学生的日睡眠时间(单位:h)的频率分布直方图如图.按照中学生健康教育标准要求,高中生应保证日睡眠时间达到8 h,已知被调查的学生中共有18人达标.
(1)求频率分布直方图中a,b的值;
(2)若日睡眠时间在[7,8)内的学生可通过自己的努力保证日睡眠时间达标,在[6.5,7)内的学生需要通过老师谈话劝说达到要求,为使不低于80%的学生睡眠时间达标,这600名学生中有多少名学生需要老师做工作才能使睡眠时间达标
答案与分层梯度式解析
5.1.3 数据的直观表示
基础过关练
1.D 2.D 3.ABC 6.A 7.ABC 8.C
1.D 由分层抽样的概念可得样本容量为=200,则该地区的初中生有=3 500(人),所以该地区的初中生近视人数为3 500×30%=1 050.
2.D 在400米项目中,甲的得分高于800分,乙的得分低于800分,故甲的得分比乙的得分高,A错误;
甲的各项得分中,最高分为1 000分,最低分低于400分,而乙的各项得分均在(600,800]内,故乙的各项得分更均衡,甲的各项得分的极差比乙的各项得分的极差大,B错误,D正确;
在跳高项目中,甲、乙水平相当,均为800分,
但在铁饼项目中,甲、乙成绩相差较大,C错误.
故选D.
3.ABC 由题图1可知,3月份的快递业务量为4 897万件,2月份的快递业务量为2 411万件,差值为4 897-2 411=2 486(万件),故A正确;易知B正确;
对于C,由题图易知业务量从高到低分别是3月,4月,1月,2月,业务收入从高到低分别是3月,4月,1月,2月,保持高度一致,故C正确;
对于D,由题图2知业务收入2月份比1月份减少,4月份比3月份减少,整体不具有高速增长趋势,故D错误.
故选ABC.
4.答案 77.5;200
解析 将男生成绩从小到大排列,为64,76,77,78,共4个数据,且4×75%=3,
所以男生成绩的75%分位数为=77.5(分).
设高一年级学生的总人数为n,
因为用分层抽样方法抽取的10人中,男生有4人,且高一年级中男生共有80人,
所以,解得n=200.
5.解析 (1)甲组的平均成绩是,乙组的平均成绩是=91,
乙组的方差是.
(2)乙组的平均成绩是,
由(1)及题意知,解得a<1,
易知a是自然数,所以a=0.
6.A 由题图可知服务时长超过32 h的频率为1-4×(0.005+0.040+0.090)=0.46,所以估计志愿者中服务时长超过32 h的有0.46×7.5=3.45(万人).
7.ABC 样本中女生人数为9+24+15+9+3=60,男生人数为100-60=40,故样本中女生人数多于男生人数,A正确;
样本中A层人数为9+40×10%=13,B层人数为24+40×30%=36,C层人数为15+40×25%=25,D层人数为9+40×20%=17,E层人数为3+40×(1-10%-30%-25%-20%)=9,故样本中B层人数最多,B正确;
由B的判断过程知样本中E层男生人数为40×(1-10%-30%-25%-20%)=6,C正确;
样本中D层男生人数为40×20%=8,女生人数为9,故样本中D层男生人数少于女生人数,D错误.
故选ABC.
8.C 由题表知第一组总人数为120÷0.6=200,第三组总人数为100÷0.5=200,第五组总人数为30÷0.3=100,第六组总人数为15÷0.3=50.
由题中的频率分布直方图可得第一组的频率为5×0.04=0.2,所以n==1 000.
所以第四组总人数为5×0.03×1 000=150,所以a=150×0.4=60,第二组总人数为1 000-(200+200+150+100+50)=300,所以p==0.65.故选C.
9.答案 ③
解析 ①错误,成绩落在70~80分的人数为10××55=20,但不能说成绩是75分的有20人;
②错误,从题图中看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在50~60分的人数和成绩落在90~100分的人数相等;
③正确,成绩落在70~90分的有×55=35(人);
④错误,无法判断成绩落在75~85分的人数.
10.解析 (1)由题图可知(2a+3a+7a+6a+2a)×10=1,解得a=0.005.
(2)易得这20名同学成绩的平均数为(55×2a+65×3a+75×7a+85×6a+95×2a)×10=76.5.
(3)由题图可知,[50,60),[60,70),[70,80),[80,90),[90,100]对应的频率分别为0.1,0.15,0.35,0.3,0.1,前两组频率之和恰为0.25,故样本数据的第一四分位数为70.0.
前三组频率之和为0.6,前四组频率之和为0.9,所以样本数据的80%分位数在第四组.
设样本数据的80%分位数为x,则0.6+(x-80)×0.03=0.8,解得x≈86.7.
11.解析 (1)这次测验成绩的最高分是97分,最低分是32分.
(2)根据题意,列出样本的频率分布表如下:
分组 频数 频率
[30,40) 1 0.02
[40,50) 6 0.12
[50,60) 12 0.24
[60,70) 14 0.28
[70,80) 9 0.18
[80,90) 6 0.12
[90,100] 2 0.04
合计 50 1.00
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大的形态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.
能力提升练
1.AC 2.B 3.BCD 4.D 5.A
1.AC 对于A,∵选科为政史地的人数为200,占比为25%,∴该校高一学生共有=800(人),A正确;
对于B,∵选科为物化生的人数为800×35%=280,
∴选科为物化政的人数为=80,B错误;
对于C,∵选考历史的人数为200+160=360,选考物理的人数为280+80+80=440,∴选考物理的人数比选考历史的人数多440-360=80,C正确;
对于D,∵选科为生史地的学生人数占比为×100%=0.2×100%=20%,∴采用分层抽样抽取20人时,生史地组合应抽取20×20%=4(人),D错误.
故选AC.
2.B 甲的得分的极差为28-9=19(分),故A错误;
从题图知,甲的最低得分为9,最高得分为28,且大于或等于20的得分有3个,而乙的得分有6个在(10,20)内,故乙的得分更稳定,故C错误;
乙的得分数据由小到大依次为9,14,15,16,17,18,19,20,所以乙的得分的中位数为=16.5(分),故B正确;
乙的得分的平均数为=16(分),
从题中折线图可看出题中茎叶图中甲的得分中丢失的数据一个为15,另一个可设为m,其中10故其平均数为>16,故D错误.
3.BCD A项,月度同比涨幅最大为2.8%,最小为0.1%,所以全国居民消费价格月度同比涨跌幅的极差为2.8%-0.1%=2.7%,A错误;
B项,2023年1月份全国居民消费价格月度环比涨幅最大,为0.8%,B正确;
C项,2023年5月份月度同比增长0.2%,则全国居民消费价格上涨了0.2%,C正确;
D项,2023年2月份开始,月度环比增长率都为负数,则全国居民消费价格持续下降,D正确.故选BCD.
4.D 对于A,由题图得(a+0.02+0.035+0.025+a)×10=1,解得a=0.01,故A错误;
对于B,成绩落在[70,80)内的考生人数最多,故B错误;
对于C,成绩落在[50,70)内的频率为(0.01+0.02)×10=0.3,成绩落在[70,80)内的频率为0.035×10=0.35,∴成绩的中位数在[70,80)内,故C错误;
对于D,成绩的平均分=55×0.01×10+65×0.02×10+75×0.035×10+85×0.025×10+95×0.01×10=75.5(分),∴成绩的平均分落在[70,80)内,故D正确.
5.A 设第一小组的频率为x,则由题中频率分布直方图得x+2x+3x+0.037 5×5+0.012 5×5=1,解得x=0.125,
∴第二小组的频率为2x=0.25.
∵第二小组的频数为13,∴抽取的男生人数为=52.∵全校男、女生人数之比为13∶12,∴全校抽取的学生人数为52+=100.
6.答案 0.004
解析 由题中茎叶图可知[50,60),[90,100]的频数分别为5,2.
由题中频率分布直方图可得每组的频率依次为0.2,0.24,0.36,10x,10y,
设样本容量为n,
则
故x-y=0.012-0.008=0.004.
7.解析 (1)由题意得0.5×(0.40+a)×50=18,解得a=0.32;
0.5×(0.2+0.32+0.28+b+0.40+0.32)=1,解得b=0.48.
(2)要使600名学生中有不低于80%的学生睡眠时间达标,则需要有600×80%=480人的睡眠时间达到8 h,
而睡眠时间在[7,9]内的学生人数为0.5×(0.28+0.48+0.40+0.32)×600=444,
所以为使不低于80%的学生睡眠时间达标,这600名学生中有480-444=36名学生需要老师做工作才能使睡眠时间达标.
20(共9张PPT)
知识点 1 柱形图(条形图)、折线图与扇形图
知识 清单破
5.1.3 数据的直观表示
类型 作用
柱形图 (条形图) 形象地比较各种数据之间的数量关系,柱形
图中每一矩形都是等宽的
折线图 形象地表示数据的变化情况
扇形图 形象地表示出各部分数据在全部数据中所
占的比例情况
1.一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列.若数据是两位数,则茎上的
数字表示十位上的数字,叶上的数字表示个位上的数字.茎叶图也可以只表示一组数.
2.用茎叶图表示数据的优缺点
(1)优点:①从茎叶图上可以看出所有的原始数据及数据的分布情况;②茎叶图可以在收集完
数据后描述,也可以在收集数据的过程中描述,即一边收集数据,一边记录.
(2)缺点:①茎叶图只便于表示比较集中的数据;②茎叶图只方便比较两组数据.
知识点 2 茎叶图
1.绘制频数分布直方图、频率分布直方图的步骤
(1)找出最值,计算极差.
(2)合理分组,确定区间(组距):
①若 为整数,则 =组数;
②若 不为整数,则 +1=组数([x]表示不大于x的最大整数).
(3)整理数据(可以将频数与频率列表).
(4)作出有关图示:
①频数分布直方图的纵坐标是频数,每一组数对应的矩形高度与频数成正比;
②频率分布直方图的纵坐标是 ,每一组数对应的矩形高度与频率成正比,且每个矩形的
知识点 3 频数分布直方图与频率分布直方图
面积等于这一组数对应的频率,所有矩形的面积之和为1.
2.频数分布折线图与频率分布折线图
把频数分布直方图和频率分布直方图中的每个矩形上面一边的中点用线段连接起来得
到的折线图即对应为频数分布折线图和频率分布折线图.为了方便看图,折线图都画成与横
轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
知识辨析 判断正误,正确的画“√”,错误的画“ ”.
1.当数据量很大时,柱形图能够直观地反映数据分布的大致情况. ( )
2.画频率分布直方图时,分组越多越好.( )
3.频率分布直方图的纵轴表示频率. ( )
4.当样本数据增加时,频率分布折线图不会发生变化. ( )
√
组数越多、组距越小时,保留了较多的原始数据信息,但由于小矩形较多,有时图形会
变得非常不规则,不容易从中看出总体数据的分布特点.
提示
讲解分析
1.频率分布直方图的特征
(1)频率分布直方图的形状与组数(组距)有关.组数(组距)的变化会引起频率分布直方图的结
构变化.
(2)频率分布直方图由样本决定,因此它会随着样本的改变而改变.
(3)若固定分组数,则随着样本容量的增加,频率分布直方图中的各个矩形的高度会趋于特定
的值.
(4)频率分布直方图能够直观地表明数据分布的情况,一般呈中间高、两端低的“峰”状结
构.但是从直方图本身得不到具体的数据内容.
疑难 情境破
疑难 频率分布直方图
2.与频率分布直方图有关的结论
(1)小矩形的面积=组距× =频率;
(2)所有小矩形的面积之和等于1;
(3) =频率,此关系式的变形为 =样本容量,样本容量×频率=频数.
典例 (多选)某学校为了调查学生一周内在生活方面的支出情况,抽取了一个容量为n的样本,
其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有60人,则下列说法正确
的是 ( )
A.样本中支出在[50,60]内的频率为0.03
BC
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则一定有600人的支出在[50,60]内
解析 由题中频率分布直方图知,样本中支出在[50,60]内的频率为1-(0.010+0.024+0.036)×10
=0.3,故A错误;
样本中支出不少于40元的人数为 ×60+60=132,故B正确;
n= =200,故C正确;
若该校有2 000名学生,则可能有2 000×0.3=600人的支出在[50,60]内,故D错误.
故选BC.