5.4数据的可视化表达
一、选择题
1.图为2020年2月3日-4月15日我国工程建设领域复工率(含新建项目)、复工强度变化的图表表达,下面说法正确的是( )
①单独一个数据是没有意义的,将数据联系起来进行加工处理分析,可以获取信息
②数据和信息都是有价值的,其价值时刻都能体现出来
③折线图适合表示数据间的对比,柱形图适合表示数据变化趋势
④从图表中可以分析出4月15日复工率已达3月18日的1.5倍左右,这反映了我国工程建设领域市场旺盛的需求
⑤根据对图表的分析,建议加强工程机械供应链及生产管理,保障工程建设复工的顺利进行
A.①②④⑤ B.①④⑤ C.③④⑤ D.①②③
2.词云图是一种数据可视化表达方式。关于下图所示词云图说法正确的是( )
A.词云图只能通过字体的大小表示关键词的重要程度
B.对文本分词后可直接创建词云图,无须特征提取
C.从词云图可以分析出词语“父亲”比“北京”的出现频率高
D.词云图必须显示该数据集包含的全部词语
3.2021年5月11日,国家统计局公布第七次全国人口普查主要数据结果,数据显示,在人口年龄构成方面,0至14岁人口为25338万人,占17.95%;15至59岁人口为89438万人,占63.35%;60岁及以上人口为26402万人,占18.70%。我们可以运用以下哪种图表形象地呈现我国人口年龄结构?( )
A.折线图 B.词云图 C.饼图 D.柱形图
4.下列关于词云说法错误的是( )。
A.词云是目前常用的关键词可视化形式
B.用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征信息
C.词云通常使用字体的大小和颜色表示关键词的重要程度或出现频次
D.在词云中,字越大表示该关键词使用频率就越低
5.数据可视化表达的工具有( )
A.Seaborn 与Bokeh B.Seaborn 与 Word C.Word与 Bokeh D.Excel与c++
6.以下关于数据可视化描述中,不恰当的是( )。
A.通过图形化手段清晰有效地传达与沟通信息
B.选择合适的图表类型才有助于对信息的理解
C.数据可视化有利于推动数据思维提升并发现业务逻辑
D.尽量从视觉设计的角度制作数据可视化图表
7.下列选项中,可以实现实时数据可视化的是( )
A.导航地图 B.标签云图 C.思维导图 D.统计图表
8.下列选项中,属于可视化应用的是( )
A.思维导图 B.拍照识花 C.课程表 D.语音助手
9.列关于投针实验的描述错误的是( )。
A.投针实验起源于18世纪
B.投针实验应用了蒙特卡洛方法并采用计算机进行模拟
C.投针实验中拋掷的次数越多,结果偏离越大
D.投针实验可通过“网络画板”平台进行模拟
10.下列选项中,属于数据可视化表达的是( )
A.表格表达 B.文字表达 C.项目式表达 D.流程图表达
11.下列不属于思维导图制作工具的是( )。
A.Xmind B.Mindmanager C.FreeMind D.Word
12.Mac OS系统的开发者是( )。
A.微软公司 B.惠普公司 C.苹果公司 D.IBM公司
13.下列不是数据可视化优势的是( )
A.更容易被记住 B.可以多维度显示数据
C.快速展现企业存在的风险 D.只能一维度显示数据
二、简答题
14.以下数据为1945年—2015年间登陆我国的台风数据记录。按数据流计算,尝试使用数据分析的方法,建立模型推测下一次台风登陆我国的地点及时间,并阐述你的理由。
图1
图2
图3
三、判断题
15.数据可视化的目的是为了帮助用户过滤、清洗掉无用的、错误的数据。(______)
16.数据可视化是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等。(______)
17.数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。( )
试卷第2页,共2页
参考答案
1.B
【详解】
本题考查的是数据、信息及可视化表达信息相关知识。数据和信息都是有价值的,其价值并不是时刻都能体现出来;柱形图适合表示数据间的对比,折线图适合表示数据变化趋势。故本题应选B。
2.C
【详解】
本题考查的是词云图。词云图通过字体的大小和颜色来表示关键词的重要程度,故选项A说法错误;创建词云图需要特征提取,故选项B说法错误;从词云图可以分析出词语“父亲”比“北京”的出现频率高,选项C说法正确;词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨,故选项D说法错误。
3.C
【详解】
本题考查的是图表相关知识。常见图表:(1)柱形图:显示各个项目之间的比较情况。(2)拆线图:适用于显示在相等条件间隔下数据的趋势。(3)饼图:每一数值相对于总数值的大小,即占比。(4)条形图:和柱形图一样,显示各个项目之间的比较情况。要显示我国人口年龄结构应采用饼图,故本题应选C。
4.D
【详解】
本题主要考查可视化工具。词云是目前常用的关键词可视化形式;用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征信息;词云通常使用字体的大小和颜色表示关键词的重要程度或出现频次;在词云中,字越大表示该关键词使用频率就越高,故本题选D选项。
5.A
【详解】
本题主要考查数据可视化表达。Seaborn是基于matplotlib的图形可视化python包,它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表;Bokeh (Bokeh.js) 是一个 Python 交互式可视化库;Word是字处理软件;Excel是表格处理软件,c++ 是程序设计软件,故本题选A选项。
6.D
【详解】
本题主要考查数据可视化的描述。通过图形化手段清晰有效地传达与沟通信息;选择合适的图表类型才有助于对信息的理解;数据可视化有利于推动数据思维提升并发现业务逻辑;应该根据实际需要,从不同的角度制作数据可视化图表,不一定局限于视觉角度,故本题选D选项。
7.A
【详解】
本题主要考查数据可视化方法。导航地图可以实现实时数据可视化,标签云图、思维导图、统计图表是静态非实时的可视化工具,故本题选A选项。
8.A
【详解】
本题主要考查数据可视化。思维导图是揭示文本数据之间相互关系的可视化表达,“拍照识花”和“语音助手”属于人工智能中的模式识别的应用,课程表是表格的应用,它们都不属于数据可视化的应用,故本题选A选项。
9.C
【详解】
本题主要考查数字可视化的应用。投针实验起源于18世纪;投针实验应用了蒙特卡洛方法并采用计算机进行模拟;投针实验中拋掷的次数越多,结果偏离越小;投针实验可通过“网络画板”平台进行模拟,故本题选C选项。
10.D
【详解】
本题主要考查数据可视化。数据可视化表达是指以图表、图形、动画等方式更加直观生动地呈现数据以及数据分析的结果,揭示数据之间的关系、趋势、规律等表达方式。流程图是简单的文本数据可视化的表达方式之一,故本题选D选项。
11.D
【详解】
本题主要考查数据可视化工具。Xmind、Mindmanager、FreeMind均是思维导图制作工具,Word是字处理软件,故本题选D选项。
12.C
【详解】
本题考查的是操作系统Mac OS。Macintosh(简称Mac)是苹果公司自1984年起开发的个人消费型计算机,包含如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro等计算机。使用独立的Mac OS系统,Mac OS系列基于NeXT系统开发,不支持兼容。是一套完备而独立的操作系统。故选项C正确。
13.D
【详解】
本题考查的数据可视化知识点。ABC均是数据可视化的优势。
14.下一次台风登陆我国的广东,2016年7月上旬(根据出现频率的推断)
【详解】
本题考查数据分析的相关知识点
可以采用关联分析法就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事务中某些属性同时出现的规律和模式。关联分析的基本算法如下:
扫描历史数据,并对每项数据进行频率次数统计
构建候选项集C1,并计算其支持度,即数据出现频率次数与总数的比
对候选项集的支持度进行筛选,筛选的数据项支持度应当不小于最小支持度,从而形成频繁项集L1
对频繁项集L2进行连接生成候选项集C2,重复上述步骤,最终形成频繁K项集或者最大频繁项集
15.错误
【详解】
本题主要考查数据可视化。数据可视化可以使数据变得更有意义,而且可视化也可以使数据变得更容易理解,故表述错误。
16.正确
【详解】
本题考查的是数据可视化。数据可视化是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等。题干的说法是正确的。
17.正确
【详解】
本题考查的是数据的可视化表达。
答案第2页,共3页
答案第3页,共3页