中小学教育资源及组卷应用平台
2024信息技术学业水平考试专题练
优化集训16 文本数据处理、数据可视化
1.根据交通路况实时更新导航线路的应用场景中,下列处理方式中合理的是( )
A.选用针对静态数据的批处理计算
B.选用针对流数据的流计算
C.选用针对图结构数据的图计算
D.用统计分析软件提供的丰富的统计算法进行数据分析
2.Python中,可以绘制多种形式的图形,常用于科学计算可视化的扩展模块是( )
A.numpy B.scipy
C.pandas D.matplotlib
3.利用matplotlib模块的pyplot子模块进行绘图,绘图下列绘图函数必需的是( )
A.show() B.polt()
C.legend() D.scatter()
4.文本数据处理的一般过程包括分词、特征提取、数据分析和结果呈现等。中文的词与词之间呈现紧密连接的特点。下列说法错误的是( )
A.中文分词方法十分复杂
B.实现完全准确的中文分词还很困难
C.不同的中文分词算法不能结合使用
D.基于规则的分词方法还处于试验阶段
5.下列关于文本数据分析与应用的说法错误的是( )
A.对大型数据集中的文本分词后须先进行特征提取,再创建词云
B.标签云用词频表现文本特征
C.文本情感分析的研究领域是专门、单一的
D.文本情感分析应用于多个不同领域
6.下列有关数据可视化方法的说法,错误的是( )
A.要分析相等时间间隔下数据的发展趋势,可采用折线图
B.要显示各部分数据在总数据中的大小和比例关系,可采用饼图
C.要探究若干数据系列中各数值之间的关系,可采用柱形图
D.要比较每个数据相对中心的数值变化,可采用雷达图
7.下列关于大数据应用的说法,错误的是( )
A.随着大数据在各行各业的应用,数据成为核心资产
B.云计算对大数据的分析应用无太大帮助
C.大数据在电子商务领域的应用,为商业的振兴起到了推动作用
D.智能交通可以使交通运输服务和管理智能化
8.下列关于大数据在电子商务方面的应用,说法正确的是( )
A.精准营销基于用户购买行为的大数据,使用推测算法深度挖掘出用户行为偏好
B.在供应链管理中,根据商品的销售情况和市场预期数据,依靠推断模型,实现商品自动补货
C.在交易、营销、供应链、仓储等环节不会产生太多数据
D.智能网站基于大数据挖掘和分析,电商网站变得越来越智慧
9.下列哪项不属于智能交通为人们出行提供的便利 ( )
A.通过智能手机随时随地查看火车车次和购票
B.人们没出门就知道即将乘坐的公交车到哪里了
C.通过外卖派送吃到周边美食
D.在网上就可以订机票或改签
10.文本数据处理的主要步骤包括:
①结果呈现 ②特征提取 ③分词 ④数据分析
⑤文本数据获取
正确的顺序是( )
A.⑤②④①③ B.⑤③①④②
C.⑤①③②④ D.⑤③②④①
11.关于中文分词方法的描述中,属于基于词典的分词方法的是( )
A.在分析句子时与词典中的词语进行对比,词典中出现的就划分为词
B.依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词
C.让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词
D.依据词语与词语之间的空格进行分词
优化集训16 文本数据处理、数据可视化
1.B 解析 根据交通路况实时更新导航线路中数据为流数据,所以选用流计算。
2.D 解析 matplotlib模块:依赖于拓展库numpy和标准库tkinter,可以绘制多种形式的图形,包括折线图、散点图、饼状图、柱状图等,常用于科学计算可视化。
3.A 解析 在图表对象上绘制的图表,需要执行plt.show()函数后,绘制的图表才会显示。
4.C 解析 中文词与词之间的紧密连接,其分词方法十分复杂,目前尚不能实现完全准确的中文分词。为了获得更准确的分词结果,在实际应用中,可以将不同的分词算法结合使用,比如将基于词典与基于统计的分词方法相结合。基于规则的分词方法需要让计算机模拟人的理解,但是由于中文语言知识十分复杂,这种分词方法还处于试验阶段。
5.C 解析 标签云用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的形式代表词语的重要性;将文本中复杂的或者难以通过文字表达的内容和规律以视觉符号的形式表达出来。文本情感分析作为一个多学科交叉的研究领域,涉及自然语言处理、信息检索、机器学习、人工智能等领域,主要应用于网络舆情监控、用户评论分析与决策、信息预测等众多领域。
6.C 解析 关系的可视化可采用散点图或气泡图。
7.B 解析 本题考查大数据应用的相关知识。云计算使千亿数据的检索实现了秒级返回,为大数据的分析提供了速度保障。
8.D 解析 本题考查大数据在电子商务中的应用。精准营销基于用户购买行为的大数据,使用推荐算法深度挖掘用户的行为偏好。供应链管理根据商品的销售情况和市场预期数据,依靠预测模型,实现自动补货。大型电商企业拥有大量用户数据,同时,在交易、营销、供应链、仓储、配送和售后等环节也产生了大量数据。
9.C 解析 本题考查智能交通的应用。智能交通主要通过交通信息服务、交通管理、公共交通、车辆控制、货运管理、电子收费、紧急救援等服务子系统为用户提供服务。
10.D 解析 典型的文本处理过程主要包括分词、特征提取、数据分析、结果呈现等。
11.A 解析 基于词典的分词方法也成为基于字符匹配的分词方法,即在分子句子时与词典中的词语进行对比,词典中出现的就划分为词。
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)