2021-2022学年高中信息技术浙教版(2019)必修4.2.3 文本数据处理 课件-1(23张PPT).pptx
(共23张PPT)
4.2.3文本数据处理
1.文本数据处理的一般过程
2.文本数据的分析与应用
文本数据处理的目的
文本数据处理的主要目的是从大规模的文本数据中提取出符合需求的、感兴趣的和隐藏的信息。
文本数据处理的应用
搜索引擎
情报分析
自动摘要、自动校对
论文查重、文本分类
垃圾邮件过滤
机器翻译
自动应答
文本数据处理的一般过程
文本数据源
分词
特征提取
数据分析
结果呈现
中文分词
分词是将连续的字序列按照一定的规范重新组合成词序列的过程。
下雨天留客天留人不留
主人家:下雨天留客,天留人不留
徐:下雨天,留客天,留人不?留!
中文分词的方法
1、基于词典的分词方法
根据设定好的...