第二十七讲?认识人工智能
学习目标"
1.体验人工智能典型应用过程,剖析人工智能典型案例;
2.了解智能信息处理的巨大进步和应用潜力。
学习内容
在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能加速发展。
人工智能
人工智能是计算机科学的一个分支,是研究计算机模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。人工智能是引领未来的战略性技术,将深刻改变人类生产生活方式。人类要保持对人工智能的控制能力,防范人工智能失控的风险和对人类社会未来发展的潜在威胁。
在互联网时代,人们“遇上新问题,就上网搜索,寻找出答案”已成为一种习惯。然而,一般的信息搜索需要人们在搜索引擎上输入一些关键字,然后在返回的无数个相关网页中,一个一个地打开查看网页内容是否包含自己所需要的信息。这种搜索方式非常耗时,严重影响查找信息的效率。如何快速准确地获取所需要的信息,成为人们亟待解决的问题。
上述的空调企业智能客服机器人是一款领域知识智能问答机器人。它是在某一领域知识范围内实现人机自动问答的智能信息系统,是一种新颖的信息检索系统。它可以准确理解人们的信息检索意图,并通过语料库检索出相关文档和答案,最后从相关的候选答案中提取最接近问题的结果。使用智能问答机器人时,人们可以不采用输入关键字的方式提问,而是直接使用自然语言组成的问句进行提问。因为智能问答机器人采用的自然语言处理技术,可以根据相关领域知识,对人们的提问做必要处理后返回结果,且返回的结果不同于一般搜索引擎返回成千上万的网页,而是通过对答案的抽取,直接从成千上万的网页中快速、准确地检索出所需结果。
剖析领域知识智能问答机器人
领域知识智能问答机器人是在某一领域知识范围内实现人机自动问答的智能信息系统。在智能问答系统中,用户能够直接向机器人提出自己关心的问题;然后机器人根据用户的提问把系统中已有的相似问题的正确答案按问句相似度进行排序,再把排序后的结果作为答案反馈给用户;最后将认为最满意的答案标记为最佳答案。典型的智能问答系统主要包括常见问题解答(FAQ)、问题理解、信息检索、文档库、答案抽取五大模块,结构如下图所示。
1.常见问题解答模块
用户发起提问后,智能问答系统首先从FAQ库中寻找是否包括用户的问题(问句),如果包含问句,则直接返回问句对应的答案给用户,从而省去后面一系列步骤;否则,就进入问题理解模块。FAQ库主要用于提高智能问答系统的效率,其主要技术就是问句相似度计算和候选问句的选择。
问句相似度计算通常采用 Jaccard相似度系数算法。 Jaccard相似度系数表示两集合的交集元素个数与两集合的并集元素个数之比,系数越高,两集合的相似度越高。例如,计算问句A“空调机有什么功能?”与问句B“空调机的功能有哪些?”的 Jaccard相似度系数流程如下:
(1)运用分词系统处理问句。处理后得到集合A={“空调机”,“有”,“什么”,能”,“?”}和集合B={“空调机”,“的”,“功能”,“有”,“哪些”,“?”}。
(2)计算集合A和集合B的交集与并集。集合A和集合B的交集={“空调机”,“有”,“功能”,“?”},集合A和集合B的并集={“空调机”,“有”,“什么”,“功能”,“的”,“哪些",“?”}。
(3)计算交集元素的数量和并集元素的数量的比值。交集元素的数量为4,并集元素的数量为7,交集元素的数量和并集元素的数量的比值为4÷7≈0.57。因此,将0.57作为问句A和问句B的相似度系数。
2.问题理解模块
该模块主要实现计算机理解用户的问题,确定问题的关键词和问题的类型,为后面的信息检索和答案提供服务。问题理解模块的实现过程一般包括问题预处理、问题分类、关键词提取和关键词扩展等。其中,问题分类主要确定问题的类别,以方便信息检索和答案抽取。问题理解模块主要运用的技术有分词、同义词词典、分类方法等。
3.信息检索模块
该模块主要从互联网或者知识库中找到与问题相关的文档作为答案提取的原材料。信息检索的方法一般有两种,一种是直接利用搜索引擎检索信息;另一种是建立特定的知识库,然后根据知识库建立索引模块,从而可以方便、快速地找到相关文档,并根据特点的排序算法对文档进行排序。信息检索模块运用的技术主要包括查询扩展、语料库的构建技术、词汇索引、文档排序等。
4.文档库模块
文档库用于存放专家提供的知识,其内部含有大量某个领域的常识性知识和专家水平的知识与经验总结,且能够利用专家的知识和解决问题的方法来处理该领域问题。知识的表示形式有产生式、框架、语义网络等,运用得较为普遍的知识是产生式规则。产生式规则以“iif…then…”的形式出现,即如果前提条件得到满足,就产生相应的动作或结论。
5.答案抽取模块
该模块主要利用问题的类型构建相应的答案抽取策略,从信息检索后的文档中对排序靠前的文档进行答案的定位和输出,所用技术主要有答案抽取模板的制定、模式匹配、聚类等。
人工智能的诞生与发展
人工智能是通过智能机器延伸、增强人类改造自然和治理社会能力的新兴技术。怎样才能判断一台机器是否具备了思维能力呢?阿兰·图灵提出:在测试人与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。经过多次测试后,如果被测试者超过70%的答复不能使测试人确认出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类智能。测试示意图如下图所示
在20世纪50年代,有几位科学家提出想做一台能够像人那样认知、思考和学习的机器,也就是用计算机来模拟人的智能。他们列举了几个准备去攻克的难点,包括系统计算机、用程序对计算机进行编程、神经网络、计算的复杂性、自我学习与提高、抽象等。从此,人工智能便迈上了它的征途,人工智能发展历程大致分为三个阶段。
第一阶段(20世纪50年代—80年代)。这一阶段人工智能刚诞生,基于抽象数学推理的可编程数字计算机已经出现,符号主义( Symbolism)快速发展,但由于很多事物不能形式化表达,建立的模型存在一定的局限性。此外,随着计算任务的复杂性不断加大,计算能力远远不能满足需求,人工智能发展一度遇到瓶颈
第二阶段(20世纪80年代一90年代末)。在这一阶段,专家系统得到快速发展,数学模型有重大突破,但由于专家系统在知识获取、推理能力等方面的不足,以及开发成本高等原因,人工智能的发展又一次进入低谷期。
第三阶段(21世纪初至今)。大数据的积聚、理论算法的革新、计算能力的提升,为人工智能发展提供了丰富的数据资源,协助训练岀更加智能化的算法模型。人工智能的发展模式也从过去追求“用计算机模拟人工智能”,逐步转向以机器与人结合而成的増强型混合智能系统,用机器、人、网络结合成新的群智系统,以及用机器、人、网络和物结合成的更加复杂的智能系统。人工智能在很多应用领域取得了突破性进展,迎来了又一个繁荣时期。