课件23张PPT。第四章 因特网的应用本章主要内容 4.1 因特网上的信息检索 因特网的发展和广泛运用,使世界范围内的信息交流、信息资源共享变得更加便利,它打破了时空的限制,扩展了人类的信息活动空间。根据中国互联网络信息中心(CNNIC)在京发布第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,中国网页数量为2360亿个,而全世界的网页数量则更多,要想及时准确的获取所需的信息,不是一件容易的事。为此,人们开发了各种类型的信息检索工具。4.1.1 检索工具的类型和特点按照信息的搜集方法和服务方式的不同来分:目录检索搜索引擎元搜索引擎目录检索(主题目录) 方法:将收集到的网络资源进行加工整理,按照主题分类体系编制成层次结构式的目录表,一级目录下有二级目录,二级目录下可能还有三级目录等等,最后指向具体的资源或网页的链接地址。hao 360主页模式腾讯网主页模式7目录检索优缺点优点:资源经过分门别类的安排和组织,可以快速的找到相关信息。
缺点:整理的信息范围有限,数据库相对较小,更新速度慢。搜索引擎(全文搜索引擎)搜索引擎既指搜索引擎技术,也指使用搜索引擎技术的网站。
特点:网站的主页上有一个醒目的检索框,供用户填入所要检索的关键词词组或者短语。可以使用逻辑运算符(AND、OR、NOT)生产逻辑表达式组成检索条件。填好后点击检索按钮即可查询信息。
百度搜索引擎搜索引擎优缺点优点:信息量大,更新及时
缺点:检索条件较宽,查询信息过多,难以选择。
元搜索引擎特点:通过一个统一的界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。元搜索引擎优缺点优点:检索结果的条数相对较少。
缺点:
检索性能的局限性。
调用搜索引擎的局限性。
检索结果在数量上的局限性。
4.1.2 搜索引擎的工作原理搜索引擎一般包括两大核心技术:
自动网页搜索技术和全文检索技术。自动网页搜索技术自动网页检索技术的工作可分为以下四个步骤:搜索引擎工作原理动画全文检索技术 这是一种将文本中的任何字符或字符串都可以作为检索入口的检索方式。也就是说,它能够把所有包含检索词的文档检索出来。或者说,能对文档中出现的任意词进行检索。课 堂 练 习 1.用户使用某个搜索引擎进行查询,该搜索引擎由于没有自己的数据库,于是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重新排除、重新排序等处理后把综合的结果返回给用户。这个搜索引擎属于( )
A.全文搜索引擎 B.目录搜索引擎
C.垂直主题搜索引擎 D.元搜索引擎D课 堂 练 习2.某搜索引擎如下图所示,可以看出它属于( )
A.目录搜索引擎 B.全文搜索引擎
C.元搜索引擎 D.集成搜索引擎C课 堂 练 习3.下列关于搜索引擎的说法中,错误的是( )。
A.目录类搜索引擎的网站导航质量高,但分类不够细、信息更新速度慢
B.全文搜索引擎的信息量大、更新及时,但返回信息过多,用户必须进行筛选
C.元搜索引擎将多个搜索引擎返回的结果经过处理后保存到自己的数据库中
D.通过元搜索引擎可以同时使用多种全文搜索引擎进行检索C课 堂 练 习4.“定期地自动到各个网站上,把网页抓取下来,并顺着网页中的链接,持续不断的抓取网页”,这句话描述的是搜索引擎的( )。
A.搜索器(“蜘蛛”程序) B.索引器
C.检索器 D.触发器A谢谢观赏