(共111张PPT)
我叫李冬梅
来自北大附中,将和大家一起探讨新课程的教学
希望我们合作愉快
08 09 23 江西新课程培训
高中信息技术
新课标理念目标及实施
08 09 23 江西新课程培训
李冬梅Ldm@pku.
背景及课程结构介绍
1
与指导纲要的差异
2
学生现状分析
3
4
主要内容
5
理念与目标
6
教学模式的选择
教学评价与反馈
(一)背景与课程结构
08 09 23 江西新课程培训
背 景 介 绍
课程改革是政府行为,势在必行。
基础教育处于改革发展的新阶段。2000年,完成了基本普及九年义务教育的奋斗目标,至2004年已达到93%。
国家在提供了基本的就学机会以后,基础教育即进入了一个以全面提高教育质量为主要任务的新阶段。
教育部在进行了一系列的调研和国际比较研究的基础上,于2002年12月,经部党组讨论通过了经专家组审议的高中新课程方案和各学科课程标准,并同意以省为单位进行实验。 2003年3月教育部正式印发了新的高中课程方案和各学科课标。
08 09 23 江西新课程培训
高中新课程结构
普通高中课程由学习领域、科目、模块三个层次构成。
模 块
Text
领 域
科 目
背 景 介 绍
08 09 23 江西新课程培训
普通高中课程结构
数
学
语言与 文学
人文与 社会
科
学
技
术
艺
术
体育与 健康
综合实践 活动
语
文
外
语
数
学
物
理
化
学
生
物
通用技术
信息技术
政
治
历
史
地
理
美
术
综合实践活动
体育与健康
音
乐
艺
术
(略)
学习领域
科目
模块
学生毕业的学分要求
学生每学年在每个学习领域都必须修得一定学分;
三年中获得116个必修学分(包括研究性学习活动15学分,社区服务2学分,社会实践6学分),并在选修Ⅱ中至少获得6学分;
总学分达到144方可毕业。
高中课改的亮点
课程管理:
全国统一课程
国家课程
地方课程
校本课程
08 09 23 江西新课程培训
学习者
高中课改的亮点
完全被动接受
有了自主
选择的可能
08 09 23 江西新课程培训
评价
高中课改的亮点
单一
选拨性评价
多元
过程性评价
08 09 23 江西新课程培训
选修:
强调在必修模块的基础上关注技术能力与人文素养的双重建构,是信息素养培养的继续,是支持个性发展的平台
高中信息技术课程结构
高中信息技术课程——课程结构:
必修:
信息素养培养的基础,是学习后续选修模块的前提。
高中信息技术
信息技术课程的模块设置
高中信息技术课程——模块设置:
信息技术基础
选修5:人工智能初步
选修1:算法与程序设计
选修2:多媒体技术应用
选修3:网络技术应用
选修4:数据管理技术
学分 安排
高中信息技术课程——学分安排:
每个模块2学分,36课时
毕业要求:
学生必须修满4学分(必修2学分,科目内选修2学分),才能取得高中毕业资格。
有兴趣、有潜能的高中学生再加修若干学分,为今后发展创造条件。
08 09 23 江西新课程培训
(二)高中信息技术
新课标的理念与目标
08 09 23 江西新课程培训
课程理念一:
提升信息素养,培养信息时代的合格公民
以高中信息技术课程的开设为契机,充分调动家庭、学校、社区等各方力量,整合教育资源,为高中学生提供必备的软硬件条件和积极健康的信息内容,营造良好的信息氛围;既关注当前的学习,更重视可持续发展,为学生打造终身学台。
08 09 23 江西新课程培训
课程理念二:
营造良好的信息环境,打造终身学台
信息素养是信息时代公民必备的素养。高中信息技术课程以义务教育阶段课程为基础,以进一步提升学生的信息素养为宗旨,强调通过合作解决实际问题,让学生在信息的获取、加工、管理、表达与交流的过程中,掌握信息技术,感受信息文化,增强信息意识,内化信息伦理,使高中学生发展为适应信息时代要求的具有良好信息素养的公民。
08 09 23 江西新课程培训
课程理念三:
关照全体学生,建设有特色的信息技术课程
充分考虑高中学生起点水平及个性方面的差异,强调学生在学习过程中的自主选择和自我设计;提倡通过课程内容的合理延伸或拓展,充分挖掘学生的潜力,实现学生个性化发展;关注不同地区发展的不均衡性,在达到“课程标准”的前提下,鼓励因地制宜、特色发展。
课程理念四:
强调问题解决,倡导运用信息技术进行创新实践
高中信息技术课程强调结合高中学生的生活和学习实际设计问题,让学生在活动过程中掌握应用信息技术解决问题的思想和方法;鼓励学生将所学的信息技术积极地应用到生产、生活乃至信息技术革新等各项实践活动中去,在实践中创新,在创新中实践。
08 09 23 江西新课程培训
课程理念五:
注重交流与合作,共同建构健康的信息文化
高中信息技术课程鼓励高中学生结合生活和学习实际,运用合适的信息技术,恰当地表达自己的思想,进行广泛的交流与合作,在此过程中共享思路、激发灵感、反思自我、增进友谊,共同建构健康的信息文化。
08 09 23 江西新课程培训
信息意识
信息能力
信息道德
信息素养
08 09 23 江西新课程培训
课程总目标:提升信息素养
信息素养表现在:对信息的获取、加工、管理、表达与交流的能力;对信息及信息活动的过程、方法、结果进行评价的能力;发表观点、交流思想、开展合作并解决学习和生活中实际问题的能力;遵守相关的伦理道德与法律法规,形成与信息社会相适应的价值观和责任感。
08 09 23 江西新课程培训
高中信息技术课程应培养的
信息素养主要包括
信息技术知识技能——基础
信息问题解决能力——核心能力
信息技术人文修养——人文素养
辩证的信息技术价值观——价值观导向
良好的信息技术使用习惯和社会责任感
——社会责任感
08 09 23 江西新课程培训
知识技能的目标:
要理解、熟练操作、适应
1. 理解信息及信息技术的概念与特征,了解利用常用信息技术获取、加工、管理、表达与交流信息的基本工作原理,了解信息技术的发展趋势。
2.能熟练地操作并应用常用信息技术工具,能适应信息技术的发展变化,初步形成自主学习新信息技术的能力。
08 09 23 江西新课程培训
根据实际需要,选择和熟练使用信息技术,获取、加工、管理、表达与交流信息,来解决实际问题的能力。
根据需要选择/使用信息技术
信息获取加工管理表达交流
解决生活学习中的实际问题
对过程、方法、结果进行评价;
总结一般规律;进行创新
过程与方法的目标——核心素养
08 09 23 江西新课程培训
过程与方法目标——核心素养
3、能从日常生活、学习中发现或归纳需要利用信息和信息技术解决的问题,能通过问题分析确定信息需求。
把发现和提出问题的权力还给学生,并形成一种自然的意识
重视信息需求分析
08 09 23 江西新课程培训
过程与方法目标——核心素养
4、能根据任务的要求,确定所需信息的类型和来源,能评价信息的真实性、准确性和相关性。
多信息来源:通过调查、访谈、实地考察等获取第一手资料;强调通过图书、报刊、杂志、光盘、因特网等多信息来源获取资料;辩证分析通过因特网获取信息的优缺点。
对信息来源进行比较分析,判断真伪。
5、能选择合适的信息技术进行有效的信息采集、存储和管理。
使学生有机会根据具体需要,评价各种信息技术工具的适用性,选择合适的工具或最佳的技术解决方案。
08 09 23 江西新课程培训
过程与方法目标——核心素养
6、能熟练运用信息技术,通过有计划的、合理的信息加工解决实际问题,辅助其他学科学习,创作信息作品。
面向实际问题的信息技术应用。
技术应用过程的规范性、计划性,例如,对软件工程思想的体现。
技术应用和作品制作的规划——自主规划。
08 09 23 江西新课程培训
过程与方法目标——核心素养
7、能采用适当的工具和方式呈现信息、发表观点、交流思想、开展合作
根据计划呈现的信息和内容的具体特点,针对不同受众的特点和需求,选择合适的信息技术工具和恰当的信息发布方式。
注意其中的信息伦理和有关规范。
过程与方法目标——核心素养
08 09 23 江西新课程培训
8、能对自己和他人信息活动的过程和结果进行评价,能归纳利用信息技术解决问题的基本思想方法。
学生参与评价:参与制定评价标准;采用有针对性的评价标准;教师和学生合作讨论评价方式,共同分析测验结果;学生是评价主体。
引导学生归纳有关原理、思想、方法
分析缺陷,鼓励创新。
过程与方法目标——核心素养
强调渗透;避免教条式的讲解
9、体验信息技术蕴涵的文化内涵,形成和保持对信息技术的求知欲,养成积极主动地学习和使用信息技术、参与信息活动的态度。
10、能辩证地认识信息技术对社会发展、科技进步和日常生活学习的影响。
11、能理解并遵守与信息活动相关的法律法规和道德规范,负责任地、安全地、健康地使用信息技术。
08 09 23 江西新课程培训
情感态度价值观目标
(三) 新课标与指导纲要的主要差异
08 09 23 江西新课程培训
08 09 23 江西新课程培训
新课标以培养信息素养为主要目标
新课标要求学生具备一定的信息技术应用技能
新课标强调培养学生的评价能力
新课标强调学生要有与信息社会相适应的价值观和责任感
新课标在技术内容上更注重方法与思想的挖掘
新课标明确提出以培养学生的信息素养为总目标,通过高中信息技术教育要使学生能够“选择合适的信息技术进行有效的信息采集、存储和管理;能采用适当的工具和方式呈现信息、发表观点、交流思想、开展合作” 。必修模块“更多关注课程的深层内涵。该模块所依托的信息技术内容不宜过分提高”“将课程重点转移到适合高中学生认知水平的信息素养的培养上” 。
面对的第一个问题:转变观念
08 09 23 江西新课程培训
在新课标下我们教学的重心不能只停留在讲解技术和工具能干什么,怎么做,而是要教会学生什么情况下选择什么样的信息技术或工具和方式“对信息进行获取、加工、管理、表达与交流” 。当然这首先要求学生对各种相关的信息技术和工具要达到熟练的程度。
面对的第一个问题:转变观念
08 09 23 江西新课程培训
因此,在新课标的教学中,我们面临的第一个问题就是转变观念,将教学重点转移到如何培养学生的信息素养上,而不再是操作与技能。
面对的第一个问题:转变观念
08 09 23 江西新课程培训
08 09 23 江西新课程培训
面对的第二个问题:学生现有水平与目标的差距
在2000年指导纲要中小学、初中的信息技术课没有被列为必修课,义务教育阶段又将信息技术教育放在综合实践活动领域,因此,我们面对的学生究竟学过了哪些基本的知识与技能还需要我们进一步的分析。
08 09 23 江西新课程培训
面对的第二个问题:学生现有水平与目标的差距
所以,在新课标的教学中,我们面临的第二个问题就是需要界定我们的教学对象已经掌握了哪些知识与技能?哪些知识和技能还需要进一步加强(或补课)?需要归纳总结哪些技术上的方法?
面对的第二个问题:学生现有水平与要求间的差距
课标解读的第54页还指出“关于各学段课程任务的轮廓性分野是这样确定的:小学——初步接触信息技术,形成感性经验;初中——提高信息技术应用技能,开始学习用信息技术解决生活与学习中的问题;
08 09 23 江西新课程培训
面对的第二个问题:学生现有水平与要求间的差距
高中——在持续经历信息技术的基础上,形成个性化发展,追求自由于信息文化的能力”,必修模块“所依托的技术内容不宜过分提高,可以在初中经验的基础上注入一定的实用技巧,注重对方法的归纳与总结”,由此看来,新课标下的教学就技术内容而言是非零起点,已经假定学生要具体一定的信息技术应用技能。
面对的第三个问题:如何对自己与他人的信息活动过程和结果进行评价?
新课标还强调了学生评价能力的培养。要求学生要“能评价信息的真实性、准确性和相关性”“能对自己和他人的信息活动过程和结果进行评价” 。新课标中提到的评价,不仅仅是对教学过程、学习过程及结果的评价,更重要的是对信息、对信息活动过程与结果的评价,是一种判断能力的培养。而在过去的信息技术教学中,有关这方面的内容及训练是很少的,即使是对学生学习结果的评价也是少而又少的。
面对的第三个问题:如何对自己与他人的信息活动过程和结果进行评价?
因此,在新课标的教学中,我们面临的第三个问题就是教师如何去评价学生的学习过程与结果?如何教会学生对自己与他人的信息活动过程和结果进行评价?
08 09 23 江西新课程培训
面对的第四个问题:如何在教学过程中渗透与信息社会相适应的伦理道德与法律法规
对于一线教师而言,在新课标的教学中面临的第四个问题就是,如何在教学过程中渗透与信息社会相适应的伦理道德与法律法规,信息技术所蕴含的文化内涵,以培养学生形成与信息社会相适应的价值观和责任感。
面对的第五个问题:教师不仅要熟练掌握各种技术的应用,同时还要了解它背后更深层的技术方法与技术思想
新课标除了必修模块外,还引入了五个选修模块,如算法与程序设计,人工智能初步,数据管理技术、多媒体技术应用、网络技术应用等。
08 09 23 江西新课程培训
面对的第五个问题:教师不仅要熟练掌握各种技术的应用,同时还要了解它背后更深层的技术方法与技术思想
“各选修模块是沿着技术分类纵向设置的” ,“具体教学中,需要教师适当对技术应用方法和思想进行渗透,引导学生去探究、发现技术背后所蕴含的技术价值和技术思想,使其获得知识与技能的同时,理解和掌握过程与方法,这样才能够学会认知,学会做事,乃至学会生活,提高终身学习的能力、分析解决问题的能力,满足其终身发展的需要,成为适应信息社会的公民。”
面对的第五个问题:教师不仅要熟练掌握各种技术的应用,同时还要了解它背后更深层的技术方法与技术思想
这里的“算法与程序设计”也不同于以往所讲的VB程序设计,它不仅仅是一些控件对象及编程,而且是对算法的理解,对软件工程思想的挖掘;“数据管理技术”要挖掘数据库技术思想和知识管理、知识发现等等。
08 09 23 江西新课程培训
面对的第五个问题:教师不仅要熟练掌握各种技术的应用,同时还要了解它背后更深层的技术方法与技术思想
因此,在新课标的教学中,我们面临的第五个问题就是不仅要熟练掌握各种技术的应用,同时还要了解它背后更深层的技术方法与技术思想,我们需要再学习。
08 09 23 江西新课程培训
(四) 学生现状分析
08 09 23 江西新课程培训
08 09 23 江西新课程培训
学生现状分析
新课标认定学生的信息技术应用技能为非零起点。那么起点在哪里?这个问题需要具体分析。现实情况是复杂多变的,不同的地域、不同的环境都会造成很大的差异,即使在同一个环境中也不可避免地存在着较大的差异。所以,我们面临的另一个问题就是学生水平的差异,它主要表现在以下三个方面。
08 09 23 江西新课程培训
1、信息技术应用技能的差异
多年来由于地区与地区之间,学校与学校之间小学初中开课的不均衡,造成了新课标面对的学生的信息技术应用技能参差不齐。我们知道,学生之中不乏特别优秀的,没有接触过计算机的也大有人在,一知半解的人又占多数。
调查表
LDM
调查结果
10%
对常用工具熟悉并有一定自主学习能力
85%
知道点,会一点
5%
什么都不会
08 09 23 江西新课程培训
LDM
2、自主学习能力的差异
除了信息技术应用技能上的差异外,学生在自主学习能力上也存在着较大的差异。这里之所以强调自主学习能力,是鉴于学生信息技术应用技能的现状,在新课标的教学中教师将面临着双重重任:技术应用的教学和信息素养的培养。而由于课时所限,又不可能花太多的时间在信息技术应用技能的培养上,因此,更多的技能要靠学生自学去补上。
LDM
2、自主学习能力的差异
然而,学生的自主学习能力的现状并不容我们乐观,由于长期采用STEP BY STEP的教学方式,学生习惯于教师牵着走,即使教师提供了具体要求详细操作步骤的技术热支持,大多数学生也不去看,仍然要问教师,即便是自认为自学能力很强的学生。只有少数学生(5%)能够根据教师提供的技术支持进行自主学习。
LDM
3、信息素养基础不同
新课标要着重培养的学生信息素养的基础也各不相同。
他们可能会进行文字处理、会对某张图片进行处理、会制作动画,但他们不知道什么时候选择什么样的工具来完成自己的意愿,我们的任务就是要教会它什么情况下选择什么样的工具来处理信息,表达自己的意图。
本校学生素材采集案例
08 09 23 江西新课程培训
LDM
?
面对以上问题
我们如何应对
(五)教学模式的选择
08 09 23 江西新课程培训
从教学形式上:分层教学
首先要解决的是如何处理学生水平参差不齐的问题,办法之一是分层教学法。
实现分层教学,首先要摸清学生的情况,确定分层原则。为了更好的搞清楚学生的水平,除填写调查表外,在分层教学前还进行了两周的实验教学
分层原则
教学测试
分层办法
LDM
08 09 23 江西新课程培训
LDM
从教学内容上:加强基本技能的学习
应对办法二是,根据学生的具体情况,在教学内容上适当增加基础技能的学习。这些内容包括基本的网络知识、文字表格处理等技能。
例如:
文字处理之名片设计
图像处理之我的校园1 2 3
网络之搜索引擎研究
08 09 23 江西新课程培训
LDM
教学模式的探索
从培养信息素养出发,基于问题解决,设计教学情境
选择恰当的教学方法进行教学
提供丰富的学习资源
给出详细的学习指导
提供有针对性的技术支持
布置难易适中的实践
交流 、及时评价与反馈
08 09 23 江西新课程培训
LDM
从培养信息素养出发,基于问题解决,设计教学情境与教学活动
如何让学生在学习过程中体验信息处理的全过程,培养其获取、管理、存储、加工、表达、交流信息的能力,教学情境及教学活动的设计是关键,一个好的学习活动不仅能够让学生体会并经历信息处理的过程,还可以学习总结一些技术技巧和方法,加深学生应用信息技术的能力。
我的学校我的同学
08 09 23 江西新课程培训
学生作品浏览
LDM
选择恰当的教学方法进行教学
针对不同的教学内容要选择恰当的教学方法。如:自主探究、游戏法、任务驱动法、小组协作等等。
且要注意各种方法的正确使用。
搜索研究报告
08 09 23 江西新课程培训
学生作品浏览
LDM
提供丰富的学习资源
信息素养需要学生在不断的实践中体验提升,学生在实践活动中需要大量的学习资源,当然,我们可以让学生上因特网去查找,但教师仍需要针对不同的学习主题性提供针对性较强的学习资源,如我们在校园内部网上为学生提供了丰富的学习资源
08 09 23 江西新课程培训
LDM
学习资源的提供
2007-05-11 北京
给出详细的学习指导
对于学生接触较少的一些知识与技能,教师还应该以范例的形式给出较详细的学习指导。下面为《算法与程序设计》中一个范例的学习指导。
算法与程序设计之案例
LDM
提供有针对性的技术支持
新课标基础模块的一个最大特点是不以信息技术应用技能为主线,而是在它基础上培养学生的信息素养。这样一来,我们就不能像以往的教学那样,把大量的时间花在教学生如何掌握信息技术应用技能上,但在学生的学习过程中,信息素养是在学生的实际学习活动中养成的,而学习活动中又时时刻刻在应用信息技术,这样一来,如何处理技术与工具的学习就成为新课标教学实践研究的一个重要问题,我在实践中的解决方案是,将不需要教师过多讲解的技术操作和工具的使用写成“技术支持”(如上面第一、二周教学活动中有关电子邮件的内容),供学生查阅使用。在我的教学网站的每节课里都提供了技术支持。
图片处理的技术支持
布置难易适中的实践
信息技术是一门实践性很强的学科,许多内容只有在亲手实践后才能理解与掌握.
所以每次课给出一定的时间和空间让学生亲历实践是非常重要的.
每次课要布置难易适中的实践
实践要能激发学生的兴趣,可操作性要强
要给学生的创意留下空间
LDM
实践内容及要求
1. 开动脑筋,充分发挥想像力,设计你的第一个VB程序。
提示:可以在课堂例子的基础上添加自己的内容,最好自己设计;
具体要求:
(1)内容积极向上。
(2)界面设计完整、美观、实用。
(3)要运用按钮、标签或图像框等控件(也可以 使用本课未学控件)。
(4)把窗体调整到适当大小,并固定大小。
(5)程序要有结果按钮,并可以正常结束。
(6)生成EXE文件。
LDM
作业保存与提交要求
以文件夹形式保存你的程序,文件夹名为:学号后2位+"第1个VB作品-"+作品名称(自定义)。并将该文件夹复制到作业提交区。
作品评价标准
LDM
交流与评价
汇报交流与评价这一环节在主题学习活动中也占着非常重要的地位,让学生上讲台讲演自己的作品不仅为锻炼学生的表达能力提供了机会和场所,同时也是对学生潜力的一个挖掘,对其实践活动的一个督促。当然教师也做好评价工作的各个环节,如评价标准,汇报场面的主持,评价结果的评价等等。在一年的实践中我体会到,重视交流与评价环节是教学效果提高的一个重要原因。
LDM
案例1:我的校园生活
活动主题:我的学校我的同学
活动形式:小组协作
活动时间:4次课(8课时)
内容过程:
(1) 分组:每 组不多于3人。在自愿组合的基础上由老师调整后确认。
(2) 每组选一位组长。实行组长负责制,负责人员与设备的安全 、作品制作与演示。
(3)确定本组作品主题。并将作品主题、主要思路、人员及特长写成Word文档。
(4)每组使用数码相机,围绕小组作品主题拍摄相关素材照片若干。
(5)将采集的照片输入计算机。
(6)对图片进行加工处理。
(7)对加工后的图片进行合成。
(8)向全班同学汇报演示作品,并对作品进行评价。
LDM
具体要求:
(1)作品要有创意,主题明确,内容积极向上,反映北大附中校园和学生的校园生活。
(2)要有一定的图片处理的技术含量。
(3)每位同学至少拍摄并处理2张图片。
(4)汇报作品时小组组长先做总的介绍,每位组员都要承担一定的汇报任务。
(5)评价为小组之间的互相评价。
08 09 23 江西新课程培训
LDM
第一环节:素材的采集
(1)分组并确定本组组长
(2)在组长组织下,讨论本组作品主题、 大致内容,明确每个人分工及活动计划(约4次课),并在WORD中形成小组活动计划。具体内容包括:
组长: 组员: 作品主题: 内容提要: 活动计划:
然后以“08届Y班-第XX组-”+组长名+“-图像处理作品主题及计划”为文件名保存在组长的Z盘中,并由组长通过邮件发送给老师,邮件主题“08届Y班第XX组活动主题及计划”
(3)以小组为单位在校园内采集图片素材。
(4)采集结束即回教室,将采集到的图片素材输入计算机,开始编辑。
具体要求
(1)主题明确,内容积极向上,反映北大附中校园生活,主题不要太大
(2)根据主题精心采集图片素 材
(3)采集的素材要有可供拼接的多幅照片
(4)素材要包括符合小组主题的人物、校园风景、学生活动等内容
(5)小组同学间友好、团结,相互帮助。
(6)每个小组围绕主题至少拍摄20张照片。
(7)小组每位同学均要参与拍摄、处理、合成等每个步骤。
(8)在组长的作业提交文件夹中建立“第XX组图片素材”,将采集的素材存放其中。
学生作品展示
06届:
学生生活与校园一角
半岛铝盒
07届:
07届第02组图片处理作业_北大附中的植物
08届:
08届01班第13小组图像处理作品-服装展示
08届01班第09组图像处理作品- 神奇的人类
09届:
09届01班第07组化石
09届09班一张照片引起的……
10届:10届01班第09组-射击名人
10届04班第06组图像处理作品
案例2:搜索研究
实践主题: 搜索研究
实践内容:
在教学内容及教学资源的基础上,通过因特网了解搜索引擎的发展史、原理、常用中英文搜索引擎及其使用技巧等。并就以下问题用Word写一个报告:
(1)搜索引擎的历史与发展
(2)搜索引擎的工作原理
(3)搜索引擎的种类及其区别
(4)各种搜索引擎的代表网站
(5)常见的搜索引擎及其特点
(6)常用的搜索技巧
(7)搜索引擎的评价及参数
(8)特色网站介绍
(9)通过搜索以下内容(也可以自己选择搜索内容)并就准确率、速度等方面对三个以上搜索引擎进行比较,分别说明它们的特点,适合查询什么信息,不适合查询什么信息。
查找2005年北大附中网校夏令营情况说明。
查找1982世界杯足球前四强的得主。
查找2002年狮子座流星雨的情况和图片。
查找小于200KB的FLASH指法练习小游戏。
查找我国最早的人口普查资料。
查找3个比较好的网上图书馆,了解它们的特点。
查找超级女生前10名的相关资料。
(10)自己的心得体会
LDM
具体要求:
(1) Word文档大于15页(A4纸、正文为5号字体、行距大小为单倍间距)
(2)通过三级标题(可以在大纲视图中设置)来组织内容
(3)图文并茂,内容丰富。文档内容涵盖“活动内容”的 十个方面
(4)在文档的最前面放置提取的目录
(5)有自己的发现和心得体会
(6)从网上复制摘取的信息经过自己的编辑。
评价项目:
08 09 23 江西新课程培训
LDM
学生作品展示
07届 赵曦的搜索研究报告
08届 姜小丰的搜索研究报告
09届任晓媛的搜索研究报告
09届王若含的搜索研究报告
10届耿然的搜索研究报告
10届部分学生的心得体会
08 09 23 江西新课程培训
名片的设计
资源提供
以往名片作品及教师案例
(1) (2) (3) (4) (5) (6)
2007届名片展示 2008届名片展示 2009届名片展示
名片教学网页上的资源
图片资源
技术支持
参考评价标准
案例3:名片的设计
08 09 23 江西新课程培训
08 09 23 江西新课程培训
随机数的教学案例
案例4:随机数的正确使用
学生作品展示
糖葫芦 打西瓜 小鸟 宿舍
手电简 以小见大
探照灯 微软招聘测试
广告1 广告2 鼻子
打虫子 小游戏
小强初编的三个游戏 1 2 3
小曾五一编的5个游戏 1 2 3 4 5
08 09 23 江西新课程培训
(六) 教学评价与反馈
08 09 23 江西新课程培训
回顾我国中小学信息技术普及教育20余年的历史,谈起教学评价只是近几年的事。而随着国家基础教育课程改革的浪潮,围绕信息技术教学评价的各种研究也逐渐多起来,诊断性评价、形成性评价、终结性评价、电子学习档案、评价量规、自评、互评等一系列评价方法和评价方式常常被人们应用在信息技术教学的研究中。然而,在新课标下这些评价方法如何在实际教学中应用实施,何时选择何种方式进行教学评价却是大多数一线教师十分困惑的问题。本文将结合作者多年教学评价的实践以及一年来新课标的教学实践谈谈信息技术教学评价方法的实施及评价方式的作用和选择。
08 09 23 江西新课程培训
LDM
教学是有目标的。新课标下的信息技术教学要求我们从知识与技能、过程与方法、情感态度价值观三个维度提升学生的综合信息素养。因此,信息技术教学评价的目的就是要从这三个维度去检验教学是否达到了预期的目标和效果。
传统的教学评价过分强调了对学生的选拔与甄别作用。在新课标的教学评价中我们要以促进学生学习为原则,应运灵活多样的评价方式激发学生的学习兴趣,鼓励学生去创新实践,引导学生学会学习。
08 09 23 江西新课程培训
LDM
如果按照评价的时间和作用来分,教学评价可以分为诊断性评价、形成性评价、终结性评价。诊断性评价是指在某项教学活动开始之前,为了使教学计划更有效的实施而进行的预测性、测定性的评价,或者是对评价对象现状和存在问题的鉴定,其主要目的是为了了解评价对象的基础和情况,看他们是否具备了进行某项教学活动的条件;形成性评价是指在教学过程中测定评价对象对某一具体教学内容的掌握程度,指出没有掌握的内容和学习过程中存在的问题,促进学生掌握所学内容;而终结性评价则是当某一项教学活动告一段落时,对最终的成果做出判断。它是以预先设定的教学目标为基准,对评价对象达到目标的程度进行评价。给学生评定成绩,为学生具有某种能力或资格作证明。
评价方法及实施
08 09 23 江西新课程培训
如果按照参与评价的主体来分,教学评价又可以分为自我评价和他人评价。自我评价就是评价者根据确定的评价标准对自己进行评价。开展自我评价,使评价对象积极反省自己,约束自己在学习活动的行为;他人评价即是由被评价者之外的其他人对评价对象进行评价,它的客观性和公正性比较强。
08 09 23 江西新课程培训
在制作评价的整体方案时要根据不同的教学内容和目的选择不同的评价方法。如在开学初为了我解学生初中信息技术的水平,可以采用诊断性评价方法。而对于平时作业的管理就要选择形成性评价方法。为了检查教学效果和评定学生的期末成绩就需要采用终结性评价方面。此外,我们还可以根据不同的教学内容可以采用不同的评价方式,如自评、互评等等。
具体到每一个方案又要从知识性、技能性、创新性、实践性等方面进行评价。下面是我在教学过程中的评价方案。
08 09 23 江西新课程培训
把诊断性评价用于教学的分层
高中信息技术教学不同于其它学科,由于初中小学开课的不统一以及教学内容的不衔接,造成高中入学学生信息技术水平的极大差异。针对这一点,我们可以通过调查表、访谈、作品设计等方式诊断了解每一位同学的情况,从而制定切实可行的教学方案。例如:我对每年入学的新生都要做以下几个有针对性的诊断性评价:(1)通过“信息技术水平调查表” 了解学生对信息技术的掌握程度;(2)通过完成以“我的感受与希望”为主题的电子作品了解学生对通用应用软件的掌握程度;(3)通过“网上搜索技巧”了解学生对网络应用的程度。根据这些评价、和学生的意愿进行分层教学。
08 09 23 江西新课程培训
把形成性评价用于平时作业管理
在各种评价方法中,形成性评价对学生的学习起着重要的作用,它致力于引导学生掌握所学内容,激励学生去学生,并发现学习过程中的错误,从而及时采取因人施教的补救措施。这是信息技术教学过程中的一个重要环节。
08 09 23 江西新课程培训
李冬梅教学评价表样例
然而,令人遗撼的是长期以来,大多数信息技术课根本没有这个环节。一些信息技术课没有明确的实践内容,学生只是简单重复教师的操作;一些信息技术课尽管有实践内容,但学生做了没有做?做的怎么样?老师一概不知道!一些信息技术课虽然设计了一些评价,但也是流于形式或是阶段性的,并没有对学生的形成性学习起到作用。一些老师教了一年的学生连名字也不知道,有得甚至连学生一年没有上信息技术课都不知道。学生课上没有明确的实践内容,教师不对学生的实践结果进行评价,这是造成目前信息技术课不受学生重视、不能激发学生学习兴趣的重要原因,学生认为信息技术课就是“玩一玩”,做不做或做的怎么样老师根本不知道!
信息技术教师不批作业,也就失去了对学生学习情况进行形成性评价的最好机会。
08 09 23 江西新课程培训
在我多年的教学过程中,每次课学生都有明确具体的实践内容,并且都必须在下课前提交实践结果(作业), 然后我再对学生的实践结果进行评价(批作业),并把评价结果在下次上课时提交给学生。我深切体会到,这是学生重视我的信息技术课,对我的课感兴趣的一个重要原因。每次上课前学生都在仔细的查看老师对他(她)作业的评价,并询问每一个细节。
08 09 23 江西新课程培训
如何将形成性评价与作业管理相结合呢?我们需要对每次课堂实践内容设计合理科学的评价项目,并对其进行评价
08 09 23 江西新课程培训
基本知识的评价
基本技能的评价
行为习惯的评价
创新能力的评价
表达能力的评价
08 09 23 江西新课程培训
(七) 软硬件资源建设与管理
08 09 23 江西新课程培训
软硬件资源的建设
硬环境、软环境(资源、师生交流)
新课标下的教学,不仅要有一个良好的软硬件环境,还要创设一个具有丰富的学习资源和教学资源、畅通的师生交流空间、方便的管理平台的教学环境。
新课标下的教学环境要在软硬件资源的管理、学习资源的建设与管理、教学资源的建设与管理、师生间的交流与评价等多方面进行深入的研究。
08 09 23 江西新课程培训
软硬件环境的管理
硬件的管理
解决软硬件资源管理的关键是给予不同的使用者以不同的权限
软件资源的建设与管理
学习资源、教学资源的建设与管理
学生作业的提交与管理
08 09 23 江西新课程培训
软硬件资源的管理
通过活动目录AD,实现校园计算机及用户的统一管理
通过“网络驱动器”为师生提供安全方便的网上存储空间
08 09 23 江西新课程培训
08 09 23 江西新课程培训
08 09 23 江西新课程培训
08 09 23 江西新课程培训
学生、老师可以在任何一台计算机上登录;桌面、我的文档、电子邮件可以跟着人走;每人有一个网络硬盘(学生登录的目录)
08 09 23 江西新课程培训
软件资源的建设与管理
学习、教学资源的建设
学习、教学资源的管理
学生作业的管理
08 09 23 江西新课程培训
学习、教学资源的建设
新课标的教学要求为学生提供大量的学习资源,如:素材、案例、学习指导等内容。为此,我们在教学实践中利用网络文件夹为学生提供了“resource(资源)”、“初中教学”、“高中教学”等网络驱动器,其中动态存储着丰富的素材、案例、教师教案及进行学习交流的活动空间。
08 09 23 江西新课程培训
LDM
08 09 23 江西新课程培训
08 09 23 江西新课程培训
此外,各具特色的教学网站,从另一个侧面为学生提供了丰富的学习资源。
08 09 23 江西新课程培训
LDM
学习、教学资源的管理
由于学习、教学资源是一个动态的资源库,所以它的管理是至关重要的。为了保证资源的安全性、可靠性以及使用的灵活性,可以采用针对不同的用户对不同的资源享有不同的访问权限。如某位教师的教学文件夹只有他个人和他所教的学生才能够阅读,只有教师本人拥有完全控制权限,学生只能读的权限。学生提交作业的文件夹只有学生才拥有所有权,教师只能读等等。又如资源的上传区,师生提交的资源暂时存放在上传区,由管理资源的教师统一整理后归类存放。学生优秀作品展示区的文件中由各位任课教师提供,其他人只有阅读的权限,等等。
学生作业的管理
长期以来。学生作业的管理一直是信息技术教师比较头疼的问题。从早期的软盘保存,到“网络邻居”的共享文件夹,再到邮件、FTP提交等等,我也尝试了许多方法。共享文件夹为学生的恶作剧提供的条件,由于同学之间的文件夹可以互相访问,一些同学刚刚提交的作业就被另一些同学改的面目全非。邮件提交作业又为教师增加的负担。经常长时间的试验,我采用了在AD域用户下为每位学生建立作业提交的网络文件夹,并设置只有学生本人有完成控制权,任课教师有访问权限,这样既方便了学生提交,也方便了教师批作业。
08 09 23 江西新课程培训
谢谢各位老师!
李冬梅
ldm@pku.
QQ:70837175
08 09 23 江西新课程培训(共55张PPT)
成都之旅
制作人:赵莞莼 (都江堰部分)
兰天竹(成都 峨眉山部分)
总结合作完成
预算清单
10月21日 07:45 自北京首都国际机场
国航 C1401 10:20 抵达成都双流国际机场
10月24日 19:00自成都成都双流国际机场
国航CA4111 21:35 抵达北京首都国际机场
机票:1140* 0.8*2+1440*0.9*2=4840
住宿: 238*2=476
酒店共住两晚,其中三天出去玩,做行李寄存
旅行社:390*2=780
吃饭: 300
峨眉山索道费:100
城内费用:100
包括交通费、地图费等杂七杂八的费用 ,那里的taxi很便宜
都江堰参观门票:45*2=90 (半价)
往返车费:32*2=64
总计:6750元 (不计途中的意外事件)
十月的成都已进入秋天。虽然没有北方的寒冷,但是还是能感到丝丝凉意。建议穿长袖衫+薄外套,如果比较怕冷的朋友可以带薄毛背心。成都是四川的首府,四处中国西南,平日里阴雨天气较多,所以雨具是必备的用品。如果怕鞋子因为下雨被弄湿,可以再带一双鞋子(不过不待也没什么关系)。在南方洗衣服不容易干,所以最好多带几套衣服。
为避免因水土不服在旅途中出现的感冒、肚子不舒服等病症,应备有感冒冲剂、黄连素、华素片等药品
来到成都,欣赏美景,记录当地风土民情,自然是少不了数码用品的。相机、DV都不不错的选择
到了成都当地最先要买的就是一份地图,以防迷路。
如果不带雨伞,后果比上述画面还惨,所以……
第一站:成都
时间:2007.10.20—21日
交通:从北京乘飞机至成都双流国际机场
航班等信息见前
住宿:民航宾馆
住宿条件:标间
价格:238/天
位置:成都锦江区北新街31号
电话:028-86716688
行程安排:
1.乘早八点的飞机于中午抵达成都双流国际机场
2.下午一点半左右到达民航宾馆,在春熙路(宾馆所在街)附近寻觅一家馆子用午餐
3.下午乘出租车(或三轮 成都特有的交通工具)抵达武侯祠。
晚上在锦里闲逛,顺便品尝锦里的美食
成都夜景
第一站:成都
俗话说得好,“民以食为天”。来到北京尚且要好好品尝一下北京小吃,何况到了自古有“美食之都”之称的成都呢?据当地的一位姐姐介绍,来到成都,除了欣赏当地的美景,最不能忘记的事情就是吃。(虽说光说吃显得我没什么追求没什么水平^0^)但是来成都吃,吃的不仅是个美味,更能感觉到一种氛围,一种文化。
成都小吃历史悠久、品种繁多,富有浓厚的地方特色。 它同川菜一样,在我国烹饪技术遗产的宝库中,占有相当重要的地位。 成都名小吃品种繁多:以各色小面到抄手包饺;从糕团汤元到筵席细点;从凉抖冷食到热饮羹汤;从锅煎油烙到蒸煮烘烤,堪称花色品种琳琅满目,甜咸酸辣各味俱全。
有名的“变态辣”
第一站 成都
钟水饺
韩包子
夫妻肺片
卤肉锅盔
火锅 这可是此处变态辣的精华之所在,不吃火锅?白来一趟!绝对会让你体会到和北方火锅不同的滋味。
Tips:对于很少吃这般辣的火锅的北方人来说,最好在点鸳鸯火锅,在吃之前喝下一瓶豆奶,胃就不会疼了
此为原创~
第一站:成都
红油抄手乃是四川成都著名小吃。以面皮包肉馅,煮熟后加清汤、红油和其它调料即可食用。此种小吃柔嫩鲜美,汤汁微辣浓香。抄手是四川人对馄饨的称呼,红油抄手是最为著名的品种之一。
推荐店面:龙抄手(为于春熙路)
陈麻婆豆腐 陈氏所烹豆腐色泽红亮,牛肉粒酥香,麻、辣、香、酥、嫩、烫、形整,极富川味特色。有好事者观其陈氏脸生麻痕,便戏之为“陈麻婆豆腐“。清朝末年,陈麻婆豆腐被列为成都的著名食品。
推荐店面 陈麻婆豆腐(成都北郊万福桥 二环路三段也有店面)
担担面 担担面是著名的成都小吃。用面粉擀制成面条,煮熟,舀上炒制的猪肉末而成。成菜面条细薄,卤汁酥香,咸鲜微辣,香气扑鼻,十分入味。此菜在四川广为流传,常作为筵席点心。 担担面中最有名的又要数陈包包的担担面了。过去,成都走街串巷的担担面,用一中铜锅隔两格,一格煮面,一格炖鸡或炖蹄膀。现在多数已改为店铺经营,但依旧保持原有特色,尤以成都的担担面特色最浓。
推荐店面:春熙路附近的店面都有,钻进一家当地的小馆子一般就可以吃到比较正宗的担担面
第一站:成都
赖 汤 圆 开店后始以鸡油汤圆闻名,以后品种不断增加,有了黑芝麻、麻酱、冰桔、玫瑰、洗沙、八宝、樱桃等十余种馅心,其外形有圆的、尖的、椭圆的、枕头形的,一碗之内形态各异,风味各具。该店还以白糖、芝麻酱味碟供客人吃汤圆时蘸食,一时慕名而来的食客络绎不绝,赖汤圆成了成都汤圆的金字招牌。
推荐店面:没有专门的店面推荐,去锦里一般可以吃到正宗的小吃
其实,成都还有无数的美食,随便说说都会有十好几种。碍于篇幅限制,在此不便多介绍。不过如果还想品尝更多美食。可以询问当地的出租车师傅、三轮车师傅或者直接到锦里(小吃一条街)吃个爽~
第二站 峨嵋山
时间:2007.10.22—23日
交通:大巴车
住宿:在峨眉山景区内旅店停留一晚
住宿条件:标准间 价格:含于旅社费用
位置:峨眉山景区内
行程安排
第一天:成都-乐山-峨眉山
早晨成都出发,经成乐高速公路至乐山,午餐后游览世界上最大的石刻弥勒坐佛--乐山大佛,体验“佛是一座山、山是一尊佛”的奇景;登九曲栈道,参观千年古刹凌云寺;远眺大渡河、岷江、青衣江三江汇合.晚抵峨眉.
第二天:峨眉山--成都
早晨于峨嵋山景区乘观光车至万年寺停车场,乘索道(自理)直上峨嵋山规模最大、建院最早的寺庙---万年寺,观峨眉镇山之宝、全国唯一的无梁殿---普贤铜像。游白娘子修真之地---白龙洞,至清音阁,聆听十大景观之一的“双桥清音”。再经黑龙峡一线天,游览自然生态猴区,与峨眉山灵猴尽情嬉戏,傍晚返回成都,结束游程。
由于峨嵋山距成都有不近的车程,所以若不能自己驾车,一般而言只能以散客形式随旅游团,在此特别说明。但是到了峨嵋山一般就有比较大的自由度。
第二站 峨眉山
衣: 峨眉山地处山区,比成都市区的平均气温低2—3摄氏度,可以在之前说过的“穿衣”一条中加上夹克衫一件。
宿:根据旅行社的安排,住在景区内的宾 馆
行程安排: 万年索道——万年寺——白龙洞——清音阁——一线天——生态猴区——五显岗停车场 ——共计十公里左右
第二站 峨眉山
——峨眉,取大峨山与二峨山两山相对如眉而名。一说峨眉作蛾眉,谓山云鬟凝翠,鬓黛遥妆,如螓首蛾眉,细而长,美而艳也。于是有“峨眉天下秀”之谚。或谓峨以名言,状其巍峨;眉以形言,有如秀眉。
——春季万物萌动,郁郁葱葱;夏季百花争艳,姹紫嫣红;秋季红叶满山,缤纷五彩;冬季银装素裹,白雪皑皑。登临金顶极目远望,视野宽阔无比,景色十分壮丽。观日出、云海、佛光、晚霞,令你心旷神怡;西眺皑皑雪峰、贡嘎山、瓦屋山,山连天际;南望万佛顶,云涛滚滚,气势恢弘;北瞰百里平川,如铺锦绣,大渡河、青衣江尽收眼底。置身峨眉之巅,真有“一览众山小”之感慨。
——峨眉 中国四大佛教名山之一 供普贤菩萨,开健康之光
山云鬟凝翠,鬓黛遥妆
郁郁葱葱;白雪皑皑
第二站 峨眉山
万年寺
生态猴区
白龙洞
一线天
第二站 峨眉山
景区一 万年寺
万年寺是四川峨嵋山历时最久的古刹之一,相传为汉代采药老人蒲公礼佛处。东晋隆安五年(401)创建时名普贤寺。唐乾符三年(876)慧通重建,易名白水寺。宋称白水普贤寺;明万历二十八年(1600)重修时,神宗赐额“圣寿万年寺”,沿称至今。
万年寺 外观
一方清池
普贤菩萨像
景区二 白龙洞
相传为白娘子曾经路过的寺庙。庙中供有南无阿弥陀佛。可以拜一拜。
Tips 只有镀了金身,装过脏的佛才能够拜,别的佛都是“泥菩萨过江”自身难保。拜的佛不能够拍照。
第二站 峨眉山
第二站 峨眉山
景区三 一线天 两边石岩壁立,下面流水寒彻;顶上古木参天,只见青天一线,所以又叫“一线天”。这是在七千万年以来,由于地壳运动,使地壳迅速上升,河水强烈地下切,把这岩石切了个深槽。古时僧人来往过此,全靠在石壁上凿石穿孔,横穿进木桩作梁,再在桩上面铺横木条当桥板,人踏上去,栈道吱吱作响,上下闪动,够人担惊受怕的。1980年后,为方便游人通行,改建成了现在的钢筋水泥预制板栈道。这样虽不及古栈道原始风味浓郁,便平坦宽敞,免去担忧,便可尽情欣赏这里的自然美景了
景区四 生态猴区
来峨眉山旅游的人,除了希望感受这里的佛教气氛,欣赏清幽的美景,恐怕最想做的就是和峨眉山的猴子们来个“亲密接触”了。峨眉山的猴子,的确很可爱,也很聪明。不过还是要提醒各位:为了他们的健康,不要随意投放食物!为了自己的安全,请不要随意与猴子嬉闹!
第二站 峨眉山
好胖的猴子~都是大家喂的。
此为原创~
当地特产~
茶叶
(竹叶青 姑娘茶 媳妇茶)
猕猴桃(纯野生)
天麻
雪魔芋
……
不得不提的是峨眉山的茶叶。主要分为“青山绿水”和“姑娘媳妇”两个品种。其中的“青山绿水”,茶如其名,用当地的山泉水泡出,青中黛绿,翠色非常,宛若峨眉山间的青山绿水,品一品,略有些绿茶的苦涩,但之后细腻而悠长的芬芳。
而“姑娘茶”和“媳妇茶”则是一种茶先后不同时间才下来的。明前茶是姑娘茶,明后茶是媳妇茶。姑娘茶一泡,片片青翠的茶叶在杯中竖起,煞是好看。媳妇茶就略微差一下。但喝起来的口感基本没什么大差别。
第二站 峨眉山
姑娘茶倩影
此为原创~
1
2
3
1.天麻 传说中500大洋一斤…
2.雪魔芋
3.峨眉山绿茶
第二站 峨眉山
Tips:峨眉山海拔高,景点间路程较远,所以首先要穿一双合适的运动鞋~除此之外,可能有少数人会再次产生高原反应,建议做好药物准备。山上售有土特产,但是价格较贵,若想买建议到山下(拉动一下当地GDP增长~)。此游览路线大概要走一天的时间,山上有各种各样的小吃摊,均为当地农民所办,所以也不必带上很多食物。如果有老人、小孩、身体不适者随行,累了的话可以乘坐山中特有的“滑竿”(这也是里面唯一的交通工具了),但是是比较贵的。所以建议年轻人还是多走两步吧,锻炼身体,欣赏美景,而且还省了钱。
第二站 峨眉山
此为原创~
第三站 都江堰
路线:从成都的茶店子客运中心坐4路汽车 直达终点站,来往票价32元
都江堰门票:90元
都江堰属全国重点文物保护单位,坐落于成都附近。都江堰水利工程在四川都江堰市城西,是全世界至今为止,年代最久、唯一留存、以无坝引水为特征的宏大水利工程。 这项工程主要有鱼嘴分水堤、飞沙堰溢洪道、宝瓶口进水口三大部分构成,科学地解决了江水自动分流、自动排沙、控制进水流量等问题,消除了水患,使川西平原成为“水旱从人”的“天府之国”。 目前都江堰灌溉面积已达40余县,1998年超过一千万亩。都江堰附近景色秀丽,文物古迹众多,主要有伏龙观、二王庙、安澜索桥、玉垒关、离堆公园、玉垒山公园和灵岩寺等。
岷江是长江上游的一条较大的支流,发源于四川北部高山地区。每当春夏山洪暴发的时候,江水奔腾而下,进入成都平原,由于河道狭窄,古时常常引起洪灾,洪水一退,又是沙石千里。而灌县岷江东岸的玉垒山又阻碍江水东流,造成东旱西涝。秦昭襄王五十一年,李冰任蜀郡太守,他为民造福,排除洪灾之患,主持修建了著名的都江堰水利工程。
都江堰的主体工程是将岷江水流分成两条,其中一条水流引入成都平原,这样既可以分洪减灾,又达到了引水灌田、变害为利。另外一条则汇入长江。都江堰水利工程最主要部分为都江堰渠首工程,这是都江堰灌溉系统中最关键、最重要的设施。都江堰渠首工程主要由鱼嘴分流堤、飞沙堰溢洪道和宝瓶口引流工程三大部分组成。它科学地解决了江水的自动分流、自动排沙、控制进水流量等问题,三者首尾相接、互相照应、浑然天成、巧夺天工。
鱼嘴分水堤坐落在岷江中游的顶端。它将奔腾而来的岷江一分为二,外江为原始河床,内江用于引流灌溉,它巧妙之处体现于两点。其一是它利用内江河床低而枯水季节六成引水,外江河床宽,则洪水季节六成泄洪。所谓“分四六,平潦旱”正是这个道理。其二是鱼嘴处于岷江中游第一弯的末端,它巧妙的利用了弯道流体力学的自然法则,即表层水流入凹岸,低层水流入凸岸。于是沙石含量较少的表层水自然涌入内江,而底层水则顺着江弯的凸岸挤向外江,绝大部分沙石也就在外江河道上滚动、留沉。所谓“四六分洪,二八排沙”说的便是这个道理。
飞沙堰是都江堰三大要件之一,看上去十分平凡,其实它的功用却是任何工程都无法取代的,可以说是确保成都平原不受水灾的关键要害。飞沙堰的的高度刚好超过内江河床2.15米,它的作用主要是当内江的水量超过宝瓶口流量上限时,多余的水便从飞沙堰自行溢出;如果遇到特大洪水的紧急情况,它还会自行溃堤,让大量江水回归岷江正流。另一作用是“飞沙”地巧妙地利用离心力的作用和虎头岩的顶拖作用将上游带来的泥沙和卵石,甚至重达数百公斤的巨石,从这里抛入外江,确保内江通畅,确有鬼斧神功之妙。
宝瓶口是由人工开凿的一通山峡,玉垒山被一分为二,其间只留出20米的入水口,内江水从百米之宽的河道涌向宝瓶口,平水季节奔流而过,高峰时节则节节升高,不加节制的水流不断爬升,一涌而入,成都平原就会遭受洪涝灾害。此间飞沙堰的设计与宝瓶口相互结合,它的高度刚好超过内江河床2.15米。这就意味着当内江水位升高2.15米后,汹涌的波涛将从飞沙堰溢出。宝瓶口入水便始终在一个几乎平衡的常量上。成都平原从此以后既获灌溉又安然无恙,此间的苦心可谓巧也
四川人民为了纪念李冰父子修建了二王庙。二王庙原名“崇德祠”,寓意李冰治水有功,人们推崇他的恩德。宋、元两代,李冰父子先后敕封为王,故将崇德祠改为二王庙。从此,蜀人敬李冰如神明。现存建筑为清代重修。 2000多年来,李冰父子凿离堆,开堰建渠为天府之国带来的福泽一直为世人所崇敬、感激,二王庙从古至今不但香火鼎盛,而且在历史上一直都有官方以及民间的祭典活动和祭祀活动。形成了以李冰父子为主题人物的每年农历六月二十四日和六月二十六日为中心的庙会活动
安澜索桥
信息来源
百度:
其中所有的图片均由“百度 图片”提供。
以及“百度 贴吧” “百度 知道”等
携程网:
提供酒店预订、机票等信息
四川旅游网:
提供散客旅行的一些必备信息。
其中,一些关于小吃的介绍以及 Tips均为本组原创,如有雷同,纯属巧合~
在这次活动中,一开始,,我们感到无从下手,不会安排、不会计划,犹如热锅上的蚂蚁急得团团转,但后来,通过在网上查资料,询问别人,我们渐渐找到了方向,并结合之前旅游的体会,选取适当的信息获取方式,高效率地完成了任务。
在制作报告时,我们还有电脑操作的技术问题,如合并报告,但通过请教别人,也解决了。
同时,分工也是个大难题。但我们还是尊重彼此的意见,合作完成作业。
通过这次活动,我们不但学会了规划自助旅游,还能够合理快速地通过正确渠道去获取信息,并通过小组合作,将信息以自己的方式呈现出来,完成作业;同时,这也是一次体验,让我们学会自己规划自助游,不用随团,享受自己的旅游时间。还有,通过查资料,我们也了解到祖国大地上有如此多的美景和名胜,所以也希望其它同学和老师去旅游时注意保护我们的文化遗产,保护我们的祖国河山。搜索研究报告
班级:高一(1)班
姓名:钟博远
学号:1020121
目录
TOC \o "1-3" \h \z \u 1 搜索引擎的历史与发展 3
1.1 搜索引擎的历史 3
1.2 搜索引擎的发展 3
2 搜索引擎的基本结构及工作原理 6
2.1 搜索引擎的基本结构 6
2.2 搜索引擎的工作原理 7
3 搜索引擎的分类及其典型代表 8
3.1 搜索引擎的分类 8
■ 全文搜索引擎 8
■ 目录索引 8
■ 元搜索引擎 (META Search Engine) 8
■几种非主流形式 9
3.2 搜索引擎的典型代表 9
4 常用搜索技巧 9
4.1 如何选择正确的关键词? 9
4.2 搜索引擎的十大秘密 10
4.3 怎样成为搜索高手——选择适当的查询词 11
4.4 找软件下载 12
4.5 找问题解决办法 12
4.6 找产品使用教程 13
4.7 找英汉互译 13
4.8 找专业报告 14
4.9 找论文 14
4.10 找范文 15
4.11 找谜底 15
4.12 找医疗健康信息 16
4.13 找人 16
4.14 找明星资料 17
4.15 找产品信息 17
4.16 找网上购物信息 18
4.17 找客户 18
4.18 找企业或者机构的官方网站 19
5 搜索引擎的评价及相关参数 20
参评的六个搜索引擎介绍 20
项目1:页面速度评测 20
项目2:搜索内容评测 22
项目3:其它杂项测试 24
项目4:特色功能一览 24
6 搜索引擎比较 25
6.1 数据 25
6.2 表格 26
6.3 结论 26
7 心得体会 26
1 搜索引擎的历史与发展
1.1 搜索引擎的历史
1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
1.2 搜索引擎的发展
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile)
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Usenet group to the Yahoo Database ,1996年的Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture)
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(注:后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初是否第一个登台并不总是很重要。Infoseek的友善用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。(注:元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。)
DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。
而Altavista的另一些新功能,则永远改变了搜索引擎的定义。
AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。(2003年2月18日,Altavista被Overture收购。)
然后到来的是Inktomi。1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(注:Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购;inktomi于2002年12月23日被Yahoo收购)
Northernlight 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(注:2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)
Teoma 起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Wisenut 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。
Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。
北大天网 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。
Baidu 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
2 搜索引擎的基本结构及工作原理
2.1 搜索引擎的基本结构
普通的搜索引擎由网页搜集器spider、索引器indexer与检索服务接口searcher组成。
spider以某种策略从网上抓回网页存储到原始网页库中。
索引器对该网页库进行分析得到网页索引文件库(网页id索引与URL索引)、倒排文件(包括索引词表)、网页结构库。网页索引文件为了在原始网页库中快速定位网页,以生成网页快照,而倒排文件是为了检索时快速找到相关网页集合,顾名思义,是由文档到词mapping的文件生成的从词到文档mapping的文件,所以可以大大提高检索速度,网页结构库用于分析网页间链接关系,为每一个网页计算出PageRank值,这个值意味是它本身的重要程度,pageRank是google技术的基石。同时倒排索引中还保存了词频和词的文档频率以及词出现位置等数据,词的文档频率频率指文档集合中出包含该词的文档数目,这个指标意味着词的区分能力以及重要性大小。前两者用于检索时相关度计算,后者用于生成具有高亮显示的动态摘要。
检索服务接口的主要问题也就是查找倒排文件,返回相关结果集合,按照前面提到的词频指标与PageRank指标计算相关度,为结果排序,另外,还包括生成动态摘要。
2.2 搜索引擎的工作原理
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。
搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。
真正意义上的搜索引擎,通常指的是收集了互联网上几千万到几十亿个网页并对网页中的每一个文字(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。
现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的文字,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如“恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦”指向这个网页A,那么用户搜索“恶魔撒旦”时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页文字的更新情况,增加新的网页信息,去除死链接,并根据网页文字和链接关系的变化重新排序。这样,网页的具体文字变化情况就会反映到用户查询的结果中。
互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几千万至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的网页。而互联网上有更大量的网页,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。
你心里应该有这个概念:搜索引擎只能搜到它网页索引数据库里储存的网页文字信息。你也应该有这个概念:如果搜索引擎的网页索引数据库里应该有而你没有搜出来,那是你的能力问题,学习搜索技巧可以大幅度提高你的搜索能力。
3 搜索引擎的分类及其典型代表
3.1 搜索引擎的分类
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
■ 全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
■ 目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
■ 元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
■几种非主流形式
1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
3.2 搜索引擎的典型代表
4 常用搜索技巧
4.1 如何选择正确的关键词?
在确定某一关键词之前,您得考虑一个问题:网络中的用户查询这一关键词的目的是什么?如果您的回答含糊不清,那此关键词决不是您正确的关键词。如果您的回答是明确的,随之而来的另一个问题是,您的站点能不能有效地解决访问者的问题。如果答案还是明确无误,这便是您该选择的关键词。
如果您的站点不能为访问者解决他们希望解决的问题,访问者将继续寻找其他的能解决问题的站点,而这些站点多半是您的竞争对手。为什么您花了时间和精力集中某一关键词,但又不能很好地满足访问者的需求,解决他们的问题呢?众所周知,从搜索引擎那里点击来的访问客都是非常合格的预客户,比那些看了新奇的广告条点击而来的要好得多。如果您能解决搜索客的问题,他们会满意,会成为您的客户。这种销售成功率是其他方法无法比拟的。
◆ 选择正确关键词的对策如下:
1、明确站点阐述的核心问题与概念;
2、分别罗列核心问题,想尽办法找出访问者在查询时可能包含的词和词组,任何您未考虑到的关键词都将使您潜在的客户跑向您的竞争对手;
3、去竞争对手站点,看他们所选择的关键词;
4、检查自己的站点,修改、调整自己的关键词;
5、注意关键词的组合和查询的几率大小;
6、再次强调,高访问率的关键词并不一定会带来好的赢利,低访问率的关键词更准确,更能捕捉到合格的访问者并形成销售;
7、一旦明确了最终的关键词(组),除去其他的不精确的词组;
8、长的关键词容易获得好的排名,太普通的关键词对有经验的老手也是个棘手的问题。
4.2 搜索引擎的十大秘密
要记住,在大多数情况下,登录搜索引擎可不是宣传和推广你网站的唯一手段。要取得真正的成功,你还需要使用很多其他的技术和方法。然而,当你适当的登录到搜索引擎后,也同样可以为你的站点带来大量的流量,而你几乎不需要花费什么。当然,适当的登录工作也会占用你一定的时间和精力,但回报将是成倍于你的这些投入的。每天都会产生数万个新的站点。
想想看!多么令人吃惊的数字。但它们其中的大多数都不曾适当的运用过META值,而搜索引擎的机器人就是根据META值来检索站点的。下面是一些小技巧与窍门:
★ 在你的标题中使用你最常用的关键字。大部分搜索引擎都在它们的排名系统中为这些关键字打出更高的分。
★ 用关键字的复数形式,(如,用"books"来代替"book",那么,当有人查询book或者books时,你的站点都会呈现在他面前)
★ 关键字的大写和小写多种拼写方式都用上。(如:books,Books,BOOKS)同一个单词的三种以上的拼写方式并不会起到多大作用,尽管通常的错误拼写倒能奏效。
★ 用你选定的关键字的组合方式。人们经常使用包含2或2个以上关键字的短语来搜索。(如:"storage facilities", "STORAGE FACILITIES")为了真正找准你的目标市场,加上"self, "SELF"和"你的城市/州" 等单词。那些不需要你的产品和服务的访问者即便再多,也没有什么价值。
★ 必须使用META值。许多搜索引擎都是根据这些META值为你的站点做索引的。META值位于你页面HTML中的HEAD之间,并不会在你的页面中显示出来。为了更精确的使用这些META值。可以找一个排名最高的站点的源文件来做些参考分析。
★ 使用你10到20个最好的关键字的组合。关键字丰富的META内容通常都是你站点排名的决定性因素。提示:如果可能,尽量在每一段的开头或者搜索短语较靠前的位置使用你最具代表性的关键字。
★ 用关键字来填满你图象链接中的ALT值。
★ 你站点中的每一页都应该单独登录到搜索引擎,而不仅仅是登 录了首页就结束了。提示:许多搜索引擎都会定期对你的站点重新检索,如果站点上没有变化你的排名可就会下降了,所以,保持你的站点常新。
★ 警告!过去很多人投机取巧,滥用关键字来取得更高的排名。就是将自己的关键字一再重复使用,并改变文字颜色使之适应页面背景色。现在如果一旦发现你这么做了,大多数搜索引擎都会采取惩罚措施。
★ 为你的每一个主要的关键字创造或定制一个独立的页面,并为 每个主要的搜索引擎单独设计。这会花上些时间,但是,一旦你做好了,将会令人不可置信的提高你的排名。提示:确保每个页面都能直接链接到首页以及其它一些相关页面。
4.3 怎样成为搜索高手——选择适当的查询词
搜索技巧,最基本同时也是最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循:
表述准确 百度会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。
一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。
例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。
另一类典型的表述不准确,是查询词中包含错别字。
例如,要查找林心如的写真图片,用“林心如写真”,当然是没什么问题;但如果写错了字,变成“林心茹写真”,搜索结果质量就差得远了。
不过好在,百度对于用户常见的错别字输入,有纠错提示。您若输入“林心茹写真”,在搜索结果上方,会提示“您要找的是不是: 林心如写真”。
查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。
还是用实际例子说明。某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。
这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。
绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。
因此,最好的查询词,应该是“时间名言”。
试着找出下述查询词的问题,并想出更好的能满足搜索需求的查询词:
所得税会计处理问题探讨
周星驰个人档案和所拍的电影
根据网页特征选择查询词 很多类型的网页都有某种相似的特征。例如,小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而页面上通常有“目录”两个字,点击页面上的链接,就进入具体的章节页,章节页的标题是小说章节名称;软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词。等等。
经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。
例如,找明星的个人资料页。一般来说,明星资料页的标题,通常是明星的名字,而在页面上,会有“姓名”、“身高”等词语出现。比如找林青霞的个人资料,就可以用“林青霞 姓名 身高”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名 身高 intitle:林青霞”。Intitle,表示后接的词限制在网页标题范围内。
这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是,您必须了解这种共性(或者通过试验性搜索预先发现共性)。
4.4 找软件下载
日常工作和娱乐需要用到大量的软件,很多软件属于共享或者自由性质,可以在网上免费下载到。
直接找下载页面 这是最直接的方式。软件名称,加上“下载”这个特征词,通常可以很快找到下载点。
例:flashget 下载
在著名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。
例:网际快车 site:skycn.com
小提示:一旦搜索范围局限在专业下载站中,“下载”这个特征词就不必在查询词中出现了。
4.5 找问题解决办法
我们在工作和生活中,会遇到各种各样的疑难问题,比如电脑中毒了,被开水烫伤了等等。很多问题其实都可以在网上找到解决办法。因为某类问题发生的几率是稳定的,而网络用户有好几千万,于是几千万人中遇到同样问题的人就会很多,其中一部分人会把问题贴在网络上求助,而另一部分人,可能就会把问题解决办法发布在网络上。有了搜索引擎,我们就可以把这些信息找出来。
找这类信息,核心问题是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。
例如,我们上网时经常会遇到陷阱,浏览器默认主页被修改并锁定。这样一个问题的解决办法,我们应该怎样搜索呢?首先要确定的是,不要用自然语言。比如,有的人可能会这样搜索“我的浏览器主页被修改了,谁能帮帮我呀”。这是典型的自然语言,但网上和这样的话完全匹配的网页,几乎就是不存在的。因此这样的搜索常常得不到想要的结果。我们来看这个问题中的核心词汇。对象:浏览器(或者IE)的主页。事件:被修改(锁定)。“浏览器”、“主页”和“被修改”,在这类信息中出现的概率会最大,IE可能会出现,至于锁定,用词比较专业化,不见得能出现。于是关键词中,至少应该出现“浏览器”、“主页”和“被修改”,这是问题现象描述。
一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。
例:浏览器主页 被修改
例:冲击波病毒 预防
4.6 找产品使用教程 ( http: / / www. / search / skill.html" \l "04#04 )
我们装了一个新软件,或者家里买了新的产品(如数码相机),往往会需要一个细致的教程。类似的教程在书店里常可以买到,但在网上一样也可以搜索到。教程的搜索,有两个要点,第一个要点是,这个教程是针对什么产品做的。这点比较好确定。比如说,我们想找office2000的教程,这第一个要点就是“office2000”了。第二个要点是,这类教程,通常会有一些什么样的特征关键词。也就是说,如果某个网页是某类产品的教程,这个页面上,会有一些什么样的词汇,来表明这个网页是个教程。
对这些特征关键词的把握是搜索老手和新手的差别所在。其实只要平时做个有心人,对类似问题多总结,多记忆,搜索技能就会慢慢熟练。对教程类网页而言,常出现的特征关键词有:教程、指南、使用指南、使用手册、从入门到精通等等,而在URL链接中,通常会有汉语拼音的“jiqiao”来标注这个页面是技巧帮助性页面。通过一次搜索就达到目的通常会有些困难,但多次试验,总会构建出一个非常好的搜索关键词。
例:photoshop 技巧集锦
例:数码相机 使用指南
例:dreamweaver inurl:jiqiao
4.7 找英汉互译 ( http: / / www. / search / skill.html" \l "05#05 )
尽管手头有英文词典,但翻词典一是麻烦速度慢,二是可能对某些词汇的解释不够详尽。中译英就更如此了。多数词典只能对单个汉字词语做出对应的英文解释,但该解释在上下文中也许并不贴切。搜索引擎找英汉互译的一个长处就在于,可以比较上下文,使翻译更加精确。
找简单的英汉互译 百度本身提供了英汉互译功能。对找到释义的汉字词语或者英文单词词组,在结果页的搜索框上面会出现一个“词典”的链接,点击链接,就可以得到相应的解释。
例:黄瓜
例:face
例:格物致知
找生僻词语的互译 很多情况下,无论是在线下的词典,还是用百度的线上词典,都无法找到词义解释,此时就需要利用网页搜索了。在某些情况下,网页作者会对某些生僻的词语加注一个英文或者中文释义。但提取这个生僻翻译的难度在于,没有表明释义存在的特征性关键词,因为作者在注释的时候,是不会有诸如“英文翻译”这样的提示语的。
例如,我们要找“特此证明”的英文正规翻译。我们想象一个有“特此证明”的英文翻译,通常会有一些判断性的语句,如“他是xxxxxx”,对应的英文就是“he is xxx”,于是,如果把“特此证明”和“he is”放在一起搜索,可能就能找到想要的结果。
例:特此证明 he is
4.8 找专业报告 ( http: / / www. / search / skill.html" \l "06#06 )
很多情况下,我们需要有权威性的,信息量大的专业报告或者论文。比如,我们需要了解中国互联网状况,就需要找一个全面的评估报告,而不是某某记者的一篇文章;我们需要对某个学术问题进行深入研究,就需要找这方面的专业论文。找这类资源,除了构建合适的关键词之外,我们还需要了解一点,那就是:重要文档在互联网上存在的方式,往往不是网页格式,而是Office文档或者PDF文档。Office文档我们都熟悉,PDF文档也许有的人并不清楚。PDF文档是Adobe公司开发的一种图文混排电子文档格式,能在不同平台上浏览,是电子出版的标准格式之一。多数上市公司的年报,就是用PDF做的。很多公司的产品手册,也以PDF格式放在网上。
百度以“filetype:”这个语法来对搜索对象做限制,冒号后是文档格式,如PDF、DOC、XLS等。
例:霍金 黑洞 filetype:pdf
4.9 找论文 ( http: / / www. / search / skill.html" \l "07#07 )
找论文网站 网上有很多收集论文的网站。先通过搜索引擎找到这些网站,然后再在这些网站上查找自己需要的资料,这是一种方案。找这类网站,简单的用“论文”做关键词进行搜索即可。
例:论文
直接找特定论文 除了找论文网站,我们也可以直接搜索某个专题的论文。看过论文的都知道,一般的论文,都有一定的格式,除了标题、正文、附录,还需要有论文关键词,论文摘要等。其中, “关键词”和“摘要”是论文的特征词汇。而论文主题,通常会出现在网页标题中。
例:关键词 摘要 intitle:物流
4.10 找范文 ( http: / / www. / search / skill.html" \l "08#08 )
写应用文的时候,找几篇范文对照着写,可以提高效率。
找市场调查报告范文 市场调查报告的网页,有几个特点。第一是网页标题中通常会有“xxxx调查报告”的字样;第二是在正文中,通常会有几个特征词,如“市场”、“需求”、“消费”等。于是,利用intitle语法,就可以快速找到类似范文。
例:市场 消费 需求 intitle:调查报告
找申请书范文 申请书有多种多样,常见的比如入党申请书。申请书有一定的格式,因此只要找到相应的特征词,问题也就迎刃而解。比如入党申请书的最明显的特征词就是“我志愿加入中国共产党”。
例:我志愿加入中国共产党 入党申请书
找工作总结范文 还是那个关键问题,工作总结会有什么样的特征词?将心比心的设想一下,就会发现,工作总结,总会写的象八股文一样,“一、二、三”,“第一,第二,第三”,“首先,其次,最后”。而且工作总结的标题中,通常会出现“工作总结”四个字,于是,问题就很好解决了:
例:第一 第二 第三 intitle:工作总结
4.11 找谜底 ( http: / / www. / search / skill.html" \l "09#09 )
猜谜语 有时候,我们会遇上各种高难度的谜语,但有了搜索引擎,只要这种谜语的传播范围略广些,我们通常都可以在网上找到答案。搜索时候,我们只需把谜面和“谜底”作为关键词搜索就可以了。
例:眼皮上落着一只苍蝇 谜底
解难题 除了标准谜语,我们还会遇到一些类似福尔摩斯探案之类的智力题。比方说,有这么个推理题:“一个人在朋友家吃饭,问朋友这餐吃的是什么肉?朋友说是企鹅肉,他就号啕大哭自杀了。”为什么呢?搜一下。这个题目中的特征词串是“企鹅肉”和“自杀”,再加上问题答案的特征词“答案”,就可以快速找到结果了!再比如,微软招聘,曾有一个著名的题目:下水道的盖子为什么是圆的,也可以用搜索引擎找其他人五花八门的解答。
例:企鹅肉 自杀 答案
例:下水道 盖子 圆的 回答
4.12 找医疗健康信息 ( http: / / www. / search / skill.html" \l "10#10 )
互联网上有大量的健康和疾病治疗方面的资料信息,他就像一个超级大夫,才高八斗,学富五车,关键是要看我们怎么去向“他”咨询。
根据已知疾病查找治疗方式 这类资料通常有这样的特点,在标题中会注明疾病的名称,同时会有诸如“预防”、“治疗”、“消除”等特征性关键词。于是,用疾病名称和特征性关键词,就可以搜到相关的医疗信息。
例:消除青春痘
例:预防口腔溃疡
找专业疾病网站 对于某些大型的综合类疾病,如心脏病、癌症、艾滋病等,我么也可以先用搜索引擎查找这类疾病的权威专业网站,然后到这些专业网站上求医问药,获取有关知识。找这类网站很简单,就是用疾病名称作关键词搜索。搜索引擎通常会把比较权威、质量比较高的网站列在前面。
例:艾滋病
根据症状找疾病隐患 我们经常还会有这样的需求,已知身体不舒服的症状,希望知道可能的疾病隐患是什么。这也可以通过搜索引擎解决问题。一般的疾病介绍资料,通常会有疾病名称、疾病症状、治疗方法等部分。我们描述的症状,如果和某个网页中的疾病症状刚好符合,搜到这样的网页,疾病名称也就知道了。做这类搜索的关键是,如何把症状现象用常用的表达方式提炼出来。
例:经常打嗝
例:头皮屑特别多
4.13 找人 ( http: / / www. / search / skill.html" \l "11#11 )
想找几十年失去联系的小学同学吗?想知道十多年没联系的初恋情人的最新情况吗?试试搜索引擎,也许能给您带来惊喜。
在互联网上找人,首先想到的一点就是搜他/她的名字。而一个人可能有多个名字。正式名、曾用名、小名、网名、英文名、绰号等。如果我们要找的人并不著名,找人可能是个艰巨的工程,因此所有这些可能的名字,都需要一一试验。
但中国人有十多亿,随便找个名字,都能找出N个重名者。因此,在名字之外,我们还需要添加更多的限制条件。什么限制条件呢?和这个人密切相关的经历。比如,籍贯、生日、曾就读的学校、曾呆过的班级、曾有过的作品、曾工作过的单位、曾经的婚姻伴侣,等等。
用名字+相关经历做组合查询,可以最大限度的从互联网信息中抠出所要找的人的点滴资料。当然,如果单搜人名的结果数不多,也可以不加限制,逐一浏览搜索结果。
4.14 找明星资料 ( http: / / www. / search / skill.html" \l "12#12 )
大部分年轻人都有偶像。搜罗这些偶像的点点滴滴资料,是对偶像崇拜的一种方式。如何查找偶像各方面的资料呢?
搜明星官方网站、Fansite或者其他网站娱乐频道的明星专题
很多大牌明星都有自己的官方网站,用以发布自己的最新消息,以及与崇拜者做线上交流,这样的网站叫Official Site(官方网站)。还有一些崇拜者,收集的偶像资料比较丰富,就自己做了一个网站以示崇拜,这样的网站叫做Fans Site。而大型的门户网站,通常为明星建有专门的娱乐频道。这些网站或者频道,通常信息比较丰富。直接找到这类网站,资料收集也就轻松很多了。找这类网站很简单,就是在搜索引擎中输入明星的名字,排在前列的网站,通常都具有比较丰富的内容。
例:章子怡
找明星图片
明星图片除了在官方网站、Fansite、明星频道中出现,还会在其他的图片网站栏目中出现。用明星的名字,加上“图片”、“写真”、“相册”、“图集”等图片特征关键词,进行搜索。
例:章子怡 写真
找明星档案
想了解明星的生日、三围、主要成就?除了到官方网站和门户网站的明星频道上找,也可以通过网页搜索直接获取。这些档案页面,通常有一些特定的词汇,如“身高”、“籍贯”、“档案”等;而明星的名字,则通常出现在网页标题中。用明星名字加上这些特征词,就可以快速找到明星档案。
例:章子怡 身高
例:档案 intitle:林青霞
4.15 找产品信息 ( http: / / www. / search / skill.html" \l "13#13 )
对于高价值的产品,我们在购买之前通常会做一个细致的研究,通过对比,择优而购。研究过程中,会需要很多资料,如产品规格,市场行情,别人对产品的评价,等等。如何通过搜索引擎获取这些资料呢?
到制造商的官方网站上找第一手产品资料 对于高价值的产品,制造商通常会有详细而且权威的规格说明书。很多公司不但提供网页介绍,还把规格书做成PDF文件供人下载。利用前面小节谈到的企业网站查找办法找到目标网站,然后利用site语法,直接在该网站范围内查找需要的产品资料。
例:mp3播放器
找产品某个特性的详细信息 有时候,我们可能非常关注特定产品的某个特性。举例说,我们想了解一下著名耳机拜亚动力DT231的音质。就直接可以用产品型号“DT231”和“音质”这个特征词搜索媒体或者其他用户对这个产品的这个特性的评价。
例:DT231 音质
和上面的两种需求刚好颠倒过来,有时候我们先有了特定的需求,然后想找一些能满足自己需求的产品做对比研究。这样的搜索经常会发生。
找一篇综述文章 第一种方式,是希望借助于业内的行家评论,即所谓的综述性评论文章。我们经常可以在媒体上看到诸如“暑期购电脑指南”、“DVD机选购全攻略”等文章。如果我们对某类希望购买的产品一无所知,最好先找一些这方面的综合性评论做参考。这类综合评述文章通常有个特点,就是标题常常出现诸如“选购指南”、“综合评测”、“从入门到精通”等特征性词汇,当然,这些特征性词汇需要我们平时生活和学习中多做积累。我们用产品名称加上这类特征词汇做查询词,就可以轻松搜到类似文章。
例:MP3播放器 选购指南
利用需求直接搜索 如果对产品比较熟悉,也可以利用产品名称和提炼的需求,组成查询词进行搜索。比方说,我需要找一台用钻石珑显像管的19英寸显示器(特性是19英寸和钻石珑显像管)。于是就可以这样搜索:
例:19英寸显示器 钻石珑显像管
>上述搜索的关键,在于如何把自己的需求用简练的语言描述出来。
4.16 找网上购物信息 ( http: / / www. / search / skill.html" \l "14#14 )
直接找商品信息 网络商城的页面都具有一定特点,除了商品名称会被列举出来,页面上通常会有一些肯定会出现的特征词,如“价格”、“购物车”等。于是,用商品名称,加上这些特征词,我们就能迅速的找到相关的网页了。
例:保罗西蒙 cd 购物车
例:金庸全集 购物车
找购物网站 除了直接搜商品信息,我们也可以先找一些著名的购物网站,然后在站内进行搜索。找这类购物网站比较简单,就是用类似“购物”这样的查询词进行搜索。
例:购物
4.17 找客户 ( http: / / www. / search / skill.html" \l "15#15 )
销售人员如何在网上找客户?
找某个行业的客户
首先要确认的是,您的客户有什么共同点。比如说,您卖的是一种专门用于笔记本电脑上的零件,这时候要找的就是笔记本电脑制造商;如果您卖的是一种专门针对服装厂的MRP软件,那么您要找的就是有一定规模的服装厂。销售还有一个特点是有地域限制。因此关键词中,还需要加入地区限制。
例:苏州工业园区 笔记本电脑制造
找最新投资的客户
刚刚准备投资或者奠基或者投产的客户,是销售新客户开发的重点。越早把握这类信息,在激烈的市场竞争中就越占一分先机优势。对于某个工业园区的新投资厂商,除了从政府部门中获取资料,也可以从网上进行搜索。大型的新投资或者新开工通常会有当地报道,这类网页一般有固定的格式,会有一些特征关键词,如“开工”、“动工”、“奠基”、“剪彩”、“投产”等。用工业园区的名称,加上产品行业名称,再加上这类新投资的的特征词,组成关键词进行搜索,往往可以获得很好的效果。
例:苏州工业园区 笔记本电脑 投资 动工
找目标客户群体的关键职位变迁
对销售而言,潜在目标客户群的某些关键职位如果发生变迁,则通常是业务切入的好时机。关键职位,通常是和销售直接打交道的采购、采购经理、物料经理等。如何查找这类变迁信息呢?在人力资源网上通常会有体现。人力资源网上的企业招聘信息,通常首先会介绍一下自己是做什么的,然后是招聘需求。于是用行业名称,加上招聘信息的特征词,在把搜索范围局限在当地的人力资源网站上,就可以随时关注最新动态。
例:笔记本电脑 招聘 采购 site:
(注:是苏州工业园区人力资源网)
4.18 找企业或者机构的官方网站 ( http: / / www. / search / skill.html" \l "16#16 )
很多时候,我们需要到企业或者机构的官方网站上查找资料。如果不知道网站地址的话,首先就需要通过搜索引擎获得企业或者机构的网站域名。
通过企业或者机构的中文名称查找网站,这是最直接的方式。我们可以直接利用企业在网络用户中最为广泛称呼的名称作为关键词进行搜索。什么是“最为广泛称呼的名称”呢?举个例子,新浪可能有很多称呼,比如“新浪”、“新浪网”、“sina”、“新浪公司”、“北京新浪互联信息服务有限公司”等等。哪个是网络用户最常用的呢?毫无疑问就是“新浪”。于是,我们在查询新浪的域名时,就最好使用“新浪”作为关键词。
例:海尔
例:上海市政府
例:大众汽车
5 搜索引擎的评价及相关参数
随着信息化的深入,网络 ( http: / / www. / " \t "_blank )时代给人们生活带来了信息量骤增的“信息威胁”。如何从海量的信息中,寻找到自己想要的信息加以利用呢?这一直是人们需要解决的问题。
自从上世纪末Google搜索技术的发迹,搜索引擎这个新事物逐渐被人们所热切讨论。现在越来越多的人使用搜索引擎了,甚至有的人上网就离不开搜索引擎!
那么哪个搜索引擎的中文搜得最准确?哪个最快?哪个搜索引擎的网站最适合您呢?笔者根据试验,记录相关数据并给予评价,希望能给大家一个参考。
注:因为搜索引擎的算法非常复杂,我们只取其用户看得见摸得着的项目进行评测。
参评的六个搜索引擎介绍
http://www. ( http: / / www. / " \t "_blank ) Google搜索拥有全球最领先的搜索引擎技术,其用户数量庞大,在全球搜索引擎市场中占有最大份额。其信息量大、更新及时深受许多用户欢迎。 http://www. ( http: / / www. / " \t "_blank ) 中国市场份额最大的搜索引擎。领先的中文搜索引擎。每分每秒,接受来自全球各个国家的中文搜索请求。其专业的中文搜索技术使其深受中国用户喜欢。 http:// ( http: / / / " \t "_blank ) 互联网最早的网页分类提供网站,随着搜索引擎技术普及,Yahoo搜索技术也从第一代目录式搜索发展到如今第三代搜索引擎技术。
http://search.msn.com ( http: / / search.msn.com / " \t "_blank ) 微软去年新推出的MSN搜索,主要在英文上使用,在中文上使用还在完善阶段。
http://www. ( http: / / www. / " \t "_blank ) 诞生于04年8月,由门户网站搜狐推出的全球首家第三代中文互动式搜索引擎服务。以电脑 ( http: / / www. / " \t "_blank )与用户在互动提示下进行搜索为主要特征。 http://www. ( http: / / www. / " \t "_blank ) 原是慧聪搜索,是国内领先的搜索引擎公司。先后为新浪、搜狐、网易、TOM等知名门户网站,及中国搜索联盟上千家各地区、各行业等优秀中文网站提供搜索引擎技术。
项目1:页面速度评测
人们使用搜索引擎的目的就是为了检索信息,所以成功的搜索引擎站点在设计上都是为了让用户以最快速度的“离开自己的页面”。这样就意味着该搜索引擎站点有着较高的搜索效率。为此,笔者评测了以下两个参数:
主页文件大小:笔者对六大搜索引擎的访问页文件大小(即访问该页面产生的数据传输流量)进行了统计比较。
图表一 主页文件数据大小
百度的搜索页面最为简洁,访问速度也是最快的。由于MSN搜索引擎访问时,会下载一些运行程度代码,所以导致数据量特别大,一定程度
生成搜索页面时间 当搜索关键词后,生成的结果列表需时更是一个重要的速度参数。于是笔者通过秒表以精确度为0.1秒的原始方法进行测量,并使用了四个关键字:“软件下载”、“软件资讯”、“pconline”、“ectend”。
*注:各搜索引擎结果生成页上方都有页面生成时间,但这并不代表用户所等待的时间,为此评测以用户使用为出发点,记录点击“搜索”按钮后,至结果列表页生成所需要的时间。数据记录如下表(单位:秒):
关键字/搜索引擎 Google 雅虎 MSN 百度 搜狗 中搜
“软件下载” 0.7 0.4 1.2 0.4 0.6 0.5
“pconline” 0.6 0.5 0.7 0.5 0.6 0.6
“软件资讯” 0.8 0.9 1.6 0.5 1.2 0.8
“ectend” 0.6 0.5 1.4 0.8 0.7 0.9
所有关键字需时平均 0.675 0.575 1.225 0.55 0.775 0.7
*注:为了使数据尽可能精确,笔者对各关键字进行了三次测试,然后将其平均值填入上表。
图表二 搜索结果页面生成平均需时
不容置疑,在这个速度评测环节中MSN搜索引擎的表现差强人意,两个测试项目MSN都明显落后于其它的搜索引擎。而百度稍有优势,但是并不是太大。总体上来讲其它五个搜索引擎在速度上基本上是相近的。
项目2:搜索内容评测
搜索引擎搜索出来的内容,也是评价一个搜索引擎好坏的重要标准。下面笔者对搜索结果的数量、搜索内容的相关性、搜索内容的死链率、提供搜索服务的种类进行了评测。
搜索结果数量对比 为了体现数量上的差异,笔者使用了五个热门且性质不同的关键词:“四六级考试”、“电子商务趋势”、“馒头血案”、“徐静蕾”、“神舟六号”。另外,为了一定程度上反映各搜索引擎的更新速度,笔者还搜索了五个时效性较强的关键词:“馒头饭”、“奥斯卡之梦”、“盛大亏损”、“K娃”、“百度财报”。并根据各引擎搜索的结果数量进行了记录:
关键词/搜索引擎 Google 雅虎 MSN 百度 搜狗 中搜
四六级考试 7,330,000 2,700,000 0 1,690,000 1,152,289 485,000
电子商务趋势 1,460,000 3,750,000 0 542,000 1,332,714 13,200,000
馒头血案 800,000 5,640,000 23 3,490,000 416,604 54,100
徐静蕾 1,270,000 5,260,000 494,991 1,680,000 599,387 1,610,000
神舟六号 2,660,000 2,520,000 59 1,530,000 855,858 666,000
馒头饭 4,030 7,000 4 10,000 349,918 1,181
奥斯卡之梦 736,000 1,330,000 1 87,800 27,350 5,299
盛大亏损 736,000 13 0 261,000 106,043 5,890,000
K娃 495,000 17 0 49,900 61,034 7,570
百度财报 390,000 1,390 0 212,000 67,980 687,000
图表三 五个热门关键词搜索结果对比
图表四 五个时效性强的关键词搜索结果对比
搜索结果分析:根据众多数据整体分析:雅虎、google、百度对于网页的抓取数量较多,由此说明这三个搜索引擎索引的互联网网页数多。对于时效性强的关键词,Google反应最快,抓取的页面数量也是最多的。另外MSN搜索引擎在测评中表现极其不佳,笔者认为这是因为暂时来说MSN搜索引擎对中文的页面抓取不够。而中搜网对于个别的关键词列表数量多,但并不能影响其整体数据。
值得说明的是,在搜索关键词“馒头饭”时,搜狗的结果数量十分的多。通过进一步分析,笔者发现事实上与该关键词相关的不足100条,之后的结果毫无相关性。这说明仅仅考查一个搜索引擎的结果数量是不够的,还需要人工地对结果的相关性进行分析,于是笔者进行了下一个评测项目:
相关性评价与死链率:分别搜索两个关键字,对前四十个结果进行评分。相符的记2分,结果不相符、结果重复或者页面无法打开的记0分,基本相符的记1分。并对无法打开页面进行统计,得出死链率。
项目/搜索引擎 Google 雅虎 MSN 百度 搜狗 中搜
“搜索引擎” 相关性 56 58 43 59 51 48
死链率 12.5% 0% 7.5% 5% 2.5% 2.5%
“电子商务” 相关性 55 42 47 53 52 50
死链率 5% 10% 5% 5% 2.5% 7.5%
图表五 两个关键词搜索结果相关性评分比较
根据结果,总体上来说:Google和百度在结果的相关性上稍胜一筹,说明在技术上还是有所领先。对于Google存在死链接率较高,在一定程度上是根据我国法律法规和政策的所限定的,而其它搜索引擎在相关性与死链率上相差不大。MSN搜索中文的功能亟待加强。另外搜狗与中搜的搜索结果重复率偏高。
因为针对不同的关键字有不同的结果,所以得出的数据能否完全判定一个搜索引擎搜索相关程度还待商榷。
搜索服务的种类 在一些基本的搜索服务上,Google、百度做得比较齐全的。不过在Google的搜索使用上比较复杂,需要认真参看搜索帮助才可以搜索到你特定的内容。各搜索的情况如下表: (○代表有,×代表没有)
项目/搜索引擎 Google 雅虎 MSN 百度 搜狗 中搜
网页 ○ ○ ○ ○ ○ ○
资讯 ○ ○ ○ ○ ○ ○
图片 ○ ○ ○ ○ ○ ○
音乐 × ○ ○ ○ ○ ○
地图 ○ × × ○ ○ ○
学术(国学、Encarta) ○ × ○ ○ × ×
论坛(贴吧、说吧) ○ × × ○ ○ ○
各种常用生活搜索 ○ × × ○ ○ ○
项目3:其它杂项测试
搜索内容广告:广告是搜索引擎重要的收入来源之一。参加评测的六大搜索引擎除了MSN外,都有广告。笔者搜索了“电脑 ( http: / / www. / " \t "_blank )”这个做广告最热门的关键词发现,五家(除MSN外)都在搜索结果右边都有相关文字广告。另外,百度、雅虎的搜索结果排名是按照竞价排的,而非自然机器选择。令用户遗憾的是,百度的前十个搜索结果都是赞助的广告商。
网页快照:十分欣喜地看到六大搜索引擎都具有网页快照的功能,十分的方便。不过对于中国用户来说Google的网页快照有时显示却不太正常,或者无法显示,的确给用户带来一定的不便。
搜索扩展工具:所有的搜索引擎都希望可以把搜索本机化,主导用户的搜索方式。于是它们都积极地开发了各类搜索扩展工具。有兴趣的网友可以下载一款使用试试,或许可以给你更快的搜索感觉。
Google 雅虎 MSN 百度 搜狗 中搜
Google 工具条 ( http: / / / html / 1 / 3 / dlid=11153&dltypeid=1&pn=0&.html" \t "_blank )
Google 桌面 ( http: / / / html / 1 / 6 / dlid=13356&dltypeid=1&pn=0&.html" \t "_blank ) 雅虎上网助手 ( http: / / / html / 1 / 3 / dlid=12063&dltypeid=1&pn=0&.html" \t "_blank ) MSN搜索工具条 ( http: / / / html / 1 / 3 / dlid=12063&dltypeid=1&pn=0&.html" \t "_blank ) 百度超级搜霸 ( http: / / / html / 1 / 1 / dlid=9111&dltypeid=1&pn=0&.html" \t "_blank )
百度硬盘搜索 ( http: / / / html / 1 / 9 / dlid=13599&dltypeid=1&pn=0&.html" \t "_blank ) 搜狗直通车 ( http: / / / html / 1 / 9 / dlid=13869&dltypeid=1&pn=0&.html" \t "_blank ) ( http: / / / html / 1 / 5 / dlid=12805&dltypeid=1&pn=0&.html" \t "_blank )网络 ( http: / / www. / " \t "_blank )猪
项目4:特色功能一览
以下特色功能并不是各搜索引擎所有辅助功能,笔者只是不完全地挑选一些比较实用的功能与网友们分享:
Google 博客搜索 ( http: / / blogsearch. / " \t "_blank )、Video搜索 ( http: / / www. / video" \t "_blank )、Flash搜索 ( http: / / www. / intl / zh-CN / features.html" \t "_blank )、大学搜索 ( http: / / www. / intl / zh-CN / options / universities.html" \t "_blank )、商品搜索 ( http: / / froogle. / " \t "_blank )、Base搜索 ( http: / / base. / " \t "_blank )、个性化主页 ( http: / / www. / ig" \t "_blank )、手机搜索 ( http: / / mobile. / " \t "_blank )、搜索记录 ( http: / / www. / searchhistory" \t "_blank )和翻译网页功能。
雅虎 搜索社区 ( http: / / . / " \t "_blank )、WAP搜索 ( http: / / sms.3721.com / wap / special / ysearch.htm" \t "_blank )、知识堂 ( http: / / . / " \t "_blank )
MSN Shopping搜索 ( http: / / shopping.msn.com / " \t "_blank )、电影搜索 ( http: / / entertainment.msn.com / search / movie" \t "_blank )(全是英文版)
百度 WAP搜索 ( http: / / www. / search / wap_help.html" \t "_blank )、地区搜索 ( http: / / diqu. / " \t "_blank )、百度 ( http: / / zhidao. / " \t "_blank )知道 ( http: / / zhidao. / " \t "_blank )
搜狗 商机搜索 ( http: / / b2b. / " \t "_blank )、软件搜索 ( http: / / d. / softindex.html" \t "_blank )
中搜 FLASH搜索 ( http: / / flash. / " \t "_blank )、行业搜索 ( http: / / 360. / " \t "_blank ) 搜索北京 ( http: / / bj. / " \t "_blank )
总结:
笔者为评测设计合理的评测方式与记录最客观的评测数据尽了最大的努力:通过点击访问一千多个网页,反复修改,完成此文。由于技术上的局限和不完善。但是基于这样一个相同的测评平台,我们可以看到Google、百度、雅虎表现不失大家风范。
如百度有着优势的中文搜索结果,Google有着迅速的抓取网页速度,其它搜索引擎也有着各种特色的搜索功能。
不过在评测中,各搜索引擎存在一些问题都暴露出来:如Google搜索时的出现提示的“相关搜索”关联性不强,用中搜索时,会出现无搜索结果的不稳定情况,百度、搜狗搜索结果在后面的条数与关键词无关联性。而MSN由于还在Beta阶段,希望在未来的日子里,MSN搜索也将被更多中国人使用。
大家在搜索信息的时候,笔者的建议是针对时效性的“新”信息,采用Google搜索;针对本地程度化强的采用百度搜索;如果有一些特定的搜索目标,可以参考各搜索引擎的特色功能;对于重要的搜索内容,建议用多几个搜索引擎,一定能找到您满意的结果!
6 搜索引擎比较
6.1 数据
6.2 表格
(注:表中数据为原始数据的平均值)
6.3 结论
由表格及数据可以得出:
1、Google适合查找贴近生活的一类事物,且准确率较高。不适宜商业问题搜索。
2、百度适合查找商业动态方面资讯以及时事。不适宜搜索一些具有历史意义的、人
文的事物。
3、搜狐适合查找生活经常遇到的事物以及需求量大的信息和热点话题。不适宜一些
个别资讯和时事。
7 心得体会
经过这一系列对“搜索”以及“搜索引擎”的探索,我收获颇丰。我了解到了搜索引擎的历史和发展,仿佛经历了那段曲折感人的时光,看着搜索引擎慢慢成长,我真为自己能轻松地使用百度、Google来搜索信息而感到幸运。
通过探究搜索引擎的基本结构以及其典型代表,我懂得了搜索信息并不只是用鼠标点击按钮那么简单,其中蕴涵着丰富的技术和知识结构网络。同时,我也了解到了其他的一些搜索引擎。
“搜索技巧”更让我学到了许多能够学以致用的搜索方法,我不再为查找一个长标题而绞尽脑汁了。
搜索引擎的相关参数展示了各个搜索引擎的优势、劣势,让我今后可以更好地为不同的搜索标题选择不同的搜索引擎。不仅不会再发生“杀鸡用宰牛刀”的事,还能得到意想不到的惊喜。
通过自己进行搜索引擎的比较,我更加切身体会到了不同搜索引擎在不同方面的特点。今后,我可以更好地利用它们的特点进行搜索。枯燥无味的搜索也会变得有趣起来。
最后,我十分感谢老师能够给我们这一个与“搜索引擎”零距离的机会,让我更深入地了解我每天都在用的搜索引擎,了解它们背后的故事。同时,我也学会了如何在Word中用大纲版式进行文档编辑。通过这次探究,我是学有所获、受益匪浅。
PAGE
21(共73张PPT)
2008-09 高一第2课
技术?
第2课 信息技术及其应用
北大附中 李冬梅
2008-09 高一第2课
一、什么是技术
为了明确信息技术的概念,需要了解什么是信息,什么是技术。上节课我们已经对信息进行了研究。技术总是与科学连在一起的,为了更好的理解信息技术,我们先来研究一下科学技术。
2008-09 高一第2课
科学技术是不是自古就有的,是不是客观存在的?
2008-09 高一第2课
科学技术并不是自古就有的,也不是永恒不变的。在人类发展的初始阶段,既没有科学也没有技术,人们完全是以赤手空拳来争取自己的生存和发展。
2008-09 高一第2课
科学技术是从什么时候开始的?是如何产生的?
2008-09 高一第2课
科学和技术都是在人类进化的过程到达一定的阶段后,由于人类进一步扩展自身能力的“需要”和自然规律的“许可”才逐渐
萌发出来的。
人类进化分为两个基本阶段:生物进化阶段(也称初级进化阶段)和文明进化阶段(也称高级
进化阶段)。
2008-09 高一第2课
1、科学技术的产生
2008-09 高一第2课
在生物进化阶段,人们主要通过自身器官功能的分化和强化来增强自身的能力。直立行走,手脚分工,是人类生物进化阶段的主要成果。由四脚行走进化到直立行走,人类的视野开阔了,认识环境认识世界的能力也提高了,也使人类身体的灵活性和灵巧性大大增强。通过手脚分工,人类双手从行走功能中获得解放,手的功能扩展,
2008-09 高一第2课
使人类适应环境、改造环境的能力增强了。这是一个漫长的进化阶段,这个阶段仍然没有科学也没有技术。
由于人类生理器官功能分化和强化的有限性,人类生物学意义上的进化过程不可能无限地展开,当人类自身的进化达到饱和状态时,人类争取更好的生存和发展的需求并没有停止,这样,就会出现矛盾,必然会激发新的进化机制,人类的文明进化机制 就自然出现了。
2008-09 高一第2课
在人类的文明进化机制阶段,人们的的注意力开始从自身器官转向外部世界,人们试图利用外部世界的力量来增强自身的能力。
2008-09 高一第2课
“借助身外之物”扩展自身能力的方法和手段就是科学技术的生长点。
搬移重物的经验正是近代力学“杠杆原理”的原始萌芽。杠杆成为有力的工具,扩展了人们的体力。设计和使用杠杆的具体手艺就成为一种有效的技术;在这种具体应用的反复刺激下,久而久之,人们脑海里就会涌动着“杠杆原理”的抽象理论,这就是最早的原始形态的科学。
杠杆原理与杠杆技术
结论1
人类由生物进化向文明进化的转化,由“内部器官的分化和强化”机制到“利用身外之物强化自身功能”机制是科学技术产生的前提条件。其中,身外之物就是科学技术所创造的各种工具。
2008-09 高一第2课
科学、技术、工具
科学:揭示事物运动变化规律的理论和方法。它可以提高人们认识世界和改造世界的水平。
技术:依据一定的科学理论,制造和制作工具的工艺和手段。
制作不同的工具有不同的技术。可以依据的科学原理是可以一样的。
工具:技术的成果。
工具的使用推动的社会生产力,也推动的社会的进步
2008-09 高一第2课
科学技术的发展
追求“更高的生存发展目标”是人类社会进步的永恒动力。为此,人类必然会不断地对自身提出“更高的能力要求”,这个要求与人类所具有的“实际能力水平”是有差距的,这种差距又是巨大的导向力,支配人类在实践摸索过程中自觉或不自觉地朝着缩小这个差距的方向努力,这种努力的理论成果就沉淀为“科学发展”,这种努力的工具成果则成为“技术进步”。
2008-09 高一第2课
2008-09 高一第2课
科学技术与人类需求的关系
科学技术是为了满足人类自身能力发展的实际需求而产生,那么它的发展也要符合人类自身能力的发展规律。
2008-09 高一第2课
科学技术是“辅助人类扩展能力”的,那么,人的能力有哪些?
2008-09 高一第2课
人的三大能力
从宏观上看,人的能力有三种:
体质能力——体质能力反映人的体质结构的合理性和强健性。
体力能力——体力能力反映人的力量的充沛性和持久性。
智力能力——智力能力反映人的思维和智慧的理智性和敏捷性。它们是一个有机的统一体。
2008-09 高一第2课
科学技术的产生是通过制造工具来扩展人的能力的。而工具的制造一方面需要“资源”,另一方面需要科学技术知识。通过科学技术知识的运用,把“资源”转变为“工具”,通过“工具”的作用,实现人的“能力扩展”。
2008-09 高一第2课
科学技术是如何扩展人的这些能力的?
扩展人类能力的三种工具
2008-09 高一第2课
(1)扩展体质能力的质料工具
质料工具主要是扩展人的体质能力,把质料工具与人的体质能力结合起来,就可以具有更强的硬度、更好弹性、更注意的应力特性、更高的熔点、更低的凝聚点、更强的耐压能力和更强的抗腐蚀和抗辐射的能力,等等。
质料工具的制造,一方面依赖于物质资源,另一方面依赖于物质结构和材料力学理论。
制造质料工具的关键,在于利用材料科学技术的知识和技能把各种物质资源转化为具有各种优良性质的材料,并根据力学原理把材料加工成为相应的工具。比如,农业社会的锄头和镰刀。
这一阶段,人类主要开发的是物质资源。
2008-09 高一第2课
(2)扩展体力能力的动力工具
动力工具的作用主要是扩展人的体力能力。动力工具与人的体力能力相结合,就可以具有更强的推动力、牵引力、负荷力、冲击力、爆破力、摧毁力等。
动力工具的制造,一方面依赖于能量资源,另一方面依赖于能量守恒与转换理论。
制造动力工具的关键是,利用能量科学技术的知识和技能,将能量资源转换成动力。当然,任何一种动力工具的制造都离不开物质资源,所以,更准确的说,动力工具的制造需要能量和物质两方面的资源,需要能量学科技术和材料科学技术两方面的知识和技能。
这一阶段,人类主要开发的是能量资源。
2008-09 高一第2课
(3)扩展智力能力的智能工具
智能工具的作用主要是扩展人的智力能力。智能工具与人的智力能力相结合,就可以具有更敏锐的观察能力、更广阔的感知能力、更精细的分辨能力、更高效和更可靠的信息共享能力、更强大的记忆能力、更快捷的计算能力、更好的学习与认知能力、更明智的决策能力与更强大的控制能力等。
智能工具的制造,一方面依赖于信息资源,另一方面依赖于信息加工与转换的理论和技术。
制造智能工具的关键是,利用信息科学技术的知识与技能,把信息资源提炼成知识,并进一步把知识激活成为智能。当然,任何智能工具的制造都离不开材料和动力。所以,更确切地说,智能工具的开发与制造需要信息、能量、物质三方面的资源,需要信息科学技术、能量科学技术、材料科学技术。
这一阶段,人类主要开发的是信息资源。
2008-09 高一第2课
结论2:资源—科学技术—工具—能力的关系
2008-09 高一第2课
所利用的资源 所需要的科学技术 所制造的工具 所扩展的能力
物质 材料 质料工具 体质能力
能量+物质 能量+材料 动力工具 体力能力
信息+能量+物质 信息+能量+材料 智能工具 智力能力
结论3:时代—资源—科学技术—工具—能力的关系
2008-09 高一第2课
时代 表征性资源 表征性
科学技术 表征性
工具 扩展能力
古代 物质 材料科学技术 质料工具 体质能力
近代 能量 能量科学技术 动力工具 体力能力
现代 信息 信息科学技术 智能工具 智力能力
结论4
从技术的本质意义上,信息技术就是能够扩展人的智力能力,也就是扩展人的信息器官功能的一类技术。
2008-09 高一第2课
人类具有哪些信息器官?
2008-09 高一第2课
人类的信息器官及功能
2008-09 高一第2课
(1)感觉器官
包括视觉器官、听觉器官、嗅觉器官、味觉器官、触觉器官和平衡感觉器官等。
主要功能是:获取信息——通过视觉、听觉、嗅觉、味觉和触觉来感知(即获取)外部世界各种事物运动的状态和方式;平衡感觉器官则可以根据运动主体与客体之间的关系来获取平衡信息。
2008-09 高一第2课
(2)传导神经网络
它又可以分为导入神经网络和导出神经网络等。
主要功能是:传递信息——通过导入神经网络把感觉器官获得的信息传送给思维器官;通过导出神经网络把思维器官加工出来的信息传送给各种效应器官或内部某些器官。
2008-09 高一第2课
(3)思维器官
包括记忆系统、联想系统、分析推理和决策系统等。
主要功能是:加工和再生信息——实际上它担负着存储信息、检索信息、加工信息和再生信息的复杂任务。通过存储、检索、加工信息得到对于外部事物运动规律的认识;通过再生信息(即第二类认识论意义的信息)来表示主体对于外部事物进行改造的策略和意图。
2008-09 高一第2课
(4)效应器官
包括操作器官(手)、行走器官(脚)和语言器官(口)等。
主要功能是:施用信息——通过操作器官和行走器官来执行大脑发出的第二类认识论意义的信息,或者通过语言器官来表达第二类认识论意义的信息,使这些信息产生实际的效果。
2008-09 高一第2课
信息技术的四项基本内容(4C)
2008-09 高一第2课
(1)感测技术
感觉器官功能的延长。感测技术包括传感技术和测量技术,也包括遥感、遥测技术等。它使人们能更好地从外部世界获得各种有用的信息。
2008-09 高一第2课
举例说明
2008-09 高一第2课
(2)通信技术
传导神经网络功能的延长。它的作用是传递、交换和分配信息,消除或克服空间上的限制,使人们能更有效地利用信息资源。
2008-09 高一第2课
举例说明
2008-09 高一第2课
(3)计算机和智能技术
思维器官功能的延长。计算机技术(包括硬件和软件技术)和人工智能技术,使人们能更好地加工和再生信息。
2008-09 高一第2课
举例说明
2008-09 高一第2课
(4)控制技术
效应器官功能的延长。控制技术的作用是根据输入的指令(决策信息)对外部事物的运动状态实施干预,即信息施效。
2008-09 高一第2课
举例说明
2008-09 高一第2课
结论5
由上面给出的信息技术的基本定义还可以引出两个比较具体的定义,即: (1)信息技术是指能够完成信息的获取、传递、加工、再生和施用等功能的一类技术。 (2)信息技术是指感测、通信、计算机和智能以及控制等技术的整体。
2008-09 高一第2课
2008-09 高一第2课
信息技术的发展历史
语言
文字
印刷术
电报电话、电视
计算机与现代通信
2008-09 高一第2课
2008-09 高一第2课
信息技术的应用
“仿生眼”帮盲人复明
2008-09 高一第2课
“仿生眼”帮盲人复明
据英国媒体08年4月22日报道,英国伦敦穆尔菲尔德眼科医院日前施行了一项先锋性的“仿生眼”移植手术——在两个盲人患者的眼球表面分别植入安装有60个电 极的人造视网膜芯片,从而让两个失明患者恢复视力,并能辨认简单物体。这是英国首次施行“仿生眼”移植手术,在未来3年之内,“仿生眼”技术有望得到大范围推 广。
2008-09 高一第2课
“仿生眼”帮盲人复明
患者双目失明多年
两个失明患者均50多岁,并都是因患有遗传性色素性视网膜炎而失明多年。在手术中,眼科 医生林登为两个患者植入了一种名为“阿格斯II型”的“仿生眼”。“阿格斯II型仿生眼”价格高达1.5万英镑,是由美国“第二视力”公司 生产、加州洛杉矶市多赫尼视力学会的科学家发明的。它由一个微型摄像机和一片植入患者眼球表面的人造视网膜组成。人造视网膜下植入60个电极。微型摄像机 安装在失明患者戴的眼镜上方。
2008-09 高一第2课
“仿生眼”帮盲人复明
图像类似“印象画”
“阿格斯II型仿生眼”的工作原理是:首先通过患者眼镜上的摄像机捕捉外部景象,然后图像经无线发射器传送到患者眼球表面的人造视网膜上,并转 换为电脉冲信号。接着,人造视网膜上的电极会刺激视网膜的视觉神经,继续将信号沿视神经传送到大脑。这些脉冲信号可以“欺骗”大脑,让大脑以为患者的眼睛 仍然在正常地工作。最终,患者可以和常人一样“看到”外部世界,并区分光明和黑暗,从而恢复视力。
2008-09 高一第2课
目前“仿生眼”提供的脉冲信号,并不能达到健康眼睛捕获的图像质量,只能让大脑产生画质粗糙的黑白图像,这种图像有点类似“印象画”,缺乏鲜明的自然色彩。
花数月学习“观看”
21日,林登医生透露两个患者正处在康复阶段,目前他们已经能辨认简单物体,并可以独自四处走动。林登说:“穆尔菲尔德眼科医院是欧洲仅有的3 家获选参与‘仿生眼’手术试验的医院,我们为此感到非常自豪。患者们都是依靠拐杖、导盲犬或者他人帮助才能认路。而他们的‘仿生眼’植入手术都很成功。”
专家预测,未来3年之内,“仿生眼”技术有望在英国大范围推广,令数百万盲人通过这种方法重见光明。
“仿生眼”帮盲人复明
2008-09 高一第2课
“舌头驾驶系统”助残障人活动
2008-09 高一第2课
北京时间7月1日消息,据英国《每日邮报》报道,美国科学家6月30日表示,他们最近成功地研制出一种使用微小磁铁进行控制的小仪器,这种米粒大小的仪器可以植在人的舌头下,肢体残疾的人士只需要动一下舌头,就能够轻松地驾驭自己的轮椅甚至是操作电脑。这套装置将可协助脊椎神经受到重创的严重残疾人,重新过着以往丰富、活跃及独立的生活。
2008-09 高一第2课
“舌头驾驶系统”助残障人活动
负责此项研究的美国佐治亚理工学院的教授戈范卢说,他们研发了一种使用微小磁铁的仪器,能够让残障人士只需要动动舌尖,就能够轻而易举地驾驭自己的残疾轮 椅,甚至还能操作电脑,这使得他们不需要借助于他人之手进行活动。人们只要将这个只有米粒般大小的磁铁植入残障人士的舌头下,使用者就能够自如地控制电脑 屏幕上的滑动鼠标,或者是在房间里驱动轮椅。
2008-09 高一第2课
“舌头驾驶系统”助残障人活动
在这套系统中,使用者头部将戴上一个磁场感应器,它能够测出舌头的磁迹,然后将无线电讯号传送到在使用者戴在身上或轮椅上的手提电脑中。此外,电脑系统 还能确认每名使用者的独特舌头动作,即舌头所触碰的每颗牙齿,都可代表不同的指令。戈范卢说:“我们选择舌头来操作这个系统,是因为舌头是经由一条头盖骨 神经直接与大脑相连,不像手脚是经由脊椎神经受大脑控制;另外,头盖骨神经一般能避免严重脊椎神经受伤或是神经肌病变所造成的损害。此外,舌头的动作快而 准,也不需要太多思考、集中精神或使太多力。”
2008-09 高一第2课
“舌头驾驶系统”助残障人活动
无音通话系统
《参考消息》2008年3月17日报道
美国安比恩特公司发明了一套无需发出声音就能够进行电话通话的系统。使用者利用一个放置在颈部周围的项圈,就可以收集到人脑中与特定词汇有关的神经信号,从而创造无声说话的奇迹。
2008-09 高一第2课
今年2月底,安比恩特公司首次推出了"Audeo"无音通话系统,可以识别和转换150个单词和短语的神经信号。公司计划在今年底推出没有词汇量限制的升级版,"Audeo"升级版不是识别整个单词或短语,而是识别构成完整单词的整个音素。
2008-09 高一第2课
无音通话系统
通过这套名为“Audeo”的系统,任何人经过一定时间训练,就可以在不必发出任何声音的情况下发送出与大脑中具体词汇有关的神经信号。
这些信号被放置在颈部声带周围的项圈接收到以后进行编码,通过无线传递给附近的电脑,最终电脑对信号进行解码,再合成声音和语言。这个无线感应项圈重量很轻,可以接收来自大脑的神经信息,然后对这些信息进行数据处理。
2008-09 高一第2课
无音通话系统
对于那些担心"Audeo"会让人泄露内心秘密的人来说,发明者表示无需有这一顾虑,因为系统能够破解的神经信号需要一定的思想集中程度,也就是说用户必须特意去"思考"他要说的"声音词汇"。
2008-09 高一第2课
无音通话系统
农田里的信息技术
《参考消息》2008年3月4日报道
在德国,借助现代信息技术和传感器技术种植经济作物已在从实验室通往实际应用的道路上迈出了一大步。“为了更有效地指挥农户的田间管理,联邦德国已有8% 的农业企业使用现代信息技术和传感器技术”,联合项目“普雷阿格罗”负责人阿明·维尔纳说。这个项目是在约9年前由联邦研究部设立的,现在接 近尾声。
2008-09 高一第2课
农田里的信息技术
农业经营者在耕种过程中利用传感器掌握土壤与植物的状况。借助电子仪器来确定肥料和除草剂的用量,使用卫星定位系统,用专门的软件管理和处理搜集的数据。这种所谓的地理信息系统还可以帮助农业经营者跟踪其前几年耕种的开支和收获。
2008-09 高一第2课
传感技术打造高科技消防衣
2008-09 高一第2课
新华网北京11月15日专电在不知道失火的楼房里是否有人的情况下,消防队员只能闯进烟熏火燎的楼房,依靠自己的直觉进行搜查。现在,德国不来梅大学赫尔佐克负责的一个课题组正利用现有的传感技术研发高科技消防装备。新产品可利用传感技术,提高人的感觉器官的功能,以便让消防人员能够及早了解哪里有危险。
传感技术打造高科技消防衣
2008-09 高一第2课
例如,在手套里加一个温度传感器。传感器可以告诉门外的消防队员温度是否太高。如果温度太高,则意味着门后有熊熊大火。另外一种传感器可以检查是否存在 有毒物质,提醒消防队员防止中毒。赫尔佐克介绍说,有些传感器还可以监测消防队员的体力参数,例如血压、血液中的含氧量和心跳频率等,并让指挥中心随时了 解和监控这些数据。
传感技术打造高科技消防衣
2008-09 高一第2课
传感器收集到的所有信息都汇集到消防队员随身携带的一台袖珍计算机里。这台计算机被安装在一只很小、却非常结实的铝合金盒子里,可以扣在消防队员的皮带扣上。它功能齐全、安装拆卸方便,可以运算,也可以发送和接收信息。
传感技术打造高科技消防衣
2008-09 高一第2课
课题组的研究人员还研发了消防部门专用定位导航系统。该系统的传感器可以安装在消防队员的消防靴里。传感器可以测出靴子的加速情况,还有一个指南针负责确 定消防队员正在行进的方向。消防队员每走一步,传感器都会把数据传送过来,由系统进行运算和分析,指挥中心可以十分精确地确定消防队员在建筑物里的位置和 路线,误差仅有1%。
2008-09 高一第2课
信息技术的发展趋势
上机实践——内容要求
1、列举应用实例。
就信息技术的感测技术、通信技术、计算机与智能技术、控制技术分别列举三个或三个以上的生活等方面的应用实例,如电子体温计、血压计均为感测技术在生活中的应用。
说明:可以借助网络搜索信息。
2008-09 高一第2课
上机实践——内容要求
2. 案例分析。
首先列举一个(或一个以上)信息技术前沿技术的综合应用实例(如霍金的交流设备), 并就案例中各部分所使用的信息技术归类进行说明(如,其中...地方用到的是感测技术...,其中...地方用到的是通信技术...,其中...地方用到的是计算机与智能技术...,其中...用到的是控制技术...,等等)。
说明:具体案例可上网查找,如可以在“百度”中输入“高科技前沿-信息科学”即可查到相关内容的网址;
2008-09 高一第2课
上机实践——内容要求
3. 描述自己的想像。
信息技术是当今热门研究领域,它在我们的日常生活中发挥着举足轻重的作用,请根据你对信息技术的了解,大胆地展望一下信息技术的未来。
说明:是说你自己的想像,不需要上网搜索。
2008-09 高一第2课第一章 网站项目开发概述
网站开发是一个比较复杂的过程,在学习具体的技术细节之前,了解建设的过程是十分重要的。这部分内容理论性比较强,但要想做真正的项目开发就必须要去了解,这样才能让你在以后的学习中做到心中有数。
网站项目开发由始至终分为网站策划、人员组织、页面设计制作、动态编程、测试发布、宣传与维护、项目总结几个阶段。当确定项目后,需要有一个整体的开发目标,然后设计网站的关键页面,一般动态网站还需要动态编程。当站点所有内容完成并且测试通过后,就可以在网上发布了。但工作还远没有完,宣传和维护工作任重而道远,而且往往经过一段时间之后,网站还需要重新进行开发,因此它实际上是一个循环往复的过程。
图1-1网站开发流程
了解网站开发流程对于做好一个商业化的项目十分关键,因为你是在给一个公司做网站,要达到的是客户的要求,这一点是任何时候都要牢记的。下面我们以“新东方IT教育网上书城”(以下简称“网上书城”)的建设为例给大家介绍专业网站项目开发的一般流程。
1.1网站项目竞标
“新东方IT教育网上书城公司”是新东方IT教育要创建的网上售书交流平台,主办单位首先在多家网络公司中招标。新东方IT教育应用软件教学部也参与了这次竞标,教学部接到招标项目后,立即组织相关人员进行项目的策划,在三天之内拿出了具体解决方案。
网站项目竞标前需要根据客户的要求深入分析,重点是考虑这样几个问题:
1、如果做这个项目是否能够盈利、大致盈利多少;
2、如果要做,应决定做出的网站主要针对的是什么人、这些人具体需要什么服务;
3、客户要实现什么功能和目的;
4、定出网站的宣传口号、网站结构等内容。
分析完后,由项目主管写出可行性研究报告,陈述该项目的可行性。部门通过后将会要求写出周密细致的方案书(标书)提交给项目客户,如果客户与公司达成一致,即可签订合同,开始制作过程。
具体过程包括:需求分析、可行性研究、项目计划的制定、方案书、签订开发合同等步骤。
图1-2网站项目竞标流程
1.1.1需求分析
与客户会面,请客户填写项目调查表或者由客户提供项目要求资料,明确项目需求。下面是由新东方IT教育提供的项目基本需求资料。
表1-1 客户基本需求
分类 具体要求
网站风格 清新活泼、大众化。
前台栏目 至少有最新图书、热点图书、新书预告、本月排行、案例下载、原创交流、技术论坛、客户反馈、公司简介等栏目。
后台管理 安全、稳定。能实现商品的管理、查询、统计分析等功能,能实现分级管理。
1.1.2可行性研究
可行性研究的目的是根据客户提出的要求,确定项目是否可以做,做得话能否赢利。在做决定之前,重点需要确定以下内容:
1、明确开发目的、功能要求和主要工作内容;
2、开发所需要的主要技术、软硬件条件;
3、确定完成网站的时间长短;
4、所有的费用开支预算;
5、判断客户的信誉,是否有支付能力;
6、如果项目竞争激烈,需要了解竞争对手的具体情况,做到知己知彼;
以上内容明晰之后,项目主管需要提交一份项目可行性研究报告,具体阐述以上几个方面的内容。报告由公司决策层审阅,如果通过开始制定比较详实的项目计划书。
表1-1是应用软件教学部提交给部门经理审阅的可行性研究报告。
表1-2 新东方IT教育网上书城可行性研究报告
一、新东方IT教育网上书城概要新东方IT教育网上书城是新东方电脑部网上售书系统,属于典型的电子商务平台。网站旨在推动新东方电脑部教材的研发和推广,推广新东方电脑培训品牌。目前应用软件教学部共有四位老师可以参加该项目的开发,另外还有公司内部网管等人可以协助该项目,人员结构比较完整。由于参加人员均有相关开发经验,可以保证项目高质量的完成。二、我们需要做的工作网络结构新东方IT教育内部已经形成相对完整的局域网,外部通过ADSL专线与Internet相连。由于目前已经有了域控制器,因此只需要添加1台网站发布服务器和1台数据库服务器就可以了。由于“网上书城”规模不大,采用中型服务器发布网站、采用小型服务器备份数据就可以达到要求,如果日后需要扩容,只需要升级服务器就可以改善性能。业务系统制作相对完善的网上售书系统,并且提供案例下载、留言系统、论坛等功能。由于主要针对新东方IT教育学员和在校学生,采用ASP作为服务器脚本语言,SQL server作为数据服务器软件完全可以满足要求。因此开发任务主要集中在ASP脚本的编写和网站静态页面的设计上。系统的标准性新东方IT教育将接手该系统的后期维护工作,这对项目提出了更高的要求——系统需要有更强的稳定性、安全性和易维护性,开发时需要为该项目建立更完备的文档管理。系统的拓展潜力系统建设的最终目标是建立一个完整的图书社区。这个过程中,系统必然需要随着业务的扩展不断添加新的功能,因此开发时需要考虑一段时间内的拓展潜力。三、结论该项目是一个标准的、可定制的图书社区平台,这对开发建设单位提出了较高的要求,但在新东方IT教育、开发部门的协作下,在一个时间内,我们有能力完成这项工作,并在以后通过用户的使用使该系统不断的完善。新东方IT教育应用软件教学部2002年10月1日
1.1.3项目计划书
项目说明书是项目实施前的规划说明文档,供内部使用。内容包括:建设网站目的及功能定位、客户自身条件分析、完成期限、项目进度安排、职责和工作分配、项目规划、项目小组成员组织、项目资料的收集等。
建站方式与主要技术
首先根据客户需要确定网站的功能,也就是说到底要做哪种类型的网站,进而确定可以采用的网站开发技术。网站有很多种,有商品宣传型、网上营销型、客户服务型、电子商务型等。比如,实例网站主要就是要宣传新东方IT教育系列从书,因此是一个商品宣传型的网站,但同时也需要包括在线售书功能(网上营销)。
要实现这些功能有两种渠道,一种是购买IBM、HP等公司提供的企业上网方案、电子商务解决方案,但这种方案一方面成本太高,而且可定制性能受到一定的限制,一般规模不大的网站显然不合适;另外一种就是利用动态网站技术自己开发。
目前有很多动态网站技术可以选择,如ASP、JSP、PHP等。由于动态网站一般都需要一个数据库做支持,因此还涉及到数据库软件的选择,目前比较常用的数据库软件有SQL server、Oracle、Mysql等。
另外还要根据客户目前的局域网建设情况,确定采用什么样的方式发布网站,也就是考虑是自建服务器还是租用虚拟主机,当然还要选择使用哪种操作系统,UNIX, Linux还是Windows2000/NT。
下列表中列出的是常见脚本程序语言、服务器软件以及操作系统的特点。
表1-3常用动态服务器程序语言
动态语言 特点 配套使用的操作系统
ASP 简单易学、易用,但是平台移植性差,只能在Windows操作系统上运行。 Windows NT、windows 2000等windows操作系统。
JSP 平台移植性好,但最好有Java的基础。 Windows、Linux、Unix操作系统。
PHP 能够运行在多种操作平台上,能节省开支但后期维护比较麻烦。 Windows、Linux等操作系统。
表1-4常用数据库服务器软件一览表
数据库类型 特点
Access Office的套件之一。简单易学,操作方便,但安全性不高。
SQL server 可用于大中型网站数据库操作平台,简单易行,是中小型公司的首选。
Oracle 大型数据库系统,安全性很高,可以定制,但售价很高,一般用于金融系统。
MySQL 免费是最大的特色,在网上用的也不少,但功能上有一些缺陷,安全性不是很高。
就本例而言,新东方IT教育网上书城主要用来做丛书宣传,访问量不是很高(低于10000人/天),而且安全性能要求也不是很高,因此采用技术比较成熟的ASP能节省开发费用,但由于ASP必须运行于Window2000/NT,因此必须建立windows2000/NT服务器系统发布网站。
开发软件
除了操作系统、数据库服务软件以外,还要选择网页制作方面的软件。网页制作主要包括网页排版、网页图形设计和图像处理、多媒体开发三大领域。这方面的软件非常多,下面是非常典型的网页制作软件的特点和评价。
表1-6网页排版软件
软件名称 特点 评价
DreamWeaver MX Dreamweaver是美国Macromedia公司开发的集网页制作和管理网站于一身的网页编辑器。用它制作的网页代码精炼、跨平台性好、可以自动生成Javescript脚本语句。它成功地整合了电子商务功能,不需要通过浏览器就能预览动态网页。Dreamweaver、Fireworks、Flash之间可以良好协作,它们一起被称为"网页三剑客"。 专业、实用。既可制作页面也可用于动态编程。
Visual Interdev 可以实现ASP脚本的自动添加,与VB、VC的使用方式有些相似,缺点是产生的代码不是很规范。 适合熟悉VB、VC的程序员使用。
表1-7网页图像处理软件简介
软件名称 特点
PhotoShop 6.0 能进行很精细的位图处理,是平面设计中不可缺少的软件。但是它的矢量图功能比较差,在制作图标等矢量对象时还需要借助Illustrator来完成。
Fireworks MX 它是专门针对网页设计的绘图软件,将矢量图和位图的功能融合在一起,而且完善的切片和优化导出功能使得它在专业的网站开发领域占据着不可替代的地位。
表1-8多媒体软件简介
软件名称 特点
Flash MX Macromedia Flash是Flash动画专业的创作工具。无论是创建动画图标、Web 站点导航、动画片头或者完整的 Flash Web 站点,Flash 的强大功能都能帮您实现。另外,由于actionscript的引入使得在动画上添加Web应用程序成为可能。
Livemotion Adobe Livemotion是一个和Flash功能上差不多的工具,但由于在国内出现的比较晚,很少有人在使用。它是一款针对平面设计师的动画处理软件。
Ulead COOL 360 Ulead COOL 360是用来全景动画的专业制作软件,利用它我们可以很轻松的创建出360全景演示场景。
到目前为止,Macromedia studio MX版本已经逐渐普及,这个版本对于我们开发一个专业的商务网站来说完全可以胜任。事实上,在业内有90%以上的网页制作人员正在用它或者以往的版本制作网站。
项目进度计划
项目进度计划需要给出比较细致的开发进度,主要说明在什么时候完成了哪些工作。下表是实例的开发进度计划概要。
表1-9新东方IT教育网上书城项目进度计划概要
工作内容 开始时间 截止时间
1、网站策划(用户调研、需求分析、系统规划设计) 2002/10/7 2002/10/15
2、人员组织 2002/10/7 2002/10/15
3、形象设计(图标、广告条、关键页面草图) 2002/10/15 2002/12/25
4、动态编程(应用系统开发) 2002/10/25 2002/11/25
5、测试发布 2002/11/25 2002/11/30
7、系统文档编写整理 2002/11/30 2002/12/5
8、汇报验收 2002/12/10
9、宣传与维护(系统试用期) 2002/12/10 2003/3/10
10、项目总结 2003/3/11
这个时间表和正式合同的时间一般会有一些差别,因为有可能会出现一些意外情况耽误项目的进程,因此签合同时一般需要多出一个月给自己做缓冲。
项目预算
项目预算要将开发中可能出现的开支以及系统搭建所需的所有费用详细列出,给出完整的清单。清单主要包括硬件开支、软件开支、工资开支、日常开支等内容。
其中硬件开支主要包括网站发布服务器、数据备份服务器、防火墙硬件、其他网络硬件等所需开支;软件开支主要包括操作系统、硬盘备份软件、杀毒软件等项开支;工资开支主要是指员工的正常工资和奖金,涉及到的人员主要有项目主管、网站策划、美工、网页制作、程序员等;最后还有一项就是日常开支,主要包括午餐、办公用品、相关活动的开支等。
风险计划
简单的说就是设计一份出现意外情况时的应急办法清单。基本上就是确定出现什么意外之后应该怎么办。这里的风险主要是指网站开发过程中的可能出现的风险。
1.1.4方案书
方案书与计划书不同,它是提交给客户的资料,因此你必须考虑到双方的利益问题。标书一定要讲清用户最感兴趣的内容,如能实现的功能、采用的技术、各项开发费用等,必须让用户相信你有实力也有充足的准备,否则他就会将“绣球”丢向你的对手。
具体来讲,一个完整的方案书需要包括网站主要功能、硬件软件系统环境、软硬件报价表、开发周期表和开发费用明细表等内容。方案书还应附有开发中的各项费用开支清单以及开发日程详细安排等内容,这样可以让客户心中有数,给顺利签订合同打下坚实的基础。
1.1.5签订开发合同
如果客户对你给出的开发计划比较满意,就会和你签订一个技术开发合同,合同需要将网站建设目的、详细功能要求、费用及支付方式等列举出来,下面是比较规范的项目开发技术合同。
“新东方IT 教育网上书城”开发技术合同
合同编号:XDFIT-2002-10
项目名称:新东方IT 教育网上书城
甲方:新东方IT教育
乙方:应用软件教学部
一、建设目的:
新东方IT教育开发建设新东方IT教育网上书城的目的是宣传新东方IT教育系列丛书,更好的为学员服务,进而扩大企业知名度。根据这个目的,合作双方设计并制定了网站的各个模块以及要实现的功能。
二、前台设计
(一)首页设计
首页要有清晰的导航,每个次级页面左侧导航及相关内容不同,均有不同的风格,但在同一分类下风格统一。静态网页设计需要有三个方案,方案须经甲方同意才能继续完成动态编程部分。
(二)公司简介及新东方系列丛书介绍
公司简介需要包含新东方IT教育、组织机构、公司文化、发展历程、网站简介、联系我们、客户留言。
(二)动态信息发布模块
要求有以下互动信息的实时发布栏目(包括文字、图片、图表、数字等):新闻、经营信息、调查结果发布、行业动态、人才信息。
(三)会员管理模块
对会员进行不同权限的划分,分为三类:访客、注册用户、新东方学员。
(四)商品销售模块
最新图书信息、热点图书信息、新书预告、本月排行。用户可以在线提交订单,查询图书,察看图书相关信息。商品信息包括编号、名称、规格、价格、出版社、作者、详细说明、图书封面、备注等内容。
能实现商品的搜索,可以按照关键字进行检索;
(五)商品服务模块
案例下载、原创交流、技术论坛、客户反馈。
(六)市场调查和分析模块
管理员可以使用界面实现市场调查表单内容的修改;对客户的意见进行统计分析。
(七)客户反馈模块
访问者可以填写反馈信息,而且将访问者的信息放在页面上显示。为了保证安全性,访问者的联系方式等涉及私人秘密的信息不在页面上显示。
三、后台设计
(一)分级管理
能实现分级管理,管理员分为超级管理员、普通管理员、会员三个等级,分别享有不同的权限。
(二)动态信息管理
可以按类别发布信息,能实现关键字检索。
(三)商品管理模块
可以手动将某一项商品变为“畅销商品”,并在“热点图书”栏目中显示出来。在每个大类下,可以动态添加、删除、编辑商品小类,可以添加、修改、删除任何一种商品的信息。
(四)会员管理模块
会员可以修改个人资料,而管理员可以修改、删除、增加一个新的用户。
(五)市场调查及分析模块
对前台提交的调查问卷进行分析归总。
(六)用户反馈模块
对用户提交的反馈信息进行归纳分析,具有回复、归纳、查询、删除留言等功能。
(七)网站访问统计系统
对用户提交的反馈信息进行归纳分析,恢复帖子。
四、项目内容及相关费用(单位:人民币/元)
网站开发费用如表1-3所示。
表1:网站页面及页面制作费用
序号 项目 单价 数量
1 欢迎屏(包含Flash) 1000元/页 3套
2 首页 800元/页 3套
3 栏目页 400元/页 3套
4 终极页 100元/页 3套
5 Flash动画广告 500元/秒 3套
小计: 8000.00元
表2:网站数据库程序设计费用
序号 项目 规格
1 动态信息发布系统 按照方案实施
2 商品管理系统 按照方案实施
3 会员管理系统 按照方案实施
4 客户反馈系统 按照方案实施
5 网站访问统计 按照方案实施
6 市场调查和统计 按照方案实施
小计:15000.00元
网站开发所需硬件和软件全部由新东方IT教育。网站开发总费用为23,000元整,开发前先预付5000元整,项目测试完成验收后由甲方支付剩余的18000元整。
五、开发周期
网站从2002年10月10日开始,2002/1/10完工。2002/1/10至2002/4/10为网站调试阶段,届时由乙方负责调试好站点并由甲方监督测试。网站建设期间甲方能通过http:// ( http: / / )网站看到网站的建设情况和进度。
六、其他
依据合同双方约定,乙方有责任根据甲方要求提出修改的要求进行调整。但一旦设计方案正式确定之后,甲方将不再有大幅度调整网站结构的权利。如有未写明的要求,应以实现网站功能为标准。
甲方:代表签字(盖章):时间:2002年9月30日 乙方:代表签字(盖章):时间:2002年9月30日
1.2网站项目策划
合同签下来了,还有很多的事情要做。项目正式开发之前最重要的就是项目策划。项目策划包括网站结构的设计、模块功能设计、书写项目策划报告等内容。
1.2.1网站结构设计
网站结构的确定和整个网站的主要开发目的紧密相关,比如“新东方IT教育网上书城”这个项目既要介绍实现网上购物,又要宣传公司形象,因此设计需要从这两个方面去着手。
由于需要宣传公司和丛书,因此至少包括公司简介、丛书介绍、服务内容、联系方式等信息;另外由于要实现网上购物功能,因此需要提供会员注册、详细的价格信息、在线购物、商品服务信息、搜索查询、定单确认、付款方式、帮助系统等基本内容。
网站内容是网站吸引浏览者最重要的因素,无内容或不实用的信息不会吸引匆匆浏览的访客。可事先对人们希望阅读的信息进行调查,并在网站发布后调查人们对网站内容的满意度,以及时调整网站内容。
设计的结果最重要的就是网站结构示意图。在这张示意图中,必须将网站重要表达的内容非常清晰的表达出来。
表1-11网站结构示意图
网站结构示意图前台部分后台管理部分
1.2.2模块功能设计
模块功能设计实际上就是将每个功能进行深入研究分析,明确应当完成的所有工作。然后制定出详细的开发计划以及人员组织计划。
1.2.3项目策划报告
项目策划报告是提交给项目决策人员(如老板、部门经理)的重要材料,他们将会根据客户要求对计划书的内容提出修改意见,确定后正式实施。
1.3网站开发人员组织
项目开发人员的多少和比例要根据实际项目来决定,一般控制在5-7人。组建项目团队时根据网站规模确定需要哪些职位,然后选择合适人员组成。人员最好都有相关项目的开发经验,技术上一定要过硬,因为任何一个环节上浪费了时间都可能导致项目如发如期完成。
一般开发人员至少需要项目主管、网站策划、内容编辑、美术设计、网页制作、网站程序员,另外还需要公司里的系统管理员、网络工程师、质量测试、法律顾问、文档管理等人协助。当然小的开发公司一个人往往需要身兼数职,比如内容编辑、美术设计、网页制作甚至网站程序员都可能有一人完成。当然这样能节省一些开支,但必然会延长开发周期,而且项目质量也难以保证。
表1-12网站开发人员职责职位一览表
人员职位 主要职责 能力要求
项目主管 负责项目的管理和协调,合理分配和使用资源,保证项目按计划顺利进行。具体工作包括参与决策、召集开发人员、审查开发文档、协调开发进度、汇报开发进展、书写宏观技术文档以及项目总结等。 要求对市场、人力资源、开发成员的特点、开发项目所需资金、开发周期、各部分技术等各方面都有着全面的认识,而且要求表达沟通能力好、能够任劳任怨、在关键时刻能起到精神领袖的作用。
网站策划 对网站结构和内容进行设计和组合,和软件开发中的系统分析员有些类似。书写网站策划文档。 对客户需求有很深的理解,能准确把握整个项目全部内容。
内容编辑 负责收集整理资料。 要求知识面很广、具备很强的写作能力,能迅速收集大量有用数据、资料,对网站内容要求有着深刻的理解。
美术设计 主要负责标志、广告条、色彩以及关键页面草图的设计。书写网站形象说明书。 必须熟练掌握Adobe Photoshop或Macromedia Fireworks等专业绘图软件,有较高的艺术修养和丰富的设计制作经验。
网页制作 按照美术设计的方案制作网站效果图和页面,需要时制作各种动画(如Flash、虚拟现实动画等);书写网站文件管理技术文档。 能熟练运用专业网站制作软件(Dreamweaver、Fireworks、Flash 等)、了解Asp编程,能设计美观实用的网站界面。
网站程序员 网站程序员主要是指负责与Web相关的基于网络数据库系统与应用软件开发的工程;书写网站后台管理技术文档。 目前一般要求会使用ASP、JSP、PHP中的一种,能熟练使用一种网页制作工具(如Dreamweaver)。
系统管理员 也就是 “网管”,负责发布Web站点,配置数据库服务器等,保证网络安全。 要求熟悉网络基础知识,熟练掌握多种操作系统,能配置服务器软件、数据库软件,进行网站的管理和页面内容的更新。
网络工程师 主要负责局域网络的组建与维护。 要求熟悉网络技术、安全协议、路由与交换技术,对网络的设备进行维护与管理。
其他人员 需要时安排人员担任质量测试、法律顾问、文档管理。
由于这些人员的工作时间一般不会同时进行,因此有很大一部分可以在需要时从其他部门抽调过来。比如,在项目策划阶段一般只需要项目策划和项目主管参与就可以了;当正式进行静态页面设计时,就需要将内容编辑、美术设计、网页制作请过来,这是项目策划就可以去参加其他项目的策划;当静态页面完成后,美术设计就可以离开参加其他项目的设计了,而网站程序员又可以从其他部门抽调过来。另外,像系统管理员、网络工程师、质量测试、法律顾问、文档管理等一般公司只有一位,需要时可以请他们帮助项目组完成一些配套的工作。图1-3是每个流程所需要的人员示意图。
图1-3每个流程所需人员示意图
所有人员的调动都和公司的人事部门紧密相关,与他们之间的沟通是项目主管的重要工作之一。项目主管必须和人事部门确定好用人时间,并出具开发时间表。确定人员之前,项目主管还必须了解人事部门推荐人员的特点,从中筛选最合适的人才作为项目开发组成员。
人员的确定必须在项目正式开发前进行,临时找人绝对不是一个好方式,这样很难保证开发进度和商品质量。如果不是专业的开发公司,就必须从公司外找一部分人来做,当然这样一来风险也就增大了。
1.4 项目开发规范
要制定项目开发规范,由两个方面的原因:一是为了方便交接,二是为了减少错误。
因为开发项目时,不是任何时候所有的开发人员都在一起,任务交接就成了一个大问题。比如说静态网页制作完成后,网页制作就需要将所有的静态页面交给程序员,这时就需要告诉程序员那些文件主要包含什么内容。如果网页制作人员给文件目录和文件命名时是按照指定的规范命名的,那么程序员就只需要阅读一下文件目录命名规范就可以很轻松得找到自己想要的文件,相反就需要一个个的打开文件察看内容,这样必然会浪费很多时间。更加严重的是,这样会使得合作非常不愉快,导致开发小组不团结。
另外,网站分工的深入以及网络业的逐渐成熟,很多行业标准提了出来。比如网站广告条的尺寸、层叠样式表的使用等都有了一套比较规范的要求。
项目开发规范由项目主管结合开发小组其他成员的意见书写,要求尽可能的细致。主要包括:目录文件命名规范、网站Logo的设计规范、广告Banner的尺寸规范、字体使用规范、CSS书写规范、网页HTML代码书写规范、数据库设计规范等。
1.4.1目录文件命名规范
除了上面提到的任务交接的原因,网站管理员和开发小组之间的项目交接也是一个重要原因。由于往往不属于一家公司,交流起来就比较麻烦,如果没有遵循一定的开发规范,就会给后期网站的管理造成很多麻烦,甚至造成巨大经济损失。
为了减少这些麻烦,文件命名规范在开始前就要制定好。详细内容请参阅第七章 网站目录结构的确定。
1.4.2网站Logo的设计规范
网站图标(logo)是整个网站的视觉中心,也是整个网站内涵的集中体现。如何让logo看着美观大方,又能体现公司文化和行业特点,使设计师不可回避的问题。本书也给出了一些网站图标的设计思路,详细内容请参阅第三章 网站图标的制作。
1.4.3广告Banner的尺寸规范
网站建立起来后,往往需要在一些大网站上打广告,这样就需要制作广告Banner。另外由于需要在其他网站上显示广告条,还需要考虑大小问题。
作为网络广告提供商,他们一方面要保证你的Banner的显示效果,另一方面也不希望你的广告放上去后影响到他们网站风格的统一。为了解决这个矛盾,广告提供商一般按照标准大小预留广告条位置。
由于预留位置已经固定,因此我们在制作广告条时如果做得太大或者太小就会发生变形,变得很难看,因此必须遵循网上通用的尺寸规范制作各种类型的广告条,图1-4是最常见的468*60像素的广告条。
图1-4 468×60广告条
关于广告条的制作请参阅第四章 网站广告条的制作。
1.4.4字体使用规范
文字的使用非常广泛,标题、正文、装饰图片都要用到文字。文字到底有哪些字体、应该选用什么样的字库、在某个具体情况下应该用什么样的字体,这些都是困扰设计师的问题,这部分内容请参阅第三章 网站图标的制作。
1.4.5色彩管理规范
网站中无论是图片还是普通文本,都涉及到大量的色彩信息。如何管理这些信息以往是一件很复杂的工作,但在有了Macromedia studio MX之后,这些工作就比较轻松了。详细内容请参阅第六章 网站效果图的制作。
1.4.6 CSS样式表书写规范
CSS样式表包含了几乎所有的页面样式信息,利用它可以控制整个网站的风格。因此,一个规范的容易操作的样式表显然是十分重要的。如何让样式表尽可能的精炼、修改网站风格时工作量最小就成了一门很深的学问。详细内容请参阅第七章 使用CSS确定网站风格。
1.4.7网页HTML代码书写规范
HTML代码对于静态网页制作的人员来说已经不是什么问题了,因为除了少量的Javascript脚本之外,几乎所有的静态页面都可以用Macromedia MX制作出来。但是,对程序员来讲,不规范的HTML代码是致命的,因为他们需要找到插入动态服务器脚本的具体位置,垃圾代码往往会消耗他们非常多的时间。下面是两种显示效果完全一样但代码书写格式不同的两段代码。
欢迎访问新东方IT教育网上书城:::...欢迎访问新东方IT教育网上书城〉〉〉
这样的代码看起来是不是很清楚?
欢迎访问新东方IT教育网上书城:::...欢迎访问新东方IT教育网上书城:::...
这样的代码看起来累吗?
这两段代码显示的效果是完全一样的,但是给程序员的感觉是完全不一样的。如果所有的页面都是很不规范的代码,就会让程序员变得非常烦躁,严重影响开发情绪,进而波及到整个开发小组。
幸运的是,Macromedia Dreamweaver对HTML代码的生成实行了严格的控制。如果你避免了一些错误的操作,就完全可以避免垃圾代码的产生。而且,Dreamweaver还提供了清除垃圾代码的功能。
另外作为一个专业的网站,往往需要在网页代码中添加一些特殊的代码,如版权信息、搜索关键字、网站描述信息等。这些都可以通过Dreamweaver可视化工具添加到HTML源代码当中。详细内容请参阅第十七章 网站测试及常见问题。
1.4.10数据库设计规范
数据库是整个网站的核心,它能否高效率的输入输出数据,将决定着动态网站的反应速度。因此创建一个结构清晰完整、重复数据量小、垃圾数据少的数据库就成为网站创建过程中很重要的一环。
1.4.11 ASP代码书写规范
ASP虽然使用起来比较简单,但是它的功能已经比较完善,如果使用不当,给不法分子留下了空当,就可能会出现很多问题。而且ASP代码中涉及很多函数、变量,如何给他们合理的命名也是一个不容忽视的问题。
1.5网站形象设计
“爱美之心人皆有之”,网站做得不漂亮,要想在众多网站中脱颖而出恐怕是难于上青天。网站外观的好坏不仅影响到浏览者的回头率,更重要的是直接影响到公司的形象。由于目前电子商务还没有真正被大多数人所接受,很多人还持有怀疑态度,即使你的公司实力很强,但如果你的网站做的就像个不入流的个人网站,我想浏览者无论如何是不会去下订单的。原因很简单,一句话:我不信任你。
好的外观可以给浏览者带来好的心情。在舒适、优雅的氛围中,浏览者会很自然的去浏览你的网站,进而将商品放进“购物车”。
1.5.1收集资料
站点开发所需要的资料主要由客户提供,如果不足可以由网站编辑负责收集整理。这些资料包括照片、文字等。收集时一般先收集有关客户的资料,如是否有公司图标、公司经营情况、代表性商品等,因为美术设计的工作必须建立于这些素材之上。
随后网站编辑需要收集各种商品的信息,并将这些数据分门别类的录入商品数据库。在建立商品数据库时,由于采集商品照片的工作量很大,而照片的多少对开发进度并没有太大的影响,因此一般放在最后去收集。
除了收集工作之外,网站编辑还需要编写网站帮助系统和管理员使用手册。具体的工作责任和流程如图1-5所示。
图1-5 网站编辑工作流程
1.5.2构思草图
根据基本内容设计出页面的基本框架,应当尽可能的细化。图1-6是实例中首页和“关于我们”两个栏目页面的结构草图。这样的草图可以用铅笔直接在纸上去画,也可以用Fireworks在计算机上去画。我一般习惯于用计算机,因为修改起来很方便,可以节省大量的时间。
图1-6首页结构草图
1.5.3美术设计
页面设计当中有两个关键点,一个是网站图标,另一个是网站广告条。另外为了使页面更加美观,需要制作一些装饰性的图片,这部分主要由美工去完成。
网站logo
当开发规范和开发思路明确之后,就要开始设计网站了。首先由美工设计出网站的图标(logo)。标志的设计是整个网站的关键,它体现了一个公司的形象和文化底蕴,也是整个网站中使用频率最高的对象,因此标志设计的好坏直接关系到网站的形象。如图1-7和1-8是新东方学校、新东方IT教育的图标。
图1-7 新东方学校图标
图1-8新东方IT教育图标
图标设计需要注意很多方面的问题,图标的字体、颜色、大小都是设计师必须要考虑的问题。标志的设计主要分为构思、绘制草图、具体制作、优化输出等步骤。详细内容请参阅第三章 网站图标的制作。
广告Banner
广告条(banner)是推广网站和商品有力的工具。商业网站一般都会在页面顶部最醒目的位置上放置一个广告条用来宣传自己的商品。广告条一般都采用GIF动画,现在逐渐开始向Flash动画过渡,具体采用什么形式,可以根据广告条的复杂程度以及访问人群来决定。
如果动画情节很简单,可以采用GIF的格式,这样的动画完全可以用Fireworks来完成。由于Fireworks既可以制作图形、处理图像,又可以制作简单动画,文件无需重复导入和导出,因此用Fireworks来制作简单Banner动画是最理想的选择。这部分详细内容请参阅第四章 网站广告条的制作。
图1-9 网上GIF格式的广告条
相反,如果需要制作很复杂的动画,用GIF格式文件体积会很大,影响下载速度,这时可以考虑使用Flash动画文件格式,如图1-10所示就是Flash动画的一帧。它可以使文件体积很小,但是必须保证访问者的浏览器安装了flash播放器的插件。这部分内容请参阅第十四章 网站宣传动画的制作。
图1-11比较复杂的动画一般采用Flash格式
装饰性图片
只有文字、广告条、图标的页面多少会显得比较单薄,为了页面的美观,一般需要在页面中添加一些装饰性图片。比如将重要的内容如标题等用图片装饰起来,用图片填充空白区域等。这些图片都可以在Fireworks中制作出来,具体方法请参阅第五章 装饰性图片的制作。
页面效果图
当图标和广告条设计好后,基本上网站的基调就定下来了。这时我们可以根据策划时绘制的关键页草图用Fireworks制作出关键页面的效果图。这里说的关键页面指的是网站首页和第一级栏目页面。
这里你需要认真考虑的是如何美化网页的每个部分,并且保证整个页面看起来很完美和谐。也就是需要决定采用什么样的版式结构,采用什么样的配色等内容。这是整个网站开发中最难的部分。
一般比较大的项目,客户都要求制作单位拿出2-3套前台设计方案,也就是必须有2-3套效果图。效果图完成后,由项目主管把效果图交给客户审查,经客户签字认可后开始页面的制作。具体方法请参阅第六章 网站效果图的制作。
1.5.4静态网页制作
组织网站的目录结构
根据网站策划过程中确定的功能结构图,你需要决定建哪些一级栏目,每个栏目下还要不要分第二级栏目,二级栏目是否还要细分,每个栏目中应该有什么文件,每个文件里面具体应当有些什么内容,这些都应当事先规划好。
组织目录结构实际操作起来很简单,就是在站点中添加很多的文件夹,分别放上不同的文件。目录结构确定时一定要保证结构清晰、完整,方便查找文件。图1-12所示是实例网站的目录结构。
图1-12“新东方IT教育网上书城”网站目录结构
设计样页
这部分工作主要用Dreamweaver来完成,利用Dreamweaver我们可以完成这样几项重要的工作:
1、版式结构的实现;
2、图文的混排;
3、网站风格的确定——确定CSS样式表;
4、网页动态特效的添加;
针对不同网站,需要采用不同的版式,而表格是控制页面布局最好的工具,关于表格的使用请参阅第八章 表格的使用。
动态特效
用表格排好的页面中有了文字、图片或者flash动画,但有时候为了使页面有生气,还希望加上一些动态特效,比如想在页面中显示当前日期、图像的替换翻转、下拉菜单等。要做出这样的特效,我们需要在网页的代码中加入一些脚本语言,一般我们采用Javascript。利用这些脚本,可以将网页变得更加生动活泼。
但在dreamweaver中,我们一般不需要手写Javascript代码。大部分常见的特效都可以用Dreamweaver 制作出来。这时需要用到层、行为和时间线。这部分内容请参阅第十五章 给页面添加动态特效。
创建模板和库
仔细观察任何一家网站,就会发现同一个栏目下的页面中有很大一部分是完全相同的。由于这样的页面数量一般很大,修改时工作量也非常大,因此需要一种方法能批量创建和修改这种页面,这种方法就是模板。在Dreamweaver中,你可以将做好的页面保存成模板,然后从模板创建新的文件,就可以免掉很多重复性的劳动,而只需要做的不同的内容。更重要的是,当你修改模板时,所有使用过这个模板的页面都会自动更新,大大减小了工作量。
除了本栏中的页面大部分相同外,不同栏目之间也有很多相同的部分。比如本例中前台页面几乎所有的版权信息部分都是相同的,但其他部分并不相同。这个怎样保证他们能同步更新呢?
这时需要用到Dreamweaver中的另一个工具,那就是“库”。利用它可以保证小块内容相同的区域能够保证同步更新。
最后我们将所有的页面链接起来,这时整个网站才形成一个有机整体。
这部分内容请参阅第十三章 使用模板和库。
1.6动态编程
动态网站编程是整个网站的灵魂所在,正因为有了它,我们制作的所有页面才有了实际意义。动态编程我们在本书不作更深入地介绍。
1.7页面整合测试
网站完成之后,必须严把质量关,首先由小组内部人员从头至尾测试一遍,保证没有明显的错误。一般这时可以将网站挂在公司内部局域网中调试,由公司的网站测试人员检查是否符合客户要求,这部分内容请参见第十七章 网站测试及常见问题。
1.8发布与验收
当测试确认没有什么问题后,联系客户的网络工程师和系统管理员,将本机上站点文件通过FTP传到对方的网站服务器上去,一般三个月内是试用期。试用期中很重要的工作就是培训客户的系统管理员。培训手册由项目主管结合所有开发人员的技术文档书写,将网站后期可能出现的问题作出详尽的说明。
试用期内开发小组至少要保留项目主管,其他人员特别是网页制作、网站程序员这段时间内也必须做到随叫随到,因为客户可能会在发现问题后要求调整网站内容或者功能细节。
试用期结束后,项目符合客户要求,将举行验收仪式。在仪式上,项目主管需要将整个项目的功能特点、技术细节汇报给客户,并进行项目的交接。客户在项目验收协议上签字后,项目正式交接完毕。同时,客户需要将所有开发费用一并结清。对于开发小组而言,一般项目到此结束,剩下的就是技术支持等后期服务了。
1.9网站的宣传与维护
但对于客户而言,还需要认真考虑采用怎样的方式来宣传网站。一般可以根据访问者的性别、年龄、居住地区、生活习惯以及收入等情况决定宣传网站的方式。其中注册搜索引擎、广告条、友情链接等是最常见的方法。
当网站发布之后,系统管理员(网管)还有很多的事情要做,如检查整个网站是否有断链,是否有损坏的文件,更新维护站点内容等等。
关于网站的宣传、后期维护等内容请参阅第十八章 网站管理常见任务。
1.10项目总结
对于网站开发小组而言,项目结束后要及时总结开发过程中的成功与不足,将开发过程中产生的重要成果整理出来,转化为下一轮开发的生产力,比如程序模块化等。
当然如果网站运行了很长时间之后,技术上可能又落后了,这时客户必然需要升级网站,这是我们又可以开始网站的开发了。事实上网站开发就是一个循环往复的过程。正因为如此,网页设计师才有了生存的空间,这个职业才得以持续存在。
小结:
其实一个专业网站的开发比这里讲的可能还要复杂,往往需要消耗大量的人力、物力、财力。在所有的流程当中,对于多媒体网页设计师而言最为重要的就是美术设计和网页制作部分,这些往往需要花费大量的时间,具体而言就是制作和设计网站上用到的图片、Flash动画,设计和制作好所有的静态页面。
PAGE
18(共9张PPT)
卷首语·
银杏情结
等待梦开启
酿出新的季节
细数每一份金色的誓约
收藏每一季落叶
——银杏影中
有你有我
蒋超
刘梦洁
樊熙
张梦頔
组长:周雪瑶
附中360。
我喜欢
看这些景色旋转
这些时候我能感受到
我的附中
真真切切地
就在我身边…
我喜欢飞翔的瞬间
我的身体腾空仰起
挣脱了一切束缚
这一步的终点
似乎就是无限远的天边
梦见一片绿荫
叶片缝隙里的天空
缤纷蓝绿 在风声中摆动
荡漾的心情和歌
写满了我的扉页
多少个夜晚
当同学们都走干的时候
橙黄色的灯光
静静的散发着
回忆白天校园里的欢声笑语
眷顾这一方深挚的风景
这里遍布
我们的脚印
昨天和今天的笑颜
就停在那里
让我在一个清晨走遍
这是我们的舞台
这是我们的时代
雀跃着初绽的青春
是最耀眼的色彩
报告老师
还没做完
谢谢
我眼中的北大附中
闲云柱
歌息的
在重验
相心普通高中技术领域课程标准
(信息技术部分)
一、课程的基本理念
(一) 提高信息素养,培养信息时代的合格公民
信息素养是信息时代公民必备的素养。高中信息技术课程以义务教育阶段课程为基础,以进一步提高学生的信息素养为宗旨,强调通过合作解决实际问题,让学生在信息的获取、加工、管理、表达与交流的过程中,掌握信息技术,感受信息文化,增强信息意识,内化信息伦理,使高中学生发展为适应信息时代要求的具有良好信息素养的公民。
(二) 营造良好的信息环境,打造终身学台
以高中信息技术课程的开设为契机,充分调动家庭、学校、社区等各方力量,整合教育资源,为高中学生提供必备的软硬件条件和积极健康的信息内容,营造良好的信息氛围;既关注当前的学习,更重视可持续发展,为学生打造终身学台。
(三) 关注全体学生,建设有特色的信息技术课程
充分考虑高中学生起点水平及个性方面的差异,强调学生在学习过程中的自主选择和自我设计;提倡通过课程内容的合理延伸或拓展,充分挖掘学生的潜力,实现学生个性化发展;关注不同地区发展的不均衡性,在达到“课程标准”的前提下,鼓励因地制宜、特色发展。
(四) 培养解决问题的能力,倡导运用信息技术进行创新实践
高中信息技术课程强调结合高中学生的生活和学习实际设计问题,让学生在活动过程中掌握应用信息技术解决问题的思想和方法;鼓励学生将所学的信息技术积极地应用到生产、生活乃至信息技术革新等各项实践活动中去,在实践中创新,在创新中实践。
(五) 注重交流与合作,共同建构健康的信息文化
高中信息技术课程鼓励高中学生结合生活和学习实际,运用合适的信息技术,恰当地表达自己的思想,进行广泛的交流与合作,在此过程中共享思路、激发灵感、反思自我、增进友谊,共同建构健康的信息文化。
二、课程设计思路
(一) 课程设计思路与模块结构
随着社会信息化的发展,信息素养日益成为信息社会公民素养不可或缺的组成部分。信息技术教育已经超越了单纯的计算机技术训练阶段,发展成为与信息社会人才需求相适应的信息素养教育。因此,高中信息技术课程的设计体现如下三个特点:第一,信息技术应用能力与人文素养培养相融合的课程目标;第二,符合学生身心发展需求的课程内容;第三,有利于所有学生全面发展与个性发展的课程结构形式。
高中信息技术课程包括必修与选修两个部分,共六个模块,每个模块2学分。必修部分只有“信息技术基础”一个模块,2学分。它与九年义务教育阶段相衔接,是信息素养培养的基础,是学习后续选修模块的前提。该模块以信息处理与交流、信息技术与社会实践为主线,强调让学生掌握信息的获取、加工、管理、表达与交流的基本方法,在应用信息技术解决日常学习、生活中的实际问题的基础上,通过亲身体验与理性建构相结合的过程,感受并认识当前社会信息文化的形态及其内涵,理解信息技术对社会发展的影响,构建与社会发展相适应的价值观和责任感。建议该模块在高中一年级第一学期开设。
信息技术科目的选修部分包括“选修1:算法与程序设计”“选修2:多媒体技术应用”“选修3:网络技术应用”“选修4:数据管理技术”和“选修5:人工智能初步”五个模块,每个模块2学分。选修部分强调在必修模块的基础上关注技术能力与人文素养的双重建构,是信息素养培养的继续,是支持个性发展的平台。模块内容设计既注重技术深度和广度的把握,适度反映前沿进展,又关注技术文化与信息文化理念的表达。在选修部分的五个模块中“算法与程序设计”是作为计算机应用的技术基础设置的;“多媒体技术应用”“网络技术应用”“数据管理技术”是作为一般信息技术应用设置的;“人工智能初步”是作为智能信息处理技术专题设置的。为增强课程选择的自由度,五个选修模块并行设计,相对独立。各选修模块的开设条件有所不同,各学校至少应开设“算法与程序设计”“多媒体技术应用”“网络技术应用”“数据管理技术”中的两个,也要制定规划,逐步克服经费、师资、场地、设备等因素的制约,开出包括“人工智能初步”在内的所有选修模块,为学生提供更丰富的选择。建议将选修模块安排在高中一年级第二学期或以后开设。其中“算法与程序设计”模块与数学课程中的部分内容相衔接,应在高中二年级第一学期或以后开设。
信息技术的部分相关内容安排在“通用技术”科目中,如在其必修模块“技术与设计II”中设置有“控制与设计”主题,在选修部分设置有“电子控制技术”和“简易机器人制作”两个模块。
针对确能代表信息技术发展趋势,但对条件要求较高,不宜在国家课程中硬性规定的内容,允许自行开发相应的地方课程或者校本课程。学校还要善于发现确有信息技术天赋和特长的学生,并给予专门的培养。
应维持学生较长的信息技术学习历程,以保证学习的有效性。如果学生仅修4个学分,建议分布在两个学年里完成。例如,高中一年级第一学期完成必修模块,高中二年级第一学期完成一个选修模块。
信息技术课程各模块之间的关系结构如下图:
(二)关于学业的认定
修满4学分是取得高中毕业资格的最低要求,其中必修2学分,选修2学分。建议有兴趣、有潜能的高中学生再加修若干学分,为今后发展创造条件。
(三)标准体例说明
高中信息技术课程标准的撰写,采用“内容标准”“例子”“活动建议”相结合的形式。其中内容标准是主体,例子是对内容的进一步解释,活动建议是对教学活动方式的建议和引导。
内容标准的撰写,首先坚持灵活性,既给出每一部分的基本要求,又给教材编写、教学活动和工具的选用等留有多样化的发挥空间;其次注重时效性,以保证在本标准实施期间对信息技术教学具有持续的指导意义。
例子是对内容标准的提示,是对内容标准的进一步解释和具体说明,考虑到课程标准灵活性与时效性的要求,有些内容标准的描述比较概括,所以通过例子对其进行提示和解释。但例子仅仅是提示,不是内容标准的具体规定。另外,例子中内容的时效性往往较差,但例子中的思想和方法可以举一反三,长期生效。
活动建议用于启发和引导教学活动的实施。
(四)学习目标要求与行为动词
为帮助理解,下表列出了标准中使用的行为动词及对应的学习目标和掌握水平:
各水平的要求 内容标准中使用的行为动词
知识性目标 低高 了解水平再认或回忆事实性知识;识别、辨认事实或证据;列举属于某一概念的例子;描述对象的基本特征等 描述、列举、列出、了解、熟悉
理解水平把握事物之间的内在逻辑联系;在新旧知识之间建立联系;进行解释、推断、区分、扩展;提供证据;收集、整理信息等 解释、比较、检索、知道、识别、理解、调查
迁移应用水平归纳、总结规律和原理;将学到的概念、原理和方法应用到新的问题情境中;建立不同情境之间的合理联系等 分析、设计、制订、评价、探讨、总结、研究、选用、选择、学会、画出、适应、自学、发现、归纳、确定、判断
技能性目标 低高 模仿水平在原型示范和他人指导下完成操作 尝试、模仿、访问、解剖、使用、运行、演示、调试
独立操作水平独立完成操作;在评价和鉴别基础上的调整与改进;与已有技能建立联系等 获取、加工、管理、表达、发布、交流、运用、使用、制作、操作、搭建、安装、开发、实现
熟练操作水平根据需要评价、选择并熟练操作技术和工具 熟练操作、熟练使用、有效使用、合乎规范地使用、创作
情感性目标 低高 经历(感受)水平从事并经历一项活动的全过程,获得感性认识 亲历、体验、感受、交流、讨论、观察、(实地)考察、参观
反应(认同)水平在经历基础上获得并表达感受、态度和价值判断;做出相应的反应等 关注、借鉴、欣赏
领悟(内化)水平建立稳定的态度、一贯的行为习惯和良好的价值观等 形成、养成、确立、树立、构建、增强、提升、保持
三、课程目标
普通高中信息技术课程的总目标是提升学生的信息素养。学生的信息素养表现在:对信息的获取、加工、管理、表达与交流的能力;对信息及信息活动的过程、方法、结果进行评价的能力;发表观点、交流思想、开展合作与解决学习和生活中实际问题的能力;遵守相关的伦理道德与法律法规,形成与信息社会相适应的价值观和责任感。可以归纳为以下三个方面。
(一) 知识与技能
1. 理解信息及信息技术的概念与特征,了解利用信息技术获取、加工、管理、表达与交流信息的基本工作原理,了解信息技术的发展趋势。
2. 能熟练地使用常用信息技术工具,初步形成自主学习信息技术的能力,能适应信息技术的发展变化。
(二) 过程与方法
3. 能从日常生活、学习中发现或归纳需要利用信息和信息技术解决的问题,能通过问题分析确定信息需求。
4. 能根据任务的要求,确定所需信息的类型和来源,能评价信息的真实性、准确性和相关性。
5. 能选择合适的信息技术进行有效的信息采集、存储和管理。
6. 能采用适当的工具和方式呈现信息、发表观点、交流思想、开展合作。
7. 能熟练运用信息技术,通过有计划的、合理的信息加工进行创造性探索或解决实际问题,如辅助其他学科学习、完成信息作品等。
8. 能对自己和他人的信息活动过程和结果进行评价,能归纳利用信息技术解决问题的基本思想方法。
(三) 情感态度与价值观
9. 体验信息技术蕴含的文化内涵,激发和保持对信息技术的求知欲,形成积极主动地学习和使用信息技术、参与信息活动的态度。
10. 能辩证地认识信息技术对社会发展、科技进步和日常生活学习的影响。
11. 能理解并遵守与信息活动相关的伦理道德与法律法规,负责任地、安全地、健康地使用信息技术。
上述三个层面的目标相互渗透、有机联系,共同构成高中信息技术课程的培养目标。在具体的教学活动中,要引导学生在学习和使用信息技术、参与信息活动的过程中,实现知识与技能、过程与方法、情感态度与价值观等不同层面信息素养的综合提升和协调发展,不能人为地割裂三者之间的关系或通过相互孤立的活动分别培养。
四、内容标准
(一)必修课程
信息技术基础
“信息技术基础”以信息处理与交流为主线,围绕学生的学习与生活需求,强调信息技术与社会实践的相互作用。本模块是高中学生信息素养提升的基础,也是学习各选修模块的前提,具有普遍价值,为必修模块。
通过本模块的学习,学生应该掌握信息的获取、加工、管理、表达与交流的基本方法;能够根据需要选择适当的信息技术交流思想,开展合作,解决日常生活、学习中的实际问题;理解信息技术对社会发展的影响,明确社会成员应承担的责任,形成与信息化社会相适应的价值观。
本模块的教学要强调在信息技术应用基础上信息素养的提升;要面向学生的日常学习与生活,让学生在亲身体验中培养信息素养。
本模块由4个主题组成,结构如下:
(一)信息获取
1.内容标准
(1)描述信息的基本特征,列举信息技术的应用实例,了解信息技术的历史和发展趋势。
例 烽火台、信函、电报电话、广播电视、计算机网络代表着信息传播技术发展的不同阶段。
(2)知道信息来源的多样性及其实际意义;学会根据问题确定信息需求和信息来源,并选择适当的方法获取信息。
(3)掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。
(4)掌握信息价值判断的基本方法,学会鉴别与评价信息。
2.活动建议
信息技术使人们能在最短的时间里(甚至是同步)了解到世界各地发生的事情。比如在因特网上,天气信息可以随着气象台的预报同步更新,但并不是所有做天气预报的网站都充分利用了这个优势。试就这个专题展开调查,了解相关网站上的天气预报情况,就其更新速度、准确性(与实际情况相比较)等指标进行统计和分析,寻找更新最及时和最可信赖的天气预报网站。
(二)信息加工与表达
1.内容标准
(1)能够根据任务需求,熟练使用文字处理、图表处理等工具软件加工信息,表达意图;选择恰当的工具软件处理多媒体信息,呈现主题,表达创意。
例 可使用多媒体素材加工软件、多媒体著作软件、网页制作软件等处理多媒体信息。
(2)合乎规范地使用网络等媒介发布信息、表达思想。
(3)初步掌握用计算机进行信息处理的几种基本方法,认识其工作过程与基本特征。
(4)通过部分智能信息处理工具软件的使用,体验其基本工作过程,了解其实际应用价值。
例1 模式识别类:光学字符识别(OCR)、手写汉字输入、语音汉字输入等。
例2 自然语言识别类:自然语言对话与机器翻译等。
2.活动建议
(1)使用计算机解决实际问题的方法是多种多样的,除可使用文字处理、图表处理或加工软件进行信息处理以外,直接使用计算机程序解决实际问题也是一个基本方法。教师可以演示并解剖一段实用的计算机程序实例,也可以根据具体情况,让学生使用一种高级语言编程工具解决一个简单问题。
(2)使用双向翻译软件,先将一段英文短文翻译成中文,然后将该中文内容再次翻译成英文,考察机器翻译的准确性,讨论机器翻译的优缺点。
(3)访问一个自然语言处理网站如:http://www-ai.ijs.si/eliza/eliza.html或http://alice./live.html,用自然语言与其中的机器人对话,通过寻找其“谈话”的破绽,讨论当前使用计算机理解自然语言的局限性。
(三)信息资源管理
1.内容标准
(1)通过实际操作或实地考察,了解当前常见的信息资源管理的目的与方法,描述各种方法的特点,分析其合理性。
例1 个人藏书、图书馆藏书、音像资料、因特网信息等都是信息资源,都需要管理。
例2 实施教学信息资源管理的目的:提高教学资源利用率,提高教学效率与质量等。
(2)通过使用常见的数据库应用系统,感受利用数据库存储、管理大量数据并实现高效检索方面的优势。
(3)通过对简单数据库的解剖分析,了解使用数据库管理信息的基本思想与方法。
2.活动建议
(1)在教师的引导下,选择一个与课程学习有关的专题,分组讨论建立数据库的方法,设计建立数据库的方案。可根据实际情况,适度参加学校教学资源库建设。
(2)访问某个在线数据库,譬如“科学数据库”(http://www.sdb.ac.cn/),就某一个主题进行查询,如“眼睛与视力”,并对查询资料进行统计和分析,就资料的准确性、丰富性、权威性等进行讨论。
(四)信息技术与社会
1.内容标准
(1)探讨信息技术对社会发展、科技进步以及个人生活与学习的影响。
例1 利用因特网等多种信息渠道进行调查,制定蔬菜新品种引进计划。
例2 E-mail方便了人们的沟通与交流,但垃圾邮件又给人们带来困扰。
(2)能利用现代信息交流渠道广泛地开展合作,解决学习和生活中的问题。
(3)增强自觉遵守与信息活动相关的法律法规的意识,负责任地参与信息实践。
(4)在使用因特网的过程中,认识网络使用规范和有关伦理道德的基本内涵;能够识别并抵制不良信息;树立网络交流中的安全意识。
(5)树立信息安全意识,学会病毒防范、信息保护的基本方法;了解计算机犯罪的危害性,养成安全的信息活动习惯。
(6)了解信息技术可能带来的不利于身心健康的因素,养成健康使用信息技术的习惯。
例1 青少年长期沉溺于网络容易诱发实际生活中的社交恐惧症。
例2 长时间凝视监视器屏幕容易导致眼睛疲劳,影响健康。
2.活动建议
(1)假定学校要为学生开设网上讨论区,需要制订一份守则规范大家的行为。根据本校的实际情况,展开调研并撰写这个守则。
(2)有一幅著名漫画,题目为“在因特网上没有人知道你是一条狗”;又有人撰文说“别以为你是一条隐藏很深的狗”。组织学生讨论:网络中的匿名化活动带来哪些新的伦理问题。
(3)从传播结构上看,电话是点对点的信息传播网,广播电视是点对面的信息传播网,计算机网络是点/面对点/面的信息传播网。结合具体实例,讨论信息传播结构的不同及其对社会生活的影响。
(二)选修课程
选修1:算法与程序设计
本模块旨在使学生进一步体验算法思想,了解算法和程序设计在解决问题过程中的地位和作用;能从简单问题出发,设计解决问题的算法,并能初步使用一种程序设计语言编制程序实现算法解决问题。本模块为选修模块。
本模块的教学,应注意与数学课程中有关内容的衔接,要强调理论与实践的结合,引导学生注意寻找、发现身边的实际问题,进而设计出算法和计算机程序去解决这些问题。教师要注意发现对程序设计有特殊才能的学生,根据具体情况为他们提供充分的发展空间。本模块强调的是通过算法与程序设计解决实际问题的方法,对程序设计语言的选择不作具体规定。
本模块由3个主题组成,结构如下:
(一)计算机解决问题的基本过程
1.内容标准
(1)结合实例,经历分析问题、确定算法、编程求解等用计算机解决问题的基本过程,认识算法和程序设计在其中的地位和作用。
(2)经历用自然语言、流程图或伪代码等方法描述算法的过程。
(3)在使用计算机解决实际问题的过程中,通过观看演示、模仿、探究、实践等环节,了解顺序、选择、循环三种基本结构及其重要作用,掌握计算机程序的基本概念,能解释计算机程序执行的基本过程。
(4)了解程序设计语言、编辑程序、编译程序、连接程序以及程序开发环境等基本知识。
2.活动建议
有专家认为,对于能够借助计算机技术来解决的问题,可以按照其结构化程度划分成三个类型:结构化问题,是能够通过形式化(或称公式化)方法描述和求解的一类问题;非结构化问题,难以用确定的形式来描述,主要根据经验来求解;半结构化问题,介于上述两者之间。请依照该思路,调查结构化问题的实例,并归纳解决此类问题的一般规律。
(二)程序设计语言初步
1.内容标准
(1)理解并掌握一种程序设计语言的基本知识,包括语句、数据类型、变量、常量、表达式、函数。会使用程序设计语言实现顺序、选择、循环三种控制结构。
例1 顺序结构:一列火车在某地时的速度为V0 = 40 km/h,以加速度a = 1.5 m/s2加速行驶,求2分钟后的速度V和距开始点的距离S。
例2 选择结构:某商场为了对苹果进行促销,规定购买2公斤以上可以在原价每公斤1.5元的基础上打8折。请设计一个程序计算购买x公斤苹果的应付款。
例3 循环结构:为校园歌手大赛设计一个评分程序,10名评委,去掉一个最高分、一个最低分,计算平均分。
(2)理解模块化程序设计的基本思想,初步掌握其基本方法。
(3)初步掌握调试、运行程序的方法。
(4)在使用某种面向对象程序设计语言解决问题的过程中,掌握面向对象程序设计语言的基本思想与方法,熟悉对象、属性、事件、事件驱动等概念并学会运用。
(5)能够说出程序设计语言产生、发展的历史与过程,能够解释其意义。
2.活动建议
(1)选择实例,根据解决问题的要求分析设计算法,恰当地使用三种控制结构编写源程序,调试并运行该程序,在过程中体验程序设计语言的逻辑特点。
(2)分别就模块化程序设计的思想与方法、面向对象的程序设计语言的思想与方法展开讨论,展望计算机程序设计的发展趋势。
(三)算法与问题解决例举
1. 内容标准
A 解析法与问题解决
(1)了解解析法的基本概念及用解析法设计算法的基本过程。
(2)能够用解析法分析简单问题,设计算法,编写程序求解问题。
例1 使用一根长度为L厘米的铁丝,制作一个面积为S的矩形框,要求计算出满足这种条件的矩形的高h和宽w。(本例问题可以归结成求一元二次方程的根)
例2 计算从y1年m1月d1日起,到y2年m2月d2日之间的天数。
B 穷举法与问题解决
(1)了解穷举法的基本概念及用穷举法设计算法的基本过程。
(2)能够根据具体问题的要求,使用穷举法设计算法,编写程序求解问题。
例1 一张单据上有一个5位数的号码,其中百位数和千位数已模糊不清,但知道该数能被57或67除尽。设计一个算法,找出该单据原有可能的号码。
例2 在一个直角三角形中,三条边a、b、c的长度都为整数,且一条直角边a的长度已确定,斜边c的长度不能超过某数I,找出满足条件的所有直角三角形。
C 查找、排序与问题解决
(1)了解数组的概念,掌握使用数组存储批量数据的基本方法。
(2)通过实例,掌握使用数据查找算法设计程序解决问题的方法。
例 使用顺序查找算法和对分查找算法查找校运动会上某个班级或者某个运动员的比赛成绩。
(3)通过实例,掌握使用排序算法设计程序解决问题的方法。
例 设计一个程序,按照选择交换法,把学校运动会比赛成绩(无序)按降序排序后存储。
D 递归法与问题解决
(1)了解使用递归法设计算法的基本过程。
(2)能够根据具体问题的要求,使用递归法设计算法、编写递归函数、编写程序、求解问题。
例1 写出两个正整数乘积m×n的递归函数。
例2 汉诺塔问题:传说在古代印度的贝拿勒斯圣庙里,安放了一块黄铜板,板上插了三根宝石柱,在其中一根宝石柱上,自上而下按由小到大的顺序串有64个金盘。这就是汉诺塔游戏。要求将左边柱子上的64个金盘按照下面的规则移到右边的柱子上。
规则:
a) 一次只能移一个盘子。
b) 盘子只能在三个柱子上存放。
c) 任何时候大盘不能放在小盘上面。
2.活动建议
(1)从其他科目的学习或者生活实际中选择问题,确定解决该问题所需要的算法和计算公式,用流程图描述问题的计算过程,编写程序,调试并运行该程序,获得问题的答案,并讨论该问题解决过程与所得答案的特点。
(2)在已学知识的基础上,通过教师指导以及自主调查,更多地了解常用算法,探讨待解决的问题与算法之间的关系,尝试归纳算法与程序设计应用的一般规律,讨论使用计算机程序设计解决问题的优势和局限性。
选修2:多媒体技术应用
多媒体技术的应用,在改善人机交互效果、提高信息交流效率、促进合作方面具有十分重要的作用。针对多媒体技术在生活中的实际应用而设置的“多媒体技术应用”是选修模块。
通过本模块的学习,学生应该在亲身体验的过程中认识多媒体技术对人类生活、社会发展的影响;学会对不同来源的媒体素材进行甄别和选择;初步了解多媒体信息采集、加工原理,掌握应用多媒体技术促进交流并解决实际问题的思想与方法;初步具备根据主题表达的要求,规划、设计与制作多媒体作品的能力。
本模块教学要密切结合学生学习与生活的实际,注重利用多媒体表现创意、表达思想,实现直观有效的交流。
本模块由3个主题组成,结构如下:
(一)多媒体技术与社会生活
1.内容标准
(1)能够说出多媒体技术的现状与发展趋势,关注多媒体技术对人们的学习、工作、生活的影响。
(2)通过调查和案例分析,了解多媒体在技术数字化信息环境中的普遍性。
例 PC机上基于图形用户界面的操作系统就是一个多媒体产品。
(3)通过网络浏览、使用多媒体软件或阅读相关资料,体验和认识利用多媒体技术呈现信息、交流思想的生动性和有效性。
例1 改变网络浏览器的多媒体支持属性设置,观察并体会改变前后的使用效果。
例2 对同一组数据,分别采用电子数表与饼形图、柱状图等形式表示,比较其表达效果的差异。
(4)体验并了解多媒体作品的集成性、交互性等特征。
2.活动建议
(1)通过阅读资料、网络浏览或参观多媒体技术产品展览等途径,在自己感兴趣的多媒体技术应用领域(如教育、商业、医疗、军事、新闻出版、娱乐等)选定一个主题(如阅读、电脑、风筝、足球等),就多媒体技术的应用现状和发展趋势,多媒体技术对人们学习、工作、生活等方面的影响进行归纳与分析,将结果制作成演示文稿在小组或班级内交流。
(2)多媒体技术在宣传、广告等方面有很好的呈现效果,但另一方面,多媒体信息的泛滥也给人们带来诸多麻烦。试分析网络浏览时“无用”信息对感官的干扰以及对注意力的强占等负面作用。在此基础上,就“读图时代”“眼球经济”等概念与多媒体技术应用之间的关系问题开展讨论。
(二)多媒体信息采集与加工
1.内容标准
(1)了解常见的多种媒体信息如声音、图形、图像、动画、视频的类型、格式及其存储、呈现和传递的基本特征与基本方法。
例1 不同种类的计算机动画具有不同的构成要素和表达特点。
例2 流媒体在信息传输方面具有较强的优势。
(2)能选择适当的工具,分别对声音、图形、图像、动画、视频等信息进行采集;能解释多媒体信息采集的基本工作思想。
例1 通过麦克风录制声音并存储为声音文件,分析声音采样、编码的简单原理。
例2 从多媒体光盘或因特网上获取视频文件,或利用视频抓图软件捕捉屏幕上的视频片断并存为AVI格式的视频文件。
(3)能根据信息呈现需求,选择适当的工具和方法,分别对声音、图形、图像、动画、视频等多种媒体信息进行适当的处理。
2.活动建议
通过实例分析,研讨多媒体信息存储、呈现与传递的特点,总结不同的媒体信息对表现主题、表达思想的作用;分析合理选择与恰当运用不同类型的媒体,对表现主题、传递信息所产生的影响。
(三)多媒体信息表达与交流
1.内容标准
(1)通过网络浏览、软件使用和资料阅读,理解多媒体技术是人类在信息社会中表达思想、实现交流的一种有效技术。
例 以不同方式组织文本、声音、图片、动画乃至视频等不同类型的信息,可以适用于不同的表达与交流任务。
(2)通过案例分析,了解从问题解决的需要出发,规划、设计、制作多媒体作品的一般方法。
(3)学会使用非线性方式组织多媒体信息。
(4)能根据表达、交流或创造的需要,选择适当的媒体和多媒体编辑或集成工具完成多媒体作品,实现表达意图,并能够对创作过程与结果进行评价。
(5)能使用一种常用的工具制作简单的虚拟现实作品,并能描述其基本特点。
例 使用全景环视工具制作一个简单的作品。
(6)通过评价与鉴赏他人的多媒体作品,体验其创作思想,明了其中所蕴含的意义。
2.活动建议
设计并制作一个多媒体作品,例如“可爱的家乡”“保护水资源”等等。采用小组合作方式确定主题、规划内容、选择媒体、策划创意、设计信息呈现方式,完成作品。在班级或年级内展示,相互交流、共同欣赏。
选修3:网络技术应用
“网络技术应用”模块介绍网络的基本功能和因特网的主要应用,是选修模块。
通过本模块的学习,学生应掌握网络的基础知识和基本应用技能;掌握网站设计、制作的基本技术与评价方法;体验网络给人们的生活、学习带来的变化。
本模块的教学,要注重激发学生对网络技术和参与创造性活动的兴趣;要结合实际条件,把网络技术基础知识和基本技能整合到学生的日常学习和生活中去,避免技术与应用、理论与实践相脱节;要充分展示网络技术发展的指导思想,展示网络技术与现代社会生活的相互作用。
本模块由3个主题组成,结构如下:
(一)因特网应用
1.内容标准
(1)通过使用因特网,了解因特网服务的基本类型、特点与应用领域;了解因特网服务组织的类型、提供的服务与服务特点。
例1 因特网服务通过信息交流、信息获取、资源共享等功能来实现。
例2 因特网服务的应用领域包括:电子商务、远程医疗、远程教育、网上娱乐等。
例3 ASP(应用服务提供商)和ISP(因特网接入服务商)有不同的服务内容和服务特点。
(2)通过尝试与分析,了解因特网信息检索工具的类型与特点;知道搜索引擎、元搜索引擎(又称集成搜索引擎)等因特网信息检索工具的产生背景、工作原理与发展趋势;掌握常用因特网信息检索工具的使用方法,能熟练使用检索工具获取所需信息。
(3)通过使用或演示,了解与人们学习、生活密切相关的因特网应用技术的基本使用方法,初步了解其基本工作思想。
例1 基于流媒体的因特网音频、视频技术目前已经广泛应用于远程教育、网上娱乐等方面。
例2 ICQ不仅可用于网络寻呼,还有聊天、文件传输等功能。
(4)能够根据实际需求选择恰当的方式方法,利用因特网获取所需信息、实现信息交流;体验因特网在跨时空、跨文化交流中的优势,分析其局限性。
例 因特网较好地支持了人们的交流,但语言壁垒对网上跨文化交流有阻碍作用。
2.活动建议
以小组为单位,通过网络浏览,了解不同类型网站(如政府网站、商业网站、教育网站、新闻网站、娱乐网站等)在内容、呈现方式以及所发挥作用等方面的差别。进一步就某一类因特网服务的一个专题进行网络调查研究,如浏览商业网站,就因特网在商务活动中的应用价值、存在的问题与发展前景开展调查和讨论。
(二)网络技术基础
1.内容标准
(1)了解计算机网络的主要功能、分类与拓扑结构。
(2)理解网络协议的基本概念,能描述网络的开放系统互联协议(OSI)分层模型的基本思想,能描述因特网TCP/IP协议的基本概念、思想与功能。
例 了解因特网协议IPv6的产生背景,比较IPv6与IPv4的优劣。
(3)能列举并解释网络通信中常用的信息交换技术及其用途。
例 IP电话采用的是分组交换技术,传统电话采用的是电路交换技术。
(4)能描述浏览器/服务器(B/S)结构、客户机/服务器(C/S)结构的概念与特点。
(5)理解IP地址的格式与分类;知道域名的概念和域名解释的基本过程。
(6)知道因特网IP地址、域名的管理办法及相应的重要管理机构。
例1 中国互联网信息中心的主要任务包括注册服务(域名注册、IP地址分配等)、目录数据库服务、信息服务、网站访问流量认证等。
例2 国际性的因特网组织包括因特网协会(Internet Society, 简称ISOC,网址http://www.isoc.org/)、因特网域名与地址管理机构(Internet Corporation for Assigned Names and Numbers,简称ICANN,网址http://www.icann.org/,中文相关网址http://www.icann./),它们都是非盈利的因特网管理与服务机构。
(7)通过实地考察,了解小型局域网的构建方法与使用方法;知道网络服务器的主要作用与基本原理;能说出代理服务器的概念并知道其作用。
2.活动建议
(1)选择校园网或当地的计算机网络系统,画出网络拓扑图,对该网络应用情况进行调查,并就如何进一步提高网络使用效率展开讨论。
(2)有条件的学校可以让学生分组合作搭建简单的局域网,安装代理服务器软件,使多台计算机同时联入因特网。
(三)网站设计与评价
1.内容标准
(1)知道WWW、网页、主页、网站的基本概念及其相互关系。
(2)理解动态网页的概念,能解释其工作过程。
(3)能够根据表达任务的需求,使用常用的网页制作软件制作与发布动态网页。
(4)通过开发实践,学会规划、设计、制作、发布与管理简单网站的基本方法。
(5)能够根据网站主题要求设计评价指标,对常见网站的建设质量与运行状况进行评价。
2.活动建议
对于给定的主题,以小组合作方式制订网站开发计划、设计网页结构、确定制作方案,并通过比较与评价,选出最佳方案,根据方案完成网站建设。例如,围绕“家乡旅游资源”或者其他科目学习的主题进行网站设计。
选修4:数据管理技术
数据管理技术已经在各个领域得到应用,广泛地渗透到人们的社会生活之中。本模块是针对数据管理技术应用而设置的选修模块。
通过本模块的学习,学生应该掌握数据管理的基础知识和数据库设计的一般方法,学会使用大型专业数据库,初步学会使用数据库技术管理信息,处理日常学习与生活中的问题,体验并认识数据管理技术对人类社会生活的重要影响。
本模块的教学,要突出对数据库技术中“关系”这一核心特征的理解,着眼于数据管理技术在实际生活和学习中的应用,关注相关技术的发展趋势。在具体教学活动中,可以根据实际情况选择介绍一种常用的数据库管理系统。
本模块由3个主题组成,结构如下:
(一)数据管理基本知识
1.内容标准
(1)知道数据管理技术的基本概念,能说出数据管理技术的产生历史与发展趋势。
(2)能够使用现有数据库辅助学习,开展专题研究。
例 可以借助“国民体质与营养数据库”(http://www.infh.ac.cn/),了解我国不同地区青少年的体质与营养现状。
(3)掌握关系数据库中的库、表、字段、记录等概念,理解“关系”所表达的含义。
(4)通过调查与实例分析,了解数据库在多媒体和网络方面的应用方法与应用价值。
2.活动建议
(1)通过参观或使用各种数据库应用系统(如图书馆图书查询系统、医院管理系统、全国联网火车售票系统等),分析其中基本数据的组织结构特点。
(2)以小组为单位,每组确定一个研讨专题,如“珍稀动物保护”,通过上网或其他途径查找相关数据库,写出专题报告。
(二)数据库的建立、使用与维护
1.内容标准
(1)通过实例分析,初步掌握数据收集、数据分类和建立关系数据模型的基本方法。学会使用实体—关系图描述关系数据模型。
(2)熟悉一个数据库管理系统软件;掌握建立数据库结构、添加数据和编辑数据库的常用方法。
例1 建立某旅游景点基本情况的数据库。
例2 调查本班同学的基本信息,设计“本班同学基本信息数据库”的结构,确定其中的字段、记录等信息,并以表格的形式表示出来。
(3)掌握数据检索及报告输出的基本方法;掌握常用的数据筛选、排序及统计的方法。
(4)掌握数据库之间的链接、数据导入导出的基本方法。
(5)了解结构化查询语言SQL的基本概念;掌握SQL的基本数据操作与数据查询语句(SELECT、INSERT、DELETE、UPDATE)的使用方法。
2.活动建议
以小组为单位,结合某科目教学的过程性评价要求,为该科目设计学生“个人学程档案”数据库方案,经过小组讨论比较,选一个最佳方案推荐给老师,将其应用于实际教学活动中。
(三) 数据库应用系统
1.内容标准
(1)理解层次和网状数据模型的基本概念。
(2)通过案例分析,理解数据库、数据库管理系统、数据库应用系统的概念及相互关系。
(3)初步掌握设计和实现简单的数据库应用系统的基本方法。
(4)能描述数据库应用系统在信息资源管理中的作用。
(5)明确数据规范化的思想、意义,知道其在数据库应用系统建设和使用中的价值与作用。
2.活动建议
(1)设计并实现一个管理家庭光盘资料或个人图书的数据库应用系统,使之具有友好的数据输入、数据查询及统计界面。
(2)收集数据库应用方面的相关资料,把它们分类、编目并建立一个数据库,供同学、老师共享。
选修5:人工智能初步
人工智能技术是当前信息技术应用发展的热点之一。与一般的信息处理技术相比,人工智能技术在求解策略和处理手段上具有独到之处。“人工智能初步”模块介绍了人工智能的基本概念和人工智能领域内容易为高中学生所理解和掌握的部分内容,是选修模块。
通过本模块的学习,学生应能描述人工智能的基本概念,会使用一种人工智能语言解决简单问题,把握其基本特点;能利用简易的专家系统外壳开发简单的专家系统;知道人工智能对人类学习、生活的影响;通过感受人工智能技术的丰富魅力,增强对信息技术发展前景的向往和对未来生活的追求。
本模块的教学应强调让学生体验若干典型人工智能技术的应用;要根据高中学生的知识基础和本校实际情况开展教学;要发现有特长的学生并对他们进行有针对性的教学。本模块对采用的人工智能语言与专家系统工具不作具体要求,可以根据实际情况自主选择。
本模块由3个主题组成,结构如下:
(一)知识及其表达
1.内容标准
(1)能描述人工智能的概念与基本特点;知道人工智能技术随着计算机硬、软件技术的进步和应用需求而发展的事实和客观规律。
(2)列举人工智能的主要应用领域;通过演示或实际操作,体验人工智能的若干典型应用,知道其发展现状。
例1 符号运算: 通过网站http://www./ 在线执行符号运算软件Mathematica,进行多项式乘、除以及因式分解等代数运算。
例2 模式识别:声音识别、指纹识别、签名识别等识别技术的应用越来越广泛。
例3 机器证明:这是我国科学家做出过重要贡献的人工智能应用领域之一。
例4 智能代理:该技术在网上信息检索、个性化服务等方面有着广泛的用途。
(3)掌握知识的概念;学会知识表达的基本方法。
例1 用产生式规则表达简单的“动物识别”知识。
例2 将上述“动物识别”的产生式规则用“与/或图”来表达。
例3 采用框架表达“天气预报”知识。
2.活动建议
(1)就下列话题展开讨论:利用符号运算软件能解决中学课程中的哪些问题?具有哪些优点?
(2)对产生式规则、与/或图、框架等常用的知识表示方法的特点、适用场合进行比较。
(3)人工智能的基本思想已经在许多领域中得到了应用,“在家里寻找外星人”(SETI@home)项目就是利用人工智能的神经网络和分布计算思想的一个成功案例。该项目由美国行星学会和美国加州大学伯克利分校于1999年5月开始实施,它利用特定屏幕保护程序调用全球上网的个人计算机的闲置能力,分析世界上最大的射电望远镜获得的数据,帮助科学家探索外星生物。
教师先向学生简单解释神经网络、分布计算的基本思想以及SETI@home项目的社会意义,学生登录http://setiathome.ssl.berkeley.edu/home_chinese.html 网站了解或亲自参与该项目。通过该活动使学生知道人工智能领域中神经网络、分布式计算的概念,了解SETI@home项目的具体内容,感受现代信息技术服务于人类文明的价值。
(二)推理与专家系统
1.内容标准
(1)演示或使用简单的产生式专家系统软件,感受用专家系统解决问题的基本过程;了解专家系统的基本结构。
例 通过网站 http://www./ 在线执行“PC产品顾问”(Desktop PC Product Advisor)专家系统,为准备添置的个人电脑规划合理的硬软件配置。
(2)通过实例分析,知道专家系统正向、反向推理的基本原理;会描述一种常用的不精确推理的基本过程。
(3)了解专家系统解释机制的基本概念及其在专家系统中的重要作用。
例 执行专家系统,分别使用“Why”和“How”命令,了解其解释过程。
(4)了解专家系统外壳的概念;学会使用一个简易的专家系统外壳,并能用它开发简单的专家系统。
例 在专家系统的开发过程中,通常采用“原型化”策略。
2.活动建议
(1)针对学生熟悉或感兴趣的一个分类问题,利用简易专家系统外壳开发一个简单的专家系统。例如,用于识别校园中植物的专家系统。
(2)有人认为:“信息技术的应用已经经历了数值计算、数据处理、知识处理三个阶段,专家系统是知识处理阶段的典型代表。”在学习了专家系统的相关内容后,让学生从信息技术的应用对象、策略与方法等方面对上述三个阶段的特点进行比较。
(三)人工智能语言与问题求解
1.内容标准
(1)了解一种人工智能语言的基本数据结构和程序结构,掌握相关概念,知道人工智能语言的主要特征。
例 浏览Prolog语言网站http://www.visual-/,考察它的实例程序。
(2)初步学会使用该语言设计程序求解简单问题,并能够上机调试、执行相应的程序。
例1 用匹配方法解决简单的查询问题。
例2 用递归方法求解汉诺塔(Hanoi)问题。
(3)了解状态空间的概念与方法,学会用该方法描述待求解的问题。
例 “井字棋”问题。
(4)通过简单博弈问题的分析,了解用盲目搜索技术进行状态空间搜索的基本过程,知道启发式搜索的基本思想及其优点。
例 1996年,“深蓝”计算机向国际象棋世界冠军卡斯帕罗夫挑战失败。1997年,“深蓝”的后嗣替“父”报仇,以3.5:2.5的总比分击败卡斯帕罗夫。事实上,“深蓝”序列计算机中存放了包括卡斯帕罗夫的所有比赛棋谱在内的近百年的棋谱历史记录,它的“智能”主要体现在对海量的实战棋谱所进行的启发式搜索上。
2.活动建议
(1)以小组为单位,对本模块教学中尚未涉及的人工智能应用问题展开调查,就它们的应用情况、工作过程、优点与局限性以及对人们生活和工作所产生的影响进行讨论与分析。
(2)观看、阅读与人工智能相关的影视作品或文学作品,发挥自己的想象力,描述人工智能技术的应用前景,以班级网站或板报的方式展示和交流。
五、实施建议
教学建议
信息技术课程由计算机课程发展而来,但发生了质的飞跃,已经由单纯的技能训练上升为全面的信息素养的培养。因此,高中信息技术课程的教学面临着从内在理念到外在方法的全面转型。要完成这一转型,关键在于:一方面,要广泛借鉴国内外信息技术课程短暂历史中积累的教学经验;另一方面,更需要每一位信息技术教师在认真研究课程特点的基础上,加强理论学习,结合教学实际,探索行之有效的教学方法和教学模式。具体建议如下:
(一)营造有利于学生主动创新的信息技术学习氛围
良好的信息技术学习氛围是有效教学的前提。学校和教师应努力创造条件,给学生营造好学习信息技术的大环境。一方面,要尽可能给学生提供学习所需的物质条件,大到校园的整体规划,小到图书馆、机房和教室的建设,都要考虑到信息环境的营造;另一方面,更要以改善学生的学习方式、激发学生的探究欲望为出发点,设计与学生的学习、生活相适应的信息文化环境。
其次,要营造好学生课堂学习的小环境,教师应在引导学生把握知识体系的基础上,适当放手,让学生通过自主探索掌握技术工具的操作方法与应用技巧,在过程中认识和理解相关概念和原理,陶冶心性,形成健康人格;教师要做好指导和调控,有计划地让每个学生亲历与体验需求分析、方案设计以及方案实施等解决问题的完整过程,鼓励学生在过程中积极思维、大胆想象、勇于创新。
(二)合理选用并探索新的教学方法与教学模式
首先,可以学习、借鉴其他科目的成功经验,根据教学需要恰当地采用讲解、观察、讨论、参观、实验等方法,做到兼容并蓄、取长补短。其次,可以吸收国内外信息技术教学的成功经验,在继承的基础上大胆改革,探索新的教学方法与教学模式。
要从教学实际出发,根据不同的教学目标、内容、对象和条件等,灵活、恰当地选用教学方法,并善于将各种方法有机地结合起来。任何一种方法和模式的选择和使用,都应该建立在深入理解其内涵的基础上。譬如,“任务驱动”教学强调让学生在密切联系学习、生活和社会实际的有意义的“任务”情境中,通过完成任务来学习知识、获得技能、形成能力、内化伦理。因此,要正确认识任务驱动中“任务”的特定含义,使用中要坚持科学、适度、适当的原则,避免滥用和泛化;要注意任务的情境性、有意义性、可操作性;任务大小要适当、要求应具体,各任务之间还要相互联系,形成循序渐进的梯度,组成一个任务链,以便学生踏着任务的阶梯去建构知识。
(三)从问题解决出发,让学生亲历处理信息、开展交流、相互合作的过程
通过问题解决进行学习是信息技术教学的主要途径之一。一方面,通过问题解决活动学习信息技术,可以激发学生的学习动机,发展学生的思维能力、想象力以及自我反思与监控的能力;另一方面,也可以促使学生把信息技术应用到日常的学习和生活实际,甚至可以间接或直接地参与到社会生产、信息技术革新等各项活动中去。教师要根据教学需要,尽量将信息技术课安排在计算机房等与教学内容相关的实践场所;教师要引导学生在探索过程中解决问题;教师不仅要结合实际,为学生安排可以在课堂上完成的任务,也要注意把一些“课外”的实际问题交给学生去处理,如机房的建设与管理、校园网的建设与管理、学习资源的建设等。
教师可以在教学过程中设置认知冲突,让学生自己发现问题并提出解决问题的方案;要合理安排教学,让学生亲身经历处理信息、开展交流、相互合作解决问题的过程;要指导学生学会选择与确立主题,分析需求并规划、设计内容,根据需要与创意获取并加工信息,准确表达意图或主题思想;要引导学生通过交流,评价和反思问题解决的各环节及效果,在“做中学”“学中做”的过程中提升他们的信息素养。
需要注意的是,用于问题解决的综合性项目不宜过多,且大小要与学习的阶段性进展相适应;组织形式也要灵活多样,要合理安排好个人工作、小组合作、班级交流等活动形式;要根据解决问题的需要分解项目任务,再落实到个人、小组,达到既使学生体验完整过程又减轻每个学生工作强度的目的(参见案例1);前后项目的设计中,不要出现对问题解决环节和具体方法的简单重复,以免造成学生学习时间的不合理分配乃至浪费。
(四)关注基础水平和认知特点差异,鼓励个性化发展
学生在信息技术学习的过程中往往分化很快,再加上起点水平参差不齐,会给教学带来诸多不便。教师应该在教学中充分了解学生已有的信息技术学,关注学生的学习特点、个性发展需求等方面的差异,灵活设计与组织教学活动。
教师可以通过设立多级学习目标和多样的学习方式,让不同的学生都能根据自己的实际需要选择到合适的内容;教师还应给学生提供多样化的自主探索空间,鼓励不同意见和创造性思路的迸发,鼓励多样化的问题解决方式和方法。教师可以根据学生的能力差异、水平差异针对性地实施分层次教学;对于基础较差的学生,可以采用补课的方法为其奠定必要的基础,消除他们对信息技术的神秘感,增强其学习的信心;也可以采用异质分组的方法,变学生的个体差异为资源,让学生在参与合作中互相学习并充分发挥自己的长处,协同完成学习任务;对于少数冒尖的学生,给予专门辅导,使其吃饱吃好,早日成才。
(五)培养学生对信息技术发展的适应能力
从当前来看,信息技术发展速度快、知识更新周期短,光靠学校的有限学习是远远不够的;从未来来看,信息技术不仅是学习的对象,更是信息时代公民进行终身学习不可或缺的工具和环境。因此,培养高中学生对不断发展、变化的信息技术的适应能力,既是当前教学的需要,也是培养信息时代公民的需要。
教师应在认识信息技术基本特征、把握信息技术发展变化规律的基础上,注重引导学生掌握具有广泛迁移意义的知识和方法,使其在有效迁移发生的基础上适应技术的变化。在教学过程中,要注意总结和归纳不同工具平台的使用方法、不同问题解决过程的共通之处,引导学生借助已有经验,通过合理的探索,发展完成对新工具和新任务的适应,从而达到利用有效迁移的发生促进学生发展的目的。
教师要引导学生学会自主学习。在给出任务之后,通过组织学生共同研讨、分析任务,尽可能让学生自己提出解决问题的步骤、策略与方法。还要引导学生对结果进行评价,使学生真正成为学习的主人,从而增强对信息技术发展变化的适应能力。
教师还应引导学生将应用需求与发展变化相联结,主动适应信息技术的发展。譬如,每一类新的工具都是为解决某些特定问题而设计的,而这类工具的新版本或更新换代产品,都是为满足新的需求或提供更有效的方法而设计的。要引导学生在具体工具的使用中认识其优点、发现其不足并提出富有创造性的改进建议,养成主动地适应发展变化的习惯。
评价建议
评价是信息技术教学的有机组成部分,对信息技术的学习具有较强的导向作用。应围绕信息技术课程标准规定的培养目标评价教与学,保证信息技术课程目标的达成。应通过评价的合理实施,不断提高信息技术教师的教学水平,激发学生学习、应用信息技术的兴趣,帮助学生逐步提高信息素养。
(一)评价原则
1.强调评价对教学的激励、诊断和促进作用,弱化评价的选拔与甄别功能
在信息技术教学过程中,应通过灵活多样的评价方式激励和引导学生学习,促进学生信息素养的全面发展。教师应注意观察学生实际的技术操作过程及活动过程,分析学生的典型信息技术作品,全面考察学生信息技术操作的熟练程度和利用信息技术解决问题的能力。教师在向学生呈现评价结果时应多采用评价报告、学习建议等方式,多采用鼓励性的语言,这一方面有利于激发学生的内在学习动机,另一方面也可以帮助学生明确自己的不足和努力方向,促进学生进一步的发展。要慎用定量评价,呈现评价结果时要尽量避免给学生贴标签或排名次,弱化评价对学生的选拔与甄别功能,减轻评价对学生造成的压力。教师在了解学生的学习和发展状况的同时,也要利用评价结果反思和改善自己的教学过程,发挥评价与教学的相互促进作用。
2.发挥教师在评价中的主导作用,创造条件实现评价主体的多元化
教师应注意发挥在信息技术评价中的主导作用,同时充分利用学生的评价能力,适时引导学生通过自我反思和自我评价了解自己的优势和不足,以评价促进学习;组织学生开展互评,在互评中相互学习、相互促进,共同提高。
建议教师根据评价目的和当地现状创造条件组织家长、学校、外部考试机构、教育团体等有关机构和人员参与教学评价。为了减少各评价主体的主观因素对评价结果的干扰,教师可以在评价之前设计统一的评价标准,并与各评价主体充分交流,提高评价主体之间的一致性,保证评价的客观与公正。评价结束后,教师应及时收集评价信息,统计、归纳评价结果,并尽快反馈给学生和参与评价的有关人员。
3.评价要关注学生的个别差异,鼓励学生的创造实践
高中学生学习和应用信息技术的能力水平、学习风格和发展需求等方面的差异很大,信息技术课程的评价要正视这种个别差异。同时,高中学生个性特征分化更为明显,进行信息技术创造的欲望也更为强烈,评价时要充分尊重学生的个性和创造性。信息技术课程的评价标准和评价方式的确定和选用,要在保证达到最低教学要求的基础上,允许学生通过不同的方式展示自己。一方面,不同起点学生在已有基础上取得的进步都应该得到认可,使每一个学生都能获得成功的体验;另一方面,要尊重学生在学习和应用信息技术过程中表现出的个性和创造性,对同一信息作品的不同设计思路和不同设计风格、对同一问题的不同技术解决方案等,都应给予恰当的认可与鼓励。
(二)评价内容与评价方式
1.综合运用各种过程性评价方式,全面考察学生信息素养的养成过程
信息技术课在进行过程性评价时,应针对不同评价内容和相应的课程目标,适当选择和灵活运用评价方式,适当渗透表现性评价的理念,以学生在信息技术操作或运用信息技术解决实际问题过程中的表现和成果作为评价依据,全面评估学生在信息技术操作能力、运用信息技术解决实际问题的能力以及相关情感态度与价值观的形成。
要正确理解过程性评价的特点,处理好以下关键环节,切实发挥过程性评价的功能。
(1)根据教学目标制定科学的评价标准和评价量规
首先应根据评价内容和相应的教学目标明确具体的评价目的,然后根据评价目的确定评价标准。应将评价标准进一步分解为评价指标,并对评价指标进行量化,构建规范的评价量规。
在制定评价标准或评价量规时,首先要根据评价目的划分出能客观反映有关学习过程和结果的重要维度或重要方面,然后为每个方面制定不同水平的评价等级。必要时,可以为不同的指标制定不同的权重。对于比较重要的评价,要在正式评价之前挑选部分学生进行预试或预测验,考察评价指标是否合适,并进行调整和修改。评价量规的指标要全面、精练、可行。可以组织学生参与制定量规,或者在评价前向学生说明量规和评价标准,以引导和激励学生的学习。
例如,要求学生就某一主题分组合作开展研究,研究结束后要求学生制作多媒体演示文稿展示研究结果并进行口头报告。对此,可以从以下方面制定评价量规。
对研究主题的理解和表现:包括观点是否准确,论证是否清楚;内容是否全面,能否包括任务要求的所有基本主题及其他相关主题;主题内容逻辑顺序是否清楚,重点是否突出;主题的表达能否引发思考和探询更多信息的动机等。
多媒体作品制作水平: 包括能否准确、合理地应用声音、动画、视频等多媒体素材表达主题;整体布局是否平衡合理;页面设计是否与主题风格一致,界面是否美观并具有一定的艺术性,图片、动画的使用是否合理并有助于理解相关文本;是否提供了用于导航和检索的目录页和准确的链接;是否体现了学生的技术创新和创造性,例如能将以前学到的信息技术知识、技能创造性地运用到当前任务中,或根据任务主动学习和应用新的信息技术等。
口头报告:语言是否准确、生动;表达是否条理清晰,易于理解;能否根据听众的特点灵活地使用信息传递和交流技巧。
小组协作:分工是否明确;小组成员能否在完成各自任务的同时相互合作,共同完成任务。
(2)通过日常观察或设置真实任务搜集评价资料
在信息技术课的过程性评价中,可以通过现场观察、档案袋或成长记录的方式,系统客观地观察和记录学生在自然情境中的真实表现,也可以设置特定的作业、项目或任务来引发学生某种特定的行为,搜集有价值的评价信息。用于过程性评价的作业、项目或任务应指向具有普遍意义的目标,任务应该是多层次的,可考察学生综合的信息素养,不能过偏;任务应密切联系学生的学习或生活实际,避免设置脱离学生生活或学习经验的任务情境;任务对所有学生都应是公平的,不能偏难或过于偏向某些学生的生活经验。
信息技术课中设计的任务主要以典型作品设计和项目型作业或实践活动为主。
典型作品设计
可以在学习过程中随时搜集、分析学生的典型信息技术作品,也可以在测验、考试时设计特定的典型作品设计任务。对学生信息技术作品的评价要重视学生作品设计的思路和过程,不能只评价作品的优劣。信息技术课程中的作品分析大多比较耗时,教师在实际教学中可以适当组织学生遵循统一规范的标准开展自评或互评。
项目型作业或实践活动
通过对学生项目型作业或实践活动的评价,可以相对全面地了解学生信息素养的发展水平。
例如,可以围绕学生在活动过程中的规划意识和规划能力、信息技术应用水平(包括信息作品创作过程中的个性和创造性)、学习态度和参与意识、投入程度、交流能力与合作精神、问题解决能力等制定面向活动过程的评价指标。如果需要对学生活动过程、设计过程、思维过程等方面进行深入考查,可以选择少数学生进行深度访谈,访谈之前应设计好访谈主题或问题,制定访谈计划并作好访谈记录。
又如,可以围绕以下方面制定评价指标,评价学生利用信息解决问题以及开展交流合作的能力:学生能否结合任务或问题情境的要求确定合适的信息来源;学生能否制定切实可行的信息收集计划;学生能否根据问题要求采集和评价信息、管理信息、加工信息、利用信息解决问题;能否利用信息技术清楚地表达观点、思想,呈现问题解决的答案;能否根据问题解决的需要评价各种可用的信息技术设备、工具和资源的潜在优势和不足,选用合适的信息技术设备、工具和资源解决问题;能否体会到与他人合作解决问题的重要性,并能利用合适的信息技术与他人进行有效交流、合作;能否对解决问题的过程进行反思,获得解决问题的经验,提高相关能力。
(3)评价结果的处理
评价结论既可以针对某一学生的整体表现进行全面分析,也可以针对学生在不同方面的表现分别进行分析。评价结论中的分数或量化评价结果主要提供有关学生表现水平的参考依据,必须将这些量化结果与定性分析相结合,切忌单纯利用量规分数对学生的学习下结论或排名次。在使用评价结果时要注意考察不同评价者的评价结果是否一致,如果出现较大差异,应注意分析其中的原因,减少评价者的主观因素对评价结果的不良影响。
2.评价与教学过程相结合,动态把握、及时引导学生情感、态度和价值观的形成
学生对待信息技术的态度、信息技术的使用习惯以及在信息活动中表现出的社会责任感和价值观,是在学习和使用信息技术的活动中逐渐形成的。教师应结合具体的教学过程,通过适当的过程性评价方式随时把握、及时引导。可以向学生呈现蕴含人文、道德、社会冲突的案例或问题情境,如“信息技术的使用与知识产权”专题,让学生对这些案例或情境进行讨论、分析,或撰写短文,再根据学生表达的观点把握他们的情感、态度以及对有关问题的认识和理解。要注意观察学生在教学过程和各种信息活动中的实际行为表现,考查学生是否真正将有关的法律、法规、道德规范等内化为自己的行为准则并自觉指导自己的实践。对情感、态度、价值观的评价,最终要落实为教师对学生的适时预防、关怀或引导,要避免对学生的情感、态度和价值观进行简单量化或脱离实际单纯打分。
3.纸笔测验和上机测验相结合开展总结性评价
应正确认识期末考试等总结性评价的作用和功能。期末考试的主要功能是考察学生所学模块的基础知识、实际操作技能和利用信息技术解决实际问题的能力,诊断本学期教学存在的问题,帮助教师和学生改进随后的教与学。
在组织期末考试等总结性评价时,要根据课程标准的要求和具体考试内容选择合适的题型和考试方式,综合运用纸笔测验、上机测验等多种评价方法;要创造条件全面考察学生信息素养的协调发展,避免只重视知识记忆和计算机操作,忽视学生利用信息技术解决实际问题能力的倾向;要注意结合学生平时学习表现和过程性评价结果,改变单纯以一次测验或考试为依据,评定学生一学期或整个学段学习情况的局面,适度加大过程性评价在期末成绩评定中的比重。
纸笔测验和上机测验各有所长,适合不同的评价内容和目标,应相互补充,综合运用。纸笔测验的效率较高,适于短时间内对大量学生进行集中考察,适于考察学生对信息技术基础知识的掌握和理解,但不适于评价学生的实际操作技能。信息技术的纸笔测验,要控制选择题、填空题等客观题型的比例,适度设置和增加要求学生通过理解和探究来解决的开放性题目,如问题解决分析、作品设计、短文写作等,以拓展纸笔测验在评价内容和评价目标等方面的广度。上机测验是信息技术课总结性评价中不可或缺的重要组成部分。可供选择的上机测验主要有两类,一类是通过实际操作完成的独立任务,如软件操作水平测试、作品设计与制作等;另一类是综合任务中的上机环节,如利用信息技术进行项目研究过程中的上机活动。期末考试等总结性评价一定要安排上机测验,设计一定比例的联系实际的设计、制作或其他类型的信息处理任务,以评价学生使用信息技术工具或软件的熟练程度,测查学生利用信息技术解决问题的过程、方法和能力。教师和有关机构要针对具体评价目的,灵活选用上机测验的题型和考试方式,不能单纯依赖题型单一、只考察基本知识与操作能力的机考系统,否则容易对信息技术教学产生误导。
(三)评价的组织实施
1.选用评价方式时要结合实际情况和具体评价目标,体现针对性和效益性
学校、教师在分析有关评价方法的优劣、选用具体的评价方式时,既要考虑评价方式是否适合具体的教学目标、评价内容、评价主体和客体的具体特点;又要讲究效益,充分考虑各种评价方式对学校的信息基础设施、设备以及对教师、学生的时间和精力等方面的要求。在此基础上,结合班级规模、时间和经费及其他现有条件,选择有针对性、高效益的评价方式。如果采用成本较低、省时、省力的评价方式就能达到相同的评价目的,则不要选用高成本的评价方式。要注意综合运用多种评价方式,相互补充。
2.合理应用信息技术进行教学评价,提高评价效率
信息技术在编制评价题目、实施和管理评价过程、汇总分析评价结果等方面都具有很大的应用潜力,合理利用信息技术辅助信息技术课程评价,可以提高评价的效率和效果。信息技术教师应发挥自身的技术优势,合理利用信息技术支持评价活动。可借助合适的信息技术搜集、管理评价素材,辅助评价题目的编制和评价标准的制定等;可借助测验管理软件,针对不同学生实施分层次评价,或者对评价实施的时间、评价时限等进行控制和管理;可利用电子表格、数据库软件或其他统计软件准确、迅速地统计、分析评价结果,或者对测试题目进行难度、区分度等方面的分析;可利用信息技术记录和收集学生学习过程的信息,帮助实现过程性评价。
注意结合课程标准和教学目标的要求以及本地教学条件,选择合适的信息技术工具和资源,结合自己的评价经验创造性地利用信息技术支持评价活动,强调信息技术在评价中的应用效益和实际效果。不要脱离目标和实际,为用信息技术而用信息技术,避免使用题目固定、形式呆板的考试系统或考试软件。
3.提高信息技术教师教学评价的专业技能,加强团队合作
应通过各个层面的信息技术教师培训和教师自我发展,使教师在深入理解信息技术课程目标、内容标准和教学方法的基础上,不断反思和提高自己的评价理念,熟悉有关评价方法,分析这些方法的优点、局限和适用的内容及目标,逐步提高运用有关评价方法的信心和操作技能。有条件的地区和学校可以建立信息技术教学评价的咨询和支持系统,为教师提供有关评价服务和帮助。应鼓励教师之间、学校之间开展信息技术教学评价方面的研讨和经验交流,鼓励教师积极参与评价方案的合作设计,不断提高教师教学评价的水平。学校与家长、社区之间要加强信息技术教学评价方面的沟通,引导家长和社会理解信息技术教学的评价理念和评价方式。同时,积极争取行政人员对学校和教师评价工作的支持。
教科书编写建议
信息技术教科书的编写应以《信息技术课程标准》为基本依据,要为教师和学生的信息技术教学活动提供直接指导。教科书应渗透学生自主学习、勤于动手、主动探究的思想,引导学生进行有效的实践活动,切实达成课程目标。
(一)要强调适应性
我国信息技术教学起步晚,各地信息技术教学的经费投入、基础设施、师资水平等都存在较大差异,课程开设情况参差不齐。为此,信息技术教科书更应该强调多样性,以适应不同地区的具体情况。在充分调查地方的信息基础设施、师资状况及学生信息技术水平的基础上,编写适合地方情况的教科书,保证不同地区都能开好信息技术课。
高中学生信息技术的起点差异比较大,教科书的设计要有一定开放性,具体要求要有一定弹性,内容的呈现要有较大灵活性。既保证起点水平较低的学生能够适应,也给学有余力的学生提供进一步发展的空间,使所有学生都能得到充分的发展。
(二)要体现科学性、通用性和前瞻性
信息技术是一门应用广泛而又发展迅速的学科,许多概念的界定和理解比较混乱。所以,高中信息技术教科书的内容应力图科学、客观、准确,使用通俗易懂而又严谨的语言解释基本概念。
高中信息技术教科书要向学生介绍具有广泛适用价值的信息技术知识技能以及蕴含在信息技术中的基本思想方法,有意识地培养学生的终身学习能力;要适当选择能反映信息技术发展趋势的内容,让学生有机会了解信息技术的最新发展成果及其在生活、学习中的作用,激发学生进行技术创新的动机,培养学生对信息技术发展的适应能力。
(三)要联系实际培养学生利用信息技术解决问题的能力
信息技术教科书要密切联系实际,结合学生的现实生活和学习实践以及当地的社会发展,适度设置真实性的学习任务、典型案例或研究性课题,以引导学生在动手操作、自主探究和解决问题的过程中把“学技术”与“用技术”融合在一起,主动理解知识、掌握技能、发展能力。
(四)要突出特色、强调创新
课程标准中各模块的内部结构、撰写顺序和描述方法是在标准撰写中为课程理念表达和内容呈现的方便而做出的选择,但不一定是教科书编写的最佳选择。例如,“算法与程序设计”模块中的三个主题以及各主题中条目陈列的以思想方法为主要线索,内容上,三个主题相互联系,彼此交织在一起。这种结构显然不能直接作为教科书的结构。教科书的编写应在遵循课程标准规定的内容、达到其基本要求的基础上,根据具体情况,在体系结构的设计、内容的组织编排、技术的运用、资源的提供等方面大胆创新,尝试适当的呈现方式,并形成不同教科书的特色,实现教科书多方面、多层次的创新。要针对特定的教学对象,根据教学目标、教学内容的具体要求,灵活介绍合适的教学方式,引导教师和学生在使用教科书时能创造性地教学或学习,实现教科书从教学范本向教学资源的价值转变。不应无视具体教学要求,机械套用单一的教学方式,也不能在教科书中对教学方式限制过死,影响教师的教学创新和学生学习的灵活性。
(五)要渗透人文精神,贯穿社会责任感的培养
信息技术教科书要展现信息技术发展、信息技术创新和信息技术应用中蕴藏的人文精神,要始终渗透有关社会责任感的培养,并有意识地设计相关的人文、社会教育主题,引导学生在信息技术应用过程中,不断内化与信息技术应用相关的伦理道德观念与法律法规意识,逐步养成负责、健康、安全的信息技术使用习惯。
课程资源的利用与开发建议
信息技术课程资源是课程得以实施的重要前提,要十分重视课程资源的利用与开发,建议从以下三个方面考虑。
(一)基础设施与设备
对于信息技术课程而言,必要的基础设施、基本设备是课程实施的物质基础。要配备能满足教学需要的计算机房、多媒体教室等设施;配备数量合理、配置适当的计算机和相应的外部设备(打印机、投影仪、扫描仪等);具备上网条件。
在规划和建设信息基础设施、购置设备时,要遵循“合理投入、充分利用、避免浪费、量力而行”的原则,对投入进行全面规划;还要结合本地或本校的发展水平和特色,因地制宜,避免 “一刀切”和“盲目攀比”等现象。
在管理和使用已有设施和设备时,坚持“面向教学”的原则,为各学科教师提供有效服务;注意提高学校现有设施、设备的利用率,学校的计算机教室、图书室或电子阅览室等要尽可能向师生开放;采取有效措施,加强学校与家庭、社区之间信息设备和信息资源的共享;充分发掘和利用当地图书馆、科技馆、博物馆、电视台、展览馆、信息中心以及其他可供利用的校外资源。
要根据教学要求,做好有关设备的维护,充分利用周末等时间进行机房维护,保证设备的正常运行和教学活动的顺利开展。要结合本校的实际情况,做好必要的设备更新。
(二)教学信息资源
信息技术课的教学信息资源包括两类,其一是数字化资源,如教学软件、专业资源网站等;其二是非数字化资源,如图书、报刊、录像等。
教师应密切结合教学实际,收集、组织、开发必要的教学资源,建立不同层次、不同类型的资源库。在教学资源的建设中,应面向学生的需要,为学生自主学习提供更多的支持;应遵循相关技术规范,便于交流与共享;应充分利用网上共享资源,避免低水平重复开发。
教师应引导学生参与教学信息资源的收集、组织、开发,让学生在参与资源建设的过程中学习。
应重视信息技术课程教学相关网站的开发、应用与管理,为信息技术的学习创设丰富、健康、安全的网络环境。
(三)师资队伍建设
各地区、各学校应制定相应的师资建设计划,并采取有效措施加快信息技术教师队伍建设的步伐。要开展多样化的教师培训,鼓励和组织教师参加进修、学历教育等国家和地方的教师培训,规划和开展持续的校本培训;要通过案例培训、参与性培训等多种多样的教师培训模式,持续提高信息技术教师的信息素养和信息技术教学能力;要鼓励教师积极参与各级各类信息技术教研活动,不断提高教学研究能力和自我发展能力。
六、案例
案例1
标 题:南极洲探险
涉及标准:模块“信息技术基础”;条目(一)信息获取(1)(2)(3)(4),(二)信息加工与表达(1)(2)(3)(4),(三)信息资源管理(1)(2)(3),信息技术与社会(1)(2)(3)(4)(5)。
建议学时:6
学习目标:
(1)说明当前信息技术的变化及这些变化对学习、工作和社会所产生的影响。
(2)能够选择恰当的工具和软件来支持学习和研究。
(3)与他人合作,利用远程通信手段和协作工具来研究与课题相关的问题。
(4)选择和利用适当的工具和信息资源完成各种任务并解决问题。
(5)研究和评价在实际问题中,信息资源的可靠性、相关性、综合性。
过程设计:
(1)将全班学生分组,3~5人一组,各组确定一名组长,并填写下表1。
表1 小组分工表
组长:
组员 性别 年龄 分工 主要工作
1.收集资料2.整理资料3.问题解决4.演示制作5.汇报讲演
(2)每组从后面的主题选择建议中,通过抽签方式任选一个主题进行研究。
(3)为了更好地探讨研究主题,每个小组要列出所选主题所应研究或解决的若干问题,并填写在下表2中。
表2 研究问题及计划
项目主题:
编号 需要研究或解决的问题 需要使用的工具、软件、手段 所需时间 可能出现的困难
1
2
3
4
5
6
(4)确定获取资料的来源(因特网、报刊书籍、广播电视、访问科学家或研究人员或家庭成员),通过各种手段获取资料,并按一定规则或原则对资料分类。形成小组资料文件夹(表3给出了一种参考的分类方式)
表3 资料的分类
编号 资料主题 资料类别 已有资料 需要搜集的资料 负责人
1 文本
图像
音频
动画
视频
其他
2 文本
图像
音频
动画
视频
其他
3 文本
图像
音频
动画
视频
(5)各组选派一名代表,共同整理各组获取的资料,并对资料进行有效管理,供各小组共享。分类方法可参考表3。
(6)小组讨论确定解决问题的策略与方法,并开始实施。
(7)每组选择一种或多种方式(电子文档、多媒体、动画、表格、网页、程序设计等)呈现所研究的结果。
(8)完成主题研究后,各组在全班对其研究结果进行汇报演示。
(9)师生共同制定评价内容、标准,各小组间对汇报进行自评、互评。可参考表4。
表4 评价参考表
评价内容 分值 标准 小组自评 小组互评 教师评价
(10)师生对所做主题研究进行总结。
主题选择建议:
(1)利用因特网获取有关人类在南极定居的历史、文化以及环境变化的信息,采用适当方式展示出来。
(2)利用书籍、文章、因特网研究一名南极探险者,并用文字处理软件来创办一份期刊,假设内容是一位探险者写的。
(3)利用因特网获取和记录南极的天气统计数据。编制一个图表,把这些数据与自己家乡的天气统计数字作比较。创立一个数字化的天气预报,进行报道,并比较这些数据。
(4)写一份一个月的南极旅行计划,并对所需经费进行预算。
(5)利用因特网研究南极的动物。利用文字处理软件描述一种非常适应南极环境的遗传变异动物;利用多媒体软件画一幅动物的解剖组织结构图;用交互式的手段来阐明环境适应问题。
(6)利用因特网研究南极上空的臭氧层。绘制一个比较本地与南极臭氧层数值的图表或用软件建立一个三维模型;为全球臭氧层的发展做一个预测。利用视频、演示或多媒体创作软件设计一个关于臭氧层的公益广告。
(7)创建一个有关南极动物指南的网页,包括企鹅、海豹、鲸、海豚、磷虾群、鱼和鸟类等。
(8)研究埃里伯斯火山,制作这个火山的多媒体演示作品,内容可包括:火山的类型、结构,火山在极地板块构造学中的重要性,火山给生态系统带来的威胁……
(9)创建一个板块构造学的动画演示作品,说明南极洲是怎样与大陆分开而漂移到现在的位置的。
(10)研究以下问题:天气是怎样随着纬度的不同而变化的?天气的哪些方面(温度、降雨等)能通过纬度来预测?利用南极的数据、自己所在城市的数据、南极和自己所在城市之间地区的数据来支持这些发现,并选择一种适当且引人注目的方法来展示这些发现。
(11)研究教室里的计算机是以何种方式通过因特网与正在南极的科学家实现联系的。调查初露锋芒的新技术,并就今后十年可能出现的技术联结方式提出建议。
(12)研究因特网上几个讨论臭氧层的站点,为每个网站准备一份分析报告,内容包括网站的准确性、相关性、恰当性、综合性及可能出现的偏见。
参考网站:
(1)世界地理网:http://www.earth-/dh/dlyj/njz.htm
(2)南极洲旅行:http://www./seed/zh/watch/antarctica/
(3)中国科普博览—冰雪馆:http:///gb/earth/icesnow/antarctica/
(4)地球村:http://world99./antorctica.htm
(5)北极在召唤:http://www.gmdaily./2_zhuanti/keji/bj/default.htm
(6)旅游网:http://travel./spore/pages/leisure280300.html
(7)中国教育科研网—人与自然: http://www./20011101/3007739.shtml
(8)南极洲探险记:http://www.envi.org.tw/resource/southpole/soumain3.htm
(9)百科知识网:http://www./search/kdg.asp kl=1418
(10)中国网:http://www.china./chinese/TEC-c/93573.htm
(11)地理教与学:http://dili.fsjy.net/index.htm
(12)人民网:http:///GB/kejiao/42/154/20020124/654941.html
(13)中基网—南极考察:http://www.cbe21.com/subject/geography/article.php article_id=502
(14)自然地理杂志:http://www.nationalgeographic.com/
(15)Historic timelines:http://www.search-/history.htm
(16)The Internet Public Library:http://www.ipl.org/div/news/browse/AQ/
(17)Antarctic Explorers: http://www./va/ ( http: / / www. / va / )history/ages/discovery.html
(18)Discover 网站:http://www./
(19)Discover magazine:http://www.dc./magazines/discover/
(20)Gas Concentrations-ozone:http://www.acd.ucar.edu/
(21)Data Product-Ozone:http://toms.gsfc.nasa.gov/ ( http: / / toms.gsfc.nasa.gov / )ozone/ozone01.html
(22)International AntarcticCentre:http://www.iceberg.co.nz/ ( http: / / www.iceberg.co.nz / )
(23)Mount Erebus Volcanic Observatory:http:// www.ees.nmt.edu/Geop/ ( http: / / www.ees.nmt.edu / Geop / )
erebus.html
(24)Polar Star:http://www.polarstar.org/
案例评析:
本案例以“南极洲探险”为主题,整合了信息技术、天文、地理、生物等学科进行研究。通过这一主题活动,培养学生选择合适工具、熟练运用信息技术获取、加工、管理、表达与交流信息的能力,以及运用信息技术解决实际问题的能力。
案例从多个角度提出子课题,将学生分成小组,每个小组完成一个子课题。其意义在于:第一,每组学生都可以经历一次完整的专题研究活动;第二,全班学生针对不同子课题的活动,在资源、方法、过程、成果等方面可以相互支持和共享,即协作不仅发生在小组内,还发生在小组之外;第三,合理解决了任务多与时间紧的矛盾,既完成了综合性主题活动,让学生多方位了解了南极洲,又相对节省了学生的时间,提高了学习效率。
本案例可以作为“信息技术基础”模块结束时的综合活动使用;本案例对软、硬件条件要求较高,比较适合城市或较发达地区采用。
案例2
标 题:画100个同心圆
涉及标准:模块“算法与程序设计”;条目(二)程序设计语言初步(1)
建议学时:1
学习目标:
(1)让学生体会并理解循环结构解决问题的基本思想。
(2)掌握循环语句的用法。
(3)能够用循环结构解决问题。
过程设计:
(1)教师给出题目“编程实现:在屏幕的中央画1个圆”。
(2)学生使用已有知识完成该题目。
(3)教师继续给出题目“编程实现:在屏幕的中央画10个同心圆”。
(4)学生做题,教师观察。可能出现的情况:一部分学生直接写出10条语句;一部分学生写出一条语句,利用复制命令复制九次;一部分学生感觉很繁琐,不愿做。
(5)教师继续提出问题“编程实现:在屏幕的中央画100个同心圆”,同时观察学生的反映。
(6)学生会发现,画100个同心圆的方法虽然简单,但用已有知识解决该问题很繁琐,可操作性差。
(7)教师引导学生分析:如果写出100条画圆语句,它们有什么特点?能不能像数学中的通式一样,用一条画圆语句概括描述100条语句?最后让学生总结出:(以下以QBASIC语言为例)
Circle(320,240),R,1
其中R代表半径。
(8)教师继续引导学生讨论,让学生提出“通过改变R的值,重复执行一条语句,画出100个同心圆”,这正是循环结构程序的思想。
(9)教师引出循环语句、循环结构程序的概念与功能,写出:
FOR R=2 TO 200 STEP 2
Circle(320,240),R,1
NEXT R
(10)同类迁移:要求每个学生举出1~2个利用循环结构解决的实际问题,以达到举一反三的效果。
(11)教师提问,循环结构程序与其他结构程序有什么关系?能不能用一个实例将它们综合起来?
案例评析:
本案例通过设置认知上的冲突,让学生自己发现问题、提出问题,继而找出解决问题的办法。在此基础上,引入新知识——“循环结构程序”的概念,使学生感受到循环结构解决问题的优势。在这样的学习过程中,学生的主要活动是积极思考、广泛交流、主动探究。他们学到的不仅仅是新知识,更重要的是学会了解决问题的方法,知道了什么时候、在什么地方去应用所学的知识。
本案例是一个典型的以知识与技能为内容的课堂教学实例,也说明了在程序设计语言的教学之中,最最重要的是基本思想和方法的教学,而只要能够恰当地引导,就能够使学生准确地领悟思想,从而较好地掌握基本方法。
案例3
标 题:“植物分类顾问”专家系统的设计
涉及标准:模块“人工智能初步”;条目(二)推理与专家系统(1)(2)(3)(4)。
建议学时:6
学习目标:
(1)调查校园或所在社区的常见植物,总结、归纳它们的分类特征信息。
(2)用产生式规则来表示植物分类知识。
(3)利用给定的专家系统外壳,构建一个简单的植物分类专家系统。
(4)演示所完成的专家系统,并通过电子讲稿展示小组的工作成果。
过程设计:
(1)教师向学生讲解专家系统的基本原理以及一个简单的产生式专家系统外壳的使用方法。
(2)教师介绍简单“动物分类”专家系统实例的规则集,教师指导学生自己提出植物分类的基本特征、分类规则的组织方法。
(3)学生以3~8人为一组,分工合作开展实地考察,查阅网站和图书资料,收集、总结相关植物的外形特点、生活习性和应用价值等信息。经过分析,组织出分类规则(20条以上),画出这些规则所对应的“与/或图”(层次大于2层)。
(4)各组将规则输入计算机,通过专家系统外壳进行调试,实现相应的专家系统。
(5)演示、交流与评价:各组在全班范围内演示自己的成果,教师和其他小组给予评价。可以参照学习目标来制定具体的评价标准,从小组调查、分析与设计过程中的协作程度,所编写的产生式规则的科学性、产生式规则与层次的数量,所实现专家系统的实用性,电子讲稿的展示效果等多方面综合考虑。
(6)师生总结专家系统的基本思想,专家系统适用的问题解决类型,专家系统的应用对于社会经济活动的意义。
(7)该项活动的一部分工作需要在课余时间进行,在此期间可以通过E-mail联系或向教师请教。
案例评析:
本案例通过基于项目的学习,能够使学生体验到利用产生式规则的专家系统解决实际问题的全过程。在这一学习过程中,学生不仅可以学会使用专家系统外壳开发实际专家系统的基本方法,而且可以通过该过程感受人类专家分析、解决问题的基本思想,体会到用专家系统进行问题求解的优势。同时,还可以培养学生相互协作的精神。
本案例说明了针对看起来比较难的专题,也可以使学生通过亲自参与体验其基本方法与思想,取得成果获得成就感,从而形成有效学习。
本案例还说明,“人工智能初步”模块既适当地介绍了一些简单的人工智能应用,也介绍了人工智能语言的基本使用方法,其目的是使学生更好地理解人工智能技术思想与方法的特征,而不是要求学生掌握过多过难的技术。比如专家系统外壳的获得、修改或制作,技术难度较高,不能够硬性地要求学生去做,应该由教师来完成。
信息技术基础
选修5:人工智能初步
选修1:算法与程序设计
选修2:多媒体技术应用
选修3:网络技术应用
选修4:数据管理技术
选修 2+(x)学分xxxxxssXxxXχχχχχ
必修2学分
信息加工与表达
信息获取
信息资源管理
信息技术与社会
信息技术基础
信息处理与交流
程序设计语言初步
算法与程序设计
计算机解决问题的基本过程
算法与问题解决例举
多媒体技术应用
多媒体技术与社会生活
多媒体信息采集与加工
多媒体信息表达与交流
网络技术应用
因特网应用
网站设计与评价
网络技术基础
数据管理技术
数据库应用系统
数据库的建立、使用与维护
数据管理基本知识
人工智能初步
知识及其表达
推理与专家系统
人工智能语言与问题求解旸
TOC \o "1-3" \h \z
1. 搜索引擎的定义与发展 4
1.1. 搜索引擎的定义与分类 4
1.2. 搜索引擎的发展历史 4
2. 搜索引擎的工作原理与使用技巧 5
1.1. 搜索引擎的工作原理 5
2.3. 搜索引擎的使用技巧 6
2.3.1. 搜索关键词提炼 6
2.3.2. 细化搜索条件 6
2.3.3. 逻辑命令的使用 7
2.3.4. 精确匹配搜索 7
2.3.5. 特殊搜索命令 8
2.3.6. 附加搜索功能 9
2.3.7. 用什么样的搜索引擎 10
3. 搜索引擎王者——Google 11
4. 几款当前主流的搜索引擎比较 12
1.1. 搜索结果数量比较 12
4.4. 搜索结果准确率比较 12
5. 搜索引擎的特殊功能介绍 13
5.1. Google谷歌 13
5.1.1. 查找 Flash 文件 13
5.1.2. 地图查寻 13
5.1.3. 网页快照 13
5.1.4. 货币转换 13
5.1.5. 计算器 13
5.1.6. 相关搜索 13
5.1.7. 类似网页 14
5.1.8. 按链接搜索 14
5.1.9. 指定网域 14
5.1.10. 手气不错 14
5.1.11. 错别字改正 14
5.1.12. 中英文字典 15
5.1.13. 天气查询 15
5.1.14. 股票查询 15
5.1.15. 邮编区号 15
5.1.16. 手机号码 15
5.1.17. 农历日历转换 15
5.1.18. 定义 15
5.2. Baidu百度 16
5.2.1. 拼音提示 16
6. 搜索引擎05年总结及展望 16
6.1. 页面搜索细化专业搜索更具特色 16
6.2. 浏览器工具条 哪个提供服务更方便 17
6.3. 不会再迷路 地图搜索激战正酣 17
6.4. 系统搜索不够强看我硬盘搜索软件 17
6.5. 搜索社区化搜索结果更人性 18
6.6. 总结 18
7. 个人心得体会 18
1. 搜索引擎的定义与发展
1.1. 搜索引擎的定义与分类
获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。
全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按以定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。
分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”(http://www./)。
全文搜索引擎和分类目录在使用上各有长短。全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确;分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。为了取长补短,现在的很多搜索引擎,都同时提供这两类查询,一般对全文搜索引擎的查询称为搜索“所有网站”或“全部网站”,比如Google的全文搜索(http://www./intl/zh-CN/);把对分类目录的查询称为搜索“分类目录”或搜索“分类网站”,比如新浪搜索(http:///)和雅虎中国搜索(http://cn.search./dirsrch/)。
在网上,对这两类搜索引擎进行整合,还产生了其它的搜索服务,在这里,我们权且也把它们称作搜索引擎,主要有这两类:
⒈元搜索引擎(META Search Engine)。这类搜索引擎一般都没有自己网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以统一的格式在同一界面集中显示。元搜索引擎虽没有“网络机器人”或“网络蜘蛛”,也无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术。比如“metaFisher元搜索引擎”(http://www./fish/),它就调用和整合了Google、Yahoo、AlltheWeb、百度和OpenFind等多家搜索引擎的数据。
⒉集成搜索引擎(All-in-One Search Page)。集成搜索引擎是通过网络技术,在一个网页上链接很多个独立搜索引擎,查询时,点选或指定搜索引擎,一次输入,多个搜索引擎同时查询,搜索结果由各搜索引擎分别以不同页面显示,比如“网际瑞士军刀”(http://free.okey.net/%7Efree/search1.htm)。
1.2. 搜索引擎的发展历史
曾有人说搜索引擎的鼻祖就是黄页,诞生于19世纪末。因为黄页,在电话诞生后成为了以电话为主体的信息门户,而且黄页把有电话的企业分门别类,的确与现在的搜索引擎有异曲同工之妙。不过,这更多地是从这两者的形式和用途做的类比。
我们所说的搜索引擎其实是在近10年的不断发展中逐步形成的,它建立在互联网和诸多计算机技术之上,所以很难把搜索引擎的缘起与哪个具体的产品对应起来。然而,在它逐步发展的过程中,一些关键系统和产品的产生成为了具有里程碑意义的事情。
1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索,这就是Excite,后来曾以概念搜索闻名。1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)诞生。除了网站搜索,它还支持Gopher和Telnet搜索。
Lycos是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要。
1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图、股票、词典、寻人等集成搜索、多语言支持、用户界面等功能上的革新,像Altavista一样,再一次彻底改变了搜索引擎的定义。
注意:计算机技术正在飞速发展,关于搜索引擎的定义和发展过程,也有各种各样不同的观点。
2. 搜索引擎的工作原理与使用技巧
2.1. 搜索引擎的工作原理
全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。
和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。所有这些收录的站点同样被存放在一个“索引数据库”中。用户在查询信息时,可以选择按照关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟全文搜索引擎一样,也是根据信息关联程度排列网站。需要注意的是,分类目录的关键词查询只能在网站的名称、网址、简介等内容中进行,它的查询结果也只是被收录网站首页的URL地址,而不是具体的页面。分类目录就像一个电话号码薄一样,按照各个网站的性质,把其网址分门别类排在一起,大类下面套着小类,一直到各个网站的详细地址,一般还会提供各个网站的内容简介,用户不使用关键词也可进行查询,只要找到相关目录,就完全可以找到相关的网站(注意:是相关的网站,而不是这个网站上某个网页的内容,某一目录中网站的排名一般是按照标题字母的先后顺序或者收录的时间顺序决定的)。
2.1. 搜索引擎的使用技巧
搜索引擎的使用技巧,正是从其工作原理衍生出来的。由于此技巧实用性较强,故介绍较详细。
2.1.1. 搜索关键词提炼
众所周知,要在搜索引擎上搜索信息首先必须输入关键词,所以说关键词是一切事情的开始。大部分情况下找不到所需的信息是因为在关键词选择方向上发生了偏移,学会从复杂搜索意图中提炼出最具代表性和指示性的关键词对提高搜索效率至关重要,这方面的技巧(或者说经验)是所有其他搜索技巧的基础。
选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子里要形成一个比较清晰概念,即我要找的到底是什么?是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位你要找的东西,而且多数时候你根本不需要用到其他更复杂的搜索技巧。
关键词的选择有时还是需要动一番脑筋的,难就难在如何找到某一类Web文档的关键特点。下面提供大家一个小测验,看看你的主题归纳和特性定位方面做得怎么样?
比如你是玩具(Toys)生产商,想将网站提交到有玩具分类列表的行业门户网站,但你并不知道网上都有哪些站点接受此类网站登录。当然,你首先会想到利用搜索引擎查找,而此时关键词的选择就显得非常重要了。建议大家先不要看下面的解答,先不妨到搜索引擎上试试(提议用英文搜),看看能不能精确且迅速地找到目标。
好了,现在我们就对这次的搜索任务作一下分析。
我们要找与玩具有关的网站,作为商品的一大门类,“玩具”当然就是这类信息的共性。那么接受网址登录的网站会有什么区别于其他相关站点的特性呢?答案是它们的网页中一般会有“添加网址”(addurl或add url)的字样。看到这里大家也许恍然大悟,原来如此!是的,关键词提炼有时就象脑筋急转弯。最后我们确定搜索条件为:
toys addurl(或add url)
在上述例子中,信息共性的定位是很自然的事,不存在什么障碍,而特性的发掘就需要一点创造性的思维。这在一开始可能有点摸不着方向,但当大家了解了这种思考方法,再加上平常搜索时的多次实践,搜索关键词的提炼最终会成为你下意识的一种反应。
2.1.2. 细化搜索条件
你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。
比方说你想查找有关电脑冒险游戏方面的资料,输入game是无济于事的。computer game范围就小一些,当然最好是敲入computer adventure game,返回的结果会精确得多。
有时你甚至可以问搜索引擎一个问题,返回结果的准确度会让你不得不佩服搜索引擎功能的强大。
我们想查找有关根据IP地址判断访问来源方面的资料,由于知道以“IP address”搜索没用,加上搜索条件比较复杂,无法以单个的词或词组查询,因此我们干脆在Google搜索引擎中输入了整句话:
How to recognize a visit from its IP address
结果在返回的网页链接中,第一个就是我们需要的。该网站不仅提供根据IP进行访问来源查询,还用虚拟现实(Virtual Reality)技术在地图上指出来源所在的城市!
可以看出将搜索条件细化,能够大幅提高你的搜索效率。
由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入"电脑游戏 冒险",而不是"电脑冒险游戏"。
此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略。
2.1.3. 逻辑命令的使用
搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度。比较一下下面各搜索条件的含义:
computer adventure game
最基本的搜索方式。查找与该关键词有关的记录,在过去通常情况下相当于布尔逻辑命令中“OR”的关系,翻译过来就是:
computer (OR)adventure(OR)games
因此搜索结果中不仅有同时包含三个关键字的记录,也有仅含部分关键字串(如 computer games)和个别关键字(如computer)的记录。目前搜索引擎的趋势是默认匹配全部关键词搜索,即仅返回包含所有关键词的记录,相当于下面将介绍的“+”号和AND的关系,当然有时也有例外。
+computer +adventure +game
相当于布尔逻辑命令中的“AND”关系,翻译过来就是:
computer(AND)adventure(AND)games
因此搜索结果中只列出同时包含三个关键字的记录。在搜索条件中使用“+”号还可强制搜索引擎将一些停用词当作关键词进行搜索。比如我们搜索“who am i”时,其中“who”和“i”是停用词,我们可以在两个单词前加上“+”号强制对其进行搜索,此时的搜索条件即可为:+who +am +i。
+computer +game -adventure
翻译过来就是:
computer(AND)game(NOT)adventure
列出所有包含computer game的记录,但在其中排除有关adventure的记录。
综上所述,“+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容。
2.1.4. 精确匹配搜索
除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英文字符。虽然现在一些搜索引擎已支持中文标点符号,但顾及到其他引擎,最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。如:
"computer adventure games"
它与 +computer +adventure +games 的区别是:
虽然后者限定网页中要同时包含三个关键字,但其顺序和相邻位置允许是任意的。而前者不仅要求网页中必须同时包含三个关键字,关键字的顺序也要求完全相同,并且它们必须还是挨在一起的,所以带“”号的查询范围更小。
此外使用“”号进行精确匹配查询还可用于达到我们特殊的搜索目的。比如一般情况下“who”、“i”作为停用词被搜索引擎忽略,但有时在搜索特别类型的信息时又必须包含这些停用词(如搜索影片名称“Who Am I”),这时我们就可以将全部关键词用“”号引起来,就可以强制搜索引擎将停用词作为短语的一部分进行搜索。
通过对上面这些逻辑符号的组合,能组成复杂的搜索条件,如"computer game" -adventure +new等等,从而使查询结果更加准确。
2.1.5. 特殊搜索命令
对普通用户而言,熟练掌握前面介绍的几种搜索技巧就已经足够了。但有时我们难免会有一些特殊的需求,而搜索引擎也支持一些特殊的搜索命令,以方便我们精确定位所需信息。
2.1.5.1. 标题搜索
多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在Yahoo中是“t:”(注意冒号为英文字符且后面不跟空格)。在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。请看下面的例子:
· title(或t):computer adventure games
· title:+computer +adventure +games
· title:+computer +games -adventure
· title:"computer adventure games"
返回的结果都是标题中包含关键字、词的信息条目。
2.1.5.2. 网站搜索
此外我们还可以针对网站进行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。如想查找AAA游戏制作公司网站的所有网页,可以输入:
· site(或host/url/domain):www.
还可以在其中加入其他命令组成复杂的搜索条件,如:
· site:www. +title:"computer games" -adventure
意思是查找AAA公司网站中所有标题里含有computer games的网页,但排除关于冒险游戏的网页。
说到这里大家可能已经意识到了,运用此命令我们可以达到一个极其重要的目的,就是检查我们的网站被索引的网页有多少。因此建议大家牢记这个命令。另外运用“site/host/url/domain”等搜索命令还可实现某一网站的站内搜索。比如Google引擎由于技术的先进性,通过其“site”命令实现的网站内部搜索甚至比专门的站内搜索程序还要好。
2.1.5.3. 链接搜索
在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inbound links)。如:
· link:www.
其他一些引擎也有同样的功能,只不过命令格式稍有区别。你可以用这个命令来查看是谁以及有多少网站与你做了链接。
除上述命令外,还有其他一些特殊搜索命令,如“filetype:”(限定搜索的文档类别)、“daterange:”(限定搜索的时间范围)、“phonebook:”(查询电话)等等,感兴趣的话大家可以自己研究一下。Google引擎提供了比较完备的搜索功能,具体可参考Google从入门到精通专题介绍。
2.1.6. 附加搜索功能
2.1.6.1. 单词衍生形态查询
当输入“thought”时,如果选择了此功能,搜索引擎除以“thought”为条件搜索外,还会以“think”、“thinking”等同词根的词进行查询。
2.1.6.2. 网页快昭(Snap Shot)
直接从引擎数据库缓存(Cache)中调出该网页的存档文件,方便用户在预览网页内容后决定是否访问该网站,或是在对应网页发生变动时查看原始页面。通常缓存中保存的是网页的文字部分,图象等多媒体元素还是要实时从对应的网站上下载。与其他附加功能相比,“网页快照”还是相当实用的。
与网页快照相类似的还有一种“网页预览”功能(如WiseNut引擎的“Sneek-a-Peek”),当用户选择此功能时,将在该条目下方打开一个窗口下载并显示对应的网页内容。
2.1.6.3. 网站内部查询
当你找到某个网页,搜索引擎提供查询该网站其他页面的功能。类似“site:”、“host:”等命令。
2.1.6.4. 横向相关查询
当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其他网页的功能(不限于同一网站)。一般是在信息条目后面给出“Similar Pages”或“More results like this”链接。
2.1.6.5. 概念延伸查询
以某个关键词查询时,搜索引擎列出相关领域的其他搜索条件供你选择。比如输入“furniture”,它会列出“outdoor furniture”、“patio furniture”、“office furniture”等相关的信息类别供查询。
除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新闻搜索、图象搜索、新闻组搜索、Flash搜索等等不一而足。搜索引擎的初衷是好的,都是为了方便用户,至于哪些有用哪些没用则完全看个人喜好。以我们的观点,搜索引擎毕竟只是我们信息查询的一种工具,除非你想成为信息搜索专家,否则掌握基本的搜索技能并将之巧加运用就足以应付我们日常的需要了。
2.1.7. 用什么样的搜索引擎
搜索引擎分几种,工作方式也不同,因而导致了信息覆盖范围方面的差异。我们平常搜索仅集中于某一家搜索引擎是不明智的,因为再好的搜索引擎也有局限性,合理的方式应该是根据具体要求选择不同的引擎。这里我们根据自己的经验给大家提出些建议。
我们日常信息需求大致可分为两种,一种是寻找参考资料,另一种是查询产品或服务,那么对应的搜索引擎选择就应该是全文搜索引擎(Full-Text Search Engine)和目录索引(Search Directory)。为什么?
对前一种需求来说,由于目标非常具体,而目录索引中链接条目所容纳的信息量有限,无法满足我们的要求,因此全文搜索引擎便自然成了我们的选择。按照全文搜索引擎的工作原理,它从网页中提取所有的文字信息,所以匹配搜索条件的范围就大得多,也就能满足哪怕是最不着边际的信息需求。这也就是为什么现在多数目录索引都采用其他全文搜索引擎提供二级网页搜索的原因。
相反,如果我们找的是某种产品或服务,那么目录索引就略占优势。因为网站在提交目录索引时都被要求提供站点标题和描述,且限制字数,所以网站所有者会用最精练的语言概括自己的业务范围,让人看来一目了然。而多数全文搜索引擎直接提取网页标题和正文作为链接的标题和描述。用过全文搜索引擎的人都有这样的体会,就是搜索结果显示的信息往往过于杂乱,让人无法一眼就判断出该网站的性质。就我们来说,虽然我们是Google坚定的拥护者,但在搜索商业信息时还是经常用到搜狐、新浪、网易的目录搜索。
此外,当你要搜集某一类的网站资料时,目录索引的分类目录就是你天然的宝库。
那么究竟哪几个搜索引擎能够为我们所用呢?为方便大家查阅,我们结合平常的经验列出以下表格供各位参考:
常 用 搜 索 引 擎 一 览 表
国外搜索引擎
搜索目标(英文) 搜索引擎/目录索引
一般资料 Google
资料涉及非常冷僻的领域 AllTheWeb
特殊资料(其他主要引擎都查不到时) InfoSeek/WebCrawler/Vivisimo等多元引擎
国内搜索引擎:
搜索目标(中文) 搜索引擎/目录索引
一般资料 Google
古汉语(诗词)类资料 百度(个案显示这方面百度有独到之处)
产品或服务 搜狐、新浪(质量较高)/网易(较全)
3. 搜索引擎王者——Google
英文里原本没有Google这个词,美国斯坦福大学的博士生拉里-佩奇和比他小一岁的同窗学友谢尔盖-布林在1998年为他们新创的搜索引擎公司,这家私人控股公司在1999年6月宣布,它已经集到了2,500万美元的资金。Google 通过自己的公共站点 www. 提供服务。公司还为信息内容供应商提供联合品牌的网络搜索解决方案。
在取名时取的其实是数学名词"古戈尔"(googol,10的100次方,即数字1后跟100个零,常指巨大的数字)的谐音。这显然是一个充满勃勃野心的创业梦想,用创建人佩奇的话说:"我们的任务就是要对世界上的信息编组"。
Gooogle发展史:
1995年3月:谢尔盖-布林和拉里-佩奇在斯坦福大学计算机博士候选人的春季聚会上首次见面。
1998年9月7日:组建Google公司,位于加州一个车库,有四名员工。布林和佩奇从家人、朋友和投资者募集了100万美元。当时布林和佩奇分别为24岁和25岁。
1999年2月到6月:Google得到Sequoia Capital和Kleiner Perkins Caufield & Byers两家风险投资基金的2500万美元注资。
………
以下是Google发展历史上的重要日期:
1995年
3月:谢尔盖-布林和拉里-佩奇在斯坦福大学计算机博士候选人的春季聚会上首次见面。
1998年
9月7日:组建Google公司,位于加州一个车库,有四名员工。布林和佩奇从家人、朋友和投资者募集了100万美元。当时布林和佩奇分别为24岁和25岁。
1999年
2月到6月:Google得到Sequoia Capital和Kleiner Perkins Caufield & Byers两家风险投资基金的2500万美元注资。
2000年
5月到6月:Google每天进行1800万次查询,成为最大的互联网搜索引擎,雅虎选择Google作为默认的搜索结果供应商。
2001年
3月到4月:当时担任Novell首席执行官和董事会主席的埃里克-施密特加入Google担任董事会主席,很快又被任命为首席执行官。
2002年
3月到4月:Google推出了Google新闻的测试版。
9月到10月:Google在全球推出了关键词广告,在英国、德国、法国和日本都能提供关键词广告服务。
2003年
1月到2月:Google收购了Pyra实验室,这是网络出版工具Blogger的创建者。
5月到6月:Google推出AdSense,这一广告计划能按照网站内容做广告。
2004年
2月:雅虎开始推出自己的搜索技术,淡出Google搜索技术。
3月31日:Google宣布了免费电子邮件服务Gmail。
4月29日:Google向美国证券交易委员会提交IPO申请文件。
7月12日:Google表示将在纳斯达克挂牌交易,并披露了股票代码"GOOG.O"。
7月26日:Google披露将出售2460万股股票,价格在108到135美元之间,使公司的市值超过了36亿美元。
7月30日:Google开始在网站上接受投标者的登记。
8月5日:Google披露可能向以前和现在的员工非法发行股票和期权,提出回购这些股票和期权。
8月9日:Google提高招股数量,达到2570万股,将向雅虎发行270万股股票以便和解广告技术诉讼。
8月12日:Google结束投标者登记。
8月13日:Google开始接受IPO拍卖报价,《花花公子》登出对布林和佩奇的专访,这导致证券交易委员会的非正式调查,可能导致IPO推迟。
8月16日:Google要求证券交易委员会宣布上市登记有效,这是确定IPO价格和公开发行股票的第一步。
8月18日:Google将招股数量降低到1960万股,将IPO价格范围降低到85美元到95美元。Google结束拍卖,确定85美元的IPO价格,并获得了证券交易委员会的上市许可。
8月19日:Google以100.01美元开盘,比IPO价格上涨18%。
2005年
9月19日李开复加盟Google.
4. 几款当前主流的搜索引擎比较
4.1. 搜索结果数量比较
搜索引擎结果数量
搜索的关键字 Google谷歌 Baidu百度 Iask爱问 Sogou搜狗
2006年北大附中网校夏令营情况说明 3850 0 7 11
1982世界杯足球前四强的得主 23700 8 9120 893
2002年狮子座流星雨的情况和图片 5540 3440 190 304
小于200KB的FLASH指法练习小游戏 105 0 1 0
中国最早的人口普查资料 64200 47500 759 130834
此项研究可以初步表现Google无可撼动的搜索能力霸主地位(也可能是语法问题),除了人口普查资料一项搜狗领先以外,其他都是Google占有绝对优势。
4.1. 搜索结果准确率比较
相对而言,Google的准确性较高,不论是那方面的关键字。也许是由于Google关联性搜索算法的缘故。某些中文特有的关键字,百度较好,或许也是百度土生土长的缘故。百度还有“国学”板块。另外两款参加评比的搜索引擎,搜索结果很不稳定,偶尔有极合适的,更多是一些无谓的结果。
5. 搜索引擎的特殊功能介绍
鉴于之前的研究,此两网站最具有竞争力,故分析其特殊功能。
5.1. Google谷歌
5.1.1. 查找 Flash 文件
查找Flash文件,只需搜索“关键词 filetype:swf”。
Google已经可以支持13种非HTML文件的搜索。除了PDF文档,Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。
例如,如果您只想查找 PDF或Flash 文件,而不要一般网页,只需搜索“关键词 filetype:pdf” 或“关键词 filetype:swf”就可以了。
Google同时也提供用户不同类型文件的“HTML版”,方便用户在即使没有安装相应应用程序的情况下阅读各种类型文件的内容。用“HTML版”阅读也能帮助用户防范某些类型的文档中可能带来的病毒。
总的来说,不同类型文件类型的搜索大大拓宽了Google用户能在网上获得的知识内容。Google将不断拓展新的可搜索文件种类。
5.1.2. 地图查寻
使用Google查寻城市地图或具体地址,您只需要在捜索框直接键入城市名或地址后加上“地图”即可,或直接输入具体地址。
5.1.3. 网页快照
Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。
在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。
尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。
5.1.4. 货币转换
要使用我们的内置货币转换器,只需在 Google 搜索框中键入您需要完成的货币转换,并单击“回车”键或 Google Search 按钮即可。
5.1.5. 计算器
Google 为用户提供了一个内置计算器。只需要在搜索字段中输入算式,按一下回车键或者搜索就可以了。这个计算器可以用来做所有简单的计算,一些复杂的科学计算,单位换算,以及提供各种物理常数。
5.1.6. 相关搜索
Google 能够提供与您原搜索相关的搜索词。这些相关的搜索词是根据过去 Google 所有用户的搜索习惯和 Google 提供的计算两个搜索词之间相关度的独家技术而产生出来的。这些相关的搜索词一般比原搜索词更常用,并且更可能产生相关的结果。只需点击我们提供的相关搜索词,您会自动被带到这个词的结果页。
Google 相关搜索将帮助您更快地找到更有价值的结果。
5.1.7. 类似网页
单击“类似网页”时,Google 侦察兵便开始寻找与这一网页相关的网页。
Google 侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google 侦察兵会帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google 侦察兵会为您提供相关信息,供您比较,使您尽可货比三家;如果您在某一领域做学问,Google 侦察兵会成为您的助手,帮您快速找到大量资料。
Google 侦察兵已为成千上万的网页找到了类似网页,但网页越有个性,能找到的类似网页就越少。例如,您独树一帜的个人主页就很难有类似网页。此外,如果公司有多个网址(如 和 www.),Google 侦察兵为各个网址找到的类似网页可能会有所不同。但这种情况实属罕见,Google 侦察兵将是您出色的助手。
5.1.8. 按链接搜索
有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。查询 link: 显示所有指向该网址的网页。例如,“link:www.”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。
5.1.9. 指定网域
有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:”。
5.1.10. 手气不错
按下“手气不错 ”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。
例如,要查找 Stanford 大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接带您进入 Stanford 大学的官方主页 www.stanford.edu。
5.1.11. 错别字改正
Google 的错别字改正软件系统会对输入的关键词进行自动扫描, 检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google 会自动提示 “您是不是要找:互联网”。如果您点击 “互联网”,Google 将以“互联网”作为关键词进行搜索。
因为Google 的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。
5.1.12. 中英文字典
Google 给中英文单词互译带来了极大的方便。您只需输入一个关键词(“翻译”,“fy” 和“FY” 任选其一)和要查的中 (英) 文单词,Google会直接显示您要查的单词的英文(或中文)翻译。
5.1.13. 天气查询
用Google 查询中国城市地区的天气和天气预报,只需输入一个关键词(“天气”,“tq” 或“TQ” 任选其一)和您要查询的城市地区名称即可。Google返回的网站链接会带给您最新的当地天气状况和天气预报。
5.1.14. 股票查询
用Google 查询股票价格和股市行情,非常简洁方便。您只需输入一个关键词(“股票”,“gp” 和“GP” 任选其一)和想查询的股票证券名称或是其六位数代码,Google就会返回其他链接让您只要一次点击便能得到有关股票证券的详尽资料。
5.1.15. 邮编区号
用Google 查询邮政编码或长途电话区号,您只需输入关键词(“邮编”,“yb” 和“YB” 任选其一;“区号”, “qh” 和“QH” 任选其一)和要查的城市地名或邮政编码或电话区号即可。Google 会为您提供相关的所有信息,包括所在地的省市名称,邮政编码及长途电话区号。
5.1.16. 手机号码
用Google 查询手机电话号码归属地,您只需直接输入要查的号码即可(不需要任何关键词)。Google 能自动识别以13开头的11位数字为手机号码而返回相关的网站链接,让您即刻便知道答案。
5.1.17. 农历日历转换
用Google 直接查询农历日期、节气和农历节日,只需键入关键词(“阳历”、“公历”、“阴历”、“农历”或它们的拼音缩写 “gl”、“nl”)加上日期即可。也可以直接输入节气名称、农历节日名称,加上年份或“去年”,“今 年”,“明年”。
5.1.18. 定义
要查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。如果 Google 在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。
5.2. Baidu百度
由于百度跟Google都有许多相似的搜索功能,此处仅介绍其特有的一项功能,其他以上Google具有的功能百度大多具有
5.2.1. 拼音提示
如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输入太麻烦,该怎么办? 百度拼音提示能帮您解决问题。只要您输入查询词的汉语拼音,百度就能把最符合要求的对应汉字提示出来。它事实上是一个无比强大的拼音输入法。 拼音提示显示在搜索结果上方。
6. 搜索引擎05年总结及展望
随着信息技术的进步与互联网络的飞速发展,网络上的信息资源是越来越多,在这个浩瀚的网络资源里,要想找到自己需要的资料,必须借助于搜索引擎。05年百度公司的成功上市,创造了中文搜索引擎的神话,11月17日Google公司的股价一度超过400美元,创下历史新高。这所有的一切都说明,互联网搜索引擎公司的强大潜力,与大家对搜索引擎的大力支持。
05年也是互联网搜索引擎大力发展的一年,搜索技术进一步的提高,搜索引擎不再仅仅局限于页面搜索,而进一步的细化,向专业方向发展,各大搜索巨头都纷纷推出了MP3、图片搜索等特色服务,同时在桌面搜索、地图搜索等专业搜索方面也各使高招,成为各大公司争夺市场的新焦点。
6.1. 页面搜索细化专业搜索更具特色
05年搜索引擎不再只是仅仅局限于搜索各网站页面,而是向专业方向发展。百度推出了新闻、MP3、图片、文档、黄页等(如图1所示),Google也推出了新闻、图片、论坛、大学、学术论文、图书等搜索引擎技术(如图2所示)。只要切换到相应的页面,然后输入想要搜索的关键字,就可以在数以万计的网站中找到自己需要的资料。搜索引擎进一步的细化,分类更加明确,从而使我们操作起来更加方便,搜索准确度也进一步的加强。
随着网络的发展,也出现了一些更加专业的个性化搜索引擎,如专业论坛搜索引擎"奇虎"(地址:http://www./),在这里可以对国内各大论坛的帖子进行搜索,从海量的互联网信息中提取主题词信息索引成列表,为我们提供个性化的内容浏览、搜索与订阅服务,不用再登录各论坛,就可以相关帖子信息送到我们的电脑中来。
随着网上博客的热潮,越来越多的人开始写自己的博客了,随着网上的博客文章越来越多,我们虽然可以通过RSS阅读器来订阅博客,但如果要查找某个关键词的所有博客文章,看一下所有人的看法,若一个个博客站查找就会浪费大量时间,所以方便大家搜索博客文章的中客搜索引擎(地址:http://www./)诞生了(如图3所示),在这里我们可以对博客、播客、博闻、目录等进行搜索,其使用方法与百度、Google一样,只是搜索结果不再是网站页面,而变成了个人博客文章。
专业搜索虽然在搜索资料方面为了我们提供了很大的方便,但其发展也不是一帆风顺的。百度被七家唱片公司告上法庭,最后以侵权败诉而终,这使的百度公司不得不改变其MP3搜索。Google公司也受到出版商的起诉,告其图书搜索侵权。
6.2. 浏览器工具条 哪个提供服务更方便
各大搜索公司为了方便广大网友,当然也是为了扩大自己占有的市场份额,纷纷推出了搜索工具条服务,只要安装了其搜索工具条后,不用登录搜索主页,也可以进行搜索。
百度推出了超级搜霸工具条,只要安装了该工具条后,就可以在浏览器地址栏下方多了搜索工具条(如图4所示),安装该工具条后,除了具有搜索的功能外,还可以起到拦截网络广告的作用,还您一片干净的网络空间。
Google也推出了自己的搜索工具条,同样安装该工具条后也会在浏览器地址栏下安装一下搜索工具条(如图5所示),该工具条功能要比百度的多一些,除了可以拦截网络广告外,还可以起到字词翻译、实名通、拼写检查等功能。
微软在网络方面的起步比较晚,看到Google与百度等公司的快速发展,也很快加入到网络搜索这个阵营,凭借公司强大的财力与技术支持,通过今年一年的发展,其网络方面也初露锋芒。微软推出了MSN搜索工具条(如图5所示),通过该工具条可以与Hotmail等服务进行有机的结合,方便了广大网友。
6.3. 不会再迷路 地图搜索激战正酣
地图搜索是网络公司今年新推出的服务,从今年年初Google推出在线地图服务Googl Map后,随后微软(MSN)、雅虎、百度、中搜也很快加入了这个战场,使用的地图搜索服务日趋火热起来。
Google地图搜索(地址:http://maps.)界面为英文(如图6所示),以北美为起始点,可以进行15级的缩放。借助该服务可以方便的找到某个具体的城市或是街道,由于Google地图大量的采用了实拍的"卫星地图",所以我们可以真实的鸟瞰城市风貌,同时地图的准确程序也更高。Google还推出了Google地球服务,通过3D地图定位技术,把卫星图像做成了3D地图,可以在这里搜索特定区域,放大或是缩小虚拟图片。
微软也推出了其地图搜索服务:MSN虚拟地球(http://local./),了同样使用了卫星图片,可以在这里方便的找到具体街道与不同地区的路线图。
国内各大搜索门户站也推出了符合中国人习惯的地图搜索服务,其中包括百度、新浪爱问、搜狗等。通过地图搜索服务,我们可以找到指定的城市、城区、街道、建筑物等所在的地理位置,也可以找到离您最近的所有餐馆、学校、银行、公园等等。地图搜索还为我们提供了路线查询功能,如果您要去某个地点,地图搜索会提示您如何换乘公交车,如果您想自己驾车去,地图搜索同样会为您推荐最佳路线(如图9所示为百度地图搜索)。
6.4. 系统搜索不够强看我硬盘搜索软件
随着使用电脑时间的加长,硬盘中的文件会越来越多,时间一长,想找到某个文件或是图片会非常麻烦,由于Windows系统提供的搜索文件功能比较弱,所以为了能够快速搜索硬盘中的文件,各搜索公司推出了自己的硬盘搜索软件,通过对硬盘中的文件进行索引,这样查找起来就更加方便迅速。
与地图搜索一样,桌面搜索也是今年各大搜索巨头纷纷争夺的阵地,自从Google去年年底发布硬盘搜索工具以来,随后微软、雅虎、百度都纷纷推出了自己的硬盘搜索软件。所有硬盘搜索软件的功能不相上下,都是在安装完硬盘搜索软件后,软件会对你本地硬盘的文件进行索引,等索引完成后,输入关键字就可以对其进行搜索(如图10是Google硬盘搜索结果页面)。当然了,出于安全考虑,有的硬盘搜索软件会为搜索结果添加密码,以保证搜索结果的安全。
6.5. 搜索社区化搜索结果更人性
以前我们所用的搜索引擎,无论是页面搜索还是桌面搜索,都是通过一定的程序对搜索内容进行索引,然后通过算法再对其进行查找,但这样搜索到的结果是有限的,有时候甚至搜索不到我们需要的答案。在这些情况下,新浪推出了智慧性搜索引擎"新浪爱问",把搜索推向了社区化。当你有问题的时候,如果使用其它搜索引擎找不到答案,可以把你的问题发到"爱问"中,这样看到的人就会给你做出解答,直到找到正确答案为止。推出该类服务的还有百度的"知道",同样了是采用了问答的方式,从而使我们的问题找到最佳的答案,使的搜索变成了一个互动的平台,不再只是单纯的机器算法,而把人的思维添加到了搜索当中。
6.6. 总结
通观05年搜索引擎的发展,我们可以看出,搜索不再只是单纯的搜索网站页面,而是越来越细化,越来越有针对性。专业搜索服务越来越受到大家的欢迎,也是各大搜索引擎公司的重点。特别是在微软加大对网络方面的投入,与google的竞争形成白热化的情况下,必将使06年的搜索市场得到更大的发展和革新。
延续05年搜索引擎的发展重点,明年专业搜索将会更进一步的加强,与GPRS配套的地图搜索也可能由现有的2D化转型为全3D地图搜索,这样会为自驾车一族更为轻松地出游创造条件。
从05年博客发展趋势来看,博客市场在06年会更加蓬勃壮大。这必然带动专业得博客搜索引擎更好地发展,同时也能让广大网友阅读到更多的博客日志。而专业博客搜索引擎也会推动博客市场朝更加专业化和多元化的方向发展。
视频搜索仍是热点。在网络新人辈出的05年,使一部分普通人成为了名人。因此,06年,视频必将是搜索引擎的一种主要的信息输出方式。这种大环境将造就专业视频搜索的繁荣和壮大。
同时,由于互联网不断创新,也可能会出现其它的专业搜索服务。比如,医疗、法律等更为专业的服务。
7. 个人心得体会
经过短短几天对搜索引擎的研究,使得我初步认识了目前世界上的搜索引擎的发展水平与使用技巧。当前的搜索已经成为了网络生活中不可或缺的一部分。
听过一个笑话,说有位仁兄每次登陆Gmail都要在google中搜索,然后点选第一个页面。当然这仅是个笑话,不过也就是搜索引擎才使得我们脱离了一个个背网址,也使得像我们现在这样从网上东拼西凑出来一篇文章也成为了可能,我们应当感谢搜索引擎。
有优点就必然也有缺点,搜索引擎实际上对人的隐私也构成了威胁。相传现在想要知道一个人生平,不必怎样去请侦探公司,只需要问问Google就行了。(国内貌似还不到这种程度,但是国外已经是无所不能了)
有利则有弊,搜索引擎也就是这样的一把双刃剑吧。
2006年10月10日
有关搜索引擎的研究报告
北大附中 高一一班
刘欣旸(共23张PPT)
旅游地点:海南省三亚市、广东省深圳市、福建省武夷山
旅游时间:“十一”期间
旅游人数:2人(我们俩自己去,好好加深一下感情~)
信息来源:敬爱的百度娘和google爸~(所以这ppt是个混血儿!)
亚龙湾蝴蝶谷修建在原始幽深的热带丛林之间,三面环山,一条清澈的溪流贯穿谷底,谷内小桥流水、景色宜人,自然生长着成千上万只色彩艳丽的彩蝶,是我国第一个集展览、科教、旅游、购物为一体的蝴蝶文化公园。 蝴蝶谷占地面积1.5公顷,拥有一个大型生态蝴蝶园和一个藏有2000多只珍贵蝴蝶、昆虫标本的博物馆。价值数万美金的国家唯一一级保护昆虫——金斑喙凤蝶和众多难得一见的蝴蝶、昆虫标本在此安家落户。
蝴蝶谷处于热带半落叶季雨林,植被丰富,生长着众多珍贵的龙血树(不老松)和眼镜豆、黑格、水翁等360多种植物,其中许多是天然的蝴蝶寄主,如龙珠果藤,马豆玲藤,樟树、黄杯、铁刀木、黄皮、榕树、夹竹桃等。由于其优良的生态环境,加上合理的人工改造,蝴蝶谷已成为世界上独具特色,人类与自然,结合得最完美的蝴蝶园之一。
这里是亲近自然、放松心情的最佳去处!
仙湖植物园位于市东郊莲塘,东依巍峨壮美的梧桐山,西临风光旖旎的东湖水库。因其内有“仙湖”,故名。仙湖植物园向人们展示了多姿多彩的植物世界。根据植物的分类,目前已建成有棕榈区、苏铁区、竹区、百果园、水生植物园和珍稀树木园等多个植物专类园,保存的植物多达3000多种,其中包括诸如桫椤、银杉、金花茶、珙桐等多种名贵或珍稀濒危植物。仙湖植物园地理自然条件优越,山青水秀,谷深林幽,金色琉璃瓦园林建筑点缀其间,更显格外迷人。
全园主要分庙区、湖区和天上人间三大景区。庙区包括岭南最大寺庙——弘法寺和其下面的逍遥谷等。弘法寺内,终日香烟燎绕,庄严肃穆如天国。逍遥谷中,林深蔽日,溪水如歌,曲径通幽。湖区主要是棕榈区及仙湖四周各景点。绿油油的草地,洁净如地毯。草地三面为郁郁葱葱的绿树所环抱,一面与清澈如镜的湖水相接。山光水色,亭台楼阁倒映于湖水之中,平静的湖上,轻舟荡漾。天上人间景区,除主要观赏形态各异的植物花卉外,还有妙趣横生的植物八卦迷宫,别有洞天等景点。园内还有登山道直通梧桐山顶.
深圳欢乐谷三期主要包括欢乐时光、欢乐干线、欢乐水世界、欢乐无极四大欢乐系列;其中“欢乐时光”是三期项目最重要的部分,欢乐谷三期是华侨城集团继欢乐谷一期、二期后又一重大创新项目,它与欢乐谷一期、二期一脉相承,秉承了一、二期的高科技含量和参与性游乐主题等特点,但欢乐谷三期同时也是华侨城旅游发展一种新的尝试,它突破了纯粹旅游项目改造的方式,增加了更多的娱乐元素,产品更丰富,通过全新的娱乐产品、娱乐形态,营造出“玩不完的欢乐谷”,“一个永不落幕的嘉年华”,真正融入城市,贴近消费者、贴近生活,成为一个动感、时尚、欢乐、梦幻的“都市娱乐中心”。
一次次惊心动魄的欢乐历程,一个个亦真亦幻的欢乐世界,中国最具魅力的都市娱乐中心,一个“动感、时尚、欢乐、梦幻”的繁华都市开心地将让你永志难忘! 深圳欢乐谷正在成为21世纪的欢乐王国,一座真正意义的快乐大本营。
武夷山脉,横亘千里,宛如一条绿色的长龙蜿蜒迤于闽、浙、赣、粤四省。驰名中外的武夷山国家级自然保护区就座落于武夷山脉偏北的最高地段,是我国东南大陆现存面积最大、保留最为完整的中亚热带森林生态系统。被纳入联合国世界生物圈保护区网络及评为具有全球保护意义的A级保护区。风景名胜区主景区方园60平方公里,平均海拔350米,属典型的丹霞地貌,素有素有「碧水丹山」、「奇秀甲东南」之美誉,是首批国家级重点风景名胜区之一,被国际旅游组织执委会主席巴尔科夫人称为「世界环境保护的典范」。森林植被保存完整,生物资源丰富,珍稀种类繁多。已定名的高等植物2466种,低等植物840种,脊椎骨动物475种,昆虫31个目近5000种。有国家重点保护植物26种,国家一、二类保护动物56种,另有「角怪」等数十种本区特有的世界罕见物种,素以「模式标本产地」闻名于世。保护区与武夷山国家级风景名胜区毗邻,区内峰峦林立,气势磅礴,既有醇厚古朴的原始大森林风貌,又有造化神奇的俏丽英姿,是融雄浑、古朴、隽秀于一体的一方圣土,是回归大自然的胜地。
鼓浪屿位于厦门岛西南隅,与厦门市隔海相望, 面积1.78平方公里,2万多人,为厦门市辖区。鼓浪 屿原名圆沙洲、圆洲仔,因海西南有海蚀洞受浪潮冲 击,声如擂鼓,明朝雅化为今名。由于历史原因,中 外风格各异的建筑物在此地被完好地汇集、保留,有 “万国建筑博览”之称。小岛还是音乐的沃土,人才 辈出,钢琴拥有密度居全国之冠,又得美名“钢琴之 岛”、“音乐之乡”。岛上气候宜人四季如,无车马 喧嚣,有鸟语花香,素有“海上花园”之誉。主要观 光景点有日光岩、菽庄花园、皓月园,毓园、环岛 路、鼓浪石、博物馆、郑成功纪念馆、海底世界和天 然海滨浴场等,融历史、人文和自然景观于一体,为 国家级风景名胜区,福建“十佳”风景区之首,全国 35个王牌景点之一。随着厦门经济特区的腾飞,鼓浪 屿各种旅游配套服务设施日臻完善,成为观光、度 假、旅游、购物、休闲、娱乐为一体的综合性的海岛 风景文化旅游区。
“那、那就带15000元吧……”我们俩看着这庞大(?)的数字,一边蹲墙角一边说。
1.衣服&泳衣
2.背包
3.指南针
4.雨伞&遮阳伞
5.防晒霜
6.小型医药箱
7.mp3&相机
8.通讯设备(及其充电器)
作业……(共12张PPT)
我叫姚健婷,是10届01班的学生。我的兴趣爱好十分广泛,喜欢打球、看书……我平时在家也经常用电脑——上网,写文章……
以前在附中学习的时候就上过信息课,来过机房,所以信息课对我来说并不陌生。我以前觉得信息课就是计算机课,今天上了高中的第一次信息课才知道,信息≠计算机。
信息就是对客观事物的反映,对社会、自然界的事物特征、现象、本质及规律的描述。
信息也可以说是一种报道,而报道的内容是接收的人预先不知道的。
信息是物质的属性,是物体反映出来的特征,它是事物间相互联系、相互作用的中介。
信息只有被人发现,只有当事物间相互联系、相互作用所传达的意义进入人的视野时,信息对人才是有意义的,这时的信息是被人为地赋于了精神意义的东西,具有明显的精神属性。也只有这样的信息对人而言才是存在的。
我感受最深刻的是信息的时效性。有些信息的时效性长,比如一些定理、客观事实,可能从它产生到现在已经过去了几百年,但它依然是有效的。有些信息的时效性短,比如股市行情、天气预报、新闻等等。因为这类信息的时效性短,所以掌握它们就十分重要,同时人们也在利用信息的这一特性,比如,很多媒体为了得到第一手的资料而争先恐后地去现场报道、采访,像天气预报这类的信息,如果过了“有效期”,就没有人会再去关注它了,它也就没有价值了。
远程教学
远程教学不仅打破了传统的时空限制,也能充分利用高质量的教育资源,最大限度地发展教育功效,所以是现在也是未来的重要的教育手段。 远程教学有多种不同的形式,函授教学、电视教学、广播教学都属于远程教学的范畴,这些教学方式有很多优点,比如能充分的利用教育资源让更多的人受教育。现在我们在这里所说的远程教学是利用通信、网络、多媒体、计算机设备和技术,克服传统远程教学的局限性而形成的新型远程教学模式。现代化远程教学需要完备的教学系统支持,该系统有三个环节或控制环境,主播室是教师的教学环境,用于采集教学信息;远程教室是学生学习的环境,接收教学信息、反馈学生信息;两者信息受控于计算机网络。
GPS
即全球定位系统(Global Positioning System),它是一个中距离圆形轨道卫星定位系统,可以为地球表面绝大部分地区提供准确的定位和高精度的时间基准。该系统是通过太空中的24颗GPS卫星来完成的。最少需要其中3颗卫星,就能迅速确定您在地球上的位置。所能接收到的卫星数越多,译码出来的位置就越精确。在汽车定位时,只需要在汽车上装一台比32开书本略小的“车载终端”就可以了。
电子商务
电子商务通常是指是在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于浏览器/服务器应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。
手机上网
WAP (Wireless Application Protocol)无线应用协议是一个开放式的标准协议,可以把网络上的信息传送到移动电话或其它无线通讯终端上。WAP是由爱立信(Ericsson)、诺基亚(Nokia)、摩托罗拉(Motorola)等通信业巨头在1997年成立的无线应用协议论坛(WAP Forum)中所制定的。它使用一种类似于HTML的标记式语言WML(Wireless Markup Language),并可通过WAP Gateway直接访问一般的网页。通过WAP,用户可以随时随地利用无线通讯终端来获取互联网上的即时信息或公司网站的资料,真正实现无线上网。
发展历史
古代-甲骨文,狼烟,旗语,飞鸽传书,快
马,书信……
近代-电报,电话,报纸,广播……
现代-传真,传呼,电视,广告……
当代-网络,手机……
发展趋势
1.高速、大容量。
2.综合化。
3.数字化。一是便于大规模生产。过去生产一台模拟设备需要花很多时间,而数字设备是单元式的,设计非常简单,便于大规模生产,可大大降低成本。二是有利于综合。
4.个人化。一个人在世界任何一个地方都可以拥有同样的通信手段,可以利用同样的信息资源和信息加工处理的手段。
网络化。通信本身就是网络,其广度和深度在不断发展,计算机也越来越网络化,各个使用终端或使用者都被组织到统一的网络中。
6. 智能化。信息技术本来就是减轻或替代人脑的劳动的,随着社会进步,已从替代人脑的简单劳动(如四则运算)逐渐向复杂劳动(分析、判断、处理等)发展,技术上说无论是计算机还是通信都在逐渐智能化。vti_encoding:SR|utf8-nl
vti_timelastmodified:TR|25 Sep 2007 03:04:43 -0000
vti_extenderversion:SR|6.0.2.6551
vti_nosourcecontrol:SR|True
vti_author:SR|STU\\g1020132
vti_modifiedby:SR|LDM-ILMZPSF5BWL\\ldm
vti_nexttolasttimemodified:TR|12 Sep 2007 04:50:07 -0000
vti_timecreated:TR|12 Sep 2007 04:50:07 -0000
vti_backlinkinfo:VX|ldmweb/2010/10_01/First/10灞奯01鐝璤绗 03_04娆 /10_01_02_set_out/1020132\\ 鑰跨劧\\ 绗 02涓?綔涓 /mysite5/feedback.htm
vti_cacheddtm:TX|12 Sep 2007 04:50:07 -0000
vti_filesize:IR|0(共8张PPT)
高一(1)班
钟博远
2007-9-11
1、红外热辐射温度仪
2、电子称
3、数码照相机
4、血压计
计算机技术
感测技术
1、数字图象处理
2、计算机网络与通讯
3、计算机安全与保密
4、人机界面
通信技术
1、ATM交换机
2、移动电话
3、卫星电话
4、卫星转播
1、汽车制造
2、控制水解结晶过程的pH值
3、催化裂化装置
4、奶牛性别控制
控制技术
过去找路问人查图 如今出行卫星定位
1
GPS与生活亲密接触
当你奔波了一天,饥肠辘辘地急于找到一家快餐店时,你打开手机,点击相应的服务栏,GPS系统就会在你的手机上显示出距你最近的餐饮点布局图示,并标出最佳路线,届时,你的汽车导航系统可以实现全程无人驾驶,把你安安稳稳地送到你想去的地方。这就是通过卫星信号掌握自己所处位置的全球定位系统(GPS),它正越来越多地介入我们的生活。使用引入了这一功能的手机,可以搜索距自己最近的商店、车站的位置,当然,其前提条件是这些商店、车站等必须加入GPS的数据库。而在农业上的应用更为神奇,GPS甚至可以告诉农户哪些田块需要施用农药,并根据虫情控制药量。
感测技术
计算机技术
通讯技术
计算机技术
精确测算自己所处的位置,最少需要3颗卫星,把高度也包括在内的三维位置信息则不能少于4颗卫星。若定位进一步精确到几厘米,面临的一大难题是来自卫星的电波在到达地面之前会受到大气层的影响。为此,日本通讯综合研究所正在研制一种走时精度达万亿分之一秒的时钟,将其搭载到卫星上,以便使定位精度大幅度提高。
随着GPS系统定位的进一步精确,将会给生活环境带来令人耳目一新的变化。比如汽车,现在一些大城市出现的银行押款车就可以凭借GPS系统实现无人驾驶,而且无论处于什么位置都无法摆脱安全监控,路途中该车既可准确行驶在路面白线内,又能及时避让迎面的会车,安全到达目的地。在此基础上,用GPS武装起来的残疾人轮椅、生活机器人等也将陆续呈现在人们面前。
计算机技术
通讯技术
+
控制技术
+
2
英国剑桥大学的两位计算机专家发明了一种智能软件,可以使人不用键盘不动手,光靠眼睛的移动来打字,这一发明使残疾人打字难的问题有望得到解决。
据英国媒体报道,这种软件被命名为“猛冲者”。利用这套软件时,人们只需要移动自己的视线就可以在屏幕上“打出”不同的词句,每分钟可输入34字,跟常规的键盘打字速度差不多。
发明这一软件的两位专家是剑桥大学凯文迪什实验室的戴维·沃德和戴维·麦凯。据他们介绍,利用这套软件来“打字”就像从一个巨大的图书馆里寻找自己想要的文章一样。软件包括一个跟踪系统和摄像头,利用它们来跟踪眼睛的移动。当眼睛盯住一个字母时,摄像头马上把这一情况报告给计算机,计算机随即在屏幕上显示出一系列以该字母开头的单词供人选择,以此类推,直到“打出”整个单词或者句子。
另外,这种软件还能够根据不同人的写作风格作出调整,形成不同的语言模式,从而大大提高了词句的输入速度。此外,用这种方法输入词句,实际上是在“选择”单词,因此很少出现拼写错误。
神奇的“眼睛打字”软件问世
计算机技术
感测技术
控制技术
我想,随着半导体、光纤技术的发展,生活中,我们将可以从因特网下载节目,电视将能和人交流、互动。
手机将不仅仅只能够打电话、上网,还可以和人交流。
学校里,学生们可以用电脑录音、识别手写的文字,无需课本就能实现更有效的学习。
在农业方面,通过软件的分析计算,用较少的农药培育出高产量的优良品种。
医学上,人们将建立更为庞大的基因数据库。
希望信息技术课能教会我们更多的专业知识和计算机方面的技能。使我们将来能为祖国的信息事业贡献自己的一份力量。2007届 3A班 第XX组第一个活动主题及计划
1、 人员编制
组长:崔元硕
组员:赵霄、冯景辰、赵润中
2、 活动主题
同学们上课时的千姿百态
3、 人员分工
崔元硕:图像处理
赵霄、冯景辰:拍摄
赵润中:制作演讲稿
4、 活动计划
1、 确定拍摄内容
2、 按拍摄内容进行拍照
3、 筛选并处理图片
4、 制作演讲稿
5、 结束信息与信息技术
北大附中 高一(1)班 姚竞凌
个人简介:我叫姚竞凌,今年15岁,就读于北大附中高一(1)班,今年是我在附中的第4个年头。我性格开朗活泼,喜欢交朋友,有自己的兴趣爱好,如绘画、唱歌、弹琴、阅读等。我最喜欢的颜色是天蓝色,最喜欢的书是《小妇人》,最喜欢抒情、轻柔的音乐。小学时我曾参加过学校的计算机兴趣小组,但现在的电脑技术一般,不过我喜欢学习新知识,也乐于在探索中学习。
我对信息概念的理解:在我眼中,信息就是事物的性质、特点、变化、运动中被主体(人)所感知到的部分。
实际中信息特性的体现:网络使我充分感受到了信息的共享性。当老师布置下需要查找资料才能完成的作业时,许多同学首选的资料库就是网络。即使几个人同时选中同一份资料,同时下载,每个人都会得到相同的一份资料,网站上原有的文章也不会消失,而是在等待更多人的浏览或下载。
信息技术的前沿应用:导弹、雷达、航空航天、手机、计算机、核潜艇。
信息技术发展历史及发展趋势:
信息技术在人类社会发展历史上主要体现在五次信息技术革命上。第一次信息技术革命是语言的使用,是从猿进化到人的重要标志;第二次信息技术革命是文字的创造,使信息的存储和传递首次超越了时间和地域的局限;第三次是印刷术的发明,为知识的积累和传播提供了更为可靠的保证;第四次是电报、电话、广播、电视的发明和普及,进一步突破了时间与空间的限制;第五次是计算机技术与现代通信技术的普及应用,将人类社会推进到了数字化的信息时代。
信息技术将向人性化和大众化的方向进一步发展。通过虚拟现实技术、语音技术和智能代理技术的发展,人机界面将越来越友好;功能设计将根据人们不同的需求越来越个性化;信息技术正向低消耗、高速度的方向发展,性能价格比将越来越高;信息技术的发展速度还将越来越快,以适应飞速发展的社会;各国之间关于信息技术的合作将更加密切,技术领域的竞争也会愈加激烈;信息技术还会继续向全球化的方向不断发展。for-
differences
----网络搜索研究报告
高一1班
王若含
TOC \o "1-4" \f \p " " \h \z ----网络搜索研究报告 1
导言 4
关键词 4
正文 4
搜索引擎的过去,现在与未来 4
蛮荒时代(46亿年前-1989) 4
花季16年(1990-2006) 4
现在(2006.X.X~) 6
未来(20XX,3XXX, 4XXX。。。) 7
搜索引擎的工作原理 7
概念 7
搜索=大索引 7
工作过程 8
搜索引擎的种类及其区别 9
全文搜索引擎 9
目录索引 9
元搜索引擎 (META Search Engine) 9
其它 10
常见的搜索引擎及其特点 10
常用中文搜索引擎 10
常用英文搜索引擎 11
亲手开启引擎的必备技巧 12
1:选择最好的搜索工具 12
2: 使用组合搜索关键词 12
3:使用自然语言搜索 12
4:适当的名词首字母大写 12
5:不要犯愚蠢的错误 13
6:小心使用布尔符 13
7:点击搜索结果前先思考 13
8:向搜索专家学习 13
9:培养自己有效的搜索习惯 13
10:不要放弃 14
搜索引擎的iq与eq 14
IQ~ 准确率: 14
IQ~速度: 14
IQ~其他 14
EQ~ 善解人意 14
特色网站介绍 15
百度MP3搜索 15
LRC歌词大全 15
百度文档搜索 15
BT种子搜索 15
雷区电影搜索 15
环球搜索Yahoo寻人搜索引擎 16
优秀的图像搜索引擎Google 16
Excite 16
搜索引擎比较 17
心得体会 17
导言
“我们若能更妥善地搜寻资料,实在已经改变世界。”难道不是如此么?
搜索引擎,这个后现代社会不可小视的组成部分 ,存在的意义,便是为人类世界的发展,提供一种能量 。
所以,它被人叫做“Engine”(用百度百科上的话说,引擎,就是发动机的核心。)
所以我们就有了了解它的必要。
关键词
正文
搜索引擎的过去,现在与未来
蛮荒时代(46亿年前-1989)
据现有资料看,这时段地球上的物质或场还没有叫做“搜索引擎”的。
花季16年(1990-2006)
1990-Archie所有搜索引擎的祖先~~,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
spider--Google祖先~~由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
ALIWEB--Yahoo祖先~~1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
Metacrawler --元搜索引擎~~1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。(注:元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。)
Altavista~~DEC的Altavista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选Altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(Altavista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计Altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。
而Altavista的另一些新功能,则永远改变了搜索引擎的定义。
Altavista是第一个支持自然语言搜索的搜索引擎,Altavista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用Altavista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。Altavista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。Altavista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,Altavista也作了大量革新。它在搜索框区域下放了"tips"以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,Altavista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。(2003年2月18日,Altavista被Overture收购。)
GOOGLE革命~1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
事实上,全网搜索引擎技术产生的突破性变化并不多。在搜索引擎的发展上,大的转变一般被认为有三次:第一次就是根据关键词在正文中出现的次数进行排序;第二次是Google的Pagerank技术带来的思想创新,这也是百度所提出的“超链分析”技术,核心思想是一个网页被其他网站引用的次数越多,这个网页的重要性就越强。当然,之后衡量PageRank的权重因素增加了很多种。第三次是伴随着商业收费模式诞生的“自信心”原则,指的是如果商家愿意为一个关键词付费时,那说明这个网站的价值也比较高,也应该放在前面。客观上来说,最后一次改变更像是搜索引擎公司为了收费而杜撰的理由,技术性的因素很小。
现在(2006.X.X~)
仍然说不清地球上是否有物质或场被叫做“搜索引擎”的,但我们知道 “搜索引擎”这个 “东西”已经“融入了日常生活”。
搜索引擎已经开始取代很多门户网站在网民心目中的位置,这同它们不断扩充的服务项目有关。比如百度和中搜网推出的新闻系统,他们可以更快的集成各种新闻,而且可以不用任何一名编辑。在这个新闻系统创建的过程中,尽管使用了搜索引擎的部分技术,但实际上同全网搜索服务是分离开的,因为新闻技术要求的实时性非常高,而全网搜索无法满足这种需要,因此,搜索引擎的新闻聚合技术主要考虑了快速和编辑功能。而Google已经成熟的新闻邮件定制功能也获得了很多用户的喜爱。
搜索引擎甚至开始涉及很多门户最火热的论坛,百度推出的“贴吧”就是一个例证。在百度创始人李彦宏看来,既然用户寻找同一个关键词,那说明他们关注的事情属于同一类,在搜索引擎无法提供满意的结果同时,人和人之间的交流或许可以带来更好的结果。不过从运行的结果看,除了“美女”和一些人们喜欢发表评论的关键词外,好像并不能给用户的搜索带来更多更好的效果。而Google斥重金收购最大的Blog系统也是因为看到了Blog的私人空间可能给搜索带来的巨大意义。
而MP3下载、Flash搜索这样的功能对于吸引网民更为实用。百度推出的MP3搜索就非常成功,百度技术副总裁刘建国说:“用户经常在网上寻找音乐资源,因此在2002年执行的闪电计划中,我们开发了mp3搜索功能,推出后,用户反响很大,迅速就把口碑建立了起来,这对百度的品牌和流量是非常有帮助的。”有位原来做过搜索引擎技术的程序员说:“我非常看好利用全网搜索技术做的多媒体形式的搜索功能。”事实上,虽然MP3的搜索与网页搜索在技术上差别并不大,但仍然需要考虑一些死链和下载速度的评估,有时还要考虑音乐格式。刘建国说:“我们甚至需要辨别原唱和翻唱的差别。”
由于搜索引擎试图进入更多领域-并且很多功能都在进行测试中,有些专家相信,未来的几年,尤其是在商业领域和个人学习领域,搜索引擎技术将会得到更为广泛的应用。另外一些专家则认为,搜索引擎技术的无限制扩展并不一定能够取得预想的成功,因为每一个专业领域都需要更加定制化的技术,意图以一种通用的技术统治整个信息产业是不现实的。
未来(20XX,3XXX, 4XXX。。。)
面向商务的搜索引擎正在被看好。在这方面,利用全文检索的技术来进行商品的检索被认为是未来的一个方向。
搜索引擎技术目前还和用户的某些期望相去甚远:它并不能智能化理解人类的想法,并与人类的生活完全结合。实际上,那些搜索引擎提供的 各种搜索技巧,需要我们操心的更多而不是更少。用户要迅速搜索到适合的内容,就要定义好合适的关键词,还要了解搜索的各种技巧。而当 你不在电脑前面的时候,你就根本无法利用搜索引擎所能带来的便利。即便是这个检索很简单。
要想让搜索引擎获得更为广泛的应用,试想一下,当你在一个不熟悉的地方要打出租车的时候,你可以通过手机发出一个检索 ,搜索引擎便将这个请求的检索结果返回给购买这一服务的当地出租车服务公司,出租司机可以根据手机的定位检索系统给用户提供服务。
多媒体的检索也将为生活带来更为便利的服务未来人们将可以不同计算机的输入而仅仅通 过语言便获得更为快捷的信息。到那时,信息资源的传播和共享速度将达到前所未有的境界。
搜索引擎的工作原理
概念
搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。用户的查询途径主要包括自由词全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等
搜索=大索引
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。
搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。
真正意义上的搜索引擎,通常指的是收集了互联网上几千万到几十亿个网页并对网页中的每一个文字(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。
现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的文字,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如“恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦”指向这个网页A,那么用户搜索“恶魔撒旦”时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。
工作过程
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页文字的更新情况,增加新的网页信息,去除死链接,并根据网页文字和链接关系的变化重新排序。这样,网页的具体文字变化情况就会反映到用户查询的结果中。
极限
互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几千万至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的网页。而互联网上有更大量的网页,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。
搜索引擎的种类及其区别
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
其它
除上述三大类引擎外,还有以下几种非主流形式:
集合式搜索引擎:
如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
门户搜索引擎:
如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
免费链接列表
(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
常见的搜索引擎及其特点
常用中文搜索引擎
Baidu www. ( http: / / www. ) 约1.24亿中文网页,平均2周更新一遍,对部分网页每天更新。提供百度快照、网页预览/预览全部结果、相关搜索词、错别字纠正提示、Flash搜索 ( http: / / flash. )、信息快递 ( http: / / ix. )、百度搜霸 ( http: / / bar. / baidubar / )、搜索援助中心 ( http: / / forum. / cgi-bin / forum / board_show.cgi id=1&age=30 ),推荐使用MP3搜索 ( http: / / mp3. )。Baidu搜索技巧 ( http: / / www. / search / jiqiao.html )
Google中文 www./intl/zh-CN/ ( http: / / www. / intl / zh-CN / ) 中文网页数不详,按比例推算约8500万。平均1月更新一遍,对部分网页每日更新,由 BasisTechnology ( http: / / www. / news / press-releases / 2001 / google-061901.html ) 提供中文处理技术,搜索相关性高,高级搜索语法丰富。提供Google工具条 ( http: / / toolbar. / intl / zh-CN / )、网页快照、图像搜索 ( http: / / image. )(4.25亿图片)、新闻组搜索。Google搜索帮助 ( http: / / www. / intl / zh-CN / help.html )
Alltheweb
(Fast) www. ( http: / / www. ) 4480万简体中文网页,1401万繁体中文网页,需单选中简体中文语言搜索,否则效果不好。
Openfind中文 www./cn.web.php u=cn ( http: / / www. / cn.web.php u=cn ) 中文网页数不详,从检索效果上看与Google相近。更新较慢,提供按网页大小或日期排序。Openfind查询秘诀 ( http: / / www. / aboutus / cn / aboutus_cn_2.htm )
北大天网 http://e.pku./ ( http: / / e.pku. / ) 约6000万网页,更新略慢,搜索相关性较低。提供天网搜霸 ( http: / / / )、历史网页。推荐使用ftp搜索 ( http: / / bingle.pku. / )。天网使用帮助 ( http: / / e.pku. / gbhelp.htm )
Inktomi/MSN
Altavista www.msn.com ( http: / / www.msn.com )
www. ( http: / / www. ) Inktomi和Altavita收录中文网页也以千万计,但因为它们没作中文特殊处理,所以用简单的中文关键词可以搜到一些内容,但用稍长一点或组合关键词查询时,搜索效果就很差。其它如Wisenut ( http: / / www. )、Gigablast ( http: / / www. )等,也能搜索一点点中文,但因为没做中文特殊处理,一样没有搜索价值。
常用英文搜索引擎
Google www. ( http: / / www. ) 30亿网页(约1/4非全文索引),用户界面出色,有新闻组、图像、新闻等搜索,以搜索相关性高闻名。
Alltheweb
(Fast) www. ( http: / / www. ) 21亿网页,高级检索强大,有新闻、图片、MP3、Video、ftp,利用ODP对搜索结果简单分类。
Altavista www. ( http: / / www. ) 约7亿网页,有图像(5.4亿图片)、音频、视频文件、新闻搜索,高级语法强大,有prisma辅助检索。(部分网友需通过p-roxy访问,无p-roxy可用 qbseach ( http: / / www. )单选altavista搜索。)
Inktomi search. ( http: / / search. / ) 自称30亿网页(搜索效果上看不出这么多),技术设置和参数可调性高,支持的门户搜索数据库和排序多不同,可到 Hotbot ( http: / / hotbot. ) 使用Inktomi的高级搜索。
Northernlight nlresearch. ( http: / / nlresearch. ) 约7亿网页+7100出版物数据,需选中"World Wide Web only"搜索。速度略慢,杂志数据有独特搜索价值,能对结果作简单自动分类,翻页数不限,支持通配符。
Wisenut www. ( http: / / www. ) 约14亿网页,网页索引数据库偏老,提供类似简单自动分类和相关检索词的WiseGuide,及预览搜索结果的Sneak-a-Peek。
Openfind www. ( http: / / www. ) 自称35亿网页(搜索效果上看不出这么多),旧网页死链接多,支持按网页大小或日期排序。
Teoma www. ( http: / / www. ) 约3亿网页,速度略慢,支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Gigablast www. ( http: / / www. ) 1.5亿网页,提供网页快照。
亲手开启引擎的必备技巧
1:选择最好的搜索工具
每一个搜索都是不同的,如果你为每一个搜索都选择最好的搜索工具,那么每次你都会得到最好的搜索结果。
一般的规则是,如果你在找什么特殊的内容或文件,那么使用全文搜索引擎如google和baidu,如果你想从总体上或比较全面的了解一个主题,那么使用网站分类目录如yahoo和odp。
对于特殊类型的信息考虑使用特殊的搜索工具,比如你要找人或找地点,那么使用专业的寻人引擎或地图和位置搜索网站。事实上几乎每种主题都有特殊的搜索工具。
2: 使用组合搜索关键词
好的搜索请求应该包含多个能限制搜索范围的关键词。
3:使用自然语言搜索
多数搜索引擎对自然语言的处理很好。事实上,搜索引擎能够从语句结构得到很有用的信息,不会象仅得到几个关键词那样容易迷失。
与其输入几个不合语法的关键词,还不如试一下一句自然的提问。与其搜索"snow blowers Minnesota",不如试一下 "Where can I find a snow blower dealer in Grand Marais, Minnesota "
4:适当的名词首字母大写
多数搜索引擎对特殊名词是很敏感的,这意味着,如果你使用大写的任命、地名或者其他合适的名词,将得到更好的结果。
你搜索"John Bull"得到的结果可能更多是关于不列颠保护神的,而搜索"john bull" 可能得到大量的西班牙斗牛场的休息室信息。(虽然看上去也很合理) .
5:不要犯愚蠢的错误
喂,你明显不应该犯这么低级的错误。但是你真的知道自己在搜索时可能犯的错误的范围和种类吗?看一下最常见的七个低级搜索错误吧,即使是非常出色的、聪明的、善意的人也不例外。
6:小心使用布尔符
大多数搜索引擎允许你使用布尔符(and, or, not)来使的你的搜索范围更精确。除非你有丰富的布尔符使用经验,否则你最好不要使用它。
有两个理由,第一,布尔符在不同的搜索引擎中使用起来是略有不同的。除非你明确知道布尔符在某一个搜索引擎中是如何使用的,确定你不会错用布尔符,不会妨碍你的搜索结果。第二,当你使用布尔符时,你可能错过了许多其它的影响因素,比如搜索引擎是如何决定搜索结果的相关性的。本质上,你是在对搜索引擎说:“我比你聪明,所以让我来告诉你如何工作。”不管是在网上还是网下,这种做法很少被证明是明智的策略。
7:点击搜索结果前先思考
一次成功的搜索由两个部分组成:一个设计优秀的搜索请求,和一个准确可信的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题和网址,会帮你节省大量的时间。
举例,如果两个文件都叫“One Hundred Faces of Faith”,那么,网址为www.vatican.va/faith.html 的文件和来自 www./faith.htm 的文件会大不一样。当然,到底哪一个是你需要的内容,取决于你在寻找什么。
评估网络内容的质量和权威性是搜索者的重要工作。看 Lies, Damned Lies, & Web Pages: Falsehoods on the Internet for a deeper look at separating online wheat from the chaff.
8:向搜索专家学习
要想成为一个伟大的搜索者,最好的方法是向一流的搜索专家学习。有两本杂志经常发表来自搜索专家的技巧和方法:《Online》 和 《Searcher》。
9:培养自己有效的搜索习惯
就象所有值得花时间的技能一样,搜索也是一种需要通过大量实践才能发展的技能。多多练习那些能带给你有效搜索结果的搜索技巧,这是非常重要的一点。
真正的搜索者不会一搜到满意的结果就离开搜索引擎。他们会思考,会回顾,会培养自己快速和有效找到所需内容的搜索习惯。阅读一下高效网络搜索者的七条习惯,将强有力的推进你的搜索技巧。
10:不要放弃
让我们正面接受挑战,勇敢面对。有时你做的所有搜索尝试都不能得到有用的搜索结果。经常,当你的大量搜索努力都被证明是白费劲,你感觉自己已经撞进了一条死胡同,撒手离去的欲望越来越具有诱惑力。
不,不要失望,当搜索失败的时候,你要检查上面的搜索策略,重新设定搜索方法。一个看上去毫无希望的搜索,很有可能在你检讨自己的搜索策略后获得成功。
搜索引擎的iq与eq
如此丰餍的引擎市场,选择什么 ?为什么?
还是看看它的 iq与eq吧
IQ~ 准确率:
包括下面两个方面
收集网站(或网页)的数目,即搜索范围。它直接影响到搜索结果的广泛性。
搜索结果的满意度,包括搜索结果相关项命中数量、死链接和重复链接的数量。
一般情况会搜索到很多条结果,通常只查看前10条(大概就是第一个搜索结果页面)。准确率的统计就是看前10个搜索结果中有几个给出了正确的信息。
IQ~速度:
速度是指提交搜索信息到搜索引擎给出搜索结果所使用的时间。在搜索页面的右上角一般会给出搜索所使用的时间。
IQ~其他
索引数据库的更新频度和时效性。
对于中文搜索引擎还要看它能否自动识别中英文,能否自动进行内码转换。
EQ~ 善解人意
除了支持简单搜索外,是否还支持逻辑查询和多词查询,多词查询是自动分词还是加标记
对于目录分类式搜索,需要看目录分类的合理性,分类和广度和深度,限制在类别内搜索的能力
特色网站介绍
百度MP3搜索
http://mp3./
百度MP3号称全球最大中文MP3搜索引擎,收录的音乐多而全,无论是搜歌曲名、歌手名或者专辑名,都会得到满意结果。网站设有MP3排行榜、中文金曲榜、歌手列表等栏目,并提供在线视听。其歌曲下载和以前相比有个小小改动,就是在搜索结果的歌曲列表中,需要先左键点击“歌曲名”,在新打开的小窗口中,右键单击歌曲名或者歌曲链接地址才可以下载。
LRC歌词大全
http://www.jpwy.net/gc/
许多拥有MP3播放器的朋友,都希望可以同步显示歌词,如果您的播放器支持此功能,只需下载一个后缀名是.LRC的歌词文件就可以了,这个LRC歌词文件名还需跟相应的MP3音频文件名相同,放在同一个目录下。要想找LRC歌词文件,推荐您去LRC歌词大全网站,搜寻完歌曲名后,有一列是LRC歌词,直接单击左键即可保存。
百度文档搜索
http://file./
很多有价值的资料,在互联网上并非以普通的网页形式出现,而是以Word、PowerPoint、PDF等文档格式存在。百度文档搜索则支持对这些文档进行全文搜索,例如:输入“工作总结”,可以直接得到很多文档格式结果,点击结果标题,可以直接打开该文档。您也可以点击标题后的“HTML版”,快速查看该文档的网页格式内容。
BT种子搜索
http://www./ad.htm
随着P2P技术的流行,网民们逐渐接受并喜欢上了BT下载。最新最热的动漫影视、巨型工具软件等等,利用BT软件统统可以下载。但随之而来的问题就是如何得到BT种子,除了去逛各个BT论坛,使用搜索引擎搜索BT种子也是一种较好的方法,而BT搜网站则是其中的佼佼者,只要不搜索反动、黄色等不良信息,各种影视综艺、动漫游戏等BT种子都可以在这里找到。
雷区电影搜索
http://pub./
迅雷因下载速度飞快而成为网友心中的首选下载工具,迅雷的缔造者们又趁热推出了雷区——就是迅雷互动社区。“雷友”们在网上下载一些好看的电影或其他网络资源时,如果感觉不错,随时可以把它发布到雷区,与网友共享,其他网友再利用迅雷下载软件将它们下载到自己的硬盘中。目前雷区电影资源非常丰富,下载速度也比较快,相信可以满足你苛刻的要求。
搜索全球华人Look4u
如果您要在网上寻找一位华人,那么笔者向您推荐Look4u(http://www./gb ( http: / / www. / gb" \t "_blank ))。该网站收集了许多华人的资料,既有中国用户、也有在世界各地旅居的华人,主要集中在加拿大、澳大利亚、美国、马来西亚、菲律宾、新加坡等国家。您可以使用搜索对象的中文姓名或拼音、英文名、网名等资料进行搜索。
环球搜索Yahoo寻人搜索引擎
如果您想网上寻人,但是无法支付搜索费用,那么可以考虑使用Yahoo提供的寻人搜索引擎(http://people. ( http: / / people. / " \t "_blank ))。因为在互联网方面,Yahoo曾领先一步,大多数网民都拥有或曾经拥有Yahoo的账户,使它在资源方面有很大优势,国际化特征明显,用户组成包含了全世界各国的网民。而且它的黄页也包含了大量的有用信息。因此,它应该是大范围寻人的较好选择。尤其当您寻找的人正好在某些非英语国家,找不到专门的搜索引擎,Yahoo的优势就更为明显。
使用Yahoo的寻人搜索引擎,提供的资料可繁可简,即使只有姓名的一部分,也能让您有所发现。当然,如果有更详细的信息,自然可以更准确地找到目标。在高级搜索中,您可以通过被寻找人所在地区、城市、学历等详细资料去搜索,查找目标的电话或电子邮件。由于Yahoo有各个语言版本的网站,所以支持非英文关键字,但是用中文搜索时效果一般。由于很多华人在注册时,没注意到国外的语言习惯,把姓和名字的位置颠倒了,所以当没有令您满意的结果时,您可以尝试把姓和名字交换位置,说不定就会柳暗花明。
优秀的图像搜索引擎Google
在过去的2001年度,Google 获得了《搜索引擎观察》杂志关于搜索引擎的五项大奖,其中就包括最佳图片搜索奖(另外的奖项是最佳搜索引擎大奖、最佳设计奖、对网站管理人员最友好奖和最佳搜索特性奖)。在文本搜索领域,Google的领先地位毋庸质疑,屡屡获奖(在CHIP2001年第9期的搜索引擎评测中荣获第一名)。在图像搜索引擎方面,Google一样是实至名归。
Excite
网址:http://www.
Excite虽然是与AltaVista及HotBot相似的搜索引擎,但它最有特色的恐怕就是它的概念搜索了。
Excite首先将你的检索式字词按字义进行自动扩展或加以限定,然后根据处理过的检索式再到库中进行检索,对于一般概念的检索来讲,这种方法很有帮助。并且它很提供了相似检索(MoreLikeThis)的扩展功能,使用户能根据反馈的检索结果来做进一步的查询。
但是Excite的这种技术非常复杂,对于复杂及专业的查询效果也不好,同时由于中文与英文处理的不同,这一想法值得中文搜索引擎借鉴,但却不可能照搬。
Excite较有特色的部分还有在页面上提供财经新闻等,并允许用户定制网页。
搜索引擎比较
BAIDU GOOGLE YAHOO
准确率 最高 略低 较好
结果数量 最少 最多 多
主页页面组织 简洁 有创意 丰富
查询速度 最快 最慢 中
更新速度 快 快 快
适合 比较有针对性的中文查询,比较陈旧的资料 英文网站,比较散的内容 和GOOGLE差不多
心得体会
面对一台虽然冷冰冰的电脑,用搜索引擎海飘于网络,是一件非常人性化的事情。尤其是当你心情闲适,知道该去哪一片或几片引擎开地垦荒,又怎么样把心情用“搜索关键词”和鼠标表现出来的时候 ,至少对我来说,这便是一种至上的精神享受。
在搜索中,总会在随性的浏览中,找到一些意料之外的东西,从而再一次激发出自己的灵感,在那些精致的网站里耕种,不免忘时而沉醉。
PAGE
17(共67张PPT)
08 09 23 江西 南昌
李冬梅Ldm@pku.
高中信息技术
新课程教学设计
人是如何学习的
1
2
3
主要内容
教学与教学设计
4
信息技术教学设计原则
信息技术教学设计案例
08 09 23 江西 南昌
08 09 23 江西 南昌
教学是有目的学习
为了便教学达到最优化需要进行教学设计
如何进行教学设计才能使教学达到最优化?
一、人是怎么学习的
08 09 23 江西 南昌
08 09 23 江西 南昌
一、人是怎么学习的
不同类型的学习内容,人学习的方式是不同的
1、知识
识记概念
键盘、鼠标、按钮
苹果等水果名,英文单词
理解概念
信息,信息技术
08 09 23 江西 南昌
一、人是怎么学习的
2、技能
动作技能
鼠标操作
打字
图片的旋转
开车
收发电子邮件
智力技能
信息的特性
08 09 23 江西 南昌
一、人是怎么学习的
3、过程与方法
程序设计
网页设计
08 09 23 江西 南昌
一、人是怎么学习的
4、情感态度价值观
喜欢上信息技术课
规范使用电子邮件
有条理地管理个人文件
使用信息技术的意识
创新意识
创新精神
二、教学与教学设计
08 09 23 江西 南昌
(一)什么是教学设计
08 09 23 江西 南昌
其实,每位教师在日常教学工作中都扮演着教学设计者的角色。
作为一堂有计划的课,其目标在于对某一具体教学内容做有准备的分析,且教师根据自己对学生特征的了解来采纳这些分析。
每个教师都要对所用的教学方法或多或少地作出一定的安排。
一个有经验的、以学生为导向的教师会把教什么和怎么教融入意义丰富的境脉!
08 09 23 江西 南昌
从理论上讲,教学设计
是为了达到最优化的教学效果,采用新课程理念和系统化方法,分析教学内容,确定教学目标,设计教学过程、教学策略和评价方法。
08 09 23 江西 南昌
教学设计的历史与发展
教学设计作为教育技术领域的一个独立学科出现于20世纪60年代的美国。
教育技术是研究教学过程和学习资源的设计、开发、利用、管理和评价。
教学设计主要研究教学过程和教学资源的设计与评价。
08 09 23 江西 南昌
教学设计的两个流派
以“教”为中心的教学设计
以“学”为中心的教学设计
08 09 23 江西 南昌
以“教”为中心的教学设计
从60年代开始的教学设计的理论大多数是以“教”为中心,其基本内容是研究如何帮助教师把课备好、教好,比较强调教师的作用。
08 09 23 江西 南昌
理论依据
以“教”为中心的教学设计有坚实的理论基础,系统理论、学习理论、教学理论和传播理论是它的主要研究依据。依据系统论设计整个框架,依据学习理论研究学习的过程和学习的结果,等等。经过二十多年多位专家学者的研究,已经形成了一套比较完整严密的理论体系,有可操作性很强的教学设计模型。
08 09 23 江西 南昌
学习理论
教学理论
传播理论
系统理论
08 09 23 江西 南昌
学习特征
教学目标
教学策略
教学评价
四个基本要素
08 09 23 江西 南昌
三个主要问题
(1)学生必须学到什么
确定教学目标
(2)为了达到预期目标应该如何进行教学
根据教学目标分析确定教学内容和教学资源
根据学习者特征分析确定教学起点及教学策略和教学方法
(3)检查和评定预期的教学效果
进行教学评价
08 09 23 江西 南昌
十个环节
分析学习者特征
预测学生的准备情况
分析教学内容
确定学习需求和学习目标(了解教学条件)
阐明教学目标
选择课题与任务
实施教学活动
利用教学资源
提供辅助性服务
进行教学评价
以“教”为中心的教学设计模型
(1)前期分析
学习者特征分析
学习任务分析
学习需要分析
(2)确定教学目标
(3)设计教学策略(就是采取什么样的方针、方式或手段来达成目标)
教学组织策略设计( 教学内容的组织与呈现顺序)
传递策略设计(教学媒体和教学内容呈现方式的选择)
教学资源管理策略
(4)设计评价策略
08 09 23 江西 南昌
前期分析
学习任务分析
学习者特征分析
确定教学目标
设计教学策略
教学过程的确定
学习方式的设计
教学组织形式的确定
教学方法的选择
教学媒体的选择
教学评价
检测教学目标是否达成
以“学”为中心的教学设计
二十世纪50年代,随着建构主义学习理论的产生与发展,以“学”为中心的教学设计思想逐渐形成。
建构主义学习理论强调以学生为中心,不仅要求学生由外部刺激的被动的接受者和 知识的灌输对象变为信息加工的主体、知识意义的主动建构者,还要求教师从知识的传授者、灌输者转换为学生主动建构的帮助者、促进者。
08 09 23 江西 南昌
以“学”为中心的教学设计原则
(1)强调以“学”为中心
(2)强调“情境”对意义建构的重要作用
(3)强调“协作学习”对意义建构的关键作用
(4)强调对学习环境的设计
(5)强调利用各种信息资源来支持“学”
(6)强调学习过程的最终目的是完成意义建构
08 09 23 江西 南昌
以“学”为中心的教学设计方法和步骤
(1)教学目标分析
确定所学习“主题”
(2)情境创设
创设与主题相关的、尽可能真实的情境
(3)信息资源设计
确定学习本主题需要的各类信息资源及其作用,从何处获取以及如何应用
08 09 23 江西 南昌
以“学”为中心的教学设计方法和步骤
(4)自主学习设计
即设计教学方法,如“支架式”“抛锚式”“随机进入式”
(5)协作学习环境设计
在个人自主学习的基础上开展小组讨论和协商,以进一步深化对主题的意义建构;
(6)学习效果评价设计
自主学习能力 的评价
协作学习过程中的贡献评价
是否达到意义建构的要求
(7)强化练习设计
根据评价结果再为学生设计一套可供选择有针对性的强化练习
08 09 23 江西 南昌
(二)教学设计的分类
08 09 23 江西 南昌
整体(宏观)
课程设计-以地区性的某一学科为设计对象
学段整体教学设计-以某学段、某学年或某学期为设计对象
局部(微观)
单元教学设计(以某一单元的教学为对象)
课时教学设计(以某一课的教学为对象)
微格教学设计(以某个教学环节为设计对象)
08 09 23 江西 南昌
宏观设计
就是对一门课程或课程的某一学段进行整体设计,如:
整个高一年级信息技术课程或某个模块的总体设计,包括教学内容,教学内容的组织顺序,教学环境,总的教学策略和整体教学评价等等。
08 09 23 江西 南昌
就新课程教学内容而言
根据实际情况
适当调整教学内容(增加或删除)
适当调整教学内容的顺序
08 09 23 江西 南昌
三、信息技术
新课程教学设计原则
08 09 23 江西 南昌
目标导向性原则
主体性原则
面向全体原则
实践性原则
创新性原则
问题解决性原则
趣味性原则
评价性原则
08 09 23 江西 南昌
目标导向性原则
教学目标是教学活动的出发点和归宿;
教师要根据教学目标随时调控自己的教学行为。
08 09 23 江西 南昌
主体性原则
要培养学生的主体意识,发挥学生的主动性;
如何才能发挥学生的主动性?
要给学生想的时间和空间
要给学生做的时间和空间
要引导学生主动地去想,主动地去做
08 09 23 江西 南昌
面向全体原则
要面向各类学生,面向全体学生;
要因人施教,分层推进;
要满足各个层次学生的学习要求,使每个学生都得到发展
08 09 23 江西 南昌
实践性原则
信息技术教学中大量的过程与方法需要学生亲身去体验,去实践
只有加强学生的动手实践活动才能更好地达成目标
要遵循实践性原则首先要从时间上,保证学生的上机实践时间。
08 09 23 江西 南昌
LDM
创新性原则
创新意识、创新精神、创新能力是人类社会前进的真正动力。
树立学生的创新意识,培养学生的创新精神和能力是我们教师时刻要牢记的。
开放性的实践,在空间上放飞学生的想像力,为学生树立并养成创新意识提供了客观的可能。
长期、及时的鼓励激励学生创新的力量。
08 09 23 江西 南昌
LDM
问题解决性原则
前面强调信息技术课堂教学设计要突出实践性,突出创新性,那么实践什么?如何创新。
这就要求我们在教学设计时要基于问题解决
选择和设计那些便于应用信息技术的、与学生的生活学习紧密相接的案例。
08 09 23 江西 南昌
LDM
08 09 23 江西 南昌
趣味性原则
兴趣是学习的起点也是学习的终点。
我们的教学目的之一是让学生对你所教学的内容感兴趣。
激发学生的直接学习兴趣
引人入胜的教学情境
充满激情的教师
激发学生的间接学习兴趣
充满个性的开放的实践内容
激发学生的创作热情,放飞学生的想像
让学生体验成就感
建立激励机制,进一步激发学生的学习热情
LDM
08 09 23 江西 南昌
评价性原则
既然教学是有目标的,那么目标是否达成就一定要进行评测。
因此,每个学段、每个单元、每节课都在进行评价设计
其目的就是检测教学目标是否达成
不同的教学目标要使用不同的评价方法。
LDM
08 09 23 江西 南昌
四、信息技术 新课程教学设计实例
LDM
案例 1
第一章 信息与信息技术
08 09 23 江西 南昌
第一部分:前期分析
08 09 23 江西 南昌
分析要学习的内容范围与深度。
即学什么,学到什么程度
并辨别学习内容的不同类型。
知识?还是技能?还是过程与方法?或情感态度价值观
1、学习内容分析
08 09 23 江西 南昌
第一步:列出新课标中对相应内容
描述信息的基本特征
列举信息技术的应用实例
了解信息技术的历史和发展趋势
08 09 23 江西 南昌
案例1:第一章 信息与信息技术-学习内容分析
第二步:对课标内容的分析
第一条:描述信息的基本特征,实际上隐含了信息的概念,不知道信息为何物,如何说信息的特征?
第二条:实际上隐含的信息技术的含义。
08 09 23 江西 南昌
案例1:第一章 信息与信息技术-学习内容分析
第三步:通读教材理出其中内容
(教科版)
(1)信息的概念(第2页旁批)
(2)信息的基本特征(第3-4页)
(3)信息技术的概念(第6页)
(4)信息技术的发展历程(第6页)
(5)信息技术的发展趋势(第7-10页)
(6)合理使用信息技术(第10-11页)
08 09 23 江西 南昌
案例1:第一章 信息与信息技术-学习内容分析
2、学习者特征分析
确定学习者的知识基础
课前的调查
确定学习者的认知能力
了解学生的认知能力,如:识记能力、理解能力、应用能力、分析能力、综合能力和评价能力
办法是:测试法与预估法
08 09 23 江西 南昌
“信息与信息技术”学习者特征分析
对于高一学生都上过信息技术课,所以:
(1)对信息的概念是有一定感性认识的
(2)对信息技术的概念也有一点模糊了解
(3)对信息技术的应用有一定的了解和接触
(4)有一定的逻辑思维能力
(5)且已经具备了一定的信息技术的使用经验
(6)只是对所学内容还缺少系统的提炼、重组和内化。
08 09 23 江西 南昌
案例1:第一章 信息与信息技术-学习者特征分析
3、学习需要分析
学习需要分析的作用就是要鉴定教学问题,在此基础上形成教学目标,并为其它环节做准备。
具体的说,就是结合教学实际环境分析目前学生的学习状况和将要期望达到的学习状况,找到他们之间的差距,这个差距就是学习需要。
08 09 23 江西 南昌
“信息与信息技术”学习需求
信息的概念
信息的基本特征
信息技术的概念
信息技术的应用
信息技术的历史与发展趋势
08 09 23 江西 南昌
案例1:第一章 信息与信息技术学习需求分析
4、教学环境分析
现有教学环境的分析
硬件环境
软件环境
08 09 23 江西 南昌
“信息与信息技术”教学环境分析
普通教室有接入因特网的多媒体演示设备
信息技术专用教室:保证每人一台接入因特网的计算机;
08 09 23 江西 南昌
案例1:第一章 信息与信息技术—教学环境分析
第二部分:确定教学目标
08 09 23 江西 南昌
有关教学目标
1、新课标强调从三个维度(知识与技能、过程与方法、情感态度与价值观)来阐述课程目标,是一个重大突破。
2、目标写出来就一定要达成,一节课的目标要在一节中达成,一个单元的教学目标要在一个单元中达成,如何测试是否达成?通过教学评价检验目标的达成。
3、技能可以分为两种:
动作(操作)技能
智力技能
08 09 23 江西 南昌
根据前面的分析确定教学目标,每条教学目标的编写应包括以下四个因素:
教学对象(可以省略)
行为(不可以省略)
用学生的行为变化表明在学习结束时,学生应该达到什么样的水平;
用词一定要可操作,尽量避免使用“理解”“体会”等
条件
学生完成上述行为的条件;
标准
行为合格的最低标准;
08 09 23 江西 南昌
有关教学目标
(1)叙述信息的主要特征,并举例说明;
(2)说出个人对信息概念的理解;
(3)从多个角度解释信息技术的含义,说说个人对信息技术的理解;
(4)知道构成信息技术的核心技术,并说出他们的功能和作用;
(5)结合实例说出信息技术的发展趋势;
(6)感受信息技术对个人、社会发展的重要影响,树立学习信息技术的兴趣;
(知识)
(技能)
(知识)
(知识)
(技能)
(态度)
08 09 23 江西 南昌
“信息与信息技术”教学目标
(技能)
(技能)
案例1:第一章 信息与信息技术——教学目标分析
教学重点
信息的特征
信息技术对个人、社会发展的重要影响
建立学习信息技术的兴趣
08 09 23 江西 南昌
案例1:第一章 信息与信息技术——教学重点分析
教学难点
信息的概念
信息技术的概念
08 09 23 江西 南昌
案例1:第一章 信息与信息技术——教学难点分析
第三部分:设计教学策略
08 09 23 江西 南昌
设计教学的组织策略
教学内容的组织
教学内容的呈现顺序
设计传递策略
选择适当的教学媒体
选择教学内容的呈现方式
选择教学方法
08 09 23 江西 南昌
教学策略设计的主要内容
信息及其特性
08 09 23 江西 南昌
案例1:第一章 信息与信息技术第1课——教学策略设计
第1课:信息及其特性——教学策略
第四部分:设计教学评价
08 09 23 江西 南昌
评价
学生作品1 2 3 4 5
08 09 23 江西 南昌
案例1:第一章 信息与信息技术第1课-教学评价设计
第1课:信息及其特性——教学评价
第2课:信息技术及其应用——教学策略
信息技术及其应用
评价
学生作品1 2 3 4 5
08 09 23 江西 南昌
案例1:第一章 信息与信息技术第2课-教学策略与评价
教学反思
讨论与交流
08 09 23 江西 南昌
谢谢各位老师!
李冬梅
QQ:70837175
Ldm@pku.
08 09 23 江西 南昌信息与信息技术
10届1班雷宗第01次作业
(1)个人简介;
我叫雷宗,男,汉族。爱好广泛。尤其喜欢看书、玩电脑游戏,虽然对编程一窍不通,但确报有浓厚的兴趣(人工智能太吸引人了),时间不多,就不多介绍自己了。
(2)谈谈你个人对信息概念的理解;
信息充满了这个世界,我们无论深处何处都会感受到丰富多彩的信息。我们的生活离不开信息,正如人们常说,物质、能量、信息是构成世界的三大要素。信息是事物的运动状态及其状态变化的方式,当然,信息的理解也取决于人们的主观感受,所以又是对同一条信息大家理解是不同的。而信息的获得,是通过各种感官感受的,无论是外在或是内在。这就是我对信息的理解。
(3)你对信息的无处不在一定深有感触,请结合实际谈谈你感受最深刻的某个信息特性。
我对信息感受最深刻的就是价值性,而感受最深的就是其促进物质、能量的生产和应用。以为我的妈妈曾经有一段时间炒股,所以我也了解了一些参考股票的方法——衡量公司业绩,看有没有股票分红,股改前后的业绩……最重要的是观察公司营业领域是否符合当今社会的发展取向,是否存在增长潜力;在比较它以往的走势,选择适当时机购入……所有的事情都需要使用信息,这遍突出了信息的价值性。而且在不断分析筛选信息的过程中,会得出更重要的信息,使其原有信息增值,从而使选股成功率增加。这就是我对信息价值性的感受。
(4)找出4个以上信息技术的前沿应用(可以上网查找)。
1、植物保护领域:研究昆虫种族模型、植物病害流行模型、作物生长模型、天气与土壤环境动态模型……
2、人工智能
3、语音技术
4、全部由电脑制作完成的电影、动漫
(5)简述信息技术的发展历史与发展趋势。
历史:信息技术的发展历史非常悠久,在人类社会发展历史上发生过五次信息技术革命。第一次信息技术革命是语言的应用。第二次信息技术革命是文字的创造。第三次信息技术革命是印刷术的发明。第四次信息技术革命是电报、电话、广播、电视的发明和普及。第五次信息技术革命是计算机技术和现代通信技术的普及应用。每一次革命都是对以往技术的超越,使信息技术进一步发展。
发展趋势:
1、信息技术在向人性化和大众化的方向进一步发展。随着信息技术的飞速发展,涌现出的新的技术(如虚拟现实技术、语音技术、智能代理技术等),使人机界面更加友好;2、功能设计越来越个性化:信息技术产品走向了个性化和集成化的发展方向,在不同的用户群体中得到了充分应用和推广;3、性能价格比越来越高:信息技术正向低消耗、高速度的方向发展,成本的降低和性能的提高给人们带来更多实惠。(共37张PPT)
08 09 24 江西南昌
李冬梅Ldm@pku.
高中信息技术
新课程教学设计
人是如何学习的
1
2
3
主要内容
教学与教学设计
4
信息技术教学设计原则
信息技术教学设计案例
08 09 24 江西南昌
技术
信息技术
信息
通信技术
感测技术
计算机与智能技术
控制技术
算法与程序设计
多媒体技术
网络技术
数据管理技术
人工智能
(必修)
(选修)
三、信息技术
新课程教学设计原则
08 09 24 江西南昌
目标导向性原则
主体性原则
面向全体原则
实践性原则
创新性原则
问题解决性原则
趣味性原则
评价性原则
08 09 24 江西南昌
目标导向性原则
教学目标是教学活动的出发点和归宿;
教师要根据教学目标随时调控自己的教学行为。
08 09 24 江西南昌
主体性原则
要培养学生的主体意识,发挥学生的主动性;
如何才能发挥学生的主动性?
要给学生想的时间和空间
要给学生做的时间和空间
要引导学生主动地去想,主动地去做
08 09 24 江西南昌
面向全体原则
要面向各类学生,面向全体学生;
要因人施教,分层推进;
要满足各个层次学生的学习要求,使每个学生都得到发展
08 09 24 江西南昌
实践性原则
信息技术教学中大量的过程与方法需要学生亲身去体验,去实践
只有加强学生的动手实践活动才能更好地达成目标
要遵循实践性原则首先要从时间上,保证学生的上机实践时间。
08 09 24 江西南昌
LDM
创新性原则
创新意识、创新精神、创新能力是人类社会前进的真正动力。
树立学生的创新意识,培养学生的创新精神和能力是我们教师时刻要牢记的。
开放性的实践,在空间上放飞学生的想像力,为学生树立并养成创新意识提供了客观的可能。
长期、及时的鼓励激励学生创新的力量。
08 09 24 江西南昌
LDM
问题解决性原则
前面强调信息技术课堂教学设计要突出实践性,突出创新性,那么实践什么?如何创新。
这就要求我们在教学设计时要基于问题解决
选择和设计那些便于应用信息技术的、与学生的生活学习紧密相接的案例。
08 09 24 江西南昌
LDM
08 09 24 江西南昌
趣味性原则
兴趣是学习的起点也是学习的终点。
我们的教学目的之一是让学生对你所教学的内容感兴趣。
激发学生的直接学习兴趣
引人入胜的教学情境
充满激情的教师
激发学生的间接学习兴趣
充满个性的开放的实践内容
激发学生的创作热情,放飞学生的想像
让学生体验成就感
建立激励机制,进一步激发学生的学习热情
LDM
08 09 24 江西南昌
评价性原则
既然教学是有目标的,那么目标是否达成就一定要进行评测。
因此,每个学段、每个单元、每节课都在进行评价设计
其目的就是检测教学目标是否达成
不同的教学目标要使用不同的评价方法。
LDM
08 09 24 江西南昌
LDM
四、信息技术 新课程教学设计实例
案例2
第二章 信息获取
08 09 24 江西南昌
第一部分:前期分析
08 09 24 江西南昌
1、学习内容分析
08 09 24 江西南昌
第一步:列出新课标中对相应内容
知道信息来源的多样性及其实际意义;
学会根据问题确定信息需求和信息来源,并选择适当的方法获取信息。
掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。
掌握信息价值判断的基本方法,学会鉴别与评价信息。
08 09 24 江西南昌
案例2:第二章 信息获取——学习内容分析
第二步:对课标内容的分析
学会根据问题确定信息需求和信息来源,并选择适当的方法获取信息。
掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。
掌握信息价值判断的基本方法,学会鉴别与评价信息。
08 09 24 江西南昌
案例2:第二章 信息获取——学习内容分析
第三步:通读教材理出其中内容
(教科版)
1、信息获取的一般过程(P14-18)
2、因特网信息的查找(P19-24)
3、文件的下载(P25-31)
4、网络数据库的信息检索(P32-38)
08 09 24 江西南昌
案例2:第二章 信息获取——学习内容分析
2、学习者特征分析
08 09 24 江西南昌
“信息获取”学习者特征分析
1、学生在初中或小学对互联网就有所了解,家庭条件好的学生可能会更早就上网了。对网站、搜索都有所了解,不少学生认为自己 是网络搜索高手。如果以讲授法对搜索引擎的相关概念进行介绍,或者以一些实例引导学生去讨论交流很难让学生静下心来认识的研究搜索引擎。
2、但大多数学生对什么是搜索引擎?搜索引擎是如何工作的?各个搜索引擎有什么异同?如何去评价一个搜索引擎等问题还是很不了解的。特别是对如何提炼搜索关键词还缺少经验与技巧。也就是说,学生对搜索引擎还缺少深入的了解。
08 09 24 江西南昌
案例2:第二章 信息获取-学习者特征分析
08 09 24 江西南昌
3、学生尽管很早就使用文字处理软件WORD,但对WORD大纲视图如何管理大文档,如何设置三级标题,如何制作目录基本上没有接触过。
4、作为高一学生已经具体了通过阅读自习相关知识的能力。
5、目前中学的计算机教室都具备上网的条件。
6、学生虽然有一定的获取信息的经历,但还不能有计划、目标明确的去获取信息,还缺少对获取信息进行评价的意识。
案例2:第二章 信息获取-学习者特征分析
“信息获取”学习者特征分析
3、确定学习需求
08 09 24 江西南昌
08 09 24 江西南昌
1、有关搜索引擎的相关知识。
2、网络信息检索的主要策略与技巧。
3、获取信息的一般过程与方法。
4、根据问题确定信息需求和信息来源,并选择适当的方法获取信息。
5、对信息价值判断的基本方法,信息的鉴别与评价。
案例2:第二章 信息获取-学习者特征分析
“信息获取”学习需求
第二部分:确定教学目标
08 09 24 江西南昌
一、知识与技能
1、描述搜索引擎的产生与发展历史
2、能说出搜索引擎的工作原理及分类
3、能列举常见搜索技巧,并将其应用到实际搜索中。
4、能正确下载网上文字、图片等资料。
5、能对下载资料进行适当的编辑处理。
6、知道评价搜索引擎的参数,并能对不同的搜索引擎进行比较。
7、能够在WORD大纲视图中创建文档的三级标题,插入目录。
案例2:第二章 信息获取-第1课 搜索研究教学目标
二、过程与方法
1、经过实际上网搜索指定的内容,学会提炼关键词的一般方法。
2、经历上网搜集下载整理信息的过程,明确并掌握上网搜集整理信息的一般过程和方法。
3、经过制作WORD大文件,明确并掌握大纲视图管理的一般方法和步骤。
08 09 24 江西南昌
案例2:第二章 信息获取-第1课 搜索研究教学目标
三、情感态度价值观
1、经过实际上网搜索指定的内容,体会提炼关键词的重要性。
2、经过对搜索引擎历史与工作原理的研究,进一步感受信息技术对人类所做的贡献,感受信息技术的魅力,增强对信息技术学科的兴趣。认识到学习信息技术的重要性。
3、经过制作搜索研究大报告,树立坚忍不拔的做事风格。
08 09 24 江西南昌
案例2:第二章 信息获取-第1课 搜索研究教学目标
第三部分:教学策略设计
08 09 24 江西南昌
一、主题:搜索研究
二、教学方法:自主探究
三、学习过程:
1、浏览学习资源中提供的有关搜索引擎的相关资料
2、构思搜索研究报告的基本结构
3、在WORD大纲视图中创建搜索报告的三级标题
4、从学习资源或网上下载要求的有关搜索引擎的资料,经过编辑、删除、修改纳入搜索研究报告中。
5、根据任务书完成指定的搜索,并通过表格对搜索引擎进行比较评价。
6、在大纲视图中对下载的图文格式进行编辑修改。
7、撰写心得体会。
8、生成目录,制作报告封面。
9、提交报告。
四、学习资源:
案例2:第二章 信息获取-第1课 搜索研究——教学策略设计
第四部分:教学策略设计
08 09 24 江西南昌
教学评价
学生作品:
1020132 耿然 搜索研究报告
1020121 钟博远搜索研究报告
部分学生的心得
08 09 24 江西南昌
案例1:第一章 信息与信息技术第1课——教学评价设计
案例2:第二章 信息获取-第1课 搜索研究——教学评价设计
案例2:第二章 信息获取-第2课 获取信息的一般过程与方法
08 09 24 江西南昌
教学策略与教学评价
教学策略
课堂练习
案例分析
教学评价
学生作品1 2 3 4 5 6 7
案例3
计算机是如何解决问题的
08 09 24 江西南昌
案例4
教学难点片断
08 09 24 江西南昌
谢谢各位老师!
李冬梅
QQ:70837175
Ldm@pku.
08 09 24 江西南昌搜索研究的研究的研究
研究人:曾成
专聘打字员:曾成
后期校稿:曾成
发型服装:曾成
茶水端送:曾成
投资商:曾成
(以上排名均按字母顺序排列,无先后之分)
1. 搜索引擎的历史与发展
1990年以前
,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
1993年
1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan’s World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。
1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。 而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。
然后到来的是HotBot。1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购)
Northernlight 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。
Teoma 起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Wisenut 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。
Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。
北大天网 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。
现在
Baidu 2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。2001年8月发布搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
2. 搜索引擎的工作原理
全文搜索引擎
在 搜索引擎分类 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / 02.htm" \t "_blank )部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
目录索引
与全文搜索引擎相比,目录索引有许多不同之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。
其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。(由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍 登录Yahoo雅虎的技巧 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / 05.htm ))
此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。
目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围 (注) 。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。
(注) :Yahoo已于2004年2月正式推出自己的全文搜索引擎,并结束了与Google的合作。
三.搜索引擎的种类及其区别
搜索引擎按其工作方式主要可分为三种,分别是
全文搜索引擎(Full Text Search Engine)、目录索引
类搜索引擎(Search Index/Directory)和元搜索引擎
(Meta Search Engine)。
全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代
表性的有Google、Fast/AllTheWeb、AltaVista、Inkto
mi、Teoma、WiseNut等,国内著名的有百度(Baidu
)。它们都是通过从互联网上提取的各个网站的信息
(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有 InfoSpace ( http: / / www. / )、 Dogpile ( http: / / www. / )、 Vivisimo ( http: / / www. / )等( 元搜索引擎列表 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / resources / general / category_general_meta.htm )),中文元搜索引擎中具代表性的有 搜星搜索引擎 ( http: / / www.soseen.com / )。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
除上述三大类引擎外,还有以下几种非主流形式:
1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。
四.各种搜索引擎的代表网站
国外英文目录索引
Yahoo ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / yahoo.htm" \t "_blank )— 最著名的目录索引,搜索引擎开山鼻祖之一。
/ODP ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / odp.htm" \t "_blank )— 由义务编辑维护的目录索引。
Ask Jeeves ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / ask%20jeeves.htm" \t "_blank )— 著名的自然语言搜索引擎,2002年初收购Teoma全文搜索引擎。
LookSmart ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / looksmart.htm" \t "_blank )— 点击付费索引目录,2002年收购WiseNut全文搜索引擎。
( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / about.htm" \t "_blank )— 有其自身特色的目录索引。
国外英文搜索引擎
Google ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / google.htm" \t "_blank )— 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。
Fast/AllTheWeb ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / alltheweb.htm" \t "_blank )— 总部位于挪威的搜索引擎后起之秀,风头直逼google。
AltaVista ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / altavista.htm" \t "_blank )— 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。
Overture ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / overture.htm" \t "_blank )— 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。
Lycos ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / lycos.htm" \t "_blank )— 发源于西班牙的搜索引擎,网络遍布世界各地。
HotBot ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / hotbot.htm" \t "_blank )— 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。
国内目录索引
搜狐(Sohu) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / sohu.htm" \t "_blank )— 国内三大门户之一,最早在国内推出搜索引擎收费登录服务。
新浪(Sina) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / sina.htm" \t "_blank )— 最大的中文门户网站,同样也推出了搜索引擎收费索引项目。
网易(Netease) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / netease.htm" \t "_blank )— 网易搜索是ODP的国内翻版,其目录由志愿管理员维护,是google的网页搜索用户。
国内搜索引擎
百度(Baidu) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / baidu.htm" \t "_blank )— 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。
五.常见的搜索引擎及其特点
百度(baidu)
百度公司(,Inc) 于1999年底成立于美国硅谷。2000年1月,百度公司在中国成立了她的全资子公司百度网络技术(北京)有限公司,随后于同年10月成立了深圳分公司,2001年6月又在上海成立了上海办事处。
百度是国内最大的商业化全文搜索引擎,占国内80%的市场份额。其功能完备,搜索精度高,除数据库的规模及部分特殊搜索功能外,其他方面可与当前的搜索引擎业界领军人物Google相媲美,在中文搜索支持方面有些地方甚至超过了Google,是目前国内技术水平最高的搜索引擎。为包括Lycos中国、、21CN、广州视窗等搜索引擎,以及中央电视台、外经贸部等机构提供后台数据搜索及技术支持。
百度目前主要提供中文(简/繁体)网页搜索服务。如无限定,默认以关键词精确匹配方式搜索。支持“-”号、“.”号、“|”号、“link:”、书名号“《》”等特殊搜索命令。在搜索结果页面,百度还设置了关联搜索功能,方便访问者查询与输入关键词有关的其他方面的信息。提供“百度快照”查询。其他搜索功能包括新闻搜索、MP3搜索、图片搜索、Flash搜索等。
2001年9月,百度推出了类似Overture的“竞价排名服务”,市场反应强烈。目前已有雅虎中国、Lycos中国、263、、21CN、、上海热线、广州视窗、福建在线、等门户网站加入了百度竞价排名阵营。
(注1)百度现已去掉了关键词分类搜索。
Google
Google成立于1997年,几年间迅速发展成为目前规模最大的搜索引擎,并向AOL、Compuserve、Netscape等其他门户和搜索引擎提供后台网页查询服务。目前Google每天处理的搜索请求已达2亿次!而且这一数字还在不断增长。Google数据库存有42.8亿个Web文件。属于全文(Full Text)搜索引擎。
Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从10到100条任选。提供网站内部查询和横向相关查询。Google还提供特别主题搜索,如:Apple Macintosh, BSD Unix, Linux和大学院校搜索等。
Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择,包括英语、主要欧洲国家语言(含13种东欧语言)、日语、中文简繁体、朝语等。同时还可以在多达40多个国别专属引擎中进行选择。
搜索规则:以关键词搜索时,返回结果中包含全部及部分关键词;短语搜索时默认以精确匹配方式进行;不支持单词多形态(Word Stemming)和断词(Word Truncation)查询;字母无大小写之分,默认全部为小写。
搜索结果显示网页标题,链接(URL)及网页字节数,匹配的关键词以粗体显示。其他特色功能包括“网页快照”(Snap Shot),即直接从数据库缓存(Cache)中调出该页面的存档文件,而不实际连接到网页所在的网站(图象等多媒体元素仍需从目标网站下载),方便用户在预览网页内容后决定是否访问该网站,或者在网页被删除或暂时无法连接时,方便用户查看原网页的内容(注:国内用户目前暂时无法使用Google的网页快照)。
Google借用Dmoz的目录索引提供分类目录查询,但默认网站排列顺序并非按照字母顺序,而是根据网站PageRank 的分值高低排列。
Google的“蜘蛛”程序名为“Googlebot”,Google一般每隔28天派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。
新浪(sina)
新浪是全球范围内最大的华语门户网站之一,仅新浪北京目前每天访问量高达6亿次。根据北京赛迪网信息技术有限公司和盖洛普咨询有限公司联合发布的中国互联网用户行为和态度研究(CIUA 2000)报告,新浪是国内网民最常访问的网站。
新浪自建独立的目录索引。共设15大类目录,10,000多个子目,收录网站达20余万,是规模最大的中文搜索引擎。提供网站、中文网页、英文网页、新闻、图片、MP3、旅游等查询项目,支持中文域名。
搜索规则:默认分类网站搜索,范围限于自身目录中的注册网站,当目录中没有相应的记录时,自动转为网页搜索。搜索网页时,调用Google搜索引擎进行查询。网站排名根据目录及网站信息与搜索条件的关联程度确定。
向新浪提交网站后,一般2个工作日内工作人员便会通知你结果。由于新浪是目前最常用的中文搜索引擎,也是网站访问量的主要来源之一,因此登录新浪也是网站推广的必经之路。
目前除学校、政府机构、科研单位的网站外,其他类型网站都须支付一定的费用才能登陆到新浪搜索引擎。
六.常用的搜索技巧
网站排名基本原则
在搜索引擎的“远古”时代,搜索结果的排列只是以搜索引擎在数据库中找到匹配网页的先后次序排列,但人们很快意识到这种搜索根本是无效的。实际上用户在信息检索时,最关心的是如何在最短时间内找到想要的东西,因此对搜索引擎提出了更高的要求,即不仅限于简单返回数据库检索结果,还应该对这些结果进行再加工,判断哪些最符合用户搜索意图,然后优先排列最匹配的网页。这便是搜索引擎发挥作用的最基本原则——相关性原则,有人更是将之上升为搜索引擎的“第一定律”。
从搜索引擎登录角度上看,相关性原则对网站也意义非凡。我们总是想让自己的网站信息优先出现在搜索结果中,以便吸引更多的访问者,因此了解搜索引擎在网站排名方面的一些规则,对于我们登录搜索引擎并获得理想的搜索排名会有相当大的帮助。
由于网页“相关性”是我们进行网页优化的最终目的,因此需要对其做进一步的探讨。
所谓相关性,就是指网站信息符合搜索条件的程度。搜索引擎在判断关联性时,基本上是根据网页中关键词的“匹配/位置/频次”原则,就是说网站内容中的字词、词组或短语与用户输入的关键词越匹配,出现的次数越多,则该网站的关联程度越高,在搜索结果中排名也越靠前。
随着互联网规模的不断发展,搜索引擎技术也在不断完善。为了给用户提供更有价值的搜索服务,目前各引擎在原有相关性基础上,逐步在排名规则中引入了网站主题和受欢迎程度的概念,具体体现为:一个网站的内容主题越集中,相关的外部链接越多,网站获得的点击率越高,则排名会越靠前。
当然万变不离其宗,这一切还是要基于信息关联的基础上的。即使你的网站主题突出,很受访问者的欢迎,但如果内容与用户的搜索条件不符,你仍旧是无法获得好名次的。这一点不难理解。
关键词选择技巧
关键词不是仅限于单个的词,还应包括词组和短语。
我们知道,在搜索引擎中检索信息都是通过输入关键词来实现的。因此正如其名所示,关键词的确非常关键。它是整个 网站登录 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / service.htm )过程中最基本,也是最重要的一步,是我们进行网页优化的基础,因此怎么强调其重要性都不过分。然而关键词的确定并非一件轻而易举的事,要考虑诸多因素,比如关键词必须与你的网站内容有关,词语间如何组合排列,是否符合搜索工具的要求,尽量避免采用热门关键词等等等等。所以说选择正确的关键词绝对是需要下一番工夫的。
那么如何才能找到最适合你的关键词呢?首先,要仔细揣摩你的潜在客户的心理,绞尽脑汁设想他们在查询与你有关的信息时最可能使用的关键词,并一一将这些词记录下来。不必担心列出的关键词会太多,相反你找到的关键词越多,用户覆盖面也越大,也就越有可能从中选出最佳的关键词。
我们经常听到这样的事例:一家公司的网站在搜索引擎上排在了前20名,业务量随之猛增到原来的10倍。而另一家公司排名同样也在前20位,可业务量前后却一点没变化。是什么造成了如此大的差异?原因很简单,就是前一家公司选择了正确的关键词,而后者在这方面则犯了致命的错误。这一事例说明,正确选择关键词对企业 网站营销 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / services.htm )的成败是何等重要。
.....................................................................................
■ 选择相关的关键词
对一家企业来说,挑选的关键词当然必须与自己的产品或服务有关。不要听信那些靠毫不相干的热门关键词吸引更多访问量的宣传,那样做不仅不道德,而且毫无意义。试想一个查找 测速仪 ( http: / / / csy.htm )的人,会对你生产的酱油感兴趣吗?当然不。必须承认,有时这种作法的确能提高网站的访问量,但既然你目的是销售产品,不是提供免费的小道消息,那么靠这种作弊手段增加访问量又有何用呢?
.....................................................................................
■ 选择具体的关键词
我们在挑选关键词时还有一点要注意,就是避免拿含义宽泛的一般性词语作为主打关键词,而是要根据你的业务或产品的种类,尽可能选取具体的词。比如一家销售木工机具的厂家,“Carpenter Tools”不是合适的关键词,“Chain Saws”则可能是明智的选择。
有人会问,既然“Carpenter Tools”是集合名词,涵盖了厂家所有的产品,为什么不用?我们不妨拿Carpenter Tools到 Google ( http: / / www. / )一试,你会发现搜索结果居然在6位数以上(实际数字为189,000),也就是说你的竞争者有近 200,000个!想在这么多竞争者当中脱颖而出几乎是“不可能完成的任务”。相反,“Chain Saws”项下的搜索结果则少得多(69,800个),你有更多的机会排在竞争者的前面。
.....................................................................................
■ 选用较长的关键词
与查询信息时尽量使用单词原形态相反,在提交网站时我们最好使用单词的较长形态,如可以用“games”的时候,尽量不要选择“game”。因为在搜索引擎支持单词多形态或断词查询的情况下,选用“games”可以保证你的网页在以“games”和“game”搜索时,都能获得被检索的机会。
.....................................................................................
■ 别忘错拼的单词?
不少关于如何选择关键词的文章都特别提到单词的错误拼写,如“contemorary modern coffee tables”,提醒我们别忘将之纳入关键词选择之列。其理论是,有些单词经常被用户拼错,考虑到一般人不会以错别字作为自己的目标关键词,因此如果聪明的你发现了这一诀窍,以错拼单词优化你的网页,那么一旦遇到用户再以这个错别字进行搜索,你就会高高在上,昂然屹立于搜索结果的前列!
事实果真如此吗?首先我们还是来看看上述例子错在哪里吧。“contemorary”实为“contemporary”,虽为一个字母之差,但从关键词角度两者则相去甚远了。奇怪的是根据关键词监测统计报告,“contemorary”在两个月内出现次数达66次之多!那么我们赶快将它列入关键词清单吗?且慢。我们先分析一下有谁会经常写错别字吧。是受过良好教育的正规商家吗?可能性不大,毕竟“contemporary”不是艰涩的拉丁文借用词嘛。看来象是某些粗心大意的丈夫或勤俭持家的主妇嫌疑比较大。凭心而论,他们会是你珍贵的客源,但不大可能成为你理想的商业合作伙伴。
反过来,如果一个潜在的客户偶然手误拼错了单词,却赫然发现你的网站出现在眼前,而且那个错别字被多次显著地以粗体字显示,他会做何反应?他会象发现金矿一样欣喜若狂?还是在心里对这家企业的素质产生一丝疑问?他会认为一个连基本文法都掌握不好的厂家,其实力实在值得怀疑。所以,错拼的关键词是个陷阱,采用时我们一定要三思。
而且,目前一些搜索引擎(如Google)都增加了自动拼写检查功能,当用户输入错别字时,系统会自动提供正确的词语选择。当用户意识到自己出错时,大部分都倾向于按提示的正确关键词进行搜索。所以现阶段来看,以错拼单词优化网页已基本上失去了意义。
.....................................................................................
■ 寻找关键词技巧
作为网站拥有者,你当然是最了解自己企业情况的人,所以你总是能找到最能反映自身业务特点的关键词。但单靠自己的努力有时难免会有些遗漏,这时你不妨来到搜索引擎上,找到竞争对手的网站,看看他们使用的是哪些关键词,你也许会从中得到一些启发的。
此外,借助一些关键词自动分析软件,可以迅速地从你的或你竞争对手的网页中提取适合的关键词,使你的工作效率成倍地提高,我们可以借助这些软件找到许多以前不曾考虑到的关键词,从而大幅扩充我们的关键词列表。
.....................................................................................
■ 停用词/过滤词(Stop Words/Filter Words)
这两者意义一样,都是指一些太常用以至没有任何检索价值的单词,比如“a”、“the”、“and”、“of”、“web”、“home page”等等。搜索引擎碰到这些词时一般都会过滤掉。因此为节省空间,应尽量避免使用这一类的词,尤其是在对文字数量有严格限制的地方。(如想验证上述规则,你可以试着在搜索引擎中以“stay the night” 查询 ( http: / / www. / search sourceid=navclient&ie=UTF-8&oe=UTF-8&q=stay%2Bthe%2Bnight )。你会发现结果中单词“the”虽与搜索条件匹配,但并未以粗体字显示,说明它被忽略掉了。)
.....................................................................................
■ 把关键词重复1000次
既然关键词出现频次是决定网站排名的重要因素,我们何不将它重复个1000次,这样不是即简单又有效吗?打住。殊不知这可是搜索引擎“石器时代”的做法,在当时的确奏效,现在则早已被搜索引擎所摒弃。
那时典型的做法是:“关键词,关键词,关键词......”。重复次数越多,网站排位越靠前。于是登录搜索引擎变成了一场无休止的关键词重复大赛。你重复500次不算多,我来600次,而将关键词重复上千次的也不乏其人。搜索引擎很快意识到了这种做法的危害性,忍无可忍之际终于站出来,警告那些事情做过了头的网站,如果继续执迷不悟,不仅达不到目的,还有可能被处极刑——永远将你的网站拒之门外!
所以不要刻意过分重复某个关键词,尤其不要在同一行连续使用某个关键词2次以上。在使用关键词时,要尽量做到自然流畅,符合基本的文法规则。
七.搜索引擎的评价及参数
(摘自http://211.68.78.61:1000/First/05_Web_engine/搜索/主流搜索引擎测试.htm ( http: / / 211.68.78.61:1000 / First / 05_Web_engine / 搜索 / 主流搜索引擎测试.htm ))
在宽带日益普及的今天,引擎已经是使用率最高的网络工具之一,它可以使网虫们快速的在海量的网络资源里找到所需要的信息,可以不夸张的说只要接触过网络的人几乎都使用过搜索引擎。目前的搜索引擎可谓五花八门、种类繁多,但是经常使用的却只是那几种,今天笔者就来对google、百度等几个使用率较高的搜索引擎做个横向比较,以使用户可以找到最适合的搜索利器,更加轻松的畅游网络世界。
评测对象
本次评测选取了使用率较高的几大主流搜索引擎,它们分别是
·Google:http://www./ ( http: / / www. / " \t "_blank )
·百度:http://www./ ( http: / / www. / " \t "_blank )
·搜狗(搜狐):http://www./ ( http: / / www. / " \t "_blank )
·一搜(YAHOO):http:/// ( http: / / / " \t "_blank )
·中国搜索:http://www./ ( http: / / www. / " \t "_blank )
·新浪:http:/// ( http: / / / " \t "_blank )
·网易:http://so./ ( http: / / so. / " \t "_blank )
一、搜索界面
从搜索引擎的首页地址来看,google、百度、中国搜索(以下简称中搜)、搜狗和一搜都是比较简洁的,搜索栏位于网页正中,并且在四周标有分类、高级搜索等功能;新浪和网易的搜索主界面搜索框位于页面上方,页面大部分都是一些热门的搜索分类关键字,从而方便用户了对热门信息的查找。中搜页面上“龙”的标志看起来很显眼,而且提供了详细的分类导航功能。
打开搜索结果页面,google在搜索页面把相同网站的不同搜索结果错落排列,很容易让人看到其信息来源是出自一处的。由于新浪、网易都使用了google的技术支持和数据库,所以他们的页面显示情况相似,不过新浪对部分搜索内容在第一页给出的是其推荐的结果,在后面页面显示内容与google一致。中搜在前几位排列出最近有关搜索信息的最新新闻,并且标出了发布时间。
二、搜索能力测试
对于搜索引擎,大家最关心的就是其搜索能力的强弱,为此笔者从搜索的准确率、快照的打开的成功率、分类搜索能力等几方面进行了测试;而搜索数量(部分搜索引擎重复的搜索结果较多)、和搜索时间(几大主流搜索引擎仅相差百分之几秒)并不能反映出一个搜索引擎的搜索能力强弱,所以没有把其添加到测试项目中。
1、搜索准确率
这一参数是大家比较关心的,它决定着用户搜索到所需信息的时间。在这里笔者以“M65+手机+价格”为例,进行搜索,当搜索结果显示出报价则成功,以前20个搜索结果的成功率来表示搜索准确度。
Google:在搜索到的全部20个结果中有8个成功显示出M65手机的价格,最先显示出来的是第2条,准确度40%。
百度:在20个搜索结果中有9个成功的显示出了M65手机的价格,其中搜索结果的第一项就就显示出价格范围,准确度45%。
一搜:在20个搜索结果中成功的显示出价格的为5个,其中最先成功的为第3项,准确度25%。
中搜:在20个搜索结果中有8个成功的显示出价格,且第一项结果里就看到了价格,准确率40%。
搜狗:21个搜索结果里成功显示价格的为8个,但是其中有几个是重复的,第一个成功的结果在10项以后,准确率为30%。
新浪和网易由于使用了google的技术,从搜索结果上看它们的数据库也是一样的,准确率一样为40%。
2、网页快照
随着时间的流逝,部分网站可能会关闭或者对较老的资料进行了删除更新,这样就有一部分资料无法查询,为了解决这个问题,各大搜索引擎都推出了快照功能,在搜索引擎的网站服务器上保存了互联网上几乎所有网站的大部分页面,在不能链接到所需网站的时候,也能使用网页快照功能调出搜索引擎为您暂存的网页救急。下面笔者就来测试一下几大主流搜索引擎打开快照功能的成功率。测试中笔者选取了老掉牙的微机型号——“486DX100”,结果以20个快照的成功比率来计算。
Google:在第一次进行测试的时候可能是网络方面的问题20个快照没有一个打开的,但是使用相同数据库的新浪和网易却可以打开,在第二天补测的时候前10个快照打开,后10个失败,成功率不如使用相同数据库的新浪、网易,成功率50%。
百度:20个搜索结果的快照全部成功打开,成功率100%,看来以后要是找老文件就得靠百度了。
一搜:20个结果的快照全部成功打开,成功率100%。
中搜:20个搜索结果的快照打开了17个,成功率85%。
搜狗:20个搜索结果的快照全部成功打开,成功率100%。
新浪:20个搜索结果中快照成功打开16个,成功率80%。
网易:与新浪使用了相同的数据库,所以它的成功率与新浪相同,成功率80%。
3、分类搜索
分类搜索引擎采用网站登录/收录方式,依据主旨、用户对象及网络资源状况构建分类体系,把收集到本地的网站页面进行人工编辑,层层类分,形成纵向隶属、横向关联的网站目录数据库。这样可以近一步缩小搜索范围,从而减少有用户的搜索时间。
目前的分类主要包括图片、音乐、新闻等,下面笔者就以一实例来做个准确度的测试。MP3是目前搜索绿比较高的文件,在测试中笔者选取了最近较流行的歌曲“七里香”的MP3文件,结果以前20项所有连接的下载成功率来计算。
Google:因为google没有专用的音乐下载分类,所以笔者使用了“七里香+下载“为条件进行搜索,在搜索的前20个结果全部需要开新页面进行下载,其中成功数仅为8个,但这对只是用普通搜索功能进行的测试来说已经是个不错的结果了,成功率 40%。
百度:20项全部可以下载,而且有文件大小和速度标识,但有两项下载的不是七里香的MP3,成功下载连接18,成功率90%。
一搜:20项搜索结果全部下载成功,下载界面文件类型、速度等标识齐全,不过下载时需要打开二级网页进行下载。成功率 100%。
中搜:20项搜索结果全部下载成功,下载界面文件类型、速度等标识齐全,不过有五项是其专集里的其它歌曲,成功率 75%。
搜狗:由于搜狗也没有专门的音乐搜索引擎,笔者的搜索条件仍为“七里香+下载”,搜索结果全部在二级网页,经过一番努力笔者只成功的下载了7个。成功率 35%。
新浪:与百度和一搜一样有专门的MP3分类,搜索结果界面标识齐全,20个搜索结果全部可以下载,但有一个不完全只有几秒,2个错误的歌曲,下载成功率 85%。
网易:网易拥有专门的音乐搜索引擎,而且界面做得很别致,下载界面歌曲的各项标识齐全,可能是由于其音乐搜索功能还在建设完善中的原因,20项下载结果中有7项下载结果不符,1项无效,成功率为60%。
三、高级搜索
为了能做到万里挑一,更准确、更省时的找到相关信息,部分专业搜索引擎还提供了“高级搜索”功能。其中Google和百度在这方面做的比较出色,从关键位置、到文件格式、发布时间可谓详尽。
四、个性服务
各大搜索引擎为了在竞争中占有更大的市场份额,除了基本的图片、网站等基本搜索功能,纷纷推出了个性服务。
Google:手气不错、论坛搜索、目录搜索
手气不错,输入搜索关键字都点击“手气不错”可以快速找到google为您推荐的最佳网页。
论坛搜索,常泡论坛的朋友都知道,网络上有部分信息论坛中的发布时间要早于网站,而且有的信息只能在论坛上才可以看到。为此,gooogle也特别设置了论坛搜索功能,专门用来查询并观看各讨论区里的留言信息。
目录搜索,Google 的网页目录能帮助您了解各分类主题的相关程度,使用网路目录检索,能将搜索范围局限于特定的分类内,略去类似但无关的其它网页。例如检索各『大学』,如果将搜索范围设定于『教育机构』的分类内,便可略去其它网页像是『大学书城』等信息。
百度:贴吧
贴吧,百度的贴吧是个类似BBS的功能,可以在里边随意的发表信息,而贴吧搜索则是可以在这些发表的信息中进行搜索。
新浪:黄页、万师行
通过黄页功能可以快速找到万方数据提供的企业地址、简介等相关信息,使用“万师行”,可以快速找到各个行业的专业服务者。
网易:时尚搜索
时尚搜索,利用网易的时尚搜索功能,可以快速搜索到可视手机、汽车改装等最新、最炫的时尚信息。
一搜:实名直达
因为YAHOO收购了3721,所以在其搜索引擎中也就整合了3721的招牌产品“网络实名”,对于它我想大家已经都很熟悉了,笔者就不再加以解释了。
中搜:拼音纠错
中搜中具有颇为实用的“拼音纠错”功能,使用它可以起用南方音,(z=zh;s=sh),这对于一些方言较重的朋友来说是个不错的选择。至于使用方法,只要点击搜索框下边的“个性设置”就可以看见了。
搜狗:直通车
搜狗的直通车功能属于网站导航类,通过它可以快速的查询到外汇牌价、列车时刻表等信息。
五、特色工具——搜索工具条
为了方便搜索者,同时争夺用户和扩大市场占有,众多的专业搜索引擎无不争先恐后的推出了特色工具——搜索工具条。
用户无需打开搜索引擎的主页就可以在工具条内输入关键字进行搜索。
当前的搜索工具条多是嵌入浏览器的——toolbar,另外还有一种在桌面上运行的——deskbar,toolbar只有在打开浏览器时才可以显示,占用的系统资源比较少,而deskbar不需要打开浏览器真正的作到了即时查看的,但是其相对的占用系统资源也多一些。
下载地址
Google:http://toolbar./data/zh-CN/big/current/GoogleToolbarInstaller.exe ( http: / / toolbar. / data / zh-CN / big / current / GoogleToolbarInstaller.exe" \t "_blank )
百度:http://sobar./sobar/setup_baiducb.exe ( http: / / sobar. / sobar / setup_baiducb.exe" \t "_blank )
一搜:http://download./yisou/install/yisou.exe ( http: / / download. / yisou / install / yisou.exe" \t "_blank )
新浪:http:///ticker/sinaddt.exe ( http: / / / ticker / sinaddt.exe" \t "_blank )
(中搜)网络猪:http://download./07/700004/setup.exe ( http: / / download. / 07 / 700004 / setup.exe" \t "_blank )
1、操作便利性
几大搜索引擎提供的搜索工具条大都可以直接在搜索栏中输入地址进行直接查询,但是新浪的工具条打开的却是搜索选择界面,至少需要经过两步操作才可以达到搜索目的,网络猪需要安装在桌面并且注册ID。另外一搜工具条的画中画功能可以在查看搜索结果的同时不离开当前页面,而且还可以对网页上的内容进行“划字搜索”(使用鼠标在网页上选取关键字点右键直接搜索),大大方便了用户的使用。
2、搜索分类
与主页的引擎一样,这些工具条也都具有分类搜索功能,并且其分类详细程度与主页相同。
3、附加功能
除了搜索外,各大搜索引擎还为其工具条增添了许多附加功能,像流行的广告拦截、IE修复、关键字标亮功能,比较有特色的是google toolbar附加了当前网页好感度、连接相关博客站的特殊功能,而新浪的搜索条更像是个缩小体积的新浪网,新闻、娱乐应有尽有,就连电子邮件和短信的发送功能也集成到了其toolbar上。
评测总结:
在此次评测中,百度在各方面表现都比较出众,堪称完美;Google、中搜在搜索能力附加功能、高级搜索方面都有着不错的表现,而且中搜还拥有为南方用户贴心设计的“拼音纠错”功能;新浪和网易虽然都使用了Google的技术和数据库,但是其在高级搜索等方面与Google和百度还是有着一定的距离的;一搜与搜狗在搜索能力处于中等水平,但是都具有着鲜明的特色,特别是一搜工具条的“画中画”、划字搜索功能都很值得称赞。
其实最后笔者还是要提醒大家:在选择搜索引擎时笔者建议大家从实际使用情况出发,选择最适合自己的搜索引擎。
八.特色网站介绍
在中国,我们最常用的恐怕就是百度和GOOGLE了。然而除了这两位元老以外,仍有大量新秀涌出,像SOGO、一搜等,都有自己的特长和特色,在此就不一一列出了,请各位看官不妨自己找一找,说不定还会有意外的收获呢。
九.搜索引擎的比较
限于篇幅,在这里,本人只对百度和新浪了测试:
1.搜索“EMINEM演唱会”(新闻)
速度 搜索量 准确率
百度 0.032秒 42,600 约45%
新浪 0.051秒 573 约70%
2.搜索“EMINEM encore专辑下载”(文件下载)
速度 搜索量 准确率
百度 0.047秒 769 达到了95%以上
新浪 0.473秒 166 只有30%
本人还做了其他一些搜索测试,就不在此一一列举,总地来说,这些结果告诉我们百度不管在任何方面都已经十分成熟,而且在程序和音乐搜索方面尤其出色,我也很高兴中国人能靠自己的力量制作出如此完善的搜索引擎。但另一方面,新浪的搜索引擎就很需要进一步完善了,除了搜索速度慢以外,网页大量重复等问题也让人担忧,但新浪的新闻查询做的还算不错。
十.心得体会
1.搜索技术巧方面
在这几天报告制作的过程中,令本人受益匪浅,就搜索技巧而言,我发现可以归纳成一句话,就是“能简就简”,这样才能最大限度地搜出自己所需的东西。
另外,很多小符号也是很有用的,比如“+”、“-”、“*”以及引号和空格等,都会使搜索简单不少。
2.搜索引擎的选择
就我个人而言,GOOGLE是我最常用的搜索引擎,也是我最满意的一个,因为它快捷,且人性化。担当我想下载一些音乐文件时,我还是会使用百度。一千个人心中就有一千个哈姆雷特,所以也不存在所谓的“最好的引擎”关键看大家的使用习惯。
——全文完——
PAGE
21(共39张PPT)
高一(1)班
钟博远(编撰&资料&制作)
董一林(资料&资料选取)
2007-10-9~20
虽然没有法定官方语言,英语是事实上的国家语言。据2003年统计,约2亿1480万(81.6%)的五岁以上人口在家只说英语。英语是最通用的交流语言,掌握一定程度的英语也是移民归化的要求之一。
美国的平均教育水平极高,联合国的经济指数调查中将美国的教育水平列为世界第一。在世界排名前500名大学中,美国占168所,前20名中,美国占17所。全美有约3600所大学,因此能在全美大学排名挤进前50名的都是名校。而最有名的有六所(麻省理工学院、加州理工学院、哈佛大学、耶鲁大学、普林斯顿大学、和史丹佛大学),因为它们不但是最难申请上的,而且在每次的全美或世界大学排名都能进前10名。
种类和风格之多,正反映出美国的文化大镕炉特色。摇滚乐、节奏布鲁斯、爵士乐和乡村音乐等世界闻名的音乐类型都是源自美国。在20世纪初,从美国灌录、复制的唱片流行音乐逐渐传播至全世界,一些美国的流行音乐几乎在世界各地都能听到。
如同其他所有国家一般,美国文学是由其独特的发展历史所塑成的。在早期,美国是由东岸的一系列英国殖民地所形成的,因此美国文学的传统较亲近于英国文学。不过,随著历史的进展和不断的移民潮,美国文学的特色和宽广度都已经超出英国文学的范畴。
并非所有的美国文化都是源自其他国家,电影的诞生和发展便都是源自美国的。在1920年代,美国每年平均产出高达800部正规电影,除了电影之外,由迪士尼开创的卡通技术也是源自美国。 美国也是世界上电视技术发展和普及最早的国家之一。在今天,美国有著数千家电视台,电视是美国人文化和生活的一部分,喜爱看电视也是大多数美国人的少数共同特征之一。
美国梦(American Dream),是一种相信只要在美国经过努力不懈的奋斗便能获致更好生活的理想,亦即人们必须透过自己的工作勤奋、勇气、创意、和决心迈向繁荣,而非依赖于特定的社会阶级和他人的援助。通常这代表了人们在经济上的成功或是企业家的精神。许多欧洲移民都是抱持著美国梦的理想前往美国的。尽管有些人批评美国梦过度强调了物质财富在衡量胜利和快乐上扮演的角色,但许多美国人的确认为,这种获致成功的机会在世界上其他国家是找不到也并不存在的。因为与其他大多数国家不同的是,在美国拥有的经济自由相当多,政府扮演的角色相当有限,这使得美国的社会流动性极大,任何人都有可能透过自己的努力迈向巅峰。 依据历史学家的说法,美国快速的经济发展和工业扩张并非只是因为美国的自然资源丰富,更是因为所有人都有机会藉由自己的奋斗获取财富。美国梦成为了吸引世界各地人民移民美国的主要原因—无论过去或现在。在今天,每年有超过一百万的人成为合法的美国公民,是世界上最受欢迎的国家。
教育是美国社会文化的重要组成部分。 在美国,人们普遍认为每个人都有权利,也有义务接受教育。各州都有强制性入学的法律规定。所有16岁以前的儿童,除非有严重残疾,必须进学校学习。美国有80%的孩子能接受中等教育,50%的中学毕业生能够进入高等教育机构学习。 有些学校为公立。公立学校由地方财政来支持,并由地方官员负责管理。私立学校一般都要收费,不直接接受社会管理。私立学校分为两类:宗教学校和非宗教学校。 宗教学校由宗教团体支持,占私立学校的绝大部分。非宗教性质的私立学校主要为中学或学院。 各类教育都非常重视学生的参与。课上任何时候都鼓励学生的讨论和提问。课堂参与的程度被列为期终的成绩评定。在课上教师不仅仅提供给学生食物——知识,而且通过实际练习教给学生学会如何自己获取食物的技能。学生有充足的时间自主安排课外活动。
主要地点 游览景点
华盛顿 宾夕法尼亚大学 白宫 林肯纪念碑 国会图书馆 华盛顿太空博物馆 罗斯福公园 杰弗逊纪念堂
纽约 联合国总部 中央公园 华尔街 自由女神像 世贸中心遗址 帝国大厦 百老汇 时代广场 哥伦比亚大学
波士顿
儿童博物馆 公共图书馆 州议会大厦 富兰克林雕像 哈福大学 麻省理工学院 耶鲁大学 波士顿大学
注:景点介绍见附页
华盛顿是美国的政治中心,
白宫、国会、美国最高法院以及
绝大多数政府机构均设在这里。
国会大厦(右图)建在被称为“国会山”的全城最高点上,它是华盛顿的象征。这座乳白色的建筑有一个圆顶主搂和相互连接的东、西两翼大楼,美国国会参众两院都在国会大楼里办公。白宫是一座白色大理石圆形建筑,是华盛顿之后美国历届总统办公和居住的地方。椭圆形的美国总统办公室设在白宫西厢房内,南窗外边是著名的“玫瑰园”。白宫正楼南面的南草坪是”总统花园”,美国总统常在这里举行欢迎贵宾的仪式。国会大厦和白宫之间有“联邦三角”建筑群,其中包括联邦政府机构以及国家美术馆、国家档案馆、泛美联盟、史密森国家博物馆和联邦储备大厦等。华盛顿面积最大的建筑是位于波托马克河河畔的美国国防部所在地五角大楼。
纽约是世界特大城市之一,美国最大的金融、商业、贸易和文化中心。位于美国东北部哈得孙河注入大西洋的河口处。市区面积945平方公里,其中水面168平方公里。人口732万(1990)。由曼哈顿、布朗克斯、布鲁克林、昆斯和里士满5个区组成。此外,还包括自由岛、埃利斯岛、加弗纳斯岛、罗斯福岛等小岛。大纽约市除上述5个区外,还包括纽约州、新泽西州和康涅狄格州的26个县,面积32400余平方公里,是世界最大的都市区之一;人口1680万,是全国人口密度最大的地区。 纽约气候温和湿润,全年无霜期276天,年平均气温11℃,年降水量1091毫米,雨日123天。
原是印第安人居住地。1626年荷兰人从印第安人手中低价买下曼哈顿岛,在近哈得孙河口一角地辟作贸易站,称为“新阿姆斯特丹”。1664年被英国夺占,改名纽约,范围扩大到邻近陆地和长岛等处。1686年设市。1789年为美国临时首都(至1796年),第一任总统华盛顿在此就职。1825年伊利运河开通,纽约到五大潮地区有了全年通航的水道,沟通了美国中西部与大西洋沿岸的经济联系,使纽约处于对内对外贸易的重要交接点上。随着“纽约中央铁道”及多条铁路和公路的兴建,经济日益繁盛,纽约成为世界性的大城市和港口。居民中,种族与民族构成复杂,以黑人(约占纽约市人口总数的25%)、犹太人(20%)、意大利人(15%)、波多黎各人(11%)和爱尔兰人(10%)五族后裔居多,合计约占纽约市人口的81%。
纽约是全国最大经济中心及仅次于芝加哥和洛杉矶的全国第三大工业中心。工业以服装和出版业最盛;次为化学、电气器具、金属制品、食品、化妆品、玩具和炼油等。服装业集中于曼哈顿区,是世界上最大的服装业中心之一。印刷出版业集中于市区,占有全国约1/6的印刷能力和1/3的出版物。设有全国著名出版社的总部。新泽西所属的几个县,也是主要的工业区,有电机及设备制造、飞机零件、化妆品、化肥、化学、纺织、皮革等工业。
纽约是美国和世界的金融和证券交易中心。位于曼哈顿岛南部的华尔街耸立着许多摩天大楼,集中有几十家大银行、保险公司和证券交易所,以及成百家大工业公司和运输公司的总经理处。
纽约也是全国文化教育和电视、广播中心。拥有94所大学和学院,976所公立学校,914所私立学校。纽约市立大学规模最大,包括17个学院和一个研究生所院,注册学生17.7万人。哥伦比亚大学是全市创建最早的高校(1754年始建),是最著名的私立大学;其次是纽约大学等。福尔特罕和圣约翰大学是著名天主教会学校。此外还有众多的博物馆、美术馆、图书馆、科研机构、艺术中心等。其中最著名的大都会艺术博物馆是全美洲规模最大的一所。自然历史博物馆也享有盛名。纽约的公园、游乐场、海滩疗养地、剧院、歌剧院、音乐厅、画廊等均占全国首位。仅公园就有100余个。耸立在自由岛上的自由女神像被视作纽约市的“陆标”,建成于1886年,是法国人民为纪念美国独立战争和两国人民友谊而赠送的礼物。自由女神像连底座约高100米,内有螺旋形阶梯和电梯可抵达女神像头部,头部内是一间可容40余人的观览厅,可眺望港区全景。
当人们一想到波士顿,首先进入到脑海中的印象可能就是身为美国诞生地的这个角色。是的,许多历史都在波士顿发生,许多「第一次」的光环围绕着波士顿,第一次高唱美国国歌、第一次在独立日宣读独立宣言、第一所公立学校、全美第一家印刷厂和邮局等等,这个被移民者期待建于山丘之上、並且成为大家目光焦点的城市,在历史的意义上它办到了。在这个城市的鹅蕊石街道上、在每扇关上的窗前,我们彷彿可以看见徘徊其间的历史故事,那些标示着为迈向自由所牺牲的历史遗迹,都告诉每个来访遊客这个城市过去的点点滴滴。
但是如果你在造访波士顿时,只把眼光关注于过去,那麽你将会失去体会这个城市真正面貌的机会,因为波士顿在光荣历史的铺陈下,却有着充满活跃力与年轻的特质,这种新与旧的和谐交融,不仅没有让波士顿变得无以自处,反而让波士顿拥有一种「立足过去、放眼未来」的开阔胸襟。
没有太誇张的现代都会容貌,多了一份典雅的自得,波士顿这个小的可以让散步成为一种艺术,却也大得可以让人沉溺其豐富多彩的生活方式的城市,总是让人行走其间时,轻易呼吸到空气中舒适的人文及知性的气息,也是在缓步行走的同时,清楚体会波士顿新旧交融的和谐脉动。
位置:麻塞诸塞州首府,新英格兰六省之一。
时差:四月至十月比台湾晚12个小时(夏令时间拨快一小时),其他时间比台湾晚13个小时。
电压:120伏特。
平均气温:春季4-5月为摄氏5-22度,夏季6至8月摄氏22-33度,秋季9月至11月为摄氏7-24,冬季12月至3月为摄氏零下9度-零下7度。
日 期 行 程
8月1日 从北京出发,到达华盛顿机场,入住Tom’s Hotel。
8月2~3日 参观宾夕法尼亚大学、白宫、林肯纪念碑、国会图书馆、华盛顿太空博物馆 、罗斯福公园、杰弗逊纪念堂
8月4~6日 到纽约。参观联合国总部、中央公园、华尔街、自由女神像、世贸中心遗址、帝国大厦 百老汇、时代广场、哥伦比亚大学
8月7~8日 到波士顿。参观儿童博物馆 、公共图书馆 、州议会大厦、富兰克林雕像 、哈福大学 麻省理工学院、耶鲁大学、波士顿大学
8月9日 回国
护照
机票
足量的美元
换洗的衣服
药品
地图
笔纸
电话
小费与礼节 关于小费 在美国接受服务之后有付小费的习惯。对于中国人来说也许不太习惯。在西海岸的城市,很多都把小费写在账单上。小费是对劳动的报偿,有很多以此为生的人,所以要支付小费。 开门服务员机场搬运人员 每件行李$1-2。下雨时不好叫出租车,叫到出租车给小费$1。 餐馆用餐时 消费额的15%-20%是用餐后恰当的小费金额,但当餐馆收取服务费时可相对减少小费金额。另外,在酒吧每杯酒给调酒员$1。 出租车 小费为总额的15%。至少给$1。人数多或行李多时还要相应增加。 机场小巴 $1-3组有,按规定线路运行的大巴可以不给小费。 饭店搬运行李员 一件行李$1。 看大门的人 如果只是简单的问题不要小费,但是如果请他帮忙买比较难买的票的话根据难易度给$10、20、30的小费 打扫房间的人 如果是叫人来的话一般是服务费的10%-15%,要毛巾等物品的话$1。 观光巴士 大型观光巴士1日游或专线游$1-2,小型面包车1日游$5
单价 数量 总价
机票(北京往返华盛顿) ¥13125 2人 ¥ 26250
华盛顿→纽约(旅游Bus) ¥263
2人 ¥526
纽约→波士顿(旅游Bus) ¥300 2人 ¥600
住宿费(Total) ¥2700 2人 ¥5400
交通费 ¥1350 2人 ¥2700
膳食 ¥2250 2人 ¥4500
小费 ¥400 2人 ¥800
签证费 ¥200 2人 ¥400
总费用 ¥20588 2人 ¥41176
宾夕法尼亚大学(University of Pennsylvania),位于宾夕法尼亚州的费城,是美国一所著名的私立研究型大学,八所常春藤盟校之一。学校创建于1740年,是美国第四古老的高等教育机构,以及美国第一所现代意义上的大学。独立宣言的9位签字者和美国宪法的11位签字者和该校有关。本杰明·富兰克林是学校的创建人。
宾夕法尼亚大学在艺术、人文、社会科学、建筑与工程教育上处于领先地位,其中最为知名的学科是商学、法学与医学。学校拥有约4,500名教授,近 10,000名全日制本科生与10,000多名研究生。2006年学校获得的科研经费达到6千6百多万美元,从事研究的人员包括约4,200名教职工, 870名博士后,3,800名研究生与5,400多名技术人员。同时,学校每年的建设投入达到4亿美元以上,在常春藤盟校中名列前茅。
宾夕法尼亚大学还是美国大学联合会的14所创史校之一。
地点:华盛顿市中心区的宾夕法尼亚大街1600号
地位:美国总统府所在地
向游客开放的部分:主要是白宫的东翼,包括底层的外宾接待室、瓷器室、金银器室和图书室,一楼的宴会厅、红厅、蓝厅、绿厅和东大厅。它是世界上唯一定期向公众开放的国家元首的官邸。
常识:白宫共占地7.3万多平方米,由主楼和东、西两翼三部分组成。主楼宽51.51米,进深25.75米,共有底层、一楼和二楼3层。
在华盛顿的国家大草坪西端,碧波如染的波托马克河东岸上,有一座用通体洁白的花岗岩和大理石建造的古希腊神殿式纪念堂。它是为纪念美国第16任总统阿伯拉罕·林肯而建造的,与东端的国会大厦遥遥,林肯是美国历史上最伟大的总统之一。
美国国会图书馆是全世界藏书量最大的图书馆之一,位于华盛顿国会大厦正东处,由杰斐逊大厦、亚当斯大厦和麦迪逊纪念大厦构成。
它最早建立于1800年,收藏有2000万册图书以及各种图表、手稿、地图、期刊、唱片、电影胶片等等,总量达到8000万件。馆内的书架连接起来长达547公里。这里有华盛顿的日记手稿、《独立宣言》的原稿、首次印刷成书的《圣经》,甚至还有清政府赠送的书籍。这是一座巨大的知识宝库,游人来到这里,即便是来不及坐下来阅读书籍,至少可以参观一下它宏大的规模和极具水准的布置。
华盛顿航空太空博物馆位于堪萨斯州,是世界上最大的有关航空方面的博物馆,它属于斯密生博物馆群中的一员,而且是最新创立的一个机构。该馆有最重要的航空文献,及气球、飞机、太空航具、飞行机具,也有世界各国的飞机产品. 景色特点华盛顿太空博物馆是全世界最受欢迎的博物馆,每年有750万名游客至此参观,飞机和宇宙飞船从花板悬吊下来。怀特兄弟最早发明的双翼飞机,就悬挂在入口处的展览走廊上。太空时代馆展示月球石头。
罗斯福 (Theodore Roosevelt)国家公园位于荒烟漫草的北达科他州。这个公园是为了纪念老罗斯福总统而命名,因为他在当总统前曾在这里住过一段时间,并且经营过牧场养牛。他自认在这里的历练对于后来成为总统有很大的影响,并且使他对自然环境的保育有严肃的体认。他在任内推动成立了全国性的国家公园管理体系(当时叫森林管理处),并宣告通过了十八个保护区(National Monument),五个国家公园以及五十一个野生动物保留地(Wildlife Refuge)。谈环保在现代不稀奇,但是在二十世纪初年,这样的眼光和魄力就很让人钦佩了。
为了纪念杰弗逊而建造的这座洁白的、以科林斯式石柱环绕的圆顶建筑本身也成了经典之作。整座纪念堂典雅纯洁,外围共有54根花岗岩石柱,每根长43英尺(约13米),重45吨,给人一种沉静的感觉。纪念堂的北面是大斜坡状台阶,游人至此都需仰望,看到由8根大石柱支撑的门廊山墙上一组庄严的大理石浮雕。那是美国独立前夕,杰弗逊等5人受大陆会议委任,起草《独立宣言》的情景。年轻的杰弗逊站在中间,他的左侧是本杰明·富兰克林、约翰·亚当斯;杰弗逊的右侧是另两位合作者罗杰·谢尔曼和罗伯特·利文斯顿。这组石雕像的作者是纽约的雕刻家温曼(Adolph A.Weinman),他受杰弗逊纪念堂修建委员会的委托,赶在纪念堂落成之前完成了这个作品。
纽约旅游景点:
1 世界贸易中心:位于曼哈顿岛的南端,原来为世界上最高的双塔,纽约市的标志性建筑,是美国金融,贸易的中心之一。2001年9月11日被恐怖主义者炸毁,现在的地方叫GROUND ZERO
2 自由女神像:位于曼哈顿南部的爱丽丝岛,是美国建国200年时法国送给美国的礼物。(原来法国计划送个埃及的,因为神像是女性被埃及拒绝,后法国转手送给美国,成为纽约市甚至全美国的标志。)
3 中央公园:是全世界大都市中最美的城市公园,有湖,有树,有花,有鸟,还有很多中国的艺术家们在那里摆摊儿画素描挣钱。中央公园是去纽约必去的地方。在第五大道和中央公园西道,从59街到110街区
4 百老汇:是曼哈顿岛上最著名的一条大街。长!丰富!有意思!不能不去!
博物馆内四个楼层的展品可满足各个年龄段的儿童,从初学走路的婴儿到10来岁的小孩以及更大些的孩子。大多数展品是可触摸的,所有展览都提供一次学习,欣赏的经历。博物馆有一幢日本丝绸商人的房子,展出从日本京都搬来的真品;还有一个有关多元文化主义的展览,它是同类展览中的首家;馆中有一名为“祖母阁楼”的展室,孩子们在里面可以试穿各种精品服装;另外还有许多特别的展览、实物和演出。地址:议会街300号,地铁南站。电话:617 426 8855,开放时间:每天10:00~17:00,周五延长到21:00;关闭时间:9月到次年6月的每周一,另外在感恩节、圣诞节和新年也不开放。除周五外参观。
州议会大厦建于1798年,由18世纪著名的建筑师查尔斯·布而芬奇设计,华盛顿特区的美国国会大厦也是他设计的。大楼内富丽堂皇。旗厅就在圆顶下面,是为了惧内占时期的战旗而建的。有关里维尔飞骑报信和“波士顿茶党案”的壁画半点了参议院楼梯厅。众议院大厅悬挂着一个著名木制鱼—马萨诸塞州“神圣的鳕鱼”,表明了1784年以来捕渔业在这里的重要性是绝不能忽视的。地下档案馆和博物馆里有《五朋花和约》等许多珍贵的历史文件。地址:比肯街,地铁公园站下车。电话:617 727 3676。大厦开放时间:周一至周五9:00~17:00;参观博物馆和档案馆时间:10:00~16:00,每分钟一次,关闭时间:州立节日。
http://www./www/detailhtml/1100466431.html
http://www./scenery_abroad_show.asp SceneryID=13235
http://www./global/america/states/uanyo.htm
http://usa./art/471/
1、选题困难,美国比较陌生 解决:多查资料,了解情况
2、资料太多,没有头绪。 解决:仔细研读,围绕主题
3、时间过紧,两人间没有过多交流 解决:互相查缺补漏,确保
方案的完整性时间 行程 活动 交通 住宿 费用
第1天 上午 首都国际机场-成田机场-秋叶原 乘飞机到达日本成田机场,在秋叶原吃午餐 乘京城电铁“Sky liner”或JR山手线,在日暮里换车,到秋叶原站 神田太阳宾馆
(千代田区内神田2-8-4) 机票:1800人民币
车费:2人600日元左右
住宿:2人14000日元
吃饭:2人2000日元左右
下午 秋叶原 参观购物,前往上野公园赏樱 JR地铁到上野车站 门票免费
电车:2人400日元
第2天 上午-下午4点 秋叶原-池袋 在池袋(东京动漫中心)大肆购物!! 电车 购物:共10000日元左右
下午4点-晚上 东京-新宿-箱根 从东京前往富士山脚下的温泉酒店,在宾馆吃晚餐 搭乘JR山手线(外环)到新宿,再买小田急箱根周游票前往箱根 富士山温泉酒店 交通:2人600日元左右
小田急箱根周游票(2天):2人共10000日元
第3天 全天 富士山 泡酒店里的免费温泉、爬富士山 住宿+餐费:2人10000日元
第4天 上午-下午4点 箱根 周游美丽的箱根,参观箱根秋海棠園等,可以凭小田急箱根周游票随意上下车,在路边小餐馆吃快餐 小田急线 餐费:2人约2000日元
下午4点-晚上 箱根-日暮里-成田机场-济州岛 前往韩国济州岛,入住酒店 小田急线 到新宿车站
JR山手线 到日暮里
SKY LINER 到成田机场
乘飞机前往韩国济州岛 韩国民家旅店 机票:30000日元左右
第5天 上午 济州民俗博物馆 参观济州民俗博物馆,体验民族风情。 济州机场乘坐开往济州民俗博物馆的车。 2人共2000韩元
下午 济州岛——泰迪熊博物馆 参观泰迪熊博物馆 中文观光车 韩国民家旅店 门票:2人共10000韩元
车票:2人共1900韩元
住宿:20000韩元
第6天 全天 汉拿山 爬汉拿山 公共汽车 乘飞机到首尔,入住最佳西方尼加拉酒店 门票:2人共3400韩元
机票:折合人民币3000元
住宿:2人共1650韩元
第7天 全天 爱宝乐园 在游乐园中游玩一整天 在首尔地铁2号线江南站6号出口前乘坐5002路 乘飞机返回北京 门票:2人共54000韩元
机票:折合人民币3000元
费用TOTAL:两人总共约20000人民币TOC \o "1-7" \h \z 一、搜索引擎的产生与发展 2
1、搜索引擎的产生 2
2、搜索引擎的发展 3
二、搜索引擎的分类与区别 6
1、搜索引擎的分类 7
1.1纯技术型的全文检索搜索引擎 7
1.2分类目录 7
1.3这两种搜索引擎的应用 7
2.搜索引擎的区别 7
三、搜索引擎的工作原理 8
1、全文搜索引擎 8
2、目录索引 9
四、各种搜索引擎的代表网站 10
1、全文搜索引擎 10
ChinaByte CSEEK 10
网易 10
天网中英文搜索引擎 10
OMRON上海热线搜索器 11
悠游中文搜索 11
茉莉之窗 11
盖世搜索引擎 11
Seednet 搜索引擎 12
AltaVista中文搜索 12
2、目录索引 12
搜狐 12
指南针 13
华好网景、四通利方、我是野虎、天涯若比邻 13
蕃薯藤中文搜索引擎、哇塞 13
Yahoo中文搜索 14
五、常见的搜索引擎及其特点 14
1.国外英文目录索引 14
Yahoo — 最著名的目录索引,搜索引擎开山鼻祖之一。 14
2.国外英文搜索引擎 14
3.国内目录索引 15
搜狐(Sohu) — 国内三大门户之一,最早在国内推出搜索引擎收费登录服务。 15
4.国内搜索引擎 16
百度(Baidu) — 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。 16
六、使用搜索引擎的技巧 17
1.搜索关键词提练 17
2.细化搜索条件 18
3.用好逻辑命令 18
■ computer adventure game 18
■+computer +adventure +game 19
4.精确匹配搜索 19
5.特殊搜索命令 19
■ 标题搜索 20
■ 网站搜索 20
■ 链接搜索 20
■ 单词衍生形态查询 21
■ 网页快照(Snap Shot) 21
■ 网站内部查询 21
■ 横向相关查询 21
■ 概念延伸查询 21
7.用什么样的搜索引擎搜索 21
八、特色网站的介绍 22
22
23
24
九、搜索引擎的比较 25
有关2005年北大附中网校夏令营信息的查询 25
有关我国最早的人口普查资料的信息的查询 25
十、我的心得与体会 25
一、搜索引擎的产生与发展
1、搜索引擎的产生
在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。
现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。
Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达System Computing Services大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。
当时,“机器人”一词在编程者中十分流行。电脑“机器人”(Computer Robot)是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。
世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
与Wanderer相对应,Martin Koster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo。
2、搜索引擎的发展
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最负盛名。
然而JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos ( http: / / www." \t "_blank )。同年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo ( http: / / www." \t "_blank ),并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google ( http: / / www." \t "_blank ),其数据库中存放的网页已达30亿之巨!
随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi ( http: / / www." \t "_blank )(已被Yahoo收购),它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo,已被Yahoo收购)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度 ( http: / / www." \t "_blank )也属于这一类(注1),搜狐 ( http: / / www." \t "_blank )和新浪 ( http: / / " \t "_blank )用的就是它的技术(注2)。因此从这个意义上说,它们是搜索引擎的搜索引擎。
在浩瀚无序的网络世界查找特定信息,无疑需要借助网络资源整序及其查询工具。搜索引擎是打开网络之门的钥匙,是发掘和利用网络资源最有效的工具。资源整序技术和查询方式不同,决定了搜索引擎的不同类型。依据整序和查询的原理与工作方式,我们可以把搜索引擎分为全文搜索引擎(Full Text Search Engine)和分类搜索引擎(Directory)两种类型。
分类搜索引擎采用网站登录/收录方式,依据主旨、用户对象及网络资源状况构建分类体系,把收集到本地的网站页面进行人工编辑,层层类分,形成纵向隶属、横向关联的网站目录数据库。用户依据类目体系及其规则分类检索,逐类浏览,直至获得所需资源。
英国软件工程师Martijn Koster第一个提出人工描述网页并编制网页索引数据库的构想,他于1993年11月30日创建了AliWeb(Archie Like Indexing In The Web)。当时,FTP搜索是一种主要的网络搜索方式,Archie是著名的FTP搜索引擎。AliWeb数据库由网站管理员提交的网站列表和站内各个网页的简介构成。与“蜘蛛”程序生成的索引(spider indexe)不同,AliWeb只能查找进入数据库的文件,而不能对文件的具体内容进行检索。由于管理等方面的原因,向AliWeb提交网站列表和网页简介的管理员缺乏热情,而数据库的的空乏又使用户逐渐对它失去了兴趣,“无鸡便无蛋无蛋便无鸡”的结果,使它无疾而终。在AliWeb之前,尚无人涉足人工索引和分类浏览检索,Martijn Koster人工描述网页,建立索引数据库屏弃无用结果的方法,至今被广泛采用,最终诱发了分类导航网站和分类搜索引擎的诞生。
1994年对分类搜索引擎有着划时代的意义,这年的1月,美国德克萨斯大学推出了第一个可供检索的网络分类目录---EINet Galaxy。研发Galaxy 的最初动因是为了用于电子商务的大型目录指南服务。1995年4月Galaxy由一个研究项目演变为商业实体,1997年Galaxy被著名的网络安全公司CyberGuard收购,1998年9月CyberGuard 把Galaxy买给美国健康网(AHN.COM), 1999年5月Fox/News公司介入Galaxy,2000年5月几经变故的Galaxy,终于成为以galaxy.com而为令人注目的,以分类目录搜索而著名的自主独立的公司。
Yahoo!(www.)是美国斯坦福大学的两名博士生不经意间创造出来的奇迹,开创了分类目录导航搜索的新时代,
1994年2月大卫·费罗(David Filo)和杨致远(Jerry Yang)把他们平时搜集的与个人兴趣和学习相关的网络资源在校园网上建立了一个网络资源指南。他们花费大量时间编制资源列表,当最终由于列表太长而难以处理时,只得把资源列表分割为若干相关的单元归入若干大类,大类内容过于庞大而不便查找和管理时,又在大类下划分子类,子类下再依次划分更小的类目...。这时,支持今天Yahoo!的核心理念诞生了。(4)
Yahoo!最初以“Jerry互联网指南”(Jerry's Guide to the World Wide Web)为世人所知,1994年底Yahoo!的访问量首次突破100万人次。1995年4月美国Sequoia Capital风险投资公司向Yahoo!注资近200万美元,
Yahoo!从此步入快速发展时期。(5)。现在,Yahoo!在全球共有24个网站,12种语言版本,雅虎中国()于1999年9月开通上线。
Yahoo!作为著名的分类搜索网站,很长一个时期几乎成了“搜索”的代名词,她的分类体系和搜索模式对互联网的发展产生了巨大而深刻的影响。1998年9月7日Google问世以前,Yahoo!一直稳坐网络搜索的第一把交椅。这一时期,目录浏览式搜索风光无限,诸如www.、www.等颇具代表性的分类搜索网站应运而生,分类搜索成为网络搜索的主流。
1998年2月搜狐(www.)推出了第一个大型中文分类搜索引擎,这是一个土生土长的完全“中国化”的搜索引擎,她的诞生对中文网络搜索有着非凡的意义。
搜狐推出分类搜索引擎,使中国网民拥有了查找中文网络资源的工具。在2000年6月百度正式推出中文搜索引擎,2000年9月GOOGLE提供中文搜索以前,搜狐是唯一能与雅虎中国抗衡的中文分类搜索引擎,占据着中文搜索的半壁江山。由于搜狐的本土优势,它的分类体系、立类原则和类目设置更符合中国网民的检索习惯,也为国内分类搜索网站树立了典范。搜狐在提高中文网络资源的社会利用水平,中文分类搜索网站的兴起与发展等方面功不可没。“出门靠地图,上网找搜狐”,搜狐至今仍是中文分类搜索网站的旗舰与中坚。
继搜狐之后,国内分类搜索网站厚积薄发,一枝独秀。较为知名的有新浪(www.)、网易(www.)、雅虎中国()、蓝帆搜索(www.)、139探索器(www.)和北极星()等等,随着分类体系的逐步完善,搜索流量巨幅增长,搜索引擎对网站效益的贡献率不断提高,分类搜索引擎已成为开发和利用中文网络资源的主要工具。
1998年6月5日ODP网站www.问世,这是分类搜索引擎革命性变革的转折点,它伴随着ODP的诞生永远载入了互联网史册。
ODP(Open Directory Project),即“开放式分类目录搜索系统”,“是一个本着建立一个无偏见的、为大众服务的、阐述各种不同观点的,以及全面描述人类智慧为宗旨的,并由来自不同国家、不同文化背景、不同兴趣爱好的编辑共同维护的社区所组成。”
ODP的产生来源于两个年轻人的敏锐的观察和大胆的实践。美国加州Sun Microsystems公司的计算机程序师Rich Skrenta和Bob Truel认为Yahoo目录更新慢,死链多,致力寻求一种新的方法,创立一种全新的分类检索体系。他们受由志愿者编辑、维护的网络分类指南Godirectory(已消亡)和Zeal(2001年8月并入LookSmart数据库)的启发,基于最广泛地收集资源、最便捷地检索、最广泛地利用的理念,试验性的推出了Gnuhoo---一个完全开放的、网民共建的、网络共享的分类搜索系统。令人意想不到的是,www.上线的13天后,即6月18日,已有志愿编辑200人,把数据库分为2000个类目,索引了27000个网页。其间,由于Gnuhoo与自由软件开发组织GNU名称雷同,在其抗议下更名为Newhoo。1998年7月2日,志愿者增至400人,索引约网页31000个,目录扩充至3900类,1998年11月17日网景收购了,正式将系统命名为ODP,并将网站改名为Dmoz.org。此时,ODP已有4500个志愿者编辑,索引了大约100,000网页,1999年10月5日,索引的网页达到100万,2000年4月达到160万,2000年8月14日达到200万,2001年11也18日达到300万,2004年6月达到440万,所有网页分为590,000类,志愿者编辑已多达63,000 多人。Gnuhoo创立之初仅收录英文网站,2003年7月已有67个语种,英文网站占75%。现在,包括Google、Netscape、Lycos、Hotbot、Dogpile、Thunderstone、Linux、Mars Societyhttp://www./directory)等20多家搜索引擎和分类指南网站都在使用ODP的数据库。
2000年9月14日网易公司在国内率先推出了ODPhttp://search. 做为开放式目录的示范和“中国最大的开放式引擎”,受到众多网民的瞩目和热情参与。
在功能齐全的分布式编辑和管理系统的支持下,网易已拥有近万名义务目录管理员,创建了一个拥有多达一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。(9)有力地印证了“网聚人的力量”的网易宗旨。
网易虽开中文ODP先河,为中国的ODP事业做出了卓越贡献,但网易ODP在志愿者人数、数据库规模、索引网页文种、访问流量、管理机制以及网站效益等等方面远不及Gnuhoo,稚嫩的网易ODP需要有一个完善与成熟过程,需要网广大网民积极热情的参与。我们欣喜地看到,近年来为了ODP的发展,网易不懈努力、执着追求,先后为管理员设置了“优秀管理奖”,指定了《社会与文化管理员暂行条例》、《个人主页/世界各国/综合类管理员签到制度》、《新管理员指导手册》等多种规章,已初步构建起较为完整的管理体系。2004年7月2日网易与Google达成战略合作协议,将在其ODP系统中采用Google的专有搜索技术,网易ODP与Google的强强联合,将为网民提供最完美的搜索体验。
ODP与传统的分类搜索引擎形式上如出一辙,确有着本质的区别。ODP的编辑和管理人员广泛、随机地分布于网络世界,大多是某一方面的专家,相对于传统分类网站的雇员,他们能准确地把握某一领域网络资源状况,搜集的网站列表更加专业,质量更高,数量也更大;在人文精神的体现上,ODP收录的网站充满了活力,注释、简介洋溢着人性化的体贴与关爱,而蜘蛛程序抓取的网页是机械“匹配”的结果,永远是机器一样的冰冷;在目录的维护上,ODP的管理员能够随时地掌握其类目下的网站动态,及时增加条目、调整类目、删除死链;在系统管理与运作上,ODP较之传统的分类目录更需要诸如注册登陆、收录与归类标准、类目调整、增删审核、管理权限等等科学、详细、严谨的条款与规章。ODP是在开放型、可无限扩张的网络平台上,由网络社区共同建设、共同维护的网络资源整序中心和网络资源检索工具,ODP实践及其成就,向人们昭示了网络搜索工具互动性、开放性的发展趋向。
二、搜索引擎的分类与区别
随着搜索引擎技术和市场的不断发展,出现了多种不同类型的搜索引擎,各类媒体上有关搜索引擎的名词也越来越多,甚至产生让人眼花缭乱的感觉,如交互式搜索引擎、第三代搜索引擎、第四代搜索引擎、桌面搜索、地址栏搜索、本地搜索、个性化搜索引擎、专家型搜索引擎、购物搜索引擎、自然语言搜索引擎、新闻搜索引擎、MP3搜索引擎、图片搜索引擎……如何尽快熟悉如此众多类型的搜索引擎,又如何利用各种搜索引擎作为网络营销工具呢?首先要对搜索引擎的种类有一个比较清晰的认识。
1、搜索引擎的分类
尽管搜索引擎有各种不同的表现形式和应用领域,如果从搜索引擎的工作原理来区分,搜索引擎有两种基本类型:
1.1纯技术型的全文检索搜索引擎
如google、AltaVista、Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。需要说明的是,这些信息并不是搜索引擎即时从互联网上检索得到的,通常所说的搜索引擎,其实是一个收集了大量网站/网页资料并按照一定规则建立索引的在线数据库,如2004年3月底google收录的网页数量已经超过42亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。
1.2分类目录
这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。yahoo是分类目录的典型代表,国内的搜狐、新浪等搜索引擎也是从分类目录发展起来的。分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。
1.3这两种搜索引擎的应用
从实质上看,利用机器手自动检索网页信息的搜索引擎才是真正意义上的搜索引擎。现在的大型网站一般都同时具有“搜索引擎”和“分类目录”查询方式,只不过一些网站的搜索引擎技术来自于其他提供全文检索的专业搜索引擎,如yahoo拥有自己经营的网站分类目录,而曾经采用的网页搜索引擎包括Inktomi、google等公司提供的技术。因此,从用户应用的角度来看,无论通过技术性的搜索引擎,还是人工分类目录型的搜索引擎,都能实现自己查询信息的目的(两种形式可以获得的信息不同,分类目录通常只能检索到相关网站的网址,而搜索引擎则可以直接检索相关内容的网页),因此习惯上没有必要严格区分这两个概念,而是通称为搜索引擎。不过要注意的是,由于两种类型的搜索引擎原理不同,导致各种搜索引擎营销方式的差异,需要针对不同的搜索引擎采用不同的搜索引擎营销策略,因而处于网络营销研究和应用,有必要从概念和原理上给予区分。
2.搜索引擎的区别
但是,也有一些搜索引擎的操作方式不同于上述两类基本的搜索引擎,比较有影响力的有两种:一种是“多元搜索引擎”(Meta search Engine),另一种被称为“集成搜索引擎”(All-in-One Search Page)。这两种搜索引擎也是在前述两种基本搜索引擎的基础上发展演变而成的,但又不同于传统的搜索引擎模式。由于这些搜索引擎应用于网络营销时在基本思想和方法上并没有重大差别,因此这里仅做简要介绍。
“多元搜索引擎”的主要区别在于,并不像全文搜索引擎那样拥有自己的索引数据库,而是当用户提交搜索申请时,通过对多个独立搜索引擎的整合和调用,然后按照多元搜索引擎自己设定的规则将搜索结果进行取舍和排序并反馈给用户。从用户的角度来看,利用多元搜索引擎的优点在于可以同时获得多个源搜索引擎(即被多元搜索引擎用来获取搜索结果的搜索引擎)的结果,但由于多元搜索引擎在信息来源和技术方面都存在一定的限制,因此搜索结果实际上并不理想,目前尽管有数以百计的多元搜索引擎,但还没有一个能像google等独立搜索引擎那样受到用户的广泛认可。表2-1中列出的SavvySearch和 Metacrawler就是最早的多元搜索引擎。美国专业搜索引擎咨询网站Search Engine Watch(www.)评出的2003年最佳多元搜索引擎如下:
(1)Dogpile(http://www.)
(2)Vivisimo(http://www.)
(3)(http://www.)
国内的多元搜索引擎目前尚处于起步阶段,目前只有少数网站开始涉足,尚没有非常优势品牌的多元搜索引擎出现,但作为网络营销研究,有必要对此予以关注。
“集成搜索引擎”的原理则相当简单,甚至不需要多少专门的核心技术,其表现形式是:在一个浏览界面上同时链接了多个搜索引擎,用户检索时可以选择其中的部分或者全部搜索引擎,一次输入关键词,可以获得多个搜索引擎的检索结果。因此这种形式实际上并不是独立的搜索引擎,应该说是对现有搜索引擎的一种应用方式,是为用户获得尽可能多的搜索结果提供方便。与多元搜索引擎一样,集成搜索引擎同样没有自己的索引数据库,甚至不能对搜索结果进行筛选和重新排序,因此,从网络营销的角度来看,并不需要花费太多的精力来给予研究,网站只要在各个独立的搜索引擎中有好的排名效果,在集成搜索引擎中自然也会出现同样的结果。但值得关注的是,集成搜索引擎为网络营销人员提出了一个努力的方向,即应当让自己的网站在尽可能多的搜索引擎中都获得好的表现,尤其不要遗漏重要的搜索引擎。
那么,该如何理解本文开头提到的众多搜索引擎概念呢?我们大致可以这样理解:现有各种新出现的搜索引擎都是在前述两种搜索引擎基本类型基础上的技术革新、应用方式变革、或者应用领域的细分,例如购物搜索引擎,可以理解为搜索引擎在网上购物领域的一个分支,这个搜索引擎仅仅在网上购物网站中收集各种信息,而不考虑其他领域的信息,这样可以做到更强的针对性和专业性。考虑到搜索引擎的飞速发展,在已经出版的书籍中无法包含新出现的名词,网络营销教学网站 ( http: / / / index.htm )(www. ( http: / / / index.htm ))将在网络营销知识库 ( http: / / / resource.htm )中陆续介绍一些新的概念,如桌面搜索、地址栏搜索、本地搜索、购物搜索引擎等。
三、搜索引擎的工作原理
1、全文搜索引擎
在搜索引擎分类 ( http: / / www.se- / about / about1.htm" \t "_blank )部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
........................................................................................
2、目录索引
与全文搜索引擎相比,目录索引有许多不同之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。
其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。(由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍登录Yahoo雅虎的技巧 ( http: / / www.se- / yahoo / yahoo-submit.htm" \t "_blank ))
此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。
目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。
四、各种搜索引擎的代表网站
1、全文搜索引擎
ChinaByte CSEEK
CSEEK的检索功能非常强劲,除了国外的搜索引擎,它可能是我们评价的中文搜索引擎中检索功能最强的一个,因为它使用的搜索引擎核心是非常成熟的商用软件verity。但正因为其功能强劲且有些复杂,要充分利用到其强劲的检索功能,用户必须详细阅读其帮助页面,这对于普通用户来说有些勉为其难。 CSEEK的界面虽然也算清晰明了,但在其页面上缺乏对于其检索功能的简单描述或者是一些辅助选项按钮,不能不说是一个小小的缺憾。
作为一个新兴的中文搜索引擎,CSEEK的发展速度还是相当快。在今年五月上旬,我们初次考察这一搜索引擎时,其库内网页数28万页。而当七月上旬我们再一次考察这一搜索引擎时,其库内网页数已发展为近56万页。
象大多数的关键词搜索引擎一样,CSEEK也有一个分类库供用户查询,但此库显然是疏于管理,缺乏更新,每一个子类最多为30条网页。另外其结果显示中的网页摘要由于是由其搜索引擎按一定算法自动生成,虽然说有时比单纯引用前几行文字要更具有说明意义,但有时也使人莫名其妙。
网易
网易公司以其提供的一系列服务见长,如免费主页、免费EMAIL都在国内具有一定的影响。它的搜索引擎也是颇有特色,它先将用户的检索式在自己的分类库中进行查询,如果没有检索出结果,系统将自动将提问式转向全文数据库进行检索。如果在分类库中检索出结果,用户对检索结果不满意,可以直接按检索结果页面底部的全文检索按钮,继续在全文库中进行检索,这对于一个非专业用户来说是非常实用的一种检索策略。
另外,网易的分类库也是做得相当不错(其分类类目与方法大致上与哇塞相同),这比许多带分类库的关键词搜索引擎要好。网易的功能简单、使用方便,并且提供一定的模糊检索功能,这也是非常能吸引普通用户的功能。网易的界面清晰,反应及库容量也是可以接受的。
天网中英文搜索引擎
天网是由CERNET在北京大学设立的一个较优秀的中文搜索引擎,主要以CERNET的网页信息为主。作为国内自行开发的搜索引擎,具有一定的水准。它象很多国外的优秀搜索引擎一样,系统不仅提供WWW网页的查询,同时也提供对新闻组(Newsgroup)内容的查询。
天网将用户的检索式进行自动分词,然后进行检索,这一点和下面介绍的悠游搜索引擎是一样的。同时天网还提供模糊匹配检索模式,在模糊匹配中,系统不仅检出用户表达式中的关键词,并且将其同义词也一并检出。
天网还支持通过EMAIL的检索,即用户可将检索式通过EMAIL发送检索提问式,而天网搜索引擎通过EMAIL回送检索结果。同时天网还提供对ftp.pku. , ftp.lib.pku. , ftp.ncic.ac.cn ,ftp.igd.等FTP服务器的FTP文件检索。
但作为位于北京大学的优秀站点,天网搜索引擎似乎经常受阻于网络交通或机器瓶颈,在正常工作时间内进行检索时,经常出现超时错误,这在一定程度上影响了它的实用性。另外也可能由于面向国际的缘故,天网的缺省主页面是英文页面,这也给国内的用户带来了小小的不便。
OMRON上海热线搜索器
OMRON上海热线搜索器使用的是与ChinaByte的CSEEK同样的搜索引擎内核Verity,因此它的总体特征与CSEEK并无二致。但作为一个主要以上海热线信息为主的实验性站点,也可以说是OMRON公司的广告站点,它的优点不会比CSEEK多,缺点却不会比CSEEK少。
悠游中文搜索
较有影响的一个搜索引擎,充分体现了两岸三地的特色。它原先由美国、北京、重庆、香港四个网站组成,最近又增添了上海网站,同时台湾的网站也已推出。悠游每一个网站充分考虑到两岸三地的特点,所以每一个网站都有GB与BIG5两种页面,并且两个页面的内容还考虑到不同用户的需求而有所不同。同时各地网站主页面还有本地新闻等其他信息。各地网站还推出不同的服务内容等等。除了关键词检索功能而外,悠游也提供了一个简单而排版清晰(类似于Yahoo风格)的分类库。
除了网页搜索以外,悠游搜索引擎还提供了网址(URL)查询功能。
另外悠游搜索引擎很有特色的一点就是它能够将用户的检索式进行自动分词,然后再进行检索。因此用户在输入检索式的时候,可以按照自己的习惯直接输入,但有时用户键入一个长的检索式的话,常会检索出一大堆检索结果。
但是悠游搜索引擎在主页上未提供任何帮助信息,对于用户来说多有不便,用户只有在进入分类检索时才能找到一个帮助链接,但其帮助信息也写得较为简单,参考价值一般,搜索引擎本身也不支持什么逻辑检索的功能。
茉莉之窗
这是我们评价的中文搜索引擎中仅有的一个香港站点。它是由香港中文大学建立的一个中文搜索引擎,收录了中国大陆与台湾两地的WWW网页,其中以台湾的网页居多一些。
但是茉莉之窗的英文界面,以及同样是英文的帮助页面对于广大的中国用户来说就显得不是很方便。另外,除了网址检索功能外,其网页检索功能也显得单一了些。
盖世搜索引擎
由台湾中正大学的吴升教授领衔开发的一个相当有影响的中文搜索引擎。盖世搜索引擎的英文主页面同时有四个链接,分别链接至它的目录服务,WWW网页的检索,BBS资料库检索与FTP检索,提供的检索服务不可谓不多,这一点和国外的搜索引擎倒是有点相象。
另外作为一个自主开发的引擎,盖世提供的检索功能也颇为方便和强劲,它的模糊匹配功能同样能将用户的检索词自动分词后再行检索。
盖世搜索引擎使用了英文的主页面,它的WWW页面检索与分类库导览页面是中文的。
在笔者撰文的时候,吴升教授又领衔开发了一个新的搜索引擎,声言此搜索引擎并不以中文为目标,而是要以支持多种语言的内核见长,直接与国外的搜索引擎竞争。有兴趣的读者可以去领略一番,其网址为:www..tw 。
Seednet 搜索引擎
Seednet 搜索引擎是台湾搜索引擎中检索功能独树一帜的搜索引擎,几乎支持所有常用的逻辑检索功能外,支持中英文混合检索,支持英文的通配符等等,检索功能相当强劲。另外值得一提的是,它在检索结果显示中采用的直接跳转的技术。目前几乎所有的搜索引擎,包括国外最先进的搜索引擎,都采用在页面显示直接链接各结果显示页面的方法来显示检索结果,由于不可能在一个页面上直接显示几十个甚至上百个链接地址,因此检索结果的显示大多受限于几百条或上千条记录。而Seednet 搜索引擎采用下拉式菜单的方式直接显示检索结果页面,用户可以直接跳转至任一个页面的结果显示,这对于用户评价自己的检索结果是相当有帮助的。
AltaVista中文搜索
关于AltaVista英文搜索引擎前文已介绍过了。它在今年五月,紧随Yahoo之后推出了中文搜索,不能不说其是认识到了中文搜索这一市场的重要性。由于AltaVista的实力和技术,所以它的中文搜索在库容量及响应速度令其他中文搜索引擎难以匹敌。但是也由于它的核心不是为非西文语种所准备的,所以它在推出中文搜索的时候也偷工减料不少,最主要的是不支持它的高级检索功能,不能运用其一些强劲的逻辑检索特性。另外它为了方便中文用户的使用,在中文检索的页面上做上一个光秃秃的中文输入条,而其他的提示与帮助又都是英文的,所以实际上也没给中文用户以多少方便。但是,不管它现在在支持中文搜索上还有这样那样的不足,并由于它一流的技术与硬件,我们认为它的推出是对其他中文搜索引擎极大的挑战。
2、目录索引
搜狐
搜狐的主页也许就象它的名字,花哨而令人摸不着头脑。它的主页上提供了许多相关信息、广告等等,相对于它相当及时的新闻更新来说,它的库更新间隔就显得稍微慢了一些,同时库容量的限制也使其参考价值不大。
搜狐的分类库组织的更象一个精心组织的导航库,对于一个想在网上浏览的新手来手有一定参考价值。
在搜狐的主页上,我们同样找不到任何对检索有益的帮助信息,所以我们同样无从判断其对逻辑检索功能的支持等等。
搜狐输出结果不分页,如果用户的检索结果很长的话,那就会等来一个很长的页面,也许是搜狐一般不会返回一个很长的结果,所以这个问题也就很少成为问题了。
指南针
指南针的数据库主要以收集中国教育和科研计算机网(CERNET),ChinaNet,中国科技网(CSTNET),中国金桥网(ChinaGBN)等网络上的信息资源为主。
指南针很有特色的地方是它的多样化输入方式和多个分类体系。
指南针支持中文GB输入,中文BIG5码输入,英文翻译输入以及拼音输入,给用户在输入时提供了多样化的选择与方便。
它的分类体系有普通分类和学科分类两种,同时它还保留了它的旧版分类体系。它的上搜索引擎中是少有的,它将自己的分类库分成58个学科类目,供用户从学科角度来按图索骥。大大方便了相当一部分专业用户。
指南针目前第一要做的就是扩大库容,从一个区域性较强的中文搜索引擎转而成为面向整个中文网络信息的中文搜索引擎。
华好网景、四通利方、我是野虎、天涯若比邻
将上述四个搜索引擎放在一起评述,并不是因为它们有什么缘源关系,也不是因为它们有非常相似的特色,仅仅是因为相对于其他搜索引擎来讲对它们的评述较为困难。它们都是中文搜索引擎的后起之秀,水平也比较接近,没有什么突出的优点,也没有什么特别的缺点。也许是受限于人力、资金、技术等各方面的客观原因,它们的库都较小(野虎稍多一些),某种意义上讲它们更象导航站台,检索功能也比较简单,界面设计也比较一般,分类立意也没有什么特别之处。
在国外有许多小的搜索引擎,或是地区性的,或是专题性的,而国内走这条路的并不多,大家都在搞小而全,其实中文搜索引擎也可以走走这一条路,从一点出发然后逐渐走向全面,这也许是比较现实的策略。如果大家还是搞任何东西都是要上一起上的话,最后又囿于各方面条件限制,谁也不是搞的很好,长此以往对守住中文搜索引擎这个阵地并没有什么好处。
蕃薯藤中文搜索引擎、哇塞
中文搜索引擎的发展由于有一个不断积累的过程,所以因为起步较早,技术与资金条件可能也更好一些,台湾地区的中文搜索引擎尤其是分类搜索引擎明显走在国内同行的前面。
蕃薯藤与哇塞的共同特点是界面非常清晰,不象国内的分类搜索引擎那样过于繁复且尽是广告。从界面设计来看,哇塞是笔者认为所有这些经考察的中文搜索引擎中界面做得最干净的一个,清晰利落,颜色配比也颇具匠心,令用户阅读起来相当方便。哇塞另外用清晰的小图标标明“酷”和“新”的站点,也使用户感到既非常实用又体贴备至。
蕃薯藤的检索功能做得更强一些,它的通配符检索功能也使它在检索上比较方便用户。在此要指出的是,中文检索的通配符与西文检索的通配符用户不同。在西文检索中,通配符的作用是能让用户检索出包含一个词不同时态和用法的结果集。而在中文检索中,通配符可以替代任何字符,较类似于相近检索(NEAR),或者说比相近检索功能更丰富一些,因此中文检索中的通配符功能还是相当实用的。
Yahoo中文搜索
关于呀虎西文搜索引擎,前文已作了介绍,这里毋庸赘述。与AltaVista搜索引擎不同的是,呀虎中文搜索引擎大体上保留了原来的特色,并且根据中文的特点作了一些改进。比如,呀虎的一大特点是它精致的分类体系,呀虎中文保留了原来的主分类,而在细目上又根据中文的特点作了改动,重新规划分类,由于目前网上中文信息不是很多,因此中文分类比原来英文分类小很多,感觉上呀虎的库容量目前还太小,但仍不失精致实用的特色。
中文呀虎与原英文呀虎的界面基本一致,也保留了原有的许多特色。这多少令众多呀虎的拥趸者感到欣慰。
由于目前网上中文信息的特点,呀虎实际上是为GB与BIG5准备了两套人马,两套服务器。因为实时更新及地区特色上的原因,在GB与BIG5库中经常会有一些小小的差别。另外,呀虎中文搜索引擎的缺省中文域名指向BIG5的服务器(chinese.),而GB码的服务器域名为:gbchinese.
这也许正是因了杨致远先生所说的:“大陆也许是最重要的市场,但就先后次序来说却是最末一个。”
五、常见的搜索引擎及其特点
1.国外英文目录索引
Yahoo — 最著名的目录索引,搜索引擎开山鼻祖之一。
Yahoo! —— 搜索引擎之王,最早的目录索引之一,也是目前最重要的搜索服务网站,在全部互联网搜索应用中所占份额高达36%左右。除主站(Mother Yahoo)外,还设有美国都会城市分站(Yahoo Cities,如芝加哥分站)、国别分站(如雅虎中国)和国际地区分站(如Yahoo Asia)。其数据库中的注册网站无论是在形式上还是内容上质量都非常高。
Yahoo属于目录索引类搜索引擎,可以通过两种方式在上面查找信息,一是通常的关键词搜索,一是按分类目录逐层查找。以关键词搜索时,网站排列基于分类目录及网站信息与关键字串的相关程度。包含关键词的目录及该目录下的匹配网站排在最前面。以目录检索时,网站排列则按字母顺序。Yahoo于2004年2月推出了自己的全文搜索引擎,并将默认搜索设置为网页搜索。
登录Yahoo非常困难,而且周期很难确定,最快的只需数天,一般历时1个月左右,最长的可达2个月!如果你的网站不符合要求,也有可能永远登录不上。目前Yahoo对商业网站登录目录均要收取一定的费用,免费登录只对非盈利网站开放。
由于Yahoo靠人工操作甄选网站,且评判标准十分严格,因此是公认最难登录的搜索引擎。但它对我们网络营销的作用举足轻重,尤其是对商业网站而言,因为Yahoo不仅是全球范围内最著名的互联网品牌,而且也是最具影响力的企业资料库,所以我们无论如何也要想方设法跻身其中。
2.国外英文搜索引擎
Google — 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。
Google成立于1997年,几年间迅速发展成为目前规模最大的搜索引擎,并向AOL、Compuserve、Netscape等其他门户和搜索引擎提供后台网页查询服务。目前Google每天处理的搜索请求已达2亿次!而且这一数字还在不断增长。Google数据库存有42.8亿个Web文件。属于全文(Full Text)搜索引擎。
Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从10到100条任选。提供网站内部查询和横向相关查询。Google还提供特别主题搜索,如:Apple Macintosh, BSD Unix, Linux和大学院校搜索等。
Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择,包括英语、主要欧洲国家语言(含13种东欧语言)、日语、中文简繁体、朝语等。同时还可以在多达40多个国别专属引擎中进行选择。
搜索规则:以关键词搜索时,返回结果中包含全部及部分关键词;短语搜索时默认以精确匹配方式进行;不支持单词多形态(Word Stemming)和断词(Word Truncation)查询;字母无大小写之分,默认全部为小写。
搜索结果显示网页标题,链接(URL)及网页字节数,匹配的关键词以粗体显示。其他特色功能包括“网页快照”(Snap Shot),即直接从数据库缓存(Cache)中调出该页面的存档文件,而不实际连接到网页所在的网站(图象等多媒体元素仍需从目标网站下载),方便用户在预览网页内容后决定是否访问该网站,或者在网页被删除或暂时无法连接时,方便用户查看原网页的内容(注:国内用户目前暂时无法使用Google的网页快照)。
Google借用Dmoz的目录索引提供分类目录查询,但默认网站排列顺序并非按照字母顺序,而是根据网站PageRank 的分值高低排列。
Google的“蜘蛛”程序名为“Googlebot”,Google一般每隔28天派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。
3.国内目录索引
搜狐(Sohu) — 国内三大门户之一,最早在国内推出搜索引擎收费登录服务。
搜狐国内最著名的门户网站,也是国内最早提供搜索服务的站点。互联网概念在国内的普及,搜狐功不可没。在2001年年初由CNAZ(中文网站评估认证网)举办的搜索引擎网络专项功能排名调查中,搜狐名列第一。
搜狐设有独立的目录索引,并采用百度搜索引擎技术,提供网站、网页、类目、新闻、黄页、中文网址、软件等多项搜索选择。搜狐搜索范围以中文网站为主,支持中文域名。
搜索规则:网站搜索(默认)时,范围仅限于自身目录中的注册网站。但在目录中没有相应记录的情况下,自动转为网页搜索。网页搜索时则调用百度进行检索。此外,用户还可以选择“综合”搜索同时查找匹配的网站和网页,返回的结果中网站链接显示在页面上半部,而来自百度搜索引擎的网页结果则列于页面下半部。
登录搜狐的周期一般为3个工作日,工作人员会Email通知你登录的结果。搜狐是网站最重要的访问来源之一,因此是国内搜索引擎登录的首选。
2001年9月搜狐全面实行收费网站登录,商业网站收取最低1500元/年的费用,另外还有普通网站收费登录,费用标准为360元/年。目前除学校、科研机构、政府单位等性质的网站仍实行免费登录外,其他网站登录均须支付一定的费用。
新浪(Sina) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / sina.htm" \t "_blank )— 最大的中文门户网站,同样也推出了搜索引擎收费索引项目。
新浪是全球范围内最大的华语门户网站之一,仅新浪北京目前每天访问量高达6亿次。根据北京赛迪网信息技术有限公司和盖洛普咨询有限公司联合发布的中国互联网用户行为和态度研究(CIUA 2000)报告,新浪是国内网民最常访问的网站。
新浪自建独立的目录索引。共设15大类目录,10,000多个子目,收录网站达20余万,是规模最大的中文搜索引擎。提供网站、中文网页、英文网页、新闻、图片、MP3、旅游等查询项目,支持中文域名。
搜索规则:默认分类网站搜索,范围限于自身目录中的注册网站,当目录中没有相应的记录时,自动转为网页搜索。搜索网页时,调用Google搜索引擎进行查询。网站排名根据目录及网站信息与搜索条件的关联程度确定。
向新浪提交网站后,一般2个工作日内工作人员便会通知你结果。由于新浪是目前最常用的中文搜索引擎,也是网站访问量的主要来源之一,因此登录新浪也是网站推广的必经之路。
目前除学校、政府机构、科研单位的网站外,其他类型网站都须支付一定的费用才能登陆到新浪搜索引擎。
网易(Netease) ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / netease.htm" \t "_blank )— 网易搜索是ODP的国内翻版,其目录由志愿管理员维护,是google的网页搜索用户。
网易与搜狐、新浪并称中国三大门户。拥有国内最大的网上社区,曾是最著名的免费主页空间提供商之一。
拥有独立的开放式目录索引,目录维护工作由志愿管理员负责,类似国外的/ODP,在免费登陆时期,网易义务管理员人数曾经达上万人。目前除一些公益性行业目录仍实行志愿管理员制度外,其他收费登录目录已废除了志愿管理员制。
网易网页搜索由百度引擎提供支持。提供网站检索、网页检索、行业网站检索及图片检索等查询项目。
4.国内搜索引擎
百度(Baidu) — 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。
百度公司(,Inc) 于1999年底成立于美国硅谷。2000年1月,百度公司在中国成立了她的全资子公司百度网络技术(北京)有限公司,随后于同年10月成立了深圳分公司,2001年6月又在上海成立了上海办事处。
百度是国内最大的商业化全文搜索引擎,占国内80%的市场份额。其功能完备,搜索精度高,除数据库的规模及部分特殊搜索功能外,其他方面可与当前的搜索引擎业界领军人物Google相媲美,在中文搜索支持方面有些地方甚至超过了Google,是目前国内技术水平最高的搜索引擎。为包括Lycos中国、、21CN、广州视窗等搜索引擎,以及中央电视台、外经贸部等机构提供后台数据搜索及技术支持。
百度目前主要提供中文(简/繁体)网页搜索服务。如无限定,默认以关键词精确匹配方式搜索。支持“-”号、“.”号、“|”号、“link:”、书名号“《》”等特殊搜索命令。在搜索结果页面,百度还设置了关联搜索功能,方便访问者查询与输入关键词有关的其他方面的信息。提供“百度快照”查询。其他搜索功能包括新闻搜索、MP3搜索、图片搜索、Flash搜索等。
2001年9月,百度推出了类似Overture的“竞价排名服务”,市场反应强烈。目前已有雅虎中国、Lycos中国、263、、21CN、、上海热线、广州视窗、福建在线、等门户网站加入了百度竞价排名阵营。
(注1)百度现已去掉了关键词分类搜索。
六、使用搜索引擎的技巧
1.搜索关键词提练
无庸至疑,选择正确的关键词是一切的开始。学会从复杂搜索意图中提练出最具代表性和指示性的关键词对提高信息查询效率至关重要,这方面的技巧(或者说经验)是所有搜索技巧之母。
众所周知,要在搜索引擎上搜索信息首先必须输入关键词,所以说关键词是一切事情的开始。大部分情况下找不到所需的信息是因为在关键词选择方向上发生了偏移,学会从复杂搜索意图中提炼出最具代表性和指示性的关键词对提高搜索效率至关重要,这方面的技巧(或者说经验)是所有其他搜索技巧的基础。
选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子里要形成一个比较清晰概念,即我要找的到底是什么?是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位你要找的东西,而且多数时候你根本不需要用到其他更复杂的搜索技巧。
关键词的选择有时还是需要动一番脑筋的,难就难在如何找到某一类Web文档的关键特点。下面提供大家一个小测验,看看你的主题归纳和特性定位方面做得怎么样?
比如你是玩具(Toys)生产商,想将网站提交到有玩具分类列表的行业门户网站,但你并不知道网上都有哪些站点接受此类网站登录。当然,你首先会想到利用搜索引擎查找,而此时关键词的选择就显得非常重要了。建议大家先不要看下面的解答,先不妨到搜索引擎上 试试 ( http: / / www. / )(提议用英文搜),看看能不能精确且迅速地找到目标。
好了,现在我们就对这次的搜索任务作一下分析。
我们要找与玩具有关的网站,作为商品的一大门类,“玩具”当然就是这类信息的共性。那么接受网址登录的网站会有什么区别于其他相关站点的特性呢?答案是它们的网页中一般会有“添加网址”(addurl或add url)的字样。看到这里大家也许恍然大悟,原来如此!是的,关键词提炼有时就象脑筋急转弯。最后我们确定搜索条件为:
toys addurl(或add url)
在上述例子中,信息共性的定位是很自然的事,不存在什么障碍,而特性的发掘就需要一点创造性的思维。这在一开始可能有点摸不着方向,但当大家了解了这种思考方法,再加上平常搜索时的多次实践,搜索关键词的提炼最终会成为你下意识的一种反应。
2.细化搜索条件
搜索条件越具体,搜索引擎返回的结果就越精确,有时多输入一两个关键词效果就完全不同,这是搜索的基本技巧之一。
你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。
比方说你想查找有关电脑冒险游戏方面的资料,输入game是无济于事的。computer game范围就小一些,当然最好是敲入computer adventure game,返回的结果会精确得多。
有时你甚至可以问搜索引擎一个问题,返回结果的准确度会让你不得不佩服搜索引擎功能的强大。
一次,我们想查找有关根据IP地址判断访问来源方面的资料,由于知道以“IP address”搜索没用,加上搜索条件比较复杂,无法以单个的词或词组查询,因此我们干脆在Google搜索引擎中输入了整句话:
■ How to recognize a visit from its IP address
结果在返回的网页链接中,第一个就是我们需要的。该网站不仅提供根据IP进行访问来源查询,还用虚拟现实(Virtual Reality)技术在地图上指出来源所在的城市!
可以看出将搜索条件细化,能够大幅提高你的搜索效率。
由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入"电脑游戏 冒险",而不是"电脑冒险游戏"。
此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略
3.用好逻辑命令
搜索逻辑命令通常是指布尔命令“AND”、“OR”、“NOT”及与之对应的“+”、“-”等逻辑符号命令。用好这些命令同样可使我们日常搜索应用达到事半功倍的效果。
搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度。比较一下下面各搜索条件的含义:
■ computer adventure game
最基本的搜索方式。查找与该关键词有关的记录,在过去通常情况下相当于布尔逻辑命令中“OR”的关系,翻译过来就是:
computer (OR)adventure(OR)games
因此搜索结果中不仅有同时包含三个关键字的记录,也有仅含部分关键字串(如 computer games)和个别关键字(如computer)的记录。目前搜索引擎的趋势是默认匹配全部关键词搜索,即仅返回包含所有关键词的记录,相当于下面将介绍的“+”号和AND的关系,当然有时也有例外。
■+computer +adventure +game
相当于布尔逻辑命令中的“AND”关系,翻译过来就是:
computer(AND)adventure(AND)games
因此搜索结果中只列出同时包含三个关键字的记录。在搜索条件中使用“+”号还可强制搜索引擎将一些停用词当作关键词进行搜索。比如我们搜索“who am i”时,其中“who”和“i”是停用词,我们可以在两个单词前加上“+”号强制对其进行搜索,此时的搜索条件即可为:+who +am +i。
■+computer +game -adventure
翻译过来就是:
computer(AND)game(NOT)adventure
列出所有包含computer game的记录,但在其中排除有关adventure的记录。
综上所述,“+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容。
4.精确匹配搜索
精确匹配搜索也是缩小搜索结果范围的有力工具,此外它还可用来达到某些其他方式无法完成的搜索任务。
除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英文字符。虽然现在一些搜索引擎已支持中文标点符号,但顾及到其他引擎,最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。如:
■ "computer adventure games"
它与 +computer +adventure +games 的区别是:
虽然后者限定网页中要同时包含三个关键字,但其顺序和相邻位置允许是任意的。而前者不仅要求网页中必须同时包含三个关键字,关键字的顺序也要求完全相同,并且它们必须还是挨在一起的,所以带“”号的查询范围更小。
此外使用“”号进行精确匹配查询还可用于达到我们特殊的搜索目的。比如一般情况下“who”、“i”作为停用词被搜索引擎忽略,但有时在搜索特别类型的信息时又必须包含这些停用词(如搜索影片名称“Who Am I”),这时我们就可以将全部关键词用“”号引起来,就可以强制搜索引擎将停用词作为短语的一部分进行搜索。
通过对上面这些逻辑符号的组合,能组成复杂的搜索条件,如"computer game" -adventure +new等等,从而使查询结果更加准确。
5.特殊搜索命令
除一般搜索功能外,搜索引擎都提供一些特殊搜索命令,以满足高阶用户的特殊需求。比如查询指向某网站的外部链接和某网站内所有相关网页的功能等等。这些命令虽不常用,但当有这方面搜索需求时,它们就大派用场了。
对普通用户而言,熟练掌握前面介绍的几种搜索技巧就已经足够了。但有时我们难免会有一些特殊的需求,而搜索引擎也支持一些特殊的搜索命令,以方便我们精确定位所需信息。
■ 标题搜索
多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在Yahoo中是“t:”(注意冒号为英文字符且后面不跟空格)。在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。请看下面的例子:
· title(或t):computer adventure games
· title:+computer +adventure +games
· title:+computer +games -adventure
· title:"computer adventure games"
返回的结果都是标题中包含关键字、词的信息条目。
■ 网站搜索
此外我们还可以针对网站进行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。如想查找AAA游戏制作公司网站的所有网页,可以输入:
· site(或host/url/domain):www.
还可以在其中加入其他命令组成复杂的搜索条件,如:
· site:www. +title:"computer games" -adventure
意思是查找AAA公司网站中所有标题里含有computer games的网页,但排除关于冒险游戏的网页。
说到这里大家可能已经意识到了,运用此命令我们可以达到一个极其重要的目的,就是检查我们的网站被索引的网页有多少。因此建议大家牢记这个命令。另外运用“site/host/url/domain”等搜索命令还可实现某一网站的站内搜索。比如Google引擎由于技术的先进性,通过其“site”命令实现的网站内部搜索甚至比专门的站内搜索程序还要好。
■ 链接搜索
在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inbound links)。如:
· link:www.
其他一些引擎也有同样的功能,只不过命令格式稍有区别。你可以用这个命令来查看是谁以及有多少网站与你做了链接。
除上述命令外,还有其他一些特殊搜索命令,如“filetype:”(限定搜索的文档类别)、“daterange:”(限定搜索的时间范围)、“phonebook:”(查询电话)等等,感兴趣的话大家可以自己研究一下。Google引擎提供了比较完备的搜索功能,具体可参考Google从入门到精通 ( http: / / 202.196.108.21 / jpkc_jyjsx / InstructionalTechnology / seek / 06.htm" \t "_blank )专题介绍。
6.附加搜索功能
搜索引擎都提供的一些方便用户搜索的定制功能。常见的有相关关键词搜索、限制地区搜索等。
为方便查询信息,各搜索引擎还提供了其他一些附加搜索功能(部分可在搜索引擎的高级搜索Advanced Search页面中选择)。比如:
■ 单词衍生形态查询
当输入“thought”时,如果选择了此功能,搜索引擎除以“thought”为条件搜索外,还会以“think”、“thinking”等同词根的词进行查询。
■ 网页快照(Snap Shot)
直接从引擎数据库缓存(Cache)中调出该网页的存档文件,方便用户在预览网页内容后决定是否访问该网站,或是在对应网页发生变动时查看原始页面。通常缓存中保存的是网页的文字部分,图象等多媒体元素还是要实时从对应的网站上下载。与其他附加功能相比,“网页快照”还是相当实用的。
与网页快照相类似的还有一种“网页预览”功能(如WiseNut引擎的“Sneek-a-Peek”),当用户选择此功能时,将在该条目下方打开一个窗口下载并显示对应的网页内容。
■ 网站内部查询
当你找到某个网页,搜索引擎提供查询该网站其他页面的功能。类似“site:”、“host:”等命令。
■ 横向相关查询
当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其他网页的功能(不限于同一网站)。一般是在信息条目后面给出“Similar Pages”或“More results like this”链接。
■ 概念延伸查询
以某个关键词查询时,搜索引擎列出相关领域的其他搜索条件供你选择。比如输入“furniture”,它会列出“outdoor furniture”、“patio furniture”、“office furniture”等相关的信息类别供查询。
除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新闻搜索、图象搜索、新闻组搜索、Flash搜索等等不一而足。搜索引擎的初衷是好的,都是为了方便用户,至于哪些有用哪些没用则完全看个人喜好。以我们的观点,搜索引擎毕竟只是我们信息查询的一种工具,除非你想成为信息搜索专家,否则掌握基本的搜索技能并将之巧加运用就足以应付我们日常的需要了。
7.用什么样的搜索引擎搜索
搜索引擎分几种,工作方式也不同,因而导致了信息覆盖范围方面的差异。我们平常搜索仅集中于某一家搜索引擎是不明智的,因为再好的搜索引擎也有局限性,合理的方式应该是根据具体要求选择不同的引擎。这里我们根据自己的经验给大家提出些建议。
搜索引擎分几种,工作方式也不同,因而导致了信息覆盖范围方面的差异。我们平常搜索仅集中于某一家搜索引擎是不明智的,因为再好的搜索引擎也有局限性,合理的方式应该是根据具体要求选择不同的引擎。这里我们根据自己的经验给大家提出些建议。
我们日常信息需求大致可分为两种,一种是寻找参考资料,另一种是查询产品或服务,那么对应的搜索引擎选择就应该是全文搜索引擎(Full-Text Search Engine)和目录索引(Search Directory)。为什么?
对前一种需求来说,由于目标非常具体,而目录索引中链接条目所容纳的信息量有限,无法满足我们的要求,因此全文搜索引擎便自然成了我们的选择。按照全文搜索引擎的工作原理,它从网页中提取所有的文字信息,所以匹配搜索条件的范围就大得多,也就能满足哪怕是最不着边际的信息需求。这也就是为什么现在多数目录索引都采用其他全文搜索引擎提供二级网页搜索的原因。
相反,如果我们找的是某种产品或服务,那么目录索引就略占优势。因为网站在提交目录索引时都被要求提供站点标题和描述,且限制字数,所以网站所有者会用最精练的语言概括自己的业务范围,让人看来一目了然。而多数全文搜索引擎直接提取网页标题和正文作为链接的标题和描述。用过全文搜索引擎的人都有这样的体会,就是搜索结果显示的信息往往过于杂乱,让人无法一眼就判断出该网站的性质。就我们来说,虽然我们是Google坚定的拥护者,但在搜索商业信息时还是经常用到搜狐、新浪、网易的目录搜索。
此外,当你要搜集某一类的网站资料时,目录索引的分类目录就是你天然的宝库。
那么究竟哪几个搜索引擎能够为我们所用呢?为方便大家查阅,我们结合平常的经验列出以下表格供各位参考:
常 用 搜 索 引 擎 一 览
国外搜索引擎:
搜索目标(英文) 搜索引擎/目录索引
一般资料 Google
资料涉及非常冷僻的领域 AllTheWeb
特殊资料(其他主要引擎都查不到时)InfoSeek/WebCrawler/Vivisimo等多元引擎
产品或服务 Yahoo/Overture*
国内搜索引擎:
搜索目标(中文) 搜索引擎/目录索引
一般资料 Google
古汉语(诗词)类资料 百度(个案显示这方面百度有独到之处)
产品或服务 搜狐、新浪(质量较高)/网易(较全)
* Overture虽为全文搜索引擎,但由于搜索结果排名靠前的都是付费商业网站,且这些网站的排列与全文引擎的工作原理无关,因此将它与Yahoo放了在一起。
八、特色网站的介绍
它是一家服务于中国及全球华人社群的领先在线媒体及增值资讯服务提供商,注册用户超过一亿。新浪拥有多家地区性网站,以服务大中华地区与海外华为己任,是中国最具知名度的互联网品牌。
新浪通过旗下五大业务主线:即提供网络新闻及内容服务的新浪网()、提供无线增值服务的新浪无线(SINA Mobile)、提供社区及游戏服务的新浪热线(SINA Online)、提供搜索及企业服务的新浪企业服务(),以及提供网上购物与拍卖的新浪电子商务(SINA E-Commerce),向广大用户提供包括地区性门户网站、无线增值、搜索引擎及目录索引、兴趣分类与社区建设型频道、免费及收费邮箱、网络游戏、虚拟ISP、分类信息、
费服务、电子商务和企业电子解决方案等在内的一系列服务。
新浪在亚洲和北美地区的六个城市设有办事机构,拥有四家地区性网站,员工人数近两千。截至2004年12月31日,新浪的年度净营收达2亿美元。
它是中国领先的新媒体、电子商务、通信及移动增值服务公司,是中文世界强劲的互联网品牌。
搜狐公司成立于1996年8月,是由公司创办人张朝阳博士在美国依托MIT媒体实验室主任尼葛洛庞帝先生和美国风险投资专家爱德华·罗伯特先生的风险投资支持创办的。而后进一步得到包括美国英特尔公司、道琼斯公司、晨兴公司、IDG公司、盈科动力、联想等世界著名公司的风险投资。2000年7月12日,搜狐公司在美国纳斯达克挂牌上市(NASDAQ:SOHU),从一个国内知名企业发展成为一个国际品牌。
搜狐公司从中国首家大型分类查询搜索引擎,发展成为受用户喜爱的综合门户网站。到现在为止,搜狐公司建立了以新闻中心、产经中心、生活中心、娱乐时尚四大版块为主体的丰富的内容频道体系。为广大网民提供网上社交、学习、生活和购物的理想场所,成为中国网络用户进入互联网的通道,搜狐公司全面完善的产品体系向企业客户和个人用户提供全面的网络服务平台。
2002年,搜狐公司深刻分析了中国互联网发展的实际情况,结合自身优势,不断探索和创新,逐步建立具有搜狐特色"2C"模式,即企业客户业务线(Corporate Business)和个人用户业务线(Consumer Business)。企业客户业务线包括面向企业提供互动营销解决方案(E-Marketing)和搜狐企业在线()业务;个人用户业务线主要是面向个人最终用户提供短信、邮件、校友录、搜狐在线(SOL---Sohu Online)等互联网定制服务(E-Subscription),搜财网(SOHUStock)提供个人理财服务、搜狐商城(Sohu Store)等电子商务业务。
搜狐公司多次在第三方互联网权威评测机构如iamasia、Alexa、NetValue、华通、新生代等基于多项指标的排名中名列榜首,从而牢固地树立了中国互联网品牌地位。搜狐公司的运营收入连续十二个季度保持双位数的增长。
搜狐大事记
1996.8 ITC爱特信电子技术公司(北京)有限公司正式注册
1996.11 爱特信公司获得第一笔风险投资,投资者包括麻省理工学院尼葛洛庞帝、爱德华.罗伯特
1997.2 爱特信公司正式推出ITC中国工商网络
1998.2 推出中国人自己的搜索引擎--搜狐
1998.4 爱特信公司获得第二笔风险投资,投资者包括英特尔公司、道琼斯、恒隆公司、IDG国际数据集团和美国哈里森公司
1998.9搜狐上海分公司成立
1999.3 在分类搜索的基础上,搜狐发展成为综合性网络门户,推出丰富的特色频道,提供多种网络服务
1999.6搜狐广州分公司成立
2000.2.25万众豪情搜狐夜庆搜狐诞生两周岁
2000.6-9搜狐网上疆域新开拓,陆续开通广州、上海、成都、杭州、西安、南京、济南、武汉、长沙、大连等地方版
2000.7.12搜狐在纳斯达克挂牌上市
2000.9.14搜狐宣布收购ChinaRen.com建立中国最大的门户网站
2000.10搜狐公司被美国《福布斯》杂志评为全球最佳上市小公司之一。
2000.12搜狐财经频道business.正式面向企业用户推出在线商务服务平台--"互动商务中心"
2000.12搜狐2000年度报告会--《建构中国最优秀的互联网企业》
2001.1搜狐正式推出无线互联网信息点播增值服务--搜狐短信服务(SMS)
2001年3月搜狐公司公布2000年度业绩报告
2001年3月搜狐推出国际顶极域名注册服务
2001年6月搜狐荣登Netvalue五月综合排名榜首
2001年8月搜狐公司推出新一代免费邮件系统--搜狐闪电邮件
2001年11月搜狐商城隆重推出,确立B2C业务模式
2002年1月10日"搜狐2002年度十大新闻评选"揭晓晚会
2002年2月5日 搜狐公司公布2001财政年度业绩报告,全速挺进赢利目标
2002年2月9日 搜狐签约"中国足球出征2002年世界杯中国足球协会指定网站"
2002年2月25日搜狐公司4周年庆典,(搜狐企业在线)正式推出
2002年3月 新生代市场监测机构最新发布的"中国市场与媒体研究(CMMS2002)"中,搜狐公司在全国30个主要城市网民中覆盖率居第一
2002年4月 搜狐公司与国联证券斥资5000万联合成立合资公司
2002年7月搜狐在线(SOL-Sohu Online)业务正式推出,面向个人消费服务发动上网新变革
2002年7月17日搜狐公布2002年第二季度财政业绩报告,提前两个季度实现EBITDA和营运现金为正流量为正;并连续8个季度保持双位数百分比增长
2002年9月 "搜狐手机时尚之旅全国6省市火车接力"大型路演活动。
GOOGLE公司:GOOGLE不仅中国而且还是全球搜索排名第一的搜索引擎网站,GOOGLE的市值已经达到了500亿美元,超过了雅虎、福特、通用,成为目前市值最高的互联网公司!Google占全球搜索请求总量1/3,GOOGLE支持世界上132种语言搜索(如中文、繁文、法文、英文、俄文、日文)全球华人不论在什么地方都可以使用。GO0GLE每天面向全球为全世界10亿网民提供服务,每天都要接受10亿次的搜索申请。
“酷GOO”:是GOOGLE公司2004年推出的搜索推广右侧优质排名服务,它能让贵公司的介绍,传真,电话,域名信息,都在GOOGLE上向所有地区,所有语言进行投放,一目了然。在欧洲、北美、中国的沿海发达城市,“酷GOO”以其服务优质,排名优先的服务深受客户的喜爱,而且由于在全球范围内,每个关键词在搜索首页,只允许1-8家企业显示。全球所有地区、所有人都允许购买,故“酷GOO”在中国推出后很快就得到了用户的追捧,在中国有近千万企业、团体、个人都在使用GOOGLE搜索,沿海城市它的普及率更是惊人,几乎个个企业都在使用这种服务。
GOOGLE在2005年将会在中国进行大范围内的市场宣传活动,和巨大市场投入,年后关键词一定会得到增值,客户如果进行投资转售的话一定会得到很高的现金回报。
九、搜索引擎的比较
有关2005年北大附中网校夏令营信息的查询
搜索引擎 速度 准确率
新浪网 0.976218秒 2
Baidu 0.001秒 3
Google 0.04 秒 2
注:准确率中数字表示第N篇文章为准确信息
有关我国最早的人口普查资料的信息的查询
搜索引擎 速度 准确率
新浪网 0.0598339秒 7
Baidu 0.001秒 9
Google 0.18 秒 8
还有几项搜索就不一一列出了。
综上,新浪网比较适合搜索娱乐类的信息,百度比较适合搜索生活类的信息,GOOGLE比较适合搜索新闻类的信息。
十、我的心得与体会
通过两次课的搜索、编辑、整理,我对搜索引擎又有了新的认识,以后也能利用所整理出来的知识使学习和工作更方便快捷。搜索引擎就像一片浩瀚的海洋,还有很多不为我所知的东西等我去挖掘。以前从为关心过搜索引擎的速度,而且搜索起来也很没有方法,通过这几天的学习,我觉得以后我搜索信息素材会变得比以前快很多了。
另一方面,我发现,如果要写出一份象样的报告确实是又费心又费力的事情。所以我决定,以后再也不给我老爸的报告捣乱了。而且我还要教他用三级标题和目录的方式来整理他的报告。
最后,我终于可以轻松的大吼一声:“这个RP的报告我终于解决啦~~~~~~~~~~~~~~~~~~~~~~~”
“啦啦啦~~~~~”高兴地扭着退场~~~~~~``
PAGE
25(共8张PPT)
第01个作业
邵家琪
高一1班 学号:1020141
我叫邵家琪,是北大附中高一(1)班的学生。毕业于北达资源中学。很高兴能来到北大附中进行我的高中学习,我会认真对待每一天,快乐的度过高中三年。
个人对信息概念的理解
信息是一种抽象的概念,它是事物的运动状态及其状态变化的方式。一个人获取了一条信息那么这条信息就抽象地进入了人的脑中,抽象地发生了运动。信息需要载体,信息是有价值的,信息还具有时效性、共享性和不完整性
让我印象深刻的信息的特征
让我印象深刻的信息的特征是信息的时效性。例如现在家家都炒的股票,股市行情每日都在更新。今天有价值的信息明天便失去了它的价值。信息是在不断变化的。一定的信息只在特定的时期内保持有效,这便是信息的时效性。
信息技术的前沿应用
自动化和先进制造
新材料及其装备
生物技术
环保与能源
信息技术的发展历史(五次革命)
第一次是语言的使用,语言成为人类进行思想交流和信息传播不可缺少的工具。 第二次是文字的出现和使用,使人类对信息的保存和传播取得重大突破,较大地超越了时间和地域的局限。第三次是印刷术的发明和使用,使书籍、报刊成为重要的信息储存和传播的媒体。 第四次是电话、广播、电视的使用,使人类进入利用电磁波传播信息的时代。 第五是计算机与互连网的使用,即网际网络的出现。
信息技术的发展趋势
越来越易于操作
虚拟现实技术的发展
语音识别和合成技术
智能代理技术
趋于个性化
性价比更高(共16张PPT)
信息技术及其应用、发展技术
提交人信息:10届 1班 35号 兰天竹
提交日期 :2007.9.12
一. 信息技术的应用实例
(一).感测技术
1.自动门
自动门已经使我们生活中很常见的东西了。自动门的“自动化”就利用了感应技术。
Tips:感应(探测)器是什么?
感应探测器:负责采集外部信号,如同人们的眼睛,当有移动的物体进入它的工作范围时,它就给主控制器一个脉冲信号;
一. 信息技术的应用实例
(一).感测技术
2.生物传感器芯片
Tips:什么是生物传感器芯片。
生物传感器应用实例:生物传感器涉及的是生物物质,主要用于临床诊断检查、治疗时实施监控、发酵工业、食品工业、环境和机器人等方面。
简单的说就是与活性神经细胞相接触,读取到了细胞产生的电信号。
一. 信息技术的应用实例
3.声控灯
控制灵敏的声控灯,它采用人嘴发出约1秒的控制信号“嘶”声,即可方便及时地打开和关闭声控照明装置,并有防误触发而具有的自动延时关闭功能,并设有手动开关,使其应用更加方便。
一. 信息技术的应用实例
(二)通信技术
1. 寻呼机和无绳电话
2.移动电话
3.电子邮箱及QQ、MSN等
一. 信息技术的应用实例
(三) 计算机技术
1.软件设计
2.平面设计
3.网络工程
一. 信息技术的应用实例
(四)控制技术
1.光控音乐电路
2.调光器
3.汽车电子控制技术
这就是音乐声控灯啦
二. 综合应用案例分析
案例一
神奇的“眼睛打字”软件问世
英国剑桥大学的两位计算机专家发明了一种智能软件,可以使人不用键盘不动手,光靠眼睛的移动来打字,这一发明使残疾人打字难的问题有望得到解决。据英国媒体报道,这种软件被命名为“猛冲者”。利用这套软件时,人们只需要移动自己的视线就可以在屏幕上“打出”不同的词句,每分钟可输入34字,跟常规的键盘打字速度差不多。
智能技术
感应技术
二. 综合应用案例分析
发明这一软件的两位专家是剑桥大学凯文迪什实验室的戴维·沃德和戴维·麦凯。据他们介绍,利用这套软件来“打字”就像从一个巨大的图书馆里寻找自己想要的文章一样。软件包括一个跟踪系统和摄像头,利用它们来跟踪眼睛的移动。当眼睛盯住一个字母时,摄像头马上把这一情况报告给计算机,计算机随即在屏幕上显示出一系列以该字母开头的单词供人选择,以此类推,直到“打出”整个单词或者句子。
另外,这种软件还能够根据不同人的写作风格作出调整,形成不同的语言模式,从而大大提高了词句的输入速度。此外,用这种方法输入词句,实际上是在“选择”单词,因此很少出现拼写错误。
感测技术
个性化的设计
二. 综合应用案例分析
案例二
植入人体的电脑
不久前曾研制出世界上第一台穿戴式电脑POMA的美国麻省理工学院人体工程学设计研究科学家史瓦茨最近向人们描绘了他的隐形电脑应用蓝图。他预计,到2010年,一切将进入无线时代,现在人们身上披挂的手机、 MP3随身听、商务通等电子产品,体积会缩小到肉眼几乎看不见,成为一种隐形的人工智慧产品,人们可以随身“穿”着一“台”电脑到处游走。隐形电脑,就像一名高科技的仆人,记录着主人的一切喜怒好恶与人际关系、每日作息时间与行程、个人财务资料等信息。它可以自动帮助主人预定机位和商议价格、在网络上寻找便宜商品、寻找网友、搜寻工作中需要的资料,逢亲友生日时甚至会帮忙挑选礼物,最后把结果与提醒事项显示在我们的眼镜镜片上,而人们却感觉不到电脑的存在。
人工智慧,智能化技术
评论:真够智能的
二. 综合应用案例分析
隐形电脑可以放置在人们的上衣口袋、手表、眼镜、球鞋等日常用品内,构成人体内部电脑网络。上衣口袋装的电脑,可以起到电脑钱包的作用。像信用卡大小的电脑钱包可以储存大量的个人资料,在超市购物付账,只要通过一个结账出口,电脑钱包便会自动计算每件商品的价格,再自动从银行账户内扣款或记入信用卡账单内;电脑与手表结合的未来手表,具有电话、声音与文字显示性传呼机,GPS装置以及日历等功能,保证随时对外联系;感应上衣内的隐形电脑可以随时记录包括心跳、呼吸和肺活量等信息,并将这些信息直接与家用电脑、办公室电脑、甚至医生的电脑联接,保证个人医生随时了解个人的健康状况;等等。
通信技术,还有语音技术作为辅助
感测技术
二. 综合应用案例分析
资料来源:
http://www.bjkp./gkjqy/xxkx/
(就是老师提供的那个)
鸣谢:http://
三.展望信息技术的未来
信息技术必将向更加人性化,更加智能化,更加个性化的方向发展。正如第二个应用实例中的“植入人体的电脑”,几乎可以提醒人类处理一切日常事务,已经非常的智能化、人性化。在第一个应用实例中,“眼睛打字”软件可以根据个人的风格不同,形成不同的打字模式,这是向个性化的方向发展。
除此之外,信息技术作为未来的工具科目,将会和更多的边缘学科结合,创造更大的效益。如感测技术在工业上的运用,就已经大大推动了工业的发展。
不过也有一些令人担心的问题,当信息技术发展到一定程度时,我们身边的信息化设备越来越多,也越来越智能化,人类的思考能力是不是会退化?正如实例作者所说:“到底是信息设备越来越人性化,还是人越来越信息化?”
四.我对信息课的希望
1.希望可以学到更加实用的技术,如图片处理,网页制作等(当然是在完成基本教学任务之后)
2.作业适量 希望老师留作业的作业量是在当堂和第二天的中午完成的。
3.???将来还会有吧~~(共24张PPT)
高一4班第17组
组长:赵妍婷
工作人员:
艺术加工:袁璐
图片搜索:赵一逍
放学后·乌托邦
这是充满海贼精神的通缉令…..
赵妍婷
这……是放学后…..天空中的战斗….
袁璐
要不要来一杯饮料呢?
袁璐
哪个好看??
袁璐
赵妍婷
葵花宝典……..!!
作者不愿透露
. ….他是穿着什么灌篮(冠兰)的…….
赵一逍
你喜欢这个徽章吗???
袁璐
赵一逍……你的酒杯??漏斗??
巫医神功要揭穿~~
——马大姐
赵妍婷
赵一逍
袁璐
赵一逍
赵一逍
⊙
鞋羊非丰羊森走
Beijing
近凵己
小屋费避球人
WANTED
7900O
P. MARINE
0
GARFIELDY
G巴∞
8
krin 2002
GARFIELD: 91998 PAWS
Q邮
L■■国
lou
韩雪
GARFIELD
GARFIELD: 1978 PAWS
00 D RORONON ZORU BORONIA可u
ITNySIINTSINUSINUS INUS IINVS IINNS IINIS JINI
y
%
213
2
2
9
T
!
纵
352
式
篮球
23(共13张PPT)
不管了,还是唱段黄梅戏轻松轻松吧~~~
这里~~
傅你交
(
的事情我办完了
nve△a
andno
allopeas分
OKAG
给
ea
周国
终点終点终点终点终点终点终点终点终点终点终点
联黑
得仙是人动世自更生啊
a=/0Q
手是老大我怕谁
ea
圍圃N
目圈
p
终点終点终点终点终点终点终点终点终点终点终点
是师傅马就生执行
(
www.vooz.co.kr
SIDEBOYO
We are
ELOF SARE
匕
大
今
史虽短
校
缘斐
盛
05
AyA
http://www.hoshinavi,com
Mashimaro
w.mm
as
naro
Copyright @2001 CLKO En
ent Co.,. Ltd
reserv网站开发是一个比较复杂的过程,在学习具体的技术细节之前,了解建设的过程是十分重要的。这部分内容理论性比较强,但要想做真正的项目开发就必须要去了解,这样才能让你在以后的学习中做到心中有数。
网站项目开发由始至终分为网站策划、人员组织、页面设计制作、动态编程、测试发布、宣传与维护、项目总结几个阶段。当确定项目后,需要有一个整体的开发目标,然后设计网站的关键页面,一般动态网站还需要动态编程。当站点所有内容完成并且测试通过后,就可以在网上发布了。但工作还远没有完,宣传和维护工作任重而道远,而且往往经过一段时间之后,网站还需要重新进行开发,因此它实际上是一个循环往复的过程。
图1-1网站开发流程
了解网站开发流程对于做好一个商业化的项目十分关键,因为你是在给一个公司做网站,要达到的是客户的要求,这一点是任何时候都要牢记的。下面我们以“新东方IT教育网上书城”(以下简称“网上书城”)的建设为例给大家介绍专业网站项目开发的一般流程。
“新东方IT教育网上书城公司”是新东方IT教育要创建的网上售书交流平台,主办单位首先在多家网络公司中招标。新东方IT教育应用软件教学部也参与了这次竞标,教学部接到招标项目后,立即组织相关人员进行项目的策划,在三天之内拿出了具体解决方案。
网站项目竞标前需要根据客户的要求深入分析,重点是考虑这样几个问题:
1、如果做这个项目是否能够盈利、大致盈利多少;
2、如果要做,应决定做出的网站主要针对的是什么人、这些人具体需要什么服务;
3、客户要实现什么功能和目的;
4、定出网站的宣传口号、网站结构等内容。
分析完后,由项目主管写出可行性研究报告,陈述该项目的可行性。部门通过后将会要求写出周密细致的方案书(标书)提交给项目客户,如果客户与公司达成一致,即可签订合同,开始制作过程。
具体过程包括:需求分析、可行性研究、项目计划的制定、方案书、签订开发合同等步骤。
图1-2网站项目竞标流程
与客户会面,请客户填写项目调查表或者由客户提供项目要求资料,明确项目需求。下面是由新东方IT教育提供的项目基本需求资料。
表1-1 客户基本需求
分类 具体要求
网站风格 清新活泼、大众化。
前台栏目 至少有最新图书、热点图书、新书预告、本月排行、案例下载、原创交流、技术论坛、客户反馈、公司简介等栏目。
后台管理 安全、稳定。能实现商品的管理、查询、统计分析等功能,能实现分级管理。
可行性研究的目的是根据客户提出的要求,确定项目是否可以做,做得话能否赢利。在做决定之前,重点需要确定以下内容:
1、明确开发目的、功能要求和主要工作内容;
2、开发所需要的主要技术、软硬件条件;
3、确定完成网站的时间长短;
4、所有的费用开支预算;
5、判断客户的信誉,是否有支付能力;
6、如果项目竞争激烈,需要了解竞争对手的具体情况,做到知己知彼;
以上内容明晰之后,项目主管需要提交一份项目可行性研究报告,具体阐述以上几个方面的内容。报告由公司决策层审阅,如果通过开始制定比较详实的项目计划书。
表1-1是应用软件教学部提交给部门经理审阅的可行性研究报告。
表1-2 新东方IT教育网上书城可行性研究报告
一、新东方IT教育网上书城概要新东方IT教育网上书城是新东方电脑部网上售书系统,属于典型的电子商务平台。网站旨在推动新东方电脑部教材的研发和推广,推广新东方电脑培训品牌。目前应用软件教学部共有四位老师可以参加该项目的开发,另外还有公司内部网管等人可以协助该项目,人员结构比较完整。由于参加人员均有相关开发经验,可以保证项目高质量的完成。二、我们需要做的工作网络结构新东方IT教育内部已经形成相对完整的局域网,外部通过ADSL专线与Internet相连。由于目前已经有了域控制器,因此只需要添加1台网站发布服务器和1台数据库服务器就可以了。由于“网上书城”规模不大,采用中型服务器发布网站、采用小型服务器备份数据就可以达到要求,如果日后需要扩容,只需要升级服务器就可以改善性能。业务系统制作相对完善的网上售书系统,并且提供案例下载、留言系统、论坛等功能。由于主要针对新东方IT教育学员和在校学生,采用ASP作为服务器脚本语言,SQL server作为数据服务器软件完全可以满足要求。因此开发任务主要集中在ASP脚本的编写和网站静态页面的设计上。系统的标准性新东方IT教育将接手该系统的后期维护工作,这对项目提出了更高的要求——系统需要有更强的稳定性、安全性和易维护性,开发时需要为该项目建立更完备的文档管理。系统的拓展潜力系统建设的最终目标是建立一个完整的图书社区。这个过程中,系统必然需要随着业务的扩展不断添加新的功能,因此开发时需要考虑一段时间内的拓展潜力。三、结论该项目是一个标准的、可定制的图书社区平台,这对开发建设单位提出了较高的要求,但在新东方IT教育、开发部门的协作下,在一个时间内,我们有能力完成这项工作,并在以后通过用户的使用使该系统不断的完善。新东方IT教育应用软件教学部2002年10月1日
项目说明书是项目实施前的规划说明文档,供内部使用。内容包括:建设网站目的及功能定位、客户自身条件分析、完成期限、项目进度安排、职责和工作分配、项目规划、项目小组成员组织、项目资料的收集等。
首先根据客户需要确定网站的功能,也就是说到底要做哪种类型的网站,进而确定可以采用的网站开发技术。网站有很多种,有商品宣传型、网上营销型、客户服务型、电子商务型等。比如,实例网站主要就是要宣传新东方IT教育系列从书,因此是一个商品宣传型的网站,但同时也需要包括在线售书功能(网上营销)。
要实现这些功能有两种渠道,一种是购买IBM、HP等公司提供的企业上网方案、电子商务解决方案,但这种方案一方面成本太高,而且可定制性能受到一定的限制,一般规模不大的网站显然不合适;另外一种就是利用动态网站技术自己开发。
目前有很多动态网站技术可以选择,如ASP、JSP、PHP等。由于动态网站一般都需要一个数据库做支持,因此还涉及到数据库软件的选择,目前比较常用的数据库软件有SQL server、Oracle、Mysql等。
另外还要根据客户目前的局域网建设情况,确定采用什么样的方式发布网站,也就是考虑是自建服务器还是租用虚拟主机,当然还要选择使用哪种操作系统,UNIX, Linux还是Windows2000/NT。
下列表中列出的是常见脚本程序语言、服务器软件以及操作系统的特点。
表1-3常用动态服务器程序语言
动态语言 特点 配套使用的操作系统
ASP 简单易学、易用,但是平台移植性差,只能在Windows操作系统上运行。 Windows NT、windows 2000等windows操作系统。
JSP 平台移植性好,但最好有Java的基础。 Windows、Linux、Unix操作系统。
PHP 能够运行在多种操作平台上,能节省开支但后期维护比较麻烦。 Windows、Linux等操作系统。
表1-4常用数据库服务器软件一览表
数据库类型 特点
Access Office的套件之一。简单易学,操作方便,但安全性不高。
SQL server 可用于大中型网站数据库操作平台,简单易行,是中小型公司的首选。
Oracle 大型数据库系统,安全性很高,可以定制,但售价很高,一般用于金融系统。
MySQL 免费是最大的特色,在网上用的也不少,但功能上有一些缺陷,安全性不是很高。
就本例而言,新东方IT教育网上书城主要用来做丛书宣传,访问量不是很高(低于10000人/天),而且安全性能要求也不是很高,因此采用技术比较成熟的ASP能节省开发费用,但由于ASP必须运行于Window2000/NT,因此必须建立windows2000/NT服务器系统发布网站。
除了操作系统、数据库服务软件以外,还要选择网页制作方面的软件。网页制作主要包括网页排版、网页图形设计和图像处理、多媒体开发三大领域。这方面的软件非常多,下面是非常典型的网页制作软件的特点和评价。
表1-6网页排版软件
软件名称 特点 评价
DreamWeaver MX Dreamweaver是美国Macromedia公司开发的集网页制作和管理网站于一身的网页编辑器。用它制作的网页代码精炼、跨平台性好、可以自动生成Javescript脚本语句。它成功地整合了电子商务功能,不需要通过浏览器就能预览动态网页。Dreamweaver、Fireworks、Flash之间可以良好协作,它们一起被称为"网页三剑客"。 专业、实用。既可制作页面也可用于动态编程。
Visual Interdev 可以实现ASP脚本的自动添加,与VB、VC的使用方式有些相似,缺点是产生的代码不是很规范。 适合熟悉VB、VC的程序员使用。
表1-7网页图像处理软件简介
软件名称 特点
PhotoShop 6.0 能进行很精细的位图处理,是平面设计中不可缺少的软件。但是它的矢量图功能比较差,在制作图标等矢量对象时还需要借助Illustrator来完成。
Fireworks MX 它是专门针对网页设计的绘图软件,将矢量图和位图的功能融合在一起,而且完善的切片和优化导出功能使得它在专业的网站开发领域占据着不可替代的地位。
表1-8多媒体软件简介
软件名称 特点
Flash MX Macromedia Flash是Flash动画专业的创作工具。无论是创建动画图标、Web 站点导航、动画片头或者完整的 Flash Web 站点,Flash 的强大功能都能帮您实现。另外,由于actionscript的引入使得在动画上添加Web应用程序成为可能。
Livemotion Adobe Livemotion是一个和Flash功能上差不多的工具,但由于在国内出现的比较晚,很少有人在使用。它是一款针对平面设计师的动画处理软件。
Ulead COOL 360 Ulead COOL 360是用来全景动画的专业制作软件,利用它我们可以很轻松的创建出360全景演示场景。
到目前为止,Macromedia studio MX版本已经逐渐普及,这个版本对于我们开发一个专业的商务网站来说完全可以胜任。事实上,在业内有90%以上的网页制作人员正在用它或者以往的版本制作网站。
项目进度计划需要给出比较细致的开发进度,主要说明在什么时候完成了哪些工作。下表是实例的开发进度计划概要。
表1-9新东方IT教育网上书城项目进度计划概要
工作内容 开始时间 截止时间
1、网站策划(用户调研、需求分析、系统规划设计) 2002/10/7 2002/10/15
2、人员组织 2002/10/7 2002/10/15
3、形象设计(图标、广告条、关键页面草图) 2002/10/15 2002/12/25
4、动态编程(应用系统开发) 2002/10/25 2002/11/25
5、测试发布 2002/11/25 2002/11/30
7、系统文档编写整理 2002/11/30 2002/12/5
8、汇报验收 2002/12/10
9、宣传与维护(系统试用期) 2002/12/10 2003/3/10
10、项目总结 2003/3/11
这个时间表和正式合同的时间一般会有一些差别,因为有可能会出现一些意外情况耽误项目的进程,因此签合同时一般需要多出一个月给自己做缓冲。
项目预算要将开发中可能出现的开支以及系统搭建所需的所有费用详细列出,给出完整的清单。清单主要包括硬件开支、软件开支、工资开支、日常开支等内容。
其中硬件开支主要包括网站发布服务器、数据备份服务器、防火墙硬件、其他网络硬件等所需开支;软件开支主要包括操作系统、硬盘备份软件、杀毒软件等项开支;工资开支主要是指员工的正常工资和奖金,涉及到的人员主要有项目主管、网站策划、美工、网页制作、程序员等;最后还有一项就是日常开支,主要包括午餐、办公用品、相关活动的开支等。
简单的说就是设计一份出现意外情况时的应急办法清单。基本上就是确定出现什么意外之后应该怎么办。这里的风险主要是指网站开发过程中的可能出现的风险。
方案书与计划书不同,它是提交给客户的资料,因此你必须考虑到双方的利益问题。标书一定要讲清用户最感兴趣的内容,如能实现的功能、采用的技术、各项开发费用等,必须让用户相信你有实力也有充足的准备,否则他就会将“绣球”丢向你的对手。
具体来讲,一个完整的方案书需要包括网站主要功能、硬件软件系统环境、软硬件报价表、开发周期表和开发费用明细表等内容。方案书还应附有开发中的各项费用开支清单以及开发日程详细安排等内容,这样可以让客户心中有数,给顺利签订合同打下坚实的基础。
如果客户对你给出的开发计划比较满意,就会和你签订一个技术开发合同,合同需要将网站建设目的、详细功能要求、费用及支付方式等列举出来,下面是比较规范的项目开发技术合同。
“新东方IT 教育网上书城”开发技术合同
合同编号:XDFIT-2002-10
项目名称:新东方IT 教育网上书城
甲方:新东方IT教育
乙方:应用软件教学部
一、建设目的:
新东方IT教育开发建设新东方IT教育网上书城的目的是宣传新东方IT教育系列丛书,更好的为学员服务,进而扩大企业知名度。根据这个目的,合作双方设计并制定了网站的各个模块以及要实现的功能。
二、前台设计
(一)首页设计
首页要有清晰的导航,每个次级页面左侧导航及相关内容不同,均有不同的风格,但在同一分类下风格统一。静态网页设计需要有三个方案,方案须经甲方同意才能继续完成动态编程部分。
(二)公司简介及新东方系列丛书介绍
公司简介需要包含新东方IT教育、组织机构、公司文化、发展历程、网站简介、联系我们、客户留言。
(二)动态信息发布模块
要求有以下互动信息的实时发布栏目(包括文字、图片、图表、数字等):新闻、经营信息、调查结果发布、行业动态、人才信息。
(三)会员管理模块
对会员进行不同权限的划分,分为三类:访客、注册用户、新东方学员。
(四)商品销售模块
最新图书信息、热点图书信息、新书预告、本月排行。用户可以在线提交订单,查询图书,察看图书相关信息。商品信息包括编号、名称、规格、价格、出版社、作者、详细说明、图书封面、备注等内容。
能实现商品的搜索,可以按照关键字进行检索;
(五)商品服务模块
案例下载、原创交流、技术论坛、客户反馈。
(六)市场调查和分析模块
管理员可以使用界面实现市场调查表单内容的修改;对客户的意见进行统计分析。
(七)客户反馈模块
访问者可以填写反馈信息,而且将访问者的信息放在页面上显示。为了保证安全性,访问者的联系方式等涉及私人秘密的信息不在页面上显示。
三、后台设计
(一)分级管理
能实现分级管理,管理员分为超级管理员、普通管理员、会员三个等级,分别享有不同的权限。
(二)动态信息管理
可以按类别发布信息,能实现关键字检索。
(三)商品管理模块
可以手动将某一项商品变为“畅销商品”,并在“热点图书”栏目中显示出来。在每个大类下,可以动态添加、删除、编辑商品小类,可以添加、修改、删除任何一种商品的信息。
(四)会员管理模块
会员可以修改个人资料,而管理员可以修改、删除、增加一个新的用户。
(五)市场调查及分析模块
对前台提交的调查问卷进行分析归总。
(六)用户反馈模块
对用户提交的反馈信息进行归纳分析,具有回复、归纳、查询、删除留言等功能。
(七)网站访问统计系统
对用户提交的反馈信息进行归纳分析,恢复帖子。
四、项目内容及相关费用(单位:人民币/元)
网站开发费用如表1-3所示。
表1:网站页面及页面制作费用
序号 项目 单价 数量
1 欢迎屏(包含Flash) 1000元/页 3套
2 首页 800元/页 3套
3 栏目页 400元/页 3套
4 终极页 100元/页 3套
5 Flash动画广告 500元/秒 3套
小计: 8000.00元
表2:网站数据库程序设计费用
序号 项目 规格
1 动态信息发布系统 按照方案实施
2 商品管理系统 按照方案实施
3 会员管理系统 按照方案实施
4 客户反馈系统 按照方案实施
5 网站访问统计 按照方案实施
6 市场调查和统计 按照方案实施
小计:15000.00元
网站开发所需硬件和软件全部由新东方IT教育。网站开发总费用为23,000元整,开发前先预付5000元整,项目测试完成验收后由甲方支付剩余的18000元整。
五、开发周期
网站从2002年10月10日开始,2002/1/10完工。2002/1/10至2002/4/10为网站调试阶段,届时由乙方负责调试好站点并由甲方监督测试。网站建设期间甲方能通过http:// ( http: / / )网站看到网站的建设情况和进度。
六、其他
依据合同双方约定,乙方有责任根据甲方要求提出修改的要求进行调整。但一旦设计方案正式确定之后,甲方将不再有大幅度调整网站结构的权利。如有未写明的要求,应以实现网站功能为标准。
甲方:代表签字(盖章):时间:2002年9月30日 乙方:代表签字(盖章):时间:2002年9月30日
合同签下来了,还有很多的事情要做。项目正式开发之前最重要的就是项目策划。项目策划包括网站结构的设计、模块功能设计、书写项目策划报告等内容。
网站结构的确定和整个网站的主要开发目的紧密相关,比如“新东方IT教育网上书城”这个项目既要介绍实现网上购物,又要宣传公司形象,因此设计需要从这两个方面去着手。
由于需要宣传公司和丛书,因此至少包括公司简介、丛书介绍、服务内容、联系方式等信息;另外由于要实现网上购物功能,因此需要提供会员注册、详细的价格信息、在线购物、商品服务信息、搜索查询、定单确认、付款方式、帮助系统等基本内容。
网站内容是网站吸引浏览者最重要的因素,无内容或不实用的信息不会吸引匆匆浏览的访客。可事先对人们希望阅读的信息进行调查,并在网站发布后调查人们对网站内容的满意度,以及时调整网站内容。
设计的结果最重要的就是网站结构示意图。在这张示意图中,必须将网站重要表达的内容非常清晰的表达出来。
表1-11网站结构示意图
网站结构示意图前台部分后台管理部分
模块功能设计实际上就是将每个功能进行深入研究分析,明确应当完成的所有工作。然后制定出详细的开发计划以及人员组织计划。
项目策划报告是提交给项目决策人员(如老板、部门经理)的重要材料,他们将会根据客户要求对计划书的内容提出修改意见,确定后正式实施。
项目开发人员的多少和比例要根据实际项目来决定,一般控制在5-7人。组建项目团队时根据网站规模确定需要哪些职位,然后选择合适人员组成。人员最好都有相关项目的开发经验,技术上一定要过硬,因为任何一个环节上浪费了时间都可能导致项目如发如期完成。
一般开发人员至少需要项目主管、网站策划、内容编辑、美术设计、网页制作、网站程序员,另外还需要公司里的系统管理员、网络工程师、质量测试、法律顾问、文档管理等人协助。当然小的开发公司一个人往往需要身兼数职,比如内容编辑、美术设计、网页制作甚至网站程序员都可能有一人完成。当然这样能节省一些开支,但必然会延长开发周期,而且项目质量也难以保证。
表1-12网站开发人员职责职位一览表
人员职位 主要职责 能力要求
项目主管 负责项目的管理和协调,合理分配和使用资源,保证项目按计划顺利进行。具体工作包括参与决策、召集开发人员、审查开发文档、协调开发进度、汇报开发进展、书写宏观技术文档以及项目总结等。 要求对市场、人力资源、开发成员的特点、开发项目所需资金、开发周期、各部分技术等各方面都有着全面的认识,而且要求表达沟通能力好、能够任劳任怨、在关键时刻能起到精神领袖的作用。
网站策划 对网站结构和内容进行设计和组合,和软件开发中的系统分析员有些类似。书写网站策划文档。 对客户需求有很深的理解,能准确把握整个项目全部内容。
内容编辑 负责收集整理资料。 要求知识面很广、具备很强的写作能力,能迅速收集大量有用数据、资料,对网站内容要求有着深刻的理解。
美术设计 主要负责标志、广告条、色彩以及关键页面草图的设计。书写网站形象说明书。 必须熟练掌握Adobe Photoshop或Macromedia Fireworks等专业绘图软件,有较高的艺术修养和丰富的设计制作经验。
网页制作 按照美术设计的方案制作网站效果图和页面,需要时制作各种动画(如Flash、虚拟现实动画等);书写网站文件管理技术文档。 能熟练运用专业网站制作软件(Dreamweaver、Fireworks、Flash 等)、了解Asp编程,能设计美观实用的网站界面。
网站程序员 网站程序员主要是指负责与Web相关的基于网络数据库系统与应用软件开发的工程;书写网站后台管理技术文档。 目前一般要求会使用ASP、JSP、PHP中的一种,能熟练使用一种网页制作工具(如Dreamweaver)。
系统管理员 也就是 “网管”,负责发布Web站点,配置数据库服务器等,保证网络安全。 要求熟悉网络基础知识,熟练掌握多种操作系统,能配置服务器软件、数据库软件,进行网站的管理和页面内容的更新。
网络工程师 主要负责局域网络的组建与维护。 要求熟悉网络技术、安全协议、路由与交换技术,对网络的设备进行维护与管理。
其他人员 需要时安排人员担任质量测试、法律顾问、文档管理。
由于这些人员的工作时间一般不会同时进行,因此有很大一部分可以在需要时从其他部门抽调过来。比如,在项目策划阶段一般只需要项目策划和项目主管参与就可以了;当正式进行静态页面设计时,就需要将内容编辑、美术设计、网页制作请过来,这是项目策划就可以去参加其他项目的策划;当静态页面完成后,美术设计就可以离开参加其他项目的设计了,而网站程序员又可以从其他部门抽调过来。另外,像系统管理员、网络工程师、质量测试、法律顾问、文档管理等一般公司只有一位,需要时可以请他们帮助项目组完成一些配套的工作。图1-3是每个流程所需要的人员示意图。
图1-3每个流程所需人员示意图
所有人员的调动都和公司的人事部门紧密相关,与他们之间的沟通是项目主管的重要工作之一。项目主管必须和人事部门确定好用人时间,并出具开发时间表。确定人员之前,项目主管还必须了解人事部门推荐人员的特点,从中筛选最合适的人才作为项目开发组成员。
人员的确定必须在项目正式开发前进行,临时找人绝对不是一个好方式,这样很难保证开发进度和商品质量。如果不是专业的开发公司,就必须从公司外找一部分人来做,当然这样一来风险也就增大了。
要制定项目开发规范,由两个方面的原因:一是为了方便交接,二是为了减少错误。
因为开发项目时,不是任何时候所有的开发人员都在一起,任务交接就成了一个大问题。比如说静态网页制作完成后,网页制作就需要将所有的静态页面交给程序员,这时就需要告诉程序员那些文件主要包含什么内容。如果网页制作人员给文件目录和文件命名时是按照指定的规范命名的,那么程序员就只需要阅读一下文件目录命名规范就可以很轻松得找到自己想要的文件,相反就需要一个个的打开文件察看内容,这样必然会浪费很多时间。更加严重的是,这样会使得合作非常不愉快,导致开发小组不团结。
另外,网站分工的深入以及网络业的逐渐成熟,很多行业标准提了出来。比如网站广告条的尺寸、层叠样式表的使用等都有了一套比较规范的要求。
项目开发规范由项目主管结合开发小组其他成员的意见书写,要求尽可能的细致。主要包括:目录文件命名规范、网站Logo的设计规范、广告Banner的尺寸规范、字体使用规范、CSS书写规范、网页HTML代码书写规范、数据库设计规范等。
除了上面提到的任务交接的原因,网站管理员和开发小组之间的项目交接也是一个重要原因。由于往往不属于一家公司,交流起来就比较麻烦,如果没有遵循一定的开发规范,就会给后期网站的管理造成很多麻烦,甚至造成巨大经济损失。
为了减少这些麻烦,文件命名规范在开始前就要制定好
网站图标(logo)是整个网站的视觉中心,也是整个网站内涵的集中体现。如何让logo看着美观大方,又能体现公司文化和行业特点,使设计师不可回避的问题。本书也给出了一些网站图标的设计思路。
网站建立起来后,往往需要在一些大网站上打广告,这样就需要制作广告Banner。另外由于需要在其他网站上显示广告条,还需要考虑大小问题。
作为网络广告提供商,他们一方面要保证你的Banner的显示效果,另一方面也不希望你的广告放上去后影响到他们网站风格的统一。为了解决这个矛盾,广告提供商一般按照标准大小预留广告条位置。
由于预留位置已经固定,因此我们在制作广告条时如果做得太大或者太小就会发生变形,变得很难看,因此必须遵循网上通用的尺寸规范制作各种类型的广告条,图1-4是最常见的468*60像素的广告条。
图1-4 468×60广告条
关于广告条的制作请参阅第四章 网站广告条的制作。
文字的使用非常广泛,标题、正文、装饰图片都要用到文字。文字到底有哪些字体、应该选用什么样的字库、在某个具体情况下应该用什么样的字体,这些都是困扰设计师的问题,这部分内容请参阅第三章 网站图标的制作。
网站中无论是图片还是普通文本,都涉及到大量的色彩信息。如何管理这些信息以往是一件很复杂的工作,但在有了Macromedia studio MX之后,这些工作就比较轻松了。
CSS样式表包含了几乎所有的页面样式信息,利用它可以控制整个网站的风格。因此,一个规范的容易操作的样式表显然是十分重要的。如何让样式表尽可能的精炼、修改网站风格时工作量最小就成了一门很深的学问。
HTML代码对于静态网页制作的人员来说已经不是什么问题了,因为除了少量的Javascript脚本之外,几乎所有的静态页面都可以用Macromedia MX制作出来。但是,对程序员来讲,不规范的HTML代码是致命的,因为他们需要找到插入动态服务器脚本的具体位置,垃圾代码往往会消耗他们非常多的时间。下面是两种显示效果完全一样但代码书写格式不同的两段代码。
欢迎访问新东方IT教育网上书城:::...欢迎访问新东方IT教育网上书城〉〉〉
这样的代码看起来是不是很清楚?
欢迎访问新东方IT教育网上书城:::...欢迎访问新东方IT教育网上书城:::...
这样的代码看起来累吗?
这两段代码显示的效果是完全一样的,但是给程序员的感觉是完全不一样的。如果所有的页面都是很不规范的代码,就会让程序员变得非常烦躁,严重影响开发情绪,进而波及到整个开发小组。
幸运的是,Macromedia Dreamweaver对HTML代码的生成实行了严格的控制。如果你避免了一些错误的操作,就完全可以避免垃圾代码的产生。而且,Dreamweaver还提供了清除垃圾代码的功能。
另外作为一个专业的网站,往往需要在网页代码中添加一些特殊的代码,如版权信息、搜索关键字、网站描述信息等。这些都可以通过Dreamweaver可视化工具添加到HTML源代码当中。详细内容请参阅
数据库是整个网站的核心,它能否高效率的输入输出数据,将决定着动态网站的反应速度。因此创建一个结构清晰完整、重复数据量小、垃圾数据少的数据库就成为网站创建过程中很重要的一环。
ASP虽然使用起来比较简单,但是它的功能已经比较完善,如果使用不当,给不法分子留下了空当,就可能会出现很多问题。而且ASP代码中涉及很多函数、变量,如何给他们合理的命名也是一个不容忽视的问题。
“爱美之心人皆有之”,网站做得不漂亮,要想在众多网站中脱颖而出恐怕是难于上青天。网站外观的好坏不仅影响到浏览者的回头率,更重要的是直接影响到公司的形象。由于目前电子商务还没有真正被大多数人所接受,很多人还持有怀疑态度,即使你的公司实力很强,但如果你的网站做的就像个不入流的个人网站,我想浏览者无论如何是不会去下订单的。原因很简单,一句话:我不信任你。
好的外观可以给浏览者带来好的心情。在舒适、优雅的氛围中,浏览者会很自然的去浏览你的网站,进而将商品放进“购物车”。
站点开发所需要的资料主要由客户提供,如果不足可以由网站编辑负责收集整理。这些资料包括照片、文字等。收集时一般先收集有关客户的资料,如是否有公司图标、公司经营情况、代表性商品等,因为美术设计的工作必须建立于这些素材之上。
随后网站编辑需要收集各种商品的信息,并将这些数据分门别类的录入商品数据库。在建立商品数据库时,由于采集商品照片的工作量很大,而照片的多少对开发进度并没有太大的影响,因此一般放在最后去收集。
除了收集工作之外,网站编辑还需要编写网站帮助系统和管理员使用手册。具体的工作责任和流程如图1-5所示。
图1-5 网站编辑工作流程
根据基本内容设计出页面的基本框架,应当尽可能的细化。图1-6是实例中首页和“关于我们”两个栏目页面的结构草图。这样的草图可以用铅笔直接在纸上去画,也可以用Fireworks在计算机上去画。我一般习惯于用计算机,因为修改起来很方便,可以节省大量的时间。
图1-6首页结构草图
页面设计当中有两个关键点,一个是网站图标,另一个是网站广告条。另外为了使页面更加美观,需要制作一些装饰性的图片,这部分主要由美工去完成。
当开发规范和开发思路明确之后,就要开始设计网站了。首先由美工设计出网站的图标(logo)。标志的设计是整个网站的关键,它体现了一个公司的形象和文化底蕴,也是整个网站中使用频率最高的对象,因此标志设计的好坏直接关系到网站的形象。如图1-7和1-8是新东方学校、新东方IT教育的图标。
图1-7 新东方学校图标
图1-8新东方IT教育图标
图标设计需要注意很多方面的问题,图标的字体、颜色、大小都是设计师必须要考虑的问题。标志的设计主要分为构思、绘制草图、具体制作、优化输出等步骤。详细内容请参阅第三章 网站图标的制作。
广告条(banner)是推广网站和商品有力的工具。商业网站一般都会在页面顶部最醒目的位置上放置一个广告条用来宣传自己的商品。广告条一般都采用GIF动画,现在逐渐开始向Flash动画过渡,具体采用什么形式,可以根据广告条的复杂程度以及访问人群来决定。
如果动画情节很简单,可以采用GIF的格式,这样的动画完全可以用Fireworks来完成。由于Fireworks既可以制作图形、处理图像,又可以制作简单动画,文件无需重复导入和导出,因此用Fireworks来制作简单Banner动画是最理想的选择。这部分详细内容请参阅第四章 网站广告条的制作。
图1-9 网上GIF格式的广告条
相反,如果需要制作很复杂的动画,用GIF格式文件体积会很大,影响下载速度,这时可以考虑使用Flash动画文件格式,如图1-10所示就是Flash动画的一帧。它可以使文件体积很小,但是必须保证访问者的浏览器安装了flash播放器的插件。这部分内容请参阅第十四章 网站宣传动画的制作。
图1-11比较复杂的动画一般采用Flash格式
只有文字、广告条、图标的页面多少会显得比较单薄,为了页面的美观,一般需要在页面中添加一些装饰性图片。比如将重要的内容如标题等用图片装饰起来,用图片填充空白区域等。这些图片都可以在Fireworks中制作出来,具体方法请参阅第五章 装饰性图片的制作。
当图标和广告条设计好后,基本上网站的基调就定下来了。这时我们可以根据策划时绘制的关键页草图用Fireworks制作出关键页面的效果图。这里说的关键页面指的是网站首页和第一级栏目页面。
这里你需要认真考虑的是如何美化网页的每个部分,并且保证整个页面看起来很完美和谐。也就是需要决定采用什么样的版式结构,采用什么样的配色等内容。这是整个网站开发中最难的部分。
一般比较大的项目,客户都要求制作单位拿出2-3套前台设计方案,也就是必须有2-3套效果图。效果图完成后,由项目主管把效果图交给客户审查,经客户签字认可后开始页面的制作。
根据网站策划过程中确定的功能结构图,你需要决定建哪些一级栏目,每个栏目下还要不要分第二级栏目,二级栏目是否还要细分,每个栏目中应该有什么文件,每个文件里面具体应当有些什么内容,这些都应当事先规划好。
组织目录结构实际操作起来很简单,就是在站点中添加很多的文件夹,分别放上不同的文件。目录结构确定时一定要保证结构清晰、完整,方便查找文件。图1-12所示是实例网站的目录结构。
图1-12“新东方IT教育网上书城”网站目录结构
这部分工作主要用Dreamweaver来完成,利用Dreamweaver我们可以完成这样几项重要的工作:
1、版式结构的实现;
2、图文的混排;
3、网站风格的确定——确定CSS样式表;
4、网页动态特效的添加;
针对不同网站,需要采用不同的版式,而表格是控制页面布局最好的工具,
用表格排好的页面中有了文字、图片或者flash动画,但有时候为了使页面有生气,还希望加上一些动态特效,比如想在页面中显示当前日期、图像的替换翻转、下拉菜单等。要做出这样的特效,我们需要在网页的代码中加入一些脚本语言,一般我们采用Javascript。利用这些脚本,可以将网页变得更加生动活泼。
但在dreamweaver中,我们一般不需要手写Javascript代码。大部分常见的特效都可以用Dreamweaver 制作出来。这时需要用到层、行为和时间线。
仔细观察任何一家网站,就会发现同一个栏目下的页面中有很大一部分是完全相同的。由于这样的页面数量一般很大,修改时工作量也非常大,因此需要一种方法能批量创建和修改这种页面,这种方法就是模板。在Dreamweaver中,你可以将做好的页面保存成模板,然后从模板创建新的文件,就可以免掉很多重复性的劳动,而只需要做的不同的内容。更重要的是,当你修改模板时,所有使用过这个模板的页面都会自动更新,大大减小了工作量。
除了本栏中的页面大部分相同外,不同栏目之间也有很多相同的部分。比如本例中前台页面几乎所有的版权信息部分都是相同的,但其他部分并不相同。这个怎样保证他们能同步更新呢?
这时需要用到Dreamweaver中的另一个工具,那就是“库”。利用它可以保证小块内容相同的区域能够保证同步更新。
最后我们将所有的页面链接起来,这时整个网站才形成一个有机整体。
动态网站编程是整个网站的灵魂所在,正因为有了它,我们制作的所有页面才有了实际意义。动态编程我们在本书不作更深入地介绍。
网站完成之后,必须严把质量关,首先由小组内部人员从头至尾测试一遍,保证没有明显的错误。一般这时可以将网站挂在公司内部局域网中调试,由公司的网站测试人员检查是否符合客户要求,
当测试确认没有什么问题后,联系客户的网络工程师和系统管理员,将本机上站点文件通过FTP传到对方的网站服务器上去,一般三个月内是试用期。试用期中很重要的工作就是培训客户的系统管理员。培训手册由项目主管结合所有开发人员的技术文档书写,将网站后期可能出现的问题作出详尽的说明。
试用期内开发小组至少要保留项目主管,其他人员特别是网页制作、网站程序员这段时间内也必须做到随叫随到,因为客户可能会在发现问题后要求调整网站内容或者功能细节。
试用期结束后,项目符合客户要求,将举行验收仪式。在仪式上,项目主管需要将整个项目的功能特点、技术细节汇报给客户,并进行项目的交接。客户在项目验收协议上签字后,项目正式交接完毕。同时,客户需要将所有开发费用一并结清。对于开发小组而言,一般项目到此结束,剩下的就是技术支持等后期服务了。
但对于客户而言,还需要认真考虑采用怎样的方式来宣传网站。一般可以根据访问者的性别、年龄、居住地区、生活习惯以及收入等情况决定宣传网站的方式。其中注册搜索引擎、广告条、友情链接等是最常见的方法。
当网站发布之后,系统管理员(网管)还有很多的事情要做,如检查整个网站是否有断链,是否有损坏的文件,更新维护站点内容等等。
对于网站开发小组而言,项目结束后要及时总结开发过程中的成功与不足,将开发过程中产生的重要成果整理出来,转化为下一轮开发的生产力,比如程序模块化等。
当然如果网站运行了很长时间之后,技术上可能又落后了,这时客户必然需要升级网站,这是我们又可以开始网站的开发了。事实上网站开发就是一个循环往复的过程。正因为如此,网页设计师才有了生存的空间,这个职业才得以持续存在。
其实一个专业网站的开发比这里讲的可能还要复杂,往往需要消耗大量的人力、物力、财力。在所有的流程当中,对于多媒体网页设计师而言最为重要的就是美术设计和网页制作部分,这些往往需要花费大量的时间,具体而言就是制作和设计网站上用到的图片、Flash动画,设计和制作好所有的静态页面。
PAGE
15(共11张PPT)
总第一期 The first
总第一期 The first
总第一期 The first
总第一期 The first
总第一期 The first
总第一期 The first
经过我们1个多月来的努力,一台fashion show终于成功上演了,看着我们的笑容,知道努力没有白费, 谢谢大家的观看,谢谢……
快点我出去,我要去要看服装展示
13116AM
marie claire
5339
5340
5341
5342
5343
5344
5345
534心
5347
5348(共21张PPT)
·自助游旅行计划
7 days trip to
Greece
景点
希腊的美景让人为之倾倒,我们要去的地方有……
饮食
希腊雅典的饮食比起西欧国家的旅游城市要便宜很多,而且,您可以有许多的选择……
·我们的目的地
·旅行计划
行程安排
费用预算
预备物品
·我们的目的地…
目的地1号:雅典
关键词:卫城、奥林匹克运动场、宪法广场
·卫城建于雅典的中心,它不仅仅拥有极据价值的纪念物,同时还拥有美丽的视野,包括一些后时期的建筑。卫城和帕特农神庙的图片-作为这座城市的标志-已经在过去的几十年中已经传遍了全世界。这些纪念物带领游览者游览了古希腊的神话、历史、文明、哲学、历时的思想与价值。
·我们的目的地…
目的地1号:雅典
关键词:卫城、奥林匹克运动场、宪法广场
·卫城的古迹见证了新石器时代的生活,在伯力克里斯黄金时期,古希腊文明得到了完美的呈现,许多重要的建筑物就是在那是建立的。
·我们的目的地…
目的地1号:雅典
关键词:卫城、奥林匹克运动场、宪法广场
·卫城上神圣的大石头被认为是古希腊最主要且著名的景点,每天从早到晚,数以万计的游客前往参观。帕特农神庙是多利克风格建筑,全部使用潘泰列克大理石建造而成,神庙曾里有一尊象牙和薄金打造成的大雅典娜巨像,菲狄亚斯的作品。
·我们的目的地…
目的地1号:雅典
关键词:卫城、奥林匹克运动场、宪法广场
·2004年雅典奥运会主会场
·我们的目的地…
目的地1号:雅典
关键词:卫城、奥林匹克运动场、宪法广场&议会大厦
·议会大厦和宪法广场议会大厦建于1836年,原来是王宫。前面的宪法广场是雅典市中心广场,也是希腊进行各种重大政治和国事活动的场所。广场上无名战士纪念碑前每小时一次的卫兵换岗仪式吸引了大批游客。
·我们的目的地…
目的地2号:克里特
关键词:克诺索斯王宫遗迹、爱琴海
·希腊最大的岛屿。在地中海中,爱琴海之南。曾在此发掘出公元前10000至公元前3300年新石器文化遗迹。约从公元前2600至公元前1125年,岛上涌现了著名的米诺斯文化,艺术、建筑和工程技术空前繁荣,并建立了统一的米诺斯王朝。
·我们的目的地…
目的地2号:克里特
关键词:克诺索斯王宫遗迹
20世纪初,还在该岛北部发掘出克诺索斯王宫遗址,规模宏大,与传说中的迷宫隐隐相符,集中代表了米诺斯文化的成就。
·我们的目的地…
目的地2号:克里特
关键词:克诺索斯王宫遗迹、爱琴海
·爱琴海是地中海的一个大海湾。克里特和希腊早期文明的摇篮。
·我们的目的地…
目的地3号:奥林匹亚
关键词:古奥林匹亚运动场、迈泰奥拉岩石山顶修道院
· 奥林匹亚遗址在距首都雅典以西约190千米伊利亚洲境内,是古希腊的圣地。
· 古奥林匹亚体育场四周有大片坡形看台,西侧设有运动员和裁判员入场口。它与附近的演武场、司祭人宿舍、宾馆、会议大厅、圣火坛和其他用房等共同构成了竞技会的庞大建筑群。
·2004年雅典奥运会的铅球比赛放在奥林匹亚体育场举行,2500年之后,人们在这里重温奥运会之梦。
·我们的目的地…
目的地3号:奥林匹亚
关键词:古奥林匹亚运动场、迈泰奥拉岩石山顶修道院
·阿特拉斯的圣山教堂建筑基本上是拜占庭风格,很多都采用了大致相同的布局,其中最雄伟壮观、在建筑角度上最值得欣赏的是海拔高度为613米的大迈太奥拉修道院,又称基督变容修道院,而修道院内的教堂更是建筑精华中的精华。
觅食关键词:嫩滑的羊肉Gyros、鲜甜的海鲜、香口的pita包。
·我们吃什么?
·我们吃什么?
觅食关键词:嫩滑的羊肉Gyros、鲜甜的海鲜、香口的pita包。
·披塔(Pita)是当地最受欢迎的主食,大多为圆形面饼,外形有点像面包,又有点类似于中国北方的夹馍,但比夹馍更大更薄,中间是空心的,像个口袋,所以也有地方把它叫做口袋面包。
觅食关键词:嫩滑的羊肉Gyros、鲜甜的海鲜、香口的pita包。
·我们吃什么?
·行程安排
·日期:2007年9月30日—10月7日
·人数:4人(2个15岁青少年)
·目的地
[希腊] Athens雅典、Olympia奥林匹亚、Crete克里特岛(爱琴海南)
日期 线路 交通工具 住宿
9月30日
北京-雅典 23:55乘 TK1845北京首都国际机场起飞,经伊斯坦布尔转机 飞机
10月1日
雅典 09:40到达雅典国际机场,参观宪法广场,奥林匹克运动场,游览雅典地标性建筑-雅典卫城。(哈德良拱门、雅典娜胜利神殿、表现物质与灵魂和谐统一的艾利费朗祠堂以及帕特农神庙。之后参观宙斯神殿。)晚上在旅店休息。 公共汽车 Dionysos Hotel(青年旅馆)
10月2日
雅典 在雅典购物,品尝当地风味小吃,体验当地民俗风情。 公共汽车 Dionysos Hotel
10月3日
雅典-克里特 乘飞机前往地中海文明的发祥地-克里特岛。抵达后,乘车前往参观"米诺斯文明"的发源地--克诺索斯王宫遗迹。品尝克里特岛风味烤肉。 汽车/飞机 当地旅馆
10月4日
克里特 体验当地民俗,到爱琴海边小憩。 公共汽车 当地旅馆
10月5日
克里特-雅典-奥林匹亚 乘飞机回到雅典,再从雅典出发,坐火车穿过科林斯地峡,来到奥林匹亚。参观古奥林匹亚体育场、迈泰奥拉岩石山顶修道院。晚上在旅店休息。 火车/飞机 Best Western Europa Hotel
10月6日
奥林匹亚 在当地购物,参观博物馆,品尝当地特产。晚上看歌剧。 汽车 Best Western Europa Hotel
10月7日
奥林匹亚-雅典-北京 早上乘火车回到雅典。
参观拜占庭博物馆。
整理行装。乘TK1845返回北京。 火车/飞机
费用预算
行:6600+2000+700=8700¥/人
住:180·2+200·2+270·2=1300¥/两人
食:1200¥/人
其他:500¥/人
合计:22100¥
需要预备的东西
货币:在国内兑换的1000欧元和10000希腊币,以及一张VISA卡。
证件:身份证、护照
衣物:秋季服装(至少3套)
药品:感冒、腹泻、创可贴、消炎、晕车药
数码产品:相机(电池、充电器)
其他:雨伞(雨衣)、望远镜、太阳镜、水杯、梳洗用品、护肤品、多用途刀、便携包、可折叠的旅行袋。
[END](共9张PPT)
组员简介:刘洪荒乃高一八班学生
COME FROM SHENZHEN。
陈思凯高一八班学生 (是个男生)
吴俣(我)是本组组员、一班成员
本组组长是申井然。(每次打名字都先出来“神经”)
本组作品都和植物有关,刚刚算是没跑题。
申井然制作
还是申井然做的
又是申井然制作
陈思凯
终于不是申井然了
刘洪荒制作
注意:地上的是花!制作:吴俣
物
第一阶梯教数室
NOI MEETING HALL
第一阶梯数室
NOI MEETING HALL
药幕(共30张PPT)
制作:第10组
(王月璐 耿然)
制作时间:
Oct.16-Oct.22
历时7日
日本是一个位于欧亚大陆东侧,主要的岛屿是北海道、本州、四国、九州四岛。本州分为东北、关东、中部、近畿、中国5个地区。日本国土约四分之三是山地与丘陵、缺少平地、使农业用地、城市用地的利用受到限制,在这狭窄的平地上生活着1亿3千万人。由于日本几乎处于温带中部,所以气候大体温和。四季变化极为明显,春秋气候非常宜人,夏季闷热,冬季寒冷。
日本人自古把樱花作为自己的国花,各地都有赏樱花的胜地。每年春天,樱花盛开之时,家庭成员、公司同事一起在樱花树下摆设酒宴,饮酒、唱歌、跳舞、赏花、尽情交流是日本人的一种乐趣。赏花时节,人们欢乐的场面,也成为日本一道迷人的风景线。
100日元=6.5467人民币
人民币与日元的汇率曾经是100:7,但由于最近人民币升值,汇率下跌到100日元=6.5467人民币 ,对我们这样的自助游游客十分有利,到银行兑换现金时也可以看准汇率最低时交易。
另外,如果不想带日币,也可以带些人民币去日本,在日本的银行进行兑换
住宿:日本的apartment都是木质的简易房舍,内部煤电齐全,供低收入者使用(一般没有浴室及其他桌椅设备等)。租房都得经过“不动产介绍所”的介绍,需一次性交纳六个月费用(押金、礼金、介绍费、房租),最少也需12万日元,最少月租在2-3万日元,稍贵即需6-10万日元,特别在东京住宿,不能只顾便宜而需统筹考虑。
交通:通常乘坐地铁或电车,票价一般在110--300日元不等。
外出自助旅游,与家人朋友通话是必不可少的。日本国内电话3分钟30日元,国内平信80日元,明信片50日元,价格都较高。但是国际电信却非常便宜。打电话到中国,3分钟270日元,5分钟420日元,即每分钟90日元或84日元。
大韩民国位居亚洲东北隅、是由大陆的东北向南部伸展的半岛国家。半岛南北长约1.,000公里、东西最短距离216公里、呈细长型。总面积二十二万平方公里。半岛的西北部与中国东北部相邻,鸭绿江和头满江(又叫圆门江)是国和中国及俄罗斯国的分界线;东南隔东海与日本相望。 全国国土的70%是山地和丘陵、其中以东北部的地形最为陡峻崎岖、西南部是望无际的平原、是半岛的谷 半岛的海岸线:东部海岸平宜而水深、西部海岸较曲折而水浅、南部海岸是曲折多湾的沉降岸〈布着3,400个大小岛屿。河川宽广、流速缓慢、呈现大陆性特征。重要河川有汉江(514公里)、锦江(410公里)、洛东江(525公里)等。
散居在尔泰山脉的部落民族、在数千年前、逐渐向东方迁移。诸部落中的通古斯据传定居于韩半岛、为韩民族之始祖。 据1997年12月31日统计,现今韩国人口有46,885,255人,而全国人口的四分之一聚居于汉城。 韩言与土耳其语、蒙古语、匈牙利语等同属于鸟尔阿尔泰语系。韩国文字“HANGUL”创于公元1443年,是颇具特色的表文字。共有十个元音,十四个子音,由不同的子音与1-2个元音组合,成为表情达意的文字。韩国文字构成严密却简单易学,是有利于印刷,出版并发展的最科学的文字之一。
人民币1元=118.24韩元
根据宪法规定,公民有信仰宗教的自由。韩国没有指定的国教,目前注册的宗教团体有300余个,其中,起源于本地原始信仰的巫俗及佛教、儒教自三国时代就对韩国的政治、经济、社会、文化等产生了巨大影响,成为韩国人精神世界的支配力量较晚传人的基督教自二十世纪起逐渐扩大其影响,目前已同传统宗教平起平坐,在信徒数量及社会响力方面实力相当。耶稣教及天主教以此为基础,成为形成韩国近代思想和精神文化的主要社会力量。
在韩国要是想买吃的,可以去超市或者去市场。一般买菜我们还是去市场的时候比较多,因为那里的菜和超市相比比较便宜。如果要是想买那些熟食的话,我还是建议大家去超市,在韩国很多的超市都是在晚上有活动的,可以半价买那些东西。因为韩国不允许食物隔夜再卖。
所以往往在晚上去超市逛逛,说不定会有很多的意外收获。
韩国的交通有地铁、公共汽车和出租车。韩国的地铁票价起价是900韩元,根据所要到达目的地的远近价格也有所差异。但是如果是在地铁和公共汽车之间换车的话,30分钟之内是免费的。所以对韩国人来说一般出行都是靠地铁和公共汽车换乘。
韩国的移动通信业务可以说是世界领先,但是韩国的网络是CDMA的网络,所以说我们中国的手机拿到韩国是不能够使用的。韩国的电话费是很昂贵的,通话时间一般都是以10秒钟为一个基费标准。所以那些刚刚去韩国留学的朋友,想和家人或者朋友联系的话,可以去买那种专门往中国打的电话卡,卡的价格一般从8000韩元到15000韩元不等,通话时间也是从4个小时到5个小时不等。
如果要是使用网络电话的话,那是相当的省钱。网络电话卡是8000韩元一张,可以使用8个小时左右,但是有时候网络不稳定,通话质量是很难保证的。
济州民俗博物馆是一座私立博物馆,主要展出有关济州平民老百姓的遗物。博物馆内陈列的物品都是以前人们实际生活中曾使用过的物品。
博物馆的1层是特别展示厅,2、3层则是常设展示厅,共保存着1万多件展品。展示厅内陈列着3千多件用竹子、稻草、石头等制成的庶民用品;还有海女使用的工具,如下海时穿的水衣、石磨等。此外与巫术及传统习俗相连的奇特物品也陈列于展示厅内。游客们还可以参观到传统的草屋。济州岛特有的皮衣和儿童摇篮,5种镜子做成的巫乐乐器,草做的蓑衣等尤其引人注目。而其中最为奇特的当属日晷。这种日晷是便携式的,因而非常珍贵。在露天展示厅的院子里则陈列着一圈的石像。这里就是济州巫神宫。在巫神宫内,游客们可以看到济州从古至今保存下来的143个巫神像。所谓巫神,就是指聆听济州人祈祷并赐予他们幸福的巫俗里的神。济州巫神宫作为世界艺术资料,具有很高的价值。偶尔,附近的居民也来这里举行跳大绳等巫俗仪式。运气好的游客就能亲身体验济州地区的民俗仪式。
泰迪熊博物馆是为展示百年来深受全世界人们喜爱的玩具熊而建的。在两个展馆中可以见到世界各地生产的玩具熊。游客还可在博物馆商店、西餐厅、能看见大海的室外公园等度过美好的时光。
展馆大体可分成历史馆和艺术馆,以及企划展厅。在历史馆中,有与百年历史中有名的场面相结合而再现历史人物的玩具熊、古董玩具熊等,其中米可朗基罗创作的《最后的晚餐》和蒙娜丽莎的泰迪玩具熊造型尤其引人注目。
在艺术馆中,可以欣赏到将玩具熊引入世界艺术之路的大师们的鲜活作品,还有深受孩子们喜欢的动画人物。这里更有世界上最小的玩具熊,它只有4.5毫米大,应当去看一下。企划展厅展示的是根据不同时期的主题而展出各种泰迪玩具熊。
如果想欣赏济州道的风光、品尝美味的食物,可去博物馆内的咖啡屋和酒吧去看看。在咖啡屋里可以一边呷品着香浓的茶水,一边浅尝美味的食物。酒吧是只在夏季、只对成年人开放的高级场所。
除去消费较高的咖啡屋和酒吧,还有许多可去的地方。博物馆内的庭院里有许多惟妙惟肖的熊雕塑和模型。以半月熊家族和神话中的池塘等为主题而修建的庭院真的是非常漂亮.
汉拿山巍然耸立于济州岛的中部,海拔1950米,是代表济州岛的名山,又称瀛州山,意思是高得可抓住银河。汉拿山分布着各种植物,有着很高的学术价值,1970年被指定为国立公园,周围分布着386座寄生火山山峰(当地语为“奥陵”)。
汉拿山以其从温带至寒带的垂直植物生态分布系统而闻名。这里有着1800多种植物和4000多种动物(昆虫类3300多种),登山路线十分多,可很好地观察周围的山势。汉拿山的登山路线在10公里以内,当天即可登上山顶,但由于天气变化十分剧烈,加上风大,登山者应带上足够的装备
观音寺路线比别的路线都陡,路程为6.8公里,较长,单程3个小时左右。星板岳路线为最长7.3公里,基本上是慢坡,爬到山顶,不用说中间地带,就是城山日出峰也都能望见。单程3小时,但要记住从“金达莱营地”到山顶没有饮用水。
爱宝乐园位于京畿道龙仁市,占地面积450多万坪(约合1488公顷),是一个包括动物园、游乐山、雪橇场、植物园等的大型主题公园。
爱宝乐园由三种主题公园的庆典世界(Festival World)、加勒比海湾、爱宝乐园速度之路(赛车场)组成。庆典世界内具有世界级规模的购物街、全球集市、美洲探险、神奇乐团、欧洲探险、赤道探险等各种游乐设施,均根据空间的特点精心布列。此外韩国最早开设的水上公园加勒比海湾每逢夏天就挤满了冲浪爱好者。速度之路是韩国最早的赛车训练场,赛车手们可以在此进行练习,游客们也可在此领略汽车文化。赛场总长2.125公里,跑道平均宽11米,直线距离450米,均为柏油路,可容纳约35000名观众。此外还有格兰洛斯高尔夫俱乐部、汽车博物馆、青年旅馆、运动公园、虎岩美术馆等。
身份证(学生证)
便携包、雨伞(雨衣)、相机(电池、充电器)、望远镜、太阳镜、水杯、梳洗用品、感冒冲剂、黄连素、刀具
介绍&计划书&PPT:
日本部分:耿然
韩国部分:王月璐
图片:王月璐
加工&整合:耿然
机票价格无法在搜索引擎上查到,应该查专门的网站。最开始我们查的是各机场的官方网站,但里面几乎只有当天航班,后来看到航班号后面的“航空公司”一项时才知道预定机票等工作应该去各航空公司的官网。
中国国际航空股份有限公司
http:///
玩家旅游网 > 目的地 > 亚洲 > 日本
http://guide./_20module/mdd/catinfo/info_140.shtml
小田急电铁官网 中文版
http://www.odakyu.jp/chinese/index.html
Japan Air Lines官方网站 中文版
http://www.narita-airport.jp/ch1/
KOREAN AIR官方网站 中文版
http://www./
途牛旅游网景点 > 亚洲 > 韩国 > http://www./places
爱宝乐园
http://www./htm/MultiLanguage/chinese/htm/
北京神州国际旅行社集团出境旅游公司中东处
http:///that/lvyou/hanguo.asp
制作:第10组
(王月璐 耿然)(共19张PPT)
高一(8)
第16组
宋洋 张书瑞
位置:位于中国东南沿海的大陆架上,台湾东临太平洋,东北邻琉球群岛,相隔约600公里;南界巴士海峡,与菲律宾相隔约300公里;西隔台湾海峡与福建相望,最窄处为130公里。是中国与太平洋地区各国海上联系的重要交通枢纽。
面积:总面积为36006平方公里,台湾本岛面积为35873平方公里。
人口:2228万
民族:汉族约占总人口的98%;少数民族占2%。少数民族分为阿美、泰雅、排湾、布农、卑南、鲁凯、曹、雅美和赛夏等9族,分居全省各地。
语言:大多数的台湾居民祖籍是广东和福建两省的,其中,闽南语为台湾民间的主要方言,称为“台语”,但台湾通用语言仍以北京语(普通话)为主,台湾人称为“国语”。 宗教:佛教、道教、基督教、摩闷教、回教、印度教等。
第一天
上午乘飞机从北京到桃园
在机场解决午餐
顺带休息一下
在桃园搭往大溪的桃园客运,在大溪改搭往复兴的桃园客运,于慈湖下车。
游览慈湖
在慈湖景区要寄存行李
下午三点左右离开慈湖
乘车前往南投
慈湖和大溪陵寝是先总统
蒋公和蒋经国先生二位的陵寝,
同位于大溪镇福安里,二地相
距不远。慈湖旧名埤尾,有前
后两湖,其间有小溪相连,先
总统蒋公以其酷似故乡淅江奉化为由,命名为慈湖。而大溪陵寝原为头寮宾馆,本是一座平淡的四合院,陵寝四周植有龙柏、梅树、山茶,气氛宁静安详,蒋经国先生的灵柩奉厝在正厅,一般来此谒灵的人均在正厅前的天井行礼致敬。
到达南投后
找宾馆住下休息
第二天
前往日月潭风景区
预定日月潭度假旅店
并住下
观光+休息
第三天
早晨去九族文化村玩
九族文化村位于南投县鱼池乡大林村,占地约有62公顷,紧临中外闻名的日月潭,让您自在地悠游日月潭风景区和其他景点;九族文化村园区整体规划十分多样化,并有表演剧、传统歌舞的活动表演,结合文化观光、游憩及教育的 多元化旅游景点,九族文化村更以山地文化村为重要主题,还有最新颖的游乐设施。
九族文化区内规划相当多的园
区主题,欧洲花园为代表之一,由
水沙连宫廷花园和水沙连丽宫所组
成,是国内第一座欧洲宫廷花园,
采欧洲宫廷式的建筑,营造出典雅
浪漫的氛围。
日月潭是台湾著名的风景区,是台湾八景中的绝胜,也是台湾岛上唯一的天然湖泊,其天然风姿可与杭州西湖媲美。潭中有一小岛名珠仔屿,亦名珠仔山,以此岛为界,北半湖形状如圆日,南半湖形状如一弯新月,日月潭因此而得名。 日月潭之美在于环湖重峦叠峰,湖面辽阔,潭水澄澈;一年四季,晨昏景色各有不同。七月平均气温不高於摄氏二十二度,一月不低于摄氏十五度,夏季清爽宜人,为避暑胜地。
潭东的水社大
山高逾二千公尺,
朝霞暮霭,山峰倒
影,风光旖旎。潭
北山腰有一座文武
庙,自庙前远眺,
潭内景色,尽收眼
底。南面青龙山,
地势险峻,山麓中
有几座寺庙,其中
玄奘寺供奉唐代高
僧唐玄奘的灵骨。西畔有一座孔雀园,养有数十对孔雀,能表演开屏、跳舞,使人倍添游兴。东南的邵族居民聚落,有专供旅客观赏的民族歌舞表演。泛舟游湖,在轻纱般的薄雾中飘来荡去,优雅宁静,别具一番情趣。
第四天
早晨离开宾馆
搭车前往嘉义
中午去阿里山
森林游乐区
找宾馆住下
休息+游玩
第五天
早晨离开宾馆
阿里山森林游乐区位于嘉义市东方75公里,东临玉山山脉,与玉山公园相邻,西靠嘉南平原,北界云林、南投县,南接高雄、台南县。全部属于公有林班地,总计面积1,400公顷,为东南亚最高峰玉山的支脉。阿里山森林游乐区因位于海拔二千公尺以上,四周高山环列,气候凉爽,平均气温为摄氏10.6度,夏季平均14.3度,冬季平均气温6.4度。阿里山日出、云海、晚霞、森林与高山铁路,合称阿里山五奇。
阿里山森林铁路有七十多年历史是世界上仅存的三条高山铁路之一。途经热、暖、温、寒四带,景致迥异,搭乘火车如置身自然博物馆。尤其三次螺旋环绕及第一分道的Z字形爬升,更是难忘的经验。阿里山一向以五奇著称,登山铁路、森林、云海、日出及晚霞。
神木木筏道
乘车前往台北
到达台北后找宾馆
休息
下午出发
去信义区
逛街 参观101大楼
去夜市玩
第六天
从台北乘飞机离开
回北京
度小月担仔面
“度小月”名称有个十分感人的来源:远在九十几年前,台南有位渔民叫洪芋头,以出海打渔为生。每年在五月至八月间,正是台风季节,海上风浪很大,一般渔民称之为小月,都害怕出海而另谋工作。渔民洪芋头便经营起了福建老家流传下来的肉燥面,用一付担子挑着,一边是锅和灶,另一边则是米粉和面,到处叫卖,因此有人叫它为“度小月担仔面”,意为渡过困难小月的意思。 “度小月担仔面”除了色香味俱全之外,最吸引人的地方是它的情调和风格。虽然现今遍布全省都有打着“度小月”招牌的面摊,但是洪先生所经营的担仔面才是正宗的,并无其它分店。单看其店面的摆设即可略知一二,
至今不仅仍保持着传统的风貌,店内没有大桌高椅,全是小桌矮凳。当客人围绕著小炉上座时,一面看着店东调制,一面闲话家常,真是乐趣多多。
高汤馄饨
台湾有很多饮食店只卖馄饨,也算是特色之一。由于有祖传的擀面方法,久煮不烂的馄饨皮,加上热乎乎的高汤,再配上新鲜肉馅,入口便能欲罢不能地吞下十多只。高汤馄饨也是蒋介石至爱的美食之一
蚵仔煎
台湾四面临海,因此水产、海鲜在饮食中占有重要分量。著名的蚵仔煎,就是用海鲜做成的美味。蚵仔是一种生有硬壳的海中贝类,又名牡蛎,也叫作蚝。在台湾,蚵仔的吃法很多,而蚵仔煎就是具有特色风味的一种,它是将浓稠适当的番薯粉浆淋在煎板上,再撒上清洗好了的蚵仔,打上一个
蛋,与韭菜、豆芽、茼莴菜
同煎,再配上酱料,趁热品
尝,口味甜中带咸,咸中带
辣,令人垂涎。
www.
www.
www.
www.douban.com
宋洋:查找资料
张书瑞:制作
制定计划高一(1)班
韩舒婷
目录
TOC \o "1-3" \h \z \u 1. 搜索引擎的历史与发展 4
2. 搜索引擎的工作原理 4
2.1.全文搜索引擎 4
2.2.目录索引 5
2.3.其他 5
2.4.中文搜索引擎技术揭密:网络蜘蛛 5
2.4.1.网络蜘蛛基本原理 5
2.4.2.网站与网络蜘蛛 6
2.4.3.内容提取 7
2.4.4.更新周期 8
3. 搜索引擎的种类及其区别 8
3.1.全文搜索引擎 8
3.2.目录索引 8
3.3.元搜索引擎 (META Search Engine) 8
3.4.其他 8
3.4.1.集合式搜索引擎 9
3.4.2.门户搜索引擎 9
3.4.3.免费链接列表(Free For All Links,简称FFA) 9
4. 常见的搜索引擎及其特点 9
4.1.1. 百度搜索引擎介绍 9
4.1.2. 百度排名(免费百度搜索引擎排名) 9
4.2. Google搜索引擎 9
4.2.1.Google搜索引擎介绍 9
4.2.2.Google搜索引擎排名(Google左侧排名) 10
4.2.3.Google搜索引擎登录 10
4.3. 中国搜索联盟(慧聪搜索引擎) 10
4.4. 雅虎搜索引擎 10
4.4.1.雅虎搜索引擎(Yahoo搜索)介绍 10
4.4.2.雅虎搜索引擎登录 10
4.4.3.雅虎排名(免费雅虎搜索引擎排名) 10
4.5. 搜狐搜索引擎 11
4.6. 新浪搜索引擎 11
4.7.MSN 11
4.8.AOL 11
4.9.Lycos 11
4.10.Ask Jeeves 11
4.11.Netscape 11
4.12.AltaVista 11
4.13.Inktomi 12
5. 常用的搜索技巧 12
5.1.Google搜索技巧 12
5.2.搜索关键词提炼 13
5.3. 细 化 搜 索 条 件 14
5.4.用好搜索逻辑命令 14
5.5.精 确 匹 配 搜 索 15
5.6.特 殊 搜 索 命 令 15
5.7.附 加 搜 索 功 能 16
5.8. 网上搜索的加速方法 16
6. 搜索引擎的评价及参数 17
7. 特色网站介绍 26
8. 搜索引擎比较 27
9. 自己的心得体会 27
1. 搜索引擎的历史与发展
现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达System Computing Services大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。
当时,“机器人”一词在编程者中十分流行。电脑“机器人”(Computer Robot)是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。与Wanderer相对应,Martin Koster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最负盛名。然而JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎 最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!
随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi,它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类,搜狐和新浪用的就是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。
2. 搜索引擎的工作原理
2.1.全文搜索引擎
在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户
2.2.目录索引
与全文搜索引擎相比,目录索引有许多不同之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。
其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。(由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍登录Yahoo雅虎的技巧)。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。
目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。
2.3.其他
搜索引擎工作的三步:
第一步是“Spider”软件访问一个站点,并通过其中的链接阅读该站点的页面,而且“Spider”会不时的自动回访该站点以检查变化情况;该“Spider”获得的站点信息形成一个巨大的网络信息库,如同整个网络上已经访问站点的备份,当然记录的不是所有的内容。这也就是我们所说的数据库。第三步是查询服务。这是通过查询软件实现的,当你输入查询内容,该软件就会在其数据库中找到相关内容,然后按照“它的”规则进行排序。
搜索引擎在查询时是如何排名的:
最主要是根据一个站点的内容与查询词的关联程度,但是一个站点的内容搜索引擎又是如何确定的呢?——标题(Title)、关键词(Keywords)、描述(Description)、页面开始部分的内容以及这些内容本身之间的关联程度。而且现在绝大部分搜索引擎都支持MetaTag。
2.4.中文搜索引擎技术揭密:网络蜘蛛
2.4.1.网络蜘蛛基本原理
网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面的平均大小为20K计算(包含图片),100亿网页的容量是100×2000G字节,即使能够存储,下载也存在问题(按照一台机器每秒下载20K计算,需要340台机器不停的下载一年时间,才能把所有网页下载完毕)。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接深度。
在抓取网页的时候,网络蜘蛛一般有两种策略:广度优先和深度优先。
广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易。两种策略的区别,下图的说明会更加明确。
由于不可能抓取所有的网页,有些网络蜘蛛对一些不太重要的网站,设置了访问的层数。例如,在上图中,A为起始网页,属于0层,B、C、D、E、F属于第1层,G、H属于第2层,I属于第3层。如果网络蜘蛛设置的访问层数为2的话,网页I是不会被访问到的。这也让有些网站上一部分网页能够在搜索引擎上搜索到,另外一部分不能被搜索到。对于网站设计者来说,扁平化的网站结构设计有助于搜索引擎抓取其更多的网页。
网络蜘蛛在访问网站网页的时候,经常会遇到加密数据和网页权限的问题,有些网页是需要会员权限才能访问。当然,网站的所有者可以通过协议让网络蜘蛛不去抓取(下小节会介绍),但对于一些出售报告的网站,他们希望搜索引擎能搜索到他们的报告,但又不能完全**的让搜索者查看,这样就需要给网络蜘蛛提供相应的用户名和密码。网络蜘蛛可以通过所给的权限对这些网页进行网页抓取,从而提供搜索。而当搜索者点击查看该网页的时候,同样需要搜索者提供相应的权限验证。
2.4.2.网站与网络蜘蛛
网络蜘蛛需要抓取网页,不同于一般的访问,如果控制不好,则会引起网站服务器负担过重。今年4月,淘宝http://www.)就因为雅虎搜索引擎的网络蜘蛛抓取其数据引起淘宝网服务器的不稳定。网站是否就无法和网络蜘蛛交流呢?其实不然,有多种方法可以让网站和网络蜘蛛进行交流。一方面让网站管理员了解网络蜘蛛都来自哪儿,做了些什么,另一方面也告诉网络蜘蛛哪些网页不应该抓取,哪些网页应该更新。
每个网络蜘蛛都有自己的名字,在抓取网页的时候,都会向网站标明自己的身份。网络蜘蛛在抓取网页的时候会发送一个请求,这个请求中就有一个字段为User-agent,用于标识此网络蜘蛛的身份。例如Google网络蜘蛛的标识为GoogleBot,Baidu网络蜘蛛的标识为BaiDuSpider,Yahoo网络蜘蛛的标识为Inktomi Slurp。如果在网站上有访问日志记录,网站管理员就能知道,哪些搜索引擎的网络蜘蛛过来过,什么时候过来的,以及读了多少数据等等。如果网站管理员发现某个蜘蛛有问题,就通过其标识来和其所有者联系。下面是博客中http://www.)2004年5月15日的搜索引擎访问日志:
网络蜘蛛进入一个网站,一般会访问一个特殊的文本文件Robots.txt,这个文件一般放在网站服务器的根目录下,http://www./robots.txt。网站管理员可以通过robots.txt来定义哪些目录网络蜘蛛不能访问,或者哪些目录对于某些特定的网络蜘蛛不能访问。例如有些网站的可执行文件目录和临时文件目录不希望被搜索引擎搜索到,那么网站管理员就可以把这些目录定义为拒绝访问目录。Robots.txt语法很简单,例如如果对目录没有任何限制,可以用以下两行来描述:
User-agent: *
Disallow:
当然,Robots.txt只是一个协议,如果网络蜘蛛的设计者不遵循这个协议,网站管理员也无法阻止网络蜘蛛对于某些页面的访问,但一般的网络蜘蛛都会遵循这些协议,而且网站管理员还可以通过其它方式来拒绝网络蜘蛛对某些网页的抓取。
网络蜘蛛在下载网页的时候,会去识别网页的HTML代码,在其代码的部分,会有META标识。通过这些标识,可以告诉网络蜘蛛本网页是否需要被抓取,还可以告诉网络蜘蛛本网页中的链接是否需要被继续跟踪。例如:表示本网页不需要被抓取,但是网页内的链接需要被跟踪。
关于Robots.txt的语法和META Tag语法,有兴趣的读者查看文献[4]
现在一般的网站都希望搜索引擎能更全面的抓取自己网站的网页,因为这样可以让更多的访问者能通过搜索引擎找到此网站。为了让本网站的网页更全面被抓取到,网站管理员可以建立一个网站地图,即Site Map。许多网络蜘蛛会把sitemap.htm文件作为一个网站网页爬取的入口,网站管理员可以把网站内部所有网页的链接放在这个文件里面,那么网络蜘蛛可以很方便的把整个网站抓取下来,避免遗漏某些网页,也会减小对网站服务器的负担。
2.4.3.内容提取
搜索引擎建立网页索引,处理的对象是文本文件。对于网络蜘蛛来说,抓取下来网页包括各种格式,包括html、图片、doc、pdf、多媒体、动态网页及其它格式等。这些文件抓取下来后,需要把这些文件中的文本信息提取出来。准确提取这些文档的信息,一方面对搜索引擎的搜索准确性有重要作用,另一方面对于网络蜘蛛正确跟踪其它链接有一定影响。
对于doc、pdf等文档,这种由专业厂商提供的软件生成的文档,厂商都会提供相应的文本提取接口。网络蜘蛛只需要调用这些插件的接口,就可以轻松的提取文档中的文本信息和文件其它相关的信息。
HTML等文档不一样,HTML有一套自己的语法,通过不同的命令标识符来表示不同的字体、颜色、位置等版式,如:、、等,提取文本信息时需要把这些标识符都过滤掉。过滤标识符并非难事,因为这些标识符都有一定的规则,只要按照不同的标识符取得相应的信息即可。但在识别这些信息的时候,需要同步记录许多版式信息,例如文字的字体大小、是否是标题、是否是加粗显示、是否是页面的关键词等,这些信息有助于计算单词在网页中的重要程度。同时,对于HTML网页来说,除了标题和正文以外,会有许多广告链接以及公共的频道链接,这些链接和文本正文一点关系也没有,在提取网页内容的时候,也需要过滤这些无用的链接。例如某个网站有“产品介绍”频道,因为导航条在网站内每个网页都有,若不过滤导航条链接,在搜索“产品介绍”的时候,则网站内每个网页都会搜索到,无疑会带来大量垃圾信息。过滤这些无效链接需要统计大量的网页结构规律,抽取一些共性,统一过滤;对于一些重要而结果特殊的网站,还需要个别处理。这就需要网络蜘蛛的设计有一定的扩展性。
对于多媒体、图片等文件,一般是通过链接的锚文本(即,链接文本)和相关的文件注释来判断这些文件的内容。例如有一个链接文字为“张曼玉照片”,其链接指向一张bmp格式的图片,那么网络蜘蛛就知道这张图片的内容是“张曼玉的照片”。这样,在搜索“张曼玉”和“照片”的时候都能让搜索引擎找到这张图片。另外,许多多媒体文件中有文件属性,考虑这些属性也可以更好的了解文件的内容。
动态网页一直是网络蜘蛛面临的难题。所谓动态网页,是相对于静态网页而言,是由程序自动生成的页面,这样的好处是可以快速统一更改网页风格,也可以减少网页所占服务器的空间,但同样给网络蜘蛛的抓取带来一些麻烦。由于开发语言不断的增多,动态网页的类型也越来越多,如:asp、jsp、php等。这些类型的网页对于网络蜘蛛来说,可能还稍微容易一些。网络蜘蛛比较难于处理的是一些脚本语言(如VBScript和javascript)生成的网页,如果要完善的处理好这些网页,网络蜘蛛需要有自己的脚本解释程序。对于许多数据是放在数据库的网站,需要通过本网站的数据库搜索才能获得信息,这些给网络蜘蛛的抓取带来很大的困难。对于这类网站,如果网站设计者希望这些数据能被搜索引擎搜索,则需要提供一种可以遍历整个数据库内容的方法。
对于网页内容的提取,一直是网络蜘蛛中重要的技术。整个系统一般采用插件的形式,通过一个插件管理服务程序,遇到不同格式的网页采用不同的插件处理。这种方式的好处在于扩充性好,以后每发现一种新的类型,就可以把其处理方式做成一个插件补充到插件管理服务程序之中。
2.4.4.更新周期
由于网站的内容经常在变化,因此网络蜘蛛也需不断的更新其抓取网页的内容,这就需要网络蜘蛛按照一定的周期去扫描网站,查看哪些页面是需要更新的页面,哪些页面是新增页面,哪些页面是已经过期的死链接。
搜索引擎的更新周期对搜索引擎搜索的查全率有很大影响。如果更新周期太长,则总会有一部分新生成的网页搜索不到;周期过短,技术实现会有一定难度,而且会对带宽、服务器的资源都有浪费。搜索引擎的网络蜘蛛并不是所有的网站都采用同一个周期进行更新,对于一些重要的更新量大的网站,更新的周期短,如有些新闻网站,几个小时就更新一次;相反对于一些不重要的网站,更新的周期就长,可能一两个月才更新一次。
一般来说,网络蜘蛛在更新网站内容的时候,不用把网站网页重新抓取一遍,对于大部分的网页,只需要判断网页的属性(主要是日期),把得到的属性和上次抓取的属性相比较,如果一样则不用更新。
3. 搜索引擎的种类及其区别
3.1.全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
3.2.目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
3.3.元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
3.4.其他
除上述三大类引擎外,还有以下几种非主流形式:
3.4.1.集合式搜索引擎
如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
3.4.2.门户搜索引擎
如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3.4.3.免费链接列表(Free For All Links,简称FFA)
这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
4. 常见的搜索引擎及其特点
4.1. 百度搜索引擎
百度于1999年创建于美国硅谷,后回国发展。由于国内搜狐、新浪等国内著名门户网站曾经全面采用百度的搜索结果,使百度一夜成名,成为“最受欢迎的中文搜索引擎”和“全球最大的 中文搜索引擎”(百度自称),其数据库中存有3亿页网页。由于某些原因,国内门户网站又中断与百度的合作而转向新成立的中国搜索联盟。
客观上来说,百度搜索结果匹配度极高,很受网民欢迎,特别是它的MP3搜索功能。2001年9月,百度推出了类似Overture的“竞价排名服务”,市场反应强烈。目前已有 雅虎中国、Lycos中国、263、、21CN、、上海热线、广州视窗、福建在线、等门户网站加入了百度竞价排名阵营。
4.1.1. 百度搜索引擎介绍
百度(网址为www.),号称全球最大中文搜索引擎。百度于1999年底由李彦宏及徐勇创建于美国硅谷。2000年,百度回国发展。专门为国人提供中文搜索服务,其搜索结果同时被各大中文门户网站采用。
百度拥有庞大的服务器群,储存近3亿的中文网页。百度搜索引擎使用“超链分析”技术,使越受欢迎的网站排名越靠前。
4.1.2. 百度排名(免费百度搜索引擎排名)
免费的百度搜索引擎排名(推广型网站之后的排名)与Google排名(即Google中文搜索结果)类似,是按网页(或网站)与所搜索的关键词匹配度来决定的。所以,较高的百度排名也可以通过搜索引擎优化手段来实现。一般说来,在Google搜索引擎排名结果中靠前的网站在百度排名中也较靠前。
4.2. Google搜索引擎
4.2.1.Google搜索引擎介绍
Google成立于1997年,公司位于美国加州,只有1000多位雇员,却有20000多台服务器,储存40多亿网页,每天提供近2亿次搜索结果。Google起名自Googol,即数学中1之后加10个零这个数--10,000,000,000,即非常大的一个数。 Google被公认为全球最大的搜索引擎,而且它在全球各种语言市场几乎都是第一。Google的成功是一个奇迹,就像当年微软和戴尔电脑的崛起一样。由于搜索结果多而全,而且匹配度及高,Google成立数年后,其搜索结果就被美国在线、雅虎和网景等著名门户网站采用。在随后的很长一段时间,雅虎搜索引擎排名结果都是来自于Google,直到2003年。现在的新浪搜索引擎排名结果也是出自于Google中文搜索。
4.2.2.Google搜索引擎排名(Google左侧排名)
Google搜索引擎排名(即Google左侧排名)与Google右侧广告完全不一样,它不是按出价来排名的。相反,它是按网页(或网站)与所搜索的关键词匹配度来决定的。所以,要获得较高的Google排名可以通过搜索引擎优化手段来实现。一般说来,在Google搜索引擎排名结果中靠前的网站在其它搜索引擎排名中也较靠前。Google搜索引擎排名服务>>
4.2.3.Google搜索引擎登录
要获得较高的或者甚至是很低的Google排名,你的网站或者网页必须被Google收录。你可以到Google搜索引擎登录你的网站,完全免费,而且只需登录你网站的首页,Google搜索引擎会主动搜索其他网页。当然,如果你的某些网页是单独的网页,即必须手工登录。
另外,为使搜索结果更加丰富,Google的“蜘蛛”也经常自动浏览互联网,随时收录新的网站、网页或者更新的网页。所以你不必担心自己的网站是否会被Google收录。
4.3. 中国搜索联盟(慧聪搜索引擎)
中国搜索联盟成立于2002年9月,由中国互联网新闻中心、慧聪国际共同发起的一个以搜索引擎应用为核心的开放型联合体,联盟号召各成员网站使用共同的搜索引擎,通过搜索引擎技术应用寻求共同有效的经营模式,整合优势资源真正实现资源共通共享,进而推动各成员的网站发展。
经过半年多的发展,中国搜索联盟已经逐步发展壮大,成员包括中国网、新华网、国际在线、中国日报网、中青网、中国广播网在内的国家级新闻网站,千龙网、东方网、南方网、北方网、红网、四川新闻网在内的国内顶级区域门户网站,263等商业网站以及20家慧聪资深行业网站,并与新浪网、3721和全国近200家信息港结成紧密的战略性合作关系,成为目前国内最大的“搜索引擎服务平台”。
4.4. 雅虎搜索引擎
4.4.1.雅虎搜索引擎(Yahoo搜索)介绍
Yahoo是全世界网络流量最大的网站,也是最早的门户网站。后来的大部分门户网站都是参照它的模式建立和经营,就连提供的网络广告形式都在拷贝它的。雅虎中国是美国雅虎(Yahoo!)公司在中国的分支机构。可以这么说,雅虎在美国以外的品牌经营主要得益于雅虎在美国的成功。许多人认知雅虎大都通过媒体为雅虎公司的报道。在中国,雅虎是那些“层次较高”的人第一青睐的门户网站。由于雅虎提供的稳定的免费邮箱、独一无二的反垃圾技术以及较为整洁的页面,是许多人一直忠于雅虎。
雅虎搜索的默认结果为其自己的搜索结果,用户来可以选择“目录”一栏,看到其目录下的网站排名。
4.4.2.雅虎搜索引擎登录
雅虎中国目前提供免费的搜索引擎登录服务,用户根据自己的网站内容选择相应的目录提交自己的网站。但是否会被收录,多长时间以后才会被雅虎搜索,谁也无从得知。
4.4.3.雅虎排名(免费雅虎搜索引擎排名)
免费的雅虎搜索引擎排名与Google排名不一样。雅虎采用的是自己的搜索技术,其排名规则与Google排名规则也有不小区别。相对说来,Google比雅虎更关注外部链接,即越多的网站连接到到某个网站上,该网站的排名就可能越高。这一点在雅虎搜索引擎中则体现得不够明显。此外,雅虎搜索引擎对作弊行为(Spam)还没有成熟的惩罚技术,所以还有不少人敢于利用网站优化技术来“愚弄”雅虎搜索引擎。
最近几年,雅虎收购了包括Inktomi, Overture, AltaVista和AllTheWeb等多家搜索引擎。但雅虎目前使用的搜索不是其中的任何一家提供的,而是雅虎本身正在开发的全新的搜索技术。
4.5. 搜狐搜索引擎
严格说来,搜狐是个目录,也是国内最早的门户网站之一。搜狐的默认搜索结果为其本身目录收集的网站排序。商业性网站现在需要付费登录:推广型登录费用为每年2500元,普通型登录费用为每年360元。目前除学校、科研机构、政府单位等 非营利性的网站仍实行免费登录外,其他网站登录均须付费才能收录。
搜狐的网页搜索结果来自中国搜索联盟。
4.6. 新浪搜索引擎
新浪也是目录,是迄今为止年收入最大、浏览量最的中文门户网站。同样,商业性网站需要付费才能登录:2500元(推广型)或500元(快速登录)。
新浪的网页搜索结果来自于Google中文搜索引擎。
4.7.MSN
MSN 录属于微软 公司。MSN提供的Hotmail和MSN Message极受欢迎。但MSN没有自己的搜索引擎,一直采用其他搜索引擎的结果。比如,MSN主要搜索结果来自于Inktomi,竞价广告原由LookSmart提供,但于2004年初改由Overture提供。有证据表明,MSN正在开发一种叫做"MSN Bot"的自己的搜索引擎 >> 更多
4.8.AOL
AOL 即美国在线,是美国也是世界上最早的门户网站之一,几年前已与时代公司合并,成为美国在线-时代华纳公司。AOL目前的主营业务是ISP。其搜索结果 全部来自于Google 提供。也就是说,有良好的Google排名也有良好的AOL排名。
4.9.Lycos
西班牙公司,全称为Terry Lycos,是全世界最早的搜索引擎之一。但目前,Lycos已放弃自己开发的搜索技术,而主要搜索结果来自于Alltheweb。另外,其竞价排名结果来自于Google的右侧广告。
4.10.Ask Jeeves
规模不大,但很有特色的搜索搜索。Ask是DirectHit的母公司,于2001年收购Teoma搜索引擎,并全部采用其搜索结果。奇怪的是,Ask的竞价排名结果却仍然来自于Google的右侧广告。
Overture 最早的付费搜索引擎(竞价排名搜索引擎)。搜索结果被Yahoo, MSN等采用。Overture收购了Google的对手Inktomi后被Yahoo收购,是Google AdWords目前最大的竞争对手。 如何在Overture做竞价排名广告
4.11.Netscape
即网景公司,Netscape最初被广大用户认知是因为它的Netscape浏览器。但网景公司研发的浏览器现在几乎完全被微软的Internet Explorer浏览器逐出市场。只有少数的网民(不使用微软操作系统的)使用Netscape浏览器。Netscape的搜索结果 全部来自于Google. 另外,全世界最大的开放式目录DMOZ录属于网景公司。
4.12.AltaVista
全世界最古老的搜索引擎之一,中国网民很难访问。该搜索引擎已于2003年被Yahoo收购。同时被Yahoo收购的还有AllTheWeb。 微迪认为,AltaVista不久可能销声匿迹,因为Yahoo并没有采用AltaVista、Alltheweb或者Inktomi的搜索结果,而是重新开发全新的搜索技术。
4.13.Inktomi
Inktomi 不向终端用户开放,只对搜索引擎提供搜索结果。于2003年被Overture收购(Overture后又被Yahoo收购)。在2004年Yahoo开发自己全新的搜索引擎技术之前,Inktomi还是全球第二大搜索引擎,其搜索结果被Hotbot, MSN等著名的网站采用。
5. 常用的搜索技巧
5.1.Google搜索技巧
注意:文中[]符号是为了突出关键词,在实际搜索中是不包含的;本文采用的是意译;本译文已经征得作者许可;本译文可任意转载,请保留本文的头信息
1. 双引号可以用减号代替,比如搜索["like this"]与搜索[like-this]是一个效果
2. Google不会处理一些特殊的字符,比如[#](几年前还不行,现在可以了,比如搜索[c#]已经可以搜到相应的结果),但是还有一些字符它不认识,比如搜索[t.]、[t-]与[t^]的结果是一样的
3. Google充许一次搜索最多32个关键词
4. 在单词前加~符号可以搜索同义词,比如你想搜索[house],同时也想找[home],你就可以搜索[~house]
5. 如果想得到Google索引页面的总数,可以搜索[* *]
6. Google可以指定数字范围搜索。搜索[2001..2005]相当于搜索含有2001、2002直到2005的任意一个数的网页
7. 搜索[define:css]相当于搜索css的定义,这招对想学习知识的人很有效;也可以用[what is css]搜索;对中文来说,也可以用[什么是css]之类的
8. Google有一定的人工智能,可以识别一些简单的短语如[whenwas Einstein born ]或[einstein birthday]
9. 通过[link:]语法,可以寻找含有某个链接的网页,比如[link:blog.outer-]将找到包括指向 blog.outer-超级链接的网页(最新的Google Blog Search也支持这个语法),但是Google并不会给出所有的包含此链接的网页,因为它要保证pagerank算法不被反向工程(呵呵,可以参见那两个Google创始人关于pagerank的论文,可下载)
10. 如果在搜索的关键词的最后输入[why ],就会在结果中出现链接到Google Answers的链接http://answers. ,在里面可以进行有偿提问
11. 现在出现了一种兴趣活动,叫做Google Hacking,其内容是使用Google搜索一些特定的关键词,以便找到有漏洞的、易被黑客攻击的站点。这个网站列出了这些关键词:Google Hacking Database( http://johnny./index....ule=prodreviews )
12. 在Google 中输入一组关键词时,默认是“与”搜索,就是搜索包含有所有关键词的网页。如果要“或”搜索,可以使用大写的[OR]或 [|],使用时要与关键词之间留有空格。比如搜索关键词[Hamlet (pizza | coke)],是让Google搜索页面中或页面链接描述中含有Hamlet,并含有pizza与coke两个关键词中任意一个的网页。
13. 并非所有的Google服务都支持相同的语法,比如在Google Group中支持 [insubject:test]之类的主题搜索。可以通过高级搜索来摸索这些关键词的用法:进入高级搜索之后设置搜索选项,然后观察关键字输入窗口中的关键字的变化
14. 有时候Google懂得一些自然语言,比如搜索关键词[goog], [weather new york, ny], [new york ny]或[war of the worlds],此时Google会在搜索结果前显示出一个被业内称为“onebox”的结果,试试看吧!
15. 并非所有的Google都是相同的,它因国家版本(或是说语言版本)而异。在US版下,搜索[site:stormfront.org]会有成千上万的结果,而在德语版下,搜索[site:stormfront.org]的结果,嗯,自己看吧。Google的确与各国政府有内容审查协议,比如德国版,法国版(网页搜索),中国版Google新闻
16. 有时候Google会提示你搜索结果很烂,比如你搜索关键词[jew]试试,Google会告诉你它给出的搜索结果很烂,然后给你一个解释:http://www./explanation.html
17. 以前,搜索某些关键词如[work at Google] 时会看到Google给自己打的广告。可以去http://www./jobs/了解Google的工作
18. 对于一些“Googlebombed”(大概意思是指Google搜索的结果出问题了)的关键词,会有一个广告链接到:http: //googleblog./2005/09/googlebombing-failure.html (中国大陆需要代理才能访问)。比如搜索[failure],第一条是美国布什总统介绍
19. 虽然现在Google还没有支持自然语言,但这里有一段录像显示了支持自然语言的搜索引擎的使用效果:http://blog.outer-/videos/googlebrain.wmv
20. 有人说在Google中搜索[president of the internet],其结第一条表明了president of the internet是谁,我也是这么认为的,而且你还可以使用这个logo支持本文作者:http://blog.outer- /files/president.gif
21. Google现在不再有“stop words”(被强制忽略的关键词),比如搜索 [to be or not to be], Google返回的结果中间还列有相关的完整短语搜索结果
22. 在Google 计算器(http://www./help/features.html#calculator )中有个彩蛋:输入[what is the answer to life, the universe and everything ]时,会返回42。(关键词翻译过来的意思是指“生命、宇宙和一切的答案”,这是一个著名科幻小说中的情节,详情参见http: //en.wikipedia.org/wiki/The_Answer_to_Life,_the_Universe, _and_Everything)。试试吧,哈哈
23. 你可以在搜索时使用通配符[*],这在搜索诗词时特别有效。比如你可以搜一下["love you twice as much * oh love * *"] 试试
24. 同样,你的关键词可以全部都是通配符,比如搜索["* * * * * * *"]
25. www.是在输错网址后的结果,也是个搜索网站,但搜索结果与Google完全不同。而且此网站也赚Google的钱,因为它使用Google AdSense
26. 如果你想把搜索结果限制在大学的网站之中,可以使用[site:.edu]关键词,比如[c-tutorial site:.edu],这样可以只搜索以edu结尾的网站。你也可以使用Google Scholar来达到这个目的。也可以使用[site:.de]或[site:.it]来搜索某个特定国家的网站12. 在Google 中输入一组关键词时,默认是“与”搜索,就是搜索包含有所有关键词的网页。如果要“或”搜索,可以使用大写的[OR]或 [|],使用时要与关键词之间留有空格。比如搜索关键词[Hamlet (pizza | coke)],是让Google搜索页面中或页面链接描述中含有Hamlet,并含有pizza与coke两个关键词中任意一个的网页。
5.2.搜索关键词提炼
众所周知,要在搜索引擎上搜索信息首先必须输入关键词,所以说关键词是一切事情的开始。大部分情况下找不到所需的信息是因为在关键词选择方向上发生了偏移,学会从复杂搜索意图中提炼出最具代表性和指示性的关键词对提高搜索效率至关重要,这方面的技巧(或者说经验)是所有其他搜索技巧的基础。
选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子里要形成一个比较清晰概念,即我要找的到底是什么?是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位你要找的东西,而且多数时候你根本不需要用到其他更复杂的搜索技巧。
关键词的选择有时还是需要动一番脑筋的,难就难在如何找到某一类Web文档的关键特点。下面提供大家一个小测验,看看你的主题归纳和特性定位方面做得怎么样?
比如你是玩具(Toys)生产商,想将网站提交到有玩具分类列表的行业门户网站,但你并不知道网上都有哪些站点接受此类网站登录。当然,你首先会想到利用搜索引擎查找,而此时关键词的选择就显得非常重要了。建议大家先不要看下面的解答,先不妨到搜索引擎上试试(提议用英文搜),看看能不能精确且迅速地找到目标。
好了,现在我们就对这次的搜索任务作一下分析。
我们要找与玩具有关的网站,作为商品的一大门类,“玩具”当然就是这类信息的共性。那么接受网址登录的网站会有什么区别于其他相关站点的特性呢?答案是它们的网页中一般会有“添加网址”(addurl或add url)的字样。看到这里大家也许恍然大悟,原来如此!是的,关键词提炼有时就象脑筋急转弯。最后我们确定搜索条件为:
toys addurl(或add url)
在上述例子中,信息共性的定位是很自然的事,不存在什么障碍,而特性的发掘就需要一点创造性的思维。这在一开始可能有点摸不着方向,但当大家了解了这种思考方法,再加上平常搜索时的多次实践,搜索关键词的提炼最终会成为你下意识的一种反应。
5.3. 细 化 搜 索 条 件
你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。
比方说你想查找有关电脑冒险游戏方面的资料,输入game是无济于事的。computer game范围就小一些,当然最好是敲入computer adventure game,返回的结果会精确得多。
有时你甚至可以问搜索引擎一个问题,返回结果的准确度会让你不得不佩服搜索引擎功能的强大。
一次,我们想查找有关根据IP地址判断访问来源方面的资料,由于知道以“IP address”搜索没用,加上搜索条件比较复杂,无法以单个的词或词组查询,因此我们干脆在Google搜索引擎中输入了整句话:
■ How to recognize a visit from its IP address
结果在返回的网页链接中,第一个就是我们需要的。该网站不仅提供根据IP进行访问来源查询,还用虚拟现实(Virtual Reality)技术在地图上指出来源所在的城市!
可以看出将搜索条件细化,能够大幅提高你的搜索效率。
由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入"电脑游戏 冒险",而不是"电脑冒险游戏"。
此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略。
5.4.用好搜索逻辑命令
搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度。比较一下下面各搜索条件的含义:
■ computer adventure game
最基本的搜索方式。查找与该关键词有关的记录,在过去通常情况下相当于布尔逻辑命令中“OR”的关系,翻译过来就是:
computer (OR)adventure(OR)games
因此搜索结果中不仅有同时包含三个关键字的记录,也有仅含部分关键字串(如 computer games)和个别关键字(如computer)的记录。目前搜索引擎的趋势是默认匹配全部关键词搜索,即仅返回包含所有关键词的记录,相当于下面将介绍的“+”号和AND的关系,当然有时也有例外。
■ +computer +adventure +game
相当于布尔逻辑命令中的“AND”关系,翻译过来就是:
computer(AND)adventure(AND)games
因此搜索结果中只列出同时包含三个关键字的记录。在搜索条件中使用“+”号还可强制搜索引擎将一些停用词当作关键词进行搜索。比如我们搜索“who am i”时,其中“who”和“i”是停用词,我们可以在两个单词前加上“+”号强制对其进行搜索,此时的搜索条件即可为:+who +am +i。
■ +computer +game -adventure
翻译过来就是:
computer(AND)game(NOT)adventure
列出所有包含computer game的记录,但在其中排除有关adventure的记录。
综上所述,“+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容。
5.5.精 确 匹 配 搜 索
除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英文字符。虽然现在一些搜索引擎已支持中文标点符号,但顾及到其他引擎,最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。如:
■ "computer adventure games"
它与 +computer +adventure +games 的区别是:
虽然后者限定网页中要同时包含三个关键字,但其顺序和相邻位置允许是任意的。而前者不仅要求网页中必须同时包含三个关键字,关键字的顺序也要求完全相同,并且它们必须还是挨在一起的,所以带“”号的查询范围更小。
此外使用“”号进行精确匹配查询还可用于达到我们特殊的搜索目的。比如一般情况下“who”、“i”作为停用词被搜索引擎忽略,但有时在搜索特别类型的信息时又必须包含这些停用词(如搜索影片名称“Who Am I”),这时我们就可以将全部关键词用“”号引起来,就可以强制搜索引擎将停用词作为短语的一部分进行搜索。
通过对上面这些逻辑符号的组合,能组成复杂的搜索条件,如"computer game" -adventure +new等等,从而使查询结果更加准确。
5.6.特 殊 搜 索 命 令
对普通用户而言,熟练掌握前面介绍的几种搜索技巧就已经足够了。但有时我们难免会有一些特殊的需求,而搜索引擎也支持一些特殊的搜索命令,以方便我们精确定位所需信息。
■ 标题搜索
多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在Yahoo中是“t:”(注意冒号为英文字符且后面不跟空格)。在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。请看下面的例子:
· title(或t):computer adventure games
· title:+computer +adventure +games
· title:+computer +games -adventure
· title:"computer adventure games"
返回的结果都是标题中包含关键字、词的信息条目。
■ 网站搜索
此外我们还可以针对网站进行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。如想查找AAA游戏制作公司网站的所有网页,可以输入:
· site(或host/url/domain):www.
还可以在其中加入其他命令组成复杂的搜索条件,如:
· site:www. +title:"computer games" -adventure
意思是查找AAA公司网站中所有标题里含有computer games的网页,但排除关于冒险游戏的网页。
说到这里大家可能已经意识到了,运用此命令我们可以达到一个极其重要的目的,就是检查我们的网站被索引的网页有多少。因此建议大家牢记这个命令。另外运用“site/host/url/domain”等搜索命令还可实现某一网站的站内搜索。比如Google引擎由于技术的先进性,通过其“site”命令实现的网站内部搜索甚至比专门的站内搜索程序还要好。
■ 链接搜索
在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inbound links)。如:
· link:www.
其他一些引擎也有同样的功能,只不过命令格式稍有区别。你可以用这个命令来查看是谁以及有多少网站与你做了链接。
除上述命令外,还有其他一些特殊搜索命令,如“filetype:”(限定搜索的文档类别)、“daterange:”(限定搜索的时间范围)、“phonebook:”(查询电话)等等,感兴趣的话大家可以自己研究一下。Google引擎提供了比较完备的搜索功能,具体可参考Google从入门到精通专题介绍。
5.7.附 加 搜 索 功 能
为方便查询信息,各搜索引擎还提供了其他一些附加搜索功能(部分可在搜索引擎的高级搜索Advanced Search页面中选择)。比如:
■ 单词衍生形态查询
当输入“thought”时,如果选择了此功能,搜索引擎除以“thought”为条件搜索外,还会以“think”、“thinking”等同词根的词进行查询。
■ 网页快照(Snap Shot)
直接从引擎数据库缓存(Cache)中调出该网页的存档文件,方便用户在预览网页内容后决定是否访问该网站,或是在对应网页发生变动时查看原始页面。通常缓存中保存的是网页的文字部分,图象等多媒体元素还是要实时从对应的网站上下载。与其他附加功能相比,“网页快照”还是相当实用的。
与网页快照相类似的还有一种“网页预览”功能(如WiseNut引擎的“Sneek-a-Peek”),当用户选择此功能时,将在该条目下方打开一个窗口下载并显示对应的网页内容。
■ 网站内部查询
当你找到某个网页,搜索引擎提供查询该网站其他页面的功能。类似“site:”、“host:”等命令。
■ 横向相关查询
当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其他网页的功能(不限于同一网站)。一般是在信息条目后面给出“Similar Pages”或“More results like this”链接。
■ 概念延伸查询
以某个关键词查询时,搜索引擎列出相关领域的其他搜索条件供你选择。比如输入“furniture”,它会列出“outdoor furniture”、“patio furniture”、“office furniture”等相关的信息类别供查询。
除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新闻搜索、图象搜索、新闻组搜索、Flash搜索等等不一而足。搜索引擎的初衷是好的,都是为了方便用户,至于哪些有用哪些没用则完全看个人喜好。以我们的观点,搜索引擎毕竟只是我们信息查询的一种工具,除非你想成为信息搜索专家,否则掌握基本的搜索技能并将之巧加运用就足以应付我们日常的需要了。
5.8. 网上搜索的加速方法
网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案?有几种技术可以使得更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙的结合使用会大大加快网页搜索进程。几乎所有流行的搜索引擎都提供按词组搜索的功能,按词组搜索是一种在浩瀚的网页搜索相关网页的最佳技术。
■ 1.词组搜索
如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组)”的网页。
下面举一个例子,一个人要查找惠普的MPE/ix操作系统的命令清单,他可能在Altavista站点只输入“MPE/ix”这个词,那么他可能会发现有2400个匹配网页;如果在填写搜索条件时写了“MPE/ix”和“Commands”两个词并用AND(与逻辑)结合起来,那么满足条件的可能是450个网页;如果在搜索条件上输入“MPE/ix Commands”,那么只有15条记录匹配,其中包括爱荷达州立大学计算与通信管理用户指南,其中对MPE/ix系统命令有详细的描述
■ 2.词组选择
一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及到如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能凑效,尤其是在Altavista这个站点上,因为它采用了“Ask Jeeves”引擎技术,该技术就常见问题给出预置的答案。
在Altavista上输入“ Why is the sky blue(为什么天是蓝的)",就会在“Ask Jeeves"部分找到答案,并给出若干网页回答这个问题。然而简单明了的提问方法只对一部分搜索奏效。其他词组也可以作为搜索条件,尤其这些词组中有一个词十分独特或者该词组是几个词独特的组合。试一试用人名、产品名、甚至是嵌入程序中的字符串去搜索。
■ 3.巧妙利用错误信息
将全部或部分错误信息作为词组进行搜索。当夏时制时间变化时,Netscape Navigator (浏览器)会产生一条错误信息,该信息包含词组“book marks have changed on disk(磁盘书签已变动)”。在Northern light 或HotBot 站点上输入该词组,就会找到对该问题的解释以及如何处理。
DejaNews和新闻组文档经常发现一些问题很难甚至不能通过搜索引擎找到答案。由于新闻组更关注讨论而网页相对来说变更较少,DejaNews新闻组文档或许是一个较快的信息源。不幸的是,DejaNews 不能总是充分地处理词组引擎。尽管它遵守常规的语法,但是它的搜索引擎是处理器密集式的,而且经常只给出与搜索词组匹配的部分结果。有鉴于此,在DejaNews上搜索时最好直接键入词组不要加引号,并希望包含该词组的记录出现在前面。有些搜索引擎在处理词组时出人意料——忽略句号,搜索该词的其它形式,漏掉空格等等,但是在DejaNews中的处理过程中不存在。
■ 4.直接到信息源查找
有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的站点。如果猜不中,那么到Yahoo去,或用搜索引擎。
例如,要找Dell公司现有附件的说明书,直接去该站点www.,想知道Oracle公司有什么新闻,试一试www.,然后再去新闻栏看一看。人们在搜索引擎中得到很多无用信息,却忘了试一试该方法。这种技术还可用于其他搜索目的,并不一定与公司有关。政府机构、职业协会、教育机构也可以提供很好的信息资源。有关人口统计请去www.census.gov,还能去www.acm.org看看最近的会议清单。
6. 搜索引擎的评价及参数
常 用 搜 索 引 擎 一 览 表
国外搜索引擎:搜索目标(英文)搜索引擎/目录索引一般资料Google资料涉及非常冷僻的领域AllTheWeb特殊资料(其他主要引擎都查不到时)InfoSeek/WebCrawler/Vivisimo等多元引擎 产品或服务Yahoo/Overture*
国内搜索引擎:搜索目标(中文)搜索引擎/目录索引一般资料Google古汉语(诗词)类资料百度(个案显示这方面百度有独到之处) 产品或服务搜狐、新浪(质量较高)/网易(较全)
AltaVista
网址:http://www.altavista.
AltaVista是由DEC公司开发的因特网上一个较早也曾经是最著名的一个搜索引擎,它以巨大的库容量和极快的响应速度为用户提供强有力的网络检索服务。
AltaVista最主要的特点还是因为它继续保留着世界上最大库容量搜索引擎的荣誉,同时它的响应速度恐怕也是最快的。AltaVista支持简单和高级查询,在高级查询中,AltaVista提供了丰富的逻辑查询支持,支持常用的布尔运算符、嵌套、近似搜索等,它还提供日期限定,字段限定(如只查询URL,查询某种语言的页面,查询标题等等)等扩展功能,进一步提高用户的查准率。
AltaVista另一个相当有特色的功能是能够根据用户的检索结果,自动地生成一份关键词表,用户可以籍此选择自己所需或不需要的关键词,以此来提高查询的命中率,使用户不再对一般检索式所返回的大量检索结果感到无所适从。
特别值得一提的是,九八年五月AltaVista推出了它的中文检索服务。
HotBot
网址:http://www.
HotBot也是一个非常优秀的搜索引擎,它获得了美国《个人电脑》杂志及许多媒体的奖项。HotBot最大的特点在于它的界面组织和丰富的检索功能。它除了能够检索WEB页面之外,还提供域名检索、新闻搜索、新闻讨论组等等检索服务。
HotBot在页面上提供了直观的图形化检索菜单功能,用户可以通过简单的下拉菜单创建复杂的布尔查询,或者按日期、地理区域和媒体类型进行限制性搜索。
在结果显示时,HotBot会列出标题、摘要、相应的打分、文件大小、日期和网址,但是其结果显示不能任意进行前后跳转,这对于用户评估大的检索结果集是相当的不方便。
Yahoo
网址:http://www.
与前两个介绍的搜索引擎不同,Yahoo是属于另一类的搜索引擎。前两者是自由词搜索引擎(国外称之为索引搜索引擎Indexing),而Yahoo则属于分类搜索引擎(国外称之为目录服务DirectorService)。
和AltaVista与HotBot不同的是,Yahoo并不是单纯地提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成),以一个分层的线性目录来为用户提供按图索骥式的服务。相对于AltaVista与HotBot比较适合于检索较专业的查询来讲,Yahoo则比较适合于一般的查询。Yahoo不仅能在所有的分类类目中进行查询,也能根据需要在一个类目中进行查询,这样就保证了较高的查准率。Yahoo由人工索引的分类数据库也保证了库内数据质量较高,冗余信息较少的优点。如果用户的检索词在Yahoo中查询不到结果,Yahoo还会自动地将查询较交给AltaVista,由后者来为用户作进一步的检索。对于一个初涉因特网的用户来讲,Yahoo精致的分类目录也起到了极好的浏览导游作用。
当然由于Yahoo的分类库是由人工维护的,也不提供全文关键词检索服务,因此对于较为专业偏僻的查询很难提供满意的结果。]
Excite
网址:http://www.
Excite虽然是与AltaVista及HotBot相似的搜索引擎,但它最有特色的恐怕就是它的概念搜索了。
Excite首先将你的检索式字词按字义进行自动扩展或加以限定,然后根据处理过的检索式再到库中进行检索,对于一般概念的检索来讲,这种方法很有帮助。并且它很提供了相似检索(MoreLikeThis)的扩展功能,使用户能根据反馈的检索结果来做进一步的查询。
但是Excite的这种技术非常复杂,对于复杂及专业的查询效果也不好,同时由于中文与英文处理的不同,这一想法值得中文搜索引擎借鉴,但却不可能照搬。
Excite较有特色的部分还有在页面上提供财经新闻等,并允许用户定制网页。
ChinaByteCSEEK
CSEEK的检索功能非常强劲,除了国外的搜索引擎,它可能是我们评价的中文搜索引擎中检索功能最强的一个,因为它使用的搜索引擎核心是非常成熟的商用软件verity。但正因为其功能强劲且有些复杂,要充分利用到其强劲的检索功能,用户必须详细阅读其帮助页面,这对于普通用户来说有些勉为其难。CSEEK的界面虽然也算清晰明了,但在其页面上缺乏对于其检索功能的简单描述或者是一些辅助选项按钮,不能不说是一个小小的缺憾。
作为一个新兴的中文搜索引擎,CSEEK的发展速度还是相当快。在今年五月上旬,我们初次考察这一搜索引擎时,其库内网页数28万页。而当七月上旬我们再一次考察这一搜索引擎时,其库内网页数已发展为近56万页。
象大多数的关键词搜索引擎一样,CSEEK也有一个分类库供用户查询,但此库显然是疏于管理,缺乏更新,每一个子类最多为30条网页。另外其结果显示中的网页摘要由于是由其搜索引擎按一定算法自动生成,虽然说有时比单纯引用前几行文字要更具有说明意义,但有时也使人莫名其妙。
网易
网易公司以其提供的一系列服务见长,如免费主页、免费EMAIL都在国内具有一定的影响。它的搜索引擎也是颇有特色,它先将用户的检索式在自己的分类库中进行查询,如果没有检索出结果,系统将自动将提问式转向全文数据库进行检索。如果在分类库中检索出结果,用户对检索结果不满意,可以直接按检索结果页面底部的全文检索按钮,继续在全文库中进行检索,这对于一个非专业用户来说是非常实用的一种检索策略。
另外,网易的分类库也是做得相当不错(其分类类目与方法大致上与哇塞相同),这比许多带分类库的关键词搜索引擎要好。网易的功能简单、使用方便,并且提供一定的模糊检索功能,这也是非常能吸引普通用户的功能。网易的界面清晰,反应及库容量也是可以接受的。
天网中英文搜索引擎
天网是由CERNET在北京大学设立的一个较优秀的中文搜索引擎,主要以CERNET的网页信息为主。作为国内自行开发的搜索引擎,具有一定的水准。它象很多国外的优秀搜索引擎一样,系统不仅提供WWW网页的查询,同时也提供对新闻组(Newsgroup)内容的查询。
天网将用户的检索式进行自动分词,然后进行检索,这一点和下面介绍的悠游搜索引擎是一样的。同时天网还提供模糊匹配检索模式,在模糊匹配中,系统不仅检出用户表达式中的关键词,并且将其同义词也一并检出。
天网还支持通过EMAIL的检索,即用户可将检索式通过EMAIL发送检索提问式,而天网搜索引擎通过EMAIL回送检索结果。同时天网还提供对ftp.pku.,ftp.lib.pku.,ftp.ncic.ac.cn,ftp.igd.等FTP服务器的FTP文件检索。
但作为位于北京大学的优秀站点,天网搜索引擎似乎经常受阻于网络交通或机器瓶颈,在正常工作时间内进行检索时,经常出现超时错误,这在一定程度上影响了它的实用性。另外也可能由于面向国际的缘故,天网的缺省主页面是英文页面,这也给国内的用户带来了小小的不便。
悠游中文搜索
较有影响的一个搜索引擎,充分体现了两岸三地的特色。它原先由美国、北京、重庆、香港四个网站组成,最近又增添了上海网站,同时台湾的网站也已推出。悠游每一个网站充分考虑到两岸三地的特点,所以每一个网站都有GB与BIG5两种页面,并且两个页面的内容还考虑到不同用户的需求而有所不同。同时各地网站主页面还有本地新闻等其他信息。各地网站还推出不同的服务内容等等。除了关键词检索功能而外,悠游也提供了一个简单而排版清晰(类似于Yahoo风格)的分类库。
除了网页搜索以外,悠游搜索引擎还提供了网址(URL)查询功能。
另外悠游搜索引擎很有特色的一点就是它能够将用户的检索式进行自动分词,然后再进行检索。因此用户在输入检索式的时候,可以按照自己的习惯直接输入,但有时用户键入一个长的检索式的话,常会检索出一大堆检索结果。
但是悠游搜索引擎在主页上未提供任何帮助信息,对于用户来说多有不便,用户只有在进入分类检索时才能找到一个帮助链接,但其帮助信息也写得较为简单,参考价值一般,搜索引擎本身也不支持什么逻辑检索的功能。
AltaVista中文搜索
关于AltaVista英文搜索引擎前文已介绍过了。它在今年五月,紧随Yahoo之后推出了中文搜索,不能不说其是认识到了中文搜索这一市场的重要性。由于AltaVista的实力和技术,所以它的中文搜索在库容量及响应速度令其他中文搜索引擎难以匹敌。但是也由于它的核心不是为非西文语种所准备的,所以它在推出中文搜索的时候也偷工减料不少,最主要的是不支持它的高级检索功能,不能运用其一些强劲的逻辑检索特性。另外它为了方便中文用户的使用,在中文检索的页面上做上一个光秃秃的中文输入条,而其他的提示与帮助又都是英文的,所以实际上也没给中文用户以多少方便。但是,不管它现在在支持中文搜索上还有这样那样的不足,并由于它一流的技术与硬件,我们认为它的推出是对其他中文搜索引擎极大的挑战。
搜狐
搜狐的主页也许就象它的名字,花哨而令人摸不着头脑。它的主页上提供了许多相关信息、广告等等,相对于它相当及时的新闻更新来说,它的库更新间隔就显得稍微慢了一些,同时库容量的限制也使其参考价值不大。
搜狐的分类库组织的更象一个精心组织的导航库,对于一个想在网上浏览的新手来手有一定参考价值。
在搜狐的主页上,我们同样找不到任何对检索有益的帮助信息,所以我们同样无从判断其对逻辑检索功能的支持等等。
搜狐输出结果不分页,如果用户的检索结果很长的话,那就会等来一个很长的页面,也许是搜狐一般不会返回一个很长的结果,所以这个问题也就很少成为问题了。
指南针
指南针的数据库主要以收集中国教育和科研计算机网(CERNET),ChinaNet,中国科技网(CSTNET),中国金桥网(ChinaGBN)等网络上的信息资源为主。
指南针很有特色的地方是它的多样化输入方式和多个分类体系。
指南针支持中文GB输入,中文BIG5码输入,英文翻译输入以及拼音输入,给用户在输入时提供了多样化的选择与方便。
它的分类体系有普通分类和学科分类两种,同时它还保留了它的旧版分类体系。它的上搜索引擎中是少有的,它将自己的分类库分成58个学科类目,供用户从学科角度来按图索骥。大大方便了相当一部分专业用户。
指南针目前第一要做的就是扩大库容,从一个区域性较强的中文搜索引擎转而成为面向整个中文网络信息的中文搜索引擎。
华好网景、四通利方、我是野虎、天涯若比邻
将上述四个搜索引擎放在一起评述,并不是因为它们有什么缘源关系,也不是因为它们有非常相似的特色,仅仅是因为相对于其他搜索引擎来讲对它们的评述较为困难。它们都是中文搜索引擎的后起之秀,水平也比较接近,没有什么突出的优点,也没有什么特别的缺点。也许是受限于人力、资金、技术等各方面的客观原因,它们的库都较小(野虎稍多一些),某种意义上讲它们更象导航站台,检索功能也比较简单,界面设计也比较一般,分类立意也没有什么特别之处。
在国外有许多小的搜索引擎,或是地区性的,或是专题性的,而国内走这条路的并不多,大家都在搞小而全,其实中文搜索引擎也可以走走这一条路,从一点出发然后逐渐走向全面,这也许是比较现实的策略。如果大家还是搞任何东西都是要上一起上的话,最后又囿于各方面条件限制,谁也不是搞的很好,长此以往对守住中文搜索引擎这个阵地并没有什么好处。
呀虎中文搜索
关于呀虎西文搜索引擎,前文已作了介绍,这里毋庸赘述。与AltaVista搜索引擎不同的是,呀虎中文搜索引擎大体上保留了原来的特色,并且根据中文的特点作了一些改进。比如,呀虎的一大特点是它精致的分类体系,呀虎中文保留了原来的主分类,而在细目上又根据中文的特点作了改动,重新规划分类,由于目前网上中文信息不是很多,因此中文分类比原来英文分类小很多,感觉上呀虎的库容量目前还太小,但仍不失精致实用的特色。
中文呀虎与原英文呀虎的界面基本一致,也保留了原有的许多特色。这多少令众多呀虎的拥趸者感到欣慰。
由于目前网上中文信息的特点,呀虎实际上是为GB与BIG5准备了两套人马,两套服务器。因为实时更新及地区特色上的原因,在GB与BIG5库中经常会有一些小小的差别。另外,呀虎中文搜索引擎的缺省中文域名指向BIG5的服务器(chinese.),而GB码的服务器域名为:gbchinese.
中文搜索引擎对照总表
名字1 URL 库记录数2 主页内码3 支持多内码4 更新间隔5 主页页面组织6
关键字搜索引擎
ChinaByte www. ( http: / / www. / ) 559902 GB Y 快 一般
网易 www. ( http: / / www. / ) 大量 GB -- 快 好
天网中英文搜索引擎 Pccms.pku.:8000 60万6千网页/9万6千新闻组文献 GB Y 快 一般
OMRON上海热线搜索器 Www.omron.online. ( http: / / www.omron.online. / ) 162006 GB -- 慢 一般
悠游中文搜索 www. ( http: / / www. / ) >40万 GB/BIG5 Y 快 一般
茉莉之窗 www.jansers.org 572206 EN(GB/BIG5) Y 慢 一般
盖世搜索引擎 Gais.cs.ccu.edu.tw 大量 BIG5 -- 快 一般
怪兽搜索 www..tw ( http: / / www..tw / ) 一般 BIG5 -- 慢 一般
搜神引擎 Www.sosoon.com.tw 一般 BIG5 -- 慢 好
Seednet 搜索引擎 Search..tw 一般 BIG5 -- 快 好
AltaVista中文搜索 Www.altavista. ( http: / / www.altavista. / ) 大量 EN(GB/BIG5) Y 快 一般
分类搜索引擎
搜狐 有限 GB Y 慢 一般
常青藤 有限 GB/BIG5 Y 慢 一般
指南针 .:8010 ≈20万页 GB -- 快 一般
华好网景 Www. 有限 GB Y 慢 一般
四通利方 Www./richsurf/ 有限 GB -- 慢 一般
我是野虎 Www. ( http: / / www. / ) 一般 GB -- 慢 一般
天涯若比邻 ( http: / / / ) 有限 GB -- 慢 一般
蕃薯藤中文搜索引擎 Search.yam.org.tw 一般 BIG5 -- 快 好
哇塞 Www. ( http: / / www. / ) 一般 BIG5 -- 快 好
呀虎中文搜索 Chinese. 大量 GB/BIG5 Y 快 好
中文搜索引擎逻辑检索功能对照表
名字 支持布尔检索 其他操作 通配符 操作符 禁用词 中文自动分词 支持二次检索 模糊检索
关键字搜索引擎
ChinaByte AND/OR/NOT
/ -- */ /'/"/ -- -- -- Y(通过词典操作符)
网易 (AND/OR/NOT) -- -- &/|/!/+/- Y -- -- Y
天网中英文搜索引擎 AND/OR -- -- -- -- Y Y Y
OMRON上海热线搜索器 AND/OR/NOT / -- */ /'/"/ -- -- -- Y(通过词典操作符)
悠游中文搜索 -- -- -- -- Y Y -- --
茉莉之窗 -- -- -- -- Y -- -- --
盖世搜索引擎 (AND/OR/NOT) -- -- &/|/!/+/- Y Y -- Y
怪兽搜索 (AND/OR) -- -- -- -- -- -- --
搜神引擎 -- -- -- -- -- -- -- Y
Seednet 搜索引擎 (AND/OR/NOT) NEAR * &/+/- Y -- Y --
AltaVista中文搜索 (AND/OR/NOT) NEAR * &/+/-/!/|/~ -- -- -- --
分类搜索引擎
搜狐 -- -- -- -- -- -- -- --
常青藤 (AND/OR) -- -- -- -- -- -- --
指南针 (AND/OR/NOT) -- -- +/- Y -- -- --
华好网景 (AND/OR/NOT) -- -- -- -- -- -- --
四通利方 -- -- -- -- -- -- -- --
我是野虎 (AND/OR) -- -- -- -- -- -- --
天涯若比邻 AND/OR -- -- -- -- -- -- --
蕃薯藤中文搜索引擎 (AND/OR) -- * +/- -- -- -- Y
哇塞 (AND/OR) -- -- -- -- -- -- --
呀虎中文搜索 (AND/OR/NOT) -- -- +/-/”” -- Y -- --
名字
记录数
“电脑”
“科学”
关键字搜索引擎
ChinaByte
559902
1000(受限)
1000(受限)
网易
--
27191
27846
天网中英文搜索引擎
60万6千网页/9万6千newsgroup文献
20000(受限)
20000
(受限)
OMRON上海热线搜索器
162006
200(受限)
200(受限)
悠游中文搜索
>40万
2000(受限)
2000(受限)
茉莉之窗
572206
2000(受限)
2000(受限)
盖世搜索引擎
--
36720
18260
怪兽搜索
--
2157
887
搜神引擎
--
4606
1077
Seednet搜索引擎
--
3661
1509
AltaVista中文搜索
--
122630
65260
分类搜索引擎
搜狐
--
1/292
12/295
常青藤
--
5/833
23/490
指南针
≈20万页
3604
8999
华好网景
--
无计数
无计数
四通利方
--
68
63
我是野虎
--
2007
81
天涯若比邻
--
73
81
蕃薯藤中文搜索引擎
--
2124
1279
哇塞
--
1000(受限)
1000(受限)
呀虎中文搜索
--
96/1437
59/375
7. 特色网站介绍
SOGUA
如果您要搜索中文的MP3歌曲,那么使用SOGUA将是明智的选择。
Sobit音乐搜索引擎
采用即时扫描网络资源,目前共有歌曲数据573363首,数据总容量1018.86G。
Google图像搜索
自称是互联网上最好用的图像搜索工具。
VisionNEXT
国内只有几家提供中文多媒体搜索引擎,它们基本上都是使用VisionNEXT公司的技术。
Yahoo寻人搜索引擎
如果您想网上寻人,可以考虑使用Yahoo提供的寻人搜索引擎。
Yahoo图像搜索引擎
Yahoo网站的工作人员收集整理的图像分类目录。
Lycos多媒体搜寻
在这个多媒体搜寻器上可以找到非常多的图像。
Excite多媒体搜索
与Lycos 及 Altavista 的比较,它搜寻出來的多是相片。
Who where
一个老牌的寻人网站,可以搜索电子邮件地址、电话与地址和公众信息。
Look4u
搜索全球华人。
Cnet Music
一次搜索,就能得到几个MP3搜索引擎在内的多个搜索引擎的搜索结果。
FAST
您可以同时搜索图像、音频、视频等多种格式的多媒体文件。
Stream Search
可以搜索到关于音乐、广播、电视、电影,甚至天气等各种专题的视音频文件。
SpeechBot 视音频搜索引擎
通过收集其他网站的多媒体文件,建立搜索数据库。
MIDI Explorer
如果您是一位音乐爱好者,想搜索一些MIDI文件。
8. 搜索引擎比较
Google 百度 新浪(爱问) 搜狐(搜狗) Yahoo
界面 简洁明朗,很有条理 简洁明朗,很有条理。有广告。 简洁,分类很细 简洁,分类很细。有广告。 简洁,分类细。工具较多。
速度 很快 很快 中 较慢 较慢
内容 较多 中 较多 较多 较少
准确率 还好,但排列得很乱。本是有用的信息却放得很靠后,反而无用的信息靠前。相关链接有点少。 并不很准,信息的排列顺序不太恰当。杂乱信息较多。 总体稍显凌乱。也存在排序不当的问题。一般吧。 信息准确,排序恰当。提供的链接较丰富。 很准确,极少有杂乱信息。排序恰当。且所提供的相关链接很丰富。
比如在搜索“巴赫无伴奏大提琴组曲”的时候,baidu,google所给出的链接重复较多,且与我想得到的关于这一组曲的信息基本无关,无非是广告或是无效链接,准确率不高。在搜狗和爱问中比较好,所给的连接也较多。而yahoo的信息太少。但在搜索“长城历史”的时候,yahoo的优势就明显地体现出来了。它的分类很有序,信息准而丰富,其他引擎则显得差一些。但google和baidu提供的资料总是很多(虽然重复得也多)。
9. 自己的心得体会
就我个人来说,在网络上搜索需要的信息是我获取信息的极为重要的一种手段。由于家里是拨号上网,速度通常很慢,所以我一般尽可能地选取速度较快的搜索引擎。而google不太稳定,校园网时常无法登陆google,所以我平时搜索是用百度。然而百度虽然提供的信息多,但准确率远远不够格,而且(不知道是不是又是校园网的问题)搜索到的网页能打开的不多。有时在做一些有专题的作业时我会去yahoo搜索,它给出的链接基本上都是我需要的。但yahoo不适宜搜索比较生僻的资料,只是在一般性的资料上很有优势。至于国外网站,一般校园网无法登陆。
这次的作业让我对搜索有了新的认识。无论是从历史,原理,分类,还是各个网站的特色,都有了更深入的了解,我想这些知识会对我以后的搜索有所帮助。通过Internet进行搜索是大家都会的,但真正熟练地运用这个工具却并非那么简单。这样系统而详实地整理一下,的确收获很大。以后会记得渐渐把这些理论的东西应用一下。
PAGE
182011届01班第一学期“信息技术基础”第01次课
信息及其特性(2008-09-09课,2008-09-15批改,08:35-08:53,16:45-18:14,19:41-20:52共用时2小时58分)
基本分内容 加分内容 总得分
姓名 学号 点名 发件人 主题 附件 文件名 文件类型 态度 呈现条理 技术应用 个人简介 信息理解 信息特性 希望 技术服务内容 创意 个人理解 笑脸 得分 上榜 老师的话
满分要求 16 5
白云歌 g1120101 WORD 13 4.1 个人简介信息量有些小;什么是物质运动的规律
步晓什 g1120102 WORD 13 4.1 信息是一种生活方式 是不是觉得不用搞清楚什么是信息
陈翀尧 g1120103 WORD 12 3.8 有关信息的概念是从网上来的吧
陈子聪 g1120104 WORD 15 4.7 不错,能够用自己的语言描述有关信息的概念和特性
邓扬清 g1120105 WORD 15 4.7 不错!音乐本身不是信息,其中包含着信息;个人简介太简单
傅 萌 g1120106 WORD 14 3.5 期待你的作业~;第二次提交了,内容不错,字太大
傅冰飞 g1120107 PPT 15 4.7 写的比较实在;有别字
高祖光 g1120108 WORD 16 5.0 好!不过你说的是信息的哪个特性呢
李世凯 g1120109 WORD 15 4.7 内容不错!但技术要这内容服务,太花了我看不清楚了
李天予 g1120110 PPT 15 4.7 事物≠信息
李玉龙 g1120111 WORD 13 4.1 感官器官感受不到的东西就不是信息了
卢 迪 g1120112 WORD 14 4.4 那么你认为信息究竟是什么呢
沈 达 g1120113 WORD 13 4.1 信息只来源于生活中的小事
沈剑飞 g1120114 WORD 11 3.4 写的太简介了,信息只是抽象
宋 畅 g1120115 PPT 16 5.0 我们的设备不够好
宋世瀚 g1120116 WORD 14 4.4 标上标号是不是更清楚些 特性是要求举例说明的
苏金棣 g1120117 WORD 15 4.7 不错,只是没有说对本课的希望
孙 放 g1120118 WORD 13 4.1 你说的是信息的什么特性
孙国超 g1120119 WORD 16 5.0 内容不错!技术还不能很好的为内容服务
孙若轩 g1120120 WORD 15 4.7 内容很好!但表达不够清晰,第2,3个问题放在一起了;
孙武元哲 g1120121 WORD 15 4.7 字太大,如果分段会更有条理一些
田雨朋 g1120122 网页 16 5.0 不错!但网页应该放在一个文件夹里,文件夹打包发过来
王恺峥 g1120123 WORD 16 5.0 表达清楚;但信息的特性没有举例
谢 越 g1120124 WORD 13 4.1 你说的是信息的什么特性
越 光 g1120125 WORD 15 4.7 说的很好,希望也很好!只是前面的基本功不够扎实
张东良 g1120126 WORD 17 5.3 上榜 说的不错!
张骁懿 g1120127 WORD 16 5.0 回答的不错!只是没有一个标题,技术上要扣分,怎么喜欢红色
张质祎 g1120128 WORD 16 5.0 去参加电脑俱乐部吧!就在教室旁边,找席老师
赵 步 g1120129 WORD 15 4.7 信息≠消息
赵墨渊 g1120130 0.0 期待你的作业~
赵子为 g1120131 WORD 15 4.7 不错,但特性没有举例
周 越 g1120132 PPT 15 4.7 特性如果能单独一页来讲就更好了
吕中驰 g1120161 WORD 15 4.7 你说的是信息的什么特性
程祎明 g1120133 WORD 15 4.7 你对信息接触的比较少 !你说的是信息的哪个特性呢
刘 岑 g1120134 WORD 17 5.3 上榜 在技术上把文章再修饰一下就更好了;至少标题要居中吧
田 园 g1120135 WORD 15 4.7 信息特性少实例
王 琦 g1120136 WORD 17 5.3 上榜 标题居中一下就好了
王苏凌 g1120137 PPT 17 4.3 期待你的作业~;第二次提交了,内容写的很好!
肖 娴 g1120138 WORD 15 4.7 个人简介写的不错!但信息不是平台也不是工具
叶桻丹 g1120139 WORD 16 5.0 不错!标题居中就更好了
易斯卿 g1120140 PPT 15 4.7 能够用自己的语言表达;怎么第一页上全是链接呢
张 弛 g1120141 PPT 16 5.0 信息≠消息
张博雅 g1120142 PPT 15 4.7 第3个问题你说的是信息的普遍性吗
周泽源 g1120143 WORD 17 5.3 上榜 挺好!
邱静窈 g1120162 WORD 15 3.8 期待你的作业~;第二次提交了,内容写的很好!
2011届01班第一学期“信息技术基础”第02次课
信息技术及其应用(2008-09-16课,2008-09-20批改,9:50-13:40,18:20-20:00,共用时5小时30分钟,包括批改补交作业)
基本分内容 加分内容 总得分
姓名 学号 点名 调查表 发件人 主题 附件 文件名 文件类型 态度 封面 文档结构 修饰效果 感测实例 通信实例 计算机 控制实例 案例1 未来畅想 实例 分析 技术 想像 个性 笑脸 得分 上榜 老师的话
满分要求 24 5
白云歌 g1120101 WORD 20 4.2 见批注
步晓什 g1120102 PPT 25 5.2 上榜 见批注
陈翀尧 g1120103 0.0 期待你的作业~
陈子聪 g1120104 WORD 21 4.4 见批注
邓扬清 g1120105 PPT 24 5.0 见批注
傅 萌 g1120106 0.0 期待你的作业~
傅冰飞 g1120107 WORD 21 4.4 见批注
高祖光 g1120108 网页 25 5.2 上榜 见批注
李世凯 g1120109 0.0 期待你的作业~
李天予 g1120110 WORD 26 5.4 上榜 见批注
李玉龙 g1120111 WORD 21 4.4 见批注
卢 迪 g1120112 0.0 期待你的作业~
沈 达 g1120113 WORD 18 3.8 见批注
沈剑飞 g1120114 PPT 24 5.0 见批注
宋 畅 g1120115 PPT 19 4.0 见批注
宋世瀚 g1120116 WORD 20 4.2 见批注
苏金棣 g1120117 WORD 21 4.4 见批注
孙 放 g1120118 WORD 24 5.0 见批注
孙国超 g1120119 PPT 25 5.2 上榜 见批注
孙若轩 g1120120 WORD 23 4.8 见批注
孙武元哲 g1120121 WORD 13 2.7 见批注
田雨朋 g1120122 PPT 24 5.0 见批注
王恺峥 g1120123 PPT 22 4.6 见批注
谢 越 g1120124 0.0 期待你的作业~
越 光 g1120125 WORD 24 5.0 见批注
张东良 g1120126 WORD 23 4.8 见批注
张骁懿 g1120127 PPT 20 4.2 见批注
张质祎 g1120128 0.0 期待你的作业~
赵 步 g1120129 PPT 22 4.6 见批注
赵墨渊 g1120130 WORD 23 4.8 见批注
赵子为 g1120131 WORD 23 4.8 见批注
周 越 g1120132 PPT 0.0 期待你的作业~
吕中驰 g1120161 WORD 23 4.8 见批注
程祎明 g1120133 PPT 25 5.2 上榜 见批注
刘 岑 g1120134 WORD 24 5.0 见批注
田 园 g1120135 WORD 23 4.8 见批注
王 琦 g1120136 WORD 25 5.2 上榜 见批注
王苏凌 g1120137 PPT 24 5.0 见批注
肖 娴 g1120138 网页 26 5.4 上榜 见批注
叶桻丹 g1120139 WORD 23 4.8 见批注
易斯卿 g1120140 PPT 26 5.4 上榜 见批注
张 弛 g1120141 PPT 24 5.0 见批注
张博雅 g1120142 PPT 25 5.2 上榜 见批注
周泽源 g1120143 WORD 23 4.8 见批注
邱静窈 g1120162 WORD 20 4.2 见批注
11届01班信息技术基础模块成绩
姓名 学号 第01次 第02次 平均分 折百分 总评
白云歌 g1120101 4.1 4.2 4.1 82.3 良
步晓什 g1120102 4.1 5.2 4.6 92.7 优
陈翀尧 g1120103 3.8 0.0 1.9 37.5 不及格
陈子聪 g1120104 4.7 4.4 4.5 90.6 优
邓扬清 g1120105 4.7 5.0 4.8 96.9 优
傅 萌 g1120106 3.5 0.0 1.8 35.0 不及格
傅冰飞 g1120107 4.7 4.4 4.5 90.6 优
高祖光 g1120108 5.0 5.2 5.1 102.1 优
李世凯 g1120109 4.7 0.0 2.3 46.9 不及格
李天予 g1120110 4.7 5.4 5.1 101.0 优
李玉龙 g1120111 4.1 4.4 4.2 84.4 良
卢 迪 g1120112 4.4 0.0 2.2 43.8 不及格
沈 达 g1120113 4.1 3.8 3.9 78.1 良
沈剑飞 g1120114 3.4 5.0 4.2 84.4 良
宋 畅 g1120115 5.0 4.0 4.5 89.6 优
宋世瀚 g1120116 4.4 4.2 4.3 85.4 优
苏金棣 g1120117 4.7 4.4 4.5 90.6 优
孙 放 g1120118 4.1 5.0 4.5 90.6 优
孙国超 g1120119 5.0 5.2 5.1 102.1 优
孙若轩 g1120120 4.7 4.8 4.7 94.8 优
孙武元哲 g1120121 4.7 2.7 3.7 74.0 及格
田雨朋 g1120122 5.0 5.0 5.0 100.0 优
王恺峥 g1120123 5.0 4.6 4.8 95.8 优
谢 越 g1120124 4.1 0.0 2.0 40.6 不及格
越 光 g1120125 4.7 5.0 4.8 96.9 优
张东良 g1120126 5.3 4.8 5.1 101.0 优
张骁懿 g1120127 5.0 4.2 4.6 91.7 优
张质祎 g1120128 5.0 0.0 2.5 50.0 不及格
赵 步 g1120129 4.7 4.6 4.6 92.7 优
赵墨渊 g1120130 0.0 4.8 2.4 47.9 不及格
赵子为 g1120131 4.7 4.8 4.7 94.8 优
周 越 g1120132 4.7 0.0 2.3 46.9 不及格
吕中驰 g1120161 4.7 4.8 4.7 94.8 优
程祎明 g1120133 4.7 5.2 4.9 99.0 优
刘 岑 g1120134 5.3 5.0 5.2 103.1 优
田 园 g1120135 4.7 4.8 4.7 94.8 优
王 琦 g1120136 5.3 5.2 5.3 105.2 优
王苏凌 g1120137 4.3 5.0 4.6 92.5 优
肖 娴 g1120138 4.7 5.4 5.1 101.0 优
叶桻丹 g1120139 5.0 4.8 4.9 97.9 优
易斯卿 g1120140 4.7 5.4 5.1 101.0 优
张 弛 g1120141 5.0 5.0 5.0 100.0 优
张博雅 g1120142 4.7 5.2 4.9 99.0 优
周泽源 g1120143 5.3 4.8 5.1 101.0 优
邱静窈 g1120162 3.8 4.2 4.0 79.2 良
2011届第一学期“信息技术基础”第03_04次课
搜索研究评价量规
基本分内容 加分内容 总得分
姓名 学号 点名 发件人 主题 附件 文件名 封面 目录 页码 页数 三级标题 行间距 基本内容 搜索结果 搜索比较 心得体会 内容筛选 文字编辑 字体字号 态度 排版 见解 心得 创新 笑脸 得分 上榜 老师的话
满分要求 25 5
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
2011届01班第一学期“信息技术基础”第05_06次课
自助旅游计划()
基本分内容 加分内容 总得分
组号 姓名 学号 点名 发件人 主题 附件 附件名 文件类型 三个地点 日程安排 住宿安排 交通线路安排 自然人文风景、风土人情介绍 费用预算 需要预备东西 特色介绍 计划可行 展示技术 信息来源 标题 作者时间 总结 态度 设计 个性特色 创意 笑脸 得分 上榜 老师的话
路费 住宿 门票 总计 得分
满分要求 30 5
第01组 0.0
0.0
第02组 0.0
0.0
第03组 0.0
0.0
第04组 0.0
0.0
第05组 0.0
0.0
第06组 0.0
0.0
第07组 0.0
0.0
第08组 0.0
0.0
第09组 0.0
0.0
第10组 0.0
0.0
第11组 0.0
0.0
第12组 0.0
0.0
第13组 0.0
0.0
第14组 0.0
0.0
第15组 0.0
0.0
第16组 0.0
0.0
第17组 0.0
0.0
第18组 0.0
0.0
第19组 PPT 0.0
0.0
第20组 WORD 0.0
0.0
第21组 PPT 0.0
0.0
第22组 PPT 0.0
0.0
0.0
2011届01班第一学期“信息技术基础”第07次课
图像处理—计划与素材采集()
基本分内容 加分内容 总得分
组号 姓名 学号 组长 点名 发件人 邮件主题 附件名 计划书 小组主题 主题明确 内容简介清楚 采集计划 态度认真 素材文件夹 素材与主题 粗加工 照片数量 主题特色 计划详细 创意 素材质量 选做题 笑脸 得分 上榜 老师的话
满分要求 18 5
G11届01班信息技术基础模块成绩
姓名 学号 #REF! 得分 总评 姓名 学号 0 得分 总评
白云歌 g1120101 #REF! #REF! 良 王恺峥 g1120123 #REF! #REF! 优
步晓什 g1120102 #REF! #REF! 优 谢 越 g1120124 #REF! #REF! 不及格
陈翀尧 g1120103 #REF! #REF! 不及格 越 光 g1120125 #REF! #REF! 优
陈子聪 g1120104 #REF! #REF! 优 张东良 g1120126 #REF! #REF! 优
邓扬清 g1120105 #REF! #REF! 优 张骁懿 g1120127 #REF! #REF! 优
傅 萌 g1120106 #REF! #REF! 不及格 张质祎 g1120128 #REF! #REF! 不及格
傅冰飞 g1120107 #REF! #REF! 优 赵 步 g1120129 #REF! #REF! 优
高祖光 g1120108 #REF! #REF! 优 赵墨渊 g1120130 #REF! #REF! 不及格
李世凯 g1120109 #REF! #REF! 不及格 赵子为 g1120131 #REF! #REF! 优
李天予 g1120110 #REF! #REF! 优 周 越 g1120132 #REF! #REF! 不及格
李玉龙 g1120111 #REF! #REF! 良 吕中驰 g1120161 #REF! #REF! 优
卢 迪 g1120112 #REF! #REF! 不及格 程祎明 g1120133 #REF! #REF! 优
沈 达 g1120113 #REF! #REF! 良 刘 岑 g1120134 #REF! #REF! 优
沈剑飞 g1120114 #REF! #REF! 良 田 园 g1120135 #REF! #REF! 优
宋 畅 g1120115 #REF! #REF! 优 王 琦 g1120136 #REF! #REF! 优
宋世瀚 g1120116 #REF! #REF! 优 王苏凌 g1120137 #REF! #REF! 优
苏金棣 g1120117 #REF! #REF! 优 肖 娴 g1120138 #REF! #REF! 优
孙 放 g1120118 #REF! #REF! 优 叶桻丹 g1120139 #REF! #REF! 优
孙国超 g1120119 #REF! #REF! 优 易斯卿 g1120140 #REF! #REF! 优
孙若轩 g1120120 #REF! #REF! 优 张 弛 g1120141 #REF! #REF! 优
孙武元哲 g1120121 #REF! #REF! 及格 张博雅 g1120142 #REF! #REF! 优
田雨朋 g1120122 #REF! #REF! 优 周泽源 g1120143 #REF! #REF! 优
邱静窈 g1120162 #REF! #REF! 良信息技术课第二次作业
高一(1)班 姚竞凌 1020145
2007-9-12
一、应用实例
1.感测技术:气象卫星、机场雷达、芯片温度传感器
2.通信技术:短波无线电通讯、无线扩屏、数字移动通讯
3.计算机技术:动画制作、网络、数据处理
4.控制技术:变频器、高压断路器、回扫转换器
二、案例分析
案例一:据3月15日出版的英国《新科学家》报道,美国南加利福尼亚大学的西奥多·伯格等人经过近10年的时间,研制出来了世界第一个用于修补动物大脑内海马部位功能的硅芯片。这一研究成果为那些因脑部病变或受伤而失去新记功能的病人带来了新希望。根据设计,在用于病人时,这种芯片将附着在头盖骨上,而不是植入脑的内部。芯片通过两组电极与脑部进行通信,两组电极分别置放于海马损坏区域的两边,一组接收从脑的其余部位传送到海马的“输入”信号,另一组则根据芯片内部指令将相应的“输出”信号发送给大脑。这样,信号就绕过海马,由芯片来替代海马的功能。
分析:芯片接收传送到海马的“输入”信号应用了感测技术,根据内部指令将“输出”信号发送给大脑应用了通信技术。
案例二:美国国际商用机器公司(IBM)的研究人员日前为手机增添了一项新功能:为高危心脏病患者发送求救信息。IBM公司介绍说,新系统的核心是只有一盒口香糖大小的无线电信号转发装置。这一装置采用了可进行短距离、低功率无线通信的“蓝牙技术”,可与便携式心跳监测仪和手机配合使用。当使用者心跳达到“危险”水平时,这套系统能自动拨打一个预设的手机号码,以短信息的方式发出心跳数据。
分析:心跳监测仪应用了感测技术,自动拨打预设手机号码应用了通信技术,以短信息的的方式发出心跳数据应用了计算机技术。
三、自由畅想
在未来社会中,信息技术的发展速度将越来越快,应用将越来越广泛。我们的日常生活中将因信息技术变得更方便:在学校,老师们可以不用写板书,只需按下与电子黑板相连的便携式麦克上的一个钮,先进的感测技术和计算机技术就会将老师口述的内容“写”到黑板上;在马路上,汽车的车头都有红外感测仪,当前方有障碍物在危险距离之内时,即使司机没能及时反应,车也会自动停下;在商场里,如果顾客不方便试衣服,可以在电脑上选择想要的衣服款式,摄像头会将顾客的影像输入电脑,经技术合成,顾客“穿”着衣服的图片就出现在电脑屏幕上了……信息技术和普通人的距离将进一步缩短,人人都可以享受到信息技术带来的便捷。
四、对信息技术课的希望
希望信息技术课能让我们有较多的实践机会,有更多让我们展示自己创意的舞台。上课形式能够丰富多样,让我们充分体会到信息技术的魅力。也希望老师将基础知识讲到每个人都明白,不要因为少部分同学学得比较多、懂得比较快就一带而过。(共28张PPT)
我叫李冬梅
将和大家一起学习信息技术
希望我们合作愉快
2008-09 信息技术第1课
2008-09 信息技术第1课
信息
技术
信息
科学
的
技术
应用
信息
2008-09 信息技术第1课
技术
?
信息
?
技术
信息
科学
的
技术
应用
2008-09 信息技术第1课
信息及其特性
一、什么是信息
请大家说说
信息从哪里来?
信息长什么样?
信息看得见?摸得着吗?
信息究竟是什么?
2008-09 信息技术第1课
定义1
从本体论的角度看,信息是关于事物运动的状态和状态变化方式的自我表述(或自我显示)。
2008-09 信息技术第1课
事物
外部世界
客观实体
主观世界
精神现象
2008-09 信息技术第1课
机械运动
物理运动
化学运动
生物运动
思维运动
社会运动
运动
2008-09 信息技术第1课
宇宙间一切事物都是运动的,都有一定的运动状态和状态变化的方式。
也就是说,一切事物都在产生信息
信息来源于一切事和物。
2008-09 信息技术第1课
定义2
从认识论的角度看,信息是主体(人)感知的事物运动状态及其变化方式,包括状态及其变化方式的形式、含义和效用。
2008-09 信息技术第1课
二、信息的特性
请大家说说
信息有哪些特性?
为什么说这些是信息的特性?
他们的真正含义是什么?
2008-09 信息技术第1课
(1)相对独立性
信息来源于物质,又不是物质本身,它从物质的运动中产生,被主体所感知,脱离了源物质而寄生于媒体,相对独立存在;
信息来源于精神世界,被主体所感知,脱离了源精神世界而寄生于媒体,相对独立存在;
2008-09 信息技术第1课
(2)普遍性
信息是“事物运动的状态和状态变化的方式”,因此,只要有事物在,只要有事物的运动,就会产生信息。
无论自然界、人类社会还是人类的思维领域,绝对静止的事物是没有的,所以,信息是普遍存在的,信息无处不在,无时不有。
2008-09 信息技术第1课
(3)感知性
信息是能够通过人的感官被接受与识别的。其感知的方式与识别的手段因信息载体不同而各异:物质、文字上的信息由视觉器官感知,音响、声音中的信息由听觉器官识别,水火和天气冷热的信息则由触觉器官感知。人的各种器官,就是信息的接收器。
2008-09 信息技术第1课
(4)依附性
信息是通过一定的载体表现出来的。它不能脱离载体独立存在的。同一信息可以通过不同的载体来表现。
2008-09 信息技术第1课
(5)可复制性
由于信息是可以脱离源事物而相对独立地存在并负载于其它载体,因此,根据载体的可复制性,信息是可以被无限制地进行复制的。
2008-09 信息技术第1课
(6)传递性
信息可以在时间上或空间中从一点传递到另一点。
由于信息具有脱离母体而相对独立的能力,所以它就可以通过一定的方法使之在时间或空间上进行传递。时间上的传递称为存储;空间上的传递称为通信。 信息的传递性使人的知识能够积累和传播,人与人之间能够进行信息交流,使人与环境之间保持信息联系,从而更好的认识环境、改造环境。
信息只有经过传递、交流,才能为人们所感知和接收,才能转化为知识并发挥作用。信息传递可以是人与人之间近距离的眉目传情、口语交流,也可以通过电报、电话、书信、传真来沟通,还可以通过报纸、杂志、广播、电视、网络等来实现。
2008-09 信息技术第1课
(7)共享性
由于信息可以脱离源事物相对独立地存在,并负载于其它载体上,因此,可以被无限制地复制、传播和分配给从众多的用户,为大家所共享。交流和传播并未使信息本身的含义和效用受到影响,传播者也未失去对原有信息的占有和享用。信息共享的人数多寡,往往同信息传播效果和价值的大小成正比。
2008-09 信息技术第1课
(8)时效性
信息是事物运动的状态和变化方式,事物本身是在不断的变化的,因此,信息也会随之变化。脱离了母体的信息因为不再能够随时反映母体新的运动状态及其变化方式,它的效用就会逐渐降低,甚至完全失去效用。这就是信息的时效性。当然信息的时效性也与其母体事物本身随时间变化的速度 有关。如天气预报、股市行情等类型的信息的时效性就比较短。而一些科学原理定理的时效性就比较长。
2008-09 信息技术第1课
(9)真伪性
信息在表达过程中,由于人们在认知能力上的差异,对于同一信息,不同的人可能会有不同的理解,形成认知上的伪信息;由于在传递过程中的失误,可能会产生传递伪信息;也有一些有出于某种目的,通过篡改、捏造、欺骗、夸大、假冒等手段制造人为伪信息。所以,信息具有真伪性。
2008-09 信息技术第1课
(10)存储性
信息可以借助载体长期累积存放,以便随时提取。信息存贮有两种方式:一是通过人的大脑进行记忆存贮;二是利用各种物质载体进行记录存贮,如通过书刊、录音带、录像带、光盘存贮各种信息。这种存贮性使人类的知识得以继承发展、延绵千年。
2008-09 信息技术第1课
(11)积累性(相对性,不完整性)
信息可积累性表现在人们对信息的认识程度。人们对事物的认识是逐步深入的,所获得的信息也是逐渐增加的,一次就获取事物的全部信息是比较困难的。
对于同一个事物,不同的观察者所获得的信息也是不同的。由于不同的观察者有着不同的观察能力和理解能力、不同的目的性,因此,从同一个事物所获得的信息量肯定各不相同。
2008-09 信息技术第1课
(12)可加工性
信息的可加工性是指人们可以通过比较、筛选、分析、综合、压缩等方法与信息进行处理,将其从一种形式转换为另一种形式并保持一定信息的过程,信息加工是否会对信息产生影响,与加工的方法和过程有很大关系。
2008-09 信息技术第1课
实践内容及要求
1. 仔细阅读北大附中上机规则。
2. 使用你的用户名与密码正确登录stu域。
3. 在OutLook Express中设置你的电子邮箱,并接收邮件。
(1)使用Outlook Express建立自己的邮件账号,办法见“技术支持3”。
(2)要求:姓名用中文全名,用户名与密码与上机登录账号相同。
(3)单击“接收/发送”按钮接收邮件。
(4) 单击邮件中的图标,选择“保存附件”,将附件保存在你的Z盘中。
(5)打开附件,仔细阅读并按要求完成作业。
2008-09 信息技术第1课
实践内容及要求
4. 选择一种工具软件(如WORD,PPT,网页或其它)以“信息及其特性”为主题,完成以下问题:
(a)个人简介;
(b)用你自己的语言谈谈你个人对信息概念的理解;
(c)你对信息的无处不在一定深有感触,请结合实际谈谈你感受最深刻的某个信息特性。
(d)写写你对信息技术课的希望。
5*. 填写调查表:http://211.68.73.209/dc
2008-09 信息技术第1课
作业保存与提交要求
(1)以学号+“ ”+姓名+“ 第01个作业”为文件名(如:1120101 白云歌 第01个作业),将你的作业保存在你的Z盘 ;
(2)并将作业文件以附件的形式发至老师邮箱(lidongmei@bdfz.bj.cn)。邮件的主题为“11届ZZ班XXX第01次作业”,其中ZZ为你所在班号(如:01 ),XXX为你的中文姓名。
2008-09 信息技术第1课
作业评价标准
2008-09 信息技术第1课
今天第一节课就上到这里
谢谢各位同学
2008-09 信息技术第1课(共9张PPT)
Hi!我是高一(1)班的钟博远,我很高兴能成为您的学生,我性格活泼开朗,喜欢广交朋友。我对待学习认真仔细,对待工作一丝不苟。初中三年,我的学习成绩始终名列前茅,每学年都被评为校级和区级三好学生,并在初三下学期被评为北京市三好学生。不过,您可别以为我是个bookworm,我的兴趣爱好非常广泛,我能用钢琴演奏美妙的音乐,我能用我极富磁性的嗓音演唱中英文歌曲。我多才多艺,擅长表演。我曾在北大附中的圣诞party晚会和艺术节上做过主持人。曾在北京市中学生英语演讲比赛中获铜奖。球类运动更是我的最爱,足球、篮球、网球、乒乓球、羽毛球都丰富了我的课余生活。
我与电脑从小时候就结下了不解之缘,我也非常喜爱学习信息技术这门功课。希望我能在您的教导下更上一层楼!
我独特,我自信,我热爱生活,对未来充满希望。
我认为信息是一种看不见、摸不着,而又无处不在、无时不有的抽象概念,它伴随着并推动着人类社会的发展,它让我们的生活丰富多彩。信息通过各种不同的途径进入我们的大脑、成为我们思考的资本。这样,我们才拥有了社会观、世界观、人生观。信息是比所有物质财富都重要、都宝贵的精神资源,是它让我们察觉到时间、空间的存在,是它让我们充分利用感觉器官来感知这个美丽的世界,更是它让我们感觉到了自己的存在,让我们的生活更有意义。信息不单单是一个抽象概念,它是我们适应外界环境最重要的需求,是世间万物生存的基础。
睁开眼睛,信息便伴随着物体反射的光线扑面而来;竖起耳朵,信息便伴随着蝉鸣、鸟叫等声响萦绕耳畔;翻开书本,一个个文字在向你诉说它们的信息;打开收音机,一句句话语在向你传递它们的信息;打开电视、登陆网络,成千上万条的信息在以各种各样的方式传递给你,报纸、杂志、广告、网页、音乐、图像、视频……信息的依附载体的多方面间的,信息的载体依附性也是很强的,它使得信息具有了可存储、可传递、可转换等特点。它让信息传播到地球的每一个角落。
1、人脸识别技术:人脸识别技术在计算机视觉、
客户身份鉴别、多媒体数据检索等领域有着十
分广泛的应用前景。
2、防盗版技术:主要用于对知识产权的保护。
3、(农业方面)经营管理职能决策系统
4、(农业方面)生产过程智能化管理
5、(农业方面)温室种苗工厂化生产环境的自动
化控制系统
信息技术在人类社会发展史上发生过五次信息技术革命。第一次信息技术革命是语言的使用,是从猿进化到人的重要标志。第二次信息技术革命是文字的创造,使信息的存储和传递首次超越了时间和地域的局限。第三次信息技术革命是印刷术的发明,为知识的积累和传播提供了更为可靠的保证。第四次信息技术革命是电报、电话、广播、电视的发明和普及,进一步突破了时间与空间的限制。第五次信息技术革命是计算机技术与现代通信技术的普及应用,将人类社会推进到了数字化的信息时代。信息技术的每一次革命都是对以往信息技术的超越,使人们的学习和生活状况得以日益改善。
信息技术已经渗透到了社会生产、生活的方方面面。它的发展趋势是:1、越来越友好的人机界面。包括:虚拟现实技术、语音技术,人工智能技术。2、越来越个性化的功能设计。3、越来越高的性能价格比(共80张PPT)
欧洲游---巴黎
北京首都国际机场
巴黎戴高乐机场
卢浮宫
凯旋门
巴黎大铁塔
协和广场
香榭丽舍大街
巴黎圣母院
巴黎戴高乐机场
北京首都国际机场
安培饭店
第一天
安培饭店
安培饭店
安培饭店
安培饭店
安培饭店
安培饭店
第二天
第三天
第四天
第五天
北京首都国际机场
巴黎戴高乐机场
飞机
卢浮宫
凯旋门
巴黎大铁塔
协和广场
香榭丽舍大街
巴黎圣母院
参考价格:17477元/人
步行
步行
9:oo 地铁
步行
时间:5-6天左右
巴黎戴高乐机场
北京首都国际机场
飞机
17:20
安培饭店
专线巴士 车资35FF 车程近1小时
安培饭店
10分钟
10:00
13:00
安培饭店
10:00
13:00
10:00
13:00
5-10分钟
10—20分钟
12:35
第四天
第一天
第五天
地铁
第三天
第二天
航班:中国东方航空,每周MU1345航班 。往返机票。
(首都国际机场/巴黎戴高乐机场)。
凯旋门: 前往凯旋门乘地铁1, 2, 6号线在Ch De Gaulle Etiole站下车
卢浮宫:门票40FF
巴黎圣母院: 搭乘地铁(4)线在Cite站下车
巴黎大铁塔:乘地铁1, 2, 6号线在Ch De Gaulle Etiole站
凯旋门:32F,25岁以下21FF
巴黎圣母院不要门票, 不过登钟楼要买票(夏天是7欧元)。
68FF
航班
交通
门票
机场专线巴士 车资35FF 车程近1小时
车资67FF
7600元
协和广场:乘地铁1, 2, 6号线在Ch De Gaulle Etiole站
路费列表
项目 花费(元) 备注
机票 7600 1)机票为往返票.时间自定
2)去旅游地点搭乘地铁,一次8FF.
(1FF=1.52元 )
3)参观结束,按原路返回。故算两次地铁票。
凯旋门 24.32(12.16*2)
巴黎圣母院 24.32(12.16*2)
巴黎大铁塔 24.32(12.16*2)
机场专线巴士 106.4(53.2*2)
协和广场
24.32(12.16*2)
总计 7803.68
住宿费、观光费列表
项目 花费(元) 备注
住宿 6350(1270*5) 1)住安培饭店,单人标准客房5晚.
2)1FF=1.52元
1欧元=10元
卢浮宫 60.8
凯旋门
31.92
钟楼
70
总计 9673
注:以上统计不包括购物,吃饭。请自备足够的钱。
巴黎大铁塔
凯旋门
巴黎圣母院
卢浮宫
巴黎是世界上最大的都市之一,是一座拥有众多古迹建筑和深厚历史沉淀的世界历史名城,同时它还是融合文化与艺术精华于一身的文化之都,与生俱来的时尚气息吸引着成千上万追求品质的潮流追随者 。
法国——卢浮宫
喜欢欣赏艺术作品的人都知道法国的卢浮宫,这个博物馆位于塞纳河畔,是一组文艺复兴时代的建筑物。历代法国国王都重视经营这个收藏馆以显示帝国的文化成就,所以其藏品不断增加。当今的法国政府也决心要把它建成世界第一的艺术博物馆。为了更好地保护藏品,改善参观环境,法国总统亲自下令,聘请美藉华人贝聿铭设计博物馆的封闭式入口,结果就出现了那个玻璃金字塔。
法国——卢浮宫
从玻璃金字塔进入地下,便是一个宽敞明亮的大厅。观众从地面乘自动电梯源源而下,但进厅后一点不显拥挤。这实际上是给原有的卢浮宫增加了接待面积。从地下抬头仰望,只见这塔顶遍体通明,晶莹剔透,变化多姿的巴黎晴空不减风采,卢浮宫原有建筑的倩影也竞相悦目,视之如入幻境。这才体会到设计者也有他的一番用心。而且从地下入宫也许有利于空调的控制和藏品的保护。宫内藏品很多,据介绍,有古物、古家具、雕塑、绘画等。绘画中最令人注目的当推蒙娜丽莎,雕塑中最有名的自然是米罗的维纳斯和大卫。大家到这里都要拍照,
希腊艺术《米罗的维纳斯像》:
希腊艺术《萨莫特拉斯的胜利女神》:
莱奥纳多·达芬奇(1452-1519) 《蒙娜丽莎》:
卢浮宫是一座真正的迷宫,尤其对于一名外国人而言,想在宫中确定自己的位置是非常困难的。这 座庞大的宫殿里收藏了无数的艺术珍品,包括大量来自东方的艺术品。其中最著名三件作品有断臂的: "维纳斯",没有头的"胜利女神","蒙娜·丽莎"。
凯旋门 Arc de Triomphe
凯旋门门如其名,是一座迎接获胜归来的军队的凯旋之门,它是现今世界上最大的一座圆拱门,亦是世界上最早建设的凯旋门式建筑物。
它是1864年拿破仑为了显示他辉煌的功勋而建造的。凯旋门高164米,宽147米,门墙上的石雕描绘的是拿破仑在1792年至1815年的战争历史,拱门右边的石雕出自古典雕刻家卢德手笔,主体内容是1792年的"进军",亦即是著名的马赛进行曲,今日仍是法国的国歌,每年法国国庆日,都会在凯旋门举行盛大隆重的国庆献礼,吸引了成千上万的游客蜂拥到此观赏。以凯旋门为中心向外延伸着12条主要大街。
凯旋门
凯旋门本身就是一件艺术品,整座建筑物都雕有精致细工的浮雕,件件精美,看得人赞不绝口。拱门上方四壁的浮雕,是庆贺拿破仑凯旋归来的情景,而拱门下方是一座无名英雄战士的坟墓,也是代表战争中战死沙场的150多万名法国士兵,墓前有一束不灭之火,象征法国世代蓬勃。常有法国市民送上鲜花致敬。
凯旋门
巴黎有三座凯旋门:分别是爱德华凯旋门(亦称大凯旋门);卡鲁塞尔凯旋门(亦称小凯旋门);大门塔(亦称新凯旋门)。
小凯旋门
小凯旋门是为庆祝拿破仑·波拿巴 1805年的一系列战争胜利而建造的,位于卢浮宫博物馆对面。红、白大理石圆柱之间是三个圆拱门,拱门上方布满了纪念拿破仑皇帝战绩的淡浮雕。门的顶端摆放了四匹从意大利圣马可教堂搬来的镀金奔马。原物于回815年归还给了意大利,现在的是复制品,同时还添了一辆马车与和平女神像。小凯旋门显得很古朴。
新凯旋门
大门塔位于巴黎西面的拉德芳斯区。它的形状像大门,方型中空。整座建筑用白色大理石与玻璃覆面。门内悬挂着一张叫做“云”的巨大天幕,乘电梯可达到塔顶观景台。这座被称为“前卫文化”的凯旋门是由丹麦建筑师奥托·冯·斯普瑞克森设计的,1989年7月竣工,在这个富有想象的城市里更显其浪漫。
它是巴黎最古、最大和建筑史上最出色的天主教堂。
巴黎圣母院
建于1163年,是巴黎第一座哥特式建筑。教堂一直是巴黎宗教活动的中心,可以同时容纳9000人。圣母院的钟楼,建于1330年,里面存放着当时巴黎唯一的一口钟。它的著名不仅因雨果的小说《巴黎圣母院》,也因为它是巴黎最大、最古老同时也是最出色的天主教堂。
巴黎圣母院
巴黎圣母院
建筑占地面积5500平方米,包括一个唱诗班席和后堂,一个短的耳堂和中堂。中堂的侧面有双侧堂和方形的小礼拜堂。正门向西,共分三层。最底层并排着3个桃花形门洞。还建有南北2 座钟楼,各高69米,1330年落成。南钟楼巨钟重达13吨,堪称“钟工”。北钟楼设有一个387级的楼梯直通高达60米的尖塔,较钟塔高山21米,更为引人瞩目。
巴黎大铁塔在巴黎市中心塞纳河南岸,是世界上第一座钢铁结构的高塔,被视为巴黎的象征。因法国著名建筑师斯塔夫·埃菲尔设计建造而得名。
埃菲尔铁塔
建于1887—1889年。塔高300余米,塔身重达9,000吨,分三层。第一层平台距地面57米,设商店和餐厅;第二层平台高115米,设有咖啡馆;第三层平台高达276米,供游人远眺,底部面积1万平方米,在第三层处建筑结构猛然收缩,直指苍穹。
埃菲尔铁塔
从一侧望去,象倒写的字母“Y”。该塔由1.8万余个组成部件和250多万个铆钉构成。有电梯或徒步登塔顶。入夜,塔顶发出转动着彩色探照灯光,防飞机碰撞。塔旁竖立长方形白色大理石柱,柱顶安放斯塔夫埃菲尔镀金头像。
巴黎协和广场(Place de la Concorde in Paris)位于巴黎市中心、塞纳河北岸,是法国最著名广场和世界上最美丽的广场之一。广场始建于1757年,是根据著名建筑师卡布里埃尔的设计而建造的。因广场中心曾塑有路易十五骑像,1763年曾命名“路易十五广场”。大革命时期又被改名为“革命广场”。1795年又将其改称为“协和广场”,后经名建筑师希托弗主持整修,最终于1840年形成了现在的规模。
广场中央矗立着一尊23米高、有3400多年历史的埃及方尖碑,这是路易-菲利普于1831年从埃及卢克索移来的著名文物,碑身的古文字记载着拉美西斯二世法老的事迹。石碑两侧各有一座喷水池。池中精致的雕刻也是希托弗的作品。广场四周放置了8座雕像,分别象征着8座在法国历史上起过重要作用的城市:里昂、马赛、波尔多、南特、鲁昂、布勒斯特、里尔和斯特拉斯堡。1793年大革命时期,巴黎人民奋起捣毁了路易十五的铜像,并将路易十六送上了断头台。
香榭丽舍大街(Ave des Champs-Elysees)东起协和广场西至星形广场,全长约1800米,街道最宽处约120米,是横贯巴黎且最具特色、最繁华的街道之一。在法文中“香榭丽舍”是“田园乐土”的意思。
香榭丽舍
香榭丽舍
过去,这里曾是一片低洼潮湿的空地。17世纪路易十四在位时,曾在这里植树造林,使之成为专供宫廷贵族游乐的禁区。后来,图勒里公园的东西轴线向西延伸,在这里建成了近1公里长的林荫道。以后又加扩展。1709年才将其命名为香榭丽舍大街。
香榭丽舍
大街以南北走向的隆布万街为界,分成风格迥异的东西两段。幽静的东段体现了田园风光,长约700米,一排排梧桐苍翠欲滴,街心花园夹在万木丛中时隐时现。东端的星形广场中央有巍峨雄伟、遐迩闻名的凯旋门。大街附近有波旁宫、玛德琳娜大教堂。这里还有图勒里公园、卢浮宫、市府大厦和爱丽舍宫等名胜古迹。西段长1100多米,西端的协和广场是巴黎的另一个交通要冲。法国的一些重大节日──7月14日国庆阅兵式、新年联欢都在这条著名的街道上举行。
巴黎住宿
在法国,旅馆各具特色。您当然可以找到极其奢华的,它们往往坐落在最漂亮的景点中心或位于各地区的首府。那里的服务无微不至,所有设备都质量上乘,提供的食品更是法国传统餐饮和旅馆业中的上品。
住宿
住宿
巴黎的旅馆很多,游人不必为旅馆发愁。即使是游人特别多的4月复活节和夏季,也不用担心,因为巴黎市会特别增加设施。在法国,旅馆等级的划分是由政府来决定的。按星的多少来表示。巴黎的旅馆也是如此。正因为巴黎是大都市,所以,旅馆数量是最多的。
住宿
巴黎最高级星级旅馆,在巴黎相当集中。从纯法国式的高级旅馆,到可供整个旅游团住宿的、性能齐备的美式旅馆等,应有尽有。没有星的旅馆其服务质量和安全性也不差。只是这些旅馆的淋浴、厕所是共用的,厕所的数量比较少,但房间里设有洗脸室,经济上也可有所节省。
你还可以找到更多的乡村小客店,或山区里朴实的小木屋,或城市中简朴但功能齐全的旅馆,或深藏于密林中的狩猎驿站……您可以根据您的需求和预算尽情挑选。
安培饭店以法国人友好待客的风格,将法国传统的魅力展现给来客。
客人将在位于城市中心地带、设施豪华舒适的酒店内度过愉快的时光。
安培饭店
货币兑换 房间类型 客房价格(所列价格均为最低起价)
标准客房
单人 双人 三人
127 欧元 139 欧元 168 欧元
酒店价格中包括6%的增值税
酒店价格表示为每间/每晚的客房价格
上述价格内可能包括有早餐,如想确定是否包括,请在下面的预订栏中选择入住酒店的日期,继续下一个步骤。
三人/四人房为在一些房间里为第三/四位客人提供加床。
住宿:635 欧元
即:6350元
安培饭店
出租车
除了在招呼站之外,在路边也可叫计程车,计程车部分接受刷卡,对观光客而言非常便利。但是法国计程车一般只可乘载三位乘客,而摆放行李的地方有限,一般在清晨及晚上均设有附加费约20%。
地铁交通状况
航空交通状况
交通
旅游观光巴士交通状况
可自由上下车的循环观光巴士「Paris View」是最好的选择,一票在手2日有效,125法郎就可看遍巴黎的观光名胜。停车站包括:德洛卡德罗广场(Pl. du Trocadero)、艾菲尔铁塔(La Tour Eiffel)、战神公园(Parc du Champ de Mars)、罗浮宫(Musee du Louvre)、圣母院(Cathedrale Notre-Dame de Paris)、奥赛美术馆(Musee d’Orsay)、加尼埃歌剧院(Oera Garnier)、凯旋门(Arc de Triomphe)、大皇宫(Grand Palais)。
巴黎地下铁名为METRO,以方便、快速、经济著名,为大巴黎区主要交通工具,共有编号13条线,
是到巴黎旅游最快的交通工具。在巴黎市区有上百个车站,只要看到大大的黄色(M)标志,或是(METRO)字样,即表示为地铁站入口。单张地铁票为8法郎,或可1次购买10张为52法郎。
交通
巴黎有两处机场,一是戴高乐机场(Aeroport Charles de Gaulle,简称CDG),一是奥利机场(Aeroport d’Orly),而CDG则又分为CDG1及CDG2两个航站。 国际航线大部分由戴高乐机场升降,而国内及近距离航线则通常使用奥里机场。
进入巴黎市区的3条途径:
乘Roissy-Rail市郊(RER)火车,先乘一程免费专线巴士至Riossy火车站,在此接乘火车开往北站(Gare de Nord),车资50FF。如果持有欧洲火车证的话,可至火车站的SNCF柜台凭火车证免费换取两张黄色单程火车票,其侧的RER就须购票,因SNCF是国营铁路,而RER是巴黎市郊铁路,两者有别。在全法国用SNCF甚至其经营的巴士,也给与火车证持有人免费乘搭。
法车航空公司巴士(Air France coaches),法航巴士分为两条线,其中一条经Porte Maillot到达凯旋门附近(Gare Gaulle-Etoile),
另一条线则前往蒙特柏尼斯火车站(Gare Moutparnasse)。平均每隔20分钟开出一班,车程40分钟许,车资64FF。
进入巴黎市区的3条途径:
专线巴士(Roissybus),往返于机场及Rue Scribe和Rue Auber的交汇处(Opera地铁站附近),车资35FF(可用四张地铁单程票代替)。每小时开出4班,车程近1小时。
出行
购买巴黎观光票Paris Visite 可以随意乘坐地铁、RER1等车和蒙马特丘陵过缆车的一种票券。可以去第凡斯等巴黎周围近郊的是3Zone,可以去凡尔赛或奥尔良机场、戴高乐机场等的是4Zone。分为有效期2天、3天和5天三种。 此外,还有其他特殊待遇,如购蒙帕斯塔56~59层入场券、租用自行车皆可凭此票享受一定的优惠等。在地铁、RER各主要车站和机场的国铁窗口出售。
交通
注意:公共汽车站(arret)有二类,一类是在柱子上附有标识物,再一类是有顶盖候车室。但不管哪种,都有红色、黄色标识,标有路线号码和停靠站名。如果路线号码是白色的,表示它是7:00~20:30之间的正常运行;如果号码是蔚蓝色的,则表示运行到深夜0:00~0:30;如果是黑色的,则表示星期天和节假日停止运行。
法国菜
法国菜是西餐中最有地位的菜,是西方文化的一颗明珠。相传16世纪意大利女子Catherine嫁给法兰西国王亨利二世以后,把意大利文艺复兴时期盛行的牛肝脏,黑菌,嫩牛排,奶酪等烹饪方法带到法国,路易十四还曾发起烹饪比赛,即现今流行的Corden Bleu奖。
法国菜
曾任英皇乔治四世和帝俄沙皇亚历山大一世首席厨师的安东尼.凯莱梅写了一本饮食大字典,Dictionary of Cuisine,成为古典法国菜式的基础。法国菜的特点是选料广泛,用料新鲜,滋味鲜美,讲究色,香,味,形的配合,花式品种繁多,重用牛肉蔬菜禽类海鲜和水果,特别是蜗牛,黑菌,蘑菇,芦笋,洋百合和龙虾,法国菜肴烧得比较生,调味喜用酒,菜和酒的搭配有严格规定,如清汤用葡萄酒,火鸡用香槟。
上菜顺序
法国菜的上菜顺序是,第一道冷盆菜,一般沙丁鱼,火腿,奶酪,鹅肝酱和色拉等,其次为汤,鱼,再次为禽类,蛋类,肉类,蔬菜,然后为甜点和馅饼,最后为水果和咖啡,比较有名的法国菜是鹅肝酱,牡蛎杯,局蜗牛,马令古鸡,麦西尼鸡,洋葱汤,沙朗牛排,马赛鱼羹。
在法国吃东西花费并不很昂贵。菜单里有许多固定价格的在80法郎以下的简单可口的食物。稍微多花一点钱就能有更多的菜可选。一旦超过150法郎就能得到美食家的满足,有许多的不同国家的餐厅可选。有北非,南非,中国,日本,越南,希腊还有更多的。素食餐厅的数量在增长,印度人,犹太人,意大利人的餐厅是提供素食菜的好地方。
餐馆就餐时间及价钱
一般餐馆的营业时间是由正午十二时至下午二时三十分,而晚上则由七时至十一时左右。而其它时间则可以到 Cafe 或 Brasserie 等咖啡茶座吃小食;如三明治之类,也可到Creperie薄饼店。 麦当劳等快餐馆在巴黎不太普遍,只有在较著名的游客区如香榭里舍大道才找到,价钱亦较昂贵。
餐馆就餐时间及价钱
很多餐馆供应每日午餐特餐,周一至周五:11:00-14:00,约有45-65法郎,其中包括: 主餐、沙拉、饮料和咖啡。有主餐热炒的晚餐一般在80法郎以上。咖啡馆无论冬夏,去斯德哥尔摩咖啡馆的人总是络绎不绝。
名称 餐馆名(法语) 地址 邮编(Paris) 电话
新敦煌酒楼 La Table de Ming 17,Av,de 1`Opera 75001 0142609380
新美丽酒家 L`auberge Fleuris 11,Rue de la Nichodiere 75002 0147427481
天坛酒楼 Temple Celeste 9,Rue Volta 75003 0142729671
长城酒楼 Mandarin de Rambuteau 11,Rue Rambutean 75004 0142728722
北京楼 Restaurant de pekin 16,,Rue Cujas 75005 0143549617
广东酒家 Canton St Germain 5,Rue Gozlin 75006 0143265186
皇都 Grenelle de Pekin 124,Rue de Grenelle 75007 0145517723
福禄居 Au Mandarin 1,Rue de Berri 75008 0143594848
兰亭 Aux Orchidees 79,Bd de Courcelles 75008 0147633922
丰泽园 Au Boheur du Palais 5,Rue Rougemont 75009 0142463100
新中国城大酒楼 China Town Belleville 27-29,Rue de Buisson St-Louis 75010 0142393419
营业时间 一般餐馆的营业时间是由正午十二时至下午二时三十分,而晚上则由七时至十一时左右,而其他时间则可以到Cafe或Brasserie等咖啡茶座。吃小食,如三明治之类,也可到Creperie薄饼店。
价格 大部份的餐馆都在门口张贴了当日的菜单及价钱 ,而午饭时大多有 Plat du jour(今日推荐菜单)价钱也很合算。
当今世界上排列前十位的最昂贵的香水
1、毕扬(Bijan):
由名牌服装设计师毕扬(Bijan)调制,最昂贵的香水,木香-龙涎香系列,有浓郁而神秘的东方香味,每盎司300美元。
2、欢乐(Joy)
由巴黎服装设计师尚巴度(Jean Patou)推出,其茉莉香味,名副其实能带给女性欢乐,每盎司230美元。
3、第凡内(Tiffany)
优雅的欧洲风格,以茉莉与玫瑰香味为主,混合丛林基调,每盎司200美元。
其他
4、狄娃(Diva)
5、鸦片(Opium)
6、小马车(Caleche)
7、艾佩芝(Arpege)
8、夏奈尔5号香水(Chanel No.5)
9、一千零一夜(Shalimar)
10、象牙(Ivoire )
香水经久不衰的畅销三杰
1. Nina Ricci的比翼双飞
以康乃馨和综合花卉为基础,给人纤细而华丽的感觉。 L`Air du Temps比翼双飞香水,是Nina Ricci于1948年上市至今的经典香水。它的鸽子造型香水瓶身非常著名,是以第二次世界大战中法国雕塑家Marc Laliugi所雕刻的“双鸽”为设计背景。香水瓶盖是一个飞翔的鸽子,象征着二次大战结束,人们对于和平的渴望。
2. Elizabeth Arden的第五大道
以铃兰、茉莉为基础的高贵清爽、深具典雅风范的香味。 第五大道(Fifth Avenue)香水曾由于伊丽莎白·雅顿女士的要求,只能在纽约第五大道销售。
3. Chanel No.19
以茉莉和玫瑰作为基础,可以将成熟韵味表露无疑。 Chanel No.19(香奈儿19号)香水--8月19日是香奈儿女士的生日,沿袭No.5香水以简洁易记的数字命名,所以把香奈儿女士最后一支亲自推荐的香水,命名为No.19。该香水1970年问世。
法国葡萄酒
法国是世界上葡萄酒生产历史最悠久的国家之一,不仅葡萄种植园面积广大,葡萄酒产量大,消费量大,而且葡萄酒质量是世界上公认是第一的。
法国葡萄酒的分类
1,原产地名称监制葡萄酒(AOC)是法国葡萄酒中的极品,政府对这类酒的出品有严格的法规进行控制,这些法规涉及生产、葡萄品种、最低酒精含量、单位面积最高产量、葡萄栽培方法、酿酒方法,有时甚至包括储藏和陈酿条件等,“原产地名称监制葡萄酒”只有在符合了该酒的特定标准以后,才有资格冠以“地名监制”的美称,否则无权使用“地名监制”。
法国葡萄酒分类
2,特酿葡萄酒(VDQS)它的生产必须经过:“国家原产地地名协会”的严格控制和管理,其生产条件包括:生产地区、使用的葡萄品种、最低酒精含量、单位面积最高产量、葡萄栽培方法、酿酒方法等,在顺利通过官方委员会进行的品尝试验之前,这类酒不能从地方企业联合会取得VDQS标签
法国葡萄酒分类
3,当地产葡萄酒(VINS DE PAYS)又称乡土葡萄酒,该类酒只能用经认可的葡萄品种进行酿制,且葡萄品种必须是酒标上所使用地名的当地产品。
法国葡萄酒分类
4,佐餐葡萄酒(VINS DE TABLE)是除当地产葡萄酒外的佐餐酒,酒精度一般在8。5%-15%之间,他们可以是不同地区,甚至不同国家葡萄酒的混合品。
法国葡萄酒的分类
法国葡萄酒无论是佐餐葡萄酒还是AOC葡萄酒,开始生产直到被消费,都受到全方位的严格控制,控制内容涉及到生产、批发商、销售和消费等内容。
法国葡萄酒小常识
法国葡萄酒之所以最好,是因为法国在上述6大因素上的具备天赐优厚的条件。决定葡萄酒好坏的6大因素:葡萄品种、气候、土壤、湿度、葡萄园管理和酿酒技术。 同样的葡萄,如果种在山坡上就与山脚下不同。
法国葡萄酒小常识
例如,海拔上升则温度下降,采摘时间就得延后,另外,阳光照射时间也很重要,太少则酸,太多则甜,法国政府规定的葡萄从开花至采摘间的日照时数为1300小时;同理,如果土壤不同,质量也不同:土地越贫瘠,葡萄酒越好。土地肥沃则葡萄含糖量过高。湿度也重要:看的见河流的地方才能酿出好酒……
法国葡萄酒的真假鉴别
第一步,看酒瓶外观 · 看酒瓶标签印刷是否清楚?是否仿冒翻印? · 看酒瓶的封盖是否有异样?有没有被打开过的痕迹? · 看酒瓶背面标签上的国际条形码是否以3字打头:法国国际码是3 · 看酒瓶背面标签上是否有中文标识:根据中国法律,所有进口食品都要加中文背标,如果没有中文背标,有可能是走私进口,则质量不能保证。
法国葡萄酒的真假鉴别
第二步,看葡萄酒液 · 看葡萄酒的颜色是否不自然? · 看葡萄酒上是否有不明悬浮物?(注:瓶底的少许沉淀是正常的结晶体) · 酒质变坏时颜色有浑浊感
法国葡萄酒的真假鉴别
第三步,看酒塞标识 · 打开酒瓶,看木头酒塞上的文字是否与酒瓶标签上的文字一样。 在法国,酒瓶与酒塞都是专用的。
法国葡萄酒的真假鉴别
第四步,闻葡萄酒的气味 · 如果葡萄酒有指甲油般呛人的气味,就变质了 第五步,品葡萄酒的口感 · 饮第一口酒,酒液经过喉头时,正常的葡萄酒是平顺的,问题酒则有刺激感。
法国葡萄酒的真假鉴别
咽酒后,残留在口中的气味有化学气味或臭气味,则不正常。
好葡萄酒饮用时应该令人神清气爽。
买一本巴黎旅馆指南 在巴黎的旅游局导游所内,出售一种巴黎旅馆指南性质的小册子。"hotelset Résidencesde Tourisme",将从1区到20区乃至近郊的所有旅馆收集在内。虽然没有照片和详细说明,但它按区划分,要查旅馆的电话号码和价格却极为有用。一本只收10F,买一本,下次再来巴黎,要寻找旅馆住宿就太方便了。
注:除了法国的卢浮宫和凡尔塞宫,其他的旅游景点都不提供中文解说机 ,出行之前,学好英语。或买一本法语的日常会话,(配中文发音的)
巴黎的观光事务所 一到巴黎,首先要光顾的是观光问讯处Office de Tourisme。在香榭丽舍大街127号,设有中央事务所,不但可以帮助游客预约宾馆,而且还可以回答所有游客提出的问题,并赠与地图、宾馆饭店指南等。 除了香榭丽舍大街的事务所外,主要的车站、机场甚或是旅游旺季的埃菲尔铁塔等处也开设类似的事务所。
暸解法国国内旅游线路:www.tourisme.fr;
法兰西之家网站设有一个“年轻人旅游专栏”:www.;
可提供15天以内出发的削价机票的旅行社网站:
Degriftour 旅行社: www. ;
AIRPRICER旅行社:www.;
TRAVELRICE旅行社:www.travelprice.fr;
EUROLINES旅行社可提供乘大巴士畅游欧洲廉价旅游,共有1500多个目的地可供选择:www.eurolines.fr;
租车可查询 “黄页(PAGES JAUNES)” 专业电话号码簿中的 “租车” 栏目: www.pagesjaunes.fr。
制作:冉烺 蒋彦翃 高一(10)班
10.8---10.18
1 :有时资料与图片不符。
解决:把所需资料仔细品读,找出明了且正确的文段。
2:文字与图片无法看清。
解决:给文字加透明的底。或调节图片的亮度
困难
3:需要的资料查不到
解决:多查几遍。并换不同的关键词(共22张PPT)
声·色·校园
欢迎你来到“周三A班7组”的校园……
高血压心脏病患者请在家属陪同下观看……
袁瑗
高逸菲
安静的。
安静的。
安静的。
校园。
袁瑗
这里是你熟悉的地方……
谁说熟悉的地方没有风景。
袁瑗
当校园里没有我们……
只有雾的时候……
秋天来了……
叶子红了……
朱未名
这个淡定的季节……
中秋月圆……
却不幸造就了我的少白头。
——王力飞
袁瑗
“要活下去。” ——川端康成
花未眠。
高逸菲
乱七八糟
的
校园。
高逸菲
我们的领导班子!
老师:我们尊敬您!
高逸菲
他们究竟在看什么……?
嘿嘿。
袁瑗
苏彤
那些竞争的岁月……
袁瑗
袁瑗
朱未名
努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!努力!
苏彤
苏彤
苏彤
我们的演艺生涯
袁瑗
回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……
回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……回眸回眸一笑百媚生……回眸一笑百媚生……回眸一笑百媚生……
高逸菲
赵雯
我叫曹零。
这是我们的声色校园。
我们爱我们的声色校园。
赵雯TOC \o "1-3" \h \z
HYPERLINK \l "_Toc148244380" 一.搜索引擎的历史与发展 5
1.1 搜索引擎的历史 5
1.2 搜索引擎的发展 5
二. 搜索引擎的工作原理 8
2.1从互联网上抓取网页 8
2.2 建立索引数据库 8
2.3在索引数据库中搜索排序 8
三.搜索引擎的种类及其区别 9
3.1全文搜索引擎 9
3.2 目录索引 9
3.3元搜索引擎 (META Search Engine) 10
3.4非主流形式: 10
集合式搜索引擎 10
门户搜索引擎 10
免费链接列表(Free For All Links,简称FFA) 10
四.常见的搜索引擎及其特点 11
4.1 搜狐 11
4.2 网易 11
4.3 新浪 11
4.4 百度 12
4.5 Goyoyo 悠游中文搜索引擎 12
4.6 Google 12
4.7 Alta Vista 13
4.8 Yahoo 14
4.9 Yahoo!中文 14
4.10 InfoSeek 14
4.11 Excite 15
4.12 Lycos 15
4.13 Webcrawler 15
4.14 Open Text Index 15
五.常用的搜索技巧 17
5.1搜索之前先思考 17
5.2学会使用两个关键词搜索 17
5.3学会使用减号“-” 18
5.4点击搜索结果前先思考 18
5.5善于改正错误 18
常见错误1:错别字 18
常见错误2:关键词太常见 18
常见错误3:多义词 19
常见错误4:不会输关键词,想要什么输什么 19
常见错误5:在错误的地方搜索 19
六.搜索引擎的评价及参数 20
6.1 评价及起源 20
6.2 评价方法 21
6.2.1查全率 21
6.2.2搜索速度 22
6.2.3查准率 23
6.2.4死链接 23
6.2.5用户负担 23
6.2.6其它还有 24
七.特色网站介绍 25
7.1 特色搜索引擎简介 25
7.2寻人:众里寻他 26
环球搜索 Yahoo寻人搜索引擎 26
寻找外国朋友 Who where 27
搜索全球华人 Look4u 27
7.3搜图:“形形色色”的世界 28
优秀的图像搜索引擎 Google 28
Yahoo画廊 Yahoo图像搜索引擎 29
中文多媒体搜索引擎 VisionNEXT 29
7.4多媒体:让网络更生动 30
MIDI这里找 MIDI Explorer 30
博采众长寻洋歌 Cnet Music 31
“搜刮”华语MP3 SOGUA 31
同时搜索多种类型文件 FAST 32
轻松搜索流媒体文件 Stream Search 32
颇具特色的视音频搜索引擎 33
八.搜索引擎比较 34
8.1 Google数据 34
8.2百度数据 35
8.3新浪数据 36
8.4搜狐数据 36
九.心得体会 37
一.搜索引擎的历史与发展
1.1 搜索引擎的历史
1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan’s World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。
1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile
1.2 搜索引擎的发展
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。 而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。
然后到来的是HotBot。1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购)
Northernlight 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。
Teoma 起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Wisenut 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。
Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。
北大天网 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。
Baidu 2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。2001年8月发布搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
二. 搜索引擎的工作原理
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
2.1从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
2.2 建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大些?与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
2.3在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。
互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。
然而由于各种类型的搜索引擎工作原理并不尽相同,详细内容请见第三节中详细叙述。
三.搜索引擎的种类及其区别
3.1全文搜索引擎
在搜索引擎分类 ( http: / / www.se- / about / about1.htm" \t "_blank )部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。
另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
3.2 目录索引
与全文搜索引擎相比,目录索引有许多不同之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。
其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。
此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。
目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。
(注):Yahoo已于2004年2月正式推出自己的全文搜索引擎,并结束了与Google的合作
3.3元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo
3.4非主流形式:
集合式搜索引擎
如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
门户搜索引擎
如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
免费链接列表(Free For All Links,简称FFA)
这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。
四.常见的搜索引擎及其特点
4.1 搜狐
爱特信搜狐公司于98年2月25日在北京隆重推出的大型网上中文分类搜索引擎,目前已成为互联网上的第一中文网站。
最先进的人工分类技术
友好的全中文界面
符合中文语言文化习惯
18个部类、近10万条链接构成的树杈型网页结构
最直观、最轻松为网上用户提供所需要的内容。
4.2 网易
作为国内三大门户网站之一,网易一直保持着卓越的网络品牌形象。网易搜索引擎秉承网易“网聚人的力量”的宗旨,凭借强大的技术实力,为更多的中国网民和企业提供最有价值的服务,帮助企业乃至社会各界抢占网络时代之先机从而走向成功。
网易搜索引擎具备以下优势:
. 门户搜索引擎,网易超过4.39亿名累计注册用户,有着强大品牌支撑力和很高的用户粘着度;
. 中国最大的开放式目录管理系统(ODP),为广大网民提供了庞大的、高质量的检索数据
. 技术先进,是国内首屈一指的智能化搜索引擎;
. 页面日均访问量接近3000万次,查询速度快,链接成功率高;
. 与国际接轨,提供中文、英文、日文、俄文等几十种语言关键词检索;
. 与国内外知名的搜索技术服务提供商和渠道经销商具有良好的合作关系;
. 服务体系完备,拥有过个性化、专业化的服务队伍;
. 团结高效的优秀员工队伍,年轻且富有朝气,经验丰富且富有创新精神
4.3 新浪
新浪网搜索引擎是面向全球华人的网上资源查询系统。提供网站、网页、新闻、软件、游戏等查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。目前共有16大类目录,一万多个细目和二十余万个网站,是互联网上最大规模的中文搜索引擎之一。
新浪搜索为用户提供最准确、全面、详实、快捷的优质服务,以网民需求为本,使用户获得最满意的服务是新浪永恒的追求。近日,新浪网推出新一代综合搜索引擎,这是中国第一家可对多个数据库查询的综合搜索引擎。在关键词的查询反馈结果中,在同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,最大程度地满足用户的检索需要,使用户得到最全面的信息,这项服务在国内尚属唯一。
除了资源查询外,新浪网搜索引擎推出了更多的内容和服务,包括:新浪酷站、本周新站、引擎世界、少儿搜索、WAP搜索、搜索论坛等。
4.4 百度
百度公司是中国互联网领先的软件技术提供商和平台运营商。中国提供搜索引擎的主要网站中超过80%由百度提供。
百度公司自进入中国互联网及软件市场以来,就一直以开发真正符合中国人习惯的互联网核心技术为使命,依靠自身实力不断研发出拥有自主知识.
百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库、检索程序。
门户网站只需将用户查询内容和一些相关参数传递到百度搜索引擎服务器上,后台程序就会自动工作并将最终结果返回给网站。
百度搜索引擎使用了高性能的"网络蜘蛛"程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。百度搜索引擎拥有目前世界上最大的中文信息库,总量达到6000万页以上,并且还在以每天几十万页的速度快速增长。产权的可扩展的网络应用软件。
4.5 Goyoyo 悠游中文搜索引擎
Goyoyo是一个极具高度智慧的中文搜索器,随时带你畅游全球700,000个中文互联网网页,自动为你转换繁、简体字,让你悠游其间,乐也融融!
Goyoyo中文搜索器有超智能的Robot系统,分秒不停地穿梭於全球数以百万个互联网网页之中,寻找新网页和每日更新的资料,自动识别和分类。假如读者不懂任何中文输入法,也可以使用分类检索,而找到自已心目中所喜爱的文章;更可藉着相关网页的索引,进入其他有相连的网址,而绝不费神!
Goyoyo除了智慧型的搜寻,尚有精确匹配型。
Goyoyo 的分类主题搜索∶分类包括[人物]、[电脑网络]、[生活资讯]、[娱乐休闲]、[食衣住行]、[工商企业]、[艺术]、[政治]、[环保公益]、[自然科学]、[医药保健]、[社会]、[人文科学]及[教育] 等十四个主项目及其下的各类分项。
4.6 Google
Google 的使命就是要为您提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对 20 多亿网页进行整理,Google 可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒。现在,Google 每天需要提供 1.5 亿次查询服务。
两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。这家私人控股公司在 1999 年 6 月宣布,它已经集到了 2,500 万美元的资金。公司的投资夥伴包括 Kleiner Perkins Caufield & Byers 和 Sequoia Capital。Google 通过自己的公共站点 www. 提供服务。公司还为信息内容供应商提供联合品牌的网络搜索解决方案。
Google 搜索引擎使网络井然有序
Google 依据网络自身结构,清理混沌信息,缜密组织资源。Google 的搜索服务既不是简单的信息目录,也不是变相的商业广告。
10 亿网址供搜索
Google 目录中收录了 10 亿多个网址,这在同类搜索引擎中是首屈一指的。这些网站的内容涉猎广泛,无所不有。
Google 搜索引擎 只返回包含所有关键词的网页
与大多数其它搜索引擎的区别在于:Google 只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键词,而无须再受其它无关结果的烦扰。
Google 搜索引擎 遵从关键词的相对位置
Google 不仅能搜索出包含所有关键词的结果,并且还对网页关键词的接近度进行分析。与大多数其它搜索引擎的又一区别是:Google 按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果,这样可以为您节省时间,而无须在无关的结果中徘徊。
Google 搜索引擎 摘要萃取精华
不同于那些老生常谈的网站简介,Google 只摘录那些包含您的搜索关键词的内容。这样,您就不必为打开网页之后才发现它根本不相关而沮丧。
Google 搜索引擎 为您带来好手气!
Google 最擅长于为常见查询找出最准确的搜索结果。我们极力向您推荐“手气不错(tm)” 按钮,它会直接带您进入最符合搜索条件的网站,省时又方便。
Google 搜索引擎 储存网页快照
Google 储存网页的快照,当存有网页的服务器暂时出现故障时您仍可浏览该网页的内容。如果找不到服务器,Google 储存的网页快照也可救急。虽然网页快照中的信息可能不是最新的,但在网页快照中查找资料要比在实际网页中快得多。
4.7 Alta Vista
前DEC公司1995年底对外推出本服务,据称收集了2200万网页、13000个新闻组的全文数据,共110亿词汇,总容量达33GB。
本服务的特点是检索功能同传统的联机检索服务有很大的相似性,提供布尔AND、OR、NOT、NEAR算符操作和嵌套提问表达式、截词、联机帮助和举例帮助。
本服务提供简单、标准和详细三种输出格式;提供简单和高级两种查询方法。简单查询不支持布尔算符,而用不同句法的组合来表示词语、相邻词、必用词和禁用词,可用页名、URL、系统名称作为字段进行检索,检索结果按相关程度排序。高级查询采用与简单查询一样的句法来定义单词、词语、通配符和标点符号,但是可用布尔算符来组合单词和词语,用括号嵌套表达式。
4.8 Yahoo
WWW最著名的查询系统,提供免费查询服务,与Netscape公司关系很密切,Microsoft公司也选择它作为其传播媒介。
Yahoo数据库有65,000篇HTML文献和其它Internet资源,共20多万个条目,其最大特色是提供优秀的主题浏览工具,对网点信息按主题建立分类索引,按字母顺序列出14个大类,每个大类所包含的子类有精炼的描述,每个子类有数以千计的相关的Internet网点信息。
1996年本服务还引入了Open Text的索引和检索引擎,因此检索结果还包括其提供的网点地址,对新增加的网点有图标指示。
4.9 Yahoo!中文
Yahoo!中文是Yahoo! Inc.为全球中文读者所最新开发的网站,它收录了全球资讯网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,只要是好的中文网站,你都可以在这里找到。除了主题式分类目录外,Yahoo!中文也将陆续推出更多的内容和服务,敬请期待。
4.10 InfoSeek
1995年由Infoseek公司推出,对2500万WWW、FTP、Gopher、NewsGroups网点进行全文索引。是Web上的第一家收费的查询系统,但是检索结果在 100 个以内不收费。
本服务采用词频统计方法来确定词语的重要性和相关性,可按词序检索,词汇大小写有区别,采用双引号、连字符、加号、减号、括号来表示词间的句法。检索结果有描述内容,按相关性排列。本服务也可用于德语和日语词语的检索。
4.11 Excite
收集了5000万网页数据,采用一个称为“智能概念抽取”(ICE)的专用查询软件,允许用户使用自然语言提问,例如:“How to stay healthy by eating well”,或“Learn to speak Chinese”等。
本服务的特色有:
1. 用ICE自动编制摘要;
2. 概念检索,查询软件自动把同义词和相关词找出来(如查询“知识产权”可以把“软件版权”和“版权法”查出来);
3. 提供一个“FIND Similar”功能(例如查询“jordan”一词,这个功能可以区分是国家“约旦”还是篮球巨星空中飞人“乔丹”)。不过目前本服务只能处理简单AND 和 OR 布尔逻辑检索,还不能处理高级查询功能。
4.12 Lycos
可对1900万URL(包括FTP和Gopher)进行索引,覆盖95%的Web地址;但1900万网页不是全文索引,仅其中的360万有比较完整的索引。索引的内容为页名、URL、子标题、文本的前20行和 100个加权的词。
对提问可以选择5种匹配命中级别:松匹配、一般匹配、良好匹配、紧密匹配和强匹配。
另一个特色是建立了一个叫 A2Z 的 Lycos 数据库,收有最常用主页的主题目录。
本服务对每个系统有一、二个句子介绍,并指引到“Find Related Sites”,从这些网点的标题又可以获得进一步的可用词。
Webcrawler
是WWW查询引擎的元老之一。1994年开始联机服务。以350,000个关键词搜索建立索引,全文索引10万HTML文献。
检索结果按相关性排序,分简单和详细两种格式显示。支持自然语言查询和布尔算符查询,用户输入一串词语时可指定任何一词匹配或全部词语匹配。但是,本服务的检索结果只有Web页名,没有URL,也没有相关的解释。检索时可把复数转化为单数检索,但不能把children转化为 child。
本服务被认为可用于训练新用户,简便易用,响应时间好。
Open Text Index
对1900万个超文本链接点、100 万个WWW节点、FTP、Gopher服务器进行全文索引,索引总量达.68 亿个词语。提供简单查询、高级查询和加权查询。简单查询是基本的关键词AND和OR匹配;高级查询可指定位置进行关键词查询,例如对全网、摘要、网页名、第一标题、URL、超文本链接等进行布尔、邻接和字段查询;加权查询可对单词和词语加权,而且可以指定查询位置。输出结果按相关性排序,高级查询给出命中数。
用户界面灵活、功能强、易学易用;但是不能进行嵌套查询,不能截词检索,词语的多数变化作为新词处理。
五.常用的搜索技巧
最重要的搜索工具,是搜索引擎。人们经常把人工编辑的网站分类目录也叫做搜索引擎,但那是错误的,真正意义上的搜索引擎指的是网页全文搜索引擎。网页全文搜索引擎,其实是个大的索引表,记录了每个网页上出现过哪些关键词,当你输入某个关键词搜索的时候,所有含有这个关键词的网页就被找出来,并按一定顺序排列。网页全文搜索引擎的信息量大、准确性高、功能强、搜寻资料的速度也快,可以搜到你从未想过,甚至你不敢想像的内容,但前提是你要掌握一点使用技巧。下面笔者就来介绍几种最基本也是最有效的搜索技巧。
5.1搜索之前先思考
搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,而成为漏网之鱼。所以在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?如果有,可能在哪里,是什么样子的?网页上会含有哪些关键字?
有些东西你根本用不着麻烦搜索引擎的,比如要找个公司的电话,打个114的速度大概比搜索引擎快得多。又有些问题,可能很难用合适的关键字描述,或者不能直接用搜索引擎搜到,那你可以尝试找个精通这个问题的朋友,或者寻找这方面的热门论坛来问,这也是一种搜索方法。有时,你能选择的最好搜索方法是放弃网络,跑一趟附近的图书馆,图书馆里有网上找不到的成吨的“信息”。 当你确认你要找的信息适合通过搜索引擎在网上找之后,搜索到满意结果的概率就大得多了。
各种搜索引擎的特点泾渭分明,如果你没有为每次搜索分别选择正确的搜索工具,你将浪费掉大量的时间。这次搜索,你应该使用新浪还是搜狐 Google还是百度 分析你的需求,比较不同搜索引擎的强项和弱点,然后为这次搜索选择最适合的搜索工具。
5.2学会使用两个关键词搜索
如果一个陌生人突然走近你,向你问道:“北京”,你会怎样回答?大多数人会觉得莫名其妙,然后会再问这个人到底想问“北京”哪方面的事情。同样,如果你在搜索引擎中输入一个关键词“北京”,搜索引擎也不知道你要找什么,它也可能返回很多莫名其妙的结果。因此你要养成使用多个关键词搜索的习惯,当然,大多数情况下使用两个关键词搜索已经足够了,关键词与关键词之间以空格隔开。
比如,你想了解北京旅游方面的信息,就输入“北京 旅游”这样才能获取与北京旅游有关的信息;如果想了解北京暂住证方面的信息,可以输入“北京 暂住证”搜索;如果要下载名叫“xxxx”的MP3,就输入“xxxx 下载”来搜索。
5.3学会使用减号“-”
“-”的作用是为了去除无关的搜索结果,提高搜索结果相关性。有的时候,你在搜索结果中见到一些想要的结果,但也发现很多不相关的搜索结果,这时你可以找出那些不相关结果的特征关键词,把它减掉。
比如,你要找“申花”的企业信息,输入“申花”却找到一大堆申花队踢足球的新闻,在发现这些新闻的共同特征是“足球”后,输入“申花 -足球”来搜索,就不会再有体育新闻来麻烦你了。
5.4点击搜索结果前先思考
一次成功的搜索由两个部分组成:正确的搜索关键词,有用的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题、网址、摘要,会有助于你选出更准确的结果,帮你节省大量的时间。当然,到底哪一个是你需要的内容,取决于你在寻找什么,评估网络内容的质量和权威性是搜索的重要步骤。
一次成功的搜索也经常是由好几次搜索组成的,如果对自己搜索的内容不熟,即使是搜索专家,也不能保证第一次搜索就能找到想要的内容。搜索专家会先用简单的关键词测试,他们不会忙着仔细查看各条搜索结果,而是先从搜索结果页面里寻找更多的信息,再设计一个更好的关键词重新搜索,这样重复多次以后,就能设计出很棒的搜索关键词,也就能搜索到满意的搜索结果了。
5.5善于改正错误
经常会有这样的事情发生:你似乎已尽了全力来搜索,但是依然没有找到需要的答案。这个时候,请不要放弃,认真回顾检查你的搜索过程,也许只是因为一个小差错。一个看上去毫无希望的搜索,很有可能在你检讨完自己的搜索策略后获得成功。
下面描述了初学者搜索时容易犯的5个低级错误和解决方法,正是因为你经常犯这些错误,所以你总是得到无用的、荒谬的或者完全没有意义的搜索结果。而一旦你认识到这些错误,将很容易把这些小鬼从你的搜索经历中永远驱逐出去。
常见错误1:错别字
经常发生的一种错误是,你输入的关键词含有错别字。笔者所做的统计表明,常有大量的错误搜索,光一个谢霆锋就有“谢霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”、“谢庭峰”、“谢廷峰”6种查法,还有什么“星际争吧”、“以德制国”之类的,这样的关键词能搜索到什么有用资料吗?所以每当你觉得某种内容网上应该有不少、却搜索不到结果时,你应该先查一下是否有错别字。
常见错误2:关键词太常见
搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索“电话”, 有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海 常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的。
常见错误3:多义词
要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇 印尼”、“爪哇 咖啡”、“Java 语言”分别搜索可以满足不同的需求。
常见错误4:不会输关键词,想要什么输什么
搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到成都列车时刻表”。
网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。
而问题在于,没有一个网页上会含有“现代爱情故事歌词”和“上海到成都列车时刻表”这样的关键词,所以搜索引擎也找不到这样的网页。但是真正含有你想找的内容的网页,应该含有的关键词是“现代爱情故事”、“歌词”,“上海”、“成都”、“列车”、“时刻表”,所以你应该这样搜索:“现代爱情故事 歌词”、“信息早报 济南 发行”、“铃羊车 图案”“上海 成都 列车 时刻表”。
不要用你心中想的大白话去搜索,当搜索结果太少甚至没有的时候,你应该输入更简单的关键词来搜索,猜测你找的网页中可能含有的关键词,然后用那些关键词搜索。
常见错误5:在错误的地方搜索
2001年7月23日这一天,正逢高考发榜,各大搜索引擎竟有超过100万次以上的搜索跟高考查分有关。考生们不知道,搜索引擎从抓取网页、解析、索引到提供检索是有一个周期的,各搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容应该去看新闻,用搜索引擎是找不到最新内容,只能找到一个星期或一个月以前的内容。另外,搜索引擎对动态内容,如:论坛、数据库内容,以及带frame结构的网页检索能力较弱,所以这类信息也不适合用搜索引擎搜索,而是应该去相关的网站寻找,当然,寻找相关网站的任务搜索引擎是当仁不让的。
在你逐渐获得网络搜索经验的过程中,避免这些常见的搜索错误将成为一种自然而然的习惯。无论何时,当你得不到或得到意料之外的搜索结果时,记得检查一下你用的搜索关键词,分析一下搜索结果,弄明白发生了什么事,你可能会发现又一个需要避免的搜索错误。
搜索引擎是个好东西,掌握使用技巧后,你会发现互联网远比想像中的精彩,而你竟能自由自在地翱翔于互联网之上。让笔者用一句话表达自己的感受——“我们若能更妥善地搜寻资料,实在已经改变世界。”
六.搜索引擎的评价及参数
6.1 评价及起源
很久很久以前,搜索引擎还不象今天的百花齐放,人们对它的要求较低,只要它能把互连网上相关的网站搜出来,搜到的网站尽量多一点,无关的网站能少一点就能满足。所以那时候,人们评测搜索引擎的方法是用几个关键词,测试对比它们的搜索速度、搜索数量和无关网站的多少。简单说就是全快准。而那时的搜索引擎技术大家差别不大,所以这样的评测方法是可行的。
此后,独特的搜索引擎技术此起彼伏,层出不穷,到现在明显处于战国时代。但是,人们的评测方法却没多大变化,现在常见的评测还是简单的用几个关键词比较搜索速度、搜索结果数量和各自介绍的搜索准确性。
搜索引擎已经是广大网民非常熟悉的一个概念了。据调查,至少有超过80%的网民使用搜索引擎服务,进行诸如查找信息、寻求帮助、学习知识甚至寻找失去联系的亲朋好友等工作。目前搜索引擎是广大网民经常使用的第二大网络服务,仅次于电子邮件,它几乎已经成了我们生活中不可或缺的一部分。
作为使用Internet必不可少的工具,搜索引擎的地位越来越重要。同时,搜索引擎作为一个新兴的产业也在蓬勃发展。Google和百度的股价高涨也说明了这一点。成立不到10年的Google的市值甚至超过了老牌的大公司IBM和可口可乐。
搜索引擎产品竞争激烈,使得评判这些产品检索能力的优劣成为搜索引擎用户或者利用搜索引擎进行产品推广的企业的必然选择。当前搜索引擎的评价方式众多,进行评测服务的企业和组织也有不少。当前在搜索引擎的评价上存在着各种各样的或主观或客观的标准和指标。不过由于立场和侧重点不同,这些评价方式既有各自的特点,也都难免有一些缺陷。广大搜索引擎用户在参考这些评价报告时,也要注意从自己的实际需要出发,才能真正做到心中有数。
首先,我们必须弄清楚为什么样的目的去进行搜索引擎的评价。比如普通用户对于搜索引擎的期望和评价标准,与搜索引擎的研究机构以及投资企业就有着很大的不同。
对普通用户来说,最重要的显然是找到自己需要的信息。因而他们更关心哪个具体的搜索引擎更加好用,能够帮助自己更快、更好地找到需要的目标信息;或者在查找不同类型的资料时,如何选择合适的搜索工具。
远的不说,就在2001年第一季度升级后的askjeeves,你既可以象打普通电话一样在任何地方用手中的任何电话拨通askjeeves的电话号码,也可以在线惦记页面上的标记进入在线语音状态,用你电脑上的话筒和音箱交流。 然后你随便口头向它提一个要求,它会把你的语音转换成文字,然后分析你的要求,到它的700万标准问题答案、200万多媒体和其他储备库以及internet上去寻找答案,找到后再转换成语音回答你。
想象一下,如果你问它:“最近美国大选悬而未决,美国人怎么想?”过了一会儿,电脑或电话回答你:“根据最新的调查,假如最后是布什当选,80%的美国人会接受他为合法总统,假如最后是戈尔当选,79%的美国人会接受他为合法总统。”如果你问它:“上届世界杯决赛的球都是谁进的?“ 它在回答你姓名的同时还调出决赛进球的音视频片段让你欣赏(当然音视频片段的前提是你用的不是电话而是电脑)。
虽然,askjeeves认为它们的语音转换功能和搜索速度已经到了可以商业化的程度,但它还是会有很多不成熟之处的,如果拿几个关键词来测试它的搜索速度和查准率、查全率,和众多的普通搜索引擎相比,该把它排在哪里呢?如果排在很后边,难道它就是很差劲的搜索引擎吗?
单是评测internet搜索引擎已是件很难的事,而很多评测结果是给普通网民看的,势必要把Yahoo,新浪等门户包括进去,对于它们而言,internet搜索只是一部分,其它各种搜索功能怎么办?你要是不算,偏偏网民用得多;要是算吧,更是一团乱麻,何从比起?
6.2 评价方法
6.2.1查全率
既然是搜索引擎,首先比搜索范围是天经地义的事,如果这条不及格,后边的评测好象也不用参加了。由于收录网页的数量都是各搜索引擎自己宣布的,未可全信,而同一个关键词的搜索结果却是显而易见的,所以一般的评测都以这个为准。
但以这个为准还是有很多毛病,多数象样一点的搜索引擎我都可以找出一批关键词来证明它的搜索结果是最全的。因为网页索引数量虽然有大小,但robot和spider程序不同,索引范围和索引标准也不尽相同,在最大的搜索引擎上搜不到的有可能在小得多的搜索引擎上搜到。
有的搜索引擎支持“的,about,了,of,啊,么”等虚词助词搜索,有的不支持,这又如何来比?哪次评测提到过?
关键词除了内容难选择,在长短上也不好定。有的搜索引擎完全不支持单个汉字搜索,怎么算它?一般都只比较单关键词搜索,而多关键词的搜索呢?长句的搜索呢?甚至有搜索引擎能支持任意文章或片段作为关键词,这样比较出来的结果跟单关键词搜索出来的可是不一样的,更别提没法比的功能了。象excite这样语义搜索的引擎,还有支持模糊搜索的引擎,别的搜索引擎搜索结果极少甚至为零的关键词它们可以搜出一大堆结果,这又如何比较?
最后一点,搜索引擎是可以针对特定的关键词进行结果优化的,评测的公正性谁来保证?如果其中某个被评测搜索引擎事先知道所用的关键词,那么只要轻松优化一下,冠军就非它莫属了。
6.2.2搜索速度
搜索速度也是用户关心的一个重要特性。影响搜索引擎速度的因素主要有两个。一个是搜索引擎系统本身的信息查找速度,另一个是用户与搜索引擎之间的网络的速度。现在的著名搜索引擎在运行速度上一般基本都能令人满意,通常查找时间都在1秒以内,因而目前真正影响用户使用的主要是网络速度。由于搜索引擎和用户所处的网络位置不同,通常需要用户实际试验来确定对自己网络速度最快的引擎。
比完了查全率,就该比搜索速度了,如果有搜索引擎索引的网页虽多,但是搜索一次要五、六秒或更长,直接请它出局吧,没有比下去的意义了。
速度的问题首先还是在关键词,单关键词搜索快的不一定多关键词搜索快。
然后是访问量的问题,对一个日访问量一亿以上的搜索引擎和一个日访问量几万的搜索引擎作同样的测试本身已是不公平。
还有网页索引数量的问题,一个搜索引擎索引了10亿的网页,另一个搜索引擎索引了一千万的网页,让它们对同一个关键词在各自的数据库里搜索比搜索速度,这样的结果如何让人信服?
除了事先优化的问题外,有的搜索引擎本就具有记忆搜索结果加速调用的能力,一个关键词哪怕第一词搜索花了10秒,第二次搜索也许就2秒了,第三次,第四次,到你去测试的时候已经永远是0.0001秒了。这样,如果你选常见词测试,它快得惊人,如果来个偏僻词,也许老半天出不来,到底该选什么关键词?常用和偏僻各占多少?这真是一笔糊涂帐。
搜索引擎不是放在实验室的本地机上测试用的,而是给普通网友用的,所以这搜索时间应该还包括搜索界面和搜索结果的传输过程在内。一个搜索引擎搜索时间花了0.0001秒,但是传输结果网页花了3秒,另一个搜索花了0.5秒,但是传输网页结果花了一秒,你说哪个搜索引擎算快?真正用的时候,你选那个3.0001秒以后看到搜索结果的还是1.5秒以后看到搜索结果的?
6.2.3查准率
有调查结果显示,网民最关心搜索结果有效性。在选用搜索引擎最主要的依据上,超过一半的网民认为搜索结果准确度最重要。用户使用搜索引擎的直接目的是找到其所需要的信息,搜索引擎只要做到“查全”与“查准”,就能让用户基本满意。如果再将结果优化,使其对用户来说更加有效,那么用户对这个搜索引擎就会有很高的忠诚度。对用户来说,技术无所谓高低,达到目标就行,技术从低到高不断改进、不断满足需求就会使用户满意。
这个相当重要,搜到的东西即使又多又快,但你想要的那条结果不知道要翻多少页才能找到,那这搜索结果要来何用?这样的搜索引擎只有在查稀罕东西时才有用,但是要查稀罕东西应该去元搜索引擎呀,干吗要用它?查准率的评价标准很难定,得看你查什么,你要查一个特定的网站和找一群相似网站根本就是两回事。查准率的关键还是在于要搜什么和选择什么关键词,评测人可以随意定夺的,然后影响到评测结果的可靠性。
6.2.4死链接
网上的信息变化非常快。每天都会出现成千上万的新网页,同时也会有无数的网页失效。能不能及时地反映网上的信息变化,也是衡量搜索引擎的重要指标。一方面要看我们关心的新闻动态是否能够及时反映在搜索内容中。现在多数的搜索引擎,对于更新较快的新闻网站的索引时间都能够达到一天以内,好一些的甚至能能够做到一两个小时就能更新。另一方面,对于已经失效的页面也要及时剔除。如果搜索结果中存在大量“死链接”,就会让用户觉得效果很差了。
普通搜索引擎总有些搜索结果是点不进去的,少到百分之一二,多到百分之八九,这个也常被用作评测条件之一。但是象google使用了网页快照功能,几乎不存在死链接问题,就算搜索结果中的那个网站已关闭,你还是可以看到google自己储存的网页。这种死链接怎么计算?
6.2.5用户负担
还没见过国内搜索引擎评测有谁用过这一项,但它是评价搜索引擎优劣的重要因素,包括很多方面。搜索引擎是给人用的,一定要让人用得舒服方便快捷,任何妨碍和延迟用户到达最终搜索结果的都算用户负担。
首先是搜索界面,一个只有搜索框的纯粹搜索引擎界面跟一个带有广告和大量网页内容的门户相比,它们带给用户的搜索负担是高下立判的。
其次是搜索结果描述,搜索结果网页的文字描述是长还是短,网页文字描述采用索引带关键词的部分还是索引网页的开始几行还是索引网页的主要内容,关键词是否高亮显示又采用什么颜色,是否显示网页地址,还有搜索结果页面的布局,这些对于用户的搜索负担区别大大的有。
再者就是对用户操作步骤的影响,是否可以用鼠标启动搜索,搜索结果每页显示数量是否只有10条,翻页的便捷与否,搜索框是两个还是一个,放在上边还是下边,一次搜索后关键词是否还在搜索框中显示,这些每一条都会影响搜索效率。
6.2.6其它还有
是否支持本目录下搜索,
internet索引数据库更新时间长短,
搜索引擎的稳定性,
对高级搜索的支持能力强弱等也应该加以评测。
使用方便性也很重要。一个搜索引擎即使功能再强大,内容再丰富,如果操作烦琐,界面晦涩难懂,也很难得到用户的认可。
一个人想得不一定周到,可能还有其它重要评测要素没被我提及,网友若想到,望告知。看到这里,大家对目前常用搜索引擎评测方法的局限性一定有所了解了,当然最可笑的是,不知是无知还是猫腻还是选择标准比较特别,有的中文搜索引擎评测今年才做竟然没有包括google ,就好象排一长串小提琴名人却漏了帕格尼尼,呵呵。
评测搜索引擎实在是件很难的事。
七.特色网站介绍
7.1 特色搜索引擎简介
SOGUA
如果您要搜索中文的MP3歌曲,那么使用SOGUA将是明智的选择。
Sobit音乐搜索引擎
采用即时扫描网络资源,目前共有歌曲数据573363首,数据总容量1018.86G。
Google图像搜索
自称是互联网上最好用的图像搜索工具。
VisionNEXT
国内只有几家提供中文多媒体搜索引擎,它们基本上都是使用VisionNEXT公司的技术。
Yahoo寻人搜索引擎
如果您想网上寻人,可以考虑使用Yahoo提供的寻人搜索引擎。
Yahoo图像搜索引擎
Yahoo网站的工作人员收集整理的图像分类目录。
Lycos多媒体搜寻
在这个多媒体搜寻器上可以找到非常多的图像。
Excite多媒体搜索
与Lycos 及 Altavista 的比较,它搜寻出來的多是相片。
Who where
一个老牌的寻人网站,可以搜索电子邮件地址、电话与地址和公众信息。
Look4u
搜索全球华人。
Cnet Music
一次搜索,就能得到几个MP3搜索引擎在内的多个搜索引擎的搜索结果。
FAST
您可以同时搜索图像、音频、视频等多种格式的多媒体文件。
Stream Search
可以搜索到关于音乐、广播、电视、电影,甚至天气等各种专题的视音频文件。
SpeechBot 视音频搜索引擎
通过收集其他网站的多媒体文件,建立搜索数据库。
MIDI Explorer
如果您是一位音乐爱好者,想搜索一些MIDI文件。
7.2寻人:众里寻他
儿时的玩伴、求学时的同窗、过去的同事,经常会因时光的流逝,空间的变化,从此天各一方,失去联络,渐渐淡漠了友情,疏远了彼此。偶尔回忆起来,是否会觉得遗憾?随着网络的发展,现在您也许可以弥补这个遗憾。通过网络,我们不用再“众里寻他千百度”,只需使用专业的寻人搜索引擎,即可轻松地在网上寻人。著名的网上寻人网站,号称已经有超过一亿次的成功搜索记录,但它是个收费网站,并且价格不低,每搜索一次需要几十美金,显然不是我们所希望的。
环球搜索
Yahoo寻人搜索引擎
如果您想网上寻人,但是无法支付搜索费用,那么可以考虑使用Yahoo提供的寻人搜索引擎(http://people.)。因为在互联网方面,Yahoo曾领先一步,大多数网民都拥有或曾经拥有Yahoo的账户,使它在资源方面有很大优势,国际化特征明显,用户组成包含了全世界各国的网民。而且它的黄页也包含了大量的有用信息。因此,它应该是大范围寻人的较好选择。尤其当您寻找的人正好在某些非英语国家,找不到专门的搜索引擎,Yahoo的优势就更为明显。
使用Yahoo的寻人搜索引擎,提供的资料可繁可简,即使只有姓名的一部分,也能让您有所发现。当然,如果有更详细的信息,自然可以更准确地找到目标。在高级搜索中,您可以通过被寻找人所在地区、城市、学历等详细资料去搜索,查找目标的电话或电子邮件。由于Yahoo有各个语言版本的网站,所以支持非英文关键字,但是用中文搜索时效果一般。由于很多华人在注册时,没注意到国外的语言习惯,把姓和名字的位置颠倒了,所以当没有令您满意的结果时,您可以尝试把姓和名字交换位置,说不定就会柳暗花明。
寻找外国朋友
Who where
如果您希望找的人在欧美地区,则可以到Who where(http://www.whowhere.)试试。Who where是一个老牌的寻人网站,可以搜索电子邮件地址、电话与地址和公众信息。原有的通过姓名搜索家族族谱的祖先搜索功能,现在已改为收费服务了。电子邮件搜索方面,普通搜索以搜索对象的姓名为检索条件,如果使用高级搜索,可以从搜索对象所在城市、国家、学校、社会团体、企业单位甚至个人爱好等多方面进行搜索,既可以只提供一个项目,也可以指定几个项目,要求搜索同时符合所有条件的目标。电话与地址搜索是以姓名作为检索条件,另外还可以通过个人主页、美国政府机构工作人员名录、企业名录、美国800免费电话号码、美国黄页等各方面来检索。
Who where本身的数据库就非常庞大,而且还支持搜索美国政府机构工作人员名录、企业名录、美国800免费电话号码、美国黄页等数据库。在这里您可以查到几十万甚至几千万的企业或个人资料。只是资料大多是针对欧美或加拿大等国家或地区,比较适合搜索国外的信息。
搜索全球华人
Look4u
如果您要在网上寻找一位华人,那么笔者向您推荐Look4u(http://www./gb)。该网站收集了许多华人的资料,既有中国用户、也有在世界各地旅居的华人,主要集中在加拿大、澳大利亚、美国、马来西亚、菲律宾、新加坡等国家。您可以使用搜索对象的中文姓名或拼音、英文名、网名等资料进行搜索。
在Look4u的数据库中,台湾和香港的用户资料最多,其次是新加坡的华人,如果您要寻找的朋友恰巧住在这三地之一,那是再合适不过了。需要注意的是,因为该网站的搜索程序不能自动执行中文内码转换,如果对方的注册资料是Big 5码的,您也要用Big 5码输入搜索关键字,效果才会较好,否则搜索到的结果将大大减少。如果您对每次返回50条记录不满意,或希望使用更详细的搜索功能,那么您可以注册为Look4u的成员。该注册是免费的,成为会员后可以使用高级搜索功能,除姓名以外,您还能通过搜索目标的公司,曾经读过的学校,毕业学校等其他条件进行搜索,另外每次返回的搜索结果将从50条改为100条。同时,以后如果有其他人想要在网上寻找您,也可以在Look4u搜索到您的资料。
7.3搜图:“形形色色”的世界
长久以来,信息的多媒体化一直是人们的梦想。如今,它正在逐渐变成现实。一篇篇文章不再仅仅是枯燥的文字,图片、视频也成为了人们在网络上了解信息的有力助手。但由于这些资源和普通文本不同,使用传统的搜索引擎对其进行搜索,成功率不高。快速便捷地进行多媒体信息检索、查询和浏览,成为了人们的迫切需求,新的搜索技术也应运而生。目前,一些多媒体搜索引擎已经开始为人们服务。这其中,以图片搜索引擎为最多。
优秀的图像搜索引擎
Google
在过去的2001年度,Google 获得了《搜索引擎观察》杂志关于搜索引擎的五项大奖,其中就包括最佳图片搜索奖(另外的奖项是最佳搜索引擎大奖、最佳设计奖、对网站管理人员最友好奖和最佳搜索特性奖)。在文本搜索领域,Google的领先地位毋庸质疑,屡屡获奖(在CHIP2001年第9期的搜索引擎评测中荣获第一名)。在图像搜索引擎方面,Google一样是实至名归。
Google图像搜索引擎(http://images.)自称为“互联网上最好用的图像搜索工具”,虽有些夸张,但也体现出其信心和地位。与它的文本搜索引擎一样,Google有中文版的图像搜索网站,支持使用中文关键字进行搜索。使用方法也与文本搜索大至相同,分为高级搜索与普通搜索两种方式。在高级搜索方式下,可以使用“必须和下列的全部字词有关系”和“必须和下列的字句完全符合”等输入框,定义要搜索的关键字。您无需按照逻辑关系,在关键字间添加“+”、“AND”等逻辑符,只要用空格隔开即可。另外还可以指定搜索目标的大小、文件类型、色调等详细条件,也可以通过指定以网络域名区分搜索范围,有针对性地搜索某些区域。
Google图像搜索引擎的搜索结果非常令人满意,当笔者输入自己的姓名作为关键字时,能够找到笔者早年制作的一些图片。输入“刘德华”搜索时,返回900多个结果,其中有90%是演艺界名人刘德华的图片。当输入“CHIP新电脑”作为关键字时,Google找到了700多个结果,其中第一页就包括了多张《CHIP新电脑》杂志的封面。点击搜索结果的缩略图,能够以框架方式浏览该图片所在网页。通过框架右上角的两个链接,可以决定是返回搜索结果页面,重新选择图像,还是去掉当前页面的框架,继续浏览该网站,使用起来非常方便。在搜索速度方面,Google的表现也很优秀。如果使用宽带,每次搜索需要的时间可在1秒以内。
虽然Google是国外是搜索引擎,但对中文的支持很好,搜索结果的准确度也很高。综合它的整体表现,可以说无愧于“最佳图像搜索引擎”的称号,
Yahoo画廊
Google的Web搜索是通过使用自动化程序,在整个网络范围内收集图像信息,然后建立数据库供用户搜索。用户通过搜索引擎找到的图像,全部来自网络上的其他网站,用户通过访问这些网站,可以获得更多所需的信息。但这种方式也存在一定缺点,一是由于使用自动化程序处理数据库,即使采用最先进的程序,搜索结果中也难免会夹杂许多无用的信息。二是由于图像来自于其他网站,如果搜索引擎数据库的更新速度不快,用户搜索到的图像链接很可能已经不存在。
Yahoo的图像搜索引擎技术是以搜索站点目录为主,数据库由Yahoo网站的工作人员人工处理,把收集到的图像整理好并分类存放,供用户搜索并浏览。也就是说,用户在通过Yahoo图像搜索引擎(http://gallery.)进行搜索时,检索的只是Yahoo网站的工作人员收集整理的图像分类目录。这种搜索方式的优点是,所有的资源都是经过处理的,能够保证搜索结果的正确性,而且图像的质量也相对较高,体现了Yahoo自己给图像搜索网站的命名,让人感觉真的是置身一个画廊,一个图片库。但这种方法的缺点也显而易见,它需要耗费较多的人力和物力,而且由于收集的范围、数量问题,资源肯定没有Web搜索丰富,有时会导致用户无法找到所需要的图像。
目前Yahoo只有英文的图像搜索引擎,不支持中文关键字。共有十二个大类的图像,搜索时可选择是在全部分类中搜索,还是指定具体的分类。除了NBA等热门分类外,其他分类中的图像还不是很多。当输入“Great Wall”(长城)搜索时,只返回了12张图片,但是所返回的图片准确率度很高,而且每张图片的质量都很好。如果您对图片质量要求较高,并且不太在意数量,可以试一下Yahoo的图像搜索引擎。
中文多媒体搜索引擎
VisionNEXT
目前国内只有几家网站提供中文多媒体搜索引擎,而且它们基本上都是使用VisionNEXT公司的技术。该公司的搜索引擎技术面向明确,可以说是特意为中文搜索设计的。除了能结合图像分类目录和Web图像进行搜索外,还可以根据某个图像的基本特征,搜索同类图像,做到以图找图。另外它还有专用于中文搜索的中文分词索引、繁简互查功能,对用户使用中文搜索有很大帮助。该公司声称其中文多媒体搜索引擎功能强大,支持搜索各种类型的多媒体文件,如声音、图像或视频等。但目前,使用该公司技术的搜索引擎都仅提供图像搜索服务。
VisionNEXT公司本身有两个网站,用于测试其搜索引擎技术,简体网站是易易寻(http://www.),繁体网站是网图(http://www.want2.com.tw)。其中易易寻网站只提供图像搜索引擎及分类目录,其他图像搜索功能由网图提供。263搜索引擎(http://www.)和台湾网络家庭(http://www..tw)也使用VisionNEXT 公司的技术提供服务。但由于这种技术既采用了Yahoo的图像分类目录搜寻,又结合了Google的自动化收集数据搜寻,虽然这四个网站使用同样的技术,但搜索出来的结果却不完全一样。其中易易寻的图像分类目录中的内容相对比较丰富,而263所能够搜索到的图像最多,如果您有兴趣可以逐一访问。
7.4多媒体:让网络更生动
介绍了图片搜索引擎,您也许希望了解一些其他多媒体文件的搜索引擎。随着网络的发展,宽带的普及,一些以前人们想也不敢想的事情,现在都可以轻松地实现了。海量下载MP3,在线观看视频文件,都不再是梦想。这时,资源的匮乏就成为了瓶颈。这里,笔者就为大家介绍一些视音频文件的搜索引擎。
MIDI这里找
MIDI Explorer
多媒体信息种类繁多,复杂而又无序,任何一个搜索引擎也难以兼收并蓄,提供对所有多媒体文件都适用的搜索服务。我们介绍的多媒体搜索引擎可以说各有所长,如果您是一位音乐爱好者,想搜索一些MIDI文件,那么MIDI Explorer(http://www.)才是您的最佳选择。
在MIDI Explorer您可以通过所需MIDI的曲名,或者歌手、演奏家的名字进行搜索,并且可以设置搜索结果的排序方式。如果搜索MIDI名称,搜索结果将返回搜索到的所有MIDI文件。点击所需要的文件,MIDI Explorer将再次进行搜索,显示该MIDI文件能够在什么网页上找到,方便您的查找。搜索歌手或演奏家的名字时,如果MIDI Explorer已经为其编制了个人目录,则可以直接显示目录的链接、所收集MIDI文件的数量。如果您没有明确的搜索目标,也可以通过MIDI Explorer整理的分类目录来进行浏览。
另外MIDI Explorer还有两个兄弟站点,分别是专门提供歌词搜索的Lyrics Robot(http://www.),可以对吉他谱进行搜索的Tab Robot(http://www.)。
博采众长寻洋歌
Cnet Music
搜索MIDI文件用MIDI Explorer,那么搜索MP3该用什么呢?其实在多媒体搜索引擎里,最常见的就是MP3搜索引擎,3pmmp3、AltaVista、eMP3Finder、Epitonic、都提供很好的MP3搜索服务。但这里笔者要向您介绍的是Cnet Music(http://music.),您使用这个MP3搜索引擎搜索一次,就能得到包括上面提到的几个MP3搜索引擎在内的多个搜索引擎的搜索结果,无论如何也比逐一去搜索方便。
每次搜索,Cnet Music只显示各个MP3搜索引擎的前十个结果,然后按搜索引擎的名称分组,十个一组地按顺序排列。如果需要查看某一个搜索引擎的所有结果,可以点击该组下方的链接“See all matching results”,转到该网站继续浏览。当然,这时您不需要再次输入要搜索的关键字,可以直接进入搜索结果的浏览页面。Cnet Music的搜索引擎支持中文关键字,不过无论是使用中文还是拼音作为关键字,所得到的结果都不是很理想,所以不建议使用Cnet Music MP3搜索引擎去搜索中文歌曲。搜索英文歌曲才是它的长处。
“搜刮”华语MP3
SOGUA
如果您要搜索中文的MP3歌曲,那么使用SOGUA(http://www.)将是明智的选择。SOGUA是一个娱乐搜索引擎,网站的规模不是很大,页面也非常简单。但就是这个不起眼的网站,却有一个非常不错的MP3搜索引擎。这个搜索引擎简单易用,支持使用中文关键字,使用者只需要输入希望搜索的MP3歌曲名称,或演唱者的姓名就可以进行搜索。
SOGUA MP3搜索引擎检索的速度非常快,搜索结果的准确性也非常高,一般的歌曲都能够找到四五个可下载的链接,如果是比较热门的,则可以找到几十个下载链接。在搜索结果页面上,还会提供各个链接的可靠性评估,文件的大小,连接时的反应速度,最后检查的时间等详细资料,帮助使用者选择。另外,在搜索结果中,SOGUA还提供一个歌词的链接,只需点击这个链接可以自动调用SOGUA的歌词搜索引擎。
除了MP3和歌词搜索,SOGUA还提供试听歌曲、影视点播等其他几种多媒体搜索引擎,另外网站的论坛和其他娱乐栏目也相当不错,所有的内容都是以中文为主,非常适合中文用户。
同时搜索多种类型文件
FAST
FAST(http://multimedia.)是国外著名的多媒体搜索引擎,很多同类搜索引擎都会引用此引擎的内容,例如Lycos(http://multimedia.)等。
在FAST搜索多媒体文件,您可以同时搜索图像、音频、视频等多种格式的多媒体文件,图像支持JPEG、GIF、BMP三种格式,音频支持MP3、Wave、AIFF、RealAudio、MIDI五种格式,视频支持AVI、DivX、QuickTime、MPEG四种。所有的搜索结果都来自其他网站,FAST为每一个搜索结果提供预览和说明,同时还有可供下载的直接链接,以及该文件所在网站的地址。
目前FAST还不能支持中文检索,但对搜索影响不大。因为在网络上,很少使用中文命名文件,在搜索时直接查找中文,所得到的结果并不是最好的。如果您想搜索中文关键字,可以输入它的拼音。如要寻找关于刘德华的文件,可以输入“liudehua”进行搜索,可以找到几百张图片,几十个音频文件和一些MTV之类的视频文件。如果您搜索“Michael Jackson”(迈克尔·杰克逊),将可以找到数千个相关的资源。如果希望提高搜索的准确性,可以使用FAST的高级搜索。它除了能逐一定义搜索的文件格式,还可以通过定义文件是只能在线播放,还是可下载等选项筛选文件。通过背景是否透明、图像是什么色调等详细选项,定义要搜索的图像。
轻松搜索流媒体文件
Stream Search
Stream Search(http://www.)是一个以搜索在线播放的多媒体文件为主的网站。在Stream Search,您可以搜索到关于时事、经济、体育、音乐、广播、电视、电影,甚至天气、生活等各种专题的视音频文件。
Stream Search有一个中文网站(http://chinese.),但不能支持搜索中文关键字,只能用拼音搜索。根据网站的公告,搜索中文关键字的功能将在一两个月后推出。网站的内容大多数是从Internet收集,以国外的新闻、音乐、电影为主。除了提供搜索引擎服务外,Stream Search还将各种多媒体文件按不同的专题做成多个栏目,每个栏目的内容都非常丰富,而且有最近更新内容的介绍,让人觉得更像一个多媒体门户网站。
Stream Search网站的设计也非常友好,浏览起来很方便,初次访问的用户可以使用该网站的“检测播放器”功能,检测自己的计算机系统,确保已正确安装了所需要的播放器。然后只需点击分类目录下的多媒体文件名称或搜索结果,就可以直接在线欣赏了。
颇具特色的视音频搜索引擎
SpeechBot
Compaq公司的SpeechBot 视音频搜索引擎(http://speechbot.),也是通过收集其他网站的多媒体文件,建立搜索数据库。但相比其他搜索引擎,该站显得非常有特色。首先该网站选择了政治、军事、超自然力量、Internet等十个热门的分类,然后再为每个分类挑选几个资源丰富的网站,把搜索数据库的范围限制选定的几十个网站之内。这种方法既避免了自动化收集数据容易发生错链,内容过于繁杂的缺点,又可以在不投入更多的人力物力的情况下,让使用者找到更多的资源,可以说是两全其美。
SpeechBot支持通配符,另外其高级搜索功能允许指定搜索范围,可以专门对其搜索范围内一个或几个网站进行搜索。如果它搜索的网站中,恰好有您习惯访问的站点,那么使用SpeechBot将是您很好的选择。
八.搜索引擎比较
下面介绍几个搜索引擎的功能比较,由于没有很强大的统计技术以及很充裕的时间,所以评价可能会有失偏颇或者十分片面——但是我使劲了自己的努力去寻找差别看明白每个网站的特色,所以希望能够有较有意义的内容。
谢谢支持。
Google 速度 准确率 查全率
查找2006年北大附中网校夏令营情况说明 0.42s 前五页六条较准确 约有11,900项符合 无
伦敦地铁爆炸案 搜索用时 0.52 秒 基本准确 190,000项符合
查找2002年狮子座流星雨的情况和图片 搜索用时 0.19 秒 前四页较准,后面也有准的但概率不高。 约有7,900项符合(图像约117张)
查找小于200KB的FLASH指法练习小游戏 搜索用时 0.04 秒 前几页都不全准,但又都有准的,占40% 约有27,000项符合
查找我国最早的人口普查资料 搜索用时 0.19 秒 第一页全部准确,我很惊喜……后面偶尔有一片准的 约有64,500项符合
查找3个比较好的网上图书馆,了解它们的特点 搜索用时 0.12 秒 这么多——但好像很少是“网上”图书馆 约有4,520,000项符合
备注 博客搜索 ( http: / / blogsearch. / " \t "_blank )、Video搜索 ( http: / / www. / video" \t "_blank )、Flash搜索 ( http: / / www. / intl / zh-CN / features.html" \t "_blank )、大学搜索、商品搜索 ( http: / / froogle. / " \t "_blank )、Base搜索 ( http: / / base. / " \t "_blank )、个性化主页 ( http: / / www. / ig" \t "_blank )、手机搜索 ( http: / / mobile. / " \t "_blank )、搜索记录 ( http: / / www. / searchhistory" \t "_blank )和翻译网页功能。
评价 首先有一个很要命的问题就是这个网站好象经常出现一些很怪的连接中断出现,尤其是图片查着查着就不出东西了……不知道怎么回事。有很大的查全率,但会把很多没有太大关联的东西一并收入。不过也因此可以找到更全的东西。的确准确率是高了不少,虽然后面的很多都不是很有价值的。搜索用时我想很有网络的影响吧,不是在一个地方搜的所以会很慢……不过它应当还是可以的。所以总的来说信息类的东西找这里还是很有效率的,尤其如果在别的地方不是很好找的。
8.1 Google数据
8.2百度数据
百度 速度 准确率 查全率 相关链接(提示词)
查找2006年北大附中网校夏令营情况说明 用时0.128秒 共三条较准 找到相关网页86篇 100(10较准)
伦敦地铁爆炸案 用时0.058秒 基本准确 相关网页约84,500篇(图片38张) (8)
查找2002年狮子座流星雨的情况和图片 用时0.028秒 前三页较准(有当时的新闻) 找到相关网页约18,400篇(图片70张) (12)
查找小于200KB的FLASH指法练习小游戏 用时0.044秒 从第4页好像才比较准有30%,前面都是介绍打字的。 找到相关网页约4,580篇, 个人认为89条都挺准的。。。列出了好多指法游戏,很有用。
查找我国最早的人口普查资料 用时0.112秒 百度知道里有答案,还挺详细情况和那3个别的差不多,不过总在说人口普查,不是最早 找到相关网页约34,800篇 (30)
查找3个比较好的网上图书馆,了解它们的特点 用时0.029秒 几乎没有,好多关于网上图书馆的技术介绍 找到相关网页约971,000篇 (13)
备注 很有特色的相关链接,甚至可以看到每一个被别人查的次数。 “百度知道”是很大的提问专栏,也较有效。WAP搜索、地区搜索、百度知道、歌曲搜索
评价 不得不再提一下百度知道,那实在是一个解决问题的好地方。感觉时间较快,准确率好像稍高一些,而且信息量比较大。当然还有很令人佩服的链接量,那也是一个很有价值的东西,尤其是找寻相关软件的时候能够给予很大的帮助。而且它在图片方面还是有着更高的信息量的。所以我想它还比较算一个挺全的搜索器。同时还兼备着最大之一的歌曲搜索,也是很有效率的一个引擎。
8.3新浪数据
新浪 速度 准确率 查全率 相关链接(提示词)
查找2006年北大附中网校夏令营情况说明 用时 0.066 秒 一条 32 篇网页 1
伦敦地铁爆炸案 用时 0.195 秒 基本准确 找到 270,000 篇网页 9
查找2002年狮子座流星雨的情况和图片 用时 0.136 秒 较准至第三页 27,700 篇网页 10
查找小于200KB的FLASH指法练习小游戏 用时 0.072 秒 前几页准确率35%,出了很多flash小游戏但不是指法的 381,000 篇网页 无
查找我国最早的人口普查资料 用时 0.284 秒 仅三四篇较符合。剩下的都是中国别的情况。 36,400 篇网页 3
查找3个比较好的网上图书馆,了解它们的特点 用时 0.109 秒 有三四个推荐介绍的,但好像是论坛上别人问出来的。 1,380,000 篇网页 8
备注 有提问“爱问”服务。
评价 窗口不写网站名而写查找内容,方便查时了解自己在查什么(虽然不方便我做这项作业……)。有一些特殊的领域内容,比如查游戏的时候会出现很多别的flash小游戏,而最后又会查到比别的更多的论坛,所以感觉比较适合查软件技术和网比较有关类的东西,而且新闻的内容也很丰富。查找到的信息量比较大。
8.4搜狐数据
搜狐 速度 准确率 查全率 相关链接(提示词)
查找2006年北大附中网校夏令营情况说明 用时 0.224 秒 前两页仅一条较准 157 个网页 10
伦敦地铁爆炸案 用时 0.029 秒 前几页基本都是“相关”内容 518,857 个网页
查找2002年狮子座流星雨的情况和图片 用时 0.19 秒 准至前三页 15,928 个网页(单搜图片仅九张)
查找小于200KB的FLASH指法练习小游戏 用时 0.074 秒 前几页准确约60% 559 个网页
查找我国最早的人口普查资料 用时 0.047 秒 前几页仅10%剩下好多别的“最早” 66,325 个网页
查找3个比较好的网上图书馆,了解它们的特点 用时 0.19 秒 光查3个查不到,否则就是一个一个专门的网站没有总的介绍的。 286,011 个网页
备注 会点出一些非正常网站…… 可以自动排除“的”字等的干扰。商机搜索 ( http: / / b2b. / )、软件搜索 ( http: / / d. / softindex.html )
评价 比较快。每次都是有10个相关链接。感觉在技术性方面内容好像不是很强,但是似乎比较近的新闻还是有一定的量和准确性的。图片搜索还是有待改进。但是鉴于它有自己专门的商机和软件搜索,我想搜狐应当是属于一个更时尚更先进的包围圈里的搜索引擎。
九.心得体会
做这一次作业的体会还是挺深的。
首先就了解了“选择性粘贴”这一个东西,十分十分的有用。同时真的是了解了很多和搜索引擎有关的知识,都是平常自己不能太用心去想的。比如那一些不同类型的搜索方式,google还和新浪是根本两种体系,这都是以前不能够完全了解的。
技巧还是很有用的,关键词这东西就是关键——也明白了有的网站可以自动忽略“的”之类的。
当然在查资料的过程中发现真的有很多资料有的时候十分难以取舍,不过仔细看也能够从简单的介绍条中辨别出来是不是你想要的内容——可见这短短几行字的重要性。同时也了解了更多的技巧,尤其是后来搜索的时候发现怎么也找不出来的时候才发现应该多多利用技巧。而且其实出来的好多网页也就只有前面几页所符合的比较多——其实符合的内容也没有那么多,只不过联想能力太强了。而且搜集到最准的信息还需要各处采集汇总,甚至不同地方还会有小小的不同。但是许多信息,甚至是前几页的也会出现并不符合自己要求的问题——谁让有的网站不讲这个事,却偏要老提这个词呢……每个人的要求也毕竟是不一样的嘛。所以搜索网站的制作者也是很难办的。
看到那么多的特色搜索网站都是我以前不曾知道的,现在就明白要找什么特定的东西该去哪里了。
最后的比较还真是很难判断,尤其是感觉搜不到的好像都没有,比如网上图书馆之类的。但是各个引擎搜出来的并非我想要的信息所偏向的方向又是不同的。好像比较共同的特点就是新闻类,软件类,或者很明确的一类东西好搜。而那些寻求类好像就比较困难——也许是我还没掌握好技巧吧。因为听别人说好像都查明白了……但是可能是我搜的东西不够典型,只看到了整体的方向而看不出来个人的优势。我还是得改进,但毕竟还是了解了很多的东西的。
而一些比较不普遍的知识好像都能够查到,但并不是很多。其实也就是搜索的时候总是事实新闻很多,也就是说越新越热的东西好像越多。
像关于google明白很多。以前不曾清楚它的查全率那么大。现在就更明白了。而且一直以为百度的图片最好现在好像google更胜一筹呢。
还有就是查的过程中经常有很奇怪的网页,明明写得好好的,可是打开却什么都不是,而且还是很混乱的东西,让人很怀疑有病毒。
其实还有很多体会,慢慢自己品味吧。
搜索的道路还有很长,电脑行业继续,我也会继续的。
高一(1)
任晓媛一、信息技术应用实例
1、感测技术:触摸屏、电子体温计、血压计
2、通信技术:电话、E-mail、msn
3、智能技术:机器人、电脑、指纹识别
4、控制技术:遥控器、电控门、声控开关
二、信息技术应用实例分析
在神舟六号载人飞船的制造和发射过程中,需要多种科学技术的协同合作,其中,信息技术发挥着至关重要的作用。
神州六号飞船系统共由7大系统13个分系统构成,共有设备600余台,软件82个,元器件10万余个,并配备有录音设备。其中,7大系统分别是:发射场系统(控制技术)、运载火箭系统(智能技术)、航天员系统(智能技术)、载人飞船系统(感测技术)、测控通信系统(通信技术)、飞船应用系统(智能技术)、着陆场系统(控制技术)。在这七大系统中,大量用到IT技术与产品。
神六的发射场系统为载人飞船的发射提供全套的后勤服务,包括技术支持,航天员日常需求保障(智能技术),飞船的发射、测试以及指挥、调度(智能技术),应急救生(感测技术)、跟踪测量(感测技术)、安全控制(控制技术)等。发射系统需要用到超级计算系统(智能技术)以及用于供应链平台系统开发的软件产品(通信技术),以实现对飞船的协同控制。
三、想象未来
未来一定是信息技术的天下,人们会很依赖信息技术。比如:噪声起床会有闹钟性机器人,用闹铃、泼水、掀床等手段把你按时叫醒;下床后坐在可移动座椅上,带有温度计的衣柜会测量当天温度,帮你挑选衣服,机械臂帮你穿上,做一把你送到客厅;做饭机器人从储存的上万种菜谱中随即挑选当天的样式,在五分钟内做好;出门后有无人智能安全车送那上下学……总之以后的生活将被信息技术包围。(共15张PPT)
快乐的中学生活
组长:芶晓萌
组员:关典
图片采集、编辑:芶晓萌
铃!!!第五节课下课铃响了
楼道的宁静即将不复存在
图片采集:芶晓萌
图片编辑:关典
图片采集:芶晓萌
图片编辑:关典
图片采集、编辑:芶晓萌
图片采集、编辑:芶晓萌
图片采集、编辑:芶晓萌
图片采集:芶晓萌
图片编辑:关典
图片采集、编辑:芶晓萌
瞧这俩人!
从天上打到地下,难解难分,怎么还没有个结果呢?……
图片采集、编辑:芶晓萌
图片采集、编辑:关典
图片采集、编辑:芶晓萌
图片采集、编辑:芶晓萌
图片采集:芶晓萌
图片编辑:关典
图片采集:芶晓萌
图片编辑:关典
图片采集、编辑:关典
n
A
呀。把
拍到她上
样的镜属
拍到了
2真是网
兼居然在我净备抢球时
把球掉了 铠有些理!
宁静在此结束
通往食
午休在此开始
横批
饿狼传说
身做起中!!
以为我不知道怎
么回事儿 天知
道你们会用PhO
toshop把我加工
成什么形状
(振臂高呼
加工者注)
拒绝偷拍
捍卫肖像权!!
笑得多灿烂
老师教育
我们:要
做顶天
立地的
人
爱护草坪
XX山论剑
天下第一之争
祖国
到底是谁让我这个时候出来练灌篮
我招谁惹谁了 不
周四下午再凶险不过
殳听说
过是帮我哥们儿上四班的无良摄影者们正凶分极恶端
镜头
您看他
相机满学校游荡吗 (指笔者
这个头灌篮不容易屏幕后一脸黑线的菜鸟加工者注)
吧 —那个菜
乌作者居然把我
涂掉一半,而且留
下的形状还是支离
破碎,这家伙当年
Photoshop怎么学的
似乎端着相机凶恶四
游荡的不正班
菜
者关典注,(请据图为远处
观望的二班偷拍者)
他在求婚吗 !
画外音
灌蓝高手,杯是
老师害羞了!
谢绝拍照!
谢谢合作目录:
TOC \o "1-3" \h \z 搜索引擎的历史和发展 2
引擎的工作原理 6
搜索引擎的种类及其区别 7
■ 全文搜索引擎 7
■ 目录索引 8
■其他 8
各种搜索引擎 8
代表网站及其特点 8
搜索引擎的比较及其参数 9
特色网站介绍 12
使用搜索引擎 13
常用的搜索技巧 13
如何正确选择搜索引擎 16
我的心得体会 16
搜索引擎的历史和发展
1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage ( http: / / www. / mediapolis / emtage.html )、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ ( http: / / www.ou.edu / research / electron / internet / archifaq.htm ))。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ ( http: / / cnet.windsor.ns.ca / Help / Inet / gopher.html ))搜索工具Veronica(Veronica FAQ ( http: / / www.ou.edu / research / electron / internet / veronica.htm ))。Jughead是后来另一个Gopher搜索工具。
Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ ( http: / / / fafaqsspy01.html ))程序。世界上第一个Spider程序,是MIT Matthew Gray ( http: / / www.mit.edu / people / mkgray / )的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster ( http: / / www.greenhills.co.uk / mak / mak.html )创建了ALIWEB ( http: / / www. / )(Martijn Koster Annouces the Availability of Aliweb ( http: / / groups. / groups selm=1993Nov30.093536.28554@cs.nott.ac.uk&output=gplain )),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm ( http: / / groups. / groups selm=2m31s9$pq0@falstaff.css.beckman.com&output=gplain ))、NASA的Repository-Based Software Engineering (RBSE) spider。JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
Excite ( http: / / www. ) 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile ( http: / / www. ))
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy ( http: / / www.galaxy.com )(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang ( http: / / web.archive.org / web / 19990508183250 / http: / / akebono.stanford.edu / users / jerry / )(杨致远)和David Filo共同创办了Yahoo ( http: / / www. )(Jerry Yang Alerts a Usenet group to the Yahoo Database ( http: / / groups. / groups selm=JERRY.94Sep20185952@akebono.stanford.edu&output=gplain ),1996年的Yahoo ( http: / / web.archive.org / web / 19961017235908 / http: / / www2. / ))。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture)
1994年初,Washington大学CS学生Brian Pinkerton ( http: / / www. / bp / )开始了他的小项目WebCrawler ( http: / / www. / )(Brian Pinkerton Announces the Availability of Webcrawler ( http: / / groups. / groups selm=2r0rnm$ftj@news.u.washington.edu&output=gplain ))。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(注:后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos ( http: / / www. )(Carnegie Mellon University Center for Machine Translation Announces Lycos ( http: / / groups. / groups selm=32u1ec$14qr@msuinfo.cl.msu.edu&output=gplain ))是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin ( http: / / web.archive.org / web / 20010512074906 / http: / / www. / lti / vita.html )将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek ( http: / / www. )(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine ( http: / / groups. / groups selm=30cvtt$4u8@corp.&output=gplain ))是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初是否第一个登台并不总是很重要。Infoseek的友善用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture ( http: / / www. )的搜索结果)
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup ( http: / / / searchday / 02 / sd0918-meta1.html ))。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg ( http: / / web.archive.org / web / 20010407110524 / www.cs.washington.edu / homes / speed / home.html ) 和 Oren Etzioni ( http: / / www.cs.washington.edu / homes / etzioni / )的 Metacrawler ( http: / / www. / )。(注:元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。)
DEC的AltaVista ( http: / / www. )(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach ( http: / / www. )单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release ( http: / / groups. / groups selm=9512151806.AA02246@raptor.pa.dec.com&output=gplain ) ( http: / / groups. / groups selm=9512151806.AA02246@raptor.pa.dec.com&output=gplain ))。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。
而Altavista的另一些新功能,则永远改变了搜索引擎的定义。
AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。(2003年2月18日,Altavista被Overture收购。)
然后到来的是Inktomi ( http: / / www. )。1995年9月26日,加州伯克利分校CS助教Eric Brewer ( http: / / www.cs.berkeley.edu / %7Ebrewer / )、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi ( http: / / groups. / groups selm=44elvm$3td@agate.berkeley.edu&output=gplain )),1996年5月20日,Inktomi公司成立,强大的HotBot ( http: / / www. )出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(注:Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购;inktomi于2002年12月23日被Yahoo收购)
Northernlight ( http: / / www. ) 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(注:2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch ( http: / / nlresearch. / ),选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google ( http: / / www. )只是Stanford大学的一个小项目BackRub ( http: / / web.archive.org / web / 19971210065425 / backrub.stanford.edu / backrub.html )。1995年博士生Larry Page ( http: / / www-pcd.stanford.edu / %7Epage / )开始学习搜索引擎设计,于1997年9月15日注册了的域名,1997年底,在Sergey Brin ( http: / / www-db.stanford.edu / %7Esergey / )和Scott Hassan ( http: / / www. / hassan / homepage / index_html )、Alan Steremberg ( http: / / www-cs-students.stanford.edu / %7Ealans / )的共同参与下,BachRub开始提供Demo ( http: / / web.archive.org / web / 19971210065417 / http: / / backrub.stanford.edu / )。1999年2月,Google完成了从Alpha ( http: / / web.archive.org / web / 19981111183552 / google.stanford.edu / )版到Beta ( http: / / web.archive.org / web / 19981202230410 / http: / / www. / )版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank ( http: / / patft.uspto.gov / netacgi / nph-Parser Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u= / netahtml / srchnum.htm&r=1&f=G&l=50&s1=%276,285,999%27.WKU.&OS=PN / 6,285,999&RS=PN / 6,285,999 )、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
Fast(Alltheweb) ( http: / / www. )公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP ( http: / / www.dmoz.org )自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)
Teoma ( http: / / / ) 起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis ( http: / / www.cs.rutgers.edu / %7Egerasoul / )教授带领华裔Tao Yang ( http: / / www.cs.ucsb.edu / %7Etyang / )教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves ( http: / / www. )收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Wisenut ( http: / / / ) 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart ( http: / / www. )收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。
Gigablast ( http: / / / ) 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。
Openfind ( http: / / www. / cn.web.php u=cn ) 创立于1998年1月,其技术源自台湾中正大学吴升 ( http: / / www.cs.ccu.edu.tw / %7Esw / )教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。
北大天网 ( http: / / e.pku. / ) 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。
Baidu ( http: / / www. ) 2000年1月,两位北大校友,超链分析专利 ( http: / / 164.195.100.11 / netacgi / nph-Parser Sect2=PTO1&Sect2=HITOFF&p=1&u= / netahtml / search-bool.html&r=1&f=G&l=50&d=PALL&RefSrch=yes&Query=PN / 5920859 )发明人、前Infoseek资深工程师李彦宏 ( http: / / www. / about / 02.html )与好友徐勇 ( http: / / www. / about / 02.html )(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
引擎的工作原理
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。
真正意义上的搜索引擎,通常指的是收集了互联网上几千万到几十亿个网页并对网页中的每一个文字(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。
现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的文字,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如“恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦 ( http: / / / so / )”指向这个网页A,那么用户搜索“恶魔撒旦”时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦 ( http: / / / so / )”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。
搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并 沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页 收集回来。
建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页文字的更新情况,增加新的网页信息,去除死链接,并根据网页文字和链接关系的变化重新排序。这样,网页的具体文字变化情况就会反映到用户查询的结果中。
互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几千万至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的网页。而互联网上有更大量的网页,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。
你心里应该有这个概念:搜索引擎只能搜到它网页索引数据库里储存的网页文字信息。你也应该有这个概念:如果搜索引擎的网页索引数据库里应该有而你没有搜出来,那是你的能力问题,学习搜索技巧可以大幅度提高你的搜索能力。
搜索引擎的种类及其区别
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
■ 全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
■ 目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
■ 元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有 InfoSpace ( http: / / www. / )、 Dogpile ( http: / / www. / )、 Vivisimo ( http: / / www. / )等,中文元搜索引擎中具代表性的有 搜星搜索引擎 ( http: / / www.soseen.com / )。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
■其他
1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
各种搜索引擎
代表网站及其特点
常用中文搜索引擎
Baidu www. ( http: / / www. ) 约1.24亿中文网页,平均2周更新一遍,对部分网页每天更新。提供百度快照、网页预览/预览全部结果、相关搜索词、错别字纠正提示、Flash搜索 ( http: / / flash. )、信息快递 ( http: / / ix. )、百度搜霸 ( http: / / bar. / baidubar / )、搜索援助中心 ( http: / / forum. / cgi-bin / forum / board_show.cgi id=1&age=30 ),推荐使用MP3搜索 ( http: / / mp3. )。Baidu搜索技巧 ( http: / / www. / search / jiqiao.html )
Google中文 www./intl/zh-CN/ ( http: / / www. / intl / zh-CN / ) 中文网页数不详,按比例推算约8500万。平均1月更新一遍,对部分网页每日更新,由 BasisTechnology ( http: / / www. / news / press-releases / 2001 / google-061901.html ) 提供中文处理技术,搜索相关性高,高级搜索语法丰富。提供Google工具条 ( http: / / toolbar. / intl / zh-CN / )、网页快照、图像搜索 ( http: / / image. )(4.25亿图片)、新闻组搜索。Google搜索帮助 ( http: / / www. / intl / zh-CN / help.html )
Alltheweb
(Fast) www. ( http: / / www. ) 4480万简体中文网页,1401万繁体中文网页,需单选中简体中文语言搜索,否则效果不好。
Openfind中文 www./cn.web.php u=cn ( http: / / www. / cn.web.php u=cn ) 中文网页数不详,从检索效果上看与Google相近。更新较慢,提供按网页大小或日期排序。Openfind查询秘诀 ( http: / / www. / aboutus / cn / aboutus_cn_2.htm )
北大天网 http://e.pku./ ( http: / / e.pku. / ) 约6000万网页,更新略慢,搜索相关性较低。提供天网搜霸 ( http: / / / )、历史网页。推荐使用ftp搜索 ( http: / / bingle.pku. / )。天网使用帮助 ( http: / / e.pku. / gbhelp.htm )
搜索引擎的比较及其参数
1、搜索准确率
Google:在搜索到的全部20个结果中有8个成功显示出M65手机的价格,最先显示出来的是第2条,准确度40%。
百度:在20个搜索结果中有9个成功的显示出了M65手机的价格,其中搜索结果的第一项就就显示出价格范围,准确度45%。
一搜:在20个搜索结果中成功的显示出价格的为5个,其中最先成功的为第3项,准确度25%。
中搜:在20个搜索结果中有8个成功的显示出价格,且第一项结果里就看到了价格,准确率40%。
搜狗:21个搜索结果里成功显示价格的为8个,但是其中有几个是重复的,第一个成功的结果在10项以后,准确率为30%。
新浪和网易由于使用了google的技术,从搜索结果上看它们的数据库也是一样的,准确率一样为40%。
2、网页快照
随着时间的流逝,部分网站可能会关闭或者对较老的资料进行了删除更新,这样就有一部分资料无法查询,为了解决这个问题,各大搜索引擎都推出了快照功能,在搜索引擎的网站服务器上保存了互联网上几乎所有网站的大部分页面,在不能链接到所需网站的时候,也能使用网页快照功能调出搜索引擎为您暂存的网页救急。下面笔者就来测试一下几大主流搜索引擎打开快照功能的成功率。测试中笔者选取了老掉牙的微机型号——"486DX100",结果以20个快照的成功比率来计算。
Google:在第一次进行测试的时候可能是网络方面的问题20个快照没有一个打开的,但是使用相同数据库的新浪和网易却可以打开,在第二天补测的时候前10个快照打开,后10个失败,成功率不如使用相同数据库的新浪、网易,成功率50%。
百度:20个搜索结果的快照全部成功打开,成功率100%,看来以后要是找老文件就得靠百度了。
一搜:20个结果的快照全部成功打开,成功率100%。
中搜:20个搜索结果的快照打开了17个,成功率85%。
搜狗:20个搜索结果的快照全部成功打开,成功率100%。
新浪:20个搜索结果中快照成功打开16个,成功率80%。
网易:与新浪使用了相同的数据库,所以它的成功率与新浪相同,成功率80%。
3、分类搜索
分类搜索引擎采用网站登录/收录方式,依据主旨、用户对象及网络资源状况构建分类体系,把收集到本地的网站页面进行人工编辑,层层类分,形成纵向隶属、横向关联的网站目录数据库。这样可以近一步缩小搜索范围,从而减少有用户的搜索时间。
目前的分类主要包括图片、音乐、新闻等,下面笔者就以一实例来做个准确度的测试。MP3是目前搜索绿比较高的文件,在测试中笔者选取了最近较流行的歌曲"七里香"的MP3文件,结果以前20项所有连接的下载成功率来计算。
Google:因为google没有专用的音乐下载分类,所以笔者使用了"七里香+下载"为条件进行搜索,在搜索的前20个结果全部需要开新页面进行下载,其中成功数仅为8个,但这对只是用普通搜索功能进行的测试来说已经是个不错的结果了,成功率 40%。
百度:20项全部可以下载,而且有文件大小和速度标识,但有两项下载的不是七里香的MP3,成功下载连接18,成功率90%。
一搜:20项搜索结果全部下载成功,下载界面文件类型、速度等标识齐全,不过下载时需要打开二级网页进行下载。成功率 100%。
中搜:20项搜索结果全部下载成功,下载界面文件类型、速度等标识齐全,不过有五项是其专集里的其它歌曲,成功率 75%。
搜狗:由于搜狗也没有专门的音乐搜索引擎,笔者的搜索条件仍为"七里香+下载",搜索结果全部在二级网页,经过一番努力笔者只成功的下载了7个。成功率 35%。
新浪:与百度和一搜一样有专门的MP3分类,搜索结果界面标识齐全,20个搜索结果全部可以下载,但有一个不完全只有几秒,2个错误的歌曲,下载成功率 85%。
网易:网易拥有专门的音乐搜索引擎,而且界面做得很别致,下载界面歌曲的各项标识齐全,可能是由于其音乐搜索功能还在建设完善中的原因,20项下载结果中有7项下载结果不符,1项无效,成功率为60%。
三、高级搜索
为了能做到万里挑一,更准确、更省时的找到相关信息,部分专业搜索引擎还提供了"高级搜索"功能。其中Google和百度在这方面做的比较出色,从关键位置、到文件格式、发布时间可谓详尽。
特色网站介绍
各大搜索引擎为了在竞争中占有更大的市场份额,除了基本的图片、网站等基本搜索功能,纷纷推出了个性服务。
Google:手气不错、论坛搜索、目录搜索
手气不错,输入搜索关键字都点击"手气不错"可以快速找到google为您推荐的最佳网页。
论坛搜索,常泡论坛的朋友都知道,网络上有部分信息论坛中的发布时间要早于网站,而且有的信息只能在论坛上才可以看到。为此,gooogle也特别设置了论坛搜索功能,专门用来查询并观看各讨论区里的留言信息。
目录搜索,Google 的网页目录能帮助您了解各分类主题的相关程度,使用网路目录检索,能将搜索范围局限于特定的分类内,略去类似但无关的其它网页。例如检索各『大学』,如果将搜索范围设定于『教育机构』的分类内,便可略去其它网页像是『大学书城』等信息。
百度:贴吧
贴吧,百度的贴吧是个类似BBS的功能,可以在里边随意的发表信息,而贴吧搜索则是可以在这些发表的信息中进行搜索。
新浪:黄页、万师行
通过黄页功能可以快速找到万方数据提供的企业地址、简介等相关信息,使用"万师行",可以快速找到各个行业的专业服务者。
网易:时尚搜索
时尚搜索,利用网易的时尚搜索功能,可以快速搜索到可视手机、汽车改装等最新、最炫的时尚信息。
使用搜索引擎
常用的搜索技巧
细化搜索条件
你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。
比方说你想查找有关电脑冒险游戏方面的资料,输入game是无济于事的。computer game范围就小一些,当然最好是敲入computer adventure game,返回的结果会精确得多。
有时你甚至可以问搜索引擎一个问题,返回结果的准确度会让你不得不佩服搜索引擎功能的强大。
一次,我们想查找有关根据IP地址判断访问来源方面的资料,由于知道以“IP address”搜索没用,加上搜索条件比较复杂,无法以单个的词或词组查询,因此我们干脆在Google搜索引擎中输入了整句话:
■ How to recognize a visit from its IP address
结果在返回的网页链接中,第一个就是我们需要的。该网站不仅提供根据IP进行访问来源查询,还用虚拟现实(Virtual Reality)技术在地图上指出来源所在的城市!
可以看出将搜索条件细化,能够大幅提高你的搜索效率。
由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入"电脑游戏 冒险",而不是"电脑冒险游戏"。
此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略。
用好逻辑命令
精确搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度。比较一下下面各搜索条件的含义:
■ computer adventure game
最基本的搜索方式。查找与该关键词有关的记录,在过去通常情况下相当于布尔逻辑命令中“OR”的关系,翻译过来就是:
computer (OR)adventure(OR)games
因此搜索结果中不仅有同时包含三个关键字的记录,也有仅含部分关键字串(如 computer games)和个别关键字(如computer)的记录。目前搜索引擎的趋势是默认匹配全部关键词搜索,即仅返回包含所有关键词的记录,相当于下面将介绍的“+”号和AND的关系,当然有时也有例外。
■+computer +adventure +game
相当于布尔逻辑命令中的“AND”关系,翻译过来就是:
computer(AND)adventure(AND)games
因此搜索结果中只列出同时包含三个关键字的记录。在搜索条件中使用“+”号还可强制搜索引擎将一些停用词当作关键词进行搜索。比如我们搜索“who am i”时,其中“who”和“i”是停用词,我们可以在两个单词前加上“+”号强制对其进行搜索,此时的搜索条件即可为:+who +am +i。
■+computer +game -adventure
翻译过来就是:
computer(AND)game(NOT)adventure
列出所有包含computer game的记录,但在其中排除有关adventure的记录。
综上所述,“+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容。
精确匹配搜索
■ "computer adventure games"
它与 +computer +adventure +games 的区别是:
虽然后者限定网页中要同时包含三个关键字,但其顺序和相邻位置允许是任意的。而前者不仅要求网页中必须同时包含三个关键字,关键字的顺序也要求完全相同,并且它们必须还是挨在一起的,所以带“”号的查询范围更小。
此外使用“”号进行精确匹配查询还可用于达到我们特殊的搜索目的。比如一般情况下“who”、“i”作为停用词被搜索引擎忽略,但有时在搜索特别类型的信息时又必须包含这些停用词(如搜索影片名称“Who Am I”),这时我们就可以将全部关键词用“”号引起来,就可以强制搜索引擎将停用词作为短语的一部分进行搜索。
通过对上面这些逻辑符号的组合,能组成复杂的搜索条件,如"computer game" -adventure +new等等,从而使查询结果更加准确。
特殊搜索命令
■ 标题搜索
多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,在Yahoo中是“t:”(注意冒号为英文字符且后面不跟空格)。在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。请看下面的例子:
· title(或t):computer adventure games
· title:+computer +adventure +games
· title:+computer +games -adventure
· title:"computer adventure games"
返回的结果都是标题中包含关键字、词的信息条目。
■ 网站搜索
此外我们还可以针对网站进行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。如想查找AAA游戏制作公司网站的所有网页,可以输入:
· site(或host/url/domain):www.
还可以在其中加入其他命令组成复杂的搜索条件,如:
· site:www. +title:"computer games" -adventure
意思是查找AAA公司网站中所有标题里含有computer games的网页,但排除关于冒险游戏的网页。
说到这里大家可能已经意识到了,运用此命令我们可以达到一个极其重要的目的,就是检查我们的网站被索引的网页有多少。因此建议大家牢记这个命令。另外运用“site/host/url/domain”等搜索命令还可实现某一网站的站内搜索。比如Google引擎由于技术的先进性,通过其“site”命令实现的网站内部搜索甚至比专门的站内搜索程序还要好。
■ 链接搜索
在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inbound links)。如:
· link:www.
■表述准确
搜索引擎会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。
一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻 ( http: / / www. / s ie=gb2312&bs=%C1%D6%C7%E0%CF%BC%2B%D0%D5%C3%FB%2B%C9%ED%B8%DF&sr=&z=&wd=2004%C4%EA%B9%FA%C4%DA%CA%AE%B4%F3%D0%C2%CE%C5&ct=0&cl=3&f=8" \t "_blank )”;但如果把查询词换成“2004年国内十大事件 ( http: / / www. / s wd=2004%C4%EA%B9%FA%C4%DA%CA%AE%B4%F3%CA%C2%BC%FE" \t "_blank )”,搜索结果就没有能满足需求的了。
另一类典型的表述不准确,是查询词中包含错别字。
例如,要查找林心如的写真图片,用“林心如写真 ( http: / / www. / s wd=%C1%D6%D0%C4%C8%E7%D0%B4%D5%E6" \t "_blank )”,当然是没什么问题;但如果写错了字,变成“林心茹写真 ( http: / / www. / s wd=林心茹写真" \t "_blank )”,搜索结果质量就差得远了。不过好在,百度对于用户常见的错别字输入,有纠错提示。您若输入“林心茹写真”,在搜索结果上方,会提示“您要找的是不是: 林心如写真 ( http: / / www. / s wd=%C1%D6%D0%C4%C8%E7%D0%B4%D5%E6" \t "_blank )”。
查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。 还是用实际例子说明。某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言 ( http: / / www. / s wd=小学三年级关于时间的名人名言" \t "_blank )”。
这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。
绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的, 在名言前加上名人,是一种不必要的重复。
因此,最好的查询词,应该是“时间名言 ( http: / / www. / s wd=%CA%B1%BC%E4%C3%FB%D1%D4" \t "_blank )”。
试着找出下述查询词的问题,并想出更好的能满足搜索需求的查询词:
所得税会计处理问题探讨
周星驰个人档案和所拍的电影
■根据网页特征选择查询词
很多类型的网页都有某种相似的特征。例如,小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而页面上通常有“目录”两个字,点击页面上的链接,就进入具体的章节页,章节页的标题是小说章节名称;软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词。等等。
经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。
例如,找明星的个人资料页。一般来说,明星资料页的标题,通常是明星的名字,而在页面上,会有“姓名”、“身高”等词语出现。比如找林青霞的个人资料,就可以用“林青霞 姓名 身高 ( http: / / www. / s wd=%C1%D6%C7%E0%CF%BC%2B%D0%D5%C3%FB%2B%C9%ED%B8%DF&cl=3" \t "_blank )”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名 身高 intitle:林青霞 ( http: / / www. / s wd=%D0%D5%C3%FB%20%C9%ED%B8%DF%20intitle:%C1%D6%C7%E0%CF%BC" \t "_blank )”。Intitle,表示后接的词限制在网页标题范围内。
这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是,您必须了解这种共性(或者通过试验性搜索预先发现共性)。
如何正确选择搜索引擎
1、查找2005年北大附中网校夏令营情况说明。
2、查找1982世界杯足球前四强的得主。
3、查找2002年狮子座流星雨的情况和图片。
4、查找小于200KB的FLASH指法练习小游戏。
5、查找我国最早的人口普查资料。
6、查找3个比较好的网上图书馆,了解它们的特点。
7、查找超级女生前10名的相关资料。
我们需要完成上述的7个任务,通过搜索,对Baidu,Google以及Sina搜索的准确度及速度进行调查,结果如下
Baidu(速度/第几个准确) Google Sina
1 0.061秒,2 0.86 秒,3 0.719773秒,1
2 0.208秒,无 0.46 秒,无 1.209187秒,无
7 0.102秒,2 0.17秒,3 0.576578秒,3
从上表的数据可以看出,baidu的搜索速度最快,搜索的准确度也不错。Google其次,sina最慢。但在调查过程中,我发现了一个很致命的问题。网站所显示的搜索速度与实际需要花费的时间是不相符的。例如搜索第1个题目,sina从开始搜索到显示几乎用了将近5秒钟。也就是说,这些数据并不是完全可信的。有时它告诉你搜索的很快,但却浪费了很多时间在显示上,这样就得不偿失了。综上所述,我认为还是baidu最好。
我的心得体会
通过做这次的报告,我发现了许多问题。
1、 有条理最重要
在做一件很复杂,很凌乱的事情时,一定要有条理。就像这次做这个报告,首先一定要在大纲视图中把结构看好,并先把结构打在上面。并且分清一级标题,二级标题等,否则过一会儿就忘记了哪些需要怎样做了。我在做的时候,下载的资料又想分成若干个标题就麻烦了,因为都忘记了应该是第几级了。所以有条理得安排很重要。
2、 搜索是一件麻烦事
以为搜索很容易,人人都会,但是原来有那么多技巧。可是呢,这些技巧一般不是很实用的。因为要记这么多技巧是一件难事,而且我们也不是专业的搜索人员,没必要记录下那么多的东西。平常搜索的时候,只要比较能抓住关键就可以搜索得很好了。况且baidu等搜索引擎还提供帮助,在搜索的条目底下会显示:你是否想要搜索……列出很多。当我们想不出来如何措辞的时候,这些帮助可以提示我们。也就是说,上课用的搜索和平常使用的搜索是不一样的。虽然上课学的搜索是一件麻烦事,但是平常使用的搜索还是异常简单的。
3、 做事需要有耐心
如此长篇大论的东西,做起来简直是烦人至极了。来回翻页,看着这么多东西脑袋都大了,要是想做好就必须得有耐心,不能看了就烦,一烦就不想好好做。那样就达不到预期的效果了。
PAGE
1目录 TOC \o "1-3" \h \z \u
1 搜索引擎的历史与发展 4
2 搜索引擎的基本结构及工作原理 5
2.1 基本结构 5
2.1.1 网页搜集器spider 5
2.1.2 索引器indexer 5
2.1.3 检索服务接口searcher 5
2.2 工作原理 5
3 搜索引擎的分类及其典型代表 7
3.1 全文搜索引擎 7
3.2 目录索引 7
3.3 元搜索引擎 (META Search Engine) 7
3.4 非主流形式搜索引擎 7
3.4.1 集合式搜索引擎 7
3.4.2 门户搜索引擎 8
3.4.3 免费链接列表(Free For All Links,简称FFA) 8
4 常用搜索技巧 8
4.1 搜索之前先思考 8
4.2 学会使用两个关键词搜索 8
4.3 学会使用减号“-” 8
4.4 点击搜索结果前先思考 9
4.5 善于改正错误 9
4.5.1 常见错误1:错别字 9
4.5.2 常见错误2:关键词太常见 9
4.5.3 常见错误3:多义词 10
4.5.4 常见错误4:不会输关键词,想要什么输什么 10
4.5.5 常见错误5:在错误的地方搜索 10
5 搜索引擎的评价及相关参数 11
5.1 Google 11
5.2 百度 11
6 搜索引擎比较 12
6.1 查询资料 12
6.1.1 界上营业额最高的5个公司以及中国营业额最高的5个公司 12
6.1.2 小说Tom Jones是哪一年出版的 12
6.1.3 最新出版的有代表性的图书 13
6.1.4 助游需要事先做哪几方面的准备 13
6.2 所用关键词 13
6.3 各搜索引擎的特点 14
7 感受、发现和心得体会 14
1 搜索引擎的历史与发展
在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。
现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。
Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达System Computing Services大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。
当时,“机器人”一词在编程者中十分流行。电脑“机器人”(Computer Robot)是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。
世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
与Wanderer相对应,Martin Koster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最负盛名。
然而JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!
随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi,它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类(注),搜狐和新浪用的就是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。
2 搜索引擎的基本结构及工作原理
2.1 基本结构
2.1.1 网页搜集器spider
spider以某种策略从网上抓回网页存储到原始网页库中
2.1.2 索引器indexer
索引器对该网页库进行分析得到网页索引文件库(网页id索引与URL索引)、倒排文件(包括索引词表)、网页结构库。网页索引文件为了在原始网页库中快速定位网页,以生成网页快照,而倒排文件是为了检索时快速找到相关网页集合,顾名思义,是由文档到词mapping的文件生成的从词到文档mapping的文件,所以可以大大提高检索速度,网页结构库用于分析网页间链接关系,为每一个网页计算出PageRank值,这个值意味是它本身的重要程度,pageRank是google技术的基石。同时倒排索引中还保存了词频和词的文档频率以及词出现位置等数据,词的文档频率频率指文档集合中出包含该词的文档数目,这个指标意味着词的区分能力以及重要性大小。前两者用于检索时相关度计算,后者用于生成具有高亮显示的动态摘要。
2.1.3 检索服务接口searcher
检索服务接口的主要问题也就是查找倒排文件,返回相关结果集合,按照前面提到的词频指标与PageRank指标计算相关度,为结果排序,另外,还包括生成动态摘要。
2.2 工作原理
网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面的平均大小为20K计算(包含图片),100亿网页的容量是100×2000G字节,即使能够存储,下载也存在问题(按照一台机器每秒下载20K计算,需要340台机器不停的下载一年时间,才能把所有网页下载完毕)。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接深度。
在抓取网页的时候,网络蜘蛛一般有两种策略:广度优先和深度优先(如下图所示)。广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易。两种策略的区别,下图的说明会更加明确。
由于不可能抓取所有的网页,有些网络蜘蛛对一些不太重要的网站,设置了访问的层数。例如,在上图中,A为起始网页,属于0层,B、C、D、E、F属于第1层,G、H属于第2层,I属于第3层。如果网络蜘蛛设置的访问层数为2的话,网页I是不会被访问到的。这也让有些网站上一部分网页能够在搜索引擎上搜索到,另外一部分不能被搜索到。 对于网站设计者来说,扁平化的网站结构设计有助于搜索引擎抓取其更多的网页。
网络蜘蛛在访问网站网页的时候,经常会遇到加密数据和网页权限的问题,有些网页是需要会员权限才能访问。当然,网站的所有者可以通过协议让网络蜘蛛不去抓取(下小节会介绍),但对于一些出售报告的网站,他们希望搜索引擎能搜索到他们的报告,但又不能完全免费的让搜索者查看,这样就需要给网络蜘蛛提供相应的用户名和密码。网络蜘蛛可以通过所给的权限对这些网页进行网页抓取,从而提供搜索。而当搜索者点击查看该网页的时候,同样需要搜索者提供相应的权限验证。
3 搜索引擎的分类及其典型代表
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
3.1 全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、 Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人” (Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
3.2 目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords) 查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。
3.3 元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
3.4 非主流形式搜索引擎
3.4.1 集合式搜索引擎
如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
3.4.2 门户搜索引擎
如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3.4.3 免费链接列表(Free For All Links,简称FFA)
这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。
4 常用搜索技巧
4.1 搜索之前先思考
搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,而成为漏网之鱼。所以在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?如果有,可能在哪里,是什么样子的?网页上会含有哪些关键字?
有些东西你根本用不着麻烦搜索引擎的,比如要找个公司的电话,打个114的速度大概比搜索引擎快得多。又有些问题,可能很难用合适的关键字描述,或者不能直接用搜索引擎搜到,那你可以尝试找个精通这个问题的朋友,或者寻找这方面的热门论坛来问,这也是一种搜索方法。有时,你能选择的最好搜索方法是放弃网络,跑一趟附近的图书馆,图书馆里有网上找不到的成吨的“信息”。当你确认你要找的信息适合通过搜索引擎在网上找之后,搜索到满意结果的概率就大得多了。
各种搜索引擎的特点泾渭分明,如果你没有为每次搜索分别选择正确的搜索工具,你将浪费掉大量的时间。这次搜索,你应该使用新浪还是搜狐 Google还是百度 分析你的需求,比较不同搜索引擎的强项和弱点,然后为这次搜索选择最适合的搜索工具。
4.2 学会使用两个关键词搜索
如果一个陌生人突然走近你,向你问道:“北京”,你会怎样回答?大多数人会觉得莫名其妙,然后会再问这个人到底想问“北京”哪方面的事情。同样,如果你在搜索引擎中输入一个关键词“北京”,搜索引擎也不知道你要找什么,它也可能返回很多莫名其妙的结果。因此你要养成使用多个关键词搜索的习惯,当然,大多数情况下使用两个关键词搜索已经足够了,关键词与关键词之间以空格隔开。
比如,你想了解北京旅游方面的信息,就输入“北京 旅游”这样才能获取与北京旅游有关的信息;如果想了解北京暂住证方面的信息,可以输入“北京 暂住证”搜索;如果要下载名叫“xxxx”的MP3,就输入“xxxx 下载”来搜索。
4.3 学会使用减号“-”
“-”的作用是为了去除无关的搜索结果,提高搜索结果相关性。有的时候,你在搜索结果中见到一些想要的结果,但也发现很多不相关的搜索结果,这时你可以找出那些不相关结果的特征关键词,把它减掉。
比如,你要找“申花”的企业信息,输入“申花”却找到一大堆申花队踢足球的新闻,在发现这些新闻的共同特征是“足球”后,输入“申花 -足球”来搜索,就不会再有体育新闻来麻烦你了。
*耿耿评价:这种情况碰到太多了,没想到还有个减号能帮忙解决!!
4.4 点击搜索结果前先思考
一次成功的搜索由两个部分组成:正确的搜索关键词,有用的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题、网址、摘要,会有助于你选出更准确的结果,帮你节省大量的时间。当然,到底哪一个是你需要的内容,取决于你在寻找什么,评估网络内容的质量和权威性是搜索的重要步骤。
一次成功的搜索也经常是由好几次搜索组成的,如果对自己搜索的内容不熟,即使是搜索专家,也不能保证第一次搜索就能找到想要的内容。搜索专家会先用简单的关键词测试,他们不会忙着仔细查看各条搜索结果,而是先从搜索结果页面里寻找更多的信息,再设计一个更好的关键词重新搜索,这样重复多次以后,就能设计出很棒的搜索关键词,也就能搜索到满意的搜索结果了。
4.5 善于改正错误
经常会有这样的事情发生:你似乎已尽了全力来搜索,但是依然没有找到需要的答案。这个时候,请不要放弃,认真回顾检查你的搜索过程,也许只是因为一个小差错。一个看上去毫无希望的搜索,很有可能在你检讨完自己的搜索策略后获得成功。
下面描述了搜索时容易犯的5个错误和解决方法。这些错误使得你总是得到无用的、荒谬的或者完全没有意义的搜索结果。而一旦你认识到这些错误,将很容易把这些小鬼从你的搜索经历中永远驱逐出去。
4.5.1 常见错误1:错别字
经常发生的一种错误是,你输入的关键词含有错别字。比如,光一个谢霆锋就有“谢霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”、“谢庭峰”、“谢廷峰”6种查法,还有什么“星际争吧”、“以德制国”之类的,这样的关键词能搜索到什么有用资料吗?所以每当你觉得某种内容网上应该有不少、却搜索不到结果时,你应该先查一下是否有错别字。
4.5.2 常见错误2:关键词太常见
搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索“电话”, 有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的。
4.5.3 常见错误3:多义词
要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇印尼”、“爪哇 咖啡”、“Java 语言”分别搜索可以满足不同的需求。
4.5.4 常见错误4:不会输关键词,想要什么输什么
搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到成都列车时刻表”。
网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。
而问题在于,没有一个网页上会含有“现代爱情故事歌词”和“上海到成都列车时刻表”这样的关键词,所以搜索引擎也找不到这样的网页。但是真正含有你想找的内容的网页,应该含有的关键词是“现代爱情故事”、“歌词”,“上海”、“成都”、“列车”、“时刻表”,所以你应该这样搜索:“现代爱情故事歌词”、“信息早报 济南 发行”、“铃羊车 图案”“上海 成都 列车 时刻表”。
所以不要用你心中想的大白话去搜索,当搜索结果太少甚至没有的时候,你应该输入更简单的关键词来搜索,猜测你找的网页中可能含有的关键词,然后用那些关键词搜索。
耿耿评价:呵呵,老爸以前就经常这么查东西,被我指点迷津N次以后终于找到窍门了。
4.5.5 常见错误5:在错误的地方搜索
2001年7月23日这一天,正逢高考发榜,各大搜索引擎竟有超过100万次以上的搜索跟高考查分有关。考生们不知道,搜索引擎从抓取网页、解析、索引到提供检索是有一个周期的,各搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容应该去看新闻,用搜索引擎是找不到最新内容,只能找到一个星期或一个月以前的内容。另外,搜索引擎对动态内容,如:论坛、数据库内容,以及带frame结构的网页检索能力较弱,所以这类信息也不适合用搜索引擎搜索,而是应该去相关的网站寻找,当然,寻找相关网站的任务搜索引擎是当仁不让的。
5 搜索引擎的评价及相关参数
5.1 Google
全球网站排名:3
pr值:8
Google,是全球最大的搜索引擎,它具有的优势当然也不少。根据前阵子的网上调查显示,百度的用户超过Google很多,但Google用户更多的集 中在精英阶层(如科研人员等),是潜力所在。再看看具体表现:其一,在英文检索方面,Google肯定领先,做英文搜索出身,这样很多国内用户如果需要英 文参考资料的话,一般会首选Google,这就是所谓的精英阶层集中在Google的原因之一;其二,新业务推出一般走在百度前面,而且服务相对较好,大 容量邮箱、相册,自定义个人空间,在线文档、视频等,如果上述业务真正本土化,百度的压力是比较大的;其三,Google能给人比较客观的感觉,因为在国 内有很多所谓的黑幕,国人会不经意地怀疑搜索结果(尤其是排名),而Google甚至给存在安全隐患的网站贴出标签,应该说这是对用户负责的态度,把握好尺度,是可取的。
耿耿评价:但是用Google搜索出的结果往往不需要的结果很多,可能主要是因为关键词拆分的太细致,导致一个完整的词都经常被拆成单字,与之相比百度就好得多。
5.2 百度
全球网站排名:4
pr值:8
百度,在国内搜索引擎领域,还是有比较多的竞争对手的,最大的莫过于“谷歌”,其他像soso、问问、爱问、sogou等等还处于起步阶段。在国内相对 Google,百度具有的优势在于:第一,亲和力,百度毕竟是本土企业,很多都符合国人的习惯,就连“baidu”这个网址都比“Google”好记,对 于大多数国人来说,“Google”是一连串毫无疑义的字母;其二,百度创新力不错,记得当年最先接触的是“3721”,甚至抵制过百度,后来 “3721”因为种种原因造成了今天的潦倒,而百度却蒸蒸日上,这与百度坚持改革与创新离不开的,地图、空间、相册、百度联盟等等都为百度带来了大量用 户,而Google的本地化却不够,甚至受到不少网民的指责;其三,百度是本地企业,很多用户发现打开百度的速度比Google快,而且Google时常 受限,如最近的Googlepages就访问不了,百度应该会得到比较多的支持。
6 搜索引擎比较
6.1 查询资料
6.1.1 界上营业额最高的5个公司以及中国营业额最高的5个公司
6.1.1.1 世界排名
排名 公司标志 中文常用名称 总部所在地 主要业务 营业收入百万美元
1 沃尔玛 美国 一般商品零售 351,139.00
2 埃克森美孚 美国 炼油 347,254.00
3 皇家壳牌石油 英国/荷兰 炼油 318,845.00
4 英国石油 英国 炼油 274,316.00
5 通用汽车 美国 汽车 207,349.00
6.1.1.2 国企排名
No.1 中国石油化工集团公司
No.2 中国石油天然气集团公司
No.3 国家电网公司
No.4 中国工商银行股份有限公司
No.5 中国移动通信集团公司
6.1.2 小说Tom Jones是哪一年出版的
答:1992年
6.1.3 最新出版的有代表性的图书
书名 作者 出版社 出版时间
《明朝那些事儿4》 当年明月 中国友谊出版公司 Sep-07
《素年锦时》 安妮宝贝 作家出版社 Sep-07
《山楂树之恋》 艾米 江苏文艺出版社 Sep-07
《巴别塔之犬》 (美)卡罗琳·帕克丝特 南海出版公司 Jul-07
《你今天DaLaDaLa了没》 (日)徒步助(Toposuke) 国际文化出版公司 Sep-07
6.1.4 助游需要事先做哪几方面的准备
▲确定旅游目的地
在确定旅游目标以前,你首先要考虑的是时间,其次是经济承受能力。综合这两种因素,你基本上就可以排定目的地的大致方位了。
▲了解交通情况
锁定了旅游目标,你就得掌握一下交通状况,好做到心中有数。先找地图看看,怎样走最节省时间和资金,把要经过的主要城镇名称记下,然后决定是走陆地、空中还是水上,或海陆空并举,了解你要乘坐的交通工具的出发时间、准确的车站、码头、机场位置,设法预订好票,减少临时购票的紧张压力。
▲出发前的准备
a.掌握旅游地的概况;
b.根据天气预报选择服装;
c.带一点常用内外科药,如治疗肠胃系统和心血管系统的药物,及创可贴、棉花、酒精等;
d.相机、电池、胶卷以及洗漱用具等;
e.带少许水果或点心、瓶装饮料水(减少旅途中高价购买的开支),钱要分散放好,如有全国通用银行卡最好带上;
f.专门提醒一下,记得带上身份证。
当然,如果走的地方较近,就不用准备得这样复杂,只要有方向感,勤动嘴,有点够用的钱就行了。而对于一些交通不发达、比较偏远的地区,最好能几个人结伴,这样租车的费用大家可以分担一些,而且相互有些照应。
6.2 所用关键词
查询内容 界上营业额最高的5个公司 中国营业额最高的5个公司 小说《Tom Jones》出版年 最新出版的有代表性的图书 自助游需要事先做哪几方面的准备
关键词 2007世界 公司 排名 2007 中国企业500强 营业收入 tom jones Henry Fielding 介绍 新书排行榜 自助游 准备
百度 准确率 第1页第1条 第1页第1条 第1页第1条 第1页第1条 第1页第1条
速度 0.073秒 0.058秒 0.052秒 0.001秒 0.037秒
查全率 50% 60% 30% 30% 90%
Google 准确率 第1页第1条 第1页第4条 第1页第2条 第1页第2条 第1页第1条
速度 0.33秒 0.38秒 0.08秒 0.09秒 0.13秒
查全率 80% 30% 40% 30% 20%
搜狐 准确率 第1页第1条 第1页第1条 第1页第1条 第1页第1条 第1页第1条
速度 0.867秒 0.144秒 0.236秒 0.075秒 0.017秒
查全率 60% 40% 40% 90% 40%
6.3 各搜索引擎的特点
优点 缺点 适合查询 不适合查询
百度 准确率高 较简单的关键词查全率低 相对具体的关键词 相对简单的关键词x
Google 英文和新闻查询占优势 查准率低,速度慢 英文网站和新闻 较长的中文关键词(拆词为字现象严重!!)
搜狐 速度快 (数据中未体现) 最新信息等 (似乎平均下来都比较适合)
7 感受、发现和心得体会
原来,我一有什么不明白的事情都要依靠搜索引擎,只是考虑过它可能随时在从互联网上“搜罗”更新的信息,但并没有想到去真正了解它的工作原理,更没有想到各种搜索引擎工作原理竟有不少差异。
另外,“-”号的运用也是一个新知识,以前搜索的时候总是碰上一系列和我想要的内容无关的搜索结果,只能一页一页的往后翻,“-”号的运用可以让我省去很多花在直接用肉眼过滤无关信息的时间。
还有就是对百度和Google的比较。我最先使用的搜索引擎是Google,但是自从同学推荐了百度以后,我才发现我更适合用百度搜索我需要的内容(因为我不怎么关注实事)。Google总是把我设置的关键词拆分成单个字来搜索,这也是很麻烦的事情,就好像把“overcome”这一个词语分成“over”和“come”两个词一样,导致搜索结果出现大量无关的网页。而百度就相对比较“厚道”,尽量不去拆分我输入的关键词,搜索结果的准确率比Google高很多。这次的探究结果也表明百度更适合搜索目的明确的具体关键词。
至于搜狐,尽管通过老师列出的5个搜索例子的参数,并没有发现什么“缺点”,但和我不喜欢用新浪搜索的理由一样,太慢。搜狐的首页相比起百度和Google来,安排过分紧张,邮箱登陆页面、分类搜索页面、新闻咨讯页面、甚至广告,比比皆是。由于页面显示顺序是由上到下的,我正要在搜索栏上输入关键字时,主页的下半部分往往还没有接收完毕,导致输入速度变慢。我想,如果搜狐专门辟出一条简洁的(像百度那样除了搜索栏就是空白)页面通道来提供搜索服务,效果会好得多。(如专门设置一个像http://search./ ( http: / / search. / )这样的地址)
以上,耿然(1020132)的第3次作业——搜索探究报告
PAGE
16