还剩8页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
网络信息检索工具的比较研究摘要随着Internet的迅速发展,网络上的信息越来越多,但由于这些信息缺乏合理有效的__,使得许多用户面对浩瀚的信息显得手足无措,无法准确地获取自己所需要的信息针对这种情况有些__和个人__出多种用以查找网络信息的检索工具.对目前广为使用的网络信息检索工具进行功能比较选择其综合性的网络信息检索工具以便用户能够更快捷地找到所需信息 关键词检索工具搜索引擎Google百度NETWORKINFOR__TIONRETRIEVALTOOLSFORCOMPARATIVESTUDAYENGLISH AbstractAlongwithInternetrapidlyexpandInthenetworkinfor__tionaregettingmoreandmoreButbecausetheseinfor__tionlackthereasonableeffectiveorganizationCauses__nyusersappearshelplessfacingthevastinfor__tionIsunableinfor__tionwhichgainsitselftoneedaccuratelySomewhatorganizesinviewofthiskindofsituationanddevelopspersonally__nykindsofusestosearchthenetworkinfor__tiontheretrievaltoolthecurrentwidelyusedbythenetworkinfor__tionretrievalsearchenginetoolsarecomparedfunctionallythroughcomparingtofoundtherespectivemeritsanddemeritsuserscanmorequicklyfindtheinfor__tionneeded. Keywords:ToolOfRetrievesSearchEngineGoogleBaidu 目录 摘要Ihttp://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085467AbstractIIhttp://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085468绪论一网络信息检索工具概述1http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085469
(一)网络信息检索工具的概念1http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085470
(二)网络信息检索工具的特点2http://m
三、网络信息检索工具的比较……………………………………………………………………6http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085481
(一)检索型网络信息检索工具与目录型检索工具的比较..6http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085482
(二)目录型网络信息检索工具与元搜索引擎的比较7http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085483
(三)元搜索引擎检索工具.7http://m
143.__il.__.com/cgi-bin/frame_htmlsid=ASJ3V74LEt3WMidtt=newwin_frameurl=%2Fcgi-bin%2Fread__il%3F__ilid%3DZC1514rJDHzruJR7CUeIbUUML5tg52%26folderid%3D4%26t%3Dcompose%26s%3Ddraft%26%26compose_new%3Dcompose%26%26groupid%3D\l_Toc200085484结束语…………………………………………………………………………………8____………………………………………………………………………………8谢辞……………………………………………………………………………………8 绪论随着Internet的迅速发展,网络上的信息越来越多,但由于这些信息缺乏合理有效的__,使得许多用户面对浩瀚的信息显得手足无措,无法准确地获取自己所需要的信息针对这种情况有些__和个人__出多种用以查找网络信息的检索工具对目前广为使用的网络信息检索工具进行功能比较,通过比较找到各自的优点和缺点,以便用户能够快捷找到所需信息了解网络信息检索工具,熟悉其功能,将大大提高我们的检索效率网络检索系统拥有全世界数量众多的用户,吸引了大量的__,为电子信息的增值服务提供了广阔的空间网络检索系统已成为新的投资热点网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公用性转向商业化美国著名的数字媒体评估公司JupiterMediaMetrix日前发布研究报告称“搜索引擎公司推出的付费添加服务是一个正在兴起的、前景光明的因特网领域,相对于目前低迷的在线__市场来说,它的发展潜力是非常巨大的”网络信息检索工具是信息检索效率的关键因素传统的检索工具已不能适合新的网络和信息发展的需要目前__的能在广域网环境下运行的信息检索工具,对于网络的检索者来说,最重要的是熟悉这些工具的性能,并且运用有效的检索策略,只有这样才能避免淹没在大量的无关信息中
一、网络信息检索工具概述一网络信息检索工具的概念随着Internet的迅速发展,网络上的信息越来越多,但由于这些信息缺乏合理有效的__,使得许多用户面对浩瀚的信息显得手足无措,无法准确地获取自己所需要的信息针对这种情况有些__和个人__出多种用以查找网络信息的检索工具早期的Internet检索工具有针对FTP资源的Archive针对Gopher资源的Veronica和Jughead以及针对整个Internet网上文本信息资源的WAIS等随着___的发展,针对___资源的各种检索工具已成为网络检索工具中的主流,它们有Yahoo、Alt__ista、Excite、HotBot、Lycos、OpenText、WebCrawler和MetaCrawler等.这些检索工具大多是由非图书馆专业技术人员设计的,由于缺乏统一的网页描述标准,所以在各自对自己的数据库进行检索时的方法各不相同,各有自身的优缺点本文选择了其中六种检索工具,它们分别是Lycos、AltaVista、Excite、OpenText、Yahoo和__gellan分析了它们在信息收集方法、索引范围与检索方法和检索结果格式三个方面的异同,并在此基础上,从图书馆员的角度出发,对未来网络检索工具的改进进行了探讨二网络信息检索工具的特点1交互式作业方式所有的网络信息检索工具都具有交互式作业的特点,因此具有良好的信息反馈功能和瞬间反应功能这两个指标在传输信息检索系统性能的最重要指标,在网络环境下也具有同样的意义2用户透明度网络信息检索对用户屏蔽了网络的各种物理差异,使用户在使用这些服务时__到明显的系统透明度这里所指的物理差异包括主机的硬件平台、操作系统等软件上的差异、客户程序和服务程序版本上的差异、主机的地理位置、信息的存储方式甚至通信协议的差别(如___客户程序可以通过多种协议使用各种不同的信息资源)等这一特点对网络环境下的信息检索来说是十分关键的3信息检索空间的拓宽信息检索空间是衡量信息检索工具的重要指标之一网络信息检索在这方面具有传统信息检索和Internet基本信息服务所不具备的优势以FTP为例,尽管使用FTP可以检索所有的FTP服务器,但是用户必须预先知道这些服务器所在的主机地址,而且在某一时刻只能使用一个FTP服务器网络信息检索工具的工作方式则与此不同,它们可以同时使用多个主机甚至是所有主机的某种资源而且用户不必知道它们的具体地址这一特点为用户带来的好处上显而易见的4友好的用户界面与Internet的三大基本信息服务相比,网络信息检索系统的用户界面要友好得多,特别是一些商业化软件(如InternetExplorer和NetscapeN__igator)即使是Internet上的一些免费软件(如MSWindows和Unix下的各种服务程序和客户程序)也设计得相当不错对于有一定微机使用经验的人来说,学会使用这些软件是轻而易举的事情Internet的普及在很大程度上是得益于这些设计精良的软件详细描述文献的内容特征,外表特征;每条文献记录必须有检索标识;文献条目按一定顺序形成一个有机整体;能够提供多种检索途径二网络信息检索工具的分类
(一)检索型网络信息检索工具在这里我们要向网络用户提供一些世界上有名的网络搜索引擎这些专业搜索引擎要比国内中文__的搜索引擎起步早,更加完善起初上网,我主要是利用百度、谷歌等的搜索引擎,但随着对搜索引擎理解的深入,便发现我们自己的搜索引擎还有许多的问题比如说百度网,其搜索引擎不够精确,有时也不完全按照用户的设定条件来完成搜索任务,形成了许多资源垃圾,为查阅增添了许多麻烦国内其它搜索引擎也存在着这样的问题,这说明我们的网上引擎服务正处在发展阶段,还不够完善一些外国著名的搜索引擎服务公司看准了中国网络市场这种缺陷,及时地打入中国的市场目前,几个著名的国际搜索引擎公司都有中文检索搜寻功能,这极大地方便了我们获取重要资料这些有名的搜索引擎公司服务质量好、服务完善、精确匹配高,大大提高了文献提取的效率更为重要的是,我们要获得国际上的资源,就更离不开它们了前些日子,我和一位美国史学专家探讨如何搜索到有用的中外资料时,他毫不犹豫地向我提供了GOOGLE搜索引擎我打开一看,这真是一个方便、快捷而又个人化的搜索引擎它的搜索功能和结果列表筛选是国内__无法比拟的因此,我建议大家在以后进行搜索时,应该使中外的搜索引擎兼顾使用,这样才能达到预想的效果检索型搜索引擎是提供给用户输入检索式代替用户在互联网上进行网络搜索查询的工具了解搜索引擎的基础知识与使用技巧,可以大大提高搜索信息的效率目前世界上最大的搜索引擎是Google、___和雅虎,___主要是美国商业目录搜索引擎,主要为用户提供教育、新闻、媒体及娱乐信息中文综合性搜索引擎有百度、Google、中国搜索联盟、新浪、搜狐、网易、雅虎、TOM、3721等,其中百度是目前最具影响力的中文搜索引擎综合性搜索引擎针对任何用户,收录各个方面、各个学科、各个行业的信息,包括不同媒体的、正式与非正式出版的、社会科学的和自然科学的、生活性的和娱乐性的、系统的和零散的信息,用起来非常方便,但其所涵盖信息的内容比较宽泛,检准率不高,一搜就是几千甚至上万条记录,必须对这些记录进行二次检索,才能满足一般用户的浏览性检索需要专业性搜索引擎则不同,可以就某一专业进行专门检索,其检准率比较高,如专门用于搜索新闻的DejaNews、搜索中国企业定制产品的中国制造网,搜索全球企业站点的阳光之路国际商务网,搜索中国建筑的中国砌体等等 公认较好的搜索引擎有
①中文搜索引擎网易、搜狐、网络指南针、亚洲搜索、若比邻、中文雅虎;
②英文搜索引擎:YAHOO、EXCITE、INFOSEEKGUIDE、LYCOS
(二)目录型检索工具目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容http://abroad.studa.com/和性质将其归为一个预先分好的类别由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限国内著名的新浪、搜狐、中文雅虎都属于这种类型一个网络目录包括许多层,最高层(一级)目录页总是将因特网资源分成最大范围、最普通的主题范畴这些主题范畴一般有10~20个,主题链接到第二层目录(另一个页面),然后在第二层目录再分出子目录,一般到第四级逐层__,它将会罗列出一层层的目录清单,所有的选择只用鼠标__链接来实现网络资源数不胜数,任何分类目录都不可能包罗所有的网页,多数网络目录都包括下列典型的一级类目,如商业贸易(businessandcommercial)、计算机和网络(computerandInternet)、时事(currentevents)、娱乐和休闲(entertai__entandrecreation)、体育(sports)等等,遇到交叉的主题,网络目录会在相关的类目下显示不同的路径
(三)元搜索引擎检索工具元搜索引擎是一种调用其他搜索引擎的引擎它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索中文元搜索引擎__较少,较成熟的则更少,万纬搜索是目前有一定影响http://___.studa.net/的中文元搜索引擎元搜索引擎弥补了__搜索引擎不全的特点,提高了检索的全面性现__出的中文元搜索引擎的数目很少,还有诸多缺陷,需在各方面进一步改进 元搜索引擎要对各__的信息特色进行较细致的调查,以确定自己要收录的范围;在对目标搜索引擎的__中突出__搜索引擎的检索特色,并设计各搜索引擎之间的检索方式的转换算法,提高用户检索行为的针对性;建立更为灵活的,面向用户的信息检索服务检索界面要统一和友好,检索方法http://___.studa.cn/的设置要提供给用户更多的自由空间,使用户可以按照自己的意愿合理的__检索式;在检索结果的显示中要__出一个有效的检索结果去重、选择、排序和优化算法,这是中文搜索引擎__中的一个重点和难点三网络信息检索工具比较
(一)检索型网络信息检索工具与目录型检索工具的比较检索型检索工具通过用户直接输入检索词,查找索引数据库中用检索词标引的索引记录来查找用户所需要信息资源,检索方便直接,而且可以使用布尔逻辑,短语或邻近等基本检索和模糊,自然语言,概念等高级检索方式可以限定检索对象的地区,网络范围,数据类型,时间等,可以满足特定条件的资源准确定位以信息查询、检索为主,不太重视信息的整理,收录的__和网页数量大,分类目录为辅用户查找信息的时候比较麻烦,要先打开网页还要输入关键字才能查出自己想要的信息浪费时间,但它的优点就是对某一问题分析的很透彻,输关键字会有很多相关的文献和信息,提供用户查找和使用而目录型检索工具支持多种语言,对包含关键词的热门搜索在最上方,其他的排序多采用相关性的排序,相关度很高比如我们国家的百度百度图书搜索正式上线,其数据来源于图书馆(如北大图书馆、中科院图书馆、中山图书馆)、___数据库(超星、方正等)和网上书店(如卓越、蔚蓝等),所以数据量比GOOGLE大由于GOOGLE容全文或部分预览,考虑到图书版权的问题,因此走的是出版商路线;而百度的目的是放在图书书目数据上,而不提供图书内容,因此在搜索结果数量大大超出GOOGLE搜索可以作为一个较好的导购平台,但是在信息的整合(如加入图书馆藏书信息),仍有所欠缺这方面,GOOGLE的较好,不仅学术搜索进行了很好的整合,而且还开展了图书馆链接计划,让所有的图书馆网上数据库都可以加入到其中目前,百度图书搜索虽然仅限于书目搜索,但内容或者说全文扫描作为搜索引擎公司安身立命并确立垄断性话语权的关键,必然会成为百度的下一个战略目标Google也是一个相对比较简单的搜索引擎,但结果处理也有独到之处Google经过几年的发展,现在已经成为登录用户较多、服务比较完备、比较简洁实用的一个搜索引擎,我现在就一直用它还有Google公司在2004年10月、11月分别推出了的“GoogleScholar”和“GooglePrint”项目“GoogleScholar”项目主要是收集各学科领域内的连续出版物、预订本、论文和专题报告等内容“googleprint主要是用于提供与出版商的链接2004年12月又推出的“GoogleLibrary”则主要侧重于将一些大型图书馆的馆藏进行数字化后纳人到其检索引擎中,方便读者通过互联网使用这3个项目都继承了Google检索引擎一贯的页面风格,可以方便快捷地为检索者提供所需的相关链接“GoogleLibrary”项目的__计划主要是与哈佛大学图书馆、牛津大学图书馆、斯坦福大学图书馆、密歇根大学图书馆以及纽约公共图书馆这5家顶级研究性图书馆合作并签署协议,由图书馆提供其丰富的馆藏,而Google负责提供经费与技术,将这些馆的馆藏扫描成电子版并链接到它的检索引擎中在___检索工具当中,检索型检索工具的索引数据库比分类检索工具的索引数据库要大点多,在检索效果方面,检索型检索工具占很大的优势,如果二者配合使用效果会更好在检索中高级检索方式的应用有可能降低检索效果,中文Yahoo覆盖的中文信息量较大,查准率也比Cseek(英文检索工具)高,网上中文信息资源太贫乏,现有的信息当中有学术价值的不多,网络信息检索工具还存在着许多不足,尤其是中文检索工具还有待提高
(二)目录型检索工具与元搜索引擎的比较目录型检索工具通过用户浏览层次型类别目录来寻找符合需要的信息资源,目录按一定的主题分类体系__,并辅之以年代,地区等分类用户一般采取逐层浏览目录,逐步细化来寻找合适的类别直至具体资源常用的目录型检索工具有新浪,雅虎,搜狐等检索工具目录式检索工具给用户的感觉就是清晰,打开__各个方面的信息和知识都有,比检索型工具更醒目但也有它的不足给出的各个信息不够全面,没有检索型工具全面,透彻,解释的清楚以分类目录导航为主,搜索引擎相辅或并重,类目精致且相对较深,收录__和网页往往经过人工选择,数量相对较少,质量相对较高目录型检索工具与之元搜索引擎比较差别很大,元引擎是一种起检索中介作用的搜索引擎它是网络__者将网络资源收集后,以某种分类法进行__整理并和检索集成法在一起的信息查询方式,网络资源目录一般采用人工采集和存储网络信息,它通常按照网络资源的主体性质进行分类以某种分类体系为依据将信息资源分为若干领域的主体范畴,然后再细分为各学科专题目录,形成一个有信息链组成的树状结构网络目录的分类往往采用主题分类法,学科分类法,体系分类法,在这一切划分基础上,一个目录包括许多层最高层将网络资源分为若干范围大,普通的主题新浪网是面向全球华人的网上资源查询系统,所收资源十分丰富,分类规范,细致该目录原分阶段16大类,一万多个细目和20余万个__分类检索是按照首页的树型分类主题逐层__来查找所需信息的网易提供多种语言检索其分类目录是一种开放式管理目录,业余编辑多
(三)元搜索引擎检索工具元引擎是一种起检索中介作用的搜索引擎多元引擎本身没有存放网页信息的数据库当用户查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户可以存取世界各地的超媒体文件,内容包括文字、图形、声音、动画、资料库、以及各式各样的软件多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面,且将一个检索提问的同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合,去重之后输出检索结果其优点是省时,缺点是由于不同的搜索引擎的检索机制,所支持的检索算法,对提问式的接读等均不相同,导致检索结果的准确性差常用的多元搜索引擎有DogpileInferen等元搜索引擎以超连接的方式,实行对__搜索引擎的数据库选择,查询,分析,提炼整合出相关的数据,并把这些搜索引擎返回的结果经过处理后再返回给用户元搜索引擎是建立于__搜索引擎之上的搜索引擎,可以灵活地选择所要采用的__搜索引擎,充分发挥各个__搜索引擎在某个搜索领域的功能与优势,弥补__搜索引擎信息覆盖面上的局限性,保证了搜索结果的准确性和有效性,在查询,检索相关的信息或全文信息方面是__搜索引擎的升华与提高元搜索引擎检索时将用户的检索式同时转给不同的搜索引擎帮助检索,并将检索结果 重复的部分删去这样,既扩大了检索范围,又节省了在不同搜索引擎之间转载的时间提高了检索速度,查全率高,漏检率低,但是是由于不同搜索引擎的检索机制,所支持的检索算法,对提问式的解读等均不相同,导致检索结果的准确性较差,用户也需要进行筛选结束语网络信息检索工具的研究具有非常重要的意义随着信息技术和新一代因特网的发展它的研究和应用也将迈上一个新的台阶我们期待着网络信息检索工具的发展能为网络信息资源检索带来一个美好的明天在生活中先进的网络信息检索工具给人们带来很多的方便随着信息化的逐步发展我们的一切都在改变人们成在更短的时间内找到自己需要的信息.本文通过对多种网络信息检索搜索工具的介绍和描述和比较从中让人们能了解和学到最方便快捷准确的知识和信息.____
[1]孙建军成颖:信息检索技术[M].北京:科学http://___.studa.net/gong___/出版社,2004
[2]王丰:国内中文搜索引擎研究[J].网络通讯与安全,20078)
[3]王辉网络信息检索搜索工具的比较研究期刊-核心期刊20081
[4]张秋霞闫秀萍网络信息检索长安大学学报社会科学版2001
[5]张秋霞网络信息检索工具统计性能对比分析研究
[6]周丽霞网络信息检索研究综述黑龙江大学信息管理学院哈尔滨
[7]李冠南:网络信息检索工具及发展首都图书馆北京_____21
[8]曾民族:网络信息检索现状和性能评价北京文献服务处北京
[9]高琳:龚立群网络信息检索工具的分类及其发展趋势昌吉学院学报2004
[10]段其宪时永梅:网络检索工具的比较情报科学2001
[11]岳权晏__:南京大学信息管理系南京金陵图书馆
[12]章琳张保明:___检索工具比较研究,情报学报,
1998.4
[13]曾民族:网络信息检索现状和性能评价,情报学报,
1997.2http://___.lib.ytu.edu.cn/wxyjs/cyycg/dqx/wljs.html\ltop#tophttp://___.lib.ytu.edu.cn/wxyjs/cyycg/dqx/wljs.html\ltop#top
[14]孙丽陈通宝:网上中文检索工具的比较研究情报学报
[15]张燕飞彭燕云:基于___中文网络信息检索工具的比较研究江西 。