还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
1、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制
2、查全率是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示查全率=(检出相关文献量/系统中相关文献总量)*100%
3、查准率是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示查准率=(检出相关文献量/检出文献总量)*100%
4、漏检率是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示漏检率=(漏检相关文献量/系统中相关文献总量)*100%
5、跨库检索可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果
6、单库检索在选定的单一数据库中进行检索
7、经典论文优先被引用数比较多,或者文章发表在档次比较高的__上等经典的、有价值的文献优先排在前面
8、相关度优先和查询的条件内容最相关的文献优先排在前面
9、最新论文优先发表时间比较新的文献优先排在前面
10、精确匹配检索结果中包含与检索词完全相同的词语
11、模糊匹配检索结果包含检索词或检索词中的词素
12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找
13、倒查法从最新时间查找起,直到满足检索要求为止
14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息
15、二次检索是指在前一次检索结果的范围内,继续进行检索
16、定题检索SDIselectivedisseminationofinfor__tion查找有关特定主题最新信息的检索
17、回溯检索RSretrospectivesearch查找一段时期内有关特定主题信息的检索数据库的基本复习数据收录文献范围,有哪些数据库?
二、信息检索的原因
1、信息检索是获取知识的途径
2、信息检索是科学研究的向导
3、信息检索是终身教育的基础信息检索语言与检索途径
(1)分类语言
(2)主题语言
(3)分类主题一体化语言
(4)代码语言
(5)引文语言
1、内容特征检索途径
(1)分类途径
(2)主题途径
(3)分类主题途径
2、外部特征检索途径
(1)责任者途径
(2)题名途径
(3)序号途径
(4)引文途径第二节事实数据信息的检索工具
一、字典、词典(辞典)
二、百科全书
三、手册
四、年鉴
五、名录第三节文献检索工具简介
一、目录型检索工具;题录型检索工具;文摘型检索工具第四节索引介绍著者索引、主题索引(关键词索引)、分类索引、题名索引、其他索引
一、《EiVillage数据库》EiCompendexWebEI网络版)INSPEC是《科学文摘》Scien__Abstracts,简称SA的电子版,专利Patents USPTOPatents为美国专利和商标局的全文专利数据库Techstreet标准TechstreetStandards世界上最大的工业标准集之一Scirus是迄今为止因特网上最全面的科技专用搜索引擎什么叫信息在西方英文中infor__tion一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”在我国__、__地区,该词被译为“资讯”教材定义信息是被反映物的属性再现,信息的属性在于表现它物也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、__中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互__的最新反映一切事物包括自然界和人类社会都会产生信息一个完整的信息过程,包括信息的传递、接收、贮存、__和利用信息具有以下特征
(1)普遍性
(2)时效性信息在一定的时间内是有效的信息,在此时间之外就是无效信息而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性
(3)传递性
(4)可转换性信息是可以由一种形态转换成另一种形态信息一般有4种形态数据、文本、声音、图像这4种形态可以相互转化,例如,照片被传送到计算机,就把图像转化成了数字
(5)可再生性
(6)共享性同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少
(7)可识别性信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别不同的信息源有不同的识别方法
(8)可存储性信息是可以通过各种方法存储的
二、信息检索
1、定义
(1)从通信的角度认识信息检索强调信息发布者和接受者之间的通信,是两者关系的变化和延伸
(2)从信息检索过程的角度认识信息检索,这种观点认为,信息检索就是查找出含有用户所需信息的文献的过程
(3)从信息处理的角度认识信息检索信息检索的基本问题,是如何处理信息和信息的结构这种认识偏重于信息管理领域,认为信息检索不仅限于传统文献的范围,图像、声音、数据等也都能反映信息,并把信息检索视为计算机科学技术的一个分支
(4)从信息获取方式来认识信息检索分为直接检索直接从信息源中获取信息,获取方式直接,但很难广、快、精、准地查到所需的全部信息
(5)从实际检索工作的角度出发,对信息检索这样表达•广义将信息按一定的方式__和存储起来,并根据用户需要找出相关文献的过程其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及__,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程•狭义仅仅指信息查找的过程即取的环节间接检索通过信息检索工具或检查系统获取所需的信息(本课程主要学习)克服了直接检索的缺点,在掌握一定检索技巧前提下可以较全面、准确、快速地检索到相关信息信息存储与检索流程图信息检索(infor__tionretrieval)信息用户为处理解决各种问题,运用检索工具或数据库等情况__,从中查找、识别、获取相关的事实、数据、知识的活动及过程2检索语言又称为情报语言、情报存储和检索语言、信息__语言,是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种人工语言,是实现人与检索系统对话的交流语言检索语言可划分为分类语言、主题语言、分类主题语言、代码语言、引文语言等3检索工具是用来报道、存储和查找信息的工具,通常是指以书本或卡片形式呈现、采用手工方式进行的设施,如检索期刊、书目索引和卡片目录等检索工具必须具备的条件
(1)对所收录的信息资料的各种特征(包括外部特征和内容特征)要有详细的描述
(2)每条描述记录都要标明可供检索用的标识,以便按某种方式将这些描述记录__起来,为编织各种索引做准备
(3)全部描述记录要科学地__成一个有机的整体,使这些记录存放有序,方便存取
(4)具有多种必要的检索手段以满足用户从多种角度查找信息的要求
4、检索系统由一定的检索设备(如探针、选卡机、电子计算机等)和__整理并存储在相应的载体(如穿孔卡片、磁带、磁盘等)上面的文档或数据库及其他必要设备共同构成的,具有存储和检索功能的信息服务设施它往往由多个子系统或模块构成,需借助专门设备进行检索穿孔卡片检索系统、缩微品检索系统、光盘检索系统、计算机检索系统、网络信息检索系统
三、信息检索的发展•
1、第一阶段完全手工检索阶段•
2、第二阶段半机械检索系统-机电、光电检索系统的发展阶段•
3、第三阶段计算机检索系统的发展阶段•
4、第四阶段基于Internet的网络化检索系统阶段
二、信息资源的分类
1、信息源可分为自然信息源和社会信息源自然信息源广泛存在于自然界中,是物质运动和生物生存活动的结果如山川、土地、气候、能源、动物、植物、微生物等,它们是人类生存最基本的自然环境和物质条件,是自然信息的发生源社会信息源则存在于人类活动中,是社会的直接产物无论是自然信息源还是社会信息源,其__利用均在社会中进行,社会信息源是信息源的主体•
2、按信息资源所依附的载体划分•
(1)体裁信息资源以人体为载体并能为他人识别的信息资源按其表述方式又可分为口语信息源和体语信息源口语信息源是人类以口头方式表述但未被记录下来的口语信息,如谈话、讲课、讲演、讨论、唱歌等体语信息源是以人的体态为载体表述出来的信息资源,如表情、手势、姿态等方式表述的体语信息•
(2)实物信息资源以实物为载体的信息资源又分为自然实物信息源与人工实物信息源如化石、产品、样品等•
(3)文献信息资源以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源•
(4)网络信息资源以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储的手段与形式的信息资源•
3、按信息资源传递的范围划分•
(1)___息资源又称共享信息资源或白色信息资源(whiteinfor__tion),指公__行、流通和传递的信息资源,其蕴涵的信息人人可以使用一般来说,___息资源的数量最大,而且能够作为信息商品进行流通领域•
(2)半___息资源又称灰色信息资源(greyinfor__tion),指非公__行、流通和传递,从常规途径难以获取的信息(内部信息)这类信息出版量小,发行渠道复杂,流通传递范围有限,不易收集例如内部的刊物、技术报告、会议资料等•
(3)非___息资源又称黑色信息资源(blackinfor__tion),指人们未破译或未被识别的,也指处于保密状态的信息例如考古发现的古老文字、未解密的____、内部档案、个人日记、私人信件等
4、信息可分为可检信息和不可检信息,自然信息均属于不可检信息
三、文献信息资源
1、按信息资源所依附的载体的物质形态划分
(1)刻写型包括手稿、日记、信件、原始档案、碑刻等
(2)印刷型其优点是便于直接阅读、使用方便,其缺点是较笨重、存储密度低、收藏占用空间大、__保存等花费人力物力大、识别和提取难以实现机械化和自动化
(3)缩微型如缩微胶卷、缩微胶片等其优点是存储密度较大、体积小、便于收藏保存和远距离传递缺点是不能直接阅读、需借助缩微阅读机或阅读复印机才能使用缩微型一般针对于数量大、利用率低但又有较大保存和利用价值的信息资源
(4)声像型如唱片、录音带、录像带、幻灯片、电影片、多媒体资料等其优点是可以闻其声、观其形,直观而真切,给人以生动鲜明的印象其缺点是制造成本较高,且需要借助于一定的设备才能使用5)电子型其优点是存储密度高,读取速度快,更新及时,并利用电子手段随时对内容进行增、删、改,可以高速度、远距离传递信息,具有交互性,便于信息交流和共享•电子文献种类很多,按出版类型划分有电子___、电子专著、电子工具书、电子__、电子报纸、电子版书目数据、计算机软件等•按电子文献载体形式划分其类型有磁性型文献、光盘型文献和网络型文献•按信息结构__形式划分有文本型、多媒体型、超文本型及超媒体型
2、按信息资源的__深度和结构等级划分
(1)零次文献指未经过任何__的原始文献如实验记录、手稿、日记、原始录音、原始录像、谈话记录
(2)一次文献未经__或粗略__的原始信息资源,以本人的研究成果为基本素材而创作的文献,具体、详尽和系统化如期刊论文、专利文献、科技报告、会议录、学位论文等等
(3)二次文献它是将大量分散、零乱、无序的一次文献进行进行__、整理、标引、著录、浓缩,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用如目录、题录、索引、文摘具有报道和检索功能
(4)三次文献通过二次信息资源提供的线索,对某一范围内的一次信息资源进行分析、研究、__而成的信息资源,它包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等一次文献是二次文献和三次文献的基础,是文献检索的主要对象;二次文献具有浓缩性,是一次文献的简略及有序化,是文献检索的工具;三次文献具有综合性,既是检索对象,又可提供一定的检索途径与检索手段总之,文献经过__、压缩,从零次信息到三次信息,使科技信息由分散到集中,由无序到有序,由无__到系系统化,由博而精的对知识信息进行不同层次的__的过程
3、信息的不同出版类型划分
(1)图书包括专著、___、各种科普读物及专业参考工具书等,特点是内容系统、成熟、定型、信息经筛选,可靠性强,出版周期长,更新速度慢,从检索角度,图书一般___主要检索对象
(2)期刊定期或不定期刊行的连续出版物,如__、年度报告、年鉴、丛书、学会的会议录、学报和纪要等,特点是数量大、品种多,内容丰富多样、出版周期短、报道速度较快、发行、流通面很广泛,连续性强,伴随着相应的学科领域发展前进职能记录正式的公开的科学技术活动,传播科技信息的主要工具
(3)科技报告又称研究报告、报告文献大多与__的研究活动、国防及尖端科技领域有关,发表及时,课题专深,内容新颖、成熟,数据完整,且注重报道进行中的科研工作,是一种重要的信息源查寻科技报告有专门的检索工具特点
①反映新的科研成果迅速
②内容多样化
③保密性
④报告质量参差不齐
⑤每份报告自成一册,装订简单,一般都有连续编号,出版发行不规则
(4)会议文献在学术会议上宣读和交流的论文、报告及其他有关资料会议文献的特点是传递情报比较及时内容新颖专业性和针对性强,种类繁多,出版形式多样它是科技文献的重要组成部分同一会议上的文献论题集中、新颖、丰富、专深、学术性强,一般是经过挑选的质量较高,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向,是了解各国科技发展水平和动向的重要文献来源会议文献没有固定的出版形式有的刊载在学会协会的期刊上,作为专号、特辑或增刊,有些则发表在专门刊载会议录或会议论文摘要的期刊上一些会议文献还常常汇编成专题论文集或出版会议丛刊、丛书还有些会议文献以科技报告的形式出版此外,有的会议文献以录音带、录像带或缩微品等形式出版
(5)专利文献专利文献是各国专利局及国际性专利__在审批专利过程中产生的__文件及其出版物的总称作为公开出版物的专利文献主要有专利说明书、专利公报、专利文摘、专利索引和专利分类表等特点是内容具体、可靠、详尽,具有新颖性、创造性和实用性能反映科学技术最新的水平,大量重复,增加用户信息识别和去掉重复的负担
(6)技术标准和规范对工农业产品和工程建设的质量、规格、参数及其检验方法等方面所作的技术灰顶,特点是制定、审批有程序,适用范围明确专一,叙述严谨,可靠性和现实性,新陈代谢频繁
(7)__出版物__出版物是由__机构制作出版、或由__机构编辑并授权指定出版商出版的文献可分两类一类是行政性文献包括宪法、司法文献,主要涉及__法律、经济方面的国会和议会记录、议案、决议、司法资料、听证记录、法律、法令、规章制度、政策、调查统计资料等;另一类是科学技术文献,主要指__部门出版的科技报告、标准、专利文献、科技政策文件,公开后的科技档案、经济规划、气象资料等 __出版物的内容涉及人类生活的各个领域__、社会、经济、财政、工农业生产、教育、历史,也有自然科学和应用科学的各个领域__出版物是了解一个国家方计、政策、科学技术和经济、生活现状的权威___来源特点政策性、综合性、指导性强,对经济、科技发展政策导向明显、可靠
(8)学位论文学位论文是指为了获得学位,要求被授予学位的人所撰写的论文根据《中华人民___学位条例》的规定,学位论文分为学士论文、硕士论文、__论文三种特点质量参差不齐,内容专深,有独到见解,较难获取
(9)产品资料产品目录、产品说明书、产品样本等,是对产品的性能、结构、原理、用途、使用方法、技术规范及产品规格等进行描述或说明的文献特点图文并茂,形象直观,出版及时,更新迅速,反映的技术信息可靠
(10)技术档案在生产或科研过程中形成的,是具体工程和研究对象的技术文件的总称,包括任务书、技术经济指标、研究计划、方案、试验设计、实验记录、调查材料、总结报告等应入档的资料它是生产和科研中用以积累经验、吸取教训和提高质量的重要依据,具体较高的参考价值技术档案有一定的保密性,一般在内部控制使用
(11)报纸报纸指以刊载新闻和新闻评论为主,通常散页印刷,不装订、没有封面的纸质出版物有固定名称,面向公众,定期、连续发行现在多数报纸每日出版一次或数次,也有每周出版几次或每周出版一次的特点传播信息快,传播信息量大,现实感强,传播面广,具有群众性和通俗性,是重要的社会__工具和信息源附美国四大科技报告(AD,PB,NASA,DOE)
1、AD报告1951年开始出版现由美国国防技术情报中心负责收集整理和出版报告内容以国防部各个合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document之意,现在则可理解为入藏报告(Ac__ssionDocument)统化,由博而精的对知识信息进行不同层次的__的过程
2、PB报告产生于二战结束之后,当时美国__为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国___出版局(PublicationBoard),负责收集、整理、报导利用这些资料
3、NASA报告是美国国家____局NASA科技情报处编辑、出版的专业性检索刊物,它是检索____科技报告的重要工具
4、DOE报告,是美国能源部DOE技术情报中心编辑出版的半月刊收录能源部部属科研机构和各大学等一切与能源有关的科技文献,以科技报告为主
一、按检索对象的内容区分
(1)文献检索(documentretrieval)文献检索是以文献作为检索对象,查找含有用户所需信息内容的文献,文献是一种相关性检索而非确定性检索,系统不直接解答用户所提出的问题本身,只提供与之相关文献或文献的属___与来源指示供用户参考和取舍所以其检索对象是包含特定信息的各种文献
(2)数据检索dataretrieval数据检索是将经过选择、整理、鉴定的数值存入数据库中,根据需要查出可回答某一问题的数据的检索数据检索是一种确定性的检索,即直接提供用户所需要的确切数据而且检索结果一般也是确定性的,要么是有,要么是没有;要么是对,要么是错有些数据检索系统不仅能查出数据,还提供一定的运算、推导能力例如,可以回答“某人生于何年何处”;“某年的国民生产总值”等
(3)事实检索factretrieval事实检索是检索关于某些客体(如机构、人物等)的指示性描述,或关于某一__发生的时间、地点、经过等信息并将其查找出来的检索如名词术语、概念、定义、理论、方法、公式、__等事实检索属于数据,因为事实也是一种数据,即非数值性数据
二、按检索方式区分;
(1)手工检索以手工操作的方式,利用检索工具书进行信息检索手工信息检索是信息检索的传统方式,已经历经了一个多世纪的发展历程优点直观、灵活,便于控制检索的准确性缺点查找比较复杂,检索速度慢,工作量较大
(2)机器信息检索主要是指计算机检索,是通过机器对已数字化的信息,按照设计好的程序进行查找和输出的过程按机器检索的处理方式分类,有脱机检索、联机检索;按照存储的方式分类,可分为光盘检索、网络检索优点大大提高了检索效率和检索的全面性,而且拓展信息检索领域,丰富了信息检索的研究内容手检和机检的比较•手检检索点少,通常只有分类、主题、号码、著者等几个途径;查准率高,查全率低,直接性灵活性差,浏览功能强,检索效率低•机检检索点多除虚词外的所有词汇;查全率高,查准率高,检索效率高;直接性灵活性好,浏览功能差
三、按检索对象区分
(1)文本检索查找含有特定信息的文本文献的检索,其结果是以文本形式反映特信息反映的文献这是一种传统的信息检索类型,在信息检索中至今占据主要地位
(2)多媒体检索多媒体是指将声音、图像、通信等在内的多种媒体的功能有机结合在一起,并用某种新媒体代替传统媒体的多种媒体•多媒体检索是指根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行__、存储从而识别、查找并获取所需信息的过程•在因特网上存在着大量的多媒体文献,用户常常需要查找特定的声音、图像、动画等多媒体文献的信息__与处理传统文本的处理截然不同,其检索要求和检索途径也别具特色,这是现代信息检索的新课题
四、按检索对象的信息__方式区分
(1)全文检索fulltextretrieval是将存储于数据库中的整本书、整篇文章中的任意内容找出来的检索它可以根据需要获得全文中的有关章、节、段、句、词等的信息,也可以进行各种统计与分析如某个词在文章中出现的次数以全文本信息作为检索对象建立全文数据库除了具有布尔逻辑检索功能外还具有文本检索功能并允许用户以自然语言检索直接获得原文中的有关章节和段句
(2)超文本检索hypertextretrieval超文本是用超链接的方法,将各种不同空间的文字信息__在一起的网状文本
五、按检索要求区分
(1)强相关检索强调检索的准确性,也称作特性检索这种检索注重查准率只要检索得到的文献信息能满足用户的需求就行,对于检索结果的数量多少不作要求
(2)弱相关检索强调检索的全面性,向用户提供系统完整的信息的检索也称族性检索这种检索注重查全性,要求检索出一段时间期限内有关特定主题的所有信息为了尽可能避免漏检相关信息,对于检索的准确性相对要求较低•要注意的是,这是两种检索要求比较极端的检索类型实际上是介于两者之间,保证一定的查全率和查准率
六、按时间跨度区分
(1)定题检索SDIselectivedisseminationofinfor__tion查找有关特定主题最新信息的检索•其特点只检索最新的信息,时间跨度小•定题检索在文献信息库更新时运行,即每当信息库加入新的文献信息时,就用根据用户检索需求拟定的提问检索一遍,查找出特定主题的最新信息,分析整理检索结果并以一定的方式提供给用户这种检索模式非常适合于信息跟踪,便于及时了解有关主题领域的最新发展动态
(2)回溯检索RSretrospectivesearch查找一段时期内有关特定主题信息的检索•其特点是既可以查找过去一段时间的特定主题信息,也可以查找最近的特定主题信息与每个定题检索需要多次运行不同的是,每个回溯检索一般只运行一次,从已有的文献信息库中查找出某个时间内特定主题的信息,并提供给用户•目前,用户利用最多的是回溯检索,但定题检索发展也很快,科研课题进行中需要定题检索,对企业来说,也非常需要利用定题检索获得和掌握市场的持续信息
七、按检索途径的特点区分1常用法,工具法,利用检索工具或系统中常设的检索入口查找文献信息的方法如主题、分类、著者、题名等其具体操作分为顺查,倒查,抽查顺查方式是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找倒查方式则相反从最新时间查找起,直到满足检索要求为止抽查是针对有关学科的发展特点,抽查某些特定时期的文献信息通常抓住学科专业发展兴旺的时期,此时的不仅文献发表的数量多,质量也高2回溯法,引文法,利用文献末尾所附的____或引文为检索入口,查找到越来越多的文献但这种方法,查找到最后,查找到的文献与检索主题的相关性会越来越差3综合法,综合常用法和回溯法的检索方式如先用一般检索途径,再利用原始文献后的____作为检索入口,分阶段交替使用两种方法第一节信息检索语言与检索途径
一、定义•信息检索语言(retrievallanguage)又称为情报语言、情报存储和检索语言、信息__语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁•信息检索语言是检索系统的语言基础,主要作用是表达描述信息内容和信息需求;用于信息的__和整序;用于对检索系统中索引标识或提问标识的规范和控制•不同的检索系统由于所覆盖的学科领域不同,包含信息资源类型不同,通常采用不同的信息检索语言(例如EI与CNKI所使用的分类语言);•同一个检索系统往往也同时采用多种检索语言,以形成多种检索途径和角度(例如中国知网期刊文献与专利文献所使用的分类语言)
二、分类
1、根据结构原理划分
(1)分类语言
(2)主题语言
(3)分类主题一体化语言
(4)代码语言
(5)引文语言
(1)分类语言•分类语言主要可分为等级体系型分类语言和分面组配型分类语言两种•
①等级体系型分类语言是一种最传统的分类语言,是一个直接体现知识分类和概念逻辑的标识系统所有类目按照学科专业的等级、层次划分,一一列举,构成一个由总体到个体,由一般到特殊,由全部到局部的分类标识体系这种结构符合人们通常的研究思维习惯,能保证较高的查全率目前我国广泛采用《中国图书馆分类法》(简称《中图法》)进行分类,该分类法由5大部类、22个大类组成•2)主题语言以主题词来表达信息主题概念的语言,它按事物对文献信息进行浓缩、描述和整序,借用自然语言的语词,作为文献信息和检索提问的内容标示•特点按特定的事物集中文献信息,有较强的直接性•构成原理利用自然语言中的名词术语,经过一定程度的规范化处理,作为表达文献和提问内容的主题词;利用参照系统中的各种手段,显示主题标识之间的各种关系,并以此把主题词表中的众多主题词相互__起来,构成__的主题词体系;利用主题词的字顺序列,按事物的名称来排列和检索文献信息
①标题语言采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物--主题,并将全部标识按字顺排列•例一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词了,这三篇文章都必须用“微型计算机”作标题词(根据词表决定)因为这三个术语是等同概念,如果同时用三个术语来标引,便会导致文献被分散当然,读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见微型计算机”的参照指示
②关键词语言关键词语言(keyword)以关键词(从文献题名或文摘以及正文中抽取的,能够表达文献主题并具有实质意义的未经规范化处理的自然语言词汇)作为文献内容标识和检索依据的一种信息检索语言关键词与其他主题语言的区别在于前者是没有经过规范处理的自然语言属于非受控语言后者是经过规范处理的自然语言,属于受控语言
③元词语言以元词(从文献中抽选出来的,从字面上不可分割的表达最基本的概念单元的词汇)作为主题标识,通过字面组配来表达主题概念的•例“物理”、“贸易”就是元词•“知识__”就不是元词,而要拆分为知识、__•元词语言创立了检索时进行组配的后组方式,可以用较少的词汇表达几乎无限的主题,但由于元词不象标题词那样采用词组或说明语搭配词语之间的组合关系,其仅为字面组配,因而利用元词检索时错搭配、假__的现象在所难免,已被淘汰
④叙词语言(descriptor)以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言,提高标引的专指性和检索的灵活性•叙词是经过规范化处理的以基本概念为基础的表达文献信息和检索提问的主题的词和词组叙词语言对元词语言的单词组配原理,标题语言的词汇规范和参照系统,以及分类语言知识分类的方法进行了继承和发展•叙词语言的基本原理是概念组配,与元词语言的字面组配有本质区别前者是词语概念意义的拆分和组合,其本质是语义层次上的组合,后者是词语字面的拆分和组合,其本质是字符层次上的组合•如“儿童病理学”用元词为“儿童”和“病理学”•叙词为“儿童”“消化系统病理”、“内分泌系统病理”、“呼吸系统病理学•叙词的组配,按照叙词意义之间的语义关系,存在如下几种类型•a.交叉组配指两个或两个以上语义交叉的叙词之间的组配•例“人工林”和“防护林”的组配表达“人工防护林”的主题•b.限定组配指将一个表示事物的叙词与表示事物属性、部分或方面的叙词进行组配例如“电子计算机”和“存取速度”的组配表示“电子计算机的存取速度”•c.组合组配又叫并列组配,是指除上述两类叙词组配之外,任何两个或两个以上的叙词之间的组配例如“计算机”、“应用”和“图书馆”的组配表达“计算机在图书馆中的应用”•叙词语言的特点是•规范性强,叙词语言事先进行规范化处理,列于叙词表中,标引和检索都从叙词表中选词,保证了标引和检索的一致性•利用叙词的组配,可使用有限的叙词表达各种复杂的主题,尤其是最新出现的主题•叙词语言从单元概念出发提示文献内容,有助于准确、全面地揭示文献的主题,提高标引深度和专指度•检索入口多,能满足多元检索的需要,检索范围改变也相当灵活,大提高了检全率•同时适用于手工检索和计算机检索系统•叙词语言是我国目前使用最广泛的受控主题语言
2、根据组配方式划分•
(1)先组式语言表达信息主题概念的标识已事先用固定关系组配好,并编制在词表中,标引人员在标引信息或用户在检索信息时,必须根据词表选用组配好的主题进行操作如体系分类法和标题词法•
(2)后组式语言表达信息主题概念的标识在编制词表时不曾预先规定组配关系当标引信息时,只能根据词表中选用单独的主题词来描述信息的主题概念;检索时,用户可以根据需要将不同的检索词组配在一起,用来表达复杂的主题概念如元词、叙词
3、根据规范化程度划分•
(1)规范化语言•
(2)自然语言•
(3)两者结合的发展趋势
4、根据描述的文献特征分•
(1)描述文献内容特征的检索语言•内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等•主题语言、分类语言、分类主题一体化语言•
(2)描述文献外部特征的检索语言外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等代码语言、引文语言
三、检索途径及其选择
1、内容特征检索途径内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等•
(1)分类途径•
(2)主题途径•
(3)分类主题途径
2、外部特征检索途径外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等•
(1)责任者途径•
(2)题名途径•
(3)序号途径•
(4)引文途径第二节事实数据信息的检索工具
一、字典、词典(辞典)字典是为字词提供音韵、意思解释、例句、用法等等的工具书在西方,是没有字典的概念,全是中国独有的字典收字为主,亦会收词词典或辞典收词为主,也会收字为了配合社会发展需求,词典收词数量激增并发展出不同对象、不同行业及不同用途的词典例《新华字典》、《现代汉语词典》《牛津英语词典》、《建筑大辞典》西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等
二、百科全书常被誉为“没有围墙的大学”概要记述人类一切知识门类或某一知识门类的工具书百科全书在规模和内容上均超过其他类型的工具书,它集各类百科全书的主要作用是供人们查检必要的知识和事实资料,其完备性在于它几乎包容了各种工具书的成分,囊括了各方面的知识百科全书可按收录范围分为综合性百科全书(如《中国百科全书》、专业性百科全书(如《化工百科全书》;还可按编辑规模分为大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)编排方式有三种按字顺编排、按分类编排和分类与字顺相结合编排目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的百科全书一般都有各种索引,其中最主要的是主题索引,就是把条目的条头、释文的隐含主题和参见主题按字顺排列以供检索世界ABC三大百科全书美国百科全书、不列颠百科全书、科利尔百科全书美国百科全书》名为EncyclopediaAmericana,简称EA,《不列颠百科全书EncyclopediaBritannica》又称《大英百科全书》,简称EB科利尔百科全书(CollierEncyclopedia)简称EC
三、手册顾名思义是放置于手边可以方便地参考的一种工具书是汇集某一学科或某一主题等需要经常查考的资料,供读者随时翻检的工具书手册就是各行各业、不同地域、不同职业的人在进行某种行为时所需要的一种了解相关信息的材料手册主要为人们提供某一学科或某一方面的基本知识,方便日常生活或学习手册中所收的知识偏重于介绍基本情况和提供基本材料,如各种公式、规章、条例、事实、数据、图表等等通常按类进行编排,便于查找如《图书情报工作手册》、《数学手册》
四、年鉴是一种按年编纂出版的参考工具书以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书汇辑一年内的重要时事、文献和统计资料,按年度连续出版年鉴内容丰富、新颖,叙述简明,编排得当,具有可靠性、统计性、新颖性、连续性、知识性、检索性等特点其主要作用是向人们提供一年内全面、真实、系统的事实资料,便于了解事物现状和研究发展趋势它所收集的材料主要来源于当年的__公报、国家重要报刊的报道和统计部门的数据因此,年鉴有较大的总结、统计意义和比较系统的连续参考作用通过年鉴,可查找近年来国际国内时事,各部门各行业的进展及各学科各专业的研究动态;可查找__颁布的重要法规文献和逐年可比的统计数据资料年鉴大体可分为综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等
五、名录名录是提供有关专名(人名、地名和机构名录等)简要工具书,内容涉及比较广泛人们可以从名录中查找关于人物生平、机构__和某一行政区划沿革等信息名录是一种事实便览性的工具书,虽只提供有关机构、人物等的简要资料,但能起指引情报源的作用,对沟通信息、促进交流、加强协作提供了很大的方便名录按收集信息的内容的不同,可分为人名录、地名录和机构名录
1、人名录又称“名人录”,是介绍某一方面人物生卒年、学历经历、荣誉、著作等资料的检索工具如:《世界名人录》人名录分为综合性、国别或地区性的、专业或职业性的三类,每类又有回溯性的(也称人名辞典)和当代人物两种
2、地名录是收录经审定的规范化的地方名称,并注明所属的国家、行政区划以及在地图集上的具__置的工具书主要提供各行政区域(国家、城市、省、县、乡、街道)、山川、河流、岛屿等的规范化名称、地理位置、人口、历史沿革、__和矿产等资料如《中国行政区划大辞典》、《世界地名录》
3、机构名录又叫机构指南是汇集机构名、人名、地名等专名及与之相关的资料的一种工具书一般提供公司或__机构的名称、地址、__号码、历史与现状、机构的主要业务与人事、主要负责人等情况,许多公司和厂商名录还要介绍其规模、资产、经营范围、产品、设备等情况具有简明、新颖、确实等特点如《中国企事业名录大全》第三节文献检索工具简介文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的__大海里找到特定的文献检索工具必须具备四个条件第一,必须详细描述文献的外部特征和内容特征第二,每条描述记录都必须具有各种检索标识(所谓检索标识是指描述文献外部特征和内容特征的专门用于信息检索的词、词组或代码,如主题词、分类号、著者姓名、文献序号等)第三,全部描述记录要科学地__成一个有机的整体第四,能够提供多种检索途径检索工具的类型•按检索手段分,有手工检索工具、机械检索工具和计算机检索工具;•按出版形式分,有书本式、期刊式、卡片式、缩微式和机读式;•按收录范围分,有综合性、专业性、专题性和单一性;•按文种分,有中文、西文、日文、俄文等;•按著录方式分,有目录型、题录型和文摘型•其中按著录方式划分体现了检索工具对文献内容揭示的深浅程度,体现了检索工具的性质,这是检索工具最主要的划分方法
一、目录型检索工具•目录是以出版物(如一本图书、一种期刊等)为报道对象,揭示出版物外部特征的检索工具所以目录对文献的描述比较浅显,一般只描述文献的外部特征,有时也通过简单的内容提要介绍文献的内容,但它不涉及文献中的具体章节或具体文献目录主要用于报道、登记出版物的出版发行情况,揭示其收藏情况,供人们选购、查阅和获取文献时使用目录的著录项目通常包括出版物名称、责任者(著者、编者或译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、__等)•目录型检索工具主要有图书馆馆藏目录、联合目录、出版社目录、国家书目等
二、题录型检索工具•题录是以单篇文献作为报道单位,揭示文献外部特征的检索工具由于它是以单篇文献为单位来报道和存储文献的,所以对文献的揭示程度比目录要具体、深入但题录与文摘相比,对文献内容的揭示又相对较浅,不过,它也因此具有__容易、可以缩短报道的时差、文体简短、可以增加检索刊物的容量的优点题录的著录项目一般包括题录号、文献题目、__及其工作单位、出处、原文文种、主题词、文中所附图表数及____数等•《IndextoScientificTechnicalPro__edings》是由美国科学信息研究所(ISI)出版的,是专为检索会议录、会议出版物及其会议论文题录而编制的综合性检索刊物,内容涉及基础学科、工程技术及应用科学等领域,每年收录约4000次重要科学会议的论文目前,全球正式出版的重要会议文献约有75%~90%被ISTP收录,是快速、全面了解会议文献的重要检索工具,并作为评价科研工__学术水平的重要指标,它与SCI《科学引文索引》Scien__CitationIndex)、EI《工程索引》(TheEngineeringIndex)、并称为“三大索引”其正文按会议号的顺序排列,著录每个会议的名称、会议事项、会议录及其出版情况和该会论文的题录
三、文摘型检索工具•文摘(abstract)是指对一份文献或一个文献单元的内容所做的简略、准确的描述,通常不包含对原文的补充、解释和评论文摘的报道对象与题录相同,但它对文献内容的揭示程度较题录更深入具体,它不仅描述文献的外部特征,还进一步描述文献的主题内容对内容的介绍主要由其中的“文摘”部分完成文摘是最常用的文献检索工具文摘的主要著录项目为•
(1)文摘号、入藏号(abstractnumberreferen__numberac__ssionnumber)它是在文献处理完以后,为每条文摘编的号码,起排序并帮助读者识别特写文摘的作用它可以是简单的顺序号,也可以是含有某种情报内容的代码符号•
(2)文献名称(documenttitle)即文献的题目(篇名),它是读者识别特定文献的重要标志之一文献名称一般是逐字照录,有时也可以删去某些引导性的词,或对含义不清及不完整的名称加以改写、补充外文文献一般要同时著录译名和原名有些英文检索工具对非拉丁文字的文献一般不著录原名,而著录原名的音译名•
(3)著者(author)及其工作单位(affiliation)是读者迅速鉴别文献的依据之一,著录著者姓名可以用全称,也可以用简称许多国家的人名表述是名在前,姓在后,一般姓用全称,名可以缩写但大多数检索工具都采用姓在前、名在后的形式英文检索工具对非拉丁文姓名用音译法著录
(4)合同号(contractnumber)或拨款号(grantnumber)如果该文献是在某项合同或拨款的支持下进行的,一般都要标明该项合同的编号或拨款文件的编号科技报告都有这一项目
(5)原文出处指刊载原文的地方原文如果是某种期刊中的论文,出处包括该刊的刊名、出版地、卷期号、出版日期和起讫页码;如果是图书或其中的一部分,出处就是书名、编著者、出版地、出版者、出版时间和起讫页码科技报告的出处就是入藏号、订购号或原来的报告号专利说明书的出处就是专利申请书或专利说明书的编号原文出处的著录是读者顺利找到原文的重要线索
(6)原文文别和译文来源原文文别一般用某种语言的简称标明,放在文献出处之后,有的放在文献的译名之后若所摘录的文献是一篇译文,应给出译文的来源(被译文献的出处),如“译自X刊X卷X期X页”此项的用处是免得使读者去找他所不能阅读的东西
(7)主题词或索引词指用来描述该文献的主题内容的若干个词或词组该项的用途很多,既可以帮助读者了解原文主题,也可以用以查找其他相关文献,或供计算机识别和进行逻辑组配检索
(8)文摘正文对文献内容所做的简略描述可以有报道性文摘和指示性文摘之分前者需概述原文的内容要点,特别是创新点,向读者提供原文中的定量信息(如距离、最大值、最小值、公式等)和定___(如发现、结果、新方法、新设备、结论等)它是原文内容的浓缩,基本上能反映原文的技术内容、信息量大,字数也较多后者则是为了把原文的主题范围、目的和方法概略地指示给读者的一种文摘,一般不包含具体的数据、方法、设备、结论等内容它指示读者将在原文中发现什么,帮助读者判断原文是否与自己的需要相关以及是否需要阅读原文,字数也相对较少第四节索引介绍一个完整的检索工具包括四个部分
1、说明部分
2、正文部分
3、辅助索引部分
4、附录部分索引通常不提供文献内容本身,只指明文献的物理位置,是一种检索文献的系统指南,使读者能准确地找出文献或文献__体中的特定信息•最常用的索引有著者索引、主题索引、分类索引、题名索引主题索引是以主题词为标目,按照主题词的字顺排列__的索引按照__主题词的原则和方法上的不同,
一、著者索引二主题索引可分为四种
1、标题索引
2、关键词索引
3、单元词索引
4、叙词索引关键词索引关键词索引是按关键词的字顺排列的索引关键词是直接从原文的标题、摘要或全文中抽选出来的,具有实质意义的、未经规范化处理的自然语言词汇被抽选出来的关键词都可以作为标引词在索引中进行轮排,作为检索词进行检索由于关键词表达事物和概念比较直接,不受词表控制,能及时反映新事物、新概念,目前被广泛地应用于手工检索和计算机检索系统中但关键词索引不显示词间关系,不能进行缩检和扩检,影响检索效率不过,在计算机检索系统中,利用关键词之间的逻辑组配,在一定程度上解决了这个问题计算机检索系统还采用编制禁用词表和关键词表等方法,以提高关键词抽取的准确性,并对词间关系进行控制,提高了检索效率
三、分类索引分类索引以科学分类为基础,运用概念划分的方法将知识按一系列的标准和逻辑规则进行层层划分,形成一个严格有序的直线式的知识门类等级体系,用概括事物本质属性的概念作为类目名称,并给出相应的标记符号作为类号,按照分类号编排分类的方法能较好地体现学科的系统性,反映事物之间的平行、隶属和派生关系,适合人们认识事物的习惯,有利于从学科或专业的角度进行族性检索目前我国广泛采用《中国图书馆分类法》不过《中国图书馆分类法》作为体系分类法是先组式检索语言,缺乏进行多概念灵活组配的能力,分类表类目是根据编制时的学科专业情况设置的,无法反映新学科和新技术的内容,且体系分类法是按学科性质建立的直线式序列结构,对全面检索跨学科跨专业的文献信息有一定难度但它仍然是一种不可缺少的检索工具,特别是在网络检索工具中,使用分类方法浏览、搜索信息十分普遍在一些专门领域,如专利、标准文献的检索中,都有特定的分类索引
四、题名索引•题名索引是以书名、刊名或篇名为标目,并按题名的字顺排列的一种索引•如有些期刊在每年最后__后会附上全年刊登的文献的题名索引其按字顺排列,在每个题名后列出其所在的期号,甚至所在页码
五、其他索引为适应某些专业的特殊需要或某些文献的特点,会根据需要编制一些专用索引这类索引所用的索引词形式很专一,通常是某一专业领域的专用名词,如化学物质名称、动植物名称、药名、矿物名、地名、商品名、机构名等等,以及专用的符号代码,如元素符号、化合物分子式、专利号、报告号、标准号、合同号等这些专用名称和符号代码表示文献的某一种特征,有一定的检索意义,特别是在相应的专业领域内,其检索价值尤为显著第五节计算机信息检索基础理论
一、检索技术及其实现
1、布尔逻辑组配检索技术布尔逻辑组配检索是现行计算机检索的基本技术,它利用布尔逻辑运算符表示两个检索词之间的逻辑关系,将检索提问转换成逻辑表达式常用的运算符有
①逻辑“与”—AND
②逻辑“或”—OR
③逻辑“非”—NOT练习头孢菌素钠Ⅴ或磺胺甲恶唑治疗呼吸道感染的引起的副作用研究检索式头孢菌素钠ⅤOR磺胺甲恶唑AND呼吸道感染AND副作用布尔检索的特点优点
(1)形式简洁,结构化强,语义表达力好
(2)布尔运算关系有利于准确表达检索概念之间的逻辑关系
(3)由于布尔运算以比较方式在__中进行,故软件易实现缺点
(1)它不承认文献内容所涉及的多个概念的重要性,即没有规定每个检索词的权重,一个概念要么与文献内容完全相关,要么不完全相关,这常与实际情况不一致
(2)它把各个概念看成相互__的,忽略了概念间的相互关系;它把概念与文献的关系简单化,忽略了概念与文献内容形式和结构的关系
(3)它不能妥善区别和处理检索式中较多的概念标引的文献和用检索式中较少的概念标引的文献如处理提问式:“AANDBANDC…ANDZ”时,系统把含有若干个提问词和不含任何一提问词的文献认为一样差,同样加以排除;在处理提问式“AORBORC…ORZ”时,不能把含有所有提问词的文献看做比只含有一个提问词的文献更好一些
(4)它不能对检索结果按与检索要求相关的程度排序输出
(5)过分依赖检索语言的文字化、规范化,往往要求较复杂的表达式(如对同义词的全面表述)为缩短检索式和醒目起见,DIALOG检索系统中“AND”、“OR”、“NOT”算符可分别用“*”、“+”、“—”代替附DIALOG国际联机检索系统简介美国DIALOG系统是目前世界上最强大的国际联机检索系统,也是目前运作最成功的联机商业数据库系统之一,它拥有80多个国家约10万多个终端用户,主机系统位于美国加利福尼亚州DIALOG拥有近600个联机数据库,其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊DIALOG是世界最著名的商用联机数据库系统之一,它的服务是收费服务
2、截词技术所谓截词(Truncation),是指检索者将检索词在他认为合适的地方截断;而截词检索,则是用截断的词的一个局部进行的检索,并认为凡是满足这个词局部中的所有字符的文献,都为命中的文献截词符根据检索系统的不同而不同,常用截词符有“?”、“﹡”、“¥”、“!”等通常用“﹡”表示无限截断,“?”表示有限截断截断方式也有后截、中截、前截等1)后截断是最常用的截词检索技术将截词符号放置在一个字符串的右方,以表示其右的有限或无限个字符﹡不影响该字符串的检索如“Computer﹡”,则词典中存储的前8个字符为Computer的所有词均满足条件,因而能检出含有Computers、Computering、Computerigation、Computered等词的文献Computer可检索出含有Computer、Computers、Computered等词的文献可见,截词检索具有隐含的OR运算特性后截词主要使用在以后4个方面
①词的单复数,如bag、box
②年代,如199(90年代),19(20世纪)
③__,如用Lancaster﹡可检索出所有姓Lancaster的__
④同根词,如用poltic﹡检索出political、politicalize、poltically、poltician等同根词2前截断例如“﹡__gnetic(有磁性的),可以检索出electro-__gnetic(电磁的)、para__gnetic(顺磁的)、thermo__gnetic(热磁的)等词汇
(3)中截断例如m?n可以检索出含有词__n、men的文献
3、字段限定检索技术文献数据库的每条记录通常都由多个代表不同信息内容的字段组成,几乎所有机检系统均设置了限定检索的功能,以满足用户检索某一特定字段信息的要求在DIALOG联机检索系统中,数据库提供的确可供检索的字段通常分为基本字段和辅助索引字段两大类基本字段表示感谢文献内容特征,如题名、主题词、文摘等;辅助索引字段表示文献外部特征,如著者、文献类型、语种、出版年代等每个字段有一个字段代码,字段代码通常用两个大写字母表示如DIALOG联机检索系统中,字段限定符主要有•AU=限查__CS=限查__机构•JN=限查特定刊名Ti=限查题目字段•LA=限查语种AB=限查文摘字段•PN=限查特定专利号DE=限查主题词字段•PY=限查特定年份ID=限查关键词或自由词
4、词位限定检索技术1)(W)算符与(nW)算符(W)算符是“Word”或“With”的缩写,它表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间可以有一个空格,或一个标点符号或一个连接号外不得夹有任何其他单词或字母,且词序不得颠倒(W)算符严密性较强,它基本等同于词组检索目前绝大部分搜索引擎都具有词组检索的功能,一般用“”表示例如SQLWSERVER可以检索出SQLSERVER或SQLSERVERgone(2W)wind可以检索出gonewiththewind2(N)算符和(nN)算符(N)是Near的缩写,它表示在算符两侧的检索词必须紧密相连,所连接的词间不允许插入任何其他单词或字母,但词序可以颠倒(nN)表示允许在连接的两个词之间夹插入至少n个单词,且这两个检索词的词序任意例如Railway(2N)Bridge可以表示RailwayBridge,BridgeofRailwayBridgeoftheRailway
(3)(S)算符在某些情况下,特别是对查全率有较高要求时,可放松词位置检索要求,改用同句检索所谓同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制同句检索的位置算符是(S)S是senten__的缩写例如electronicSoptical可以检索出题名为Cuttingandpolishingopticalandelectronic__terials的文献
(4)(L)算符(L)是link的缩写,它要求检索词在同一主题词字段中,并且具有词表规定的等级关系因此,该算符只适用于有正式词表,且词表中的词具有从属关系的数据库如railroadsLtrafficcontrol表示trafficcontrol是railroads的下一级主题词
(5)(F)算符(F)是field的缩写,表示在此处符两侧的检索词必须同时出现在数据库记录的同一字段中,词序可变,字段类型不限从限制的严格性看,F、S、L、N、W依次渐严,而且都比AND严在执行优先级上比NOT、AND、OR优先计算机信息检索的一般步骤为
1、根据检索课题,选择适用的数据库;
2、确定检索词;
3、编制检索式;
4、显示及判断检索结果;
5、修改检索策略
6、索取原文非控制词汇是极为灵活有效的检索词对于自由文本检索和全文检索而言,关键词更是最重要的检索词
二、ISIWebofKnowledge平台信息资源组成WebofScien__(WOS)INSPECMEDLINEDerwentInnovationsIndexCurrentContentsConnectISIeSearchISTPIndextoScientificTechnicalPro__edingsISSHPIndextoSocialScien__Hu__nitiesPro__edingsScien__CitationIndexExpandedSocialScien__CitationIndexArtsHu__nitiesCitationIndexIndexChemicusICCurrentChemicalReactions CCR3个引文数据库2个会议论文引文数据库2个化学数据库ISIChemistry信息源选择信息构造检索式相关性判断与反馈初步检索结果集词汇替换检索词与标引词匹配运算信息数据库概念分析信息需求词汇替换概念分析获取所需信息系统检索语言信息存储信息检索。