还剩3页未读,继续阅读
文本内容:
学术搜XX擎的优化策略学术搜索引擎的优化策略该文介绍了一种新的检索模型,提高学术搜索引擎的检全率及检索效率该扩展模型的创新点在于引入检索词的下位词构成新的检索词组,不再局限于检索词本身字面上的匹配;且文献列表的排序将学术价值这一因素考虑在内,根据相关度及学术价值的综合评分机制对检索结果进行有序输出该模型具有一定的科学性和实用性,但是其排序的评分机制等需要在未来的研究中进一步细化,完善该扩展模型主要适用于对检全率要求较高的学术系统及___不同于普通___或系统的搜索引擎,本文所研究的学术搜索引擎是专门针对于知识库的一类搜索引擎,其检索对象较为单一,为期刊、文献等数字学术资源该文以KI为例当前学术搜索引擎检索模型一般采用布尔模型、向量模型等传统的检索模型
[1],这类检索方式只能对检索的关键词进行字面上的匹配,而忽略了其内在含义的相似度,降低了学术搜索引擎的检全率该文浅谈一种更加全面的检索模型,以提高其检索效率在该文中此模型统一简称为扩展模型所以该模型获取检索词后,首先,根据建好的学科专长词表表1利用其下位词进行扩展,扩展后成为扩展检索词组;其次,从文献库中抽取文献题目或关键词中含有扩展检索词组的文献;但是检索词与其下位词能提供的相关度权重不同,根据已确定的评分机制第三部分将详细给出即可计算相关文献的得分,按得分高低得出文献列表该模型是为了提高文献的查全率,借鉴了文献
[2]结合专长词表的专家检索方法,即用户输入检索词后,利用词表对检索词进行扩展具体设计如下
2.1构建主题词表专长词表的
一、二级词汇由中国分类主题词表中对应分类的主题词经稍加改造得来专长词表分为三级,其中部分
一、二级词汇如表1所示对每一个二级词还需建立相应的三级词文档,一个学术研究领域较长时间内的大量学术研究成果的关键词的___,可以揭示研究成果的总体内容特征、研究内容之间的内在___、学术研究的发展脉络与发展方向
[3],该文以中国知网KI数据库xx―xx年核心期刊上相关文献的所有关键词作为三级词汇
2.2确定文献列表用户输入检索词后,首先,利用该检索词的下位词进行扩展其次,根据KI数据库文献表中的文献题目和关键词,生成题目或关键词中含有扩展检索词组中词的文献,此即符合查询主题的专家文献
2.3文献排名的实现文献排名依据两方面一是依...。