摘要
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构。在此基础上,深入探讨了XML索引的存储结构及实现。并对索引的性能进行了评价。
Being an important data exchange and information storage standard, XML gained much attention and much work has been done on XML indexing. However, most of the research is based on database system and specialized semi-structured data management system. In this paper, we propose a comprehensive method for XML indexing based on traditional IR system Okapi. Firstly, Okapi and its indexing structure are introduced. Then we fully exploit the index structure, indexing algorithm and performance evaluation of this method.
出处
《情报学报》
CSSCI
北大核心
2006年第6期679-685,共7页
Journal of the China Society for Scientific and Technical Information
基金
国家社会科学基金资助项目(编号
04CTQ005)和湖北省科技攻关项目(编号:2004AA101C99)成果之一.
关键词
文本检索系统
Okapi
XML索引实现
traditional IR system, Okapi, XML, index structure and algorithm.