期刊文献+

数字图书馆中文本信息检索技术的研究与实现 被引量:3

The research and implementation of document retrieval in digital library
下载PDF
导出
摘要 介绍了一个并行数字图书馆原型系统PDL,和用于该系统的针对文本信息检索的一些数据结构,包括倒排索引,结构索引,RANK索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法.这些算法以计算机机群并行环境为基础.实验表明并行数据查询具有良好的性能. This paper introduce designs new data structures including inverted index, structure index, RANK index and lexicon for document retrieval on digital library. Based on these structures, new query and maintenance algorithms are designed. All these algorithms are running on parallel processor environment. In order to meet the need of maintenance, inverted index and forward index are used. The experiments show that the parallel method has a good performance.
出处 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第7期1007-1010,共4页 Journal of Harbin Institute of Technology
关键词 元数据模式 倒排索引 并行文本处理 基于内容和结构查询 metadata model inverted index parallel text system search based on content and structure
  • 相关文献

参考文献9

  • 1BRAY T, PAOLI J, SPERBERGMCQUEEN C M. Extensible markup language (XML)1.0. W3C Recommendation[ EB/OL]. http ://www. w3. org/TR/REX - xml. 1998.
  • 2BIRMINGHAM W P. An Agent - Based Architecture for Digital Libraries [ M ]. The university of Michigan, DLib Magazine, 1995.
  • 3HUGH J, ABITEBOUL S, GOLDMAN R, et al. Lore: a database manage ment system for semistructured data[J]. SIGMOD Record,1997,26(3) :54 -66.
  • 4SHIN D, JANG H, JIN Honglan. BUS: an effective indexing and retrieval scheme in structured documents[A]. proc, Digital Library[C]. 1998: 235-243.
  • 5http://dublincore. org/documents/1999/07/02/dces/[EB/OL].
  • 6肖珑.元数据格式在数字图书馆中的应用[J].大学图书馆学报,1999,17(4):18-24. 被引量:79
  • 7任美睿 李建中 杨艳.基于朴素贝叶斯方法的自动文本分类系统的实现[J].计算机科学,2002,(8):285-87.
  • 8朱敬华 等.数字图书馆中的RANK—Revealing技术[J].计算机科学,2002,29:107-109.
  • 9DAO Tuong. An indexing model for structured document to support queries on content, structured and attributes[ A]. Proceedings of ADL's98[ C]. 1998. 22 -24.

二级参考文献1

共引文献79

同被引文献16

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部