期刊文献+

基于单汉字索引的全文检索系统的优化研究 被引量:11

The Optimization of Full Text Retrieval System Based on Indexing of Single Chinese Character
下载PDF
导出
摘要 对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用并行计算和双缓冲技术。实验结果表明 ,经过优化后的单汉字全文检索系统已达到实用化的程度。 This paper discusses the optimization of full text retrieval system based on “indexing of single Chinese character” from three aspects: the compression of inverted index file using Golomb coding method, the bidirectional binary search intersection algorithm, the technique of parallel computing and double buffer cache. The experiment shows that these optimizations introduce the less storage spending and higher performance to the system.
出处 《中文信息学报》 CSCD 北大核心 2001年第4期14-19,27,共7页 Journal of Chinese Information Processing
基金 86 3高技术资助项目!(86 3 - 30 6 -ZD - 0 7- 0 2 )
关键词 单汉字标引 倒排文件 Golomb编码 全文检索系统 倒排索引 单汉字索引 full text retrieval single Chinese character indexing inverted file Golomb coding
  • 相关文献

参考文献7

二级参考文献7

共引文献33

同被引文献44

引证文献11

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部