期刊文献+

Lucene全文索引效率的改进 被引量:3

Improvement of Lucene full-text indexing efficiency
原文传递
导出
摘要 Lucene是一个优秀的开源的全文搜索技术框架,按照框架规范,扩展它的功能,可以将它很好地嵌入到搜索引擎中。研究了Lucene的索引结构和原理,通过改进增量索引、增大索引缓冲区的大小和减少往磁盘上写索引文件的频率,达到提高创建索引效率的目的。设计了全文检索实验,实验结果表明,该方法使10 000篇文档创建索引的平均效率比前人方法提高了19.5%,具有良好的应用前景。 Lucene is an excellent open-source full-text search technology framework that can be well embedded in its own search engine by expanding its functions in accordance with the framework specification. Lucene index structure and principles were studied, and the efficiency of indexing was enhanced by improving incremental indexing, increasing the size of index buffer in memory and decreasing the frequency of writing index to disk. A full-text retrieval experiments were designed. As a result, the average efficiency of creating index for 10 000 documents has been improved by 19. 5%, and the method has good prospects.
出处 《山东大学学报(理学版)》 CAS CSCD 北大核心 2015年第7期76-79,共4页 Journal of Shandong University(Natural Science)
基金 网络文化与数字传播北京市重点实验室开放课题项目(ICDD201404) 国家自然科学基金资助项目(61271304) 北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037) 2013年河北省高等学校科学技术研究自筹资金项目(Z2013162)
关键词 全文索引 全文检索 信息检索 效率 full-text index full-text retrieval information retrieval efficiency
  • 相关文献

参考文献10

二级参考文献53

共引文献60

同被引文献21

引证文献3

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部