期刊文献+

基于Lucene.Net的知识检索系统的设计与实现 被引量:3

Design and Implement of Knowledge Retrieval System Based on Lucene.Net
下载PDF
导出
摘要 在Lucene.Net的基础上,设计并实现了一种知识检索系统——基于奥运知识库的检索系统,该系统对Lucene.Net的中文分词功能进行了改进,即采用双字哈希机制的中文分词器,提高了对中文分词的支持度,并增加了新增生词的功能,能提高检索的准确度。 On the basis of Lucene.Net, designs and realizes a knowledge retrieval system, based on the knowledge base of the Olympic retrieval system, improves the function on the Chinese word segmentation in the Lucene.Net, that is a dual character Hash the Chinese word segmentation mechanism, enhance the Chinese-term support, and increases the functions of the new words, which can improve the accuracy of the search.
作者 陈烨彬 黄琳
出处 《现代计算机》 2008年第11期124-125,128,共3页 Modern Computer
关键词 检索系统 LUCENE.NET 中文分词 双字哈希 Retrieval System Lucene.Net Chinese Word Segmentation Double Character Hash Indexing
  • 相关文献

参考文献5

二级参考文献11

  • 1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量:45
  • 2张校乾,金玉玲,侯丽波.一种基于Lucene检索引擎的全文数据库的研究与实现[J].现代图书情报技术,2005(2):40-43. 被引量:30
  • 3马晏.基于评价的汉语自动分词系统的研究与实现[A]..语言信息处理专论[C].北京:清华大学出版社,1996..
  • 4Choi A, Cheng C H, Ko Y L. Word extraction from Chinese documents by occurrence counts [ A].1988 International Conference on Computer Processing of Chinese and Oriental Languages, Toronto,Canada: 488 - 491.
  • 5Fan C K, Tsai W H. Automatic word identification in Chinese sentences by the relaxation technique[J]. Computer Processing of Chinese and Oriental Languages, 1988, 4(1):33-56.
  • 6车东.在应用中加入全文检索功能--基于Java的全文索引引擎Lucene简介[EB/OL].http://www.chedong.com/tech/lucene.html,2002-08.
  • 7梁南元.书面汉语自动分词系统—CDWS[J].中文信息学报,1987,(2):44-52.
  • 8李晓明 刘建国.搜索引擎技术及趋势[EB/OL].http://www.media.ccidnet.com/media/ccu/4061/02701.htm,2003-03-02.
  • 9孙茂松,左正平,黄昌宁.汉语自动分词词典机制的实验研究[J].中文信息学报,2000,14(1):1-6. 被引量:118
  • 10郭辉,苏中义,王文,崔骏.一种改进的MM分词算法[J].微型电脑应用,2002,18(1):13-15. 被引量:39

共引文献120

同被引文献21

引证文献3

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部