期刊文献+

基于Lucene的全文检索系统模型的研究和开发 被引量:4

Research and development on a Lucene-based full-text retrieval model
下载PDF
导出
摘要 设计实现了一个基于Lucene的全文检索系统模型.在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档. A Lucene-based full-text retrieval model was designed and implemented. For Chinese words segmentation, a module which is based on word library and uses the positive direction maximum matching algorithm was presented. Further more, 1 for processing the documents of various formats, interfaces and dynamic instantiation are used in the system model, so it can effectively process common formatted documents such as txt, xml, html, pdf, doe and rtf, etc.
作者 朱岸青 黄杰
出处 《暨南大学学报(自然科学与医学版)》 CAS CSCD 北大核心 2009年第5期504-508,共5页 Journal of Jinan University(Natural Science & Medicine Edition)
基金 国家自然科学基金-广东省科学基金联合重点项目(U0775001)
关键词 全文检索 中文分词 格式文档 full-text retrieval Chinese words segmentation formatted documents
  • 相关文献

参考文献5

二级参考文献20

  • 1高琰,谷士文,谭立球,费耀平.基于Lucene的搜索引擎设计与实现[J].微机发展,2004,14(10):27-30. 被引量:23
  • 2王羲,任琦梅.基于44B0平台的uC-Linux Web服务器实现方法研究[J].微计算机信息,2005,21(3):76-77. 被引量:10
  • 3陈庆伟,刘军.基于Lucene的网站全文搜索的设计与实现[J].科技情报开发与经济,2005,15(15):242-244. 被引量:15
  • 4Lucene Open Source Material[Z].http://jakarta.apache.org/lucene.
  • 5Linwood J.Give Your Web Site Search Engine Using Lucene[Z].http:// builder.com,2003.
  • 6IBM DevloperWorks.Parsing,Indexing,and Searching XML with Digester and Lucene[Z].2003.
  • 7Cutting D.The Lucene Search Engine Powerful Flexible and Free:JavaWorld[M].John Wiley Sons,2000-09.
  • 8Foo S, Li Hui. Chinese Word Segmentation and Its Effect on Information Retrieval. Information Processing & Management, 2002.
  • 9Wu Z M, Tseng G. Chinese Text Segmentation for Text Retrieval:Achievements and Problems. Journal of the American Society for Information Science, 1993,44 (9): 532-542.
  • 10Gao Jianfeng. An Empirical Study of CLIR at MSRCN. Shanghai:International Workshop ILT&CIP-2001 on Innovative Language Technology and Chinese Information Processing, 2001.

共引文献81

同被引文献24

引证文献4

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部