期刊文献+

Nutch0.9中二分法中文分词的实现

下载PDF
导出
摘要 Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询。Nutch0.9较好地处理了英文分词,但对中文分词处理还不够完善。文章介绍了在Nutch0.9中实现索引及检索的二分法,提出了改进中文分词的方法。
出处 《计算机时代》 2009年第4期28-30,共3页 Computer Era
基金 江西省自然科学基金项目(0311046)
  • 相关文献

参考文献4

二级参考文献29

共引文献45

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部