期刊文献+

Nutch中文分词插件的编写与实现 被引量:1

Programming and realization of Chinese segmentation plug on Nutch
下载PDF
导出
摘要 开源搜索引擎Nutch是针对英文环境开发的,针对Nutch对中文进行单字切分的不足,在剖析Nutch分词器的基础上,基于Nutch的插件机制,结合中科院的中文分词系统ICTCLAS,成功地实现了Nutch对中文的词语切分,完善了基于Nutch的中文搜索引擎的开发。 Open source search engine Nutch is developed for English environment, which only segments Chinese into a single character. To solve this problem, the paper analyzes the linguistic analysis structure and plug-in mechanism of Nutch, combining Chinese lexical analysis system ICTCLAS of the Chinese academy of science, realizes the Chinese word seonentation of Nutch and prefects the development of Chinese search engine based on Nutch.
出处 《信息技术》 2010年第2期97-100,103,共5页 Information Technology
关键词 NUTCH ICLCLAS 插件机制 中文分词 Nutch ICTCLAS plug-in mechanism Chinese segmentation
  • 相关文献

参考文献5

二级参考文献21

  • 1彭波.搜索引擎的混合索引技术[J].计算机工程与应用,2004,40(22):16-18. 被引量:6
  • 2孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量:101
  • 3[1]李晓明,闰宏飞,王继民.搜索引擎-原理、技术与系统[M].科学出版社,2004.
  • 4[2]ERIK HATCHER、OTIS GOSPODNETIC.Lucene in Action[M],2005.
  • 5[3]FELIXJOACHIM.GettingNutchRunningWithWindows.http://wiki.apache.org/nutch/GettingNutchRunningWithWindows,2005.
  • 6[4]TOM WHITE.Introduction to Nutch.http://today.java.net/pub/a/today/2006/01/10/introduction -to -nutch-1.htnl,2006.
  • 7[5]李刚,宋伟,邱哲.Ajax+Lucene构建搜索引擎[M].人民邮电出版社,2006.
  • 8梁南元.书面汉语自动分词系统—CDWS[J].中文信息学报,1987,(2):44-52.
  • 9ZHANG Hua-Ping,LIU Qun,CHENG Xue-Qi,et al.Chinese lexical analysis using hierarchical hidden markov model[C].Sapporo,Japan:Proceedings of the 2nd SigHan Workshop,2003.63-70.
  • 10Rohit Khare,Doug Cutting,Kragen Sitaker,et al.Nutch:A flexible and scalable open-source web search engine[R].CommerceNet Labs Technical Report,2004.

共引文献26

同被引文献22

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部