期刊文献+

基于MMSEG算法的中文分词技术的研究与设计 被引量:5

Research and implementation of Chinese words segmentation based on MMSEG algorithm
下载PDF
导出
摘要 文中提出了一种更为有效和准确的中文分词处理方法,并利用Lucene软件工具设计了相应的中文分词技术模块。该模块加入了改进的FFM算法,即MMSEG算法[1]的中文分词技术,对中文分词中的歧义现象实现了更好的解决方案。与现有实现算法相比,该方法可以更快更好地实现中文分词功能,可有效提高全文检索中的中文检索的能力。 This paper presents a more efficient and acxurate method of Chinese word processing and uses the software tools of Lucene to design the (corresponding Chinese word segmentation module. The module is added to the modified FFM algorithm, that is, the algorithm MMSEG Chinese word, which achieves a better solution for Chinese word ambiguity. Comparing with the existing algorithm, the method can achieve a faster and better function of Chinese word, whic;h can effectively improve the ability of the Chinese searching in full-text search.
出处 《信息技术》 2016年第6期17-20,共4页 Information Technology
基金 上海市科学技术委员会科研项目(14DZ1101400) 同济大学研究生国际交流基金资助项目(201502008)
关键词 中文分词 正向最大匹配算法 MMSEG LUCENE Chinese word segmentation forwards maximum match algorithm MMSEG Lucene
  • 相关文献

参考文献6

二级参考文献104

共引文献144

同被引文献25

引证文献5

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部