摘要
文中提出了一种更为有效和准确的中文分词处理方法,并利用Lucene软件工具设计了相应的中文分词技术模块。该模块加入了改进的FFM算法,即MMSEG算法[1]的中文分词技术,对中文分词中的歧义现象实现了更好的解决方案。与现有实现算法相比,该方法可以更快更好地实现中文分词功能,可有效提高全文检索中的中文检索的能力。
This paper presents a more efficient and acxurate method of Chinese word processing and uses the software tools of Lucene to design the (corresponding Chinese word segmentation module. The module is added to the modified FFM algorithm, that is, the algorithm MMSEG Chinese word, which achieves a better solution for Chinese word ambiguity. Comparing with the existing algorithm, the method can achieve a faster and better function of Chinese word, whic;h can effectively improve the ability of the Chinese searching in full-text search.
出处
《信息技术》
2016年第6期17-20,共4页
Information Technology
基金
上海市科学技术委员会科研项目(14DZ1101400)
同济大学研究生国际交流基金资助项目(201502008)