摘要
正向最大匹配算法是中文自动分词一种常用算法。它为词典设计了键树结构,克服了设定初始词长的限制,并用Java实现了算法。
Forward maximum matching algorithm is widely used in Chinese word segmentation. In this paper, a structure of key tree is designed for the dictionary, and then the maximum word-length is not limited. The algorithm is implemented with Java.
出处
《电脑编程技巧与维护》
2012年第20期97-99,共3页
Computer Programming Skills & Maintenance
基金
海南省教育厅基金项目(Hjkj2011-37)
三亚院地合作项目(2011YD19)
关键词
中文分词
正向最大匹配算法
键树
Chinese word segmentation
Forward maximum matching algorithm
Key tree