摘要
本文主要讨论了蒙古文识别文本后处理字素合并模块的实现过程,包括字素合并的难点、合并规则库的设计、处理方法、转换过程、字素合并二义性现象等。在字素合并过程中,主要采取了基于规则的方法,其在规则库的建设过程中,利用了很多蒙古文语言知识,可以说字素合并规则是蒙古文字符特点、构词、构形、正字法等语言知识的形式化。经过试验,合并准确率能达到93.661%,并已成功地应用于"多字体印刷蒙古文(混排汉英)文档识别系统"中。
出处
《内蒙古民族大学学报》
2009年第6期14-15,共2页
Journal of Inner Mongolia University for the Nationalities