摘要
印刷体文字识别的作用,是将印刷在纸上或其他印刷物上的文字,通过扫描仪或其他设备输入计算机,存储为图像,再将图像中的文字转换为对应文字的计算机编码,然后将其以文本形式显示出来。经过十几年来科研人员的大量研究和实践,印刷体文字识别技术和方法已经基本成熟。即使难度最大的汉字印刷体识别,到目前识别率已经能达到99%以上。但是相对于汉字识别的研究,其他少数民族文字的印刷体识别研究却很少,如蒙古文、藏文、维文等。少数民族文字有其自身的特点,要对其进行分析,需采用不同于汉字的特征和识别方法进行识别。笔者近年来参与了蒙文印刷体文字识别的一些研究,并且已经将研究得到的结论和方法用到具体的蒙古文识别软件的设计中,现对研究的结论和方法作简要介绍。