基于多尺度的蒙古文脱机手写识别方法

A Multi-scale-based Mongolian Offline Handwriting Recognition Method

下载PDF

导出

摘要蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。用三个连接时序分类器损失函数的和作为模型的总损失函数。实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。 One major feature of Mongolian is the seamless connection of characters in a word,so a Mongolian word has multiple character division methods.A multi-scale Mongolian offline handwriting recognition method is proposed,in which one image of handwritten Mongolian word are mapped into to multiple target sequences to train the model.This paper distinguishes three candidate character division methods:"Twelve Prefix"code,presentation form code and grapheme code.The multi-scale model processes the sequence of handwritten images with a Bidirectional Long Short-Term Memory network,which are then fed into a Connectionist Temporal Classification(CTC)layer to map the image to the"Twelve Prefix"code sequence,the presentation form code sequence,and the grapheme code sequence,respectively.The sum of three CTC loss is used as the total loss function of the model.The experiments show that the model achieves the best performance on the public Mongolian offline handwritten data set MHW,with 66.22%and 63.97%accuracy on test set I and II,respectively.

作者武慧娟范道尔吉白凤山滕达潘月彩 WU Huijuan;FAN Daoerji;BAI Fengshan;Tengda;PAN Yuecai(College of Electronic Information Engineering,Inner Mongolia University,Hohhot,Inner Mongolia 010021,China)

机构地区内蒙古大学电子信息工程学院

出处《中文信息学报》 CSCD 北大核心 2022年第10期81-87,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(61763034) 内蒙古自治区自然科学基金(2020MS06005)。

关键词蒙古文脱机手写识别多尺度 LSTM CTC Mongolian offline handwriting recognition multi-scale LSTM CTC

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李进,高静,陈俊杰,王永军.基于条件生成对抗网络的蒙古文字体风格迁移模型[J].中文信息学报,2020,34(4):55-59. 被引量：5
2范道尔吉,高光来,武慧娟.MHW蒙古文脱机手写数据库及其应用[J].中文信息学报,2018,32(1):89-95. 被引量：2
3范道尔吉,高光来,武彗娟.基于字素分割的蒙古文手写识别研究[J].中文信息学报,2017,31(5):74-80. 被引量：1

二级参考文献7

1赵继印,郑蕊蕊,吴宝春,李敏.脱机手写体汉字识别综述[J].电子学报,2010,38(2):405-415. 被引量：41
2王震,刘汇丹,吴健.新标准体系下蒙古文变形显现模型的设计与实现[J].中文信息学报,2013,27(1):108-114. 被引量：2
3金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.深度学习在手写汉字识别中的应用综述[J].自动化学报,2016,42(8):1125-1141. 被引量：111
4杨吉雅图,毕力格巴图.传统蒙古文字体设计方法研究[J].内蒙古大学艺术学院学报,2017,14(2):85-90. 被引量：4
5马志强,张泽广,闫瑞,刘利民,冯永祥,苏依拉.基于N-Gram模型的蒙古语文本语种识别算法的研究[J].中文信息学报,2016,30(1):133-139. 被引量：3
6滕少华,孔棱睿.基于生成式对抗网络的中文字体风格迁移[J].计算机应用研究,2019,36(10):3164-3167. 被引量：11
7袁菁菁.论传统蒙古文字体的设计方法[J].中国民族博览,2019(1):90-91. 被引量：2

共引文献5

1周雅琴,车大爽.基于知识图谱的生成式字体设计研究可视化分析[J].包装工程,2024,45(S01):8-21. 被引量：1
2任建军,张卫正,张伟伟,王越峰,崔俊杰,李灿林,刘岩,刘欣琪.青花瓷纹饰的艺术风格迁移研究[J].轻工学报,2022,37(5):113-119. 被引量：5
3石佳钰,殷雁君,张文轩,智敏.融合边缘注意力的手写蒙古文字元数据增强方法[J].内蒙古师范大学学报（自然科学汉文版）,2023,52(2):189-196.
4姚伟健,赵征鹏,普园媛,徐丹,钱文华,吴昊.稠密自适应生成对抗网络的爨体字风格迁移模型[J].计算机辅助设计与图形学学报,2023,35(6):915-924. 被引量：3
5王维兰,胡金水,魏宏喜,库尔班·吾布力,邵文苑,毕晓君,贺建军,李振江,丁凯,金连文,高良才.少数民族文字文本分析与识别的研究进展[J].中国图象图形学报,2024,29(6):1685-1713.

1李家琦.基于物性结构理论的表服饰类名词构词研究——以“X+衣/服/装”为例[J].现代语文,2022(11):45-51.

中文信息学报

2022年第10期

浏览历史

内容加载中请稍等...

基于多尺度的蒙古文脱机手写识别方法

参考文献3

二级参考文献7

共引文献5

相关作者

相关机构

相关主题

浏览历史