MHW蒙古文脱机手写数据库及其应用被引量：2

MHW Mongolian Offline Handwritten Dataset and Its Application

下载PDF

导出

摘要建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。 A public well-recognized Mongolian offline handwritten database is the basis for the research and development of Mongolian handwriting recognition system.Based on the research on Mongolian coding,word formation and grammar,a large-vocabulary Mongolian offline handwritten database（MHW）is constructed,which contains 100000 pieces of Mongolian words,i.e.20 samples for each of 5000 words.The test set I contains 5000 samples and test set II contains 14085 samples.An automatic error detection algorithm is applied,which is based on the variable length of each Mongolian word.The performance of MHW is validated on three propular handwriting recognition models,among which the Recurrent Neural Network based model shows best performance of 2.20% on test set I and 5.55% on test set II with constrained dictionary.

作者范道尔吉高光来武慧娟 FAN Daoerji;GAO Guanglai;WU Huijuan(College of Computer Science, Inner Mongolia University, Hohhot, Inner Mongolia 010021, China;College of Electronic Information Engineering, Inner Mongolia University, Hohhot, Inner Mongolia 010021, China)

机构地区内蒙古大学计算机学院内蒙古大学电子信息工程学院

出处《中文信息学报》 CSCD 北大核心 2018年第1期89-95,共7页 Journal of Chinese Information Processing

基金内蒙古自治区自然科学基金(2016MS0603)

关键词蒙古文手写识别字库 HMM LSTM Mongolian handwriting recognition dataset HMM LSTM

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1赵继印,郑蕊蕊,吴宝春,李敏.脱机手写体汉字识别综述[J].电子学报,2010,38(2):405-415. 被引量：41

二级参考文献46

1高彦宇,杨扬.基于正交特征的手写体汉字识别方法[J].仪器仪表学报,2003,24(z2):446-447. 被引量：4
2金连文,覃剑钊.手写汉字识别弹性网格Gabor特征提取方法的研究[J].计算机应用研究,2004,21(12):163-165. 被引量：11
3高彦宇,杨扬,陈飞.基于融合特征和LS-SVM的脱机手写体汉字识别[J].北京科技大学学报,2005,27(4):509-512. 被引量：4
4杨蕊红,潘泉,程咏梅.小波不变矩在图像识别中的应用研究[J].计算机应用研究,2005,22(11):239-240. 被引量：4
5王建平,钱自拓,王金玲,罗国军.基于数学形态学的图像汉字笔划细化和提取[J].合肥工业大学学报（自然科学版）,2005,28(11):1431-1435. 被引量：12
6张芳,汪成军.基于支持向量机的手写体汉字的识别[J].计算机与数字工程,2006,34(1):65-68. 被引量：2
7邵洁,成瑜.关于手写汉字切分方法的思考[J].计算机技术与发展,2006,16(6):184-186. 被引量：6
8徐赵辉,杨扬,颉斌.基于弹性网格和Legendre矩的手写体汉字识别方法[J].计算机工程与应用,2006,42(17):163-164. 被引量：2
9黄戈祥,陈继荣.ART2神经网络在手写体汉字识别中的应用[J].计算机仿真,2006,23(7):153-156. 被引量：6
10崔金魁,杨扬,颉斌.一种基于集成BP网络的手写汉字识别方法[J].微电子学与计算机,2006,23(8):121-124. 被引量：6

共引文献40

1谭啸峰,沈海斌.基于主元分析的空间手写平面化预处理技术[J].机电工程,2011,28(8):965-969. 被引量：5
2郑蕊蕊,赵继印,李敏,于为民,吴宝春.多民族脱机手写体汉字数据库的设计与构建[J].大连民族学院学报,2011,13(5):502-506. 被引量：1
3潘巍,马培军,李东.基于间隔损失和L_1范数调节的特征选择方法研究[J].智能计算机与应用,2012,2(1):8-10.
4罗毅,李莺,王锴,李斌.基于Gabor变换的中文字符特征提取方法研究[J].电子设计工程,2012,20(15):146-147. 被引量：1
5刘卫,李和成.基于局部保持投影与隐马尔可夫模型的维文字符识别[J].计算机应用,2012,32(8):2309-2312. 被引量：1
6刘卫.一种基于DHMM的脱机手写维文字母识别算法[J].兰州大学学报（自然科学版）,2013,49(1):126-130.
7熊玉珍,彭德权.计算机辅助汉字测评的现状与发展[J].中国考试,2013(9):20-26.
8朱程辉,曹敏,王建平.基于过程神经网络的汉字特征提取方法的研究[J].合肥工业大学学报（自然科学版）,2013,36(10):1203-1209. 被引量：1
9余聂芳.立足细化处理解析脱机手写汉字识别[J].计算机光盘软件与应用,2013,16(24):313-313.
10朱新山,陈砚鸣,董宏辉,丁杰.基于双域信息融合的鲁棒二值文本图像水印[J].计算机学报,2014,37(6):1352-1364. 被引量：20

同被引文献69

1李进,高静,陈俊杰,王永军.基于条件生成对抗网络的蒙古文字体风格迁移模型[J].中文信息学报,2020,34(4):55-59. 被引量：5
2陈敏,吴勰,马德江.贵州古彝文字符集编码设计[J].科技经济市场,2006(7). 被引量：1
3王华,丁晓青.一种多字体印刷藏文字符的归一化方法[J].计算机应用研究,2004,21(6):41-43. 被引量：10
4王华,丁晓青.一种多字体印刷藏文字符识别方法[J].计算机工程,2004,30(13):18-20. 被引量：10
5赵骥,李晶皎,王丽君,张继生.基于HMM的满文文本识别后处理的研究[J].中文信息学报,2006,20(4):63-67. 被引量：3
6魏宏喜,高光来.印刷体蒙古文字识别中蒙古文字特征的选择[J].内蒙古大学学报（自然科学版）,2006,37(6):694-697. 被引量：8
7赵骥,李晶皎,张广渊,王杰.脱机手写体满文文本识别系统的设计与实现[J].模式识别与人工智能,2006,19(6):801-805. 被引量：6
8魏宏喜,高光来.蒙文文档图像的倾斜检测方法[J].内蒙古大学学报（自然科学版）,2007,38(4):458-462. 被引量：3
9魏宏喜,高光来.一种基于连通域的蒙古文文档图像版面分析方法[J].内蒙古大学学报（自然科学版）,2007,38(5):586-590. 被引量：4
10王嘉梅,文永华,李燕青,高雅莉.基于图像分割的古彝文字识别系统研究[J].云南民族大学学报（自然科学版）,2008,17(1):76-79. 被引量：10

引证文献2

1武慧娟,范道尔吉,白凤山,滕达,潘月彩.基于多尺度的蒙古文脱机手写识别方法[J].中文信息学报,2022,36(10):81-87.
2王维兰,胡金水,魏宏喜,库尔班·吾布力,邵文苑,毕晓君,贺建军,李振江,丁凯,金连文,高良才.少数民族文字文本分析与识别的研究进展[J].中国图象图形学报,2024,29(6):1685-1713.

1乔布师.寻找局部[J].智力（提高版）,2018,0(2):29-29.
2伊林,谢加尔,沈念驹.大自然的文字[J].小读者,2018,0(7):64-64.
3乔布师.寻找局部[J].智力（提高版）,2018,0(3):29-29.
4优秀不等于快乐[J].中国少年儿童,2018,0(3):24-25.
5徐小敏.初中英语的写作教学[J].科学咨询,2017,0(46):37-37. 被引量：1
6钟海军.语境理论在初中英语词汇教学中的应用研究[J].校园英语,2017,0(39):200-200. 被引量：1
7乐伟国.各种各样的name[J].小学教学设计（英语）,2017,0(9):62-62.
8文以芬.怎样培养学生的英语阅读能力[J].科学咨询,2018,0(2):29-29.
9文竹.基于Java技术的泰语脱机手写模式识别研究[J].无线互联科技,2017,14(21):115-117. 被引量：1
10黄弋石.维吾尔文脱机手写识别建模研究[J].信息记录材料,2018,19(2):89-91.

中文信息学报

2018年第1期

浏览历史

内容加载中请稍等...

MHW蒙古文脱机手写数据库及其应用被引量：2

参考文献1

二级参考文献46

共引文献40

同被引文献69

引证文献2

相关作者

相关机构

相关主题

浏览历史

MHW蒙古文脱机手写数据库及其应用 被引量：2

参考文献1

二级参考文献46

共引文献40

同被引文献69

引证文献2

相关作者

相关机构

相关主题

浏览历史

MHW蒙古文脱机手写数据库及其应用被引量：2