基于缝隙裁剪的满文单词分割和提取方法研究被引量：5

Segmentation and Extraction Method for Manchu Words Based on Seam Craving

下载PDF

导出

摘要从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。 An important step in the Manchu document analysis is segmentation and extraction Manchu words from large images of Manchu documents.The paper proposes a new Manchu word segmentation and extraction method based on seam craving.First of all,this paper detects the number of text lines by projection profile matching method,then paints them.Secondly,the minimum energy line is located by dynamic planning from bottom to top between adjacent text lines,and the best segmentation lines that don’t cut through Manchu word components are determined by restraining the midline areas.Finally the independent Manchu text column and Manchu word is extracted according to the segmentation curve.Experimental results show that this method achieved better segmentation and extraction result on Manchu document image datasets.

作者张晶许爽贺建军李敏郑蕊蕊 ZHANG Jing;XU Shuang;HE Jianjun;LI Min;ZHENG Ruirui(College of Information and Communication Engineering,Dalian Minzu University,Dalian,Liaoning 116600,China;College of Science,Minzu University of China,Beijing 100081,China)

机构地区大连民族大学信息与通信工程学院中央民族大学理学院

出处《中文信息学报》 CSCD 北大核心 2019年第2期81-88,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61503058 61702081) 辽宁省自然科学基金(201602190) 辽宁省自然科学基金指导计划(201602205) 辽宁省教育厅科学研究项目(L2015127) 大连市青年科技之星项目(2016RQ072)

关键词满文文档图像缝隙裁剪文本列分割投影轮廓匹配区域约束 Manchu document images seam craving text line segmentation projection profile matching restraining the midline areas

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1许爽,李敏,朱满琼,周兴华.满文识别技术研究与分析[J].大连民族学院学报,2014,16(5):546-551. 被引量：8
2倪恩志,蒋旻隽,周昌乐.古代汉字文献切分研究[J].计算机工程与应用,2013,49(2):29-33. 被引量：8
3高学,金连文,尹俊勋.一种基于笔画密度的弹性网格特征提取方法[J].模式识别与人工智能,2002,15(3):351-354. 被引量：13
4黄亮,殷飞,陈庆虎.基于图聚类的脱机手写文档图像文本行分割[J].华中科技大学学报（自然科学版）,2014,42(3):33-36. 被引量：3
5钟艳如,郭德伟,黄美发.基于高斯滤波和信息熵原理的R_a评定研究[J].计算机工程与应用,2009,45(7):230-234. 被引量：1
6舒昌献,莫玉龙.基于软化形态学的边缘检测[J].中国图象图形学报（A辑）,1999,4(2):139-142. 被引量：13
7朱宗晓,杨兵.特征离散点计算在手写文本行分割中的应用[J].计算机工程与应用,2015,51(8):148-152. 被引量：3

二级参考文献51

1韩智,刘昌平,殷绪成.手写中文信封的地址行字符切分算法[J].中文信息学报,2006,20(1):85-90. 被引量：3
2蒋焰,丁晓青,任征.基于地址结构匹配的手写中文地址的切分与识别[J].清华大学学报（自然科学版）,2006,46(7):1235-1238. 被引量：3
3ISO/TC 213.IS0/ TS 17450-1 Geometrical product specification (GPS)-General concept-Partl:Model for geometric spe.eifieation and verification[S].Geneva:Intemational Organization for Standardization, 2002.
4ISO/TC 213.ISO/ TS 17450-2 Geometrical product specification (GPS)-General concept-Part2:Basic tenets,specifications,operators and uncertainties[S].Geneva:International Organization for Standardization, 2002.
5李慧芬.基于新一代GPS体系的表面稳健高斯滤波技术的研究[D].武汉:华中科技大学,2006:17-19.
6ISO/TC 213.ISO 14253-1 Geometrical Product Specification(GPS)- Inspection by measurement of workpieces and measuring equipment-Part 1 :decision rules for proving conformance or non-conformance with specifications[S].Geneva:International Organization for Standardization, 1998.
7ISO 11562 Geometrical Product Specifications (GPS)-surface texture: profile method metrological characteristics of phase correct filters[S].Geneva:International Organization for Standardization, 1996.
8GB/T3505-1983表面粗糙度术语表面及其参数[S].国家标准局,1983.
9ISO 4288 Geometrical Product Specification (GPS)-Surface texture-profile method:Rules and procedures for the assessment of surface texture [S].Geneva:Intemational Organization for Standardization, 2003.
10张伟,蒋宏,任章.自适应多阈值图像分割算法[J].自动化技术与应用,2007,26(8):71-73. 被引量：17

共引文献41

1霍春宝,杨闯,佟智波,杨红喆,王丹丹.OCR下的改进SIFT人脸识别算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(4):378-382. 被引量：5
2杨翔宇,孙慧.用数学形态学进行图像边缘检测的新方法[J].电脑知识与技术（过刊）,2007(2):501-502. 被引量：7
3张艳群,孟凡荣.MATLAB在图像边缘检测中的应用[J].计算机应用研究,2004,21(6):144-146. 被引量：23
4金连文,高学.几种手写体汉字网格方向特征提取法的比较研究[J].计算机应用研究,2004,21(11):38-40. 被引量：10
5任洪娥.基于数学模型的原木节子视频识别理论研究[J].计算机应用研究,2006,23(3):136-137. 被引量：2
6易亨瑜.不同转换方式对三角函数算子分割效果的影响[J].强激光与粒子束,2006,18(4):549-552.
7王建平,蔺菲.基于笔划宽度提取的手写体汉字归一化方法[J].计算机技术与发展,2006,16(10):29-31. 被引量：2
8曾水玲,徐蔚鸿.基于支持向量机的手写体数字识别[J].计算机与数字工程,2006,34(10):104-106. 被引量：9
9徐超,叶正麟.基于柔性形态学的梯度边缘检测算法[J].计算机工程与应用,2007,43(26):38-40. 被引量：3
10罗文超.MATLAB在图像边缘检测中的应用[J].中国高新技术企业,2007(14):110-111. 被引量：1

同被引文献152

1吴元丰,李刚.中国满文档案工作70年——以中国第一历史档案馆为中心[J].满语研究,2019(2):81-87. 被引量：3
2李雄飞,顾千岳.满文古籍编目概述(中)[J].满语研究,2018(2):79-83. 被引量：1
3施恒涛,刘宝杰,于贤君.基于多项式的曲率连续前缘造型方法及应用[J].航空动力学报,2020,35(2):397-409. 被引量：8
4白云莉,敖其尔.满文拼音输入法的设计与实现[J].内蒙古农业大学学报（自然科学版）,2008,29(2):154-157. 被引量：3
5陈敏,吴勰,马德江.贵州古彝文字符集编码设计[J].科技经济市场,2006(7). 被引量：1
6黄润华,屈六生.《全国满文图书资料联合目录》编辑手记[J].国家图书馆学刊,1981(2):26-29. 被引量：3
7王华,丁晓青.一种多字体印刷藏文字符的归一化方法[J].计算机应用研究,2004,21(6):41-43. 被引量：10
8王华,丁晓青.一种多字体印刷藏文字符识别方法[J].计算机工程,2004,30(13):18-20. 被引量：10
9李晶皎,赵骥.基于贝斯准则和待定词集模糊矩阵的满文识别后处理[J].东北大学学报（自然科学版）,2004,25(11):1061-1064. 被引量：1
10张木森.满文文献语言形式及其著录[J].国家图书馆学刊,2005,14(2):53-56. 被引量：2

引证文献5

1黄天灵.基于视觉传达的网页文字色彩自动匹配系统设计[J].现代电子技术,2020,43(22):102-105. 被引量：2
2蔡晓秋.基于曲率约束的服装工业样板分割线提取方法[J].兰州文理学院学报（自然科学版）,2021,35(4):54-58.
3刘柯言,党佳伟,郑蕊蕊,周瑜,贺建军.满文档案图像智能处理系统设计与实现[J].大连民族大学学报,2022,24(1):75-81. 被引量：3
4王维兰,胡金水,魏宏喜,库尔班·吾布力,邵文苑,毕晓君,贺建军,李振江,丁凯,金连文,高良才.少数民族文字文本分析与识别的研究进展[J].中国图象图形学报,2024,29(6):1685-1713.
5张文亮,于姗姗.满文古籍信息组织研究的系统综述[J].图书馆学研究,2024(10):2-13.

二级引证文献5

1谭钰琴.文字符号在视觉传达设计中的双重构建[J].今古文创,2020(47):45-46.
2肖华英.基于视觉传达的嵌瓷视频图像自动定位系统设计[J].自动化与仪器仪表,2021(9):138-142. 被引量：1
3赵瑞,黄思怡,韩朝桂,陈秋婷,邹明珠.新冠疫情下社区人员管理系统的设计与实现[J].现代信息科技,2022,6(24):14-17. 被引量：3
4黄凯怡,姜佳琪,钱阳,方建文,范伟.基于SpringBoot框架的企业智慧无源锁后端系统设计与开发[J].计算机应用文摘,2023,39(18):71-74. 被引量：1
5崔浩男.多模态档案知识服务平台的基本特征与价值取向——基于国内外20个案例的分析[J].档案学通讯,2024(1):70-78. 被引量：3

1刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.基于LSTM的蒙汉机器翻译的研究[J].计算机工程与科学,2018,40(10):1890-1896. 被引量：7
2玛伊莱.艾力,吾加合买提.司马义,玛依拉.依布拉音,艾斯卡尔.艾木都拉.局部轨迹信息的联机手写维吾尔文单词过切分[J].电视技术,2018,42(6):32-35.
3闫河,王鹏,董莺艳,罗成,李焕.基于深度CNN和极限学习机相结合的实时文档分类[J].计算机应用与软件,2019,36(3):174-179. 被引量：5
4王作兵,张光银,陈云涛,刘广辉,孙艳,龙全兵,何卓.浅谈汽车车门闭合力控制模式[J].汽车实用技术,2019,45(3):154-155. 被引量：3

中文信息学报

2019年第2期

浏览历史

内容加载中请稍等...

基于缝隙裁剪的满文单词分割和提取方法研究被引量：5

参考文献7

二级参考文献51

共引文献41

同被引文献152

引证文献5

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于缝隙裁剪的满文单词分割和提取方法研究 被引量：5

参考文献7

二级参考文献51

共引文献41

同被引文献152

引证文献5

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于缝隙裁剪的满文单词分割和提取方法研究被引量：5