期刊文献+

基于自适应游程平滑算法的藏文文档图像版面分割与描述 被引量:1

Layout Segmentation and Description of Tibetan Document Images Based on Adaptive Run Length Smoothing Algorithm
原文传递
导出
摘要 版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平滑,寻找连通区域,实现版面分割;根据各版面元素的外轮廓特征,简单区分文本区域与非文本区域;利用藏文文本识别器识别文本区域,再用可扩展标记语言记录版面信息,实现版面描述。在藏文中小学教材文档和铅印版藏文文档图像上的实验表明,该方法能够取得较好的版面分析结果。 Layout segmentation is an important basic step in the process of document image analysis and recognition.In order to explore a suitable method for layout segmentation and description of Tibetan document images,a research method based on the adaptive run length smoothing algorithm is proposed.Firstly,according to the layout structure of Tibetan document images,K-means clustering analysis is used to get the run length threshold suitable for the layout,smooth the run length,find the connected component,and realize the layout segmentation.Then,according to the external contour characteristics of each layout element,the text area and nontext area are simply distinguished.Finally,the text area is recognized by a Tibetan text recognizer,and then the extensible markup language is used to record layout information and realize layout description.Experiments on Tibetan primary and secondary school teaching materials and stereotyped Tibetan document images show that this method can achieve good layout analysis results.
作者 陈园园 王维兰 刘华明 蔡正琦 赵鹏海 Chen Yuanyuan;Wang Weilan;Liu Huaming;Cai Zhengqi;Zhao Penghai(College of Mathematics and Computer Science,Northwest Minzu University,Lanzhou,Gansu 730030,China;Key Laboratory of China’s Ethnic Languages and Information Technology of Ministry of Education,Northwest Minzu University,Lanzhou,Gansu 730030,China;College of Computer and Information Engineering,Fuyang Normal University,Fuyang,Anhui 236041,China)
出处 《激光与光电子学进展》 CSCD 北大核心 2021年第14期164-171,共8页 Laser & Optoelectronics Progress
基金 国家自然科学基金(61772430) 国家民委创新团队计划(〔2018〕98号) 甘肃省双一流学科建设项目-西北民族大学(11080304) 甘肃省高等学校创新基金项目(2020B-069)。
关键词 图像处理 藏文文档图像 版面分割 版面描述 自适应游程平滑 image processing Tibetan document image layout segmentation layout description adaptive run length smoothing
  • 相关文献

参考文献4

二级参考文献6

共引文献18

同被引文献3

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部