期刊文献+

基于深度学习的藏文现代印刷物版面检测技术研究

Research on Layout Inspection Technology of Modern Tibetan Prints Based on Deep Learning
下载PDF
导出
摘要 针对藏文现代图书版面中的文本行分布不均匀、现代藏文字体差异较大的问题,提出了一种基于Faster R-CNN的版面文本行检测算法.通过在整理标注的数据集上训练,用ResNet-50网络提取出藏文现代图书版面特征信息.为了有效提高模型的泛化能力,在COCO数据集下的网络模型中进行迁移学习.实验结果表明,该方法可对藏文现代印刷物的版面实现文本行的定位,检测准确率为83%,召回率为95%,明显提高了版面检测的精确度. Aimed at the uneven distribution of text lines in the layout of modern Tibetan books and the large differences in modern Tibetan fonts,a layout text line detection algorithm based on Faster R-CNN is proposed.By training on collated and labeled data set,we use the ResNet-50 network to extract the feature information of the Tibetan modern book layout.In order to effectively improve the generalization ability of the model,transfer learning is performed in the network model under the COCO dataset.The experimental results show that this method can realize text line positioning on the layout of modern Tibetan printed materials,with a detection accuracy rate of 83%and the recall rate of 95%,which significantly improves the accuracy of layout detection.
作者 吴燕如 珠杰 管美静 Wu Yanru;Zhu Jie;Guan Meijing(School of Information Science and Technology,Tibet University,Lhasa 850000,China;National and Local Joint Center for Tibetan Information Technology,Lhasa 850000,China)
出处 《南京师范大学学报(工程技术版)》 CAS 2021年第1期44-48,共5页 Journal of Nanjing Normal University(Engineering and Technology Edition)
基金 西藏大学研究生“高水平人才培养计划”项目(2017-GSP-131) 西藏自治区高等教育教学改革研究重点项目 多学科融合的新工科创新创业教育体系研究项目 藏语文传承与发展之藏汉双向机器翻译平台建设项目 计算机及藏文信息技术国家团队及重点实验室建设项目(藏大财指[2018]81号) 国家重点研发计划重点专项(2017YFB140220).
关键词 深度学习 藏文现代印刷物 FASTER R-CNN 版面检测 deep learning modern Tibetan prints Faster R-CNN layout detection
  • 相关文献

参考文献9

二级参考文献54

共引文献86

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部