摘要
当前碑文及其拓本等非印刷字体文字的数字化录入仍需手动进行。据此,首先使用YOLOv5模型对整体图像中的文字进行精确检测和定位;随后基于UNet++模型实现单一文字图片中前景的提取,并使用Rewrite2模型对可能残缺的文字图片进行修复;最后基于PaddlePaddle OCR模型完成图片中文字的识别,获得可编辑状态汉字。在数据集中的实验结果表明,系统能很好地完成文字的检测定位、前景提取、残缺修复、识别等过程,全流程整体的准确率达到90.6%。
作者
李超
李思樵
张靖熙
杨柳
邹豪
张攀
LI Chao;LI Siqiao;ZHANG Jingxi;YANG Liu;ZOU Hao;ZHANG Pan
出处
《信息技术与信息化》
2024年第10期193-196,共4页
Information Technology and Informatization
基金
2023年度内江市基础研究与应用基础研究项目“隆昌石牌坊碑文数字化提取与残缺修复研究”。