-
题名基于关键轮廓点的汉字矢量化及字库生成研究
- 1
-
-
作者
李旭东
崔荣慧
赵彩云
-
机构
南开大学软件学院
先进计算与关键软件(信创)海河实验室
天津市操作系统企业重点实验室
-
出处
《软件》
2024年第9期52-59,69,共9页
-
文摘
古迹文字字符数字化保护过程中一直存在无规范流程、准确率低、耗时耗力等问题。针对这种情况,提出古迹文字矢量化流程,其中包括多阶段图像处理与矢量化文字提取两个关键技术。多阶段图像处理技术采用非局部均值去噪算法去除电子噪声和光照不均引入的噪声,运用直方图均衡化技术增强图像对比度,采用基于偏微分方程的Inpainting技术实现区域修复,完成受损字符图像修复。矢量化文字提取技术基于汉字笔画的特性提取更多类型的关键轮廓点,去除了冗余的轮廓点和噪声轮廓点。实验表明,本文提出的矢量化文字提取技术相较于现有方法,内存减少8.0419%,与原图相比误差小于0.15,最终提取到的字符存储到了Unicode字库中,可在文本编辑器中使用。
-
关键词
古迹文字
去噪与修残
文字矢量化
Unicode字库
集外字处理
-
Keywords
monument text
denoising and repairing
text vectorization
unicode font library
extra-set character processing
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-