-
题名视觉感知式场景文字检测定位方法
被引量:2
- 1
-
-
作者
吕国宁
高敏
-
机构
郑州师范学院网络管理中心
郑州师范学院信息科学与技术学院
-
出处
《智能系统学报》
CSCD
北大核心
2017年第4期563-569,共7页
-
基金
国家自然基金河南人才培养联合基金项目(U1204703
U1304614)
-
文摘
针对自然场景中复杂背景干扰检测的问题,本文提出一种基于视觉感知机制的场景文字检测定位方法。人类视觉感知机制通常分为快速并行预注意步骤与慢速串行注意步骤。本文方法基于人类感知机制提出一种场景文字检测定位方法,该方法首先通过两种视觉显著性方法进行预注意步骤,然后利用笔画特征以及文字相互关系实现注意步骤。本文方法在ICDAR 2013与场景汉字数据集中均取得较有竞争力的结果,实验表明可以较好地用于复杂背景的自然场景英文和汉字的检测。
-
关键词
视觉感知
视觉显著性
笔画宽度变换
场景文字
文字检测定位
视觉注意
汉字
英文
-
Keywords
visual perception
visual saliency
swt
scene text
text detection and localization
visual attention
Chinese text
English text
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习算法的碑文提取与修复系统
- 2
-
-
作者
李超
李思樵
张靖熙
杨柳
邹豪
张攀
-
机构
内江师范学院人工智能学院
-
出处
《信息技术与信息化》
2024年第10期193-196,共4页
-
基金
2023年度内江市基础研究与应用基础研究项目“隆昌石牌坊碑文数字化提取与残缺修复研究”。
-
文摘
当前碑文及其拓本等非印刷字体文字的数字化录入仍需手动进行。据此,首先使用YOLOv5模型对整体图像中的文字进行精确检测和定位;随后基于UNet++模型实现单一文字图片中前景的提取,并使用Rewrite2模型对可能残缺的文字图片进行修复;最后基于PaddlePaddle OCR模型完成图片中文字的识别,获得可编辑状态汉字。在数据集中的实验结果表明,系统能很好地完成文字的检测定位、前景提取、残缺修复、识别等过程,全流程整体的准确率达到90.6%。
-
关键词
碑文数字化录入
文字检测定位
文字前景提取
残缺文字修复
文字识别
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-