-
题名基于分割的任意形状场景文本检测
被引量:2
- 1
-
-
作者
蔡鑫鑫
王敏
-
机构
河海大学计算机与信息学院
-
出处
《计算机系统应用》
2020年第12期257-262,共6页
-
文摘
随着深度学习技术的发展,自然场景文本检测的性能获得了显著的提升.但目前仍然存在两个主要的挑战:一是速度和准确度之间的权衡,二是对任意形状的文本实例的检测.本文采用基于分割的方法高效准确的检测任意形状场景文本.具体来说,使用具有低计算成本的分割头和简洁高效的后处理,分割头由特征金字塔增强模块和特征融合模块组成,前者可以引入多层次的信息来指导更好的分割,后者可以将前者给出的不同深度的特征集合成最终的特征进行分割.本文采用可微二值化模块,自适应地设置二值化阈值,将分割方法产生的概率图转换为文本区域,从而提高文本检测的性能.在标准数据集ICDAR2015和Total-Text上,本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.
-
关键词
自然场景文本检测
分割
特征金字塔增强模块
特征融合模块
可微二值化模块
-
Keywords
natural scene text detection
segmentation
feature pyramid enhancement module
feature fusion module
differentiable binarization module
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-