-
题名联合边界框校准的自然场景文本检测
被引量:1
- 1
-
-
作者
方承志
火兴龙
程宥铖
-
机构
南京邮电大学电子与光学工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第1期161-167,共7页
-
基金
国家自然科学基金面上项目(61271334,61073115)。
-
文摘
针对自然场景下多方向文本对象,提出一种基于深度学习的文本检测方法。该方法在设计锚框时剥离锚框的方向特征但保留其长宽比特征,在覆盖相同长宽比范围时,锚框设计数量减少,从而缓解采样密集时正负样本类别失衡的影响。在方法的后处理阶段,提出一种边界框校准算法,该算法利用最大稳定极值区域(MSER)获取字符边缘信息,通过基于规则的逻辑判断,对边界框进行收缩或膨胀操作,从而达到边界框校准目的。通过在公开数据集ICDAR2015上的测试与比较,验证了所提边界框校准算法的有效性。
-
关键词
文本检测
自然场景
类别失衡
边界框校准
-
Keywords
text detection
natural scene
category imbalance
bounding box calibration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-