-
题名基于多分支特征融合的自然场景文本检测算法
- 1
-
-
作者
张庭瑞
方承志
徐国钦
陈睿霖
-
机构
南京邮电大学电子与光学工程学院、柔性电子(未来技术)学院
-
出处
《计算机技术与发展》
2024年第2期142-147,共6页
-
基金
国家自然科学基金(61977039)。
-
文摘
EAST算法是一种高效而准确的场景文本检测算法,但是由于受到感受野的限制,导致在检测小文本时容易出现误检、漏检现象,在检测较长文本时缺乏一定的完整性。针对以上问题,提出一种基于多分支特征融合的自然场景文本检测算法。该算法以EAST算法为基础,引入并改进了浅层特征增强模块(RFB-s),在避免小文本信息损失的前提下,增大浅层网络的感受野改善浅层特征语义信息不足的问题,增强对小文本定位的准确性。引入并改进了循环十字交叉注意力模块(RCCAM),使得特征图中的每个像素能够以非常有效的方式捕获全图像的上下文信息,提高对长文本的检测能力。同时针对回归任务,采用Dice Loss作为损失函数,解决正负样本占比不均衡问题。采用EIoU来提高回归的效果,得到更为精准的文本框。该算法在ICDAR2015和MSRA-TD500数据集上进行测试,均获得了不错的检测效果。表明了该算法能够有效地对自然场景文本进行检测,提高了检测的准确率。
-
关键词
文本检测
EAST算法
浅层特征增强
循环十字交叉注意力
损失函数
-
Keywords
text detection
EAST
shallow feature enhancement
recurrent criss-cross attention
loss function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-