-
题名双向特征融合的快速精确任意形状文本检测
被引量:5
- 1
-
-
作者
边亮
屈亚东
周宇
-
机构
北京航空航天大学电子信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2021年第4期931-938,共8页
-
文摘
现有的基于分割的场景文本检测方法仍较难区分相邻文本区域,同时网络得到分割图后后处理阶段步骤复杂导致模型检测效率较低。为了解决此问题,该文提出一种新颖的基于全卷积网络的场景文本检测模型。首先,该文构造特征提取器对输入图像提取多尺度特征图。其次,使用双向特征融合模块融合两个平行分支特征的语义信息并促进两个分支共同优化。之后,该文通过并行地预测缩小的文本区域图和完整的文本区域图来有效地区分相邻文本。其中前者可以保证不同的文本实例之间具有区分性,而后者能有效地指导网络优化。最后,为了提升文本检测的速度,该文提出一个快速且有效的后处理算法来生成文本边界框。实验结果表明:在相关数据集上,该文所提出的方法均实现了最好的效果,且比目前最好的方法在F-measure指标上最多提升了1.0%,并且可以实现将近实时的速度,充分证明了该方法的有效性和高效性。
-
关键词
场景文本检测
双向特征融合
多尺度特征
后处理复杂度
任意形状文本
-
Keywords
Scene text detection
Bi-directional feature fusion
Multi-scale feature
Post-processing complexity
Arbitrary-shaped texts
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名文本中心像素重建实现任意形状的文本检测
- 2
-
-
作者
雷小唐
胡靖
-
机构
成都信息工程大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第8期148-156,共9页
-
基金
国家自然科学基金(61602065)
四川省科技厅重点研发项目(2021YFG0038)。
-
文摘
针对自然场景文本检测算法未能高效、准确地实现端到端的任意形状文本检测,提出了轻量型像素聚类文本核重建的文本检测算法,针对轻量型网络特征信息弱和感受野小的问题,设计了图像级上下文信息模块(imagelevel context module)来捕获全局图像信息和语义级上下文信息模块(semantic-level context module)学习目标区域信息,两者信息融合增强网络特征信息保证检测的准确性,为了有效区分相邻文本和定位弯曲文本,基于文本核启发将文字实例中心视为聚类中心,从核中心经过一次像素聚类重建完整的文字实例实现对任意形状文本的检测。方法在弯曲文本数据集Total-Text和CTW1500综合评分达到了84.1%和84.6%超过了最好的CARFT方法,检测速度42帧/s超过最优EAST的,有效地解决了检测形状文本的高效和准确性,在应用层面更加友好。
-
关键词
图像级上下文
语义级上下文
像素聚类
任意形状文本
文本核
-
Keywords
image-level context
semantic-level context
pixel aggregation
arbitrary shape text
kenerl method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名注意力机制与自适应尺度融合的场景文本检测
- 3
-
-
作者
梁雨欣
毕晓君
-
机构
哈尔滨工程大学信息与通信工程学院
中央民族大学信息工程学院
-
出处
《应用科技》
CAS
2023年第1期45-50,111,共7页
-
文摘
在场景文本检测任务中,由于图像背景复杂、文本实例尺度不一等问题,导致现有模型的文本检测精度不高。为此,本文设计了一种基于注意力机制与自适应尺度融合的场景文本检测模型。首先,通过引入高效通道注意力机制,提高了特征提取网络的表征能力,降低了文字的漏检率和误报率;其次,通过设计自适应尺度融合模块,动态融合不同尺度特征,增强了模型对不同尺度文本实例的检测和定位能力。实验结果表明,本文提出的模型在Total-Text和MSRATD500共2个数据集上的F综合指标分别达到85.1%和84.1%,在同类型算法中处于领先水平。
-
关键词
场景文本检测
任意形状文本
注意力机制
自适应尺度融合
概率图
向心偏移图
深度学习
自然场景
-
Keywords
scene text detection
arbitrary-shaped text
attention mechanism
adaptive scale fusion
probability map
centripetal shift map
deep learning
natural scene
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-