-
题名基于端到端的多任务商标分卡模型
- 1
-
-
作者
张贞䶮
苏海
余松森
-
机构
华南师范大学软件学院
-
出处
《计算机系统应用》
2023年第8期105-115,共11页
-
基金
广东省基础与应用基础研究基金区域联合基金青年基金(2021A1515110673)。
-
文摘
目前商标分卡处理方法是先进行文本检测再进行区域分类,最后对不同的区域进行拆分组合形成商标分卡.这种分步式的处理耗时长,并且因为误差的叠加会导致最终结果准确率下降.针对这一问题,本文提出了多任务的网络模型TextCls,通过设计多任务学习模型来提升商标分卡的检测和分类模块的推理速度和精确率.该模型包含一个特征提取网络,以及文本检测和区域分类两个任务分支.其中,文本检测分支采用分割网络学习像素分类图,然后使用像素聚合获得文本框,像素分类图主要是学习文本像素和背景像素的信息;区域分类分支对区域特征细分为中文、英文和图形,着重学习不同类型区域的特征.两个分支通过共享特征提取网络,像素信息和区域特征相互促进学习,最终两个任务的精确率得以提升.为了弥补商标图像的文本检测数据集的缺失以及验证TextCls的有效性,本文还收集并标注了一个由2000张商标图像构成的文本检测数据集trademark_text(https://github.com/kongbailongtian/trademark_text),结果表明:与最佳的文本检测算法相比,本文的文本检测分支将精确率由94.44%提升至95.16%,调和平均值F1 score达92.12%;区域分类分支的F1 score也由97.09%提升至98.18%.
-
关键词
商标分卡
端到端
文本检测
多任务学习
数据集
-
Keywords
trademark sub-card
end-to-end
text detection
multi-task learning
datasets
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-