-
题名不规则场景文本的识别方法
被引量:3
- 1
-
-
作者
齐秀芳
吴陈
-
机构
江苏科技大学计算机学院
-
出处
《软件导刊》
2022年第6期200-204,共5页
-
基金
国家自然科学基金项目(61572242)。
-
文摘
场景文本识别是近年来极具挑战性的任务,针对自然场景中密集文本形态多变和弯曲导致识别困难的特点,提出面向场景图像文本的矫正与识别方法。首先利用矫正网络矫正场景文本,然后将校正后的文本输入到双分支网络模块提取图像特征进行融合,双分支模块分别利用InceptionV2和可变卷积代替普通卷积,获取不同的感受域范围,并增加调整卷积核的方向向量,促使卷积核形态更贴近文本形状,最后通过嵌入注意力的双向门控循环单元获取不同权重的文本语义信息。实验结果表明,该模型在ICDAR2013、ICDAR2015和CUTE80数据集上取得了令人信服的结果,尤其在弯曲变形文本CUTE数据集上表现最好,准确率高达89.54%,相比传统方法提高了近1.9%,说明该模型可有效识别扭曲变形的文本信息。
-
关键词
图像处理
矫正网路
文本识别
自然场景
-
Keywords
image processing
correction network
text recognition
natural scene
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-