摘要
为提高当前场景文本识别算法在自然场景下识别不规则文本和中文文本的准确率,提出了一种基于二维(2D)CTC和注意力机制序列的自然场景文本识别模型。该模型分为编码部分和解码部分,利用二维CTC自适应地关注文本的空间位置信息,同时排除背景噪声的影响。通过在ICDAR数据集上的实验结果表明,对比CTC和Seq2Seq的模型,提高了对不规则文本和中文文本识别的准确率,同时加快了收敛速度。
出处
《电子制作》
2022年第17期65-70,共6页
Practical Electronics
基金
国家自然科学基金(61702229)
南京工业大学浦江学院科研项目基金(njpj2020-1-04)。