摘要
自然场景中的文字常表现为多种样式(水平、倾斜、弯曲)。针对常规矩形检测框不能准确表示弯曲文字的问题,提出一种运用埃尔米特曲线表示任意形状文字的方法,改进后的模型只需预测文字区域4个角点的坐标以及对应位置处的斜率,即可根据埃尔米特曲线进行插值,准确表示图像中文字的位置信息。此外,在分类任务中增加文字实例质心预测分支,联合分类结果和质心预测结果,增大靠近文字实例中心处的分类预测值,减小远离中心处的分类预测值,提升模型准确率。实验部分,在标准数据集CTW1500进行的对比测试结果表明,埃尔米特曲线能够较好地表示任意形状文字区域。
出处
《科技与创新》
2022年第7期136-138,共3页
Science and Technology & Innovation