脱机手写中文字符识别(handwritten Chinese character recognition,HCCR)在计算机视觉领域一直是一个巨大的挑战。相比传统方法,基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果,但识别效果依旧处于发展过程中。基...脱机手写中文字符识别(handwritten Chinese character recognition,HCCR)在计算机视觉领域一直是一个巨大的挑战。相比传统方法,基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果,但识别效果依旧处于发展过程中。基于此,结合DW卷积和残差连接设计了一种多分支残差模块,该模块通过DW卷积以较小的内存和参数量为代价来加深网络深度,增强网络的特征提取能力;再通过残差连接抑制网络梯度问题和退化问题;另外,提出了一种多分支权重算法,来改善多分支残差模块中各分支的权重分配问题;并将六个以多分支残差模块为主的结构线性连接,组成HCCR识别网络。该模型在CASIA-HWDB1.0、CASIA-HWDB1.1、ICDAR2013数据集上的识别准确率分别达到了97.77%、97.30%、97.64%,表现出高精度的识别效果。展开更多
基金广州市科技计划(批准号:201707010426和20180401350)广东省自然科学基金(批准号:2017A030313010)+3 种基金the Ministry of Economy and Competitiveness(批准号:MTM 2016-77278-P)Agencia de Gestio d’Ajuts Universitaris i de Recerca(批准号:2017SGR1617)the European project(批准号:Dynamics-H2020-MSCA-RISE-2017-777911)Barcelona Graduate School of Mathematics(批准号:MDM-2014-0445)资助项目
文摘脱机手写中文字符识别(handwritten Chinese character recognition,HCCR)在计算机视觉领域一直是一个巨大的挑战。相比传统方法,基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果,但识别效果依旧处于发展过程中。基于此,结合DW卷积和残差连接设计了一种多分支残差模块,该模块通过DW卷积以较小的内存和参数量为代价来加深网络深度,增强网络的特征提取能力;再通过残差连接抑制网络梯度问题和退化问题;另外,提出了一种多分支权重算法,来改善多分支残差模块中各分支的权重分配问题;并将六个以多分支残差模块为主的结构线性连接,组成HCCR识别网络。该模型在CASIA-HWDB1.0、CASIA-HWDB1.1、ICDAR2013数据集上的识别准确率分别达到了97.77%、97.30%、97.64%,表现出高精度的识别效果。
文摘车辆目标检测是自动驾驶的重要环节,现有的车辆目标检测算法在特征提取方面没有充分考虑卷积神经网络(convolutional neural network,CNN)和Transformer各自的优缺点,一定程度上限制了网络的整体性能。提出了一种由CNN和Transformer组成的双分支特征聚合网络。在编码阶段,基于CNN和Transformer各自的优势,构建了双分支主干网络来提取原始图像的特征信息;通过设计的多级别空间注意力模块和双支路特征聚合模块,使两个分支间的特征信息相互引导学习;通过构建的双分支注意力模块来进一步减少深层神经网络中特征信息的丢失。在实验部分通过消融实验和对比实验进一步验证了所提算法的有效性,其相比主流的目标检测算法,在mAP(mean average precision)指标上提升了约3.5%。