经济全球化赋予了logo巨大的商业价值,随着计算机视觉领域的发展,为logo分类与识别提供了更广阔的应用领域.本文针对logo图像的分类识别,为了提高模型对logo图像分类的能力,基于logo图像整体特征不显著且数量众多的特点,提出了用细粒度...经济全球化赋予了logo巨大的商业价值,随着计算机视觉领域的发展,为logo分类与识别提供了更广阔的应用领域.本文针对logo图像的分类识别,为了提高模型对logo图像分类的能力,基于logo图像整体特征不显著且数量众多的特点,提出了用细粒度图像分类的方法渐进式多粒度拼图训练(progressive multi-granularity training of jigsaw patches, PMG-Net)对logo图像数据集进行分类.通过拼图生成器生成包含不同粒度信息的输入图像,再引入渐进式多粒度训练模块融合不同粒度的特征,融合后的特征更注重图像之间的细微差别,使logo图像分类的效果有显著提高.在提取输入图像特征时采用LeakyReLU (leaky rectified linear unit)激活函数保留图像中的负值特征信息,并引入通道注意力机制,调整特征通道的权重,增强特征信息指导能力以改进模型的分类效果.实验结果表明,本文在logo图像数据集上的分类精确率优于传统的分类方法.本文通过融合多粒度特征的渐进训练策略以及随机拼图生成器的方法实现了对logo图像的高效分类,为解决logo图像分类中存在的问题提供了一种新的思路.展开更多
文摘经济全球化赋予了logo巨大的商业价值,随着计算机视觉领域的发展,为logo分类与识别提供了更广阔的应用领域.本文针对logo图像的分类识别,为了提高模型对logo图像分类的能力,基于logo图像整体特征不显著且数量众多的特点,提出了用细粒度图像分类的方法渐进式多粒度拼图训练(progressive multi-granularity training of jigsaw patches, PMG-Net)对logo图像数据集进行分类.通过拼图生成器生成包含不同粒度信息的输入图像,再引入渐进式多粒度训练模块融合不同粒度的特征,融合后的特征更注重图像之间的细微差别,使logo图像分类的效果有显著提高.在提取输入图像特征时采用LeakyReLU (leaky rectified linear unit)激活函数保留图像中的负值特征信息,并引入通道注意力机制,调整特征通道的权重,增强特征信息指导能力以改进模型的分类效果.实验结果表明,本文在logo图像数据集上的分类精确率优于传统的分类方法.本文通过融合多粒度特征的渐进训练策略以及随机拼图生成器的方法实现了对logo图像的高效分类,为解决logo图像分类中存在的问题提供了一种新的思路.