期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据增强视觉Transformer的细粒度图像分类
被引量:
1
1
作者
胡晓斌
彭太乐
《西华大学学报(自然科学版)》
CAS
2022年第6期9-16,共8页
近来,视觉Transformer(vision transformer,ViT)在图像识别领域取得突破性进展,其自我注意力机制(self-attention mechanism,MSA)能够提取不同像素块的判别性标记信息进而提升图像分类精度,但其深层中的分类标记容易忽略层级之间的局部...
近来,视觉Transformer(vision transformer,ViT)在图像识别领域取得突破性进展,其自我注意力机制(self-attention mechanism,MSA)能够提取不同像素块的判别性标记信息进而提升图像分类精度,但其深层中的分类标记容易忽略层级之间的局部特征,此外,嵌入层将固定大小的像素块输入网络,不可避免地引入额外的图像噪声。为此,本文研究了一种基于数据增强的视觉Transformer(data augmentation vision transformer,DAVT),并提出注意力裁剪的数据增强方法,以注意力权重为指导裁剪图像,提高网络学习关键特征的能力。其次,本文还提出层级注意力选择方法(hierarchical attention selection,HAS),它通过对层级之间标记进行筛选并融合,提升网络学习层级之间判别性标记的能力。实验结果表明,该方法在CUB-200-2011和Stanford Dogs两个通用数据集上的准确率优于现有的主流方法,其准确率比原始ViT分别提高1.4%和1.6%。
展开更多
关键词
细粒度图像分类
层级注意力选择
数据增强机制
图像识别
下载PDF
职称材料
题名
基于数据增强视觉Transformer的细粒度图像分类
被引量:
1
1
作者
胡晓斌
彭太乐
机构
淮北师范大学计算机科学与技术学院
出处
《西华大学学报(自然科学版)》
CAS
2022年第6期9-16,共8页
基金
国家自然科学基金项目(61976101)
安徽省高校自然科学研究项目(KJ2017A843)。
文摘
近来,视觉Transformer(vision transformer,ViT)在图像识别领域取得突破性进展,其自我注意力机制(self-attention mechanism,MSA)能够提取不同像素块的判别性标记信息进而提升图像分类精度,但其深层中的分类标记容易忽略层级之间的局部特征,此外,嵌入层将固定大小的像素块输入网络,不可避免地引入额外的图像噪声。为此,本文研究了一种基于数据增强的视觉Transformer(data augmentation vision transformer,DAVT),并提出注意力裁剪的数据增强方法,以注意力权重为指导裁剪图像,提高网络学习关键特征的能力。其次,本文还提出层级注意力选择方法(hierarchical attention selection,HAS),它通过对层级之间标记进行筛选并融合,提升网络学习层级之间判别性标记的能力。实验结果表明,该方法在CUB-200-2011和Stanford Dogs两个通用数据集上的准确率优于现有的主流方法,其准确率比原始ViT分别提高1.4%和1.6%。
关键词
细粒度图像分类
层级注意力选择
数据增强机制
图像识别
Keywords
fine-grained visual classification
hierarchical attention selection
data augmentation
image recognition
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于数据增强视觉Transformer的细粒度图像分类
胡晓斌
彭太乐
《西华大学学报(自然科学版)》
CAS
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部