期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
ConvFormer:基于Transformer的视觉主干网络 被引量:2
1
作者 胡杰 昌敏杰 +1 位作者 徐博远 徐文才 《电子学报》 EI CAS CSCD 北大核心 2024年第1期46-57,共12页
针对主流Transformer网络仅对输入像素块做自注意力计算而忽略了不同像素块间的信息交互,以及输入尺度单一导致局部特征细节模糊的问题,本文提出一种基于Transformer并用于处理视觉任务的主干网络ConvFormer. ConvFormer通过所设计的多... 针对主流Transformer网络仅对输入像素块做自注意力计算而忽略了不同像素块间的信息交互,以及输入尺度单一导致局部特征细节模糊的问题,本文提出一种基于Transformer并用于处理视觉任务的主干网络ConvFormer. ConvFormer通过所设计的多尺度混洗自注意力模块(Channel-Shuffle and Multi-Scale attention,CSMS)和动态相对位置编码模块(Dynamic Relative Position Coding,DRPC)来聚合多尺度像素块间的语义信息,并在前馈网络中引入深度卷积提高网络的局部建模能力.在公开数据集ImageNet-1K,COCO 2017和ADE20K上分别进行图像分类、目标检测和语义分割实验,ConvFormer-Tiny与不同视觉任务中同量级最优网络RetNetY-4G,Swin-Tiny和ResNet50对比,精度分别提高0.3%,1.4%和0.5%. 展开更多
关键词 机器视觉 自注意力 主干网络 TRANSFORMER
下载PDF
基于多尺度掩码分类域自适应网络的跨域目标检测算法 被引量:2
2
作者 胡杰 徐博远 +3 位作者 熊宗权 昌敏杰 郭迪 谢礼浩 《汽车工程》 EI CSCD 北大核心 2022年第9期1327-1338,共12页
针对无监督域自适应目标检测中,域的可辨性和不变性之间的矛盾导致域负迁移和多尺度问题,本文中提出了一种可缓解域负迁移的多尺度掩码分类域自适应网络。首先在主干网络上对多个中间层进行图像级域对抗训练。接着在图像级特征图上加入... 针对无监督域自适应目标检测中,域的可辨性和不变性之间的矛盾导致域负迁移和多尺度问题,本文中提出了一种可缓解域负迁移的多尺度掩码分类域自适应网络。首先在主干网络上对多个中间层进行图像级域对抗训练。接着在图像级特征图上加入区域提议掩码,作为一种补充信息对实例特征进行补充。最后提出分类别实例级域分类器,在保证域可辨性前提下,使网络尽可能地提取出有效的域不变信息。在Cityscapes和FoggyCityscapes两个数据集上进行验证的结果表明,本文提出的多尺度掩码分类域自适应网络,其域分类平均精度的平均值提高了13.2个百分点,说明网络域自适应能力显著提升。 展开更多
关键词 目标检测 域自适应网络 深度学习 对抗学习
下载PDF
基于Transformer的图像分类网络MultiFormer 被引量:1
3
作者 胡杰 昌敏杰 +3 位作者 熊宗权 徐博远 谢礼浩 郭迪 《计算机应用研究》 CSCD 北大核心 2022年第10期3191-3195,共5页
为解决目前ViT模型无法改变输入补丁大小且输入补丁都是单一尺度信息的缺点,提出了一种基于Transformer的图像分类网络MultiFormer。MultiFormer通过AWS(attention with scale)模块,将每阶段不同尺度输入小补丁嵌入为具有丰富语义信息... 为解决目前ViT模型无法改变输入补丁大小且输入补丁都是单一尺度信息的缺点,提出了一种基于Transformer的图像分类网络MultiFormer。MultiFormer通过AWS(attention with scale)模块,将每阶段不同尺度输入小补丁嵌入为具有丰富语义信息的大补丁;通过GLA-P(global-local attention with patch)模块交替捕获局部和全局注意力,在嵌入的同时保留了细粒度和粗粒度特征。设计了MultiFormer-tiny、-small和-base三种不同变体的MultiFormer模型网络,在ImageNet图像分类实验中top-1精度分别达到81.1%、82.2%和83.2%,后两个模型对比同体量的卷积神经网络ResNet-50和ResNet-101提升了3.1%和3.4%;对比同样基于Transformer分类模型ViT,MultiFormer-base在参数和计算量远小于ViT-Base/16模型且无须大量数据预训练前提下提升2.1%。 展开更多
关键词 机器视觉 深度学习 图像分类 自注意力 TRANSFORMER
下载PDF
基于自适应门控的双路激光雷达三维车道线检测 被引量:3
4
作者 胡杰 陈楠 +4 位作者 徐文才 昌敏杰 徐博远 王占彬 郭启翔 《中国激光》 EI CAS CSCD 北大核心 2023年第22期132-146,共15页
局部和全局特征提取在车道线检测任务中扮演着重要的角色。针对现有的基于激光雷达的车道线检测算法局部特征提取层次单一和全局特征利用不充分的问题,提出一种基于自适应门控的双路激光雷达三维车道线检测算法。首先,通过全局特征金字... 局部和全局特征提取在车道线检测任务中扮演着重要的角色。针对现有的基于激光雷达的车道线检测算法局部特征提取层次单一和全局特征利用不充分的问题,提出一种基于自适应门控的双路激光雷达三维车道线检测算法。首先,通过全局特征金字塔结构,使网络提取具有全局相关性的多层次车道线特征;其次,引入双路结构,其中辅助通路将底层高分辨率纹理特征压缩到高级抽象语义特征从而降低计算复杂度,压缩的语义特征用作另一个构建的主通路的先验信息,帮助学习更加精细的底层纹理细节,并借助高效移动卷积模块,在缓解注意力窗口效应的同时产生更好的下采样特征;最后,设计一种自适应多阶门控模块来更好地利用上下文信息,使网络自适应捕捉车道线更具代表性的全局纹理及语义特征。在K-Lane数据集上的实验表明,所提算法F1分数较主流模型提升2.6个百分点,在不良光照、严重遮挡条件下分别提升2.7个百分点和3.5个百分点。将算法部署在实车平台实现在线检测,验证了算法的工程实用价值。 展开更多
关键词 激光雷达 自动驾驶 深度学习 三维车道线检测 自适应门控
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部