-
题名基于提示生成网络的Frozen ViT
- 1
-
-
作者
黄驰涵
-
机构
南京理工大学设计艺术与传媒学院
-
出处
《计算机与网络》
2024年第5期456-460,共5页
-
文摘
随着计算机视觉中Transformer模型的引入,增加模型的数据量是实现更好性能和鲁棒性的绝佳方法。然而,当模型的参数达到亿级时,传统微调方法变得越来越有局限性,甚至有时不适用。因此,通过学习额外输入来调整模型的视觉提示模型成为处理冻结云模型的方法,既不需要前馈处理,也不需要后处理。提出了提示生成网络(Prompt Generative Network,PGN),通过端到端学习生成高性能的输入相关的提示。PGN能在预训练时适应各种训练集,在获取的数据集中优于以往方法,且模型参数减少了100倍。
-
关键词
提示生成网络
TRANSFORMER
计算机视觉
适应输入
-
Keywords
PGN
Transformer
computer vision
input-based
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-