-
题名预训练模型的跨领域跨任务迁移学习
被引量:1
- 1
-
-
作者
丁文博
许玥
-
机构
上海汽车集团人工智能实验室
美国加州洛杉矶约巴林达高中
-
出处
《科技资讯》
2020年第2期107-110,共4页
-
文摘
为了解决计算机深度学习时标注数据工作量大、准确度不高、耗时耗力等问题,需要将预先训练好的模型中的数据进行跨领域跨任务迁移学习。基于对不同数据集的迁移效果的研究,试验时将视觉领域中表现良好的ImageNet预训练模型迁移到音频分类任务,通过剔除无声部分、统一音频长度、数据转换和正则化处理这4个步骤,采用经典图像增强和样本混淆两种数据增强方法,以5种不同的方式训练数据集,实验证明:ImageNET目标训练模型的跨领域迁移学习效果显著,但源领域的模型效果和目标领域的最终效果并没有必然联系,且使用同领域相似数据分布的数据集的预训练效果比ImageNet上的预训练效果更差。
-
关键词
迁移学习
预训练
数据集
数据预处理
数据增强
-
Keywords
Transfer learning
Pre-train
Dataset
Data preprocessing
Data augmentation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名深度学习的视觉关系检测方法研究进展
被引量:1
- 2
-
-
作者
丁文博
许玥
-
机构
上海汽车集团人工智能实验室
美国加州洛杉矶约巴林达高中
-
出处
《科技创新导报》
2019年第27期145-150,共6页
-
文摘
视觉关系检测或视觉关系识别,不仅需要识别出图像中的目标以及他们的位置,还要识别目标之间的相互关系,是计算机视觉领域非常具有挑战性的任务,也是深度理解图像的基础。得益于近年深度学习的蓬勃发展,视觉关系检测技术取得了显著进步。本文介绍了近年来基于深度学习的视觉关系检测的研究进展,从主要挑战、应用领域、公开数据集、算法模型、模型评估标准、模型效果这几方面进行对比分析,并展望了视觉关系检测未来的发展方向和前景。
-
关键词
视觉关系
深度学习
语义模块
视觉模块
-
Keywords
Visual relationships
Deep learning
Semantic module
Visual module
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-