现实世界中训练数据和测试数据往往存在分布差异,导致基于独立同分布假设的模型丧失鲁棒性.无监督域自适应是一种重要解决方法,极具应用价值.鉴于此,国内外研究者进行大量理论基础和方法技术的研究,促进了很多应用领域的发展,包括自动...现实世界中训练数据和测试数据往往存在分布差异,导致基于独立同分布假设的模型丧失鲁棒性.无监督域自适应是一种重要解决方法,极具应用价值.鉴于此,国内外研究者进行大量理论基础和方法技术的研究,促进了很多应用领域的发展,包括自动驾驶、智慧医疗等.但是,目前主流的方法仍存在一些问题:源域和目标域的概率分布距离是否能真正代表它们之间的差异,以及如何更准确地度量2个分布之间的差异,仍然是一个值得探讨的问题.同时,如何更有效地利用伪标签,也是一个值得继续探索的问题.提出了反向伪标签最优化传输(backward pseudo-label and optimal transport,BPLOT),不仅利用瓦瑟斯坦距离和格罗莫夫-瓦瑟斯坦距离,从最优化特征-拓扑传输的角度更准确地计算了2个分布之间的差异;而且提出了反向验证伪标签的模块来更有效地利用伪标签,在训练过程中验证伪标签的质量.将所提出的方法在多个无监督域自适应的数据集上进行了实验验证.实验结果表明,BPLOT模型的效果超过了所有对比的基准方法.展开更多
文摘现实世界中训练数据和测试数据往往存在分布差异,导致基于独立同分布假设的模型丧失鲁棒性.无监督域自适应是一种重要解决方法,极具应用价值.鉴于此,国内外研究者进行大量理论基础和方法技术的研究,促进了很多应用领域的发展,包括自动驾驶、智慧医疗等.但是,目前主流的方法仍存在一些问题:源域和目标域的概率分布距离是否能真正代表它们之间的差异,以及如何更准确地度量2个分布之间的差异,仍然是一个值得探讨的问题.同时,如何更有效地利用伪标签,也是一个值得继续探索的问题.提出了反向伪标签最优化传输(backward pseudo-label and optimal transport,BPLOT),不仅利用瓦瑟斯坦距离和格罗莫夫-瓦瑟斯坦距离,从最优化特征-拓扑传输的角度更准确地计算了2个分布之间的差异;而且提出了反向验证伪标签的模块来更有效地利用伪标签,在训练过程中验证伪标签的质量.将所提出的方法在多个无监督域自适应的数据集上进行了实验验证.实验结果表明,BPLOT模型的效果超过了所有对比的基准方法.