-
题名基于样本对语义主动挖掘的图文匹配算法
- 1
-
-
作者
陈永锋
刘劲
杨志景
陈锐涵
谭俊鹏
-
机构
广东工业大学信息工程学院
-
出处
《广东工业大学学报》
CAS
2024年第4期89-97,共9页
-
基金
广东省自然科学基金资助项目(2021A1515011341,2023A1515012561)
广东省数字孪生人重点实验室项目(2022B1212010004)。
-
文摘
针对目前基于共识学习的图文匹配算法无法有效匹配图像−文本样本对中难分的负样本,模型的泛化能力较弱,在大规模数据集上效果不佳等不足,本文提出了一种基于样本对语义主动挖掘的图文匹配模型。首先,提出的自适应分层强化损失具有多样化的学习模式,在传统的三元组损失基础上,增加具有预测性的候选实例(难以分辨的样本对)进行辅助训练。其主动学习模式通过一种惩罚机制来关注难分的负样本,以提高判别能力。此外,提出的模型还能自适应地从非真实标签样本中挖掘出更多隐藏的相关语义表征,从而提高了模型的性能和泛化能力。最后,在Flickr30K和MSCOCO公共数据集上的实验结果证明了该算法的有效性,其性能达到了目前先进水平。本方法有效地结合了图像文本两种模态,能有效提高自然语言搜索和视觉问题回答等应用的性能。
-
关键词
图文匹配
共识学习
三元组损失
难分的负对
跨模态检索
-
Keywords
image-text matching
common-sense learning
triplet loss
intractable negative pairs
cross-modal retrieval
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自适应邻域的鲁棒多视图聚类算法
被引量:6
- 2
-
-
作者
李杏峰
黄玉清
任珍文
李毅红
-
机构
西南科技大学信息工程学院
西南科技大学国防科技学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第4期1093-1099,共7页
-
基金
国家自然科学基金资助项目(61673220)
四川省重大科技项目(2018TZDZX0002)。
-
文摘
针对现存的基于自适应邻域的多视图聚类算法没有考虑噪声和共识图信息损失的问题,提出一种基于自适应邻域的鲁棒多视图聚类(RMVGC)算法。首先,为了避免噪声和异常值对数据的影响,通过鲁棒主成分分析模型(RPCA)从原始数据中学习多个干净的低秩数据;其次,用自适应邻域学习直接融合多个干净的低秩数据来得到一个干净的共识关系图,从而减少图融合过程中的信息丢失。实验结果表明,所提RMVGC算法的标准化互信息(NMI)在MRSCV1、BBCSport、COIL20、ORL和UCI digits数据集上比目前流行的多视图聚类算法分别提升了5.2、1.36、27.2、4.66和5.85个百分点。同时,该算法保持了数据局部结构,增强了对原始数据的鲁棒性,提高了关系图质量,在多视图数据集上具有较好的聚类性能。
-
关键词
自适应邻域
多视图聚类
低秩
鲁棒
共识关系图学习
-
Keywords
adaptive neighborhood
multi-view clustering
low-rank
robustness
consensus affinity graph learning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-