基于知识蒸馏的深度无监督离散跨模态哈希被引量：2

Deep unsupervised discrete cross-modal hashing based on knowledge distillation

下载PDF

导出

摘要跨模态哈希因其低存储花费和高检索效率得到了广泛的关注。现有的大部分跨模态哈希方法需要额外的手工标签来提供实例间的关联信息,然而,预训练好的深度无监督跨模态哈希方法学习到的深度特征同样能提供相似信息;且哈希码学习过程中放松了离散约束,造成较大的量化损失。针对以上两个问题,提出基于知识蒸馏的深度无监督离散跨模态哈希(DUDCH)方法。首先,结合知识蒸馏中知识迁移的思想,利用预训练无监督老师模型潜藏的关联信息以重构对称相似度矩阵,从而代替手工标签帮助有监督学生模型训练;其次,采用离散循环坐标下降法(DCC)迭代更新离散哈希码,以此减少神经网络学习到的实值哈希码与离散哈希码间的量化损失;最后,采用端到端神经网络作为老师模型,构建非对称神经网络作为学生模型,从而降低组合模型的时间复杂度。在两个常用的基准数据集MIRFLICKR-25K和NUS-WIDE上的实验结果表明,该方法相较于深度联合语义重构哈希(DJSRH)方法在图像检索文本/文本检索图像两个任务上的平均精度均值(mAP)分别平均提升了2.83个百分点/0.70个百分点和6.53个百分点/3.95个百分点,充分体现了其在大规模跨模态数据检索中的有效性。 Cross-modal hashing has attracted much attention due to its low storage cost and high retrieval efficiency.Most of the existing cross-modal hashing methods require the inter-instance association information provided by additional manual labels.However,the deep features learned by pre-trained deep unsupervised cross-modal hashing methods can also provide similar information.In addition,the discrete constraints are relaxed in the learning process of Hash codes,resulting in a large quantization loss.To solve the above two issues,a Deep Unsupervised Discrete Cross-modal Hashing(DUDCH)method based on knowledge distillation was proposed.Firstly,combined with the idea of knowledge transfer in knowledge distillation,the latent association information of the pre-trained unsupervised teacher model was used to reconstruct the symmetric similarity matrix,so as to replace the manual labels to help the supervised student method training.Secondly,the Discrete Cyclic Coordinate descent(DCC)was adopted to update the discrete Hash codes iteratively,thereby reducing the quantization loss between the real-value Hash codes learned by neural network and the discrete Hash codes.Finally,with the end-to-end neural network adopted as teacher model and the asymmetric neural network constructed as student model,the time complexity of the combination model was reduced.Experimental results on two commonly used benchmark datasets MIRFLICKR-25K and NUS-WIDE show that compared with Deep Joint-Semantics Reconstructing Hashing(DJSRH),the proposed method has the mean Average Precision(mAP)in image-to-text/text-to-image tasks increased by 2.83 percentage points/0.70 percentage points and 6.53 percentage points/3.95 percentage points averagely and respectively,proving its effectiveness in large-scale cross-modal retrieval.

作者张成万源强浩鹏 ZHANG Cheng;WAN Yuan;QIANG Haopeng(School of Science,Wuhan University of Technology,Wuhan Hubei 430070,China)

机构地区武汉理工大学理学院

出处《计算机应用》 CSCD 北大核心 2021年第9期2523-2531,共9页 journal of Computer Applications

基金中央高校基本科研业务费专项资金资助项目(2019IB010)。

关键词跨模态哈希知识蒸馏相似度矩阵重构离散循环坐标下降法非对称 cross-modal hashing knowledge distillation reconstruction of similarity matrix Discrete Cyclic Coordinate descent(DCC) asymmetric

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1严双咏,刘长红,江爱文,叶继华,王明文.语义耦合相关的判别式跨模态哈希学习算法[J].计算机学报,2019,42(1):164-175. 被引量：14
2董震,裴明涛.基于异构哈希网络的跨模态人脸检索方法[J].计算机学报,2019,42(1):73-84. 被引量：11
3邓一姣,张凤荔,陈学勤,艾擎,余苏喆.面向跨模态检索的协同注意力网络模型[J].计算机科学,2020,47(4):54-59. 被引量：10

二级参考文献4

1张鸿,吴飞,庄越挺.跨媒体相关性推理与检索研究[J].计算机研究与发展,2008,45(5):869-876. 被引量：20
2张鸿,吴飞,庄越挺,陈建勋.一种基于内容相关性的跨媒体检索方法[J].计算机学报,2008,31(5):820-826. 被引量：34
3李志欣,施智平,陈宏朝,吴璟莉.基于语义学习的图像多模态检索[J].计算机工程,2013,39(3):258-263. 被引量：6
4樊花,陈华辉.基于哈希方法的跨模态检索研究进展[J].数据通信,2018(3):39-45. 被引量：4

共引文献26

1邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：39
2陶友山.姚桥矿井改扩建工程移交生产[J].煤矿设计,2000(5):11-12.
3曹小颖.基于深度残差网络模型的人脸检测算法[J].电脑编程技巧与维护,2019,0(8):131-133.
4张典,汪海涛,姜瑛,陈星.基于轻量网络的近红外光和可见光融合的异质人脸识别[J].小型微型计算机系统,2020,41(4):807-811. 被引量：8
5顾岩,赵崇宇,黄平.基于高阶统计信息的深度哈希学习模型[J].计算机工程,2020,46(7):260-267. 被引量：1
6贺周雨,冯旭鹏,刘利军,黄青松.面向大规模图像检索的深度强相关散列学习方法[J].计算机研究与发展,2020,57(11):2375-2388. 被引量：3
7张万桢,刘同来,李志梅.重构约束的离散矩阵因式分解跨模态哈希[J].计算机工程与设计,2021,42(2):525-532.
8邱一城,杨立身.结合残差学习和双模态CAE的图像描述方法[J].光学技术,2021,47(1):93-100.
9纪冲,刘岩.基于无监督深度学习的跨模态数据目标检索[J].计算机仿真,2021,38(3):380-383. 被引量：2
10冯霞,胡志毅,刘才华.跨模态检索研究进展综述[J].计算机科学,2021,48(8):13-23. 被引量：9

同被引文献3

1冯霞,胡志毅,刘才华.跨模态检索研究进展综述[J].计算机科学,2021,48(8):13-23. 被引量：9
2刘芳名,张鸿.基于多级语义的判别式跨模态哈希检索算法[J].计算机应用,2021,41(8):2187-2192. 被引量：4
3梁美玉,王笑笑,杜军平.基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习[J].模式识别与人工智能,2022,35(3):195-206. 被引量：3

引证文献2

1柳兴华,曹桂涛,林秋斌,曹文明.自适应混合注意力深度跨模态哈希[J].计算机应用,2022,42(12):3663-3670. 被引量：1
2谭钰,王小琴,蓝如师,刘振丙,罗笑南.基于判别性矩阵分解的多标签跨模态哈希检索[J].计算机应用,2023,43(5):1349-1354. 被引量：1

二级引证文献2

1佟威,何理扬,李锐,黄威,黄振亚,刘淇.基于无监督语义哈希的高效相似题检索模型[J].计算机应用,2024,44(1):206-216.
2梁焕,王海荣,王栋.自注意力相似度迁移跨模态哈希网络[J].北京航空航天大学学报,2024,50(2):615-622.

1李源浩.一种成熟先进的创新方法——TRIZ[J].信息系统工程,2021,34(7):137-140. 被引量：8
2十万个为什么[J].课外阅读,2021(9):90-91.
3郑东霞.融合评分和社会标签的卷积神经网络推荐模型研究[J].软件工程,2021,24(9):28-31. 被引量：1
4李珣,王高平,李林鹏,王晓华,景军锋,张凯兵.基于RGB-D图像的物体识别方法[J].西安工程大学学报,2021,35(4):55-70. 被引量：9
5刘芳,孙帮勇.基于抗几何变换的离散深度哈希算法[J].西安理工大学学报,2021,37(2):246-252. 被引量：1
6刘立波,苟婷婷.融合深度典型相关分析和对抗学习的跨模态检索[J].计算机科学,2021,48(9):200-207. 被引量：1
7郑苏苏,关东海,袁伟伟.融合不完整多视图的异质信息网络嵌入方法[J].计算机科学,2021,48(9):68-76. 被引量：1

计算机应用

2021年第9期

浏览历史

内容加载中请稍等...

基于知识蒸馏的深度无监督离散跨模态哈希被引量：2

参考文献3

二级参考文献4

共引文献26

同被引文献3

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于知识蒸馏的深度无监督离散跨模态哈希 被引量：2

参考文献3

二级参考文献4

共引文献26

同被引文献3

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于知识蒸馏的深度无监督离散跨模态哈希被引量：2