基于映射字典学习的跨模态哈希检索被引量：4

Projective Dictionary Learning Hashing for Cross-modal Retrieval

下载PDF

导出

摘要针对网络上出现越来越多的多模态数据,如何在海量数据中检索不同模态的数据成为一个新的挑战.哈希方法把数据映射到Hamming空间,大大降低了计算复杂度,为海量数据的跨模态检索提供了一条有效的路径.然而,大部分现存方法生成的哈希码不包含任何语义信息,从而导致算法性能的下降.为了解决这个问题,本文提出一种基于映射字典学习的跨模态哈希检索算法.首先,利用映射字典学习一个共享语义子空间,在子空间保持数据模态间的相似性.然后,提出一种高效的迭代优化算法得到哈希函数,但是可以证明问题的解并不是唯一的.因此,本文提出通过学习一个正交旋转矩阵最小化量化误差,得到性能更好的哈希函数.最后,在两个公开数据集上的实验结果说明了该算法优于其他现存方法. With the sharp increasing of multi-modal data on the internet, retrieving samples with different modalities has become a challenge, hashing methods, which map the data to Hamming space to reduce computational cost, can provide an effective way for large-scale cross-modal retrieval. However, the hashing codes of most existing methods do not contain any semantic information, which degrades the performance. To address this issue, we propose a cross-modM hashing method, termed projective dictionary learning hashing （PDLH） method. Firstly, projective dictionary learning is employed to learn a sharing semantic subspace by preserving the inter-modal similarity. Then an efficient iterative optimal algorithm is proposed to gain hashing hmctions. However, the solution is not a unique solution, as proven in this paper. To further improve the performance of the proposed method, an orthogonal rotation matrix is learned by minimizing the quantization loss for better hashing functions. Finally, experimental results on two widely used datasets show that the performance of the proposed method is better than those of the existing methods.

作者姚涛孔祥维付海燕 TIAN Qi YAO Tao;KONG Xiang-Wei;Fu Hai-Yan;TIAN Qi(Department of Information and Communication Engineering,Dalian University of Technology,Dalian 116024,China;Department of Information and Electrical Engineering,Ludong University,Yantai 264025,China;Department of Data Science and Engineering Management,Zhejiang University,Hangzhou 310058,China;Department of Computer Science,University of Texas at San Antonio,San Antonio 78249,USA)

机构地区大连理工大学信息与通信工程学院鲁东大学信息与电气工程学院浙江大学数据科学与管理工程学系德克萨斯大学圣安东尼奥分校计算机科学学院

出处《自动化学报》 EI CSCD 北大核心 2018年第8期1475-1485,共11页 Acta Automatica Sinica

基金国家自然科学基金(71421001 61502073 61172109 61429201) 模式识别国家重点实验室开放课题(201407349)资助~~

关键词跨模态检索哈希映射字典学习汉明空间 Cross-modal retrieval hashing project dictionary learning Hamming space

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1李武军,周志华.大数据哈希学习:现状与趋势[J].科学通报,2015,60(5):485-490. 被引量：46
2练秋生,石保顺,陈书贞.字典学习模型、算法及其应用研究进展[J].自动化学报,2015,41(2):240-260. 被引量：121
3陈思宝,赵令,罗斌.基于局部保持的核稀疏表示字典学习[J].自动化学报,2014,40(10):2295-2305. 被引量：3
4黄丹丹,孙怡.基于判别性局部联合稀疏模型的多任务跟踪[J].自动化学报,2016,42(3):402-415. 被引量：5
5马名浪,何小海,滕奇志,陈洪刚,卿粼波.基于自适应稀疏变换的指纹图像压缩[J].自动化学报,2016,42(8):1274-1284. 被引量：7
6郑思龙,李元祥,魏宪,彭希帅.基于字典学习的非线性降维方法[J].自动化学报,2016,42(7):1065-1076. 被引量：9

二级参考文献283

1张海,王尧,常象宇,徐宗本.L_(1/2)正则化[J].中国科学：信息科学,2010,40(3):412-422. 被引量：15
2Wright J, Yang A Y, Ganesh A, Sastry S S. Robust face recognition via sparse representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.
3Engan K, Aase S O, Hakon H J. Method of optimal directions for frame design. In: Proceedings of Acoustics, Speech, and Signal Processing. Arizona, USA: IEEE, 1999, 5: 2443-2446.
4Aharon M, Elad M, Bruckstein M A. The K-SVD: an algorithm for designing of overcomplete dictionaries for sparse representation. IEEE Transactions on Signal Processing, 2006, 54(11): 4311-4322.
5Yang M, Zhang L, Feng X. Fisher discrimination dictionary learning for sparse representation. In: Proceedings of 2011 IEEE International Conference on Computer Vision(ICCV). Barcelona, Spain: IEEE, 2011. 543-550.
6He X F, Niyogi P. Locality preserving projections. Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2003. 152-160.
7Scholkopf B, Smola A, Muller K R. Nonlinear component analysis as a kernel eigenvalue problem. Neural Computation, 1998, 10(5): 1299-1319.
8Mike S, Ratsch G, Scholkopf B, Weston J, Muller R K. Fisher discriminant analysis with kernels. In: Proceedings of the 1999 IEEE Signal Processing Society Workshop. Madison, WI: IEEE, 1999. 41-48.
9Lu J W, Plataniotis K N, Venetsanopoulos A N. Face recognition using kernel direct discriminant analysis algorithms. IEEE Transactions on Neural Networks, 2003, 14(1): 117-126.
10Gao S, Tsang I, Chia L T. Sparse representation with kernels. IEEE Transactions on Image Processing, 2013, 22(2): 423-434.

共引文献183

1程德强,陈杰,寇旗旗,聂帅杰,张剑英.融合层次特征和注意力机制的轻量化矿井图像超分辨率重建方法[J].仪器仪表学报,2022,43(8):73-84. 被引量：28
2李帅永,毛维培,程振华,韩明秀,夏传强.基于VMD和K-SVD字典学习的供水管道泄漏振动信号压缩感知方法[J].仪器仪表学报,2020,41(3):49-60. 被引量：25
3张光雅,李江坤,李兵海,张翔,张伟,武雷超.K-SVD字典在航空伽马谱数据降噪中的应用研究[J].核电子学与探测技术,2023,43(1):56-63. 被引量：1
4殷晓辉.基于改进K-SVD算法的傅里叶叠层成像识别技术研究[J].生命科学仪器,2018,16(6):46-49.
5范引娣.基于分布结构约束稀疏表示的图像分类方法[J].计算机与现代化,2015(7):73-76. 被引量：1
6文伟,王英华,冯博,刘宏伟.基于监督非相干字典学习的极化SAR图像舰船目标检测[J].自动化学报,2015,41(11):1926-1940. 被引量：6
7王冬梅,冯偲,王海鹏,于微波.疲劳驾驶检测中基于稀疏表示的眼睛状态识别研究[J].影像科学与光化学,2016,34(1):95-101. 被引量：6
8孟祥瑞,赵瑞珍,岑翼刚,张凤珍.用于压缩采样信号重建的回溯正则化自适应匹配追踪算法[J].信号处理,2016,32(2):186-192. 被引量：9
9谭喆.多模态数据哈希检索方法综述[J].信息通信,2016,29(3):179-180.
10游寒旭,李为,李昕,朱杰.稀疏线性预测字典在语音压缩感知中的应用[J].上海师范大学学报（自然科学版）,2016,45(2):223-229. 被引量：1

同被引文献16

1高文.高文：“存得下查得快”拥抱多媒体大数据时代[J].创新科技,2013(6):7-7. 被引量：2
2秦颖.利用双语词典检索英汉跨语言剽窃文档对应内容[J].现代图书情报技术,2014(7):114-119. 被引量：2
3李武军,周志华.大数据哈希学习:现状与趋势[J].科学通报,2015,60(5):485-490. 被引量：46
4刘冶,潘炎,夏榕楷,刘荻,印鉴.FP-CNNH:一种基于深度卷积神经网络的快速图像哈希算法[J].计算机科学,2016,43(9):39-46. 被引量：17
5尹宏鹏,陈波,柴毅,刘兆栋.基于视觉的目标检测与跟踪综述[J].自动化学报,2016,42(10):1466-1489. 被引量：293
6庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗.深度文本匹配综述[J].计算机学报,2017,40(4):985-1003. 被引量：65
7张慧,王坤峰,王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报,2017,43(8):1289-1305. 被引量：245
8罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：145
9黄文明,魏鹏,梁金华.基于卷积神经网络的哈希在图像检索中的应用[J].计算机工程与设计,2017,38(2):517-521. 被引量：7
10严双咏,刘长红,江爱文,叶继华,王明文.语义耦合相关的判别式跨模态哈希学习算法[J].计算机学报,2019,42(1):164-175. 被引量：13

引证文献4

1顾岩,赵崇宇,黄平.基于高阶统计信息的深度哈希学习模型[J].计算机工程,2020,46(7):260-267. 被引量：1
2汪海龙,禹晶,肖创柏.基于点对相似度的深度非松弛哈希算法[J].自动化学报,2021,47(5):1077-1086. 被引量：3
3庾骏,黄伟,张晓波,尹贺峰.基于松弛Hadamard矩阵的多模态融合哈希方法[J].电子学报,2022,50(4):909-920. 被引量：1
4李岩,郭军军,余正涛,高盛祥.基于词映射构建伪查询改善低资源跨语言信息检索研究[J].山西大学学报（自然科学版）,2022,45(2):322-331. 被引量：7

二级引证文献12

1房悦.基于向量空间模型的网络信息智能检索算法[J].信息与电脑,2022,34(14):86-88. 被引量：1
2代佳洋,周栋.基于多任务学习的跨语言信息检索方法研究[J].广西师范大学学报（自然科学版）,2022,40(6):69-81. 被引量：2
3魏凡其.基于人工智能技术的海量计算机信息检索方法设计[J].电子技术与软件工程,2022(20):216-219. 被引量：3
4王子为,鲁继文,周杰.基于自适应梯度优化的二值神经网络[J].电子学报,2023,51(2):257-266.
5祝婕,刘敏娜.基于GAN的跨语言文本匹配算法研究[J].自动化与仪器仪表,2023(4):20-24.
6钟亚妹,薛慧丽.基于深度哈希算法的学生画像个性化推荐系统的设计与实现[J].河北省科学院学报,2024,41(1):39-45.
7庾骏,马江涛,咸阳,侯瑞霞,孙伟.半配对的多模态询问哈希方法[J].电子与信息学报,2024,46(2):481-491.
8肖朝晖.基于Web的数字化资源共享信息查询系统设计[J].微型电脑应用,2024,40(2):192-196. 被引量：1
9刘晓梅,董仲博.基于一致性哈希算法的分布式数据库索引查询优化方法[J].吉首大学学报（自然科学版）,2024,45(1):36-41.
10李彬蕙.基于贝叶斯网络的航空化工材料信息快速检索方法[J].粘接,2024,51(3):61-64.

1杨子涵.基于灰度编码和Hamming网络的彩色图像识别方法研究[J].电子技术与软件工程,2018(15):52-54. 被引量：1
2高建哲,吕文阁.基于ORB特征点的多目标匹配[J].机电工程技术,2018,47(7):90-93. 被引量：2
3黄俊峰,袁方程.证明函数不等式的几种常用方法[J].数学教学研究,2018,37(2):47-50.
4苏丹一季度黄金产量达36．5吨[J].中国经贸,2018,0(15):8-8.
5邓清文,林志贤,郭太良.一种基于主成分的多表图像哈希检索方法[J].计算机工程与应用,2018,54(3):192-199. 被引量：3
6张云霞.超立方体中最短和次短的点不交路径[J].理论数学,2017,7(4):230-235.
7袁蔚莉,朱晓飞.区块链、哈希函数和比特币[J].儿童故事画报,2018,0(15):16-17.
8冯云乔.基于特征融合的优化哈希算法[J].科技经济导刊,2018(16):9-11.
9胡六四.依赖模糊C均值聚类的网络数据库特定数据检索算法[J].信阳农林学院学报,2018,28(2):119-121.
10崔莉花.刑事诉讼中口供的证明问题探究[J].吉林广播电视大学学报,2018(7):145-146. 被引量：2

自动化学报

2018年第8期

浏览历史

内容加载中请稍等...

基于映射字典学习的跨模态哈希检索被引量：4

参考文献6

二级参考文献283

共引文献183

同被引文献16

引证文献4

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于映射字典学习的跨模态哈希检索 被引量：4

参考文献6

二级参考文献283

共引文献183

同被引文献16

引证文献4

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于映射字典学习的跨模态哈希检索被引量：4