深度学习驱动的跨模态视觉数据搜索研究综述

Review of Research on Cross-Modal Visual Data Retrieval Driven by Deep Learning

下载PDF

导出

摘要在移动互联网、智能终端以及人工智能技术迅猛发展的大数据时代背景下,以图像、音视频、3D模型等跨模态多媒体数据为检索对象的移动视觉搜索成为当下的研究热点,如何通过跨模态知识协同实现视觉数据搜索成为当务之急。文章以跨模态数据搜索的主流技术——深度学习为主线,将跨模态数据搜索的系统框架、技术关键等研究现状划分为基于卷积/循环神经网络的方法、基于图网络表示的方法、基于生成对抗的方法以及基于深度哈希编码的方法进行归纳,并对研究现状中尚未解决的难点进行关注,对未来的发展态势进行展望,为纵深方向的探索提供理论依据。 Due to the rapid development of mobile Internet, smart terminals and artificial intelligence technology in the era of big data, mobile visual search, which takes cross-modal multimedia data such as images, audios, videos, and 3 D models as the retrieval objects, has become the research hotspot nowadays. How to realize visual data retrieval through cross-modal knowledge collaboration has become the top priority. This paper uses the mainstream technology of cross-modal data retrieval-deep learning as the guideline, divides the system framework and key technologies of cross-modal data retrieval into methods based on convolutional neural networks and recurrent neural networks, methods based on graph network representation, methods based on generative adversarial networks, and methods based on deep supervised hashing, and reviews the current research status. This paper also examines the unsolved difficulties in the current research status and the future development trend, which provide a theoretical basis for the in-depth exploration.

作者朱维乔 Zhu Weiqiao(Guangzhou Maritime University,Guangzhou,Guangdong 510725,China)

机构地区广州航海学院图书馆

出处《高校图书馆工作》 2022年第5期41-45,共5页 Library Work in Colleges and Universities

基金广东省哲学社会科学十三五规划项目“大数据环境下基于深度学习的移动视觉搜索机制构建研究”(GD18XTS04)研究成果之一。

关键词深度学习跨模态视觉数据搜索 Deep learning Cross-modal Visual data retrieval

分类号 G250.7 [文化科学—图书馆学]

引文网络
相关文献

参考文献11

1陈宁,段友祥,孙歧峰.跨模态检索研究文献综述[J].计算机科学与探索,2021,15(8):1390-1404. 被引量：8
2朱路,田晓梦,曹赛男,刘媛媛.基于高阶语义相关的子空间跨模态检索方法研究[J].数据分析与知识发现,2020,4(5):84-91. 被引量：4
3尹奇跃,黄岩,张俊格,吴书,王亮.基于深度学习的跨模态检索综述[J].中国图象图形学报,2021,26(6):1368-1388. 被引量：18
4秦思琪,曾子明.基于深度哈希的数字人文移动视觉搜索方法[J].情报资料工作,2018,39(6):29-36. 被引量：6
5孙影影,贾振堂,朱昊宇.多模态深度学习综述[J].计算机工程与应用,2020,56(21):1-10. 被引量：33
6卓昀侃,綦金玮,彭宇新.跨媒体深层细粒度关联学习方法[J].软件学报,2019,30(4):884-895. 被引量：13
7冯霞,胡志毅,刘才华.跨模态检索研究进展综述[J].计算机科学,2021,48(8):13-23. 被引量：9
8王宏志,燕钰.深度学习驱动的跨模态数据检索[J].哈尔滨理工大学学报,2021,26(1):9-16. 被引量：11
9董震,裴明涛.基于异构哈希网络的跨模态人脸检索方法[J].计算机学报,2019,42(1):73-84. 被引量：11
10刘建伟,丁熙浩,罗雄麟.多模态深度学习综述[J].计算机应用研究,2020,37(6):1601-1614. 被引量：40

二级参考文献23

1张振亚,王进,程红梅,王煦法.基于余弦相似度的文本空间索引方法研究[J].计算机科学,2005,32(9):160-163. 被引量：53
2吴飞,庄越挺.互联网跨媒体分析与检索:理论与算法[J].计算机辅助设计与图形学学报,2010,22(1):1-9. 被引量：35
3王景中,胡贝贝.归一化算法在文字识别系统中的应用研究[J].计算机应用与软件,2011,28(3):95-97. 被引量：8
4闫利,胡修兵,陈长军,马振玲.多模态图像配准的梯度一致性算子[J].武汉大学学报（信息科学版）,2013,38(8):969-972. 被引量：7
5丁恒,陆伟.基于相关性的跨模态信息检索研究[J].现代图书情报技术,2016(1):17-23. 被引量：7
6刘宇鹏,马春光,张亚楠.深度递归的层次化机器翻译模型[J].计算机学报,2017,40(4):861-871. 被引量：28
7侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81
8梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：137
9邓佩,谭长庚.基于转移变量的图文融合微博情感分析[J].计算机应用研究,2018,35(7):2038-2041. 被引量：7
10李广丽,刘斌,朱涛,殷依,张红斌.基于优选典型相关分量的跨媒体检索模型[J].山东大学学报（工学版）,2018,48(5):38-46. 被引量：1

共引文献147

1赵智慧,周毅,李炜弘,汤朝晖,郭强,陈日高.基于深度学习多模态融合的2型糖尿病中医证素辨证模型的构建[J].世界科学技术-中医药现代化,2024,26(4):908-918. 被引量：1
2韩会珍,刘立波.基于注意力和视觉语义推理的枸杞虫害检索[J].计算机科学,2022,49(S02):431-436. 被引量：1
3邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：39
4李淑华,李建东.Powerbuilder中利用Windows API实现图片的动画特效[J].电脑编程技巧与维护,2000(4):78-81.
5曹小颖.基于深度残差网络模型的人脸检测算法[J].电脑编程技巧与维护,2019,0(8):131-133.
6陆芳,魏李婷.大数据背景下大学生学习状态研究的方法探析[J].黑龙江高教研究,2019,37(12):143-148. 被引量：10
7张典,汪海涛,姜瑛,陈星.基于轻量网络的近红外光和可见光融合的异质人脸识别[J].小型微型计算机系统,2020,41(4):807-811. 被引量：8
8朱路,田晓梦,曹赛男,刘媛媛.基于高阶语义相关的子空间跨模态检索方法研究[J].数据分析与知识发现,2020,4(5):84-91. 被引量：4
9孙影影,贾振堂,朱昊宇.多模态深度学习综述[J].计算机工程与应用,2020,56(21):1-10. 被引量：33
10董国亚,宋立明,李雅芬,李文,谢耀钦.基于深度学习的跨模态医学图像转换[J].中国医学物理学杂志,2020,37(10):1335-1339. 被引量：2

1王岚,王勇峰.小教具带来大乐趣——论《竹节人》教具对阅读策略单元的学习驱动[J].小学教学参考,2022(19):64-66.
2观点[J].福建教育,2022(41):64-64.
3张福锁,申建波,危常州,马文奇,张卫峰,黄成东,吕阳,张林,鲁振亚,营浩,程凌云,江荣风,屈凌波,侯翠红,王辛龙,修学峰,马航.绿色智能肥料:从原理创新到产业化实现[J].土壤学报,2022,59(4):873-887. 被引量：32

高校图书馆工作

2022年第5期

浏览历史

内容加载中请稍等...

深度学习驱动的跨模态视觉数据搜索研究综述

参考文献11

二级参考文献23

共引文献147

相关作者

相关机构

相关主题

浏览历史