深度语义关联学习的基于图像视觉数据跨域检索

Image-Based Cross-Domain Visual-Data Retrieval with Deep Semantic Correlation Learning

下载PDF

导出

摘要基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据,其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间,采用域适应算法或深度度量学习算法实现跨域特征的域对齐或语义对齐,其有效性仅在单一类型的跨域检索任务中进行了验证。提出一种基于深度语义关联学习的方法,以适用多种类型的基于图像的跨域视觉数据检索任务。首先,使用异构网络提取跨域数据的初始视觉特征;然后,通过构建公共特征空间实现初始特征映射,以便进行后续的域对齐和语义对齐;最后,通过域内鉴别性学习、域间一致性学习和跨域相关性学习,消除跨域数据特征之间的异质性,探索跨域数据特征之间的语义相关性,并为检索任务生成鲁棒且统一的特征表示。实验结果表明,该方法在TU-Berlin、IM2MN和MI3DOR数据集中的平均精度均值(mAP)分别达到0.448、0.689和0.874,明显优于对比方法。 Image-based cross-domain retrieval of visual data is performed to identify cross-domain images and three-dimensional model data that are semantically consistent with or similar in appearance to an input image.In this task,the modal heterogeneity between cross-domain data must be addressed to achieve cross-domain correspondence between the query images and target objects.Existing methods achieve domain or semantic alignment of cross-domain features by constructing a common feature space and using a domain-adaptation or depth metric algorithm.The effectiveness of these methods has only been verified in a single type of cross-domain retrieval task.To address the above issues,a method based on deep semantic correlation learning is proposed for many types of image-based cross-domain visual-data retrieval tasks.First,heterogeneous networks are used to extract the original visual features of cross-domain data.Subsequently,a common feature space is constructed to map the original features for subsequent domain and semantic alignments.Finally,intra-modal discrimination learning,inter-modal consistency learning,and cross-modal correlation learning are performed to eliminate the heterogeneity among cross-domain features,determine the semantic relevance among cross-domain data features,and generate robust and uniform feature representations for retrieval tasks.Experimental results show that the mean Average Precision(mAP)values of this method on the TU-Berlin,IM2MN,and MI3DOR datasets are 0.448,0.689,and 0.874,respectively,significantly better than comparative methods.

作者焦世超关日鹏况立群熊风光韩燮 JIAO Shichao;GUAN Ripeng;KUANG Liqun;XIONG Fengguan;HAN Xie(School of Computer Science and Technology,North University of China,Taiyuan 030051,Shanxi,China;Shanxi Key Laboratory of Machine Vision and Virtual Reality,Taiyuan 030051,Shanxi,China;Shanxi Province's Vision Information Processing and Intelligent Robot Engineering Research Center,Taiyuan 030051,Shanxi,China)

机构地区中北大学计算机科学与技术学院机器视觉与虚拟现实山西省重点实验室山西省视觉信息处理及智能机器人工程研究中心

出处《计算机工程》 CAS CSCD 北大核心 2024年第5期190-199,共10页 Computer Engineering

基金国家自然科学基金(62272426,62106238) 山西省科技重大专项计划“揭榜挂帅”项目(202201150401021) 山西省科技成果转化引导专项(202104021301055) 山西省回国留学人员科研项目(2020-113) 山西省基础研究计划(202203021222027)。

关键词跨域检索特征对齐域对齐草图真实图像三维模型相关性学习 cross-domain retrieval feature alignment domain alignment sketch real image three-dimensional model correlation learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1关日鹏,况立群,焦世超,熊风光,韩燮.多模态特征融合与词嵌入驱动的三维检索方法[J].计算机工程,2023,49(4):101-107. 被引量：1
2白静,拖继文,白少进,杨瞻源.基于自适应多类中心和半异构网络的三维模型草图检索[J].图学学报,2022,43(1):36-43. 被引量：1
3田加林,徐行,沈复民,申恒涛.基于跨模态自蒸馏的零样本草图检索[J].软件学报,2022,33(9):3152-3164. 被引量：2
4姬子恒,王斌.基于深度学习的草图检索方法研究进展[J].计算机工程与科学,2021,43(12):2190-2205. 被引量：3
5白静,周文惠,拖继文,秦飞巍.时空信息联合嵌入的端到端三维模型草图检索[J].计算机辅助设计与图形学学报,2021,33(6):826-836. 被引量：5
6赵旭飞,潘翔,刘复昌,张三元.基于哈希自注意力端到端网络的三维模型草图检索[J].计算机辅助设计与图形学学报,2021,33(5):798-805. 被引量：4
7Tian-Bi Jiang,Gui-Song Xia,Qi-Kai Lu,Wei-Ming Shen.Retrieving Aerial Scene Images with Learned Deep Image-SketchFeatures[J].Journal of Computer Science & Technology,2017,32(4):726-737. 被引量：2
8杜雨佳,李海生,姚春莲,蔡强.基于三元组网络的单图三维模型检索[J].北京航空航天大学学报,2020,46(9):1691-1700. 被引量：1

二级参考文献20

1杨思晨,王华锋,王月海,李锦涛,王赟豪.深度学习机制与小波融合的超分辨率重建算法[J].北京航空航天大学学报,2020,46(1):189-197. 被引量：5
2崔晨旸,石教英.三维模型检索中的特征提取技术综述[J].计算机辅助设计与图形学学报,2004,16(7):882-889. 被引量：65
3Pan-pan MU,San-yuan ZHANG,Yin ZHANG,Xiu-zi YE,Xiang PAN.Image-based 3D model retrieval using manifold learning[J].Frontiers of Information Technology & Electronic Engineering,2018,19(11):1397-1408. 被引量：1
4周爱保,申莎,蒋强.示能性:基于镜像神经元视角的理解[J].心理科学,2017,40(6):1335-1339. 被引量：5
5樊亚春,谭小慧,周明全,郑霞.基于局部多尺度的三维模型草图检索方法[J].计算机学报,2017,40(11):2448-2465. 被引量：16
6刘玉杰,窦长红,赵其鲁,李宗民,李华.基于条件生成对抗网络的手绘图像检索[J].计算机辅助设计与图形学学报,2017,29(12):2336-2342. 被引量：12
7赵鹏,刘杨,刘慧婷,姚晟.基于深度卷积-递归神经网络的手绘草图识别方法[J].计算机辅助设计与图形学学报,2018,30(2):217-224. 被引量：17
8刘玉杰,宋阳,李宗民,李华.融合信息熵和CNN的基于手绘的三维模型检索[J].图学学报,2018,39(4):735-741. 被引量：9
9于邓,刘玉杰,邢敏敏,李宗民,李华.包含跨域建模和深度融合网络的手绘草图检索[J].软件学报,2019,30(11):3567-3577. 被引量：7
10白静,孔德馨,周文惠,王梦杰.基于联合特征映射的端到端三维模型草图检索[J].计算机辅助设计与图形学学报,2019,31(12):2056-2065. 被引量：8

共引文献9

1白静,拖继文,白少进,杨瞻源.基于自适应多类中心和半异构网络的三维模型草图检索[J].图学学报,2022,43(1):36-43. 被引量：1
2苏亮亮,李惠.基于多特征非线性融合的草图-图像检索方法[J].安徽建筑大学学报,2022,30(3):74-82. 被引量：1
3王丹,王玫.一种适用于内部信息统筹与服务对像信息快速检索仿真设计[J].粘接,2022,49(11):169-173. 被引量：1
4张凯歌,卢志刚,聂天常,李志伟,郭宇强.面向无人装备的智能边缘计算软技术分析[J].兵工学报,2023,44(9):2611-2621. 被引量：1
5方潜生,李惠,苏亮亮,杨亚龙.基于HOG与深度特征融合的草图-图像检索[J].计算机仿真,2023,40(8):258-263. 被引量：1
6梁迪,卢列兆.基于不确定相似性度量学习的三维模型草图检索[J].沈阳大学学报（自然科学版）,2023,35(5):406-413.
7丁博,高源,范宇飞,何勇军.姿态非对齐的三维模型分类[J].电子学报,2023,51(9):2379-2390.
8张立宝,王涛,高征,丁博,何勇军.基于视点对齐的跨域三维模型检索[J].哈尔滨理工大学学报,2023,28(4):53-64.
9何明,陈艳,赵洪科,刘淇,吴乐,崔羽,曾贵华,刘贵全.Composing Like an Ancient Chinese Poet:Learn to Generate Rhythmic Chinese Poetry[J].Journal of Computer Science & Technology,2023,38(6):1272-1287.

1王海燕,杜菲瑀,姚海洋,陈晓.基于联合深度统计特征对齐的鱼类目标识别方法[J].陕西科技大学学报,2024,42(3):182-187.
2周宇,陈志华,盛斌,梁磊.基于渐进式多尺度Transformer的图像去雾算法[J].计算机科学,2024,51(5):117-124.
3唐刚,陈舰.水电站场景下的三维模型数据集成与管理[J].电气技术与经济,2024(4):249-251.
4刘航,普园媛,王成超,赵征鹏,朱朋杰,徐丹.结合细粒度自注意力的实例图像着色[J].计算机应用研究,2024,41(5):1569-1577.
5余龙,李军,贺霖,李云飞.高光谱图像类别独立的域适应分类[J].遥感学报,2024,28(3):610-623.
6王永振,童鸣,燕雪峰,魏明强.面向真实战场环境的Transformer-CNN多特征聚合图像去雾算法[J].兵工学报,2024,45(4):1070-1081.
7周朝阳,贺艳菊,夏岭梅,闵昭浩.融合词性与语义相关性的图书馆智能咨询系统问句相似性计算方法研究[J].情报探索,2024(5):1-8.
8庞瑞欣,李秀霞.基于知识元迁移的学科领域方法库构建研究[J].情报理论与实践,2024,47(5):204-212.
9田艳兵,王素珍,邓成禹,李浩儒.基于CIM的智慧社区综合管理云平台开发[J].智能建筑电气技术,2024,18(1):89-92.
10查浩然,刘畅,王巨震,林云.面向无人机辐射源个体识别的域适应模型设计[J].信号处理,2024,40(4):650-660.

计算机工程

2024年第5期

浏览历史

内容加载中请稍等...

深度语义关联学习的基于图像视觉数据跨域检索

参考文献8

二级参考文献20

共引文献9

相关作者

相关机构

相关主题

浏览历史