基于四元组度量损失的多模态变分自编码模型被引量：1

Quadruplet Metric Loss Based on Multimodal Variational Auto-Encoder

下载PDF

导出

摘要由于多模态数据具有异质性与耦合性等特点,使得对其进行建模存在较大难度.目前对多模态数据建模的一个重要研究方向是以变分自编码器为框架的多模态深度概率生成模型,已有的研究对不同模态数据之间的共享信息没有显式的约束,这使得多模态数据共享信息与私有信息不能被高效地解耦表示,进而导致数据的信息抽取不准确以及图像生成质量不清晰.本文在解耦表示共享信息与私有信息的研究思路上提出了基于四元组度量损失的多模态变分自编码(quadruplet metric loss based multimodal variational auto-encoder,Q-MVAE)模型,引入四元组度量损失,在隐空间显式地约束共享信息的抽取与对齐,使模型学到更好的解耦表示.相关定性与定量的实验证明了本文提出的模型在MNIST-SVHN多模态数据集上的数据表示与生成性能优于各对比模型.实验同时验证了模型对数据的推理表示也可用于多模态数据分类等下游任务.此外,模型还展现了对图像风格等私有信息解耦表示生成的潜力. Because of the heterogeneity and coupling of multimodal data,it is difficult to model multimodal data. At present,an important research direction of multimodal data modeling is the multimodal depth probability generative model based on the framework of variational auto-encoder. However,the existing research has no explicit constraints on the shared information between different modal data,which makes the multimodal data sharing and private information can not be effectively decoupled and represented,thus resulting in inaccurate data extraction and unclear image generative quality. Based on the research idea of decoupling representation of shared and private information,in this article we propose a quadruplet metric loss based multimodal variational auto-encoder(Q-MVAE),introduce quadruplet metric loss,explicitly constrain the extraction and alignment of shared information in the hidden space,and make the model learn better decoupling representation. Relevant qualitative and quantitative experiments show that the data representation and generative performance of the proposed model on MNIST-SVHN multimodal data set is better than that of the comparison models. At the same time,the experiment verifies that the model can also be used for downstream tasks such as multimodal data classification. Moreover,the model also shows the potential of generating decoupled representations of private information such as image style.

作者陈亚瑞杨剑宁吴世伟刘垚王晓捷 CHEN Yarui;YANG Jianning;WU Shiwei;LIU Yao;WANG Xiaojie(College of Artificial Intelligence,Tianjin University of Science&Technology,Tianjin 300457,China)

机构地区天津科技大学人工智能学院

出处《天津科技大学学报》 CAS 2022年第6期45-53,62,共10页 Journal of Tianjin University of Science & Technology

基金天津市研究生科研创新项目(人工智能专项)(2020YJSZXS31)。

关键词多模态数据变分自编码器生成模型度量学习 multimodal data variational auto-encoder generative model metric learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1陈亚瑞,杨巨成,史艳翠,王嫄,赵婷婷.概率生成模型变分推理方法综述[J].计算机研究与发展,2022,59(3):617-632. 被引量：2
2陈亚瑞,蒋硕然,杨巨成,赵婷婷,张传雷.混合变分自编码[J].计算机研究与发展,2020,57(1):136-144. 被引量：4

二级参考文献2

1朱军,胡文波.贝叶斯机器学习前沿进展综述[J].计算机研究与发展,2015,52(1):16-26. 被引量：71
2陈亚瑞,蒋硕然,杨巨成,赵婷婷,张传雷.混合变分自编码[J].计算机研究与发展,2020,57(1):136-144. 被引量：4

共引文献4

1林俊钒,赵伟.变分自编码模型在周期性KPI指标异常检测中的应用研究[J].信息通信,2020(7):206-208.
2陈亚瑞,杨巨成,史艳翠,王嫄,赵婷婷.概率生成模型变分推理方法综述[J].计算机研究与发展,2022,59(3):617-632. 被引量：2
3敦瑞静,鲁淑霞,张琦,翟俊海.基于行列式点过程的变分拉普拉斯自编码器[J].南京大学学报（自然科学版）,2022,58(4):629-639. 被引量：1
4蔡惠民,曹扬,陶政坪,谢真强.污水流量与天气数据融合的贝叶斯服务人口预测[J].计算机技术与发展,2024,34(8):181-188.

同被引文献12

1刘洋,史煜,曹雪倩,陈力迅,赵峰.自动化机器学习在眼部疾病识别及分类中的初步应用[J].中国数字医学,2019,14(3):44-45. 被引量：9
2王艳然,杨鹏飞.基于深度学习的多源数据自动分类算法设计[J].电脑知识与技术,2022,18(5):20-21. 被引量：1
3谭新宁,吴文如,梁婉晴,陈浩文,赵凯莹,张睿.定制化AI训练平台EasyDL在青葙子及其混伪品图像分类中的应用[J].中国民族民间医药,2022,31(15):40-45. 被引量：3
4王毅,陈曦,唐贵希,方志策,李朋磊.基于自动机器学习的全球尺度滑坡灾害易发性预测[J].资源环境与工程,2022,36(5):604-613. 被引量：2
5巴阳,陈越,胡学先,刘扬,徐阳.基于区块链与属性基加密的数据共享方案[J].信息工程大学学报,2022,23(4):443-451. 被引量：6
6马薛骑,裘鸿菲.基于网络照片数据与Auto ML模型的湖泊公园景观意象特征及感知偏好研究[J].中国园林,2022,38(10):86-91. 被引量：9
7周成祖,吴文,蔡晓强.基于分类分级的数据安全防控策略研究[J].数据与计算发展前沿,2023,5(1):128-135. 被引量：11
8王亚珅,胡武陵,朱小伶,葛悦涛.2022年深度学习技术主要发展动向分析[J].无人系统技术,2023,6(1):104-113. 被引量：4
9赵东明,邱圆辉,康瑞,宋韶旭,黄向东,王建民.面向聚合查询的Apache IoTDB物理元数据管理[J].软件学报,2023,34(3):1027-1048. 被引量：8
10彭锦峰,申德荣,寇月,聂铁铮.基于多视角的多类型错误全面检测方法[J].软件学报,2023,34(3):1049-1064. 被引量：3

引证文献1

1翁瑞.大数据分析技术的应用和发展趋势[J].计算机应用文摘,2023,39(21):37-39.

1王世辉,朱晓,莫锦华.基于轻量级模型共享的联合半监督学习[J].企业科技与发展,2022(7):32-35. 被引量：1
2袁壮,董大明.对比变分自编码器的近红外光谱测量及其在液态样品检测中的应用[J].光谱学与光谱分析,2022,42(11):3637-3641.
3梁弼,刘笃晋,熊伦,许晓红.一种内容和地点感知的个性化POI推荐模型[J].深圳大学学报（理工版）,2022,39(6):693-700.
4赵珊,贺军义,于金霞.电子信息专业学位研究生机器学习教学案例库建设研究[J].现代信息科技,2022,6(22):176-179. 被引量：4

天津科技大学学报

2022年第6期

浏览历史

内容加载中请稍等...

基于四元组度量损失的多模态变分自编码模型被引量：1

参考文献2

二级参考文献2

共引文献4

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于四元组度量损失的多模态变分自编码模型 被引量：1

参考文献2

二级参考文献2

共引文献4

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于四元组度量损失的多模态变分自编码模型被引量：1