增广模态收益动态评估方法

Dynamic evaluation method for benefit of modality augmentation

下载PDF

导出

摘要针对获取新模态难度大、收益差异大的问题,提出了一种增广模态收益动态评估方法。首先,通过多模态融合网络得到中间特征表示和模态融合前后的预测结果;其次,将两个预测结果的真实类别概率(TCP)引入置信度估计,得到融合前后的置信度;最后,计算两种置信度的差异,并将该差异作为样本以获取新模态所带来的收益。在常用多模态数据集和真实的医学数据集如癌症基因组图谱(TCGA)上进行实验。在TCGA数据集上的实验结果表明,与随机收益评估方法和基于最大类别概率(MCP)的方法相比,所提方法的准确率分别提高了1.73~4.93和0.43~4.76个百分点,有效样本率(ESR)分别提升了2.72~11.26和1.08~25.97个百分点。可见,所提方法能够有效评估不同样本获取新模态所带来的收益,并具备一定可解释性。 Focused on the difficulty and big benefit difference in acquiring new modalities,a method for dynamically evaluating benefit of modality augmentation was proposed.Firstly,the intermediate feature representation and the prediction results before and after modality fusion were obtained through the multimodal fusion network.Then,the confidence before and after fusion were obtained by introducing the True Class Probability(TCP)of two prediction results to confidence estimation.Finally,the difference between two confidences was calculated and used as an sample to obtain the benefit brought by the new modality.Extensive experiments were conducted on commonly used multimodal datasets and real medical datasets such as The Cancer Genome Atlas(TCGA).The experimental results on TCGA dataset show that compared with the random benefit evaluation method and the Maximum Class Probability(MCP)based method,the proposed method has the accuracy increased by 1.73 to 4.93 and 0.43 to 4.76 percentage points respectively,and the Effective Sample Rate(ESR)increased by 2.72 to 11.26 and 1.08 to 25.97 percentage points respectively.It can be seen that the proposed method can effectively evaluate benefits of acquiring new modalities for different samples,and has a certain degree of interpretability.

作者毕以镇马焕张长青 BI Yizhen;MA Huan;ZHANG Changqing(College of Intelligence and Computing,Tianjin University,Tianjin 300350,China)

机构地区天津大学智能与计算学部

出处《计算机应用》 CSCD 北大核心 2023年第10期3099-3106,共8页 journal of Computer Applications

关键词多模态分类多模态融合置信度估计增广模态表示学习 multimodal classification multimodal fusion confidence estimation modality augmentation representation learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吴明晖,张广洁,金苍宏.基于多模态信息融合的时间序列预测模型[J].计算机应用,2022,42(8):2326-2332. 被引量：7
2余娜,刘彦,魏雄炬,万源.基于注意力机制和金字塔融合的RGB-D室内场景语义分割[J].计算机应用,2022,42(3):844-853. 被引量：6

二级参考文献7

1张碧琼,李越.汇率对中国股票市场的影响是否存在:从自回归分布滞后模型(ARDL-ecm)得到的证明[J].金融研究,2002(7):26-35. 被引量：129
2张栗粽,王谨平,刘贵松,罗光春,卢国明.面向金融数据的神经网络时间序列预测模型[J].计算机应用研究,2018,35(9):2632-2637. 被引量：14
3姚小强,侯志森.基于树结构长短期记忆神经网络的金融时间序列预测[J].计算机应用,2018,38(11):3336-3341. 被引量：10
4田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：226
5孔震,张华鲁,岳圣凯,袁明磊,路通.基于时域卷积网络的多尺度双线性天气预测模型[J].图学学报,2020,41(5):764-770. 被引量：8
6杨胜杰,仇振安,高小宁,李建勋.基于深度敏感空间金字塔池化的RGBD语义分割[J].电光与控制,2020,27(12):84-89. 被引量：4
7徐辉,祝玉华,甄彤,李智慧.深度神经网络图像语义分割方法综述[J].计算机科学与探索,2021,15(1):47-59. 被引量：50

共引文献11

1余俊辉,毛琳,杨大伟.一种粗细特征增强语义分割算法[J].大连民族大学学报,2022,24(1):18-23.
2李兆玺,刘红岩.融合全局和序列特征的多变量时间序列预测方法[J].计算机学报,2023,46(1):70-84. 被引量：8
3王敏,谢永盛.不同场景下虚拟现实视频畸变校正算法[J].兰州文理学院学报（自然科学版）,2023,37(1):40-44.
4王泽宇,布树辉,黄伟,郑远攀,吴庆岗,张旭.面向交通场景解析的局部和全局上下文注意力融合网络[J].计算机应用,2023,43(3):713-722. 被引量：1
5杨世旺,赵萍,黄剑,叶子强,韩晓明.中台数据库信息共享适用性和安全性的增强[J].云南师范大学学报（自然科学版）,2023,43(5):54-58. 被引量：2
6王童.基于MSWOA改进Attention-BiGRU模型的电力负荷预测[J].软件导刊,2023,22(10):84-89. 被引量：2
7张雅波,陈春晖.融合情绪分析和Informer-ARIMA模型的比特币价格预测方法[J].现代信息科技,2024,8(9):131-135. 被引量：1
8赵凌霄,李智扬,屈磊磊.基于EMD和CatBoost算法的改进时间序列模型——以大连市PM_(2.5)预测为例[J].南京林业大学学报（自然科学版）,2024,48(3):268-274.
9付义峰,肖贺.基于TCN和双重注意力的股价预测模型[J].计算机仿真,2024,41(6):345-353.
10李顺新,陈飞飞.基于比例池化的RGB图像语义分割网络[J].计算机技术与发展,2024,34(8):101-107.

1冯庆汇.“固收+”基金的“盲盒效应”[J].理财周刊,2023(17):40-41.
2周迪,张自力,陈佳,胡新荣,何儒汉,张俊.基于EfficientNetV2和物体上下文表示的胃癌图像分割方法[J].计算机应用,2023,43(9):2955-2962. 被引量：2
3肖宁,肖小娇,强彦,李克勤,李硕,廉建红.基于条件对抗时空编码器的肺部肿瘤纵向预测方法[J].软件学报,2023,34(9):4392-4406.
4陈晓龙,吕善知,张海涛,葛铭.基于数值模拟的调峰辅助服务经济性分析[J].洁净煤技术,2023,29(S02):305-311. 被引量：2
5陈靓影,张凯,杨宗凯.人机交互式孤独症儿童语言能力动态评估研究[J].电化教育研究,2023,44(10):48-53. 被引量：3
6周来,张梦弢.华北落叶松天然林林隙冠层特征对更新的影响[J].西北林学院学报,2023,38(5):67-72. 被引量：1

计算机应用

2023年第10期

浏览历史

内容加载中请稍等...

增广模态收益动态评估方法

参考文献2

二级参考文献7

共引文献11

相关作者

相关机构

相关主题

浏览历史