基于语义相关性分析的多模态摘要模型被引量：1

Multi-modal summarization model based on semantic relevance analysis

下载PDF

导出

摘要多模态生成式摘要往往采用序列到序列(Seq2Seq)框架,目标函数在字符级别优化模型,根据局部最优解生成单词,忽略了摘要样本全局语义信息,使得摘要与多模态信息产生语义偏差,容易造成事实性错误。针对上述问题,提出一种基于语义相关性分析的多模态摘要模型。首先,在Seq2Seq框架基础上对多模态摘要进行训练,生成语义多样性的候选摘要;其次,构建基于语义相关性分析的摘要评估器,从全局的角度学习候选摘要之间的语义差异性和真实评价指标ROUGE(Recall-Oriented Understudy for Gisting Evaluation)的排序模式,从而在摘要样本层面优化模型;最后,不依赖参考摘要,利用摘要评估器对候选摘要进行评价,使得选出的摘要与源文本在语义空间中尽可能相似。实验结果表明,在公开数据集MMSS上,相较于MPMSE(Multimodal Pointer-generator via Multimodal Selective Encoding)模型,所提模型在ROUGE-1、ROUGE-2、ROUGE-L评价指标上分别提升了3.17、1.21和2.24个百分点。 Multi-modal abstractive summarization is commonly based on the Sequence-to-Sequence(Seq2Seq)framework,and the objective function optimizes the model at the character level,which searches locally optimal results to generate words and ignores the global semantic information of the summary samples.It may cause a problem of semantic deviation between the summary and multimodal information,resulting in factual errors.In order to solve the above problems,a multi-modal summarization model based on semantic relevance analysis was proposed.Firstly,the summary generator based on Seq2Seq framework was trained to generate candidate summaries with semantic multiplicity.Secondly,a summary evaluator based on semantic relevance analysis was applied to learn the semantic differences among candidate summaries and the evaluation mode of ROUGE(Recall-Oriented Understudy for Gisting Evaluation)from a global perspective,so that the model could be optimized at the level of summary samples.Finally,the summary evaluator was used to carry out reference-free evaluation of the candidate summaries,making the finally selected summary sample as similar as possible to the source text in semantic space.Experiments on benchmark dataset MMSS show that the proposed model can improve the evaluation indexes of ROUGE-1,ROUGE-2 and ROUGE-L by 3.17,1.21 and 2.24 percentage points respectively compared with the current optimal MPMSE(Multimodal Pointer-generator via Multimodal Selective Encoding)model.

作者林于翔吴运兵阴爱英廖祥文 LIN Yuxiang;WU Yunbing;YIN Aiying;LIAO Xiangwen(College of Computer and Data Science,Fuzhou University,Fuzhou Fujian 350108,China;Digital Fujian Institute of Financial Big Data,Fuzhou Fujian 350108,China;Department of Computer Engineering,Zhicheng College of Fuzhou University,Fuzhou Fujian 350002,China)

机构地区福州大学计算机与大数据学院数字福建金融大数据研究所福州大学至诚学院计算机工程系

出处《计算机应用》 CSCD 北大核心 2024年第1期65-72,共8页 journal of Computer Applications

基金国家自然科学基金资助项目(61976054) 福建省自然科学基金资助项目(2022J01116)。

关键词多模态生成式摘要序列到序列事实性错误语义相关性 multi-modal abstractive summarization Sequence-to-Sequence(Seq2Seq) factual error semantic relevance

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1蔡中祥,孙建伟.融合指针网络的新闻文本摘要模型[J].小型微型计算机系统,2021,42(3):462-466. 被引量：14

二级参考文献2

1杨宏志,庞宇,王慧倩.基于改进Faster R-CNN的自然场景文字检测算法[J].重庆邮电大学学报（自然科学版）,2019,31(6):876-884. 被引量：19
2徐如阳,曾碧卿,韩旭丽,周武.卷积自注意力编码过滤的强化自动摘要模型[J].小型微型计算机系统,2020,41(2):271-277. 被引量：2

共引文献13

1黄敏,闫思贤.基于NewTF-IDF的新闻文本特征提取算法研究[J].湖北民族大学学报（自然科学版）,2021,39(2):187-192. 被引量：6
2井钰,王名扬,周文远.基于BBCM-TextRank的文本摘要提取算法研究[J].东北师大学报（自然科学版）,2022,54(3):67-75.
3刘高军,王一如,王昊.基于BERTScore指导的文本摘要技术[J].电子设计工程,2022,30(23):1-5.
4门鼎,陈亮.基于改进Seq2Seq-Attention模型的文本摘要生成方法[J].电子设计工程,2022,30(23):6-10. 被引量：2
5曾昭霖,严馨,徐广义,陈玮,邓忠莹.基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法[J].小型微型计算机系统,2023,44(1):185-192. 被引量：6
6郭继峰,费禹潇,孙文博,谢培浇,张健.一种融合主题的PGN-GAN文本摘要模型[J].小型微型计算机系统,2023,44(1):199-203. 被引量：1
7赵伟,王文娟,任彦凝,刘群,胥钟予,彭露.基于改进Transformer的生成式文本摘要模型[J].重庆邮电大学学报（自然科学版）,2023,35(1):185-192. 被引量：6
8龚永罡,郭远南.基于TF-IDF和word2Vec的中文文本自动摘要模型[J].中国新通信,2023,25(2):65-67. 被引量：5
9王灿宇,孙晓海,吴叶辉,季荣彪,李亚东,张少如,杨士豪.基于Deep Q-Learning的抽取式摘要生成方法[J].吉林大学学报（信息科学版）,2023,41(2):306-314.
10赵冠博,张勇丙,毛存礼,高盛祥,王奉孝.融入领域知识的跨境民族文化生成式摘要方法[J].南京大学学报（自然科学版）,2023,59(4):620-628. 被引量：1

同被引文献28

1王飞跃,王艳芬,陈薏竹,田永林,齐红威,王晓,张卫山,张俊,袁勇.联邦生态:从联邦数据到联邦智能[J].智能科学与技术学报,2020,2(4):305-311. 被引量：29
2吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
3康孟珍,王秀娟,华净,王浩宇,王飞跃.平行农业:迈向智慧农业的智能技术[J].智能科学与技术学报,2019,0(2):107-117. 被引量：29
4王飞跃.人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J].复杂系统与复杂性科学,2004,1(4):25-35. 被引量：234
5王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：332
6杨林瑶,陈思远,王晓,张俊,王成红.数字孪生与平行系统:发展现状、对比及展望[J].自动化学报,2019,45(11):2001-2031. 被引量：180
7张俊,许沛东,王飞跃.平行系统和数字孪生的一种数据驱动形式表示及计算框架[J].自动化学报,2020,46(7):1346-1356. 被引量：17
8张晓东,许丹丹,王良,梁弘,吕宜生,王飞跃.基于复杂系统理论的平行城市模型架构与计算方法[J].指挥与控制学报,2021,7(1):28-37. 被引量：10
9王春法,王飞跃,鲁越,李华飙,郭超.平行博物馆:新时代博物馆运营的智能管理与控制[J].智能科学与技术学报,2021,3(2):125-136. 被引量：10
10王飞跃.数字医生与平行医疗:从医疗知识自动化到系统化智能医学[J].协和医学杂志,2021,12(6):829-833. 被引量：24

引证文献1

1张腾超,田永林,林飞,倪清桦,宋平,戴星原,李娟娟,伍乃騏,Timothy J.Lee,王飞跃.平行旅游:基础智能驱动的智慧出游服务[J].智能科学与技术学报,2024,6(2):164-178.

1秦涛,杜尚恒,常元元,王晨旭.ChatGPT的工作原理、关键技术及未来发展趋势[J].西安交通大学学报,2024,58(1):1-12. 被引量：18
2徐涛,赵星甲,卢敏.基于词-主题-文本异质网络的短文本分类方法[J].计算机应用与软件,2024,41(1):146-152.
3陈佳,张鸿.基于特征增强和语义相关性匹配的图像文本检索方法[J].计算机应用,2024,44(1):16-23. 被引量：1
4赵强,王中卿,王红玲.融合多模态信息的产品摘要抽取模型[J].计算机应用,2024,44(1):73-78.
5马奔峰.基于乡土研学活动的地理综合思维培养[J].亚太教育,2024(1):10-12.
6朱志平,杨燕,王杰.基于场景图感知的跨模态图像描述模型[J].计算机应用,2024,44(1):58-64.
7高峰,杨梓航,候进,顾进广,程军军.面向反恐安全领域的中文阅读理解数据集构建与评测[J].数据分析与知识发现,2023,7(10):131-143.
8蔡雁姬.功能对等视域下景区标识语英译策略研究——以涠洲岛景区为例[J].文化创新比较研究,2023,7(36):22-25.
9Rui Wang,Zhiming Zhou,Kaiwen Li,Tao Zhang,Ling Wang,Xin Xu,Xiangke Liao.Learning to Branch in Combinatorial Optimization With Graph Pointer Networks[J].IEEE/CAA Journal of Automatica Sinica,2024,11(1):157-169.

计算机应用

2024年第1期

浏览历史

内容加载中请稍等...

基于语义相关性分析的多模态摘要模型被引量：1

参考文献1

二级参考文献2

共引文献13

同被引文献28

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语义相关性分析的多模态摘要模型 被引量：1

参考文献1

二级参考文献2

共引文献13

同被引文献28

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语义相关性分析的多模态摘要模型被引量：1