基于孪生网络文本语义匹配的多文档摘要

Siamese Network-Based Text Semantic Matching for Multi-Document Summarization

下载PDF

导出

摘要多文档摘要旨在从一组主题相关的文档集中抽取出最能代表文档集中心内容的句子作为摘要,文本语义匹配则是指学习两个文本单元之间的语义关系,使句子表征具有更加丰富的语义信息。该文提出了一种基于孪生网络文本语义匹配的多文档抽取式摘要方法,该方法将孪生网络和预训练语言模型BERT相结合,构建一个文本语义匹配与文本摘要联合学习模型。该模型运用孪生网络从不同的视角考察任意两个文本单元之间的语义关联,学习文档集中碎片化的信息,进一步对重要信息进行评估,最后结合文本摘要模型选择出更能代表文档集主要内容的句子组织成摘要。实验结果表明,该文所提方法和当前主流的多文档抽取式摘要方法相比,在ROUGE评价指标上有较大提升。 Multi-document summarization aims to extract the sentences as a summary to best represents the central content of the document set.Text semantic matching refers to learning the semantic relationship between two text units,so that the sentence representation has richer semantic information.This paper proposes a siamese network based text semantic matching for multi-document extraction summarization.This method combines siamese network and pre-training model BERT to construct a joint learning model of text semantic matching and text summarization.The model uses the twin network to examine the semantic association between any two text units from different perspectives,learns the fragmented information in the document set,and finally combines the text summary model to select the main content of the document set.The experimental results show that compared with the current mainstream multi-document extractive summarization method,this method has a substantial improvement in the ROUGE index.

作者钟琪王中卿王红玲 ZHONG Qi;WANG Zhongqing;WANG Hongling(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2024年第5期107-116,共10页 Journal of Chinese Information Processing

基金国家自然科学基金(61976146)。

关键词多文档抽取式摘要语义关系预训练语言模型 multi-document extractive summarization semantic relation pre-training language model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1丁一,王中卿.结合预训练的多文档摘要:研究[J].计算机科学,2024,51(S01):174-181.
2宝日彤,曾淼瑞,孙海春.引入主题节点的异构图舆情摘要方法[J].科学技术与工程,2024,24(23):9965-9972.
3李峻峰.城市地标的集体记忆分析与应用——以合肥市逍遥津公园大象滑梯为例[J].沈阳建筑大学学报（社会科学版）,2024,26(3):217-224.
4黄康.基于网络文本分析的赤壁古战场旅游形象感知研究[J].江苏商论,2024(9):51-54.
5席铁钧,段宗涛,曹建荣,杨博,卜娜娜,刘悦霞,肖媛媛.面向长文本涉法舆情信息的混合式摘要方法[J].中文信息学报,2024,38(7):63-72.
6袁宁.建筑工程管理专业实训教学中建筑实体模型的运用[J].中文科技期刊数据库（全文版）教育科学,2024(9):0157-0160.
7贺妮,牟莉,万晓慧.引入位置编码机制对抗网络的文本生成模型[J].计算机技术与发展,2024,34(9):154-158.
8宋文辉.现代汉语所谓非宾格-非作格动词分类的性质[J].当代语言学,2023,25(6):810-829.
9张念晨.基于系统思维的产品设计模型构建[J].美术教育研究,2024(15):83-86.
10吴旭聪.推进模型建构能力螺旋上升的策略[J].湖北教育,2024(16):66-69.

中文信息学报

2024年第5期

浏览历史

内容加载中请稍等...

基于孪生网络文本语义匹配的多文档摘要

相关作者

相关机构

相关主题

浏览历史