-
题名基于异构图分层学习的细粒度多文档摘要抽取
- 1
-
-
作者
翁裕源
许柏炎
蔡瑞初
-
机构
广东工业大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第3期336-344,共9页
-
基金
科技创新2030—“新一代人工智能”重大项目(2021ZD0111501)
国家优秀青年科学基金(62122022)
国家自然科学基金(61876043,61976052,62206064)。
-
文摘
抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。
-
关键词
抽取式多文档摘要
细粒度建模
异构图
分层学习
语义关系
结构关系
-
Keywords
extractive multi-document summarization
fine-grained modeling
heterogeneous graph
hierarchical learning
semantic relation
structural relation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于孪生网络文本语义匹配的多文档摘要
- 2
-
-
作者
钟琪
王中卿
王红玲
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第5期107-116,共10页
-
基金
国家自然科学基金(61976146)。
-
文摘
多文档摘要旨在从一组主题相关的文档集中抽取出最能代表文档集中心内容的句子作为摘要,文本语义匹配则是指学习两个文本单元之间的语义关系,使句子表征具有更加丰富的语义信息。该文提出了一种基于孪生网络文本语义匹配的多文档抽取式摘要方法,该方法将孪生网络和预训练语言模型BERT相结合,构建一个文本语义匹配与文本摘要联合学习模型。该模型运用孪生网络从不同的视角考察任意两个文本单元之间的语义关联,学习文档集中碎片化的信息,进一步对重要信息进行评估,最后结合文本摘要模型选择出更能代表文档集主要内容的句子组织成摘要。实验结果表明,该文所提方法和当前主流的多文档抽取式摘要方法相比,在ROUGE评价指标上有较大提升。
-
关键词
多文档抽取式摘要
语义关系
预训练语言模型
-
Keywords
multi-document extractive summarization
semantic relation
pre-training language model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-