-
题名基于优势演员-评论家算法的强化自动摘要模型
被引量:6
- 1
-
-
作者
杜嘻嘻
程华
房一泉
-
机构
华东理工大学信息科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第3期699-705,共7页
-
基金
赛尔网络下一代互联网技术创新项目(NGII20170520)。
-
文摘
针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)和循环神经网络(RNN)的混合神经网络的抽取器(extractor)来提取原文关键句;然后,用基于拷贝机制和注意力机制的重写器(rewriter)来精炼关键句;最后,使用强化学习的优势演员-评论家(A2C)算法训练整个网络,把重写摘要和参考摘要的语义相似性(BERTScore值)作为奖励(reward)来指导抽取过程,从而提高抽取器提取句子的质量。在CNN/Daily Mail数据集上的实验结果表明,与基于强化学习的抽取式摘要(Refresh)模型、基于循环神经网络的抽取式摘要序列模型(SummaRuNNer)和分布语义奖励(DSR)模型等模型相比,A2C-RLAS的最终摘要内容更加准确、语言更加流畅,冗余的内容有效减少,且A2C-RLAS的ROUGE和BERTScore指标均有提升。相较于Refresh模型和SummaRuNNer模型,A2C-RLAS模型的ROUGE-L值分别提高了6.3%和10.2%;相较于DSR模型,A2C-RLAS模型的F1值提高了30.5%。
-
关键词
自动摘要模型
抽取式摘要模型
生成式摘要模型
编码器-解码器
强化学习
优势演员-评论家算法
-
Keywords
automatic summary model
extractive summary model
abstractive summary model
encoder-decoder
reinforcement learning
Advantage Actor-Critic(A2C)algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-