-
题名基于对比注意力机制的跨语言句子摘要系统
被引量:8
- 1
-
-
作者
殷明明
史小静
俞鸿飞
段湘煜
-
机构
苏州大学自然语言处理实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第5期86-93,共8页
-
基金
国家自然科学基金(61673289)
国家重点研发计划政府间国际科技创新合作重点专项(2016YFE0132100)。
-
文摘
当今句子摘要研究主要针对单语,即源端句子和目标端摘要短语属于同种语言,然而单语句子摘要严重制约了不同语言文本信息的快速获取。为解决该问题,提出一种跨语言句子摘要系统。借鉴回译思想,将单语句子摘要平行语料中的源端通过神经机器翻译系统翻译成另一种语言,将其与句子摘要平行语料中目标端的摘要短语共同构成跨语言的伪平行语料。在此基础上,利用对比注意力机制,实现目标端与源端序列中不相关信息的获取,解决了传统注意力机制中源端和目标端句子长度不匹配的问题。实验结果表明,与基于管道方法的单语句子摘要系统相比,该跨语言系统生成的摘要短语更流畅且符合人类语言表述方式,可达到接近单语的句子摘要水平。
-
关键词
跨语言句子摘要
平行语料
伪语料
对比注意力机制
管道方法
-
Keywords
cross-lingual sentence summarization
parallel corpus
pseudo corpus
contrastive attention mechanism
pipeline method
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-