-
题名使用词对齐半监督对抗学习的汉越跨语言摘要生成方法
被引量:3
- 1
-
-
作者
王剑
张莹
余正涛
黄于欣
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第5期992-997,共6页
-
基金
国家重点研发计划项目(2018YFC0830105,2018YFC0830101,2018YFC0830100)资助
国家自然科学基金项目(61972186,61762056,61472168)资助
+1 种基金
云南省重大科技专项计划项目(202002AD080001)资助
云南省高新技术产业专项(201606)资助。
-
文摘
是将输入的源语言文本生成目标语言摘要的过程.目前跨语言摘要任务大多是借助于机器翻译,而针对越南语这类低资源语言,机器翻译效果不佳是汉越跨语言摘要面临的挑战.针对该问题,提出了一种基于词对齐的半监督对抗学习汉越跨语言摘要生成方法,其思想是将汉越双语对齐到同一空间,得到对齐的双语特征,然后同时利用双语特征生成跨语言摘要.具体来讲,基于编解码框架,首先利用Bert编码器分别对输入的汉越文本进行向量表征;然后基于汉越双语词典的半监督对抗学习方法,实现双语词向量在同一语义空间对齐;最后基于注意力机制同时关注双语上下文向量,解码得到目标语言摘要.在收集的汉越摘要数据集上的实验结果表明,该方法可以有效提升汉越跨语言摘要模型的性能.
-
关键词
跨语言摘要
Bert
半监督对抗学习
词对齐
-
Keywords
cross-lingual summarization
Bert
semi-supervised adversarial
word alignment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-