-
题名融合机器翻译与复述生成的手语文本生成方法
- 1
-
-
作者
李世炜
侯霞
汪良果
-
机构
北京信息科技大学计算机学院
-
出处
《北京信息科技大学学报(自然科学版)》
2023年第2期75-81,共7页
-
基金
北京市自然科学基金青年项目(4224090)。
-
文摘
针对手语生成中源语言和目标语言是同类语言的特殊性,提出一种融合机器翻译方法与复述生成方法的两阶段中文手语文本生成方法。首先,通过机器翻译方法生成包含一定语义信息的结果,为了增加关键词的影响力,此阶段在多语言双向和自回归转换器(multilingual bidirectional and auto-regressive transformers, mBART)模型中增加了注意力层;然后,使用复述生成方法对上一阶段结果进行修正。为了使模型更适用于中文文本生成,对质量控制转述生成(quality controlled paraphrase generation, QCPG)模型中的词法评价指标进行了优化,帮助模型获得更加准确的单词语义分布。实验结果显示,相比基线模型,提出的两阶段模型在手语生成任务上的BLEU、ROUGE指标都有所提升。
-
关键词
机器翻译
复述生成
手语生成
质量控制生成
自注意力
-
Keywords
machine translation
paraphrase generation
sign language generation
quality controlled generation
self-attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-