期刊文献+

带标记音节的双向维汉神经机器翻译方法 被引量:3

Bi-directional Uyghur-Chinese Neural Machine Translation with Marked Syllables
下载PDF
导出
摘要 近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战。针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻译方法。与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,该方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU值,在汉-维机器翻译任务中分别提升5.82与3.09个BLEU值,可见在平行语料不足的条件下,该方法有效地提升了维-汉机器翻译的质量。 In recent years,neural networks have become the mainstream methods used in machine translation,but in the field of low-resource machine translation,parallel corpus shortage and data sparseness remain great challenges.Aiming at the problem of data sparseness caused by insufficient Uyghur-Chinese parallel corpus and complex Uyghur morphology,this paper proposes a neural network method,which is based on the syllable characteristics of Uyghur language,cutting words into syllables,and incorporating the idea of BME(Begin,Middle,End)markup.Compared to the word level and the BPE level,the proposed method improves 7.39 and 3.04 BLEU values respectively in Uyghur-Chinese machine translation tasks,and 5.82 and 3.09 BLEU values respectively in Chinese-Uyghur machine translation.It indicates that under the condition of insufficient parallel corpus,this method can effectively improve the quality of Uyghur-Chinese machine translation.
作者 艾山·吾买尔 斯拉吉艾合麦提·如则麦麦提 西热艾力·海热拉 刘文其 吐尔根·依布拉音 汪烈军 瓦依提·阿不力孜 Hasan Wumaier;Sirajahmat Ruzmamat;Xireaili Hairela;LIU Wenqi;Tuergen Yibulayin;WANG Liejun;Wayit Abulizi(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Xinjiang Laboratory of Multi-language Information Technology,Xinjiang University,Urumqi 830046,China;School of Software,Xinjiang University,Urumqi 830091,China)
出处 《计算机工程与应用》 CSCD 北大核心 2021年第4期161-168,共8页 Computer Engineering and Applications
基金 国家自然科学基金(61662077) 新疆多语种信息技术实验室开放课题(2016D03023) 国家语委项目(ZDI135-54)。
关键词 神经机器翻译 数据稀疏 音节粒度 维汉神经机器翻译 neural machine translation sparse data syllable level Uyghur-Chinese neural machine translation
  • 相关文献

参考文献9

二级参考文献29

共引文献55

同被引文献66

引证文献3

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部