期刊文献+

多语种网站平行语料采集与对齐研究 被引量:1

Research on Parallel Corpus Collection and Alignment of Multilingual Websites
下载PDF
导出
摘要 丰富的平行语料库对提升机器翻译准确度意义重大,然而目前研究中缺乏有效的平行语料获取方法,本文提出一种从多语种网站中自动获取平行语料的方法,并且通过6个多语种网站的平行语料采集和对齐研究,验证通过多语种网站获取大规模平行语料具有较高的可行性,这说明通过多语种网站获取大规模平行语料具有较高的可行性。 Rich in parallel corpus is of great significance to improve accuracy of machine translation,however,the lack of effective parallel corpora in the present study method,this paper proposes a parallel corpus was obtained from the multilingual website automatic method,and through six multilingual website aligned parallel corpus collection and research,validation through multilingual site access to large-scale parallel corpus has the high feasibility,it shows that through multilingual website for large-scale parallel corpus has high feasibility.
作者 刘佳雨 程南昌 LIU Jia-yu;CHEN Nan-chang(Internet Information Research Insitude,Communication University of China,Beijing 100024;National Broadcast Media Language Resources Monitoring&Research Center,Communication University of China,Beijing 100024)
出处 《数字技术与应用》 2020年第9期214-217,共4页 Digital Technology & Application
关键词 多语种 新闻网站 平行语料 篇章对齐 机器翻译 multilingual news website parallel corpus the paper-level alignmen machine translation
  • 相关文献

参考文献4

二级参考文献57

同被引文献15

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部