-
题名基于话题翻译模型的双语文本纠错
被引量:1
- 1
-
-
作者
陈欢
张奇
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
CSCD
2016年第3期284-287,共4页
-
文摘
近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语言处理任务之前对文本进行预处理显得尤为重要。面对网络文本语义空间双语对齐语料的匮乏,提出一种基于话题翻译模型的方法,利用不同语义空间的语料计算网络文本语义空间的双语对齐概率,再结合神经网络语言模型将网络混合文本中的英文翻译成对应中文。实验在人工标注的测试语料上进行,实验结果表明,通过不同的对比试验证明文中的方法是有效的,能提升翻译正确率。
-
关键词
网络文本
话题翻译模型
神经网络语言模型
-
Keywords
Network text
Topics translation model
Neural network language model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-