期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于变系数词性空间权值定义的英文句子相似度算法研究 被引量:1
1
作者 黄贤英 张金鹏 +1 位作者 赵明军 刘英涛 《计算机应用研究》 CSCD 北大核心 2015年第4期996-999,共4页
对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间... 对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间相似度协同运算。将改进的文本相似度算法运用于微软研究院释义语料库上,实验结果表明,改进的文本相似度算法使得文本相似度计算的准确率和稳定性有了较大的提高。 展开更多
关键词 Word Net语义词典 词项语义空间映射 可变词性空间权值 词项词频 句子相似度算法
下载PDF
基于多语言联合训练的汉-英-缅神经机器翻译方法 被引量:13
2
作者 满志博 毛存礼 +3 位作者 余正涛 李训宇 高盛祥 朱俊国 《清华大学学报(自然科学版)》 CSCD 北大核心 2021年第9期927-935,共9页
多语言神经机器翻译是解决低资源语言翻译的有效方法,现有方法通常依靠共享词表的方式解决英语、法语以及德语等相似语言之间的多语言翻译问题。缅甸语属于典型的低资源语言。汉语、英语以及缅甸语之间的语言结构差异较大。为了缓解由... 多语言神经机器翻译是解决低资源语言翻译的有效方法,现有方法通常依靠共享词表的方式解决英语、法语以及德语等相似语言之间的多语言翻译问题。缅甸语属于典型的低资源语言。汉语、英语以及缅甸语之间的语言结构差异较大。为了缓解由差异性引起的共享词表大小受限制问题,该文提出一种基于多语言联合训练的汉英缅神经机器翻译方法。在Transformer框架下将丰富的汉英平行语料与较少的汉缅、英缅语料进行联合训练,模型训练过程中分别在编码端和解码端将汉英缅映射在同一语义空间以降低汉英缅语言结构差异性对共享词表的影响,通过共享汉英语料训练参数来弥补汉缅、英缅语料缺失的问题。实验结果表明:在一对多、多对多的翻译场景下,所提方法的BLEU值比基线模型的汉英、英缅以及汉缅翻译结果有明显提升。 展开更多
关键词 汉语-英语-缅甸语 低资源语言 多语言神经机器翻译 联合训练 语义空间映射 共享参数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部