期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于变系数词性空间权值定义的英文句子相似度算法研究
被引量:
1
1
作者
黄贤英
张金鹏
+1 位作者
赵明军
刘英涛
《计算机应用研究》
CSCD
北大核心
2015年第4期996-999,共4页
对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间...
对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间相似度协同运算。将改进的文本相似度算法运用于微软研究院释义语料库上,实验结果表明,改进的文本相似度算法使得文本相似度计算的准确率和稳定性有了较大的提高。
展开更多
关键词
Word
Net
语义
词典
词项
语义空间映射
可变词性
空间
权值
词项词频
句子相似度算法
下载PDF
职称材料
基于多语言联合训练的汉-英-缅神经机器翻译方法
被引量:
13
2
作者
满志博
毛存礼
+3 位作者
余正涛
李训宇
高盛祥
朱俊国
《清华大学学报(自然科学版)》
CSCD
北大核心
2021年第9期927-935,共9页
多语言神经机器翻译是解决低资源语言翻译的有效方法,现有方法通常依靠共享词表的方式解决英语、法语以及德语等相似语言之间的多语言翻译问题。缅甸语属于典型的低资源语言。汉语、英语以及缅甸语之间的语言结构差异较大。为了缓解由...
多语言神经机器翻译是解决低资源语言翻译的有效方法,现有方法通常依靠共享词表的方式解决英语、法语以及德语等相似语言之间的多语言翻译问题。缅甸语属于典型的低资源语言。汉语、英语以及缅甸语之间的语言结构差异较大。为了缓解由差异性引起的共享词表大小受限制问题,该文提出一种基于多语言联合训练的汉英缅神经机器翻译方法。在Transformer框架下将丰富的汉英平行语料与较少的汉缅、英缅语料进行联合训练,模型训练过程中分别在编码端和解码端将汉英缅映射在同一语义空间以降低汉英缅语言结构差异性对共享词表的影响,通过共享汉英语料训练参数来弥补汉缅、英缅语料缺失的问题。实验结果表明:在一对多、多对多的翻译场景下,所提方法的BLEU值比基线模型的汉英、英缅以及汉缅翻译结果有明显提升。
展开更多
关键词
汉语-英语-缅甸语
低资源语言
多语言神经机器翻译
联合训练
语义空间映射
共享参数
原文传递
题名
基于变系数词性空间权值定义的英文句子相似度算法研究
被引量:
1
1
作者
黄贤英
张金鹏
赵明军
刘英涛
机构
重庆理工大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2015年第4期996-999,共4页
基金
国家自然科学基金资助项目(61173184)
重庆市教委科技计划资助项目(KJ100821)
重庆理工大学研究生创新基金资助项目(YCX2012317)
文摘
对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间相似度协同运算。将改进的文本相似度算法运用于微软研究院释义语料库上,实验结果表明,改进的文本相似度算法使得文本相似度计算的准确率和稳定性有了较大的提高。
关键词
Word
Net
语义
词典
词项
语义空间映射
可变词性
空间
权值
词项词频
句子相似度算法
Keywords
Word Net semantic library
term semantic space mapping
changing weight of part of speech space
term frequen-cy
sentence similarity algorithm
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多语言联合训练的汉-英-缅神经机器翻译方法
被引量:
13
2
作者
满志博
毛存礼
余正涛
李训宇
高盛祥
朱俊国
机构
昆明理工大学信息工程与自动化学院
出处
《清华大学学报(自然科学版)》
CSCD
北大核心
2021年第9期927-935,共9页
基金
国家自然科学基金重点项目(61732005)
国家自然科学基金项目(61662041,61761026,61866019,61972186)
+1 种基金
云南省应用基础研究计划重点项目(2019FA023)
云南省中青年学术和技术带头人后备人才项目(2019HB006)。
文摘
多语言神经机器翻译是解决低资源语言翻译的有效方法,现有方法通常依靠共享词表的方式解决英语、法语以及德语等相似语言之间的多语言翻译问题。缅甸语属于典型的低资源语言。汉语、英语以及缅甸语之间的语言结构差异较大。为了缓解由差异性引起的共享词表大小受限制问题,该文提出一种基于多语言联合训练的汉英缅神经机器翻译方法。在Transformer框架下将丰富的汉英平行语料与较少的汉缅、英缅语料进行联合训练,模型训练过程中分别在编码端和解码端将汉英缅映射在同一语义空间以降低汉英缅语言结构差异性对共享词表的影响,通过共享汉英语料训练参数来弥补汉缅、英缅语料缺失的问题。实验结果表明:在一对多、多对多的翻译场景下,所提方法的BLEU值比基线模型的汉英、英缅以及汉缅翻译结果有明显提升。
关键词
汉语-英语-缅甸语
低资源语言
多语言神经机器翻译
联合训练
语义空间映射
共享参数
Keywords
Chinese-English-Burmese
low resource language
multilingual neural machine translation
joint training
semantic space mapping
shared parameters
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于变系数词性空间权值定义的英文句子相似度算法研究
黄贤英
张金鹏
赵明军
刘英涛
《计算机应用研究》
CSCD
北大核心
2015
1
下载PDF
职称材料
2
基于多语言联合训练的汉-英-缅神经机器翻译方法
满志博
毛存礼
余正涛
李训宇
高盛祥
朱俊国
《清华大学学报(自然科学版)》
CSCD
北大核心
2021
13
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部