期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向汉维机器翻译的调序表重构模型
被引量:
4
1
作者
潘一荣
李晓
+2 位作者
杨雅婷
米成刚
董瑞
《计算机应用》
CSCD
北大核心
2018年第5期1283-1288,共6页
针对词汇化调序模型在机器翻译中存在的上下文无关性及稀疏性问题,提出了基于语义内容进行调序方向及概率预测的调序表重构模型。首先,使用连续分布式表示方法获取调序规则的特征向量;然后,通过循环神经网络(RNN)对于向量化表示的调序...
针对词汇化调序模型在机器翻译中存在的上下文无关性及稀疏性问题,提出了基于语义内容进行调序方向及概率预测的调序表重构模型。首先,使用连续分布式表示方法获取调序规则的特征向量;然后,通过循环神经网络(RNN)对于向量化表示的调序规则进行调序方向及概率预测;最后,过滤并重构调序表,赋予原始调序规则更加合理的调序概率分布值,提高调序模型中调序信息的准确度,同时降低调序表规模,提高后续解码速率。实验结果表明,将调序表重构模型应用至汉维机器翻译任务中,BLEU值可以获得0.39的提升。
展开更多
关键词
汉维机器翻译
调序表重构模型
词汇化调序
语义内容
连续分布式表示
循环神经网络
下载PDF
职称材料
面向维汉机器翻译的层次化多特征融合模型
被引量:
4
2
作者
潘一荣
李晓
+1 位作者
杨雅婷
董瑞
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2020年第2期206-212,共7页
针对维汉机器翻译中存在的维吾尔语(下文简称维语)形态复杂性和数据稀疏性问题,提出了一种层次化融合多个维语语法特征的神经网络机器翻译模型.该模型采用4种特征(词干、词性、词缀、词缀形态)作为源端语言附加信息,用于辅助单一词汇形...
针对维汉机器翻译中存在的维吾尔语(下文简称维语)形态复杂性和数据稀疏性问题,提出了一种层次化融合多个维语语法特征的神经网络机器翻译模型.该模型采用4种特征(词干、词性、词缀、词缀形态)作为源端语言附加信息,用于辅助单一词汇形式表示的维语语句;同时引入层次化多特征融合的神经网络结构,用于分层处理维语的词干级和词缀级特征,以增强机器翻译系统对维语的句法结构和语义知识的学习能力,从而提高维汉机器翻译质量.在维汉公开数据集上的实验结果表明,所提出的层次化多特征融合模型可以有效提高维汉机器翻译系统性能,其双语互译评估(BLEU)值和字符匹配度(ChrF3)值均有明显提升.
展开更多
关键词
维汉机器翻译
形态复杂性
层次化融合
语法特征
附加信息
下载PDF
职称材料
面向汉维机器翻译的双语关联度优化模型
被引量:
2
3
作者
潘一荣
李晓
+1 位作者
杨雅婷
董瑞
《计算机应用研究》
CSCD
北大核心
2020年第3期726-730,共5页
针对汉语—维吾尔语的统计机器翻译系统中存在的语义无关性问题,提出基于神经网络机器翻译方法的双语关联度优化模型。该模型利用注意力机制捕获词对齐信息,引入双语短语间的语义相关性和内部词汇匹配度,预测双语短语的生成概率并将其...
针对汉语—维吾尔语的统计机器翻译系统中存在的语义无关性问题,提出基于神经网络机器翻译方法的双语关联度优化模型。该模型利用注意力机制捕获词对齐信息,引入双语短语间的语义相关性和内部词汇匹配度,预测双语短语的生成概率并将其作为双语关联度,以优化统计翻译模型中的短语翻译得分。在第十一届全国机器翻译研讨会(CWMT 2015)汉维公开机器翻译数据集上的实验结果表明,与基线系统相比,在使用较小规模的训练数据和词汇表的条件下,所提方法可以同时有效地提高短语级别和句子级别的机器翻译任务性能,分别获得最高2.49和0.59的BLEU值提升。
展开更多
关键词
维吾尔语
神经网络机器翻译
注意力机制
词对齐
生成概率
下载PDF
职称材料
基于深度学习的相似语言短文本的语种识别方法
被引量:
1
4
作者
张琳琳
杨雅婷
+2 位作者
陈沾衡
潘一荣
李毓
《计算机应用与软件》
北大核心
2020年第2期124-129,176,共7页
在语种识别中,传统的N-Gram方法对文本长度依赖度高,因而无法有效地对短文本进行语种识别。现有的基于神经网络的模型无法同时考虑词本身信息和词间组合信息,从而降低了短文本语种识别的质量。针对以上问题,提出一种基于深度学习的字符...
在语种识别中,传统的N-Gram方法对文本长度依赖度高,因而无法有效地对短文本进行语种识别。现有的基于神经网络的模型无法同时考虑词本身信息和词间组合信息,从而降低了短文本语种识别的质量。针对以上问题,提出一种基于深度学习的字符级短文本语种识别方法。采用卷积神经网络从字符向量中获取词中字符组合信息;通过长短期记忆网络获取词与词之间的特征信息;使用全连接网络实现相似语言的语种识别。在维吾尔语、哈萨克语以及DSL2017数据集上的实验结果表明,该方法可以有效地提高相似语言短文本的识别精度。
展开更多
关键词
语种识别
相似语言
短文本
神经网络
文本分类
下载PDF
职称材料
题名
面向汉维机器翻译的调序表重构模型
被引量:
4
1
作者
潘一荣
李晓
杨雅婷
米成刚
董瑞
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
出处
《计算机应用》
CSCD
北大核心
2018年第5期1283-1288,共6页
基金
中国科学院西部之光项目(2015-XBQN-B-10)
新疆自治区重大科技专项课题(2016A03007-3)
+1 种基金
新疆自治区重点实验室开放课题(2015KL031)
新疆维吾尔自治区自然科学基金资助项目(2015211B034)~~
文摘
针对词汇化调序模型在机器翻译中存在的上下文无关性及稀疏性问题,提出了基于语义内容进行调序方向及概率预测的调序表重构模型。首先,使用连续分布式表示方法获取调序规则的特征向量;然后,通过循环神经网络(RNN)对于向量化表示的调序规则进行调序方向及概率预测;最后,过滤并重构调序表,赋予原始调序规则更加合理的调序概率分布值,提高调序模型中调序信息的准确度,同时降低调序表规模,提高后续解码速率。实验结果表明,将调序表重构模型应用至汉维机器翻译任务中,BLEU值可以获得0.39的提升。
关键词
汉维机器翻译
调序表重构模型
词汇化调序
语义内容
连续分布式表示
循环神经网络
Keywords
Chinese-Uyghur machine translation
reordering table reconstruction model
lexicalized reordering
semantic content
continuous distributed representation
Recurrent Neural Network (RNN)
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向维汉机器翻译的层次化多特征融合模型
被引量:
4
2
作者
潘一荣
李晓
杨雅婷
董瑞
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2020年第2期206-212,共7页
基金
国家自然科学基金(U1703133)
新疆维吾尔自治区重点实验室开放课题(2018D04018)
+1 种基金
新疆维吾尔自治区高层次人才引进工程项目(Y839031201)
中国科学院青年创新促进会项目(2017472)。
文摘
针对维汉机器翻译中存在的维吾尔语(下文简称维语)形态复杂性和数据稀疏性问题,提出了一种层次化融合多个维语语法特征的神经网络机器翻译模型.该模型采用4种特征(词干、词性、词缀、词缀形态)作为源端语言附加信息,用于辅助单一词汇形式表示的维语语句;同时引入层次化多特征融合的神经网络结构,用于分层处理维语的词干级和词缀级特征,以增强机器翻译系统对维语的句法结构和语义知识的学习能力,从而提高维汉机器翻译质量.在维汉公开数据集上的实验结果表明,所提出的层次化多特征融合模型可以有效提高维汉机器翻译系统性能,其双语互译评估(BLEU)值和字符匹配度(ChrF3)值均有明显提升.
关键词
维汉机器翻译
形态复杂性
层次化融合
语法特征
附加信息
Keywords
Uyghur-Chinese machine translation
complex morphology
hierarchical combination
linguistic features
additional information
分类号
H085 [语言文字—语言学]
下载PDF
职称材料
题名
面向汉维机器翻译的双语关联度优化模型
被引量:
2
3
作者
潘一荣
李晓
杨雅婷
董瑞
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理实验室
出处
《计算机应用研究》
CSCD
北大核心
2020年第3期726-730,共5页
基金
国家自然科学基金资助项目(U1703133)
中科院西部之光项目(2017-XBQNXZ-A-005)
+2 种基金
中国科学院青年创新促进会的资助项目(2017472)
新疆维吾尔自治区重大科技专项项目(2016A03007-3)
新疆维吾尔自治区高层次人才引进工程项目(Y839031201)。
文摘
针对汉语—维吾尔语的统计机器翻译系统中存在的语义无关性问题,提出基于神经网络机器翻译方法的双语关联度优化模型。该模型利用注意力机制捕获词对齐信息,引入双语短语间的语义相关性和内部词汇匹配度,预测双语短语的生成概率并将其作为双语关联度,以优化统计翻译模型中的短语翻译得分。在第十一届全国机器翻译研讨会(CWMT 2015)汉维公开机器翻译数据集上的实验结果表明,与基线系统相比,在使用较小规模的训练数据和词汇表的条件下,所提方法可以同时有效地提高短语级别和句子级别的机器翻译任务性能,分别获得最高2.49和0.59的BLEU值提升。
关键词
维吾尔语
神经网络机器翻译
注意力机制
词对齐
生成概率
Keywords
Uyghur
neural network machine translation
attention mechanism
word alignment
conditional probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习的相似语言短文本的语种识别方法
被引量:
1
4
作者
张琳琳
杨雅婷
陈沾衡
潘一荣
李毓
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆理化技术研究所新疆民族语音语言信息处理实验室
出处
《计算机应用与软件》
北大核心
2020年第2期124-129,176,共7页
基金
国家自然科学基金项目(U1703133)
中科院西部之光项目(2017-XBQNXZ-A-005)
+2 种基金
中国科学院青年创新促进会项目(2017472)
新疆维吾尔自治区重大科技专项(2016A03007-3)
新疆维吾尔自治区高层次人才引进工程项目(Y839031201)。
文摘
在语种识别中,传统的N-Gram方法对文本长度依赖度高,因而无法有效地对短文本进行语种识别。现有的基于神经网络的模型无法同时考虑词本身信息和词间组合信息,从而降低了短文本语种识别的质量。针对以上问题,提出一种基于深度学习的字符级短文本语种识别方法。采用卷积神经网络从字符向量中获取词中字符组合信息;通过长短期记忆网络获取词与词之间的特征信息;使用全连接网络实现相似语言的语种识别。在维吾尔语、哈萨克语以及DSL2017数据集上的实验结果表明,该方法可以有效地提高相似语言短文本的识别精度。
关键词
语种识别
相似语言
短文本
神经网络
文本分类
Keywords
Language identification
Similar language
Short text
Neural network
Text categorization
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向汉维机器翻译的调序表重构模型
潘一荣
李晓
杨雅婷
米成刚
董瑞
《计算机应用》
CSCD
北大核心
2018
4
下载PDF
职称材料
2
面向维汉机器翻译的层次化多特征融合模型
潘一荣
李晓
杨雅婷
董瑞
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2020
4
下载PDF
职称材料
3
面向汉维机器翻译的双语关联度优化模型
潘一荣
李晓
杨雅婷
董瑞
《计算机应用研究》
CSCD
北大核心
2020
2
下载PDF
职称材料
4
基于深度学习的相似语言短文本的语种识别方法
张琳琳
杨雅婷
陈沾衡
潘一荣
李毓
《计算机应用与软件》
北大核心
2020
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部