期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于树到串模型强化的层次短语机器翻译解码方法
被引量:
5
1
作者
肖桐
朱靖波
《计算机学报》
EI
CSCD
北大核心
2016年第4期808-821,共14页
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并...
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果.
展开更多
关键词
统计机器翻译
层次短语模型
树到串
模型
规则抽取
解码
社会媒体
社交网络
自然语言处理
机器翻译
下载PDF
职称材料
模糊匹配在树到串翻译模型中的应用
被引量:
1
2
作者
熊皓
刘洋
刘群
《中文信息学报》
CSCD
北大核心
2011年第2期66-71,共6页
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则...
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。
展开更多
关键词
树
核
树到串
翻译模型
统计机器翻译
模糊匹配
下载PDF
职称材料
基于树到串模型强化的神经机器翻译模型构建
被引量:
3
3
作者
邹德芳
胡秦斌
《计算机仿真》
北大核心
2021年第2期344-347,476,共5页
针对传统模型无法有效处理不同语言的差异性,出现源语言语法信息丢失、翻译内容欠佳的问题,构建出一种基于树到串模型强化的神经机器翻译模型。获取传统神经机器翻译模型的解码器与编码器的工作原理与运行流程,采用源句法分析树、目标...
针对传统模型无法有效处理不同语言的差异性,出现源语言语法信息丢失、翻译内容欠佳的问题,构建出一种基于树到串模型强化的神经机器翻译模型。获取传统神经机器翻译模型的解码器与编码器的工作原理与运行流程,采用源句法分析树、目标串和源端与目标端文本串之间的对齐信息等模块,架构树到串强化模型,利用GHKM算法提取翻译规则优化目标函数,依据词汇和短语的有机结合与结构化信息的提取能力,赋予语句带有规则的结构化信息,最终通过解码器与神经网络单元的组成,实现神经机器翻译模型的创建。仿真结果证明,所提模型可以极大程度抑制句长的影响,具有理想的句子敏感性,且翻译效率较好。
展开更多
关键词
树到串
模型
神经机器翻译
树
搜索算法
编码器
解码器
下载PDF
职称材料
融合格框架的基于语块的依存树到串日汉统计机器翻译模型
被引量:
1
4
作者
吴培昊
徐金安
+1 位作者
谢军
张玉洁
《中文信息学报》
CSCD
北大核心
2014年第5期133-140,161,共9页
该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,...
该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,实现格框架与日汉依存树到串模型的融合。实验结果表明,该文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,同时,还可有效提高日汉统计机器翻译的译文质量。
展开更多
关键词
日汉机器翻译
格框架
依存
树到串
模型
句法结构
下载PDF
职称材料
融合词法句法分析联合模型的树到串EBMT方法
5
作者
王丹丹
徐金安
+2 位作者
陈钰枫
张玉洁
杨晓晖
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第2期295-304,共10页
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了...
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了提高翻译精度,引入中文分词、词性标注和依存句法分析联合模型,可以减少汉英EBMT中源语言端基础任务中的错误传递,提高提取层次间特征的准确性。在此基础上,结合依存结构的特征和中英语料的特性,对依存树到串模型进行规则抽取以及泛化处理。实验结果表明,相对于基线系统,该方法可以提高实例对抽取质量,改善泛化规则和译文质量,提高系统性能。
展开更多
关键词
基于实例的机器翻译
依存
树到串
模型
联合模型
泛化模板
下载PDF
职称材料
依存树到串模型中引入双语短语的三种方法
6
作者
谢军
刘群
《中文信息学报》
CSCD
北大核心
2014年第2期44-50,共7页
依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合...
依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合现象易于由短语捕捉。为了更好地改善依存树到串模型的性能,本文提出了三种引入双语短语的方法,分别为引入句法短语、引入泛化句法短语及引入非句法短语。实验结果表明,同时使用句法短语、泛化句法短语及非句法短语时,可以将依存树到串模型的性能显著提高约1.0BLEU值。
展开更多
关键词
统计机器翻译
依存
树到串
模型
泛化句法短语
非句法短语
下载PDF
职称材料
基于句法的统计机器翻译综述
被引量:
13
7
作者
熊德意
刘群
林守勋
《中文信息学报》
CSCD
北大核心
2008年第2期28-39,共12页
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,...
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。
展开更多
关键词
人工智能
机器翻译
统计机器翻译
基于句法的统计机器翻译
树到串
树到
树
依存语法
下载PDF
职称材料
基于统计的汉藏机器翻译系统关键技术研究与实现
被引量:
5
8
作者
群诺
尼玛扎西
+1 位作者
完么扎西
嘎玛扎西
《高原科学研究》
2018年第2期97-104,共8页
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理...
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。
展开更多
关键词
汉藏机器翻译
调序算法
树到串
翻译模型
自动分词与标注
下载PDF
职称材料
题名
基于树到串模型强化的层次短语机器翻译解码方法
被引量:
5
1
作者
肖桐
朱靖波
机构
东北大学信息科学与工程学院
出处
《计算机学报》
EI
CSCD
北大核心
2016年第4期808-821,共14页
基金
国家自然科学基金(61300097
61272376
+1 种基金
61432013)
中国博士后科学基金(2013M530131)资助
文摘
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果.
关键词
统计机器翻译
层次短语模型
树到串
模型
规则抽取
解码
社会媒体
社交网络
自然语言处理
机器翻译
Keywords
statistical machine translation
hierarchical phrase-based model
tree-to-string model
rule extraction
decoding
social media
social networks
natural language processing
machine translation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
模糊匹配在树到串翻译模型中的应用
被引量:
1
2
作者
熊皓
刘洋
刘群
机构
中国科学院计算技术研究所智能信息处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2011年第2期66-71,共6页
基金
国家自然科学基金重点资助项目(60736014)
国家863计划重点资助项目(2006AA010108)
文摘
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。
关键词
树
核
树到串
翻译模型
统计机器翻译
模糊匹配
Keywords
tree kernel
tree-to-string model
statistical machine translation
fuzzy matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于树到串模型强化的神经机器翻译模型构建
被引量:
3
3
作者
邹德芳
胡秦斌
机构
广西中医药大学
南宁师范大学计算机与信息工程学院
出处
《计算机仿真》
北大核心
2021年第2期344-347,476,共5页
基金
2019年教育部人文社会科学研究一般项目(19YJA740089)。
文摘
针对传统模型无法有效处理不同语言的差异性,出现源语言语法信息丢失、翻译内容欠佳的问题,构建出一种基于树到串模型强化的神经机器翻译模型。获取传统神经机器翻译模型的解码器与编码器的工作原理与运行流程,采用源句法分析树、目标串和源端与目标端文本串之间的对齐信息等模块,架构树到串强化模型,利用GHKM算法提取翻译规则优化目标函数,依据词汇和短语的有机结合与结构化信息的提取能力,赋予语句带有规则的结构化信息,最终通过解码器与神经网络单元的组成,实现神经机器翻译模型的创建。仿真结果证明,所提模型可以极大程度抑制句长的影响,具有理想的句子敏感性,且翻译效率较好。
关键词
树到串
模型
神经机器翻译
树
搜索算法
编码器
解码器
Keywords
Tree-to-string model
Neural machine translation
Tree search algorithm
Encoder
Decoder
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合格框架的基于语块的依存树到串日汉统计机器翻译模型
被引量:
1
4
作者
吴培昊
徐金安
谢军
张玉洁
机构
北京交通大学计算机与信息技术学院
三星中国通信研究院
出处
《中文信息学报》
CSCD
北大核心
2014年第5期133-140,161,共9页
基金
国家自然科学基金(61370130)
国家国际科技合作专项资助(No.2014DFA11350)
北京交通大学人才基金(2011RC034)
文摘
该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,实现格框架与日汉依存树到串模型的融合。实验结果表明,该文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,同时,还可有效提高日汉统计机器翻译的译文质量。
关键词
日汉机器翻译
格框架
依存
树到串
模型
句法结构
Keywords
Japanese to Chinese SMT
case frame
dependency-to-string model
syntax structure
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合词法句法分析联合模型的树到串EBMT方法
5
作者
王丹丹
徐金安
陈钰枫
张玉洁
杨晓晖
机构
北京交通大学计算机与信息技术学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第2期295-304,共10页
基金
国家自然科学基金(61370130
61473294)
+1 种基金
中央高校基本科研业务费专项资金(2014RC040)
科学技术部国际科技合作计划(K11F100010)资助
文摘
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了提高翻译精度,引入中文分词、词性标注和依存句法分析联合模型,可以减少汉英EBMT中源语言端基础任务中的错误传递,提高提取层次间特征的准确性。在此基础上,结合依存结构的特征和中英语料的特性,对依存树到串模型进行规则抽取以及泛化处理。实验结果表明,相对于基线系统,该方法可以提高实例对抽取质量,改善泛化规则和译文质量,提高系统性能。
关键词
基于实例的机器翻译
依存
树到串
模型
联合模型
泛化模板
Keywords
example-based machine translation
dependency tree-to-string model
joint model
generalization template
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
依存树到串模型中引入双语短语的三种方法
6
作者
谢军
刘群
机构
中国科学院计算技术研究所
出处
《中文信息学报》
CSCD
北大核心
2014年第2期44-50,共7页
基金
国家自然科学基金重点项目(60736014)
国家自然科学基金项目(60873167
+1 种基金
90920004)
863重点项目(2011AA01A207)
文摘
依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合现象易于由短语捕捉。为了更好地改善依存树到串模型的性能,本文提出了三种引入双语短语的方法,分别为引入句法短语、引入泛化句法短语及引入非句法短语。实验结果表明,同时使用句法短语、泛化句法短语及非句法短语时,可以将依存树到串模型的性能显著提高约1.0BLEU值。
关键词
统计机器翻译
依存
树到串
模型
泛化句法短语
非句法短语
Keywords
statistical machine translation
Dependency-to-String Model
generalized syntactic bilingual phrases
non-syntactic bilingual phrases
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于句法的统计机器翻译综述
被引量:
13
7
作者
熊德意
刘群
林守勋
机构
中国科学院计算技术研究所
出处
《中文信息学报》
CSCD
北大核心
2008年第2期28-39,共12页
基金
国家自然科学基金资助项目(60573188)
国家863计划资助项目(2006AA010108)
文摘
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。
关键词
人工智能
机器翻译
统计机器翻译
基于句法的统计机器翻译
树到串
树到
树
依存语法
Keywords
artificial intelligence
machine translation
statistical machine translation
syntax-based SMT
treestring
tree-tree
dependency grammar
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计的汉藏机器翻译系统关键技术研究与实现
被引量:
5
8
作者
群诺
尼玛扎西
完么扎西
嘎玛扎西
机构
西藏大学信息科学技术学院
复旦大学计算机科学技术学院
青海师范大学民族师范学院
出处
《高原科学研究》
2018年第2期97-104,共8页
基金
国家重点研发计划项目(2017YFB1402200)
西藏自治区科技计划重大科技专项(ZDZX2017000136)
西藏自治区科技计划重点项目(2015XZ01G25)
文摘
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。
关键词
汉藏机器翻译
调序算法
树到串
翻译模型
自动分词与标注
Keywords
Chinese-Tibetan machine translation
sequence algorithm
tree-to-string translation model
auto.matic word segmentation and tagging
分类号
H085 [语言文字—语言学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于树到串模型强化的层次短语机器翻译解码方法
肖桐
朱靖波
《计算机学报》
EI
CSCD
北大核心
2016
5
下载PDF
职称材料
2
模糊匹配在树到串翻译模型中的应用
熊皓
刘洋
刘群
《中文信息学报》
CSCD
北大核心
2011
1
下载PDF
职称材料
3
基于树到串模型强化的神经机器翻译模型构建
邹德芳
胡秦斌
《计算机仿真》
北大核心
2021
3
下载PDF
职称材料
4
融合格框架的基于语块的依存树到串日汉统计机器翻译模型
吴培昊
徐金安
谢军
张玉洁
《中文信息学报》
CSCD
北大核心
2014
1
下载PDF
职称材料
5
融合词法句法分析联合模型的树到串EBMT方法
王丹丹
徐金安
陈钰枫
张玉洁
杨晓晖
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017
0
下载PDF
职称材料
6
依存树到串模型中引入双语短语的三种方法
谢军
刘群
《中文信息学报》
CSCD
北大核心
2014
0
下载PDF
职称材料
7
基于句法的统计机器翻译综述
熊德意
刘群
林守勋
《中文信息学报》
CSCD
北大核心
2008
13
下载PDF
职称材料
8
基于统计的汉藏机器翻译系统关键技术研究与实现
群诺
尼玛扎西
完么扎西
嘎玛扎西
《高原科学研究》
2018
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部