期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于树到串模型强化的层次短语机器翻译解码方法 被引量:5
1
作者 肖桐 朱靖波 《计算机学报》 EI CSCD 北大核心 2016年第4期808-821,共14页
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并... 文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果. 展开更多
关键词 统计机器翻译 层次短语模型 树到串模型 规则抽取 解码 社会媒体 社交网络 自然语言处理 机器翻译
下载PDF
模糊匹配在树到串翻译模型中的应用 被引量:1
2
作者 熊皓 刘洋 刘群 《中文信息学报》 CSCD 北大核心 2011年第2期66-71,共6页
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则... 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。 展开更多
关键词 树到串翻译模型 统计机器翻译 模糊匹配
下载PDF
基于树到串模型强化的神经机器翻译模型构建 被引量:3
3
作者 邹德芳 胡秦斌 《计算机仿真》 北大核心 2021年第2期344-347,476,共5页
针对传统模型无法有效处理不同语言的差异性,出现源语言语法信息丢失、翻译内容欠佳的问题,构建出一种基于树到串模型强化的神经机器翻译模型。获取传统神经机器翻译模型的解码器与编码器的工作原理与运行流程,采用源句法分析树、目标... 针对传统模型无法有效处理不同语言的差异性,出现源语言语法信息丢失、翻译内容欠佳的问题,构建出一种基于树到串模型强化的神经机器翻译模型。获取传统神经机器翻译模型的解码器与编码器的工作原理与运行流程,采用源句法分析树、目标串和源端与目标端文本串之间的对齐信息等模块,架构树到串强化模型,利用GHKM算法提取翻译规则优化目标函数,依据词汇和短语的有机结合与结构化信息的提取能力,赋予语句带有规则的结构化信息,最终通过解码器与神经网络单元的组成,实现神经机器翻译模型的创建。仿真结果证明,所提模型可以极大程度抑制句长的影响,具有理想的句子敏感性,且翻译效率较好。 展开更多
关键词 树到串模型 神经机器翻译 搜索算法 编码器 解码器
下载PDF
融合格框架的基于语块的依存树到串日汉统计机器翻译模型 被引量:1
4
作者 吴培昊 徐金安 +1 位作者 谢军 张玉洁 《中文信息学报》 CSCD 北大核心 2014年第5期133-140,161,共9页
该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,... 该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,实现格框架与日汉依存树到串模型的融合。实验结果表明,该文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,同时,还可有效提高日汉统计机器翻译的译文质量。 展开更多
关键词 日汉机器翻译 格框架 依存树到串模型 句法结构
下载PDF
融合词法句法分析联合模型的树到串EBMT方法
5
作者 王丹丹 徐金安 +2 位作者 陈钰枫 张玉洁 杨晓晖 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期295-304,共10页
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了... 针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了提高翻译精度,引入中文分词、词性标注和依存句法分析联合模型,可以减少汉英EBMT中源语言端基础任务中的错误传递,提高提取层次间特征的准确性。在此基础上,结合依存结构的特征和中英语料的特性,对依存树到串模型进行规则抽取以及泛化处理。实验结果表明,相对于基线系统,该方法可以提高实例对抽取质量,改善泛化规则和译文质量,提高系统性能。 展开更多
关键词 基于实例的机器翻译 依存树到串模型 联合模型 泛化模板
下载PDF
依存树到串模型中引入双语短语的三种方法
6
作者 谢军 刘群 《中文信息学报》 CSCD 北大核心 2014年第2期44-50,共7页
依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合... 依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合现象易于由短语捕捉。为了更好地改善依存树到串模型的性能,本文提出了三种引入双语短语的方法,分别为引入句法短语、引入泛化句法短语及引入非句法短语。实验结果表明,同时使用句法短语、泛化句法短语及非句法短语时,可以将依存树到串模型的性能显著提高约1.0BLEU值。 展开更多
关键词 统计机器翻译 依存树到串模型 泛化句法短语 非句法短语
下载PDF
基于句法的统计机器翻译综述 被引量:13
7
作者 熊德意 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2008年第2期28-39,共12页
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,... 本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。 展开更多
关键词 人工智能 机器翻译 统计机器翻译 基于句法的统计机器翻译 树到串 树到 依存语法
下载PDF
基于统计的汉藏机器翻译系统关键技术研究与实现 被引量:5
8
作者 群诺 尼玛扎西 +1 位作者 完么扎西 嘎玛扎西 《高原科学研究》 2018年第2期97-104,共8页
随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理... 随着统计机器学习方法的迅速普及,机器翻译技术有了突飞猛进的进展,但是目前基于汉藏两种语言的机器翻译系统研究还处于启蒙阶段。文章主要研究和扩充了已有的统计翻译模型,对藏文文法的特殊性进行了适当的处理,包括藏文动词的时态处理、动词及物性处理、格助词处理等;为解决平行语料不足导致的数据稀疏问题,对基于中介语言的词语翻译模型进行了改进,融合了基于中介语言的统计翻译模型和直接翻译模型;应用"少监督"的方法,改善了统计机器翻译模型训练过程的盲目性、低效性、冗余性和表面性等缺陷,并将这种方法加入到现有的训练过程得到改善的训练方法。 展开更多
关键词 汉藏机器翻译 调序算法 树到串翻译模型 自动分词与标注
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部