期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
Improving Phrase-Based Statistical Machine Translation Models by Incorporating Syntax-Based Language Models
1
作者 陈毅东 史晓东 《Journal of Donghua University(English Edition)》 EI CAS 2010年第2期185-188,共4页
This paper proposed a method to incorporate syntax-based language models in phrase-based statistical machine translation (SMT) systems. The syntax-based language model used in this paper is based on link grammar,which... This paper proposed a method to incorporate syntax-based language models in phrase-based statistical machine translation (SMT) systems. The syntax-based language model used in this paper is based on link grammar,which is a high lexical formalism. In order to apply language models based on link grammar in phrase-based models,the concept of linked phrases,an extension of the concept of traditional phrases in phrase-based models was brought out. Experiments were conducted and the results showed that the use of syntax-based language models could improve the performance of the phrase-based models greatly. 展开更多
关键词 statistical machine translation phrase-based translation models syntax-based language models linkage grammar
下载PDF
Korean Morphological Analysis for Korean-Vietnamese Statistical Machine Translation
2
作者 Quang-Phuoc Nguyen Joon-Choul Shin Cheol-Young Ock 《Journal of Electronic Science and Technology》 CAS CSCD 2017年第4期413-419,共7页
This paper describes the experiments with Korean-to-Vietnamese statistical machine translation(SMT). The fact that Korean is a morphologically complex language that does not have clear optimal word boundaries causes a... This paper describes the experiments with Korean-to-Vietnamese statistical machine translation(SMT). The fact that Korean is a morphologically complex language that does not have clear optimal word boundaries causes a major problem of translating into or from Korean. To solve this problem, we present a method to conduct a Korean morphological analysis by using a pre-analyzed partial word-phrase dictionary(PWD).Besides, we build a Korean-Vietnamese parallel corpus for training SMT models by collecting text from multilingual magazines. Then, we apply such a morphology analysis to Korean sentences that are included in the collected parallel corpus as a preprocessing step. The experiment results demonstrate a remarkable improvement of Korean-to-Vietnamese translation quality in term of bi-lingual evaluation understudy(BLEU). 展开更多
关键词 Factored translation models Korean-Vietnamese parallel corpus morphological analysis statistical machine translation(smt)
下载PDF
Understanding and improving online statistical translation method
3
作者 CHENG Shui-ying 《Sino-US English Teaching》 2008年第9期38-44,共7页
Companies like Google, MSN and Yahoo provide translation services on their websites, generating translations based on statistical bilingual text corpora. Human translation seems to be inferior in face of huge amount o... Companies like Google, MSN and Yahoo provide translation services on their websites, generating translations based on statistical bilingual text corpora. Human translation seems to be inferior in face of huge amount of information and fast development of computer science. Despite the functions and versatility of statistical machine translation, it may never take the place of human effort. Teachers are supposed to guide the students in using online translation system. 展开更多
关键词 statistical machine translation smt BENEFITS problems human effort
下载PDF
基于中心/修饰依存重排序模型的短语SMT 被引量:1
4
作者 刘水 李生 +1 位作者 赵铁军 刘鹏远 《软件学报》 EI CSCD 北大核心 2012年第5期1120-1131,共12页
为了提高基于短语的机器翻译系统的重排序能力,提出了一个基于源语言端的中心-修饰依存结构的重排序模型,并将该重排序模型以软约束的方式加入到机器翻译系统中.该排序模型提出了一种在机器翻译中应用句法树资源的方法,将句法树结构,通... 为了提高基于短语的机器翻译系统的重排序能力,提出了一个基于源语言端的中心-修饰依存结构的重排序模型,并将该重排序模型以软约束的方式加入到机器翻译系统中.该排序模型提出了一种在机器翻译中应用句法树资源的方法,将句法树结构,通过将句法树映射成中心-修饰词的依存关系集合.该重排序模型在基于短语系统的默认参数设置下,显著地提升了系统的翻译质量.在系统原有的词汇化的重排序模型基础上,该重排序模型在翻译模型中融入了句法信息.实验结果显示,该模型可以明显地改善机器翻译系统的局部调序. 展开更多
关键词 短语机器翻译 重排序模型 中心修饰依存关系 无词汇化
下载PDF
基于句法的统计机器翻译综述 被引量:13
5
作者 熊德意 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2008年第2期28-39,共12页
本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,... 本文对基于句法的统计机器翻译进行了综述。按照模型所基于的语法不同,将基于句法的统计机器翻译分为两大类:基于形式化语法和基于语言学语法。对这两个不同类别,我们分别介绍它们代表性的工作,包括模型的构建、训练和解码器的设计等,并对比了各个模型的优点和缺点。最后我们对基于句法的统计机器翻译进行了总结,指出设计句法模型时要注意的问题,并对未来的发展趋势进行了预测。 展开更多
关键词 人工智能 机器翻译 统计机器翻译 基于句法的统计机器翻译 树到串 树到树 依存语法
下载PDF
基于句法调序的汉维统计机器翻译 被引量:2
6
作者 陈丽娟 张恒 +2 位作者 董兴华 吐尔洪.吾司曼 周俊林 《计算机工程》 CAS CSCD 2012年第3期169-171,175,共4页
在汉语到维语的统计机器翻译中,2种语言在形态学及语序上差异较大,导致未知词较多,且产生的维语译文语序混乱。针对上述问题,在对汉语和维语的语序进行研究的基础上,提出一种汉语句法调序方法,进而对维语进行形态学分析,采用基于因素的... 在汉语到维语的统计机器翻译中,2种语言在形态学及语序上差异较大,导致未知词较多,且产生的维语译文语序混乱。针对上述问题,在对汉语和维语的语序进行研究的基础上,提出一种汉语句法调序方法,进而对维语进行形态学分析,采用基于因素的统计机器翻译系统进行验证。实验结果证明,该方法在性能上较基线系统有显著改进,BLEU评分由15.72提高到19.17。 展开更多
关键词 统计机器翻译 句法调序 形态学 因素模型 翻译模型
下载PDF
基于统计机器翻译模型的查询扩展 被引量:2
7
作者 李卫疆 赵铁军 王宪刚 《电子与信息学报》 EI CSCD 北大核心 2008年第3期725-729,共5页
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻... 在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。 展开更多
关键词 信息检索 查询扩展 语言模型 统计机器翻译
下载PDF
统计机器翻译系统在网络翻译教学中的应用 被引量:18
8
作者 王正 孙东云 《上海翻译》 北大核心 2009年第1期73-77,共5页
随着Google翻译引擎的推出,统计机器翻译因其较高的建设效率和翻译质量得到了越来越多的重视。本文分析了统计机器翻译在网络翻译教学中的应用,提出在网络翻译教学中,统计机器翻译不仅可以帮助学生进行基本的资料检索如词汇、专业术语等... 随着Google翻译引擎的推出,统计机器翻译因其较高的建设效率和翻译质量得到了越来越多的重视。本文分析了统计机器翻译在网络翻译教学中的应用,提出在网络翻译教学中,统计机器翻译不仅可以帮助学生进行基本的资料检索如词汇、专业术语等,还可以提供参考译文、翻译技巧学习等诸多辅助功能,在专业化的翻译教学建设中更是具有广阔的应用前景。 展开更多
关键词 统计机器翻译 基于规则的机器翻译 网络翻译教学
下载PDF
基于同步树序列替换文法的统计机器翻译模型 被引量:2
9
作者 蒋宏飞 李生 +2 位作者 张民 赵铁军 杨沐昀 《自动化学报》 EI CSCD 北大核心 2009年第10期1317-1326,共10页
基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具... 基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具有解决以上问题的潜力,因而越来越受到研究者们的重视.然而现有的大多数基于句法的模型都因严格的句法限制而制约了模型的描述能力.为突破这种限制并将基于短语的模型的优点融入到句法模型中,本文提出一种基于同步树序列替换文法(Synchronous tree sequence substitution grammar,STSSG)的统计机器翻译模型.在此模型中,树序列被用作为基本的翻译单元.在这种框架下,不满足句法限制的翻译等价对和满足句法限制的翻译等价对都可以融入句法信息并被翻译模型所使用.从而,两种模型的优点均得到充分利用.在2005年度美国国家标准与技术研究所(NIST)举办的机器翻译评比的中文翻译任务语料上的实验表明,本文提出的模型显著地超过了两个基准系统:基于短语的翻译系统Moses和一个基于严格树结构的句法翻译模型. 展开更多
关键词 统计机器翻译 句法限制 同步文法 同步树替换文法 同步树序列替换文法
下载PDF
一个基于JAVA的堆栈式自然语言翻译解码器 被引量:1
10
作者 聂进 《计算机工程与应用》 CSCD 北大核心 2005年第4期105-108,共4页
解码是统计学自然语言翻译系统的重要一步,解码器的任务是用从训练文本中学习到的语言/翻译模型的信息来确定源句子最可能的翻译句子,解码器的输入是翻译模型和语言模型,以及源语言句子,输出源语言句子最可能的对应目标句子/翻译。由于... 解码是统计学自然语言翻译系统的重要一步,解码器的任务是用从训练文本中学习到的语言/翻译模型的信息来确定源句子最可能的翻译句子,解码器的输入是翻译模型和语言模型,以及源语言句子,输出源语言句子最可能的对应目标句子/翻译。由于可能的目标句子很多,通常解码算法只能搜索一小部分可能的目标语言句子。该文介绍了一种基于堆栈算法的,用Java实现的解码器。Java平台提供了方便的跨平台的应用,高度安全、开放、健壮。解码器的实现重点在于解码算法和参数的选择。 展开更多
关键词 解码 解码器 基于统计模型的机器翻译 堆栈搜索 JAVA
下载PDF
LOOSE PHRASE EXTRACTION WITH n-BEST ALIGNMENTS
11
作者 Xue Yongzeng Li Sheng 《Journal of Electronics(China)》 2007年第4期567-571,共5页
Loose phrase extraction method is proposed and applied for phrase-based statistical ma- chine translation. The method extracts phrase pairs that are not strictly consistent with word align- ments. Two types of constra... Loose phrase extraction method is proposed and applied for phrase-based statistical ma- chine translation. The method extracts phrase pairs that are not strictly consistent with word align- ments. Two types of constraints on word positions are investigated for this method. Furthermore, n-best alignments are introduced for phrase extraction instead of the one-best. Experimental results show that the proposed approach outperforms the baseline system, Pharaoh system, for both one-best and n-best alignments. 展开更多
关键词 statistical machine translation phrase-based ALIGNMENT n-best Phrase extraction
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部