期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
汉英短语翻译对的自动抽取 被引量:3
1
作者 刘颖 铁铮 余畅 《计算机应用与软件》 CSCD 北大核心 2012年第7期69-72,共4页
介绍从平行语料库中如何抽取双语短语翻译对。首先用统计模型正则期望从汉语专利语料库中抽取汉语短语。抽取的短语利用统计知识和语言学知识来过滤,使得过滤后汉语短语的正确率较高;其次,利用词对齐工具Giza++从汉英平行语料库中抽取... 介绍从平行语料库中如何抽取双语短语翻译对。首先用统计模型正则期望从汉语专利语料库中抽取汉语短语。抽取的短语利用统计知识和语言学知识来过滤,使得过滤后汉语短语的正确率较高;其次,利用词对齐工具Giza++从汉英平行语料库中抽取词汇对齐,在词汇对齐的基础上利用开源工具Moses抽取汉英短语对齐,根据短语对齐与抽取出的高质量汉语短语的交集来抽取候选的汉英互译的源语言短语;接着使用停用词、对数似然估计法LLR和上下文熵来对英语短语翻译进行过滤。实验结果表明,过滤后,抽取的汉语短语准确率为97.6%,汉英短语翻译对的准确率为92.4%。 展开更多
关键词 抽取 过滤 汉英短语翻译对
下载PDF
基于中心语块扩展的短语翻译对自动获取
2
作者 张春祥 李生 赵铁军 《高技术通讯》 CAS CSCD 北大核心 2006年第9期893-898,共6页
提出了一种短语翻译对获取方法.该方法使用完全基于词典的对齐结果来确定源语言短语的译文中心语块,依据完全基于词典和多策略相融合的对齐结果的并集来确定其译文最大边界.从中心语块出发,结合译文最大边界生成源语言短语的所有候选译... 提出了一种短语翻译对获取方法.该方法使用完全基于词典的对齐结果来确定源语言短语的译文中心语块,依据完全基于词典和多策略相融合的对齐结果的并集来确定其译文最大边界.从中心语块出发,结合译文最大边界生成源语言短语的所有候选译文.同时对其进行评价,从中选出对应的目标语译文.实验结果表明:在开放测试中,这种方法的正确率达到了81.53%,性能好于其它方法. 展开更多
关键词 短语翻译对 译文中心语块 译文最大边界
下载PDF
基于主动学习的短语翻译对获取
3
作者 张春祥 赵铁军 卢志茂 《高技术通讯》 CAS CSCD 北大核心 2011年第4期380-385,共6页
利用汉-英双语句对进行了抽取短语翻译对的研究,提出了一种利用双语评价特征进行译文评价的短语翻译对主动获取方法。该方法通过选择有代表性的短语翻译对来达到减少人工标注数据的目的,以短语译文直译率、短语翻译概率和短语长度差... 利用汉-英双语句对进行了抽取短语翻译对的研究,提出了一种利用双语评价特征进行译文评价的短语翻译对主动获取方法。该方法通过选择有代表性的短语翻译对来达到减少人工标注数据的目的,以短语译文直译率、短语翻译概率和短语长度差异为基础,使用标注后的短语翻译对对支持向量机(SVM)进行训练,并使用优化后的SVM对测试数据进行分类。实验结果表明,使用此方法,在分类器性能基本没有下降的前提下,人工标注数据量减少了80%。 展开更多
关键词 短语翻译对 双语句对 双语评价特征 主动获取 支持向量机(SVM)
下载PDF
融入双语最大名词短语的机器翻译模型 被引量:9
4
作者 李业刚 梁丽君 +2 位作者 孙福振 王绍卿 于潇 《计算机应用研究》 CSCD 北大核心 2017年第5期1316-1320,共5页
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略... 在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。 展开更多
关键词 统计机器翻译 短语翻译模型 最大名词短语 双语最大名词短语
下载PDF
基于短语统计翻译的汉维机器翻译系统 被引量:5
5
作者 杨攀 李淼 张建 《计算机应用》 CSCD 北大核心 2009年第7期2022-2025,共4页
描述了一种基于短语统计翻译的汉维机器翻译系统。首先使用汉维语料进行训练,得到语言模型和翻译模型;再利用训练好的模型对源语句进行解码,以得到最佳的翻译语句。解码的核心算法是柱搜索(beam search)算法。其中维文语料使用的是拉丁... 描述了一种基于短语统计翻译的汉维机器翻译系统。首先使用汉维语料进行训练,得到语言模型和翻译模型;再利用训练好的模型对源语句进行解码,以得到最佳的翻译语句。解码的核心算法是柱搜索(beam search)算法。其中维文语料使用的是拉丁维文。实验结果表明,基于短语的统计机器翻译方法可以快速有效地构建一个汉维机器翻译平台。 展开更多
关键词 短语统计翻译 语言模型 翻译模型 柱搜索算法
下载PDF
基于改进短语翻译模型的计算机智能化校对系统研究 被引量:10
6
作者 姚兰 《电子设计工程》 2020年第18期52-55,59,共5页
针对句法与短语的英语翻译校对系统重视精准度校准,无法解决连贯性差的问题,提出了基于改进短语翻译模型的智能校对系统。首先,通过创建语义本体模型和短语译文组合翻译算法创建语义本体模型。另外,对系统的总体进行设计。通过系统的整... 针对句法与短语的英语翻译校对系统重视精准度校准,无法解决连贯性差的问题,提出了基于改进短语翻译模型的智能校对系统。首先,通过创建语义本体模型和短语译文组合翻译算法创建语义本体模型。另外,对系统的总体进行设计。通过系统的整体架构设计系统的软硬件,硬件设计主要为搜索模块,从而提高搜索的精度。在软件模块过程中,主要包括系统应用程序的框架、网络拓扑结构、客户端、译者组织管理、在线协作翻译等模块,并且能够支持多国语言的翻译和校对。最后,对设计的系统进行测试。通过测试结果表示,系统能够满足用户对翻译的校对需求,提高校对效率。 展开更多
关键词 短语翻译 模型建立 智能校对 系统测试
下载PDF
英文专利文献中名词短语的翻译 被引量:1
7
作者 林晓庆 《计算机工程与设计》 CSCD 北大核心 2010年第8期1863-1865,1869,共4页
提出了一种基于句法分析与词语相关性相结合的方法实现英文专利文献中名词短语的翻译,建立了一个面向专利文献的名词短语双语实例库,形成名词短语(NP)树库。对待翻译的术语NP,先进行句法分析,再在NP树库中搜索与该术语NP匹配的NP树,对... 提出了一种基于句法分析与词语相关性相结合的方法实现英文专利文献中名词短语的翻译,建立了一个面向专利文献的名词短语双语实例库,形成名词短语(NP)树库。对待翻译的术语NP,先进行句法分析,再在NP树库中搜索与该术语NP匹配的NP树,对匹配的NP树,用《知网》计算词语间语义相似度,找到最相似NP树,然后计算词语的翻译候选之间的相关性找到词语翻译,最后调整语序生成译文;若不存在匹配的NP树,搜索与该NP树的子NP相匹配的NP树,递归生成译文。使用BLEU作为机器评价准则,实验结果表明,该方法优于基于短语的统计翻译系统(Pharaoh)。 展开更多
关键词 名词化结构 名词短语 名词短语翻译模式 译文选择 知网
下载PDF
基于短语翻译模型的英语翻译计算机智能校对方法 被引量:8
8
作者 张蕾 王剑楠 《自动化技术与应用》 2021年第2期55-58,76,共5页
为保证机器翻译准确性,本文提出了基于短语翻译模型的英语翻译计算机智能校对方法,通过发现可代替待校对词汇的正确词汇,以实现英语翻译的自动智能校对。同时详细设计了英语翻译计算机智能校对具体流程,分析了基于最大熵模型的分词模式... 为保证机器翻译准确性,本文提出了基于短语翻译模型的英语翻译计算机智能校对方法,通过发现可代替待校对词汇的正确词汇,以实现英语翻译的自动智能校对。同时详细设计了英语翻译计算机智能校对具体流程,分析了基于最大熵模型的分词模式。最后通过计算机智能校对代码实现与测试,得出结论,英语翻译结果校对之前准确率最高只能达到72.9%,而通过英语翻译计算机智能校对方法完成校对之后,准确率全部保持于99.0%以上,二者准确率差异显著,表明基于短语翻译模型的英语翻译计算机智能校对方法具有显著有效性与良好稳定性,值得大力推广与应用。 展开更多
关键词 短语翻译模型 英语翻译 计算机 智能校对
下载PDF
基于汉英短语翻译组合机器自动翻译系统设计与测试研究 被引量:10
9
作者 田力 《微型电脑应用》 2020年第5期43-46,共4页
为了提升汉英机器翻译的准确率,实现汉英翻译系统的智能化,提出了一款汉英短语翻译组合自动翻译系统的构想。运用语义特征分析与短语翻译组合形式对汉英双语翻译算法进行改善;此外还使用交叉编辑与多线程的短语翻译加载的措施,从而完成... 为了提升汉英机器翻译的准确率,实现汉英翻译系统的智能化,提出了一款汉英短语翻译组合自动翻译系统的构想。运用语义特征分析与短语翻译组合形式对汉英双语翻译算法进行改善;此外还使用交叉编辑与多线程的短语翻译加载的措施,从而完成了本翻译系统的智能化设计。通过相关实验仿真表明,此款新设计汉英短语译文组合机器自动翻译系统翻译准确率与召回率高,很少出现翻译错误,而且还具有较强的智能性。 展开更多
关键词 短语翻译组合 机器自动翻译系统设计 实验仿真
下载PDF
基于短语相似度的统计机器翻译模型 被引量:3
10
作者 何中军 刘群 林守勋 《高技术通讯》 EI CAS CSCD 北大核心 2009年第4期337-341,共5页
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源... 针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统'摩西(Moses)'。 展开更多
关键词 相似度 基于短语的统计机器翻译 基于实例的机器翻译
下载PDF
基于改进短语翻译模型的计算机智能化校对系统研究 被引量:2
11
作者 张月 《自动化技术与应用》 2021年第12期58-61,共4页
本文基于改进短语翻译模型,设计了英语翻译计算机智能化校对系统。搜索模块负责搜索待翻译校对词汇内涵与关联内容;行为日志负责掌握用户行为数据信息,以优化改进系统。在此基础上,设计规划了翻译错误检测算法与计算机智能化校对方法,... 本文基于改进短语翻译模型,设计了英语翻译计算机智能化校对系统。搜索模块负责搜索待翻译校对词汇内涵与关联内容;行为日志负责掌握用户行为数据信息,以优化改进系统。在此基础上,设计规划了翻译错误检测算法与计算机智能化校对方法,以正确词汇直接代替待翻译校对词汇,从而完成英语翻译智能化校对。通过系统性能测试表明,其不仅校对精确性较高,有效性显著,还可有效保障语境连贯性,值得广泛推广应用。 展开更多
关键词 改进短语翻译模型 智能化 校对
下载PDF
短语抽取算法在短语统计机器翻译中的应用 被引量:1
12
作者 张小军 张宇 《黑龙江科技信息》 2015年第27期176-,共1页
短语抽取算法在短语统计机器翻译中应用得较多,这种方法可以有效进行短语抽取,提高短语统计机器翻译的准确性和效率。本文对短语抽取算法和短语统计机器翻译做了具体介绍,通过对两者的介绍可以对两者有更好的了解。同时也对短语抽取算... 短语抽取算法在短语统计机器翻译中应用得较多,这种方法可以有效进行短语抽取,提高短语统计机器翻译的准确性和效率。本文对短语抽取算法和短语统计机器翻译做了具体介绍,通过对两者的介绍可以对两者有更好的了解。同时也对短语抽取算法在短语统计机器中的应用做了一个分析,对短语抽取算法运行的步骤以及改进措施做了详细的介绍,通过这些能够使短语抽取算法在短语统计机器翻译中更好发挥作用。 展开更多
关键词 短语抽取算法 短语统计机器翻译 具体应用
下载PDF
一种考虑对齐不一致的短语翻译概率估计方法
13
作者 苏劲松 刘群 吕雅娟 《中文信息学报》 CSCD 北大核心 2011年第3期118-122,共5页
在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计... 在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计算公式,在估计概率的过程中充分地考虑短语的各种出现情况。多个测试集上的实验结果证明了我们方法的有效性。 展开更多
关键词 统计机器翻译 对齐不一致 短语翻译概率
下载PDF
基于短语译文组合的汉英翻译系统 被引量:2
14
作者 姚敏锋 《广东外语外贸大学学报》 2010年第2期75-77,共3页
本文描述了一种基于短语译文组合的汉英机器翻译系统。通过对输入的汉语进行语义分析,得到汉语短语及相对应的英文短语链;利用事先给定的中英文语法转换规则,对英文短语集合进行译文选择组合,从而得到对应的英文语句。实验结果表明,基... 本文描述了一种基于短语译文组合的汉英机器翻译系统。通过对输入的汉语进行语义分析,得到汉语短语及相对应的英文短语链;利用事先给定的中英文语法转换规则,对英文短语集合进行译文选择组合,从而得到对应的英文语句。实验结果表明,基于短语译文组合的汉英翻译方法可以快速有效地构建一个汉英机器翻译平台。 展开更多
关键词 短语译文组合翻译 翻译模型 机器翻译
下载PDF
对齐模板在标准短语统计机器翻译模型中的应用 被引量:2
15
作者 张步峰 孙越恒 赵青 《电子测量技术》 2007年第7期146-149,161,共5页
在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够... 在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够较好处理数据稀疏的问题,短语对可以使翻译更加精确。本文提出在基于最大熵的标准短语翻译模型下模拟对齐模板,模拟的对齐模板被作为一个单独的特征函数加入到此翻译模型中。实验在中英翻译和法英翻译上进行,实验结果证明,本文方法明显改善了标准短语翻译模型的翻译效果。 展开更多
关键词 统计机器翻译 标准短语翻译模型 对齐模板 最大熵模型
下载PDF
基于短语的蒙汉统计机器翻译系统的设计与实现 被引量:8
16
作者 银花 王斯日古楞 艳红 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2011年第1期91-94,共4页
介绍了机器翻译方法和统计翻译模型,利用国际开源软件构建了一个基于短语的蒙汉机器翻译系统.初步试验结果表明,基于短语翻译方法的蒙汉机器翻译系统具有较好的翻译效果.
关键词 蒙汉机器翻译 短语翻译 语言模型 翻译模型
下载PDF
一种融合句法短语的汉英统计机器翻译方法 被引量:6
17
作者 宋鼎新 黄德根 《小型微型计算机系统》 CSCD 北大核心 2017年第10期2197-2201,共5页
基于短语的统计机器翻译所使用的短语并不限制句法边界,因而得到的翻译结果存在大量不符合句法结构的表达.为此,分析短语模型与句法模型各自的优势与不足,提出将句法分析结果中获得的双语句法短语对融入在短语模型中,以改善机器翻译质量... 基于短语的统计机器翻译所使用的短语并不限制句法边界,因而得到的翻译结果存在大量不符合句法结构的表达.为此,分析短语模型与句法模型各自的优势与不足,提出将句法分析结果中获得的双语句法短语对融入在短语模型中,以改善机器翻译质量.首先对平行语料分别进行句法分析并从中获取中英文单语句法短语,而后利用短语表与一致性短语原则获取双语句法短语对,最后将其与短语翻译模型的原有短语表相结合.实验结果表明:双语句法短语能够提高基于短语的统计机器翻译质量,在十万句对与百万句对规模双语平行训练语料中BLEU值分别提高0.56%与0.62%. 展开更多
关键词 统计机器翻译 双语句法短语 短语翻译模型 短语
下载PDF
基于层次短语的汉蒙统计机器翻译研究 被引量:2
18
作者 王春荣 王斯日古楞 阿荣 《内蒙古师范大学学报(自然科学汉文版)》 CAS 北大核心 2013年第3期350-353,357,共5页
使用形式化的句法分析方法——基于层次短语的翻译模型进行汉蒙统计机器翻译研究.实验证明,基于层次短语的6元模型实验结果比基于短语的3、4、5和6元的结果都要好.进一步对基于层次短语的汉蒙统计机器翻译系统译文中的汉语未登录数词进... 使用形式化的句法分析方法——基于层次短语的翻译模型进行汉蒙统计机器翻译研究.实验证明,基于层次短语的6元模型实验结果比基于短语的3、4、5和6元的结果都要好.进一步对基于层次短语的汉蒙统计机器翻译系统译文中的汉语未登录数词进行后处理,从而提高了翻译系统性能. 展开更多
关键词 形式化句法 基于层次短语翻译模型 汉蒙统计机器翻译 数词后处理
下载PDF
基于短语的统计机器翻译中汉维短语对抽取算法改进
19
作者 任高举 吐尔根.伊布拉音 艾山.吾买尔 《现代计算机》 2010年第5期9-11,共3页
提出一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维语词的情况(包括不连续),然后采用Och方法进行判断。如果满足条件则进行短语抽取。试验结果表明,改进后的短语抽取算法能够抽取出更多汉维短语对,提高短... 提出一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维语词的情况(包括不连续),然后采用Och方法进行判断。如果满足条件则进行短语抽取。试验结果表明,改进后的短语抽取算法能够抽取出更多汉维短语对,提高短语翻译对抽取的效果。 展开更多
关键词 基于短语的统计机器翻译 短语抽取 汉维短语 翻译模型
下载PDF
基于虚拟上下文的统计机器翻译短语表的过滤 被引量:1
20
作者 殷乐 张玉洁 徐金安 《中文信息学报》 CSCD 北大核心 2013年第6期139-143,共5页
在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量。为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法。该方法引入虚拟上下文计算短语对的... 在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量。为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法。该方法引入虚拟上下文计算短语对的得分增量;并通过计算最大和最小的短语对的得分增量,设计了一种对短语对重排序的过滤策略。我们在NTCIR-9的中英数据上进行了验证实验,结果显示,当短语表的规模下降到原来的47%时,翻译质量的BLEU值提高了0.000 5;当短语表的规模下降到原来的30%时,BLEU值仅下降0.000 6。实验结果表明,在大规模短语表的过滤中,该文的方法是有效可行的。 展开更多
关键词 基于短语的统计机器翻译 短语表过滤 虚拟上下文
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部