期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
EBMT中高效的维吾尔语单词散列表构造算法 被引量:3
1
作者 田生伟 吐尔根.依布拉音 禹龙 《中文信息学报》 CSCD 北大核心 2009年第4期124-128,共5页
基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一。统计分析维吾尔语单词字母的分布特征,构造了基于维吾尔语单词的倒排索引散列表,在等概率... 基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一。统计分析维吾尔语单词字母的分布特征,构造了基于维吾尔语单词的倒排索引散列表,在等概率条件下,平均查找长度为1.59;依据散列冲突的同义词在维吾尔语料中出现的频率作为权值,提出了一种新颖的解决散列冲突的算法:同义词次优树算法。实验显示,算法的性能比传统的顺序查找和二分查找算法分别高出了27.5%,21.8%,证明了该算法在EBMT中有较高的检索效率。 展开更多
关键词 计算机应用 中文信息处理 ebmt 散列 平均查找长度 次优树
下载PDF
面向EBMT的汉语句子模式构造
2
作者 杨思春 陈家骏 《计算机工程与设计》 CSCD 2003年第6期62-64,67,共4页
实例匹配是基于实例的机器翻译(Example_Based Machine Translation,简称EBMT)系统实现的关键,它直接关系到EBMT系统本身的翻译质量。在基于模式的实例匹配方法中,模式的构造是基础。依据“谓词(或特殊词)+常见搭配成分’的形式构造汉... 实例匹配是基于实例的机器翻译(Example_Based Machine Translation,简称EBMT)系统实现的关键,它直接关系到EBMT系统本身的翻译质量。在基于模式的实例匹配方法中,模式的构造是基础。依据“谓词(或特殊词)+常见搭配成分’的形式构造汉语中常见的句子模式,并应用于汉英EBMT中的相似实例匹配。该模式构造方法可以有效地提高当前汉英EBMT系统的实现效率与准确率。 展开更多
关键词 汉语句子模式 机器翻译 实例匹配 ebmt 信息处理 计算机
下载PDF
EBMT系统中的多词单元翻译词典获取研究 被引量:5
3
作者 程洁 杜利民 《中文信息学报》 CSCD 北大核心 2004年第1期55-61,共7页
EBMT系统是一种基于语料库的机器翻译方法 ,其主要思想是通过类比原理进行翻译。如何从语料库中提取出一个实用的翻译词典进行系统的辅助翻译已经越来越多的引起关注。本文探讨了如何结合阈值和关联度提取的方法获取多词单元翻译词典 ,... EBMT系统是一种基于语料库的机器翻译方法 ,其主要思想是通过类比原理进行翻译。如何从语料库中提取出一个实用的翻译词典进行系统的辅助翻译已经越来越多的引起关注。本文探讨了如何结合阈值和关联度提取的方法获取多词单元翻译词典 ,在这两种方法中 ,阈值提取受主观影响太大 ,关联值提取效率太低 ,都不能很好的满足翻译词典提取的要求。本文提出的算法利用阈值提取出备选多词单元 ,其中提出了四点规则弱化主观影响且保证全面覆盖所有多词单元 ,降低了阈值本身所带来的不精确度的影响 ,然后对计算结果进行三层过滤 ,进一步提高了准确率 ;该算法还合并了单词译成多词单元和多词单元互译两部分词典的提取 。 展开更多
关键词 人工智能 机器翻译 ebmt 翻译词典 多词单元
下载PDF
汉英EBMT中的模式构造与应用
4
作者 杨思春 周云霞 《计算机时代》 2003年第7期37-38,共2页
在基于实例的机器翻译(Example-BasedMachineTranslation,简称EBMT)中,实例的相似性判断是关键,它直接关系到EBMT本身的翻译质量。本文根据汉英EBMT的具体要求,基于模式方法进行汉语句子相似性判断。
关键词 模式构造 机器翻译 ebmt 汉语句子模式构造 英语
下载PDF
EBMT积分在异基因造血干细胞移植治疗慢性粒细胞白血病中的预后价值 被引量:5
5
作者 胡炯 章卫平 +6 位作者 杨丹 唐暐 宋献民 王玲 赵维莅 吴文 王健民 《中华血液学杂志》 CAS CSCD 北大核心 2011年第2期75-78,共4页
目的分析慢性粒细胞白血病(CML)异基因造血干细胞移植(allo—HSCT)治疗的危险因素,以利于更好地规避移植风险。方法回顾性研究分析121例接受allo—HSCT的CML患者。预后评估参照EBMT积分,即Gratwoh]积分,危险因素包括供者来源、... 目的分析慢性粒细胞白血病(CML)异基因造血干细胞移植(allo—HSCT)治疗的危险因素,以利于更好地规避移植风险。方法回顾性研究分析121例接受allo—HSCT的CML患者。预后评估参照EBMT积分,即Gratwoh]积分,危险因素包括供者来源、患者年龄、患者移植前疾病状态、供患者性别差异、疾病确诊至移植时间。将患者分为3组:低危组(0~2分)、中危组(3~4分)和高危组(5分)。结果所有患者allo—HSCT后中位随访时间为37(1~126)个月,预期5年总生存(OS)率、无复发死亡(NRM)率及复发(RR)率分别为(56.8±5.0)%、(35.6±4.9)%和(12.9±3.7)%。其中低危组患者分别为(66.0±6.1)%、(28.8±6.0)%和(7.84-3.3)%,明显优于中危组[(47.2±8.7)%、(43.6±8.5)%和(18.7±8.1)%]和高危组[(16.8±15.2)%、(66.7±25.5)%和(50.0±25.0)%],差异具有统计学意义(P值分别为0.0015、0.045和0.0053)。结论EBMT危险因素积分系统能全面反映预测allo—HSCT治疗CML的疗效、复发率和移植相关死亡率。 展开更多
关键词 白血病 髓样 慢性 造血干细胞移植 预后 ebmt积分
原文传递
EBMT积分体系在异基因造血干细胞移植治疗恶性血液疾病中的预后价值 被引量:1
6
作者 王苓 唐暐 +5 位作者 樊星 赵维莅 陈玉宝 沈志祥 李军民 胡炯 《中华血液学杂志》 CAS CSCD 北大核心 2013年第8期655-658,共4页
目的分析恶性血液疾病异基因造血干细胞移植(allo-HSCT)治疗的危险因素,探索中国人群EBMT积分预测移植长期疗效的临床意义。方法回顾性分析144例allo-HSCT治疗的血液病患者,预后评估参照EBMT积分,危险因素包括患者年龄、疾病状态... 目的分析恶性血液疾病异基因造血干细胞移植(allo-HSCT)治疗的危险因素,探索中国人群EBMT积分预测移植长期疗效的临床意义。方法回顾性分析144例allo-HSCT治疗的血液病患者,预后评估参照EBMT积分,危险因素包括患者年龄、疾病状态、诊断至移植时间、供/患者性别组合、供体来源。将患者分为3组:低危组(O~1分)、中危组(2~3分)和高危组(4~7分)。结果移植后所有患者的中位随访时间为413(10~1827)d,存活患者中位随访837(166~1827)d,预期4年总生存(OS)率、移植相关死亡率(TRM)及复发率(RR)分别为(57.5±4.6)%、(21.6±3.7)%和(42.7±6.1)%。其中低危组4年OS率、TRM、RR分别为(72.2±9.0)%、(8.1±4.5)%和(27.3±8.7)%,明显优于中危组[分别为(57.7±6.0)%、(23.1±5.1)%和(44.9±8.3)%]和高危组[分别为(36.9士10.2)%、(33.5±9.2)%、(51.5±11.8)%],差异具有统计学意义(P值分别为〈0.01、0.02和0.009)。结论EBMT积分体系能有效提示allo-HSCT治疗恶性血液病的OS率、TRM和RR。 展开更多
关键词 ebmt积分 造血干细胞移植 血液肿瘤 预后
原文传递
一种基于实例的汉英机器翻译策略 被引量:5
7
作者 胡国全 陈家骏 +1 位作者 戴新宇 尹存燕 《计算机工程与设计》 CSCD 北大核心 2005年第4期900-903,906,共5页
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也... 介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。 展开更多
关键词 自然语言处理 机器翻译 实例 ebmt技术
下载PDF
基于实例的中文分词-词性标注方法的应用研究 被引量:4
8
作者 姜涛 姚天顺 张俐 《小型微型计算机系统》 CSCD 北大核心 2007年第11期2090-2093,共4页
通过实验证明基于实例的中文分词-词性标注(下文简称为EBST,Example-Based Chinese word Segment and Tagging)系统对训练语料相关的文本具有非常好的标注性能.实验结果显示了EBST系统的分词-词性标注不仅具有非常高的准确率,而且和训... 通过实验证明基于实例的中文分词-词性标注(下文简称为EBST,Example-Based Chinese word Segment and Tagging)系统对训练语料相关的文本具有非常好的标注性能.实验结果显示了EBST系统的分词-词性标注不仅具有非常高的准确率,而且和训练语料的标注保持了很好的一致性.这使得EBST系统非常适合于在基于实例的机器翻译(Example-Based Machine Translation,EBMT)系统中的应用.本文给出了EBST在EBMT系统中的应用实例及相应的实验结果. 展开更多
关键词 中文分词-词性标注 语料库 ebmt
下载PDF
基于实例的机器翻译——方法和问题 被引量:9
9
作者 王厚峰 《术语标准化与信息技术》 2003年第2期33-36,共4页
介绍了基于实例的机器翻译方法,并对基于实例的机器翻译中的若干问题,如双语实例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。
关键词 机器翻译 加工对齐 相似度 实例模板 ebmt 粒度
下载PDF
基于序列相交的短语译文获取 被引量:3
10
作者 王辰 宋国龙 +2 位作者 吴宏林 张俐 刘绍明 《中文信息学报》 CSCD 北大核心 2009年第1期38-43,共6页
短语译文获取技术是基于实例的机器翻译(EBMT)中的核心技术之一,其准确率直接影响到EBMT系统的性能。该文提出了一种基于序列相交的短语译文获取方法,该方法将句子视为词的序列,利用对中日句对齐语料库中包含待译短语的所有源语句子对... 短语译文获取技术是基于实例的机器翻译(EBMT)中的核心技术之一,其准确率直接影响到EBMT系统的性能。该文提出了一种基于序列相交的短语译文获取方法,该方法将句子视为词的序列,利用对中日句对齐语料库中包含待译短语的所有源语句子对应的目标语句子进行序列相交的方式,在不需要词对齐、句法分析及词典等资源的情况下,通过充分挖掘句对齐双语语料库的信息,获得高质量的短语译文。实验表明,该方法获得的短语译文准确率超过80%。 展开更多
关键词 计算机应用 中文信息处理 ebmt 短语译文获取 序列相交
下载PDF
一种改进的维吾尔语句子相似度计算方法 被引量:8
11
作者 卡哈尔江.阿比的热西提 吐尔根.依布拉音 +2 位作者 姚天昉 艾山.吾买尔 艾山.毛力尼亚孜 《中文信息学报》 CSCD 北大核心 2011年第4期50-53,共4页
在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较... 在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较接近人工评价的句子相似度。 展开更多
关键词 维吾尔语句子相似度计算 ebmt 句子结构相似度
下载PDF
机器翻译研究现状与展望 被引量:27
12
作者 戴新宇 尹存燕 +1 位作者 陈家骏 郑国梁 《计算机科学》 CSCD 北大核心 2004年第11期176-179,184,共5页
本文回顾机器翻译研完的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述... 本文回顾机器翻译研完的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 展开更多
关键词 机器翻译 基于实例 评测技术 机器学习方法 混合策略 描述 规划 统计 展望
下载PDF
一种哈萨克语句子相似度计算方法的研究 被引量:3
13
作者 江阿古丽.哈依达尔 卡哈尔江.阿比的热西提 +2 位作者 阿里木江.亚森 吐尔根.依布拉音 艾山.吾买尔 《新疆大学学报(自然科学版)》 CAS 2012年第4期471-474,479,共5页
句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译结果.哈萨克语是粘着型语言,具有丰富的构型和构词附加成分,词干正确提取可以很大程度上提高自然语言处... 句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译结果.哈萨克语是粘着型语言,具有丰富的构型和构词附加成分,词干正确提取可以很大程度上提高自然语言处理的效率.本文主要提出一种基于词干提取的哈萨克语句子相似度计算方法,即对计算相似度句子中的词语先进行词干提取,再进行相似度计算.此方法试验结果表明,其相似度有了较大的提高,进而基于实例的机器翻译系统的准确性也得到了相应的提高. 展开更多
关键词 ebmt 哈萨克语 句子相似度 词干提取
下载PDF
基于词串粒度及权值的汉语句子相似度衡量 被引量:13
14
作者 王荣波 池哲儒 +1 位作者 常宝宝 柏晓静 《计算机工程》 CAS CSCD 北大核心 2005年第13期142-144,共3页
提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。
关键词 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理
下载PDF
基于自动句对齐的相似古文句子检索 被引量:15
15
作者 郭锐 宋继华 廖敏 《中文信息学报》 CSCD 北大核心 2008年第2期87-91,105,共6页
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文... 随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。 展开更多
关键词 计算机应用 中文信息处理 古今汉语平行语料库 句子对齐 相似句子 基于实例的机器翻译
下载PDF
基于实例的汉英机器翻译系统研究与实现 被引量:13
16
作者 王长胜 刘群 《计算机工程与应用》 CSCD 北大核心 2002年第8期126-127,135,共3页
文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、... 文章实现了一个基于实例的汉英机器翻译系统(Example-BasedChinese-EnglishMachineTranslation,简称E-BCEMT)。实验结果表明:以纯粹的中英对照的句子对的例句库为基础,且不进行深层次的语法分析,在给定的翻译模式下,该翻译系统在效率、翻译结果的正确率等方面取得了令人满意的结果。 展开更多
关键词 汉英机器翻译系统 实例 双语语料库 计算机
下载PDF
基于实例的古文机器翻译设计与实现 被引量:6
17
作者 王爽 熊德兰 王晓霞 《许昌学院学报》 CAS 2009年第5期88-91,共4页
在分析现有机器翻译研究方法的基础上,提出了一种基于实例的古文机器翻译系统,并进行了设计与实现.测试结果表明:系统翻译效果良好,可有效避免复杂的深层次语法树和语义分析.
关键词 机器翻译 古文翻译 语料库 实例机器翻译
下载PDF
IHSMT中的实例优化策略 被引量:1
18
作者 王建德 陈肇雄 +1 位作者 黄河燕 夏云庆 《计算机研究与发展》 EI CSCD 北大核心 2002年第3期313-317,共5页
在基于实例的机器翻译方法中 ,通常采用双语句子实例的形式 ,但由于自然语言表达的无限多样性 ,使得这种存储粒度过大的句子级翻译实例的利用率较低 ;而在基于规则的机器翻译方法中 ,规则和词典具有一定的抽象性 ,其重复利用率高 ,但其... 在基于实例的机器翻译方法中 ,通常采用双语句子实例的形式 ,但由于自然语言表达的无限多样性 ,使得这种存储粒度过大的句子级翻译实例的利用率较低 ;而在基于规则的机器翻译方法中 ,规则和词典具有一定的抽象性 ,其重复利用率高 ,但其中存在大量的歧义 .提出了一种 IHSMT中的实例自动优化算法 ,该算法引入了实例粒度的概念 ,根据规则和实例使用率 ,将粒度大的实例分解为较小的单元 ,并建立相应的词典 ,以提高实例的使用频率和检索效率 ;同时在翻译过程中 ,根据用户修改的统计和上下文信息 ,对粒度小并具有歧义的实例进行合并 ,以提高翻译质量和推理效率 ,从而使实例粒度更加合理 ,存储结构更优化 。 展开更多
关键词 实例分解 实例合并 机器翻译 IHSMT 实例优化策略 计算机
下载PDF
多策略机器翻译系统IHSMTS中候选实例模式检索算法 被引量:2
19
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 代六玲 《小型微型计算机系统》 CSCD 北大核心 2005年第3期330-334,共5页
基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是... 基于实例的机器翻译系统EBMT都需要有一个非常大的实例模式库,其数量级通常在百万句对以上.因此,如何从中快速地选择出一定数量的与待翻译的输入句子比较相似的候选实例,提供给后续句子相似度计算、类比译文构造等模块作进一步的处理,是EBMT系统所必须解决的一大难题.文章基于句子的词表层特征和信息熵提出了一种多层次候选实例模式检索算法,通过在多策略机器翻译系统IHSMTS上的运行测试,结果表明该算法较好的解决了这一难题. 展开更多
关键词 基于实例的机器翻译 实例模式库 候选实例 词表层特征 信息熵
下载PDF
哈萨克语句子相似度的计算方法研究与实现
20
作者 沙力木别克.毕山汗 古丽拉.阿东别克 《新疆大学学报(自然科学版)》 CAS 北大核心 2016年第2期215-220,共6页
在基于实例的哈萨克语汉语机器翻译研究中,翻译质量的高低跟实例句子相似度计算方法有直接的关系.本文提出一种哈萨克语句子相似度计算方法,即采用基于词特征和基于向量特征相结合的相似度计算法,计算过程中使用了同义词替换.句子相似... 在基于实例的哈萨克语汉语机器翻译研究中,翻译质量的高低跟实例句子相似度计算方法有直接的关系.本文提出一种哈萨克语句子相似度计算方法,即采用基于词特征和基于向量特征相结合的相似度计算法,计算过程中使用了同义词替换.句子相似度计算中需要解决的关键问题是怎样快速匹配实例.为解决这个问题,所设计的快速查找模块能够快速从实例库中筛选出实例集合,进行相似度计算.实验结果表明:快速查找模块可以提高实例句子查找速度,同义词替换可以提高相似度准确性. 展开更多
关键词 基于实例的机器翻译 同义词替换 哈萨克语 句子相似度 机器翻译
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部