期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于锚点词对的双语词对齐算法 被引量:10
1
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 王建德 《小型微型计算机系统》 CSCD 北大核心 2006年第2期330-334,共5页
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要... 双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求. 展开更多
关键词 自然语言处理 语词对齐 语料 锚点词对
下载PDF
基于有效句型的英汉双语短语对齐 被引量:6
2
作者 屈刚 陈笑蓉 陆汝占 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期143-149,共7页
双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧... 双语短语对齐的输入是源语言 (英语 )、目标语言 (汉语 )候选句法分析树集 由于翻译异常现象的大量存在 ,源语言句法树和目标语言句法树间往往不存在简单的对应关系 如何在翻译异常的情况下 ,从源语言、目标语言候选句法树集中排除歧义 ,选出正确的句法树 ,并揭示其短语层次上的对应关系 ,是双语短语对齐的主要困难 提出的基于“有效句型”概念和“翻译中相对不变准则”的短语对齐模型基本解决了上述问题 双语短语对齐本身是一个复杂度较高的处理过程 ,提出的有关定理和算法使系统在保证对齐正确率的前提下 。 展开更多
关键词 有效包型 英汉语短语对齐 自然语言处理 语料库 语言翻译
下载PDF
一种高效的基于启发式规则和词典相结合的双语词对齐方法 被引量:2
3
作者 任志敏 蔡东风 尹宝生 《沈阳航空工业学院学报》 2010年第5期73-77,共5页
双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法... 双语词对齐是指在互译的双语句对中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题。本文在对当前主流的词对齐方法进行实验分析的基础上,综合考虑了各种因素,提出了基于启发式统计规则和词典相结合的方法,该方法充分利用现有资源,同时考虑到了后续的应用问题。实验表明,该方法在训练语料规模较小的情况下,取得了较好的对齐结果。 展开更多
关键词 自然语言处理 语词对齐 锚点 启发式规则 高效
下载PDF
北京大学CCL语料库的研制 被引量:38
4
作者 詹卫东 郭锐 +2 位作者 常宝宝 谌贻荣 陈龙 《语料库语言学》 2019年第1期71-86,116,共17页
北京大学中国语言学研究中心CCL语料库是面向语言学本体研究和语言教学的大规模语料库,目前包括现代汉语、古代汉语和汉英句对齐平行语料,规模超过7亿汉字。CCL语料库检索系统以包括汉字、字母、标点等在内的字符为基本索引单位,提供普... 北京大学中国语言学研究中心CCL语料库是面向语言学本体研究和语言教学的大规模语料库,目前包括现代汉语、古代汉语和汉英句对齐平行语料,规模超过7亿汉字。CCL语料库检索系统以包括汉字、字母、标点等在内的字符为基本索引单位,提供普通查询、批量查询、模式查询等多种检索方式。同时该系统支持限定范围查询、基于复杂检索表达式的查询、统计模式频次、对查询结果进行排序、下载查询结果等功能。本文介绍CCL语料库的建设情况与主要功能,具体涉及语料分布概况、语料库查询功能和使用方式、语料库索引与检索技术架构等。 展开更多
关键词 北大CCL语料库 汉英对齐语料 语料检索 语料索引
下载PDF
求解RCPSP问题的迭代局部搜索算法研究 被引量:2
5
作者 赵轩 《现代计算机(中旬刊)》 2016年第3期3-9,共7页
迭代局部搜索(Iterated Local Search)算法是一个简单、高效的元启发式算法。提出一种新的求解资源受限项目调度问题(RCPSP)的迭代局部搜索算法。通过对当前解进行迭代交换实现局部搜索过程,再通过扰动多个任务的方式进行有效的扰动,防... 迭代局部搜索(Iterated Local Search)算法是一个简单、高效的元启发式算法。提出一种新的求解资源受限项目调度问题(RCPSP)的迭代局部搜索算法。通过对当前解进行迭代交换实现局部搜索过程,再通过扰动多个任务的方式进行有效的扰动,防止陷入局部最优。迭代过程中通过优先对关键链的任务进行局部搜索进一步缩小解空间,通过双对齐技术提高解的质量。最终通过标准问题库求出各项参数并且验证算法的性能。 展开更多
关键词 迭代局部搜索 资源受限项目调度问题 扰动多个任务 关键链 双对齐
下载PDF
基于多层过滤的统计机器翻译 被引量:3
6
作者 周玉 宗成庆 徐波 《中文信息学报》 CSCD 北大核心 2005年第3期54-60,共7页
本文提出了一种基于多层过滤的算法。该算法主要实现从对齐的中英文句子中自动的抽取与对齐双语语块。根据不同语块具备的不同特性,采用不同的层次对其处理。该算法不同于传统的算法,它不需要对句子进行标注,句法分析,词法分析甚至不需... 本文提出了一种基于多层过滤的算法。该算法主要实现从对齐的中英文句子中自动的抽取与对齐双语语块。根据不同语块具备的不同特性,采用不同的层次对其处理。该算法不同于传统的算法,它不需要对句子进行标注,句法分析,词法分析甚至不需要对汉语句子进行分词等操作。初步的实验结果表明该算法性能较好,测试的结果是:抽取语块的准确率能达到F =0 70 ,对齐语块的准确率能达到F =0 80 ;而且将此算法获得的对齐双语语块用于统计机器翻译系统,跟基于词的系统做对比,结果表明基于语块的翻译系统明显提高了翻译水平,差不多能提高10 %。 展开更多
关键词 人工智能 机器翻译 多层过滤 语语块识别与对齐
下载PDF
嵌入式多语言模板翻译引擎的设计与实现
7
作者 马建敏 《内蒙古科技与经济》 2007年第10S期71-72,74,共3页
文章认为,随着全球化经济的发展,国际间交往和合作日益增多,语言障碍是亟待解决的问题。嵌入式设备的方便灵活性,使得越来越多的人们希望携带便利的手持设备,便可以很自由的与世界各国的人们进行交流。本文介绍了一种将翻译技术应用于... 文章认为,随着全球化经济的发展,国际间交往和合作日益增多,语言障碍是亟待解决的问题。嵌入式设备的方便灵活性,使得越来越多的人们希望携带便利的手持设备,便可以很自由的与世界各国的人们进行交流。本文介绍了一种将翻译技术应用于手持设备(如PDA,Smartphone等)的翻译引擎的设计与实现,阐述了该引擎的架构,应用的中文分词算法和双语词对齐算法。 展开更多
关键词 翻译模板 中文分词 语词对齐
下载PDF
Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model
8
作者 Yu Zhengtao Xian Yantuan +2 位作者 Tian Wei Guo Jianyi Zhang Tao 《China Communications》 SCIE CSCD 2012年第3期78-86,共9页
We propose a method that can achieve the Naxi-English bilingual word automatic alignment based on a log-linear model.This method defines the different Naxi-English structural feature functions,which are English-Naxi i... We propose a method that can achieve the Naxi-English bilingual word automatic alignment based on a log-linear model.This method defines the different Naxi-English structural feature functions,which are English-Naxi interval switching function and Naxi-English bilingual word position transformation function.With the manually labeled Naxi-English words alignment corpus,the parameters of the model are trained by using the minimum error,thus Naxi-English bilingual word alignment is achieved automatically.Experiments are conducted with IBM Model 3 as a benchmark,and the Naxi language constraints are introduced.The final experiment results show that the proposed alignment method achieves very good results:the introduction of the language characteristic function can effectively improve the accuracy of the Naxi-English Bilingual Word Alignment. 展开更多
关键词 word aligrmaent Naxi language ENGLISH log-linear model interval switching function posi-tion transformation function
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部