基于统计的翻译等价词对抽取研究被引量：11

Translation Equivalent Pairs Extraction Based on Statistical Measures

下载PDF

导出

摘要对利用汉英双语语料进行翻译等价词对抽取进行了探索 .对不同的词对关联度量方法进行了对比 ,考察了词性信息、多词翻译单元识别对翻译等价词对抽取结果所可能产生的改进以及负面影响 . This paper examines how the translation equivalent pairs could be extracted from parallel corpus. Four different word association measurements are compared with each other. And this paper also proposes to use part of speech information for performance improvement and integrate a multi-word unit identification component to alleviate the problem of partial correct result. Some negative aspects of these proposals are also examined in this paper.

作者常宝宝

机构地区北京大学计算语言学研究所

出处《计算机学报》 EI CSCD 北大核心 2003年第5期616-621,共6页 Chinese Journal of Computers

基金国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 7 4)资助

关键词机器翻译双语语料库翻译等价词统计知识获取单元识别 bilingual corpus translation equivalent pair automatic extraction of TEPs

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Simard M et al.Bilingual text alignment:Where do we draw the line?In:Botley S,McEnery A,Wilson A eds.Multilingual Corpora in Teaching and Research,Amsterdam,Atlanda:Rodopi publisher,2000.38～64.
2Gale W.Identifying words correspondences in parallel texts.In:Proceedings of DARPA Speech and Natural Language Workshop,Asilomar,CA,1991.152～157.
3Fung P.K—vec:A new approach for aligning parallel texts.In:Proceedings of the 15th International Conference on Computational Linguistics,Kvoto,1994.1096～1102.
4Brown P.The mathematics of statistical machine translation:Parameter estimation.Computational Linguistics,1993,19(2):263～311.
5Wu D,Xia X.Leaning an English-Chinese lexicon from a parallel corpus.In:Proceedings of AMTA-94,Columbia,MD:1994.206～213.
6Yu Shi—Wen et a1.Specification of Chinese text segmentation and POS tagging of Peking University.Journal of Chinese Information Processing,2002,(5,6)(in Chinese).
7Chang Bao-Bao et a1.Chinese-English translation database:Extracting units of translation from parallel texts.In:Barnbrook G,Danielsson P,Mablberg M eds.Meaningful texts:The Extraction of Semantic Information from Monolingual and Multilingual Corpora.Birmingham:Birmingham University Press,2002.127～139.

同被引文献81

1吕学强,吴宏林,姚天顺.无双语词典的英汉词对齐[J].计算机学报,2004,27(8):1036-1045. 被引量：11
2全如瑊.什么是"术语"?[J].术语标准化与信息技术,2004(3):18-18. 被引量：6
3胡国全,陈家骏,戴新宇,尹存燕.一种基于实例的汉英机器翻译策略[J].计算机工程与设计,2005,26(4):900-903. 被引量：5
4张姝,赵铁军,杨沐昀,李生.面向事件的多语平行语料库构建研究[J].计算机应用研究,2005,22(11):23-24. 被引量：4
5刘荣.英汉机器翻译系统的框架设计和实现[J].科技情报开发与经济,2006,16(18):227-228. 被引量：4
6陈国华,王立欣,梁茂成,刘树杰,许家金.英汉/汉英对译语料库对应词检索器[J].外语电化教学,2006(6):11-16. 被引量：13
7何莲珍.基于汉、英语平行语料库的翻译数据库设计[J].现代外语,2007,30(2):191-199. 被引量：26
8刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰.基于词典和统计的语料库词汇级对齐算法[J].情报学报,1997,16(1):21-27. 被引量：8
9Melby, A. Machine Translation: The Translation Tripod [ EB/OL]. http ://www. ttt. org/theory/mt4me/tripod, htm1,2008.5.2 )
10Sager J C. Criteria for Measuring the Functional Efficacy of Terms [M]. Munchen: Unofoterm, Set. b, 1981:196.

引证文献11

1方淼,高庆狮,余祖波.语义单元表示库的半自动构建技术[J].华中科技大学学报（自然科学版）,2005,33(z1):278-281.
2黄新艳,姚文琳,徐建良.基于汉英双语语料库的汉英Ontology的建立与管理[J].仪器仪表学报,2005,26(z2):529-532. 被引量：1
3肖华云,常宝宝.服务于双语词典编纂的检索平台[J].计算机工程与应用,2005,41(15):117-119.
4马芳,王炳锡,郭永辉.一种新的自纠错句对齐算法的研究与实现[J].微计算机信息,2005,21(10X):154-155. 被引量：1
5陈国华,王立欣,梁茂成,刘树杰,许家金.英汉/汉英对译语料库对应词检索器[J].外语电化教学,2006(6):11-16. 被引量：13
6吴宏林,刘绍明,于戈.基于加权二部图的汉日词对齐[J].中文信息学报,2007,21(5):101-106. 被引量：7
7李秀英.术语与机器翻译——实验结果分析与术语数据库的构建[J].实验室研究与探索,2008,27(11):51-56. 被引量：3
8王爽,熊德兰,王晓霞.基于实例的古文机器翻译设计与实现[J].许昌学院学报,2009,28(5):88-91. 被引量：6
9刘颖,姜巍.一种基于改进隐马尔克夫模型的词语对齐方法[J].中文信息学报,2014,28(2):51-55. 被引量：2
10姚健,俞晓明,刘悦,程学旗,程工,刘春阳.基于Web的查询翻译中OOV译文挖掘优化[J].山西大学学报（自然科学版）,2015,38(1):1-7.

二级引证文献39

1张世举.会计信息系统中的数学[J].微计算机信息,2006,22(03X):155-157. 被引量：1
2王利众,于水.俄汉机器翻译:历史、任务与展望[J].中国俄语教学,2006,25(4):49-52. 被引量：1
3李党林,王永成,刘传汉.基于弱化语法规则的机器翻译方法研究[J].计算机仿真,2006,23(12):323-326. 被引量：1
4陈国华,熊文新.英语学习词典机辅编写系统的设计原则与实现[J].外语电化教学,2007(5):3-7. 被引量：2
5熊文新,陈国华.一个用于英语学习词典编纂的机辅词编系统的实现[J].现代教育技术,2008,18(8):63-67.
6李秀英.术语与机器翻译——实验结果分析与术语数据库的构建[J].实验室研究与探索,2008,27(11):51-56. 被引量：3
7王正,孙东云.论双语词典的修订[J].中国图书评论,2009(8):53-59. 被引量：1
8贺文照.我国语料库与翻译教学:成绩与问题[J].嘉兴学院学报,2010,22(2):100-105. 被引量：2
9李宁.英语视听说语料库的构建与英语教学初探[J].成才之路,2011(24). 被引量：1
10罗卫东.近五年国内语料库语言学研究综述[J].当代教育理论与实践,2011,3(11):138-140. 被引量：3

1赵长伟,孙素环,李晓培.基于语义相似度的文本表示降维方法[J].河南科技大学学报（自然科学版）,2008,29(5):36-39. 被引量：4
2柳永念,钟诚,焦小焦.基于单元识别的网页信息抽取方法[J].广西大学学报（自然科学版）,2011,36(5):787-791. 被引量：1
3蒋润,顾春华,阮彤.基于Tri-training的评价单元识别[J].计算机应用,2014,34(4):1099-1104. 被引量：4
4单威俊,李锋,蒲海,冷文浩.船舶模型边界网格单元识别技术研究[J].计算机工程与设计,2008,29(10):2652-2654. 被引量：7
5龚永恩,袁春风,武港山.基于语义的词义消歧算法初探[J].计算机应用研究,2006,23(3):41-43. 被引量：8
6余祖波,马建军.一种利用统计语义单元识别中文人名的方法[J].小型微型计算机系统,2008,29(12):2339-2343. 被引量：1
7袁红春,熊范纶.一种基于信息熵的神经网络规则提取方法[J].模式识别与人工智能,2002,15(2):246-252. 被引量：2
8张春祥,栾博,高雪瑶,卢志茂.句法信息指导的汉语词义消歧[J].计算机工程与应用,2015,51(5):142-145.
9黄小斌,余悦蒙.一种词法分析与字标注分词结合的方法[J].电脑知识与技术（过刊）,2012,18(3X):1814-1817. 被引量：1
10廖健,王素格,李德玉,王杰.基于增强字向量的微博观点句情感极性分类方法[J].郑州大学学报（理学版）,2017,49(1):39-44. 被引量：5

计算机学报

2003年第5期

浏览历史

内容加载中请稍等...

基于统计的翻译等价词对抽取研究被引量：11

参考文献7

同被引文献81

引证文献11

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于统计的翻译等价词对抽取研究 被引量：11

参考文献7

同被引文献81

引证文献11

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于统计的翻译等价词对抽取研究被引量：11