OpenE:一种基于n-gram共现的自动机器翻译评测方法被引量：8

OpenE:an Automatic Method of MT Evaluation Based on N-gram Co-occurrence

下载PDF

导出

摘要在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评测研究已经成为机器翻译研究中的一个重要课题。本文讨论了基于n gram共现的自动机器翻译评测框架 ,介绍了BLEU、NIST、OpenE三种自动评价方法 ,并通过实验详细分析了三种方法的优缺点。其中的OpenE采用了本文提出了一种新的片断信息量计算方法。它有效地利用了一个局部语料库 (参考译文库 )和全局语料库 (目标语句子库 )。实验结果表明这种方法对于机器翻译评价来说是比较有效的。 Evaluations are very helpful for the research of Machine Translation (MT). The aim of evaluations is not only to output the differences among MT systems, but also to stimulate the improvement of key technologies in this area. In the past, the evaluations of MT are performed by human. With the increasing needs of MT research, the automatization of MT evaluations becomes more and more important. This paper introduces the basic framework of automatic MT evaluation using n-gram co-occurrence statistics. Three methods (BLEU, NIST and OpenE) based on this framework are described. The advantages and disadvantages of these methods are also discussed through the analysis of several experiments. Among these methods, OpenE adopts a new method of n-gram weighting which employs a local corpus and a large global corpus. Through the experiments, this method is proved to be practical for machine translation evaluation.

作者孙连恒杨莹姚天顺

机构地区东北大学计算机软件与理论研究所语言工程实验室机器翻译评测研究组

出处《中文信息学报》 CSCD 北大核心 2004年第2期15-22,共8页 Journal of Chinese Information Processing

基金国家重点基础研究资助项目 (G19980 30 5 0 11)

关键词人工智能机器翻译评测方法信息量计算 n-gram共现 OpenE artificial intelligence machine translation MT evaluation information computing n-gram co-occurrence

分类号 TP391.2 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1[1]Kishore Papineni, et al. BLEU: a method for automatic evaluation of machine translation[R]. Technical Report RC22176 (W0109-022), IBM Research Division, Thomas J. Watson Research Center, 2001.
2[2]Doddington. Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics [R]. NIST Research Report, 2002.
3[3]Kjersti Aas, Line Eikvil. Text Categorisation: A Survey[M]. Raport NR 941. Norwegian Computing Center, 1999.
4[4]E.H. Hovy. Toward finely differentiated evaluation metrics for machine translation[A]. In: Proceedings of the Eagles Workshop on Standards and Evaluation, Pisa, Italy, 1999.
5[5]EAGLES. Evaluation of Natural Language Processing Systems FINAL REPORT[R]. EAGLES DOCUMENT EAG-II-EWG-PR.1, 1999.
6[6]J.S. White, T. OConnell. The ARPA MT evaluation methodologies: evolution, lessons, and future approaches[A]. In: Proceedings of the First Conference of the Association for Machine Translation in the Americas, 193-205, Columbia, Maryland, 1994.

同被引文献78

1贺敏,王丽宏,杜攀,张瑾,程学旗.基于有意义串聚类的微博热点话题发现方法[J].通信学报,2013,34(S1):256-262. 被引量：12
2姚建民,周明,赵铁军,李生.基于句子相似度的机器翻译评价方法及其有效性分析[J].计算机研究与发展,2004,41(7):1258-1265. 被引量：17
3梁三云.机器翻译与计算机辅助翻译比较分析[J].外语电化教学,2004(6):42-45. 被引量：43
4唐承亮,肖海青,向华政.基于文字RGB颜色变化的脆弱型文本数字水印技术[J].计算机工程与应用,2005,41(36):6-8. 被引量：21
5陈贵敏,贾建援,韩琪.粒子群优化算法的惯性权值递减策略研究[J].西安交通大学学报,2006,40(1):53-56. 被引量：308
6华琳,阎岩,张建.关于对诊断一致性Kappa系统的探讨[J].数理医药学杂志,2006,19(5):518-520. 被引量：64
7张霄军,陈小荷.NIST2005机器翻译评测(MT—05)简评[J].南京师范大学文学院学报,2006(3):166-168. 被引量：2
8穆雷.翻译测试及其评分问题[J].外语教学与研究,2006,38(6):466-471. 被引量：80
9贺学耘,陈溪辉.语境分析:机器翻译不可忽视的因素[J].外语与外语教学,2007(4):51-53. 被引量：13
10陈天莹,陈蓉,潘璐璐,李红军,于中华.基于前后文n-gram模型的古汉语句子切分[J].计算机工程,2007,33(3):192-193. 被引量：25

引证文献8

1蔡伟鸿,佘立宇,邓宇乔,辛丽萍,熊智.潮汕方言计算机输入法的研究[J].汕头大学学报（自然科学版）,2007,22(4):1-6.
2文秋芳,秦颖,江进林.英语考试翻译自动评分中双语对齐技术的应用[J].外语电化教学,2009(1):3-8. 被引量：23
3王茜.基于BLEU的英语翻译自动评分研究[J].安徽电子信息职业技术学院学报,2010,9(4):65-66. 被引量：7
4陈江萍,丁韧,姜山.元数据记录的自动翻译：德州历史数字图书馆个例分析[J].图书情报工作,2011,55(2):16-20. 被引量：2
5唐泽,吴敏,吴桂兴,郭燕.改进粒子群BP算法的四六级翻译评分模型[J].计算机系统应用,2015,24(9):140-145. 被引量：3
6何天文,王红.基于语义语法分析的中文语句困惑度评价[J].计算机应用研究,2017,34(12):3538-3542. 被引量：11
7袁润,刘邦国,王丹.有道智云翻译API在图书馆信息服务中的应用研究[J].图书情报研究,2019,12(3):50-55. 被引量：2
8周斌,饶萍.基于实例的机器翻译评测及译后编辑修正模式[J].浙江理工大学学报（社会科学版）,2020,44(3):236-244. 被引量：10

二级引证文献58

1周胜男.人工智能背景下机器翻译在不同文本中的应用与思考[J].科教导刊,2022(7):39-41.
2邹申,陈炜.TEM4评分效度与计算机辅助评卷[J].外语电化教学,2010(1):56-60. 被引量：13
3蔡静.新世纪以来国内信息化翻译教学研究述评[J].外语界,2010(2):8-18. 被引量：24
4江进林,文秋芳.N元组和翻译单位对英译汉自动评分作用的比较研究[J].现代外语,2010,33(2):177-184. 被引量：14
5丁薇.构建大学英语翻译教研网络平台的设想[J].安康学院学报,2011,23(1):99-102. 被引量：2
6田艳.网上英译汉自动评分实践探索[J].中国翻译,2011,32(2):38-41. 被引量：15
7江进林,文秋芳.大规模测试中学生英译汉机器评分模型的构建[J].外语电化教学,2012(2):3-8. 被引量：18
8田霖,王桥影,赵晓茫.CAS在自学考试翻译测验评分中的应用研究[J].教育与考试,2012(1):5-9. 被引量：2
9任大玲.翻译教学与翻译技术并重的项目型翻译能力培养课程模式[J].外语电化教学,2013(3):42-48. 被引量：33
10江进林.近五十年来自动评分研究综述——兼论中国学生英译汉机器评分系统的新探索[J].现代教育技术,2013,23(6):62-66. 被引量：4

1吕婷婷,张政.基于N-gram共现的机器翻译自动评估的研究[J].北京工商大学学报（自然科学版）,2006,24(5):50-53.
2胡发焕,邱小童,朱花.C8051F单片机在自动机器人上的应用[J].信息化纵横,2009(5):24-26. 被引量：1
3车清太.计算机软件产品可靠性的探讨与研究[J].山西电子技术,2003(5):3-5. 被引量：1
4李予生,曲宏山.基于LAMP的诚信档案和综合素质评测系统的设计与实现[J].河南科技,2016,35(3):25-26.
5陈静.试谈CAD软件评测工作的重要性和必要性[J].机械工业自动化,1995,17(2):15-17.
6游彬,严岳松,孙英阁,刘靖.基于HowNet的信息量计算语义相似度算法[J].计算机系统应用,2013,22(1):129-133. 被引量：16
7陈保亚,宋作艳,邱立坤,陈泽浩,密雪飞.网络文本中的词汇自动识别[J].科学中国人,2003(11):52-53.
8高俊涛,林煜熙,姚建民.基于语言模型的机器翻译评价方法及其性能评价方法研究[J].中国科技信息,2008(20):108-108. 被引量：1
92006年eAutomation全球合作伙伴经销大会揭开Open eAutomation经营方针[J].微计算机信息,2006(11X):323-323.
10高廷丽,陶建华,戴红亮,李雅.傣文自动分词系统的设计与实现[J].中文信息学报,2013,27(6):187-191. 被引量：2

中文信息学报

2004年第2期

浏览历史

内容加载中请稍等...

OpenE:一种基于n-gram共现的自动机器翻译评测方法被引量：8

参考文献6

同被引文献78

引证文献8

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

OpenE:一种基于n-gram共现的自动机器翻译评测方法 被引量：8

参考文献6

同被引文献78

引证文献8

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

OpenE:一种基于n-gram共现的自动机器翻译评测方法被引量：8