ROUGE-SN:基于跨越N元语法的机器翻译评测方法被引量：2

ROUGE-SN: A Machine Translation Evaluation Method Based on Skip-Ngram

下载PDF

导出

摘要本文在ROUGE-S的基础上提出一种基于跨越N元语法的ROUGE-SN机器翻译评测方法,在跨越二元语法(Skip-bigram)的基础上尽量延长N元语法的长度,使更多的句子连贯信息得以体现。并通过设置N元语法的阈值、综合系统运行代价和译文匹配效率等因素选定ROUGE-S6对ROUGE-S进行改进。在俄汉双语句子数据集上对谷歌、百度、必应、有道在线翻译系统的俄汉翻译输出译文进行评测,ROUGE-S6方法与传统ROUGE-S以及BLEUS的评测结果一致且性能优于ROUGE-S和BLEUS;且基于跨越N元语法的ROUGE-S6使得ROUGE-S的性能得以提升,对于百度系统而言,ROUGE-S性能提升44.52%,对于谷歌系统而言,提升50.45%,对必应系统提升42.19%,有道系统中ROUGE-S性能提升40.01%。 This paper addressed a new machine translation evaluation method ROUGE-SN based on Skip-Ngram. This new method tried to extend the length of N-gram on the basis of Skip-bigram, to embody more sentence coherence information. What's more, it set Nth as the threshold value of N-gram, and selected ROUGE-S6 to improve the ROUGE-S performance considering the running cost of the system and the translations matching efficiency. Experiments were performed in Russian and Chinese bilingual sentence data set and it evaluated the output translations of online translation system such as Google, Baidu, Bing and Youdao. The evaluation results of ROUGE-SN were consistent with that of ROUGE-S and BLEUS, and the performance of ROUGE-SN was the best in the three. The experiment results also showed that the ROUGE-S6 based on Skip-Ngram improve the ROUGE-S performance. For Baidu, the ROUGE-S performance improved 44.52%; Google was 50.45%; Bing 42.19% and Youdao 40.01%.

作者于俊婷何宏业刘伍颖易绵竹

机构地区洛阳外国语学院语言工程系 [ 广东外语外贸大学语言工程与计算实验室

出处《数码设计》 2017年第3期1-5,共5页 Peak Data Science

基金国家语委重点项目(ZDI135-26) 广东省高校特色创新项目(2015KTSCX035)

关键词跨越N元语法 ROUGE-SN ROUGE-S 机器翻译评测 Skip-Ngram ROUGE-SN ROUGE-S machine translation evaluation

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1姚建民,周明,赵铁军,李生.基于句子相似度的机器翻译评价方法及其有效性分析[J].计算机研究与发展,2004,41(7):1258-1265. 被引量：17

二级参考文献16

1C Brew,H S Thompson.Automatic evaluation of computer generated text:A progress report on the TextEval project.Human Language Technology Workshop,Arpa,Isto,1994
2Shiwen Yu.Automatic evaluation of quality for machine translation systems.Machine Translation,1993,8(1/2):117～126
3A Guessoum,R Zantout.Semi-automatic evaluation of the grammatical coverage of machine translation systems.MT Summit Conf,Santiago de Compostela,2001
4Sungryong Koh,Jinee Maeng,et al.A test suite for evaluation of English-to-Korean machine translation systems.MT Summit Conf,Santiago de Compostela,2001
5Shoichi Yokoyama,Hideki Kashioka,et al.An automatic evaluation method for machine translation using two-way MT.MT Summit Conf,Santiago de Compostela,2001
6Keiji Yasuda,Fumiaki Sugaya,et al.An automatic evaluation method of translation quality using translation answer candidates queried from a parallel corpus.MT Summit Conf,Santiago de Compostela,2001
7Yasuhiro Akiba,Kenji Imamura,Eiichiro Sumita.Using multiple edit distances to automatically rank machine translation output.MT Summit Conf,Santiago de Compostela,2001
8Jianmin Yao,Ming Zhou,et al.An automatic evaluation method for localization oriented lexicalised EBMT system.The 19th Int'l Conf on Computational Linguistics (COLING-2002),Taipei,2002
9V I Levenshtein.Binary codes capable of correcting deletions,insertions and reversals.Doklady Akademii Nauk SSSR,1965,163(4):845～848
10A R Wagner,M Fischer.The string-to-string correction problem.Journal of the ACM,1974,21(1):168～173

共引文献16

1韩阳.论网络信息资源在英语教学中的实际运用[J].科技信息,2006(11X):112-112. 被引量：1
2化柏林.基于句子匹配的文章自写度测评系统[J].现代图书情报技术,2007(11):40-44. 被引量：2
3黄珏,黄志远.基于Lucene的语段模糊匹配中文检索系统设计与实现[J].浙江理工大学学报（自然科学版）,2009,26(1):109-113.
4文秋芳,秦颖,江进林.英语考试翻译自动评分中双语对齐技术的应用[J].外语电化教学,2009(1):3-8. 被引量：23
5田霖,王桥影,赵晓茫.CAS在自学考试翻译测验评分中的应用研究[J].教育与考试,2012(1):5-9. 被引量：2
6周荣锋,秦惠基.浅谈我国医学文献资源布局[J].医学情报工作,2000,21(2):27-28.
7袁创国.浓香型白酒生产如何改造低产质窖池[J].酿酒科技,2000(3):40-41.
8陈吉荣.论翻译教学中的过程性评价[J].西南科技大学学报（哲学社会科学版）,2013,30(2):51-58.
9于俊婷,何宏业,刘伍颖,易绵竹.基于同义词词林的平滑BLEU研究[J].郑州大学学报（理学版）,2017,49(2):54-59. 被引量：2
10王帅,赵翔,李博,葛斌,汤大权.TP-AS:一种面向长文本的两阶段自动摘要方法[J].中文信息学报,2018,32(6):71-79. 被引量：12

同被引文献34

1梁三云.机器翻译与计算机辅助翻译比较分析[J].外语电化教学,2004(6):42-45. 被引量：43
2张霄军,陈小荷.NIST2005机器翻译评测(MT—05)简评[J].南京师范大学文学院学报,2006(3):166-168. 被引量：2
3贺学耘,陈溪辉.语境分析:机器翻译不可忽视的因素[J].外语与外语教学,2007(4):51-53. 被引量：13
4米海涛,赵红梅,刘群.第十二届机器翻译峰会和NIST2009机器翻译评测研讨会简介[J].中文信息学报,2009,23(6):122-125. 被引量：4
5赵红梅,刘群.机器翻译及其评测技术简介[J].术语标准化与信息技术,2010(1):36-41. 被引量：11
6李茂西,宗成庆.机器翻译系统融合技术综述[J].中文信息学报,2010,24(4):74-84. 被引量：16
7王茜.基于BLEU的英语翻译自动评分研究[J].安徽电子信息职业技术学院学报,2010,9(4):65-66. 被引量：7
8周兴华.计算机辅助翻译教学:方法与资源[J].中国翻译,2013,34(4):91-95. 被引量：38
9龚惠群,刘琼泽,黄超.机器人产业技术机会发现研究——基于专利文本挖掘[J].科技进步与对策,2014,31(5):70-74. 被引量：26
10冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018,41(6):35-48. 被引量：84

引证文献2

1周斌,饶萍.基于实例的机器翻译评测及译后编辑修正模式[J].浙江理工大学学报（社会科学版）,2020,44(3):236-244. 被引量：10
2吴柯烨,孙建军,谢紫悦.基于专利文本挖掘的细粒度技术机会分析[J].情报学报,2023,42(10):1199-1212. 被引量：2

二级引证文献12

1周胜男.人工智能背景下机器翻译在不同文本中的应用与思考[J].科教导刊,2022(7):39-41.
2金鹏,张春祥,冯禹瑄,贾永刚,王淇桢.基于语言学资源的汉-英机器翻译[J].科学技术创新,2021(4):99-100. 被引量：1
3孙李丽,郭琳,文旭,张文诺.基于双向GRU神经机器模型的乡土小说翻译方法[J].计算机与现代化,2021(4):27-31. 被引量：1
4赵涛.机器翻译译后编辑的现状与问题[J].外语教学,2021,42(4):100-104. 被引量：16
5陈蓉,樊飞飞,王晓.机器翻译过程中词汇层面的译前编辑方法[J].西安邮电大学学报,2021,26(5):101-110.
6郑爱香,何泉,王春霞.机器翻译译后编辑能力的培养与实践——以英语学术论文写作为例[J].西安文理学院学报（社会科学版）,2022,25(1):92-95. 被引量：3
7赵石楠,杜文.基于改进短语翻译模型的外语数据库智能校对系统[J].自动化与仪器仪表,2022(2):90-93. 被引量：5
8王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
9李冬艳.基于人机交互的自动化英汉翻译系统设计[J].自动化与仪器仪表,2022(6):181-185.
10晏芳,罗刚峰,司海峰.面向平行语料库和多层次语言特征的英语翻译系统研究[J].自动化与仪器仪表,2023(3):213-217.

1刘文杰.探析俄汉翻译中动物形象的文化象征空缺[J].俄语学习,2017(4):32-37. 被引量：1
2陈孝慈,谭章禄,单斐,高青.基于Bigram的安全隐患文本分类研究[J].中国安全科学学报,2017,27(8):156-161. 被引量：10
3张锦锋.基于多特征组合的SVM新闻文本情感分析[J].数码世界,2018,0(1):362-363.
4张东雷.注射用血栓通对急性缺血性脑血管病患者的临床疗效[J].世界最新医学信息文摘,2017,0(57):178-179. 被引量：1
5原伟,易绵竹.基于维基百科的俄汉可比语料库构建及可比度计算[J].山东大学学报（理学版）,2017,52(9):1-6. 被引量：3
6李艳萍.俄汉翻译实践中汉语动词及动词性短语的翻译及其运用[J].长江丛刊,2017,0(28):94-94.
7陈显龙.基于领域自适应语言模型的机器翻译[J].岭南学术研究,2017,12(3):51-56.
8蒋凤,吴修建.探讨案例教学在耳鼻咽喉科临床护理教学中的应用价值[J].世界最新医学信息文摘,2017,17(54):226-226. 被引量：6
9郭俊松.针灸与推拿相结合治疗肩周炎的作用机理[J].世界最新医学信息文摘,2017,0(85):165-165.
10王长雷.研究下肢骨折患者椎管内麻醉前应用地佐辛镇痛的临床疗效[J].世界最新医学信息文摘,2017,0(A0):53-53. 被引量：3

数码设计

2017年第3期

浏览历史

内容加载中请稍等...

ROUGE-SN:基于跨越N元语法的机器翻译评测方法被引量：2

参考文献1

二级参考文献16

共引文献16

同被引文献34

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

ROUGE-SN:基于跨越N元语法的机器翻译评测方法 被引量：2

参考文献1

二级参考文献16

共引文献16

同被引文献34

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

ROUGE-SN:基于跨越N元语法的机器翻译评测方法被引量：2