翻译质量自动评估特征集被引量：6

A feature set for automated human translation quality estimation

导出

摘要本文主要介绍一套人工翻译质量自动评估特征集。该特征集包含单语、双语、语言模型三类翻译质量指标特征,使用该特征集和机器学习方法构建的自动评分系统可从内容充分性和语言流畅性两个方面对人工翻译进行质量预测。基于支持/相关向量机学习算法,研究将此特征集与QuEst基线集进行对比,并尝试使用模拟退火算法从特征集中选取部分对模型预测作用更有价值的特征,进行二次建模。结果表明,该特征集对翻译流畅性的预测优于基线特征集,二者对译文充分性的预测无显著差别;经过特征筛选后的评分模型对译文流畅性的预测作用显著提高;特征集系统和基线系统对译文充分性预测均优于对流畅性的预测。 We introduce a feature set for automated human translation quality estimation(AHTQE).This set comprises translation quality indicators of monolingual,bilingual and language model(LM)features,on which machine learning techniques can be employed to build AHTQE systems to predict translation qualities in terms of content adequacy and language fluency.We compare the feature set with the QuEst baseline set,using them in models trained with support vector machine(SVM)and relevance vector machine(RVM)on the same data set.We also report an experiment on feature selection with simulated annealing(SA)algorithm to opt for fewer but more contributing features from the whole set.Our experiments show that models trained on our feature set perform consistently better in predicting the fluency than the models trained on the baseline feature set,but there is no significant difference found among them for predicting adequacy.Through feature selection,our scoring model significantly improves to predict fluency.Both the baseline set and our feature set perform better in estimating translation adequacy than in predicting translation fluency.

作者袁煜

机构地区南京信息工程大学

出处《外语教学与研究》 CSSCI 北大核心 2016年第5期776-787,801,共12页 Foreign Language Teaching and Research

基金国家建设高水平大学公派研究生项目(留金发[2013]3009号)资助

关键词翻译质量评估特征选取文本分类机器学习

分类号 H315.9 [语言文字—英语]

引文网络
相关文献

参考文献20

1Avramidis, E. 2012. Quality estimation for machine translation output using linguistic analysis and decoding features [A]. In C. Callison-Burch, P. Koehn, C. Monz, M. Post, R. Soricut & L. Specia (eds.). Proceedings of the Seventh Workshop on Statistical Machine Translation [C]. Montreal: Association for Computational Linguistics. 84-94.
2Babych, B. & A. Hartley. 2008. Sensitivity of automated MT evaluation metrics on higher quality MT output: BLEU vs task-based evaluation methods [A]. In N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis &D. Tapias (eds.). Proceed. ings of the Sixth International Conference on Language Resources and Evaluation E C-]. Marrakeeh, Eurorman I~antmla~e Resaurce~ A.~c~iatinn (P.I .R A~ 21 ~2-21 ~f,.
3Dodigovic, M. 2005. Artificial Intelligence in Second Language Learning. Raising Error Awareness [M]. Clevedon. Multilingual Matters.
4Eisele, A. & Y. Chen. 2010. MultiUN. A multilingual corpus from the United Nations docu- ments [A]. In N. Calzolari et al. ( eds.). Proceedings of the Seventh International Con- ference on Language Resources and Evaluation, LREC 10 [C]. Valletta. European Lan- guage Resources Association (ELRA). 2868-2872.
5Guyon, I., J. Weston, S. Barnhill & V. Vapnik. 2002. Gene selection for cancer classification using support vector machines[J]. Machine Learning 46: 389-422.
6Khun, M. et al. 2014. Caret: Classification and Regression Training. Caret. R Package Ver- sion 6.0-24 [OL]. https://caran.r-project.org/src/contrib/Archive/caret (accessed 01/ 05/2016).
7Kirkpatrick, S. 1984. Optimization by simulated annealing, Quantitative studies [J]. Journal of Statistical Physics 34: 975-986.
8Manning, C., M. Surdeanu, J. Bauer, J. Finkel, S. Bethard&D. McClosky. 2014. The Stan- ford coreNLP natural language processing toolkit [A]. In K. Bontcheva &J. Zhu (eds.). Proceedings of the Conference System Demonstrations of the 52nd Annual Meeting of the Association for Computational Linguistics [C]. Baltimore, M.D:. Association for Com- putational Linguistics. 55-60.
9Neubig, G., T. Watanabe, E. Sumita, S. Mori&T. Kawahara. 2011. An unsupervised model for joint phrase alignment and extraction [A]. In D. Lin, B. Roark, Y. Matsumoto & R. Mihalcea (eds.). Proceedings of the 49th Annual Meeting of the Association for Com- putational Linguistics: Human Language Technologies. Vol. 1 [C]. Portland, OR:. As- sociation for Computational Linguistics. 632-642.
10Pad6, S., D. Cer, M. Galley, D. Jurafsky &C. Manning. 2009. Measuring machine transla- tion quality as semantic equivalence: A metric based on entailment features[J]. Machine Translation 23:181-193.

二级参考文献38

1尚福华,王宏威,黄真.自动评价机器翻译译文质量的一种方法[J].大庆石油学院学报,2004,28(3):57-59. 被引量：2
2柯飞.翻译中的隐和显[J].外语教学与研究,2005,37(4):303-307. 被引量：280
3文秋芳.英语专业学生口语词汇变化的趋势与特点[J].外语教学与研究,2006,38(3):189-195. 被引量：116
4黄瑾.ICTCLAS学习笔记[R].http://www.nlp.org.cn/docs/doclist.php,2008.
5罗爱荣,段慧明.机译评估方法评述及一个基于测试集的自动评估系统--MTE的进展[A].陈力为、袁琦主编.计算语言学进展与应用[C].北京:清华大学出版社,1995.
6俞士汶,姜新,朱学锋,等.机译译文质量自动评价原理[A].计算语言学教学参考资料[C].北京:北京大学计算机科学技术系,北京大学计算语言学研究所,1993.
7Sukkarieh, J., & Bolge, E. Leveraging C-rater's Automated Scoring Capability for Providing Instructional Feedback for Short Constructed Responses: Proceedings of the 9th International Conference on Intelligent Tutoring Systems, ITS [C]. In B. P. Woolf, E. Aimeur, R. Nkambou, & S. Lajoie (eds.). Lecture notes in computer science: Vol. 5091. 779-783. New York: Springer-Verlag, 2008.
8Waard, J.D. & Nida, E.A. From One Language to Another[M]. Tennessee, U.S.A: Thomas Nelson Publishers, 1986.
9董振东,董强.知网[M].计算语言学文集[C].北京:清华大学出版社,1999.
10董振东,董强.等:WWW.keenage.com.

共引文献39

1陆晓蕾,管新潮.翻译质量评估的现状与对策:基于人文社科与自然科学文献的计量研究(1981—2021)[J].中国ESP研究,2023(1):114-125.
2刘妍萌.基于语料库的翻译可接受度量化研究[J].语料库语言学,2021(1):56-65. 被引量：2
3张新玲,刘君玲.一项中国EFL学习者英译汉笔试成绩预测因素的实证研究[J].上海翻译,2013(4):37-40. 被引量：4
4蓝红军,穆雷.2009中国翻译研究综述[J].上海翻译,2010(3):21-26. 被引量：14
5田艳.网上英译汉自动评分实践探索[J].中国翻译,2011,32(2):38-41. 被引量：15
6何高大.基于Web的翻译系统评价[J].中国科技翻译,2012,25(1):22-25. 被引量：3
7马漪云.单句汉译英评分量表探索[J].山西农业大学学报（社会科学版）,2012,11(4):346-351. 被引量：1
8刘芳华,秦璐,张光河.翻译机器评分的研究综述[J].无线互联科技,2013,10(3):120-120. 被引量：1
9刘雪丽,林立红.中国高级英语学习者汉语词汇磨蚀研究[J].外语教学与研究,2013,45(5):719-731. 被引量：14
10张志新.语料库驱动的翻译可读性量化评估[J].蚌埠学院学报,2014,3(3):108-112. 被引量：2

同被引文献96

1穆雷.用模糊数学评价译文的进一步探讨[J].外国语,1991,14(2):68-71. 被引量：61
2陈孝大.论教师的形成性评价和终结性评价[J].教育理论与实践,1988,8(2):1-4. 被引量：6
3尚福华,王宏威,黄真.自动评价机器翻译译文质量的一种方法[J].大庆石油学院学报,2004,28(3):57-59. 被引量：2
4袁凤识,刘振前,张福勇.英语专业和非英语专业学生学习策略差异研究[J].外语界,2004(5):25-32. 被引量：93
5刘建达.学生英文写作能力的自我评估[J].现代外语,2002,25(3):241-249. 被引量：65
6赵晨.不同水平英语教学中的教师纠正反馈语——一项基于语料库的研究[J].解放军外国语学院学报,2005,28(3):35-39. 被引量：67
7楼荷英.自我评估同辈评估与培养自主学习能力之间的关系[J].外语教学,2005,26(4):60-63. 被引量：66
8蒋宇红.在线同伴评价在写作能力发展中的作用[J].外语教学与研究,2005,37(3):226-230. 被引量：122
9孙明,赵飞,赵江葵.互动式反馈对儿童二语疑问句发展作用的研究[J].国外外语教学,2007(2):1-9. 被引量：7
10王家明.英语专业学生的目标倾向与学习策略的关系[J].国外外语教学,2007(3):22-26. 被引量：5

引证文献6

1袁树厚,束定芳.我国外语教学中的形成性评价研究:回顾与思考(2002—2016)[J].外语教学理论与实践,2017(4):51-56. 被引量：47
2钟瑜,辜向东,肖巍.我国外语教育数据挖掘研究综述[J].外语与翻译,2018,0(1):79-86. 被引量：1
3马鸣皓.机器翻译质量评估刍议[J].宁波教育学院学报,2019,21(6):76-78. 被引量：4
4田艳.深度学习技术在英译汉即时自动评分中的尝试[J].中国科技翻译,2020,33(4):24-27. 被引量：1
5张利东,朱一清.基于深度学习的主观题自动评分效度研究——以大学校本英语水平考试汉译英试题为例[J].外语界,2022(2):41-48. 被引量：6
6李志强,余炫朴.基于ADASYN的跨境电商小微企业信用风险模型优化研究[J].江西师范大学学报（哲学社会科学版）,2023,56(2):118-127. 被引量：3

二级引证文献62

1卢家希.形成性评估在高职英语演讲教学中的运用[J].现代职业教育,2020,0(5):32-33.
2黄璐.我国外语教育形成性评价研究的演进与启示——基于《中国英语能力等级量表》的思考[J].现代英语,2021(1):46-49.
3牛妮妮.形成性评价在高职英语教育专业的动态运用[J].文化创新比较研究,2019,0(33):100-101. 被引量：1
4曹慧玲.OBE教育理念下的外语课堂形成性评价:理论与实践构念[J].吉林省教育学院学报,2024,40(4):89-96.
5曲抒浩,潘泰.汉字字形拆解方案与二语教学适应度论析[J].汉字文化,2021(5):127-132. 被引量：1
6何莲珍.从引介到创新:中国应用语言学研究四十年[J].外语教学与研究,2018,50(6):823-829. 被引量：15
7杨华华.基于同伴互评与教师评价相结合的英语选修课程形成性评价体系研究——以武汉轻工大学英语选修课程《高级视听》为例[J].开封教育学院学报,2018,38(8):111-112.
8穆辉.职业院校计算机英语形成性评价研究[J].科教导刊（电子版）,2018,0(29):200-200.
9肖春芳,刘志芳.形成性评价在初中英语听力教学中的应用研究[J].北方文学,2019,0(21):145-146. 被引量：1
10董伟,陈德鹏,程车智.建筑设计教学中的形成性评价及策略研究[J].建筑与文化,2019,0(12):46-48. 被引量：1

1李建美.翻译理论在中国的发展概况[J].北方文学（中）,2013(6):172-172.
2饶琪,杨红.利用成语，巧学文言[J].语数外学习（高中版）,2008(31):47-48.
3王嫣女.计算机自动评估系统辅助课堂写作教学的研究述评[J].海外英语,2012(10X):36-37. 被引量：2
4李绍青.A Quest for Foreign Language Teaching[J].学园,2010,3(16):49-50.
5王梅.词块与大学英语精读课的写作教学[J].襄樊学院学报,2007,28(6):81-84. 被引量：5
6李旭.浅谈英文原版电影剧集对英语教学的影响[J].琼州学院学报,2008,15(3):101-102. 被引量：16
7丁华福,李毅,尚福华.机器翻译质量自动评价的实践[J].黑龙江工程学院学报,2002,16(3):56-60. 被引量：1
8王宏伟.翻译中的视点转移[J].成都教育学院学报,2004,18(3):33-34.
9侯永庆.翻译目的论视阈下的新闻隐喻翻译[J].济南职业学院学报,2017(1):100-102. 被引量：1
10王德鹏.成语在中文多词表达中的提取[J].科教文汇,2012(32):67-67.

外语教学与研究

2016年第5期

浏览历史

内容加载中请稍等...

翻译质量自动评估特征集被引量：6

参考文献20

二级参考文献38

共引文献39

同被引文献96

引证文献6

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

翻译质量自动评估特征集 被引量：6

参考文献20

二级参考文献38

共引文献39

同被引文献96

引证文献6

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

翻译质量自动评估特征集被引量：6