基于Rasch模型的翻译测试效度研究被引量：28

Validation of a Translation Exam Based on Rasch Measurement Model

导出

摘要本文运用多面Rasch模型，从考生、评分员和评分项三个方面对一次英语篇章翻译测试的效度进行了研究。结果表明：①考生能力具有显著差异。但是，部分考生的内部答题行为不一致：1．33％的考生未发挥出实际水平，7．34％的考生出现了超常发挥的现象，3％的考生则可能未译完；②评分员的严厉度存在显著差异，但他们的评分均具有良好的内部一致性；③评分项的难度存在显著差异，区分度也较合理。总乏，这次测试整体上具有良好的效度，但考生的表现值得进一步研究。 This study investigates the validity of an English text translation exam from three perspectives： examinees, raters, and rating items by implementing Many-facet Rasch Measurement Model. Results indicate that ① exami- nees are significantly different in ability, but some examinees display inconsistency in translating. 1.33% of the examinees do not bring their competence into full play when translating some sentences, 7.34% of the examinees translate some sentences unexpectedly well, and 3% of the examinees may not finish all the sentences; ②raters have significantly different severity, but their rating has good internal self-consistency; ③ rating items are significantly different in difficulty, and they differentiate the examinees well. In general, this study provides evidence for the good validity of the translation exam, but the performance of examinees needs further study.

作者江进林文秋芳

机构地区北京外国语大学中国外语教育研究中心

出处《外语电化教学》 CSSCI 2010年第1期14-18,共5页 Technology Enhanced Foreign Language Education

基金教育部人文社会科学重点研究基地重大项目“大规模考试主观题(英汉互译)自动评分系统的研制”(批准号:07JJD740070)的资助

关键词多面RASCH模型翻译效度 Many-facet Rasch Measurement Model Translation Validity

分类号 H319.3 [语言文字—英语]

引文网络
相关文献

参考文献27

1American Psychological Association, American Educational Research Association, and National Council on Measurement in Education. Standards for Educational and Psychological Testing [Z ]. Washington, D. C. : American Educational Research Association,1999.
2Bachman, L. F. Fundamental Considerations in Language Testing [ M ]. Oxford : Oxford University Press.上海:上海外语教育出版社,1990.
3Bachman, L. F. Fundamental Considerations in Language Testing [ M ]. Oxford : Oxford University Press.上海:上海外语教育出版社,1999.
4Bachman, L. F. Statistical Analyses for Language Assessment [ M ]. Cambridge : Cambridge University Press,2004.
5Banerji, M. Construct validity of scores/measures from a developmental assessment of mathematics using classical and Many-Facet Rasch Measurement[J]. Journal of Applied Measurement,2000,1 (2) :177 - 198.
6Bonk, W. J. & Ockey, G. J. A many-facet Rasch analysis of the second language group oral discussion task [ J ]. Language Testing, 2003,20(1 ) :89 - 110.
7Eckes, T. & Grotjahn, R. A closer look at the construct validity of C- tests[ J]. Language Testing,2006,23 (3) :290 - 325.
8Eckes, T. Examining rater effects in TestDaF writing and speaking performance assessments : A many-facet Rasch analysis [ J ]. Language Assessment Quarterly,2005,2 ( 3 ) : 197 - 221.
9Elder, C. , Barkhuizen, G. , Knoch, U. & Von Randow, J. Evaluating rater responses to an online training program for L2 writing assessment[ J]. Language Testing,2007,24( 1 ) :37 -64.
10Hoyt, W. T. & Kerns, M. D. Magnitude and moderators of bias in observer ratings : A meta-analysis [ J]. Psychological Methods, 1999, 4:403 - 424.

二级参考文献106

1邹申.试论口语测试的真实性[J].外语界,2001(3):74-78. 被引量：80
2高前.全国高校英语专业四级面试的初步研究成果[J].外语界,2000(3):51-56. 被引量：4
3文渤燕.大学英语口语测试探讨[J].外语界,2000(3):57-60. 被引量：54
4文秋芳,吴彩霞.对全国英语专业四级口语水平的评估——兼评《大纲》对口语的要求[J].外语教学与研究,1999,31(1):30-35. 被引量：45
5金艳,郭杰克.大学英语四、六级考试非面试型口语考试效度研究[J].外语界,2002(5):72-79. 被引量：97
6杨惠中.大学英语口语考试设计原则[J].外语界,1999(3):48-57. 被引量：210
7文秋芳,赵学熙.全国英语四级录音口试评分的实践与研究[J].解放军外国语学院学报,1998,21(2):54-57. 被引量：26
8金艳,吴江.以“内省”法检验CET阅读理解测试的效度[J].外语界,1998(2):48-53. 被引量：38
9聂建中.高考英语口试的方法、评分及成绩分析[J].外语与外语教学,1998(5):53-54. 被引量：5
10熊敦礼,陈玉红,刘泽华,黄更新.大学英语大规模录音口语测试研究[J].外语教学与研究,2002,34(4):283-287. 被引量：54

共引文献226

1刘文宇,姜雨.多侧面模式在教育测试中的应用研究[J].鞍山师范学院学报,2007,9(5):75-79.
2尹波.影响粤西地区非英语专业学生口语能力的原因及对策——从口语抽测谈起[J].赤峰学院学报（哲学社会科学版）,2008,29(8):48-50.
3贺满足.多层面Rasch模型分析写作测试中评卷者的偏差性[J].长沙铁道学院学报（社会科学版）,2011,12(1):171-172. 被引量：3
4吴春容.英语专业学生口语水平和写作水平的相关性调查[J].四川理工学院学报（社会科学版）,2006,21(S2):194-196. 被引量：4
5吴连春,王宏军.我国外语语用能力评估与测试研究[J].浙江海洋学院学报（人文科学版）,2014,31(1):103-107. 被引量：1
6徐坤银.大学英语口语测试的理论基础及其发展趋势[J].新课程学习（下）,2010(9):12-13. 被引量：1
7刘洋.TEST METHOD EFFECT ON WRITING PERFORMANCE[J].Chinese Journal of Applied Linguistics,2008,31(4):50-65. 被引量：2
8刘艳萍,唐晓,陈英,李劼全.大学英语基础阶段口语测试模式探索[J].疯狂英语（教师版）,2007,0(4):67-70. 被引量：5
9王一安.平等交互型口试的话轮模式分析[J].杭州电子科技大学学报（社会科学版）,2009,5(1):60-64. 被引量：1
10王立非,周丹丹.我国英语口语研究12年:回顾与现状[J].外语界,2004(6):7-14. 被引量：125

同被引文献271

1陈菁.交际法原则指导下的口译测试的具体操作[J].中国翻译,2003,24(1):69-73. 被引量：46
2白英.熟识性对口语群测模式的影响(英文)[J].中国英语教学：英文版,2009(2):114-125. 被引量：1
3高一虹,李莉春,吕王君.中、西应用语言学研究方法发展趋势[J].外语教学与研究,1999,31(2):8-16. 被引量：300
4邓珞华.词频分析[J].武汉大学学报（人文科学版）,1987,41(1):113-120. 被引量：27
5罗冠中.Rasch模型及其发展[J].教育研究与实验,1992(2):40-43. 被引量：5
6周赟赟.全国翻译专业资格(水平)考试英语二级笔译试题效度分析[J].佳木斯教育学院学报,2012(4). 被引量：2
7高晓莹,辜向东.AN INTROSPECTIVE STUDY ON TEST-TAKING PROCESS FOR BANKED CLOZE[J].Chinese Journal of Applied Linguistics,2008,31(4):3-16. 被引量：4
8张洁,何莲珍.STUDY OF SOURCES OF SCORE VARIABILITY IN PERFORMANCE ASSESSMENT USING MFRM:A CASE OF SPEAKING TEST IN PETS BAND3[J].Chinese Journal of Applied Linguistics,2008,31(4):40-49. 被引量：4
9刘洋.TEST METHOD EFFECT ON WRITING PERFORMANCE[J].Chinese Journal of Applied Linguistics,2008,31(4):50-65. 被引量：2
10贾欣岚,张健青.谈翻译资格考试[J].中国科技翻译,2004,17(3):52-54. 被引量：8

引证文献28

1卫小梅,胡昔权,窦祖林,郭铁成,喻勇.脑卒中简明ICF核心要素信和效度检验的Rasch模型分析[J].中华物理医学与康复杂志,2011,33(4):260-264. 被引量：5
2江进林,王立非,马晓雷.英译汉任务中的评分员效应研究[J].解放军外国语学院学报,2011,34(6):97-101. 被引量：6
3江进林,文秋芳.大规模测试中学生英译汉机器评分模型的构建[J].外语电化教学,2012(2):3-8. 被引量：18
4马漪云.单句汉译英评分量表探索[J].山西农业大学学报（社会科学版）,2012,11(4):346-351. 被引量：1
5翟志华,李乃鹏.国际石油价格走势分析及对我国的影响[J].山西能源与节能,2000(2):40-41.
6姚淑超.Rasch模型下学生TEM-8写作测试效度的研究[J].文史博览（理论）,2012(11):45-47.
7刘文洋.提高CET-4写作测试效度的途径探析[J].内江师范学院学报,2013,28(1):98-101.
8赵守盈,何妃霞,刘妍.Rasch模型在学绩测验质量分析中的应用[J].教育研究与实验,2013(1):87-91. 被引量：11
9陈艳君.多层面Rasch模型在语言评估中的应用研究述评[J].教育测量与评价（理论版）,2014(6):9-12. 被引量：3
10郑美玲.以多面Rasch模型对一次课堂翻译测试的效度验证[J].山东农业工程学院学报,2014,31(6):164-166.

二级引证文献106

1刘海霞.基于ECD理论的中职公共基础课程学科核心素养测评研究——以中职英语学科核心素养测评为例[J].中国职业技术教育,2023(8):61-67.
2陆晓蕾,管新潮.翻译质量评估的现状与对策:基于人文社科与自然科学文献的计量研究(1981—2021)[J].中国ESP研究,2023(1):114-125.
3王帆,刘嘉琪.英语专业汉译英教学现状调研与分析——翻译失误中的汉英语域混合问题[J].现代英语,2020(11):68-70.
4张海威,张雪妍,张铁军,王睿昕.留学生识字量表编制研究[J].世界汉语教学,2021(1):126-142. 被引量：6
5高靖寒,柏毅.基于Rasch模型的小学四年级科学素养评价研究[J].东南大学学报（哲学社会科学版）,2021,23(S01):135-138. 被引量：5
6喻勇,窦祖林,卫小梅,姜丽.国际功能、残疾和健康分类应用于脑卒中后肢体痉挛评定的初步研究[J].中华物理医学与康复杂志,2012,34(7):505-510. 被引量：4
7马漪云.不同题型对翻译测试成绩的影响[J].外语测试与教学,2012(4):50-55. 被引量：3
8刘东杰.高中英语课堂口语展示的评价标准及多面Rasch模型分析[J].山东师范大学外国语学院学报（基础英语教育）,2013,15(6):10-15. 被引量：3
9姚琳,姜涌,张博.基于层次分析评估法的试题合格分数线确定[J].中国校外教育,2014(6):37-38.
10姜宁康,孙海英,陈良育,刘静.基于多面Rasch测量的软件工程专业学生开发能力评估方法[J].计算机教育,2014(11):81-86.

1赵南,董燕萍.基于多面Rasch模型的交替传译测试效度验证[J].解放军外国语学院学报,2013,36(1):86-90. 被引量：13
2麦田稻鹰急诊厅[J].求学（理科版）,2016,0(6):133-133.
3石志亮.多面Rasch模型分析软件Facets在英语测试中的应用研究[J].郑州航空工业管理学院学报（社会科学版）,2011,30(2):143-147. 被引量：2
4郑美玲.以多面Rasch模型对一次课堂翻译测试的效度验证[J].山东农业工程学院学报,2014,31(6):164-166.
5张冰.基于多面Rasch模型的评分质量分析——以一次英演讲比赛决赛为例[J].兰州教育学院学报,2013,29(12):137-138.
6江进林,王立非,马晓雷.英译汉任务中的评分员效应研究[J].解放军外国语学院学报,2011,34(6):97-101. 被引量：6
7张冰.多面Rasch模型在英演讲比赛中的应用研究[J].高考,2013,0(9X):112-113.
8翁平,覃红.从测试学角度看CET写作能力的要求[J].广西民族大学学报（哲学社会科学版）,2005,27(S2):335-336. 被引量：5
9王甲午.动词不定式用法归纳及NMET考点分析[J].英语学习辅导（高考指导版）,2002(4):8-9.
10赵红果.良好的心态是超常发挥的关键[J].山西教育（高中理科版）,2009(5):1-1.

外语电化教学

2010年第1期

浏览历史

内容加载中请稍等...

基于Rasch模型的翻译测试效度研究被引量：28

参考文献27

二级参考文献106

共引文献226

同被引文献271

引证文献28

二级引证文献106

相关作者

相关机构

相关主题

浏览历史

基于Rasch模型的翻译测试效度研究 被引量：28

参考文献27

二级参考文献106

共引文献226

同被引文献271

引证文献28

二级引证文献106

相关作者

相关机构

相关主题

浏览历史

基于Rasch模型的翻译测试效度研究被引量：28