An Application of Classical Test Theory and Manyfacet Rasch Measurement in Analyzing the Reliability of an English Test for Non-English Major Graduates 被引量：1

运用经典测验理论和多层面Rasch测量理论对一次“非英语专业研究生学位课程考试”的分析(英文)

导出

摘要本研究以经典测验理论和多侧面Rasch测量模型为基础,运用SPSS和FACETS软件分析了一次"非英语专业研究生英语学位课程考试"的信度。经典测验信度分析结果表明,学生主客观部分的成绩没有显著相关性,三个主观考试题目的内部一致性也不够好,整体内部一致性信度不高。多侧面Rasch测量分析结果显示,两个评分员不同的严厉度、三个主观考试任务各不相同的难度、以及部分学生与某些考试任务的偏差交互作用是导致成绩内部一致性较差的主要因素。这些研究结果对考试设计和评分以及语言教学有如下启示:不仅要训练评分员保持自身一致而且要互相一致;教师应该系统学习和掌握基础的测量理论和考试设计知识,以设计内部一致性信度较高的考试题目或任务;教师在教学中要重视培养和提高学生的综合语言技能。本研究以经典测验理论和多侧面Rasch测量模型为基础,运用SPSS和FACETS软件分析了一次"非英语专业研究生英语学位课程考试"的信度。经典测验信度分析结果表明,学生主客观部分的成绩没有显著相关性,三个主观考试题目的内部一致性也不够好,整体内部一致性信度不高。多侧面Rasch测量分析结果显示,两个评分员不同的严厉度、三个主观考试任务各不相同的难度、以及部分学生与某些考试任务的偏差交互作用是导致成绩内部一致性较差的主要因素。这些研究结果对考试设计和评分以及语言教学有如下启示:不仅要训练评分员保持自身一致而且要互相一致;教师应该系统学习和掌握基础的测量理论和考试设计知识,以设计内部一致性信度较高的考试题目或任务;教师在教学中要重视培养和提高学生的综合语言技能。

作者孙海洋

机构地区北京外国语大学中国外语教育研究中心

出处《Chinese Journal of Applied Linguistics》 2010年第2期87-102,126,共17页 中国应用语言学（英文）

关键词 classical test theory many-facet Rasch measurement RELIABILITY bias analysis 经典测验理论多侧面Rasch测量信度偏差分析

分类号 H319 [语言文字—英语]

引文网络
相关文献

参考文献39

1Baker F. B.The Basics of Item Response Theory. . 1985
2Rasch,G.Probabilistic Models for Some Intelligence and Attainment Tests. . 1980
3Saif,S.A needs-based approach to the evaluation of the spoken language ability of international teaching assistants. Canadian Journal of Applied Linguistics . 2002
4Shameem,N.Validating self-reported language proficiency by testing performance in an immigrant community: The Wellington Indo-Fijians. Language Testing . 1998
5Shohamy, E.,Gordon, C. M.,Kraemer, R.The effect of rater’s background and training on the reliability of direct writing tests. The Modern Language Journal . 1992
6Shultz, S. K.,Whitney, D. J.Measurement Theory in Action: Case Studies and Exercises. . 2005
7Weir,C.Language Testing and Validation: An Evidence-based Approach. . 2005
8Baker,R.Classical test theory and item response theory in test analysis. Language Testing Update Special Report No. 2 . 1997
9Bechger,T. M. et al.Using classical test theory in combination with item response theory. Applied Psychology . 2003
10Brown,J. D.Testing in Language Programs. . 1996

同被引文献29

1桂诗春.我国英语专业学生英语词汇量的调查和分析[J].现代外语,1985,8(1):1-6. 被引量：117
2周大军,文渤燕.理工科学生英语词汇量状况全程调查[J].外语教学与研究,2000,32(5):356-361. 被引量：129
3崔艳嫣,王同顺.接受性词汇量、产出性词汇量与词汇深度知识的发展路径及其相关性研究[J].现代外语,2006,29(4):392-400. 被引量：71
4Belgar D. A Rasch-based validation of the Vocabulary Size Test [ J]. Language Testing 2010, 27:101-118.
5Bond T G & Fox C M. Applying the Rasch Model: Fundamental Measurement in the Human Sciences (2rid ed. )[ M]. Mahwah, N.J. : Erlbaum, 2007.
6Green R. Statistical Analyses for Language Testers [ M ]. London : Palgrave Macmillan, 2013.
7Karami H. The development and validation of a bilingual version of the Vocabulary Size Test [ J ]. RELC Jour- nal, 2012, 43: 53-67.
8Linacre J M. A user's guide to WINSTEPS/MINISTEP: Rasch-model computer programs[ EB/OL]. Chicago, IL: Winsteps. com, 2006.
9Meara P & Buxton B. An alternative to multiple choice vocabulary tests [ J]. Language Testing, 1987, 4:142 -154.
10Messick S. Validity[ A]. In Linn R L(Ed. ). Educational Measurement (3rd ed. ) [ C]. New York: Macmil- lan, 1989.

引证文献1

1赵平,纪晓丽.基于经典测试理论和项目反应理论的VST测试工具效度研究[J].外语测试与教学,2016(2):39-46. 被引量：4

二级引证文献4

1吴小峰.Rasch模型在教学质量监测工具评价上的应用——以高中遗传学核心概念为例[J].教育研究与评论（中学教育教学）,2018(12):45-49.
2马蓉,刘田雨.国内二语词汇测试研究述评(1978—2018)[J].外语测试与教学,2020,0(1):10-16.
3侯炳楠.基于CiteSpace的国内语言测试研究综述[J].文化学刊,2023(4):154-157.
4余舒林,董哲,黄思烨,刘瑜婷,杨海容.英语学习策略及词汇量研究综述[J].现代语言学,2022,10(7):1411-1417.

1王跃武,朱正才,杨惠中.作文网上评分信度的多面Rasch测量分析[J].外语界,2006(1):69-76. 被引量：28
2向红笳.中央民族大学研究生英语教学改革初探[J].民族教育研究,1997,8(2):80-82.
3王晓娜.浅谈新课改下初中英语教学中的小组合作学习[J].软件（教学）,2013(7):30-30.
4童红灯,徐建华.加强口语、阅读、写作训练,提高英语听力水平[J].浙江教育学院学报,2003(4):100-104. 被引量：4
5杨楠.论语言测量理论在大学英语教学实践过程中的合理应用[J].青年文学家,2012,0(15):76-76.
6张化丽.英语新闻理解偏差分析[J].新闻知识,2010(11):104-105.
7董建民.用现代教育理论指导大学英语考试[J].内蒙古师范大学学报（教育科学版）,2000,13(4):119-121. 被引量：1
8王立群.美国托业考试的信度分析及对我国大规模英语语言测试的启示[J].南通纺织职业技术学院学报,2013,13(2):88-90.
9乔治.恩舟赫尔德,朱宇.以多面Rasch模型测量写作能力[J].教育与考试,2007(4):72-79. 被引量：1
10孙海洋,魏梅.口语测试评分标准的现代测试学分析[J].外语与外语教学,2012(6):66-70. 被引量：10

Chinese Journal of Applied Linguistics

2010年第2期

浏览历史

内容加载中请稍等...

An Application of Classical Test Theory and Manyfacet Rasch Measurement in Analyzing the Reliability of an English Test for Non-English Major Graduates 被引量：1

参考文献39

同被引文献29

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史