期刊文献+

标准参照测验及其等级线信度的概化理论分析 被引量:11

Total Score and Cut-score Dependability of Criterion-referenced Testing:A Generalizability Study
下载PDF
导出
摘要 在测量工作中,误用经典测验理论方法估计标准参照性测验的整体信度和等级线决策信度的情况非常突出。如,无论测量设计是交叉的还是嵌套的,也无论测验结果是做常模参照性解释,还是做标准参照性解释,测验工作者往往只报告克龙巴赫α系数或经典测验理论中的其它少数几个信度指标,而误把整体信度作为等级线信度的现象则更加普遍,这是十分不妥的。本文借用概化理论中的可靠性指数Ф和Ф(λ)公式,分别针对交叉设计和嵌套设计,就标准参照性测验的整体信度和等级分数线决策信度的估计问题进行了探讨。用数据演示的方法比较了交叉设计与嵌套设计在估计标准参照性测验整体信度方面的差异,展示了等级决策分数线决策信度的估计方法。 In criterion-referenced testing, dependability index based on generalizability theory is the correct indicator of measurement reliability. The present study presents the rationales and procedures for estimating dependability when the purpose of the test is to determine domain status of the individuals. Another important issue in criterion-referenced testing is how to determine reliability of different cut-scores. It is shown in this study that, reliability varies depending on the distance between a particular cut-score and the overall mean of the test. Cut-scores closer to the mean were found to have lower dependability than those farther away from the mean. It is also shown that the commonly used Cronbach ? is not an adequate index of reliability for criterion-referenced use of a test. 
作者 杨志明
出处 《心理学探新》 CSSCI 2003年第3期52-56,共5页 Psychological Exploration
关键词 标准参照性测试 经典测验理论 等级线决策信度 概化理论 整体信度 数据结构 心理测验 generalizability theory criterion-referenced testing cut-score dependability
  • 相关文献

参考文献12

  • 1刘远我,张厚粲.概化理论在作文评分中的应用研究[J].心理学报,1998,30(2):211-218. 被引量:54
  • 2杨志明 张厚粲.用概化理论研究测量误差初探[J].北京师范大学学报:自然科学版,1992,28(2):62-68.
  • 3杨志明,张雷.用多元概化理论对普通话的测试[J].心理学报,2002,34(1):50-55. 被引量:21
  • 4国家语言文字委员会 普通话培训测试中JD 《语言文字应用》编辑部合编.普通话水平测试的理论与实践[E].北京:商务印书馆,1998.200-204.
  • 5Brennan R L. Generalizability Theory[ M], New York:Springer- Verlag, 2001.
  • 6Brennan R L. MGENOVA[A]. Iowa Testing Programs[C], University of Iowa, 1999.
  • 7Brennan R L. g]ements of generalizability theory[ M].Iowa City, IA: American College Testing, 1983.
  • 8Brennan R L. Elements of generalizability theory [ M ](rev ed). Iowa City, IA: American College Testing,1992.
  • 9Chang L, Hoceva D. Models of generalizability theory in analyzing existing faculty evaluation data [ J ]. Applied Measurement in Education, 2000, 13:2.55 - 275.
  • 10Chang L. Dependability of anchoring labels of Likerttype scales[J]. Educational and Psychological Measurement, 1997, 57: 808-815.

二级参考文献3

共引文献67

同被引文献131

引证文献11

二级引证文献70

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部