词汇测验中猜测行为的探查——贝叶斯猜测系列模型的应用与思考被引量：1

Detection of Testees' Guessing Behaviors in Chinese Vocabulary Test:Application of Bayesian IRT Guess Models

下载PDF

导出

摘要本研究应用Caojing等人的Bayesian IRT Guessing系列模型,分析初中二年级学生在汉语词汇测验中的猜测行为,使用DIC3指标评价模型的拟合程度,并将参数估计结果与双参数Logistic模型进行了比较。研究发现:(1)猜测模型的拟合度优于双参数Logistic模型;(2)初中二年级测验数据最适合临界猜测模型(IRT-TG),约有3.5%的学生存在TG型猜测行为;(3)猜测者的存在会明显影响本身的能力估计与项目难度估计,但是对非猜测者的能力及区分度参数估计影响不大。 This study applied the Bayesian IRT guess models by Caojing to Chinese vocabulary test of grand 8, and compared them with the 2PL-IRT using Bayesian methodology. The results show that ：（ 1 ） all guess models perform better than the 2PL model on the data set; （2） 3.5% students of grand 8are detected guessers, they answer questions based on their knowledge up to a certain test item, and guess randomly thereafter; （3） the guessers will significantly influence the estimation of their ability parameters and the item＇s difficulty parameters, however it has little impact on non- guessers＇ ability and item＇s discrimination estimates.

作者谭艳姬曹亦薇

机构地区腾讯科技(深圳)有限公司用户研究与体验设计部深圳大学

出处《考试研究》 2012年第5期19-28,共10页 Examinations Research

关键词汉语词汇测验贝叶斯猜测系列模型 MCMC DIC3 Chinese Vocabulary Test, Bayesian IRT Guess Models, MCMC, DIC3

分类号 G424.74 [文化科学—课程与教学论]

引文网络
相关文献

参考文献9

1Wise, S. L. & DeMars, C. E. , Low Examinee Effort in Low-Stakes Assessment: Problems and Potential Solutions,Educational Assessment,2005,10 ( 1 ), 1 - 17.
2Tatsuoka, K. K. , Use of Generalized Person-fit Indices, zeta for Statistical Pattern Classification, Applied Psychological Measurement, 1996, (9) ,65 - 76.
3Pintrich, P. R. & Schunk, D. H. , Moivation in Education: Theory, Research, and Application ( 2nd ed. ), Upper Saddle River, NJ : Merrill Prentice Hall,2002.
4Barton, M. A. & Lord, F. M. , An Upper Asymptote for the Three-parameter Logistic Item Response Model ( Research Bulletin 81 - 20 ), Princeton, NJ : Educational Testing Service, 1981..
5Cao,J. & Stokes, S. L., Bayesian IRT Guessing Models for Partial Guessing Behaviors, Psychometrika, 2008, ( 73 ) ,209 - 230.
6曹亦薇.初中词汇理解能力量表的编制[J].心理学报,1999,31(2):215-221. 被引量：8
7Gelman, A. & Rubin, D. , A Single Series from the Gibbs Sampler Provides a False Sense of Security, In J. M. Bernardo,J. O. Berger, A. P. Dawid and A. F. M. Smith, ( Eds. ), Bayesian Statistics 4, Oxford : Oxford University Press, 1994.
8Spiegelhalter, D. J. , Best, N. G. , Carlin, B. P. , & van der Linde, A. , Bayesian Measures of Model Complexity and Fit, Journal Royal Statistical Society, Series B, 2002,64 ( 3 ) , 583 - 639.
9Celeux, G. , F. Forbes, C. P. Robert, & D. M. Titterington, Deviance Information Criteria for Missing Data Models, Bayesian Analysis 1:2006,651 - 674.

二级参考文献2

1曹亦薇，心理科学，1998年，21卷，4期，375页
2曹亦薇，教育心理学研究（日），1993年，41卷，64页

共引文献7

1曹亦薇.异常反应模式的识别和分类[J].心理学报,2001,33(6):558-563. 被引量：9
2肖玮,苗丹民,武圣君,贡京京.应用项目反应理论对全国征兵语词推理测验的分析[J].中国行为医学科学,2007,16(6):562-564. 被引量：5
3王轶君,苗丹民,田建全,杨业兵,苏景宽.基于项目反应理论的应征青年词汇理解能力测验的编制[J].中国行为医学科学,2008,17(3):280-281.
4林丰勋,王兴华,桑建瑜.现代测验理论的发展及其在我国的应用[J].青海师范大学学报（哲学社会科学版）,2010,32(6):118-122.
5曹亦薇,张厚粲.汉语词汇测验中的项目功能差异初探[J].心理学报,1999,31(4):460-467. 被引量：15
6刘拓,张佳慧,辛涛.多项选择题中干扰项信息的利用[J].心理学探新,2015,35(3):261-265. 被引量：3
7唐细容,姚树桥.成人词汇测验的初步编制[J].中国临床心理学杂志,2003,11(1):24-27. 被引量：1

同被引文献5

1黄展岳.关于中国开始冶铁和使用铁器的问题[J].文物,1976(8):62-70. 被引量：30
2郭沫若.《希望有更多的古代铁器出土-关于古代分期问题的一个关键》,《奴隶制时代》,北京:人民出版社,1973年,第202,207页.
3胡适.《介绍我自己的思想》[A].欧阳哲生主编.《胡适文集》第5册[C].北京:北京大学出版社,1998年..
4福建省教育考试院.《普通高等学校招生全国统一考试福建省文科综合考试说明》,福州:福建教育出版社,2012年.
5白云翔.“美金”与“恶金”的考古学阐释[J].文史哲,2004(1):54-57. 被引量：7

引证文献1

1李林川.基于史料释读分歧背景的选择题命题策略刍议——以“美金”“恶金”释读题为例[J].中学历史教学,2013(8):54-56.

1陈燕芬.小学数学课堂对学生实践能力的培养[J].学子（理论版）,2014,0(11):52-52.
2李新建.让孩子不再自卑[J].数学小灵通（启智版）（低年级）,2009(10):44-46.
3杨丹,刘汉明.基于CAT的远程学习者能力估计[J].教育技术资讯,2009(9):24-27.
4须怡.什么叫智商[J].四川教育,1990(6):48-48.
5一帆.项目难度[J].教育测量与评价（理论版）,2010(1):49-49.
6叶向阳.人体杠杆系列模型[J].中国教育技术装备,2006(3):30-32. 被引量：1
7张义庭.初中二年级学生易出现两极分化的原因及对策[J].内蒙古科技与经济,2004(10):96-97. 被引量：3
8国际[J].职业技术教育,2012,33(12):14-14.
9张艺.大连市软件产业高技能型人才培养与市场需求拟合度研究[J].中国现代教育装备,2013(3):82-84. 被引量：2
10谢朝辉,马进,原海英.基于贝叶斯的网络学习效果评估系统研究[J].中国人力资源开发,2015,32(2):63-67. 被引量：3

考试研究

2012年第5期

浏览历史

内容加载中请稍等...

词汇测验中猜测行为的探查——贝叶斯猜测系列模型的应用与思考被引量：1

参考文献9

二级参考文献2

共引文献7

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

词汇测验中猜测行为的探查——贝叶斯猜测系列模型的应用与思考 被引量：1

参考文献9

二级参考文献2

共引文献7

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

词汇测验中猜测行为的探查——贝叶斯猜测系列模型的应用与思考被引量：1