期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

全国英语等级考试锚测验非等组设计中样本量对等值结果的影响

The Effects of the Sample Size on the Result of Test Equating on the Common-Item Nonequivalent Group Design for PETS

下载PDF

导出

摘要本研究采用锚测验非等组设计,探究了锚测验样本量的变化对等值结果的影响。数据来自全国英语等级考试(PETS),使用以Bigsteps为核心的自主改进软件,基于Rasch模型估计题目参数。为了探究等值结果对合格分数线的影响,本研究对比了不同样本量锚测验参数估计值与锚题参数给定值的差异,并对不同样本量锚测验得出的实考试卷等值结果与最大样本量锚测验得出的实考试卷等值结果进行了差异分析。结果表明,当锚测验样本量达到150时,等值结果比较稳定。这一结果表明,PETS设定的300人左右的锚测验样本量是合理的。 This study explores the effects of the sample size on the result of test equating on the common-item nonequivalent group design, using data from the Public English Test System （PETS）. This study uses a self- improved Rasch-based software tool called Bigsteps to estimate the item parameter. To explore the effects of test equating on the passing score, the researchers compare the parameter estimate based on the different-sample-size anchor test and the given value of the parameter, and analyze the difference between the equating results on the live test based on the different-sample-size anchor test and the largest- sample-size anchor test. It turns out that the equating result becomes stable when the increasing sample size reaches 150. Therefore, the sample size of 300, which PETS uses, is reasonable.

作者景春丽马洁章建石

机构地区教育部考试中心

出处《中国考试》 2017年第6期60-64,共5页 journal of China Examinations

关键词锚测验非等组设计项目反应理论单参数模型等值 Common-Item Nonequivalent Group Design Item Response Theory Rasch Model Equating

分类号 G405 [文化科学—教育学原理]

引文网络
相关文献

参考文献4

1谢小庆.考试分数等值的新框架[J].考试研究,2008,4(2):4-17. 被引量：21
2戴海崎.等值误差理论与我国高考等值的误差控制[J].江西师范大学学报（哲学社会科学版）,1999,32(1):30-36. 被引量：9
3马洪超.考生样本量对项目反应理论(IRT)等值稳定性的影响[J].考试研究,2011,7(2):62-66. 被引量：5
4莫春晖.PETS垂直量表的建立[J].中国考试,2014(10):40-46. 被引量：2

二级参考文献8

1谢小庆.关于ＨＳＫ等值的试验研究[J].世界汉语教学,1998,12(3):88-96. 被引量：5
2万峰,范世福.Hamamatsu图像传感器及其在紫外可见光谱测量中的应用[J].分析仪器,2006(1):49-51. 被引量：5
3焦丽亚,辛涛.基于CTT的锚测验非等组设计中四种等值方法的比较研究[J].心理发展与教育,2006,22(1):97-102. 被引量：11
4Knupp,T.&Tao,W.Vertical Scaling[M].Presentation for the NEEA visitors.Iowa City,IA.2011,11.
5谢小庆.考试分数等值的新框架[J].考试研究,2008,4(2):4-17. 被引量：21
6谢小庆.HSK和MHK的等值[J].考试研究,2005,1(1):33-46. 被引量：10
7戴海崎.等值误差理论与我国高考等值的误差控制[J].江西师范大学学报（哲学社会科学版）,1999,32(1):30-36. 被引量：9
8李正心.SIGNIFICANCE TESTS FOR THE SECULAR POLAR MOTION DURING THE YEARS 1949—1976[J].Chinese Science Bulletin,1982,27(9):973-977. 被引量：1

共引文献31

1陈梦琳,吕欣.主观性试题准锚等值方法探究[J].语言规划学研究,2020(1):74-83.
2戴海崎,刘启辉.锚题题型与等值估计方法对等值的影响[J].心理学报,2002,34(4):367-370. 被引量：17
3刘瑜.对男大学生上肢力量类测验项目的等值研究[J].首都体育学院学报,2005,17(6):37-40. 被引量：3
4柴省三.汉语水平考试(HSK)复本测验稳定程度的历时性研究[J].现代语文（下旬．语言研究）,2011(2):123-127. 被引量：1
5马洪超.考生样本量对项目反应理论(IRT)等值稳定性的影响[J].考试研究,2011,7(2):62-66. 被引量：5
6余娟.对数线性模型在等值中的应用综述[J].大江周刊（论坛）,2011(11):211-212.
7徐岩,丁朝蓬,王利.新课程实施以来学生评价改革的回顾与思考[J].课程．教材．教法,2012,32(3):12-21. 被引量：31
8黎光明,张敏强.IRT测验等值流程化操作思路的构建[J].中国考试,2012(11):3-10. 被引量：6
9张晋军,张慧君,张铁英,符华均,黄贺臣.新汉语水平考试HSK(六级)试卷难度控制研究[J].中国考试,2012(11):17-19. 被引量：8
10程乾.“测验连接”概念框架演变述评[J].考试研究,2013,9(2):71-79. 被引量：1

1张泉慧,张颖,何佳,邹杰文,王娇艳.基于固定共同题方法的IRT等值模型比较研究[J].中国考试,2017(6):65-69. 被引量：2
2姜黄飞.一类含参数的分式方程(初二)[J].数理天地（初中版）,2017,0(6):3-3.
3谢旭升.以双理论相结合为指导的新型组卷程序设计[J].江西师范大学学报（自然科学版）,1995,19(4):311-315.
4郑玉春.优化护理学基础技能考核方法的实践与效果评价[J].卫生职业教育,2017,35(10):126-127. 被引量：1
5陆根尧,朱省娥.中国教育对经济增长影响的研究[J].数量经济技术经济研究,2004,21(1):15-19. 被引量：44
6王一波,杨涛,辛涛.无锚题测验等值设计方法研究进展[J].考试研究,2017,13(3):48-54. 被引量：3
7毛丽连.义务教育阶段教师交流政策满意度的差异分析--基于广东省S县的实证研究[J].现代教育论丛,2017(2):58-66.
8李卫东.学校体育评价:中学生主观幸福感的重要预测源[J].教育导刊（上半月）,2017(5):43-47.
9杨燕明.我的小组长——数学后进生转化实录[J].课程教育研究（学法教法研究）,2017,0(14):107-107.
10彭金栓,方媛,徐磊,邵毅明.基于个体特征的全日制专业学位研究生满意度差异分析[J].课程教育研究（学法教法研究）,2017,0(13):6-7.

中国考试

2017年第6期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部