期刊文献+
共找到152篇文章
< 1 2 8 >
每页显示 20 50 100
Reducing Item Exposure in Computerized Adaptive Testing Systems Using Automatic Item Generation 被引量:1
1
作者 Harutyun Terteryan 《Computer Technology and Application》 2014年第1期21-24,共4页
This paper studies the technics of reducing item exposure by utilizing automatic item generation methods. Known test item calibration method uses item parameter estimation with the statistical data, collected during e... This paper studies the technics of reducing item exposure by utilizing automatic item generation methods. Known test item calibration method uses item parameter estimation with the statistical data, collected during examinees prior testing. Disadvantage of the mentioned item calibration method is the item exposure; when test items become familiar to the examinees. To reduce the item exposure, automatic item generation method is used, where item models are being constructed based on already calibrated test items without losing already estimated item parameters. A technic of item model extraction method from the already calibrated and therefore exposed test items described, which can be used by the test item development specialists to integrate automatic item generation principles with the existing testing applications. 展开更多
关键词 item exposure calibration IRT item response theory adaptive testing automatic item generation item model.
下载PDF
Designing of A Computerized Cognitive Adaptive Testing Model
2
作者 He Lianzhen 《现代外语》 CSSCI 北大核心 1999年第2期169-171,共3页
Therecouldbenoscienceasweknowitwithoutmeasurement.Testing,includingallformsoflanguagetestingandpsychometricsitself,isoneformofmeasurement.Alanguagetestmaybedefinedasaprocedureforelicitinglanguageperformanceandaprocedu... Therecouldbenoscienceasweknowitwithoutmeasurement.Testing,includingallformsoflanguagetestingandpsychometricsitself,isoneformofmeasurement.Alanguagetestmaybedefinedasaprocedureforelicitinglanguageperformanceandaprocedureforassessingthatperformance.How... 展开更多
关键词 item response theory (IRT) computerIZED adaptive testING (CAT ) COGNITIVE PSYCHOLOGY (CP) computerIZED COGNITIVE adaptive testing(CCAT)
下载PDF
四参数Logistic模型潜在特质参数的Warm加权极大似然估计 被引量:3
3
作者 孟祥斌 陶剑 陈莎莉 《心理学报》 CSSCI CSCD 北大核心 2016年第8期1047-1056,共10页
本文以四参数Logistic(4-parameter Logistic,4PL)模型为研究对象,根据Warm的加权极大似然估计技巧,提出了4PL模型潜在特质参数的加权极大似然估计方法,并借助模拟研究对加权极大似然估计的性质进行验证。研究结果表明,与通常的极大似... 本文以四参数Logistic(4-parameter Logistic,4PL)模型为研究对象,根据Warm的加权极大似然估计技巧,提出了4PL模型潜在特质参数的加权极大似然估计方法,并借助模拟研究对加权极大似然估计的性质进行验证。研究结果表明,与通常的极大似然估计和后验期望估计相比,加权极大似然估计的偏差(bias)明显减小,并且具有良好的返真性能。此外,在测试的长度较短和项目的区分度较小的情况下,加权极大似然估计依然保持了良好的统计性质,表现出更加显著的优势。 展开更多
关键词 项目反应理论 四参数logistic模型 加权极大似然估计
下载PDF
多维二参数Logistic项目反应模型的Gibbs抽样法 被引量:2
4
作者 付志慧 李斌 《沈阳师范大学学报(自然科学版)》 CAS 2014年第3期379-383,共5页
项目反应理论主要有3个基本假设:单维性,局部独立性和单调性。但是这3个假设存在一些弊端亟待解决。一些科学研究表明,用单维模型来模拟多维测量数据往往会增大测量误差,导致对学生的能力做出不正确的推论。因此,研究者基于各种不同的... 项目反应理论主要有3个基本假设:单维性,局部独立性和单调性。但是这3个假设存在一些弊端亟待解决。一些科学研究表明,用单维模型来模拟多维测量数据往往会增大测量误差,导致对学生的能力做出不正确的推论。因此,研究者基于各种不同的测验背景,将单维项目反应模型推广到多维项目反应模型。多维项目反应模型涉及到的参数较多,如果采用传统的估计方法,如边际最大似然法和贝叶斯众数估计法处理起来比较困难。然而,在项目反应理论中,Gibbs抽样法可以作为一种高效灵活的估计方法加以应用。基于Gibbs抽样的增加数据的技巧,给出了多维二参数Logistic项目反应模型的Bayes估计方法。随着潜在变量的引入,每个参数的满条件分布都很容易得到,并且不受先验分布选取的限制,这样Gibbs抽样的方法就很容易实施。 展开更多
关键词 项目反应理论 多维二参数logistic模型 GIBBS抽样
下载PDF
基于三参数Logistic模型Gibbs抽样方法的敏感度分析 被引量:1
5
作者 付志慧 周末 《沈阳师范大学学报(自然科学版)》 CAS 2022年第1期71-75,共5页
通过蒙特卡罗(Monte Carlo,MC)方法研究了三参数Logistic(three-parameter Logistic,3PL)模型的Gibbs抽样方法的估计效果。首先,介绍了3PL模型的定义和参数的先验分布;其次,介绍了潜变量的引进及Gibbs抽样过程;最后,进行了模拟实验,考... 通过蒙特卡罗(Monte Carlo,MC)方法研究了三参数Logistic(three-parameter Logistic,3PL)模型的Gibbs抽样方法的估计效果。首先,介绍了3PL模型的定义和参数的先验分布;其次,介绍了潜变量的引进及Gibbs抽样过程;最后,进行了模拟实验,考虑了不同的测试长度n=10,20和40,不同的样本容量N=1000,2000和5000,以及项目参数取不同的先验假设下的实验情况。对于结果的评价指标为均方根误差(root mean squared error,RMSE)和偏差(bias)。实验结果表明,随着测试长度或样本容量的增大,RMSE逐渐减小,当项目参数的先验分布方差取值较小时,获得的RMSE比较小。因此,对于3PL模型,当样本容量不是很大或者是测试长度不够长时,项目参数采用方差较小的先验分布可以得到比较准确的估计结果。 展开更多
关键词 项目反应理论 三参数logistic模型 GIBBS抽样 敏感度分析
下载PDF
IRT和Logistic模型在计算机评测及试题编制中的应用
6
作者 包佃清 苏文 马小虎 《煤炭技术》 CAS 北大核心 2011年第10期251-252,共2页
项目反应原理通过各种指标的变化,可以看出难度、区分度等项目特征,从而起到指导项目筛选和编制测验等作用。实验选择BILOG-MG软件进行分析,通过x2指标分析在3种模型下的数据,明显看出3PML的模型具有优势。
关键词 项目反应原理 logistic模型 试题 卡方检验
下载PDF
Logistics模型在科学素养评测中的质量分析与应用 被引量:1
7
作者 柏毅 臧昰怡 《考试研究》 2018年第5期42-48,共7页
将项目反应理论中的Logistics模型应用于小学六年级科学素养评测的质量分析中。针对选择题,选择双参数Logistics模型进行分析,通过项目信息函数和项目特征曲线的结果验证比较,选择评测中项目区分度和项目难度均较为合适的选择题。同时... 将项目反应理论中的Logistics模型应用于小学六年级科学素养评测的质量分析中。针对选择题,选择双参数Logistics模型进行分析,通过项目信息函数和项目特征曲线的结果验证比较,选择评测中项目区分度和项目难度均较为合适的选择题。同时使用多线程Logistics模型对问答题进行分析,发现问答题能够较好地将测试者的能力区分出来,题目也具有较好的项目信息函数,题目设计较为合理。Logistics模型在评测设计中的应用,既有助于评测设计的科学性与有效性,也为相关领域研究提供了参考。 展开更多
关键词 项目反应理论 logistic模型 科学素养评测
下载PDF
四参数Logistic模型与双参数、三参数Logistic模型在语言测验中的拟合比较及睡眠现象检验--以来华留学生预科结业考试为例 被引量:1
8
作者 金英姿 王佶旻 《中国考试》 CSSCI 北大核心 2022年第8期57-65,共9页
四参数Logistic模型通过引入第4个参数,分析测验中高能力被试答错低难度试题的睡眠现象。运用四参数Logistic模型与双参数、三参数Logistic模型对汉语作为第二语言测验的实测数据进行分析,比对3种模型的分析结果,并通过四参数Logistic... 四参数Logistic模型通过引入第4个参数,分析测验中高能力被试答错低难度试题的睡眠现象。运用四参数Logistic模型与双参数、三参数Logistic模型对汉语作为第二语言测验的实测数据进行分析,比对3种模型的分析结果,并通过四参数Logistic模型分析测验中的睡眠现象,结果表明:在模型拟合方面,四参数Logistic模型表现良好;四参数Logistic模型对项目区分度的估计结果高于双参数、三参数Logistic模型;语言测验存在睡眠现象时,被试能力值可能会被严重低估,高风险考试需要考虑使用四参数Logistic模型进行矫正;在语言测验中,睡眠现象是一种随机的失误现象,与所测的语言技能无关。 展开更多
关键词 四参数logistic模型 项目反应理论 睡眠现象 语言测验
下载PDF
四参数Logistic模型和传统模型对被试作答拟合能力的比较研究 被引量:7
9
作者 刘玥 刘红云 《心理学探新》 CSSCI 北大核心 2018年第3期228-235,共8页
针对测验中高能力被试答错容易试题的睡眠现象,可使用四参数Logistic模型分析数据。研究选取了来自心理测验和成就测验的实际数据,分别采用传统模型和四参数Logistic模型进行拟合,对不同模型的拟合指标及参数估计结果进行比较。结果表明... 针对测验中高能力被试答错容易试题的睡眠现象,可使用四参数Logistic模型分析数据。研究选取了来自心理测验和成就测验的实际数据,分别采用传统模型和四参数Logistic模型进行拟合,对不同模型的拟合指标及参数估计结果进行比较。结果表明,四参数Logistic模型能够提高拟合程度,增强估计结果的准确性,有效纠正高能力被试能力被低估的现象。建议在必要时使用四参数Logistic模型进行数据分析。 展开更多
关键词 项目反应理论 睡眠现象 四参数logistic模型
下载PDF
项目反应理论中Logistic模型中文翻译的说明
10
作者 刘育明 张煜 《教育测量与评价》 2017年第8期13-15,共3页
项目反应理论中logistic模型翻译为"比率对数"模型,可以比较适当地表达该词的统计学意义,便于解释和交流。像常态曲线分布一样,比率对数分布同样具有对称分布的特性,只是尾部较常态分布稍微大一些,不易受分布两端极端分数的... 项目反应理论中logistic模型翻译为"比率对数"模型,可以比较适当地表达该词的统计学意义,便于解释和交流。像常态曲线分布一样,比率对数分布同样具有对称分布的特性,只是尾部较常态分布稍微大一些,不易受分布两端极端分数的影响。比率对数的累积分布函数与平均值为0、标准差为1.7的常态分布的累积函数在所有分数点上都小于0.01。更重要的是,比率对数模型较常态分布模型更便于进行数学运算和解释,在项目反应理论中比率对数模型是试题和考生能力参数的直接函数。 展开更多
关键词 项目反应理论 比率对数模型 胜算比对数函数
下载PDF
Web环境下基于项目反应理论的自适应考试系统研究与设计
11
作者 姜艳 赵鹏 《软件》 2024年第4期80-82,共3页
本文在Web环境下基于项目反应理论(IRT)设计并实现了一种自适应考试系统。通过独创的试题抽取算法,该系统能够根据考生能力动态调整试题难度,从而提高考试的准确性和效率。研究比较了传统考试与基于IRT的自适应考试系统,结果表明后者能... 本文在Web环境下基于项目反应理论(IRT)设计并实现了一种自适应考试系统。通过独创的试题抽取算法,该系统能够根据考生能力动态调整试题难度,从而提高考试的准确性和效率。研究比较了传统考试与基于IRT的自适应考试系统,结果表明后者能够更精确地评估考生能力。此研究不仅引入了新型考试模式,也为教育评估领域的发展提供了新的视角和参考。 展开更多
关键词 项目反应理论 自适应考试系统 WEB环境 试题抽取算法 能力评估。
下载PDF
等级反应模型下计算机化自适应测验选题策略 被引量:38
12
作者 陈平 丁树良 +1 位作者 林海菁 周婕 《心理学报》 CSSCI CSCD 北大核心 2006年第3期461-467,共7页
计算机化自适应测验(CAT)中的选题策略,一直是国内外相关学者关注的问题。然而对多级评分的CAT的选题策略的研究却很少报导。本研究采用计算机模拟程序对等级反应模型(G raded Response Model)下CAT的四种选题策略进行研究。研究表明:... 计算机化自适应测验(CAT)中的选题策略,一直是国内外相关学者关注的问题。然而对多级评分的CAT的选题策略的研究却很少报导。本研究采用计算机模拟程序对等级反应模型(G raded Response Model)下CAT的四种选题策略进行研究。研究表明:等级难度值与当前能力估计值匹配选题策略的综合评价最高;在选题策略中增设“影子题库”可以明显提高项目调用的均匀性;并且不同的项目参数分布或不同的能力估计方法都对CAT评价指标有影响。 展开更多
关键词 等级反应模型 计算机化自适应测验 选题策略 影子题库
下载PDF
项目反应理论新进展:基于3PLM和GRM的混合模型 被引量:9
13
作者 涂冬波 蔡艳 +1 位作者 戴海琦 丁树良 《心理科学》 CSSCI CSCD 北大核心 2011年第5期1189-1194,共6页
IRT中的计量模型较多,不同计量模型适合不同特点的数据资料,实际工作者应根据实际情况选择适当的IRT模型来分析数据。我国是个考试、测评大国,测评的题型丰富多样,在实际应用IRT时,一个模型往往很难反应所有数据资料本身的特点,这时可... IRT中的计量模型较多,不同计量模型适合不同特点的数据资料,实际工作者应根据实际情况选择适当的IRT模型来分析数据。我国是个考试、测评大国,测评的题型丰富多样,在实际应用IRT时,一个模型往往很难反应所有数据资料本身的特点,这时可考虑应用多个IRT模型(即"混合模型")来分析,以达到对数据的最佳拟合。本文对混合模型的思想方法及原理、参数估计的实现、以及模型性能进行了研究,发现:(1)本文自主开发的混合模型参数估计程序Mix—Tu具有较高的返真性,且与国际知名IRT分析软件Parscale相当。(2)在"项目异常"情况下,Mix—Tu程序对参数b和c的估计受数据异常程度的影响要大于Parscale程序,而对参数a的估计受数据异常程度的影响要小于Parscale程序,而在参数theta上两个程序相当。(3)在"被试异常"情况下,Mix—Tu程序对所有参数的估计受数据异常程度的影响均要小于Parscale程序,Mix—Tu程序表现的更为稳健。 展开更多
关键词 项目反应理论 3PLM 等级反应模型 混合模型
下载PDF
基于题目反应理论的机助自适应考试系统 被引量:20
14
作者 邵晨辉 陈玉泉 徐良贤 《计算机工程》 CAS CSCD 北大核心 2000年第11期161-163,共3页
基于题目反应理论,给出了机助自适应考试系统的基本流程及其算法.并实现了基于局域网的汉语机助自适应考试系统——HyCats.
关键词 题目反应理论 机助自适应考试系统 试题
下载PDF
基于项目反应理论的儿童睡眠问卷项目分析 被引量:6
15
作者 邰隽 许志飞 +13 位作者 李晓丹 杜江南 王桂香 马军 胡佩瑾 阎小妍 张杰 张亚梅 刘原虎 赵靖 郑莉 陈俊 冯国双 倪鑫 《中国全科医学》 CAS 北大核心 2018年第23期2844-2848,共5页
目的采用项目反应理论对儿童睡眠问卷进行项目分析,评价儿童睡眠问卷在国内的适用性。方法 2015年5—7月采用多阶段分层整群随机抽样方法,随机抽取了北京市西城、朝阳、昌平、顺义、房山、怀柔和门头沟共7个区县的25所幼儿园和中小学学... 目的采用项目反应理论对儿童睡眠问卷进行项目分析,评价儿童睡眠问卷在国内的适用性。方法 2015年5—7月采用多阶段分层整群随机抽样方法,随机抽取了北京市西城、朝阳、昌平、顺义、房山、怀柔和门头沟共7个区县的25所幼儿园和中小学学校,共计11 420例儿童。采用儿童睡眠问卷调查其睡眠情况,该问卷主要包含与儿童睡眠呼吸障碍相关的4个维度,即呼吸、睡眠、行为、其他。统计分析采用基于二参数Logistic模型的项目反应理论,计算各条目的区分度和难度参数,并绘制项目反应特征曲线。结果大多数条目具有较好的区分度,但"睡觉偶尔尿床"和"是否超重"的区分度明显低于其他条目(区分度参数估计值分别为0.441和0.124),且难度参数均较大(分别为4.378和6.172)。测验信息量结果提示删除这两个条目后,问卷提供的信息量几乎没有变化。结论儿童睡眠问卷在评价儿童睡眠障碍中可以提供较好的初筛效果,但国内应用可以考虑对其进行简化。 展开更多
关键词 睡眠 问卷调查 项目反应理论 logistic模型
下载PDF
学业水平测试中作文评分误差的多面Rasch分析 被引量:9
16
作者 刘红云 陈阅 +1 位作者 骆方 王云峰 《心理科学》 CSSCI CSCD 北大核心 2010年第4期925-927,共3页
使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同... 使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同评分员的宽严程度有显著差异,评分员之间的一致性整体较好;(3)此外,本文还就评分内部一致性较差的几个评分员的评分做了进一步研究。 展开更多
关键词 作文 评分误差 项目反应理论 多面RASCH模型
下载PDF
等级评分模型下的最大信息量分层选题策略 被引量:6
17
作者 程小扬 丁树良 +1 位作者 朱隆尹 巫华芳 《江西师范大学学报(自然科学版)》 CAS 北大核心 2012年第5期446-451,共6页
对于0-1评分模型,R.B.Juan等提出了最大信息量分层选题策略,将此选题策略应用到等级反应评分模型(GRM)中,即以项目j的最大信息量I max(j)作为分层的依据,以取得该项目的最大信息量时能力点值θmax(j)作为项目的综合难度,分别用I max(j)... 对于0-1评分模型,R.B.Juan等提出了最大信息量分层选题策略,将此选题策略应用到等级反应评分模型(GRM)中,即以项目j的最大信息量I max(j)作为分层的依据,以取得该项目的最大信息量时能力点值θmax(j)作为项目的综合难度,分别用I max(j)与θmax(j)替代张华华等提出的按a分层和按b分块按a分层方法中的a、b参数,形成最大信息量按a分层选题策略(MI-AS)和最大信息量按b分块按a分层方法(MI-BS).模拟实验结果表明:MI-AS和MI-BS方法较传统的按a分层方法要好. 展开更多
关键词 计算机化自适应测验 等级反应模型 最大信息量分层法 选题策略
下载PDF
基于IRT若干参数估计方式的比较 被引量:15
18
作者 罗芬 丁树良 +2 位作者 胡小松 万宇文 甘登文 《江西师范大学学报(自然科学版)》 CAS 2003年第1期56-60,共5页
在项目反应理论(IRT)框架下,就目前流行的若干能力参数和项目参数的估计方法进行分析比较,阐述了它们各自适用的范围和不足之处,为选用估计方法提供依据.
关键词 参数估计 CTA IRT 条件似然估计 联合似然估计 边际似然估计 EM算法 贝叶斯估计 项目反应理论 自适应考试
下载PDF
在线自适应测试系统的设计与实现 被引量:5
19
作者 丘威 钟治初 +1 位作者 黄建妮 张立臣 《计算机应用研究》 CSCD 北大核心 2008年第1期184-186,共3页
针对目前计算机自适应测试系统在远程网络测试中存在的局限性,提出了基于XML的在线自适应测试系统模型。通过题目自反应理论建立计算机自适应测试模型,并提出了一种约束试卷生成的参数模型,利用增量学习算法设计了组卷策略,解决了远程... 针对目前计算机自适应测试系统在远程网络测试中存在的局限性,提出了基于XML的在线自适应测试系统模型。通过题目自反应理论建立计算机自适应测试模型,并提出了一种约束试卷生成的参数模型,利用增量学习算法设计了组卷策略,解决了远程网络自适应测试系统中计算量大、易造成网络交互阻塞瓶颈等技术问题。最后给出了系统的设计模型,并描述了该系统的实现过程。 展开更多
关键词 题目反应理论 计算机自适应测试 在线
下载PDF
多级评分计算机化自适应测验动态综合选题策略 被引量:13
20
作者 罗芬 丁树良 王晓庆 《心理学报》 CSSCI CSCD 北大核心 2012年第3期400-412,共13页
多级评分可以提供更多关于被试的信息,是计算机化自适应测验的一个发展方向,选题策略是计算机化自适应测验的研究重点。对于多级评分的等级反应模型,本文拟用区间估计的思想改进近期提出的几种选题策略,并且将两级评分b-STR和a-STR推广... 多级评分可以提供更多关于被试的信息,是计算机化自适应测验的一个发展方向,选题策略是计算机化自适应测验的研究重点。对于多级评分的等级反应模型,本文拟用区间估计的思想改进近期提出的几种选题策略,并且将两级评分b-STR和a-STR推广到多级评分以改进最大信息量选题策略。Monte Carlo模拟实验表明在达到或接近原有选题策略测验精度的基础上,本文提出的几种新选题策略有的能够有效降低测验长度,有的可以极大降低项目曝光率。 展开更多
关键词 等级反应模型 计算机化自适应测验 选题策略 区间估计 多级评分b-STR
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部