期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
助产士规范化培训实践技能考试的测量学评价 被引量:5
1
作者 张泉慧 张颖 王钢 《中国护理管理》 CSCD 北大核心 2018年第2期223-227,共5页
目的 :评价2016年助产士规范化培训考核实践技能考试的效果。方法 :根据经典测验理论重点分析考试难度、区分度、信度、效度及考站内容相关性。结果 :本次考核实践技能考试平均成绩为(72.48±8.72)分;考核总体难度为0.691,区分度为0... 目的 :评价2016年助产士规范化培训考核实践技能考试的效果。方法 :根据经典测验理论重点分析考试难度、区分度、信度、效度及考站内容相关性。结果 :本次考核实践技能考试平均成绩为(72.48±8.72)分;考核总体难度为0.691,区分度为0.291,信度为0.582,均在测量学可接受的范围。考核内容效度指标(CVR)为0.90,结构效度的因素分析结果为3个维度,符合考试理论构想。各考站中第1站与第6站、第2站与第5站间存在中等程度相关,其余各考站成绩无明显相关性,说明考站内容互相独立,与考试设计符合。结论 :本次考核难度适中,区分度较好,具有良好的信度和效度,能够准确地评价助产士规范化培训考核的效果,对临床实践和教学具有促进作用。 展开更多
关键词 助产士 规范化培训 实践技能 考试评价
下载PDF
IRT理论不同模型下同时校准等值方法的跨样本研究 被引量:3
2
作者 张泉慧 黄慧英 《中国考试》 2016年第2期3-8,共6页
本研究基于IRT理论中最常用的LOGISTIC三种模型来探讨等值的跨样本一致性,研究对象为某一汉语类别的测验,等值方法采用同时校准法。研究结果表明,双参数模型下同时校准法等值跨样本一致性最好,最为稳定。
关键词 IRT LOGISTIC模型 同时校准法 跨样本一致性
下载PDF
基于固定共同题方法的IRT等值模型比较研究 被引量:1
3
作者 张泉慧 张颖 +2 位作者 何佳 邹杰文 王娇艳 《中国考试》 2017年第6期65-69,共5页
等值模型的选择是题库建设的重要环节。本研究在IRT理论框架下,选择最为常用的Logistic模型,针对医学考试某一学科测试比较三种Logistic模型下固定共同题等值方法的差异。结果表明,单参数模型对共同题的参数固定更稳定,等值的精确性优... 等值模型的选择是题库建设的重要环节。本研究在IRT理论框架下,选择最为常用的Logistic模型,针对医学考试某一学科测试比较三种Logistic模型下固定共同题等值方法的差异。结果表明,单参数模型对共同题的参数固定更稳定,等值的精确性优于双参数模型和三参数模型,更适合用于该学科测试。 展开更多
关键词 题库 LOGISTIC模型 等值 IRT
下载PDF
新HSK为什么要取消合格线 被引量:3
4
作者 张泉慧 张晋军 《中国考试》 2014年第9期14-17,共4页
新汉语水平考试(HSK)于2009年正式推出。其笔试分6个等级,一级至二级总分皆为200分,120分为合格。三级至六级总分皆为300分,180分为合格。其口试独立于笔试之外,分三个等级,总分皆为100分,60分为合格。从2013年2月起,HSK(五级)、HSK(六... 新汉语水平考试(HSK)于2009年正式推出。其笔试分6个等级,一级至二级总分皆为200分,120分为合格。三级至六级总分皆为300分,180分为合格。其口试独立于笔试之外,分三个等级,总分皆为100分,60分为合格。从2013年2月起,HSK(五级)、HSK(六级)取消了合格线。新HSK为什么要设立合格线?又为什么要取消其中两个等级的合格线?基于新HSK分数体系的特点,本文提出,新HSK应尽快全面取消其合格线。 展开更多
关键词 新HSK 汉语 考试 合格线
下载PDF
新汉语水平考试分数是如何处理的 被引量:3
5
作者 张泉慧 张晋军 符华均 《考试研究》 2014年第3期24-27,共4页
本文介绍了汉语水平考试(HSK)(六级)的分数处理方案,该方案同样适用于新HSK笔试其他等级及新HSK口试,这一方案已在2013年考试中付诸实践。
关键词 新HSK 汉语 考试 分数处理
下载PDF
两步聚类方法在考试作弊答案分类中的应用 被引量:2
6
作者 张泉慧 《中国考试》 2010年第6期34-38,共5页
本文首先对聚类分析的概念、形式、分类和应用做了简要介绍,其中重点介绍了两步聚类的原理和使用,然后用实证的方法研究两步聚类在考试作弊答案分类中的应用。实证表明:两步聚类能快速得出分类,将分类结果借助自编程序对作弊考生进... 本文首先对聚类分析的概念、形式、分类和应用做了简要介绍,其中重点介绍了两步聚类的原理和使用,然后用实证的方法研究两步聚类在考试作弊答案分类中的应用。实证表明:两步聚类能快速得出分类,将分类结果借助自编程序对作弊考生进行归类,其结果和人工分组的结果比对后完全一致。由此得出结论:用两步聚类辅助自编程序的方法进行作弊答案分类切实可行,快速而准确。 展开更多
关键词 聚类分析 两步聚类 作弊答案
下载PDF
医学博士英语听力测验题目分析与认知诊断研究
7
作者 张泉慧 张颖 冯攀 《考试研究》 2022年第4期24-32,共9页
全国医学博士英语统一考试2018年修订考试大纲,2019年正式实施新大纲。本研究对比分析了2018年与2019年的题目参数,采用G-DINA模型对两个年度考生的听力认知属性进行诊断。结果发现,大纲修订后的听力测验信度提升,题目区分度提升,更多... 全国医学博士英语统一考试2018年修订考试大纲,2019年正式实施新大纲。本研究对比分析了2018年与2019年的题目参数,采用G-DINA模型对两个年度考生的听力认知属性进行诊断。结果发现,大纲修订后的听力测验信度提升,题目区分度提升,更多地考查了高阶听力认知属性;考生在低阶听力认知属性的掌握率上没有变化,在高阶听力认知属性掌握率上有所提升,整体掌握率提高。 展开更多
关键词 全国医学博士英语统一考试 G-DINA模型 认知诊断
下载PDF
融合型试题在口腔执业医师资格考试中测试效果的初步观察 被引量:1
8
作者 王宁 王钢 +1 位作者 张泉慧 郑耀光 《口腔医学》 CAS 2016年第7期635-636,644,共3页
目的初步观察融合型试题在口腔执业医师资格考试中的测量效果。方法抽样选取部分历年实测试题,应用多专业融合试题开发方式对其进行改造后再次施测,分析试题融合前后难易度及区分度参数变异情况,采用配对设计资料t检验方法进行统计分析... 目的初步观察融合型试题在口腔执业医师资格考试中的测量效果。方法抽样选取部分历年实测试题,应用多专业融合试题开发方式对其进行改造后再次施测,分析试题融合前后难易度及区分度参数变异情况,采用配对设计资料t检验方法进行统计分析。结果试题经多专业融合改造后,难易度无明显变化,区分度却显著提高;并且这一规律集中体现在成绩中间组考生群体。结论提示融合型试题在口腔执业医师资格考试中具有较好的测量效果。 展开更多
关键词 融合型试题 口腔执业医师资格考试 口腔医学 教育测量
下载PDF
2013年国际眼科考试全球考生通过情况分析 被引量:1
9
作者 柳雯 张泉慧 +2 位作者 朱钊良 张赛一 李佩晔 《国际眼科杂志》 CAS 2014年第12期2244-2246,共3页
目的:旨在找出中国眼科医师在培养中存在的问题及与国际眼科医师间水平的差距,以期为今后中国眼科医师的培养提供参考。方法:对全球所有参加2013年国际眼科考试的考生的通过率进行一般统计学分析。结果:本研究发现,中国考生的考试成绩... 目的:旨在找出中国眼科医师在培养中存在的问题及与国际眼科医师间水平的差距,以期为今后中国眼科医师的培养提供参考。方法:对全球所有参加2013年国际眼科考试的考生的通过率进行一般统计学分析。结果:本研究发现,中国考生的考试成绩低于国际平均水平;尤其是临床部分,中国考生的通过率与其他国家的考生差距十分明显;可能表明中国考生对于该项考试的适应性还不够好,基础知识和临床水平尚需进一步提升。结论:可能表明我国在眼科住院医师中后期培养上效果不佳,今后需要在这方面下苦功夫。 展开更多
关键词 国际眼科考试 眼科 医师
下载PDF
我国首次临床营养师培训考核信度效度浅析 被引量:1
10
作者 王钢 王江红 +2 位作者 邹杰文 张泉慧 郑耀光 《中国高等医学教育》 2015年第6期1-1,12,共2页
为提升我国临床营养医学人才队伍整体服务水平,规范临床营养诊疗行为,受中国医师协会委托,国家医学考试中心于2015年1月举办全国首次临床营养师培训考核,包括综合理论和实践技能考试两部分。对考试信度、效度进行分析,结果显示,考试能... 为提升我国临床营养医学人才队伍整体服务水平,规范临床营养诊疗行为,受中国医师协会委托,国家医学考试中心于2015年1月举办全国首次临床营养师培训考核,包括综合理论和实践技能考试两部分。对考试信度、效度进行分析,结果显示,考试能客观反映考生的岗位胜任能力,结果可信有效,对于科学评价临床营养师水平具有实证意义。 展开更多
关键词 临床营养师 培训考核 信度 效度 岗位胜任力
下载PDF
心血管内科专科医师考试面试评分者信度的概化理论研究 被引量:1
11
作者 卢燕 张颖 +1 位作者 王钢 张泉慧 《中国高等医学教育》 2013年第12期19-19,84,共2页
目的:评估心血管内科专科医师考试面试部分的评分者的内部信度。方法:采用概化理论对心血管内科专科医师考试面试部分考生分数进行了方差来源的分解评估。结果:21组考官组的可靠性指数为0.9135。结论:考试整体的评分者信度较高。
关键词 概化理论 评分者信度 可靠性指数
下载PDF
基于Delphi平台软件的某考试作弊甄别研究
12
作者 刘叔才 张泉慧 +2 位作者 何佳 丁一民 沈瑞文 《中国社会医学杂志》 2013年第5期325-327,共3页
基于Delphi平台软件构建了错同率法与错同对同率法的统计分析程序,并以某考试的作弊判断标准,从3个方面对某考试作弊进行甄别,经验证分析科学、合理,具有较高的适用性,可为今后的大型考试作弊甄别提供可靠的技术依据。
关键词 Delphi平台软件 考试 作弊 甄别
下载PDF
国家某口腔医学统一考试试题难度预估方法探讨
13
作者 王宁 黄蓉 张泉慧 《上海口腔医学》 CAS 北大核心 2022年第3期327-329,共3页
目的 :通过分析国家某口腔医学统一考试试题难度预估方法的效果及其影响因素,研究改进预估方法的可能路径。方法:对试题难度预估方法改进前、后预估值与实测值一致性进行对比分析,并对改进方法的可能影响因素进行评价。使用SPSS 16.0软... 目的 :通过分析国家某口腔医学统一考试试题难度预估方法的效果及其影响因素,研究改进预估方法的可能路径。方法:对试题难度预估方法改进前、后预估值与实测值一致性进行对比分析,并对改进方法的可能影响因素进行评价。使用SPSS 16.0软件包对数据进行统计学分析。结果:方法改进后,试题预估难度与实测难度的一致性提高;两者一致性的变化以分数中间组考生最为显著(P<0.05),且受预估专家人数、题型及认知层次等多因素影响。结论:通过改进试题难度预估方法,可有效改进预估效果,对提高组卷预测性,进而精准评价合格考生有所帮助。 展开更多
关键词 试题难度 主观预估 配对比较 口腔医学考试
下载PDF
心血管内科专科医师专业理论考试的多元概化理论研究
14
作者 卢燕 张颖 +1 位作者 王钢 张泉慧 《中国高等医学教育》 2013年第10期20-20,58,共2页
目的:研究心血管内科专科医师考试综合笔试部分的考试信度。方法:采用概化理论从题型和模块两个角度,对心血管内科专科医师考试综合笔试部分考生分数进行了方差来源的分解。结果:此考试的总体可靠性系数在0.8左右。结论:此考试的整体信... 目的:研究心血管内科专科医师考试综合笔试部分的考试信度。方法:采用概化理论从题型和模块两个角度,对心血管内科专科医师考试综合笔试部分考生分数进行了方差来源的分解。结果:此考试的总体可靠性系数在0.8左右。结论:此考试的整体信度较好。 展开更多
关键词 概化理论 可靠性系数φ 方差
下载PDF
国际眼科考试及其对中国眼科专科医师培养体系建设的启示
15
作者 柳雯 张泉慧 +2 位作者 张赛一 朱钊良 李佩晔 《考试研究》 2014年第5期87-90,共4页
我国的眼科专科医师无论在数量质量上目前还远不能满足社会需要,本文通过对国际眼科考试的介绍,试图从考试体系、考试设计、考试实施等方面探讨国际眼科考试给我国眼科专科医师培养体系建设带来的启示。
关键词 国际眼科考试 眼科 专科医师
下载PDF
等级记分模型下几种等值方法的比较研究 被引量:2
16
作者 王菲 任杰 +1 位作者 张泉慧 曹文静 《中国考试》 2013年第6期10-17,共8页
等值对考试具有重要意义,而我国的大部分考试却没有实现等值,在少数经过等值的考试中,大多只限于对二级记分题目的等值,鲜有对多级记分题目的等值研究。该研究针对包含多级记分题目的国内某大型语言类考试,探讨了等级反应模型下的同时... 等值对考试具有重要意义,而我国的大部分考试却没有实现等值,在少数经过等值的考试中,大多只限于对二级记分题目的等值,鲜有对多级记分题目的等值研究。该研究针对包含多级记分题目的国内某大型语言类考试,探讨了等级反应模型下的同时校准法、固定共同题参数法以及链接独立校准法中的平均数标准差方法、平均数平均数方法、Haebara法和Stocking-Lord法六种等值方法的效果,从而优选最适合该考试的等值方法。 展开更多
关键词 等值 多级记分 跨样本
下载PDF
临床医学专业(本科)水平测试的等值方法比较研究 被引量:3
17
作者 张泉慧 何惧 +2 位作者 任杰 张颖 卢燕 《中华医学教育杂志》 2022年第7期577-580,共4页
目的基于经典测验理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析,探讨学业水平测试中更为适合的等值方法。方法基... 目的基于经典测验理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析,探讨学业水平测试中更为适合的等值方法。方法基于CTT方法,采用塔克(Tucker)观察分数线性等值方法、列文(Levine)观察分数线性等值方法、等百分位法、等百分位平滑法4种方法,基于IRT方法的单参数、双参数模型中,采用分别估计法、同时估计法和固定共同题参数估计法各3种校准方法进行等值探索,通过等值标准误来分析以上10种等值结果的稳定性。结果CTT方法的等值误差在0.7~1.6之间,IRT方法的等值误差在0.2~0.6之间,IRT误差更小。CTT方法中,Tucker观察分数线性等值方法误差最小,为0.7,等百分位平滑法误差最大,为1.6;IRT方法中,单参数模型的等值结果优于双参数模型,单参数模型中,固定共同题参数估计法的误差最小,为0.2。结论学业水平测试等值可以选择IRT单参数模型中的固定共同题参数估计法,通过等值,年度2学业水平测试等值后的分数上调,合格标准保持不变,有效地实现了分数可比,保证了考试公平。 展开更多
关键词 临床医学专业 水平测试 经典测验理论 项目反应理论 等值
原文传递
基于两种教育测量理论的全国医学博士英语统一考试质量分析
18
作者 张泉慧 张颖 《中华医学教育杂志》 2018年第6期940-943,共4页
目的 采用项目反应理论中的Rasch模型和经典测量理论,对2015年~2017年全国医学博士英语统一考试进行质量分析,比较两种理论估计结果的一致性.方法 采用资料分析方法,以2015年~2017年全国医学博士英语统一考试40607份试卷为研究资料,采... 目的 采用项目反应理论中的Rasch模型和经典测量理论,对2015年~2017年全国医学博士英语统一考试进行质量分析,比较两种理论估计结果的一致性.方法 采用资料分析方法,以2015年~2017年全国医学博士英语统一考试40607份试卷为研究资料,采用项目反应理论的Rasch模型和经典测量理论分别分析考试的信度、难度和区分度,对比其分析结果的一致性.结果 Rasch模型的分析结果显示,3个年度试卷参数与模型拟合度较高,最大信息函数均>25.00,估计误差均<0.20,各个题型难度均在-0.70~0.70之间.经典测量理论的分析结果显示,3个年度试卷信度均>0.80,各个题型难度均在0.31~0.63之间,区分度均在0.12~0.29之间.Rasch模型和经典测量理论分析结果呈高度相关.结论 3个年度全国医学博士英语统一考试均能够较好地评价考生医学英语的应用能力.在参数估计和误差分析方面,Rasch模型的精度更高,在后续的考试评价中可以更多地使用. 展开更多
关键词 全国医学博士英语统一考试 RASCH模型 经典测量理论
原文传递
我国首次助产士规范化培训考核综合理论考试结果分析 被引量:6
19
作者 王宁 王钢 张泉慧 《中华现代护理杂志》 2017年第34期4417-4419,共3页
目的探索加强我国助产技术服务人才队伍建设的有效途径,检验助产士培训质量、完善培训工作。方法国家医学考试中心与中国妇幼保健协会合作开展我国首次助产士规范化培训考核,并对理论考试成绩,考试信度、效度进行分析。结果学生综合... 目的探索加强我国助产技术服务人才队伍建设的有效途径,检验助产士培训质量、完善培训工作。方法国家医学考试中心与中国妇幼保健协会合作开展我国首次助产士规范化培训考核,并对理论考试成绩,考试信度、效度进行分析。结果学生综合理论考试分数呈现随学历升高而逐渐上升、随职称增高而上升的趋势。试卷的实测平均难度为0.8211,信度为0.7465,综合理论和实践技能两部分考试之间的相关系数为0.456。结论首次助产士规范化培训考核理论考试设计科学合理。 展开更多
关键词 助产士 培训考核 岗位胜任力
原文传递
基于考试内容的专家判断法在医学合格标准设定中的实践与探索 被引量:2
20
作者 何佳 张泉慧 +1 位作者 张颖 弓姝 《中华医学教育杂志》 2012年第6期943-945,共3页
考试合格标准的设定有许多种方法。在医学统一考试中,采用了基于考试内容的对错判断法和区间判断法。为了评价两种方法合格标准设定的差异,本文分析了我国医学统一考试中合格标准设定的结果,总结了基于考试内容的专家判断法应用于实... 考试合格标准的设定有许多种方法。在医学统一考试中,采用了基于考试内容的对错判断法和区间判断法。为了评价两种方法合格标准设定的差异,本文分析了我国医学统一考试中合格标准设定的结果,总结了基于考试内容的专家判断法应用于实践中的认识,提出了今后的研究方向。 展开更多
关键词 医学统一考试 合格标准设定 专家判断 实践 探索
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部