期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
测验质量的三维审视及对命题的诉求 被引量:1
1
作者 张远增 《考试研究》 2011年第2期47-53,共7页
本文建立了评估测验质量的稳定性、自洽性和可推广性三个指标,并运用它们对测验质量进行初步分析,在此基础上讨论了作为测验质量指标的稳定性、自洽性和可推广性对命题的诉求及具体的实施策略与方法。
关键词 测验质量 稳定性 自洽性 可推广性 命题
下载PDF
客观性测验质量分析方法
2
作者 杨丽敏 张永彬 《黑龙江教育学院学报》 1996年第1期75-102,共2页
客观性测验是指完全采用客观性试题的测验。所谓客观性试题,是指正确答案及表达形式简短且唯一、评分客观的一类试题,它主要包括选择题、是非题和填空题。这类试题的优点在于容量大覆盖面广、测验的可靠性和有效性较高,评卷速度快,更主... 客观性测验是指完全采用客观性试题的测验。所谓客观性试题,是指正确答案及表达形式简短且唯一、评分客观的一类试题,它主要包括选择题、是非题和填空题。这类试题的优点在于容量大覆盖面广、测验的可靠性和有效性较高,评卷速度快,更主要的是评分客观,因而被称之为客观性试题。 计算客观性试题的难度、区分度、信度和效度,其方法有很多种。 展开更多
关键词 测验质量 区分度 客观性试题 信度和效度 测验结果 分析方法 评分 是非题 取值范围 分程
下载PDF
测验质量评估指标之一——信度及其估计式综述
3
作者 邢最智 《信阳师范学院学报(自然科学版)》 CAS 1990年第4期373-380,共8页
测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上... 测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上的定义,并对信度系数的一系列估计公式给予证明,尤其还从变异源的角度给出信度的方差分析计算法。 展开更多
关键词 测验信度 信度系数 测验质量
下载PDF
基于Rasch模型对九年级数学能力测验进行质量分析 被引量:4
4
作者 蔡颖颖 林嘉浩 +2 位作者 谢丹丹 张一凡 黎光明 《教育进展》 2017年第4期177-185,共9页
使用Rasch模型分析软件WINSTEPS对九年级数学能力测验进行质量分析,通过怀特图(Wright Map)了解该测验的整体情况,包括题目难度,学生能力水平;通过单维性检验、项目拟合度、气泡图等反映题目质量的高低。研究结果表明:① 该测验基本符... 使用Rasch模型分析软件WINSTEPS对九年级数学能力测验进行质量分析,通过怀特图(Wright Map)了解该测验的整体情况,包括题目难度,学生能力水平;通过单维性检验、项目拟合度、气泡图等反映题目质量的高低。研究结果表明:① 该测验基本符合其测量目标。能较好地区分出学生能力水平和题目难度。② 题目较简单,学生能力水平范围大于题目难度分布,应增加部分高难度题目。③ 存在个别题目与模型预期的结果不一致,需进一步分析其内容与答题状况。研究所分析的九年级数学能力测验总体上能够准确地进行参数估计,是一套质量较高的测验,该测验基本符合其测量目标。 展开更多
关键词 测验质量分析 RASCH模型 学生能力 题目难度 WINSTEPS
下载PDF
水文测船悬杆测验设备技术改造 被引量:1
5
作者 张广海 刘以泉 +2 位作者 李庆金 王静 崔传杰 《水文》 CSCD 北大核心 2001年第6期57-58,共2页
针对黄河下游悬杆测验设备落后的局面,对绞车进行了部分改造,并研制了一套适合于测船安装的HCX-1型直读式流速水深计数器,取得了较好的效果。
关键词 悬杆 流速 水深 设备 技术改造 测验质量 电源
下载PDF
测验预测的价值
6
作者 徐虹 《教育研究与实验》 1987年第1期42-43,41,共3页
测验作为评价和预测的主要工具之一,广泛运用于各级各类学校,但测验作为预测手段,其价值究竟如何?这个问题并没有引起人们深入思考,特别是许多教育工作者对此问题缺乏正确认识,从而影响了测验预测作用的发挥,进而妨碍人才选拔培养的科... 测验作为评价和预测的主要工具之一,广泛运用于各级各类学校,但测验作为预测手段,其价值究竟如何?这个问题并没有引起人们深入思考,特别是许多教育工作者对此问题缺乏正确认识,从而影响了测验预测作用的发挥,进而妨碍人才选拔培养的科学化进程。本文试图从预测的实质,测验对个体预测的可能性,测验预测的准确性,测验预测同其他预测的比较等几方面来论述测验预测的价值问题。 展开更多
关键词 预测结果 测验质量 预测方法 预测准确性 预测手段 正确认识 预测作用 培养的 可能性 发展趋势
下载PDF
从心理测验的本质看心理测验潜在的问题 被引量:1
7
作者 陈生 《雁北师范学院学报》 2005年第6期94-97,共4页
本文从心理测验的本质特征的间接性、相对性、定量化、代表性入手,引中出心里测验潜在的四个基本问题:心理特质的测量方法问题;心理测量的行为组样问题;测量量表的单位问题;心理测验的误差问题。在对这些问题的探讨分析的基础上,笔者认... 本文从心理测验的本质特征的间接性、相对性、定量化、代表性入手,引中出心里测验潜在的四个基本问题:心理特质的测量方法问题;心理测量的行为组样问题;测量量表的单位问题;心理测验的误差问题。在对这些问题的探讨分析的基础上,笔者认为:只有编制和使用心理测验的人员都谨慎对待,正确使用心理测验这一心理评估工具,才能使发挥出它应有的益处。 展开更多
关键词 心理测验心理特质量表行为样本
下载PDF
基于BP神经网络的认知诊断评估分类准确率影响因素分析 被引量:5
8
作者 聂畅 孙小坚 辛涛 《中国考试》 CSSCI 北大核心 2021年第3期28-35,共8页
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经... BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。 展开更多
关键词 BP神经网络 认知诊断评估 分类准确率 测验质量 测验技术
下载PDF
一种新的信度估计 被引量:8
9
作者 丁树良 周新莲 《江西师范大学学报(自然科学版)》 CAS 2002年第3期222-224,共3页
应用相关系数的信息并结合重排不等式 ,引入了一个新的信度系数 ζ ,并证明了 ζ≥α且在某些情况下 ,ζ可以弥补α系数、β系数及γ系数的不足 ,有时 ζ比λ2
关键词 信度估计 信度系数 相关系数 重排不等式 经典测量理论 质量测验
下载PDF
认知诊断模型题目功能差异检验方法的健壮性比较
10
作者 尹昊 周蔓 +1 位作者 刘彦楼 辛涛 《中国考试》 CSSCI 北大核心 2021年第3期36-44,共9页
在认知诊断模型中进行题目功能差异(DIF)的检测,目的在于保证测验的质量与效果。在以往研究的基础上,本研究重点探索在CDMs框架下,MH、LR、CSIBTEST、WObs、WSw、WXPD 6种DIF检测方法在Q矩阵是否正确设定以及有关DIF影响因素等条件下的... 在认知诊断模型中进行题目功能差异(DIF)的检测,目的在于保证测验的质量与效果。在以往研究的基础上,本研究重点探索在CDMs框架下,MH、LR、CSIBTEST、WObs、WSw、WXPD 6种DIF检测方法在Q矩阵是否正确设定以及有关DIF影响因素等条件下的表现。结果表明:在Q矩阵正确设定时,WObs、WSw和WXPD统计量表现要好于MH、LR和CSIBTEST方法;在Q矩阵错误设定时,6种方法都会出现Ⅰ类错误率膨胀和统计检验力较低的现象。相对而言,MH、LR和CSIBTEST方法的表现比较稳定,WObs、WSw和WXPD统计量的表现变化较大,WObs、WSw和WXPD统计量的Ⅰ类错误率和统计检验力的结果依然好于MH、LR、CSIBTEST方法。 展开更多
关键词 认知诊断模型 题目功能差异 测验质量 Q矩阵错误设定 Wald统计量
下载PDF
美国教育评估办法的缺点:述评
11
作者 柴振荣 《管理观察》 1998年第2期61-61,共1页
关键词 美国教育 评估办法 述评 质量测验 影响评估 教育体制 测验制度 教育和培养 中青年专家 教育拨款
下载PDF
基于Rasch模型的力概念量表质量分析 被引量:1
12
作者 潘澎 胡象岭 《物理教师》 CAS 北大核心 2021年第8期2-6,共5页
力概念量表(Force Concept Inventory,简称FCI)是物理教育研究领域应用广泛的重要诊断工具.本研究以149名中学生为被试,基于Rasch模型采用Winsteps软件对中文版FCI的质量进行测量学检验.结果表明:对于中学生被试而言,中文版FCI的整体难... 力概念量表(Force Concept Inventory,简称FCI)是物理教育研究领域应用广泛的重要诊断工具.本研究以149名中学生为被试,基于Rasch模型采用Winsteps软件对中文版FCI的质量进行测量学检验.结果表明:对于中学生被试而言,中文版FCI的整体难度适当,拟合度较高,分离度、信度均较好,题目难度的分布形态较为合理,大部分题目的拟合度较好.但有的题目拟合度较差,量表及个别题目有待改进. 展开更多
关键词 力概念量表(FCI) RASCH模型 测验质量分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部