期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
12
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
测验质量的三维审视及对命题的诉求
被引量:
1
1
作者
张远增
《考试研究》
2011年第2期47-53,共7页
本文建立了评估测验质量的稳定性、自洽性和可推广性三个指标,并运用它们对测验质量进行初步分析,在此基础上讨论了作为测验质量指标的稳定性、自洽性和可推广性对命题的诉求及具体的实施策略与方法。
关键词
测验质量
稳定性
自洽性
可推广性
命题
下载PDF
职称材料
客观性测验质量分析方法
2
作者
杨丽敏
张永彬
《黑龙江教育学院学报》
1996年第1期75-102,共2页
客观性测验是指完全采用客观性试题的测验。所谓客观性试题,是指正确答案及表达形式简短且唯一、评分客观的一类试题,它主要包括选择题、是非题和填空题。这类试题的优点在于容量大覆盖面广、测验的可靠性和有效性较高,评卷速度快,更主...
客观性测验是指完全采用客观性试题的测验。所谓客观性试题,是指正确答案及表达形式简短且唯一、评分客观的一类试题,它主要包括选择题、是非题和填空题。这类试题的优点在于容量大覆盖面广、测验的可靠性和有效性较高,评卷速度快,更主要的是评分客观,因而被称之为客观性试题。 计算客观性试题的难度、区分度、信度和效度,其方法有很多种。
展开更多
关键词
测验质量
区分度
客观性试题
信度和效度
测验
结果
分析方法
评分
是非题
取值范围
分程
下载PDF
职称材料
测验质量评估指标之一——信度及其估计式综述
3
作者
邢最智
《信阳师范学院学报(自然科学版)》
CAS
1990年第4期373-380,共8页
测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上...
测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上的定义,并对信度系数的一系列估计公式给予证明,尤其还从变异源的角度给出信度的方差分析计算法。
展开更多
关键词
测验
信度
信度系数
测验质量
下载PDF
职称材料
基于Rasch模型对九年级数学能力测验进行质量分析
被引量:
4
4
作者
蔡颖颖
林嘉浩
+2 位作者
谢丹丹
张一凡
黎光明
《教育进展》
2017年第4期177-185,共9页
使用Rasch模型分析软件WINSTEPS对九年级数学能力测验进行质量分析,通过怀特图(Wright Map)了解该测验的整体情况,包括题目难度,学生能力水平;通过单维性检验、项目拟合度、气泡图等反映题目质量的高低。研究结果表明:① 该测验基本符...
使用Rasch模型分析软件WINSTEPS对九年级数学能力测验进行质量分析,通过怀特图(Wright Map)了解该测验的整体情况,包括题目难度,学生能力水平;通过单维性检验、项目拟合度、气泡图等反映题目质量的高低。研究结果表明:① 该测验基本符合其测量目标。能较好地区分出学生能力水平和题目难度。② 题目较简单,学生能力水平范围大于题目难度分布,应增加部分高难度题目。③ 存在个别题目与模型预期的结果不一致,需进一步分析其内容与答题状况。研究所分析的九年级数学能力测验总体上能够准确地进行参数估计,是一套质量较高的测验,该测验基本符合其测量目标。
展开更多
关键词
测验质量
分析
RASCH模型
学生能力
题目难度
WINSTEPS
下载PDF
职称材料
水文测船悬杆测验设备技术改造
被引量:
1
5
作者
张广海
刘以泉
+2 位作者
李庆金
王静
崔传杰
《水文》
CSCD
北大核心
2001年第6期57-58,共2页
针对黄河下游悬杆测验设备落后的局面,对绞车进行了部分改造,并研制了一套适合于测船安装的HCX-1型直读式流速水深计数器,取得了较好的效果。
关键词
悬杆
流速
水深
设备
技术改造
测验质量
电源
下载PDF
职称材料
测验预测的价值
6
作者
徐虹
《教育研究与实验》
1987年第1期42-43,41,共3页
测验作为评价和预测的主要工具之一,广泛运用于各级各类学校,但测验作为预测手段,其价值究竟如何?这个问题并没有引起人们深入思考,特别是许多教育工作者对此问题缺乏正确认识,从而影响了测验预测作用的发挥,进而妨碍人才选拔培养的科...
测验作为评价和预测的主要工具之一,广泛运用于各级各类学校,但测验作为预测手段,其价值究竟如何?这个问题并没有引起人们深入思考,特别是许多教育工作者对此问题缺乏正确认识,从而影响了测验预测作用的发挥,进而妨碍人才选拔培养的科学化进程。本文试图从预测的实质,测验对个体预测的可能性,测验预测的准确性,测验预测同其他预测的比较等几方面来论述测验预测的价值问题。
展开更多
关键词
预测结果
测验质量
预测方法
预测准确性
预测手段
正确认识
预测作用
培养的
可能性
发展趋势
下载PDF
职称材料
从心理测验的本质看心理测验潜在的问题
被引量:
1
7
作者
陈生
《雁北师范学院学报》
2005年第6期94-97,共4页
本文从心理测验的本质特征的间接性、相对性、定量化、代表性入手,引中出心里测验潜在的四个基本问题:心理特质的测量方法问题;心理测量的行为组样问题;测量量表的单位问题;心理测验的误差问题。在对这些问题的探讨分析的基础上,笔者认...
本文从心理测验的本质特征的间接性、相对性、定量化、代表性入手,引中出心里测验潜在的四个基本问题:心理特质的测量方法问题;心理测量的行为组样问题;测量量表的单位问题;心理测验的误差问题。在对这些问题的探讨分析的基础上,笔者认为:只有编制和使用心理测验的人员都谨慎对待,正确使用心理测验这一心理评估工具,才能使发挥出它应有的益处。
展开更多
关键词
心理
测验
心理特
质量
表行为样本
下载PDF
职称材料
基于BP神经网络的认知诊断评估分类准确率影响因素分析
被引量:
5
8
作者
聂畅
孙小坚
辛涛
《中国考试》
CSSCI
北大核心
2021年第3期28-35,共8页
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经...
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。
展开更多
关键词
BP神经网络
认知诊断评估
分类准确率
测验质量
测验
技术
下载PDF
职称材料
一种新的信度估计
被引量:
8
9
作者
丁树良
周新莲
《江西师范大学学报(自然科学版)》
CAS
2002年第3期222-224,共3页
应用相关系数的信息并结合重排不等式 ,引入了一个新的信度系数 ζ ,并证明了 ζ≥α且在某些情况下 ,ζ可以弥补α系数、β系数及γ系数的不足 ,有时 ζ比λ2
关键词
信度估计
信度系数
相关系数
重排不等式
经典测量理论
质量
测验
下载PDF
职称材料
认知诊断模型题目功能差异检验方法的健壮性比较
10
作者
尹昊
周蔓
+1 位作者
刘彦楼
辛涛
《中国考试》
CSSCI
北大核心
2021年第3期36-44,共9页
在认知诊断模型中进行题目功能差异(DIF)的检测,目的在于保证测验的质量与效果。在以往研究的基础上,本研究重点探索在CDMs框架下,MH、LR、CSIBTEST、WObs、WSw、WXPD 6种DIF检测方法在Q矩阵是否正确设定以及有关DIF影响因素等条件下的...
在认知诊断模型中进行题目功能差异(DIF)的检测,目的在于保证测验的质量与效果。在以往研究的基础上,本研究重点探索在CDMs框架下,MH、LR、CSIBTEST、WObs、WSw、WXPD 6种DIF检测方法在Q矩阵是否正确设定以及有关DIF影响因素等条件下的表现。结果表明:在Q矩阵正确设定时,WObs、WSw和WXPD统计量表现要好于MH、LR和CSIBTEST方法;在Q矩阵错误设定时,6种方法都会出现Ⅰ类错误率膨胀和统计检验力较低的现象。相对而言,MH、LR和CSIBTEST方法的表现比较稳定,WObs、WSw和WXPD统计量的表现变化较大,WObs、WSw和WXPD统计量的Ⅰ类错误率和统计检验力的结果依然好于MH、LR、CSIBTEST方法。
展开更多
关键词
认知诊断模型
题目功能差异
测验质量
Q矩阵错误设定
Wald统计量
下载PDF
职称材料
美国教育评估办法的缺点:述评
11
作者
柴振荣
《管理观察》
1998年第2期61-61,共1页
关键词
美国教育
评估办法
述评
质量
测验
影响评估
教育体制
测验
制度
教育和培养
中青年专家
教育拨款
下载PDF
职称材料
基于Rasch模型的力概念量表质量分析
被引量:
1
12
作者
潘澎
胡象岭
《物理教师》
CAS
北大核心
2021年第8期2-6,共5页
力概念量表(Force Concept Inventory,简称FCI)是物理教育研究领域应用广泛的重要诊断工具.本研究以149名中学生为被试,基于Rasch模型采用Winsteps软件对中文版FCI的质量进行测量学检验.结果表明:对于中学生被试而言,中文版FCI的整体难...
力概念量表(Force Concept Inventory,简称FCI)是物理教育研究领域应用广泛的重要诊断工具.本研究以149名中学生为被试,基于Rasch模型采用Winsteps软件对中文版FCI的质量进行测量学检验.结果表明:对于中学生被试而言,中文版FCI的整体难度适当,拟合度较高,分离度、信度均较好,题目难度的分布形态较为合理,大部分题目的拟合度较好.但有的题目拟合度较差,量表及个别题目有待改进.
展开更多
关键词
力概念量表(FCI)
RASCH模型
测验质量
分析
原文传递
题名
测验质量的三维审视及对命题的诉求
被引量:
1
1
作者
张远增
机构
华东师范大学公共管理学院
出处
《考试研究》
2011年第2期47-53,共7页
基金
"教育评价的质量控制研究"课题(2008年度教育部人文社科规划基金项目。课题编号:08JA8800237)阶段性成果
文摘
本文建立了评估测验质量的稳定性、自洽性和可推广性三个指标,并运用它们对测验质量进行初步分析,在此基础上讨论了作为测验质量指标的稳定性、自洽性和可推广性对命题的诉求及具体的实施策略与方法。
关键词
测验质量
稳定性
自洽性
可推广性
命题
Keywords
Test Quality, Stability, Consistency, Sustainability, Item Construction
分类号
G424.74 [文化科学—课程与教学论]
下载PDF
职称材料
题名
客观性测验质量分析方法
2
作者
杨丽敏
张永彬
机构
黑龙江省教育学院
大兴岭林业二中
出处
《黑龙江教育学院学报》
1996年第1期75-102,共2页
文摘
客观性测验是指完全采用客观性试题的测验。所谓客观性试题,是指正确答案及表达形式简短且唯一、评分客观的一类试题,它主要包括选择题、是非题和填空题。这类试题的优点在于容量大覆盖面广、测验的可靠性和有效性较高,评卷速度快,更主要的是评分客观,因而被称之为客观性试题。 计算客观性试题的难度、区分度、信度和效度,其方法有很多种。
关键词
测验质量
区分度
客观性试题
信度和效度
测验
结果
分析方法
评分
是非题
取值范围
分程
分类号
G424.4 [文化科学—课程与教学论]
下载PDF
职称材料
题名
测验质量评估指标之一——信度及其估计式综述
3
作者
邢最智
出处
《信阳师范学院学报(自然科学版)》
CAS
1990年第4期373-380,共8页
文摘
测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上的定义,并对信度系数的一系列估计公式给予证明,尤其还从变异源的角度给出信度的方差分析计算法。
关键词
测验
信度
信度系数
测验质量
Keywords
test reliability, relia.bity coefficient
分类号
G449 [哲学宗教—发展与教育心理学]
下载PDF
职称材料
题名
基于Rasch模型对九年级数学能力测验进行质量分析
被引量:
4
4
作者
蔡颖颖
林嘉浩
谢丹丹
张一凡
黎光明
机构
华南师范大学心理学院、心理应用研究中心
出处
《教育进展》
2017年第4期177-185,共9页
文摘
使用Rasch模型分析软件WINSTEPS对九年级数学能力测验进行质量分析,通过怀特图(Wright Map)了解该测验的整体情况,包括题目难度,学生能力水平;通过单维性检验、项目拟合度、气泡图等反映题目质量的高低。研究结果表明:① 该测验基本符合其测量目标。能较好地区分出学生能力水平和题目难度。② 题目较简单,学生能力水平范围大于题目难度分布,应增加部分高难度题目。③ 存在个别题目与模型预期的结果不一致,需进一步分析其内容与答题状况。研究所分析的九年级数学能力测验总体上能够准确地进行参数估计,是一套质量较高的测验,该测验基本符合其测量目标。
关键词
测验质量
分析
RASCH模型
学生能力
题目难度
WINSTEPS
分类号
G6 [文化科学—教育学]
下载PDF
职称材料
题名
水文测船悬杆测验设备技术改造
被引量:
1
5
作者
张广海
刘以泉
李庆金
王静
崔传杰
机构
黄委会山东水文水资源局
出处
《水文》
CSCD
北大核心
2001年第6期57-58,共2页
文摘
针对黄河下游悬杆测验设备落后的局面,对绞车进行了部分改造,并研制了一套适合于测船安装的HCX-1型直读式流速水深计数器,取得了较好的效果。
关键词
悬杆
流速
水深
设备
技术改造
测验质量
电源
分类号
P335.2 [天文地球—水文科学]
下载PDF
职称材料
题名
测验预测的价值
6
作者
徐虹
出处
《教育研究与实验》
1987年第1期42-43,41,共3页
文摘
测验作为评价和预测的主要工具之一,广泛运用于各级各类学校,但测验作为预测手段,其价值究竟如何?这个问题并没有引起人们深入思考,特别是许多教育工作者对此问题缺乏正确认识,从而影响了测验预测作用的发挥,进而妨碍人才选拔培养的科学化进程。本文试图从预测的实质,测验对个体预测的可能性,测验预测的准确性,测验预测同其他预测的比较等几方面来论述测验预测的价值问题。
关键词
预测结果
测验质量
预测方法
预测准确性
预测手段
正确认识
预测作用
培养的
可能性
发展趋势
分类号
G40 [文化科学—教育学原理]
下载PDF
职称材料
题名
从心理测验的本质看心理测验潜在的问题
被引量:
1
7
作者
陈生
机构
雁北师院心理教研室
出处
《雁北师范学院学报》
2005年第6期94-97,共4页
文摘
本文从心理测验的本质特征的间接性、相对性、定量化、代表性入手,引中出心里测验潜在的四个基本问题:心理特质的测量方法问题;心理测量的行为组样问题;测量量表的单位问题;心理测验的误差问题。在对这些问题的探讨分析的基础上,笔者认为:只有编制和使用心理测验的人员都谨慎对待,正确使用心理测验这一心理评估工具,才能使发挥出它应有的益处。
关键词
心理
测验
心理特
质量
表行为样本
Keywords
psychological measurement
psychological trait
scale
behavior sample
分类号
B841.7 [哲学宗教—基础心理学]
下载PDF
职称材料
题名
基于BP神经网络的认知诊断评估分类准确率影响因素分析
被引量:
5
8
作者
聂畅
孙小坚
辛涛
机构
北京师范大学
西南大学
出处
《中国考试》
CSSCI
北大核心
2021年第3期28-35,共8页
基金
中国基础教育质量监测协同创新中心2019年度自主课题“人工神经网络在认知诊断评估中的实现及影响因素研究”(BJZK-2019A1-19005)。
文摘
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。
关键词
BP神经网络
认知诊断评估
分类准确率
测验质量
测验
技术
Keywords
BP neural network
cognitive diagnostic assessment
accuracy of classification
test quality
test technique
分类号
G405 [文化科学—教育学原理]
下载PDF
职称材料
题名
一种新的信度估计
被引量:
8
9
作者
丁树良
周新莲
机构
江西师范大学计算机科学技术学院
广东教育学院数学系
出处
《江西师范大学学报(自然科学版)》
CAS
2002年第3期222-224,共3页
基金
江西省教委基金资助项目 (2 0 0 0 )
文摘
应用相关系数的信息并结合重排不等式 ,引入了一个新的信度系数 ζ ,并证明了 ζ≥α且在某些情况下 ,ζ可以弥补α系数、β系数及γ系数的不足 ,有时 ζ比λ2
关键词
信度估计
信度系数
相关系数
重排不等式
经典测量理论
质量
测验
Keywords
reliability
correlation coefficient
rearrangement inequality
分类号
O213.1 [理学—概率论与数理统计]
下载PDF
职称材料
题名
认知诊断模型题目功能差异检验方法的健壮性比较
10
作者
尹昊
周蔓
刘彦楼
辛涛
机构
青岛大学
曲阜师范大学
北京师范大学
出处
《中国考试》
CSSCI
北大核心
2021年第3期36-44,共9页
基金
山东省教育科学“十三五”规划2020年度教育招生考试专项“命题理论及试题库建设策略研究”(2020K2D009)。
文摘
在认知诊断模型中进行题目功能差异(DIF)的检测,目的在于保证测验的质量与效果。在以往研究的基础上,本研究重点探索在CDMs框架下,MH、LR、CSIBTEST、WObs、WSw、WXPD 6种DIF检测方法在Q矩阵是否正确设定以及有关DIF影响因素等条件下的表现。结果表明:在Q矩阵正确设定时,WObs、WSw和WXPD统计量表现要好于MH、LR和CSIBTEST方法;在Q矩阵错误设定时,6种方法都会出现Ⅰ类错误率膨胀和统计检验力较低的现象。相对而言,MH、LR和CSIBTEST方法的表现比较稳定,WObs、WSw和WXPD统计量的表现变化较大,WObs、WSw和WXPD统计量的Ⅰ类错误率和统计检验力的结果依然好于MH、LR、CSIBTEST方法。
关键词
认知诊断模型
题目功能差异
测验质量
Q矩阵错误设定
Wald统计量
Keywords
cognitive diagnosis models
differential item functioning
test quality
Q-matrix misspecification
improved Wald statistics
分类号
G405 [文化科学—教育学原理]
下载PDF
职称材料
题名
美国教育评估办法的缺点:述评
11
作者
柴振荣
出处
《管理观察》
1998年第2期61-61,共1页
关键词
美国教育
评估办法
述评
质量
测验
影响评估
教育体制
测验
制度
教育和培养
中青年专家
教育拨款
分类号
G649.7 [文化科学—高等教育学]
下载PDF
职称材料
题名
基于Rasch模型的力概念量表质量分析
被引量:
1
12
作者
潘澎
胡象岭
机构
曲阜师范大学物理学系
出处
《物理教师》
CAS
北大核心
2021年第8期2-6,共5页
基金
2019年度山东省基础教育教学改革立项项目“指向核心素养的高中物理教学设计案例开发与实施研究”(项目编号:3700009)研究成果.
文摘
力概念量表(Force Concept Inventory,简称FCI)是物理教育研究领域应用广泛的重要诊断工具.本研究以149名中学生为被试,基于Rasch模型采用Winsteps软件对中文版FCI的质量进行测量学检验.结果表明:对于中学生被试而言,中文版FCI的整体难度适当,拟合度较高,分离度、信度均较好,题目难度的分布形态较为合理,大部分题目的拟合度较好.但有的题目拟合度较差,量表及个别题目有待改进.
关键词
力概念量表(FCI)
RASCH模型
测验质量
分析
分类号
G633.7 [文化科学—教育学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
测验质量的三维审视及对命题的诉求
张远增
《考试研究》
2011
1
下载PDF
职称材料
2
客观性测验质量分析方法
杨丽敏
张永彬
《黑龙江教育学院学报》
1996
0
下载PDF
职称材料
3
测验质量评估指标之一——信度及其估计式综述
邢最智
《信阳师范学院学报(自然科学版)》
CAS
1990
0
下载PDF
职称材料
4
基于Rasch模型对九年级数学能力测验进行质量分析
蔡颖颖
林嘉浩
谢丹丹
张一凡
黎光明
《教育进展》
2017
4
下载PDF
职称材料
5
水文测船悬杆测验设备技术改造
张广海
刘以泉
李庆金
王静
崔传杰
《水文》
CSCD
北大核心
2001
1
下载PDF
职称材料
6
测验预测的价值
徐虹
《教育研究与实验》
1987
0
下载PDF
职称材料
7
从心理测验的本质看心理测验潜在的问题
陈生
《雁北师范学院学报》
2005
1
下载PDF
职称材料
8
基于BP神经网络的认知诊断评估分类准确率影响因素分析
聂畅
孙小坚
辛涛
《中国考试》
CSSCI
北大核心
2021
5
下载PDF
职称材料
9
一种新的信度估计
丁树良
周新莲
《江西师范大学学报(自然科学版)》
CAS
2002
8
下载PDF
职称材料
10
认知诊断模型题目功能差异检验方法的健壮性比较
尹昊
周蔓
刘彦楼
辛涛
《中国考试》
CSSCI
北大核心
2021
0
下载PDF
职称材料
11
美国教育评估办法的缺点:述评
柴振荣
《管理观察》
1998
0
下载PDF
职称材料
12
基于Rasch模型的力概念量表质量分析
潘澎
胡象岭
《物理教师》
CAS
北大核心
2021
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部