期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
功能动作筛查中评分者间信度的实证研究 被引量:8
1
作者 吴华 阮辉 张新定 《成都体育学院学报》 CSSCI 北大核心 2016年第6期99-102,共4页
目的:功能动作筛查(FMS)目前已得到广泛认可,但其评分者信度存在争议。为了拓展其应用范围,本文对FMS评分者间的信度进行实证研究。方法:所取样本为高水平运动队男女篮、排球运动员37人,研究对象为专业评分者6人。6名评分者按照FMS评价... 目的:功能动作筛查(FMS)目前已得到广泛认可,但其评分者信度存在争议。为了拓展其应用范围,本文对FMS评分者间的信度进行实证研究。方法:所取样本为高水平运动队男女篮、排球运动员37人,研究对象为专业评分者6人。6名评分者按照FMS评价细则对被试运动员分别进行FMS评分,然后将每个评分者评定的各项分值,运用统计方法分析评分者信度。结果:(1)FMS中控体俯撑、肩部灵活性、深蹲、直膝抬腿、体旋5个项目,评分者间评分具有较高的关联性(W值0.723-0.904)和一致性(0.6<k≤1);(2)前后分腿蹲和过栏架步2项,相关性(W值0.380-0.570)与一致性(k<0.2)偏弱,但无显著性差异。结论:FMS的总体评分者间信度良好。 展开更多
关键词 功能动作筛查 评分者间信度 实证研究
下载PDF
基于电子档案袋测评的评分者间信度分析报告
2
作者 林莉兰 《西安外国语大学学报》 CSSCI 北大核心 2021年第4期67-72,共6页
本研究旨在评估一项电子档案袋测评实验的评分者间信度,分析评分差异的可能原因。从样本框按学号抽取85名学生的档案袋(28.3%)。8位评分者分成5组(每组2人,1名任课教师,1名外部评分者),根据量规对旨在反映学生反思能力和自我测评能力的... 本研究旨在评估一项电子档案袋测评实验的评分者间信度,分析评分差异的可能原因。从样本框按学号抽取85名学生的档案袋(28.3%)。8位评分者分成5组(每组2人,1名任课教师,1名外部评分者),根据量规对旨在反映学生反思能力和自我测评能力的两指标进行独立评分。分别用Cohen的kappa系数、PABAK指数、Spearman秩相关系数、配对样本t检验和效应量对两个评分者的一致性、相关性和差异性进行估计。结果表明:1)10组评分中,7组kappa值达到中等以上一致,9组修正kappa-PABAK值达到中等以上一致;2) 10组评分均达到中等到极强相关程度;3)任务类型和任务呈现方式、评分者角色以及对量规的理解一定程度上造成了评分偏差。本文针对研究结果讨论了对未来档案袋测评设计的启示。 展开更多
关键词 电子档案袋测评 评分者间信度 一致性 相关性 差异
原文传递
普通话水平测试评分信度调查分析
3
作者 王彩豫 《汉语学报》 2005年第4期52-57,共6页
本文旨在考察普通话水平测试的评分信度。笔者在抽样基础上,从考察测试员间的评分情况入手,对测试员的测评结果进行对比分析。结果显示:现行普通话水平测试评分信度较高,大多数测试员能够比较准确地把握测试标准、评定应试人普通话的水... 本文旨在考察普通话水平测试的评分信度。笔者在抽样基础上,从考察测试员间的评分情况入手,对测试员的测评结果进行对比分析。结果显示:现行普通话水平测试评分信度较高,大多数测试员能够比较准确地把握测试标准、评定应试人普通话的水平等级;在调查中也发现了一些制约普通话水平测试评分信度的主、客观因素。本文的研究结果对现行普通话水平测试的开展及其研究都有一定的价值。 展开更多
关键词 普通话水平测试 评分信度 评分者评分信度
下载PDF
无领导小组讨论的评分者效应分析 被引量:2
4
作者 姚若松 赵葆楠 +1 位作者 苗群鹰 梁乐瑶 《广州大学学报(社会科学版)》 CSSCI 2013年第2期60-65,共6页
以大学生为研究对象,实施无领导小组讨论测评,探讨培训组与非培训组评分者的信效度差异。通过相关分析、验证性因素分析等方法检验评分者的内部一致性、评分者间信度、组间与组内差异、结构效度及效标关联效度。结果显示,培训效应对评... 以大学生为研究对象,实施无领导小组讨论测评,探讨培训组与非培训组评分者的信效度差异。通过相关分析、验证性因素分析等方法检验评分者的内部一致性、评分者间信度、组间与组内差异、结构效度及效标关联效度。结果显示,培训效应对评分者影响显著,经培训与未经培训的评分者组间差异显著,培训组评分结果的效标关联效度优于非培训组。对评分者进行系统的培训能有效促进客观公正地实施测评,提高测评结果准确性。 展开更多
关键词 无领导小组讨论测评 评分者内部一致性 评分者间信度 评分者效应 效标关联效度
下载PDF
大规模开放在线学习学生互评效果实证研究 被引量:34
5
作者 罗恒 左明章 安东尼.鲁宾逊 《开放教育研究》 CSSCI 北大核心 2017年第1期75-83,共9页
学生互评能够有效弥补教师评阅和机器评分的局限,是适用于大规模开放在线学习情境的重要评价模式。然而,现阶段对在线互评模式的准确性和有效性尚缺少基于实证的系统研究。基于此,本文通过对一门大规模开放在线课程(MOOC)的学生互评、... 学生互评能够有效弥补教师评阅和机器评分的局限,是适用于大规模开放在线学习情境的重要评价模式。然而,现阶段对在线互评模式的准确性和有效性尚缺少基于实证的系统研究。基于此,本文通过对一门大规模开放在线课程(MOOC)的学生互评、自评和教师评分等数据的比较,得出在线互评模式的信度、效度、影响因素和学生认可度等初步结论。研究结果表明,尽管互评模式的评分者间信度并不理想,但综合考量多个评分结果的前提下,该模式能够为在线学习者提供较为一致可靠的最终得分。学生互评结果和教师评分结果的相关性系数高达0.619表明,该模式同时具有较好的聚合效度。此外,对课后问卷的统计分析表明,在线学习者对互评模式总体持积极态度,认可互评活动对反馈获得、课程投入和高阶思维培养等的有益影响。这些发现和结论对完善和改进面向大规模开放在线学习的评价模式有一定的指导意义。 展开更多
关键词 学生互评 评分者间信度 聚合效度 大规模开放在线学习
下载PDF
TOEFL iBT模式的价值及对我国大规模外语水平测试的可参照性 被引量:2
6
作者 薛宁地 《重庆交通大学学报(社会科学版)》 2010年第2期131-133,共3页
TOEFL iBT的构念效度高于旧TOEFL,原因有三方面:测试内容更全面;改变了分立地测试语言能力的方法;测试了考生是否具有根据不同情景使用合适的语言的能力。TOEFL iBT测试模式的价值主要体现在其较高的构念效度。评分者间信度是我国大规... TOEFL iBT的构念效度高于旧TOEFL,原因有三方面:测试内容更全面;改变了分立地测试语言能力的方法;测试了考生是否具有根据不同情景使用合适的语言的能力。TOEFL iBT测试模式的价值主要体现在其较高的构念效度。评分者间信度是我国大规模外语水平测试参照TOEFL iBT模式的障碍。我国的CET4和CET6应尽量参照TOEFL iBT模式,但主观题所占分值比例宜控制在30%左右。 展开更多
关键词 托福 测试 构念效度 评分者间信度
下载PDF
评价量规设计对慕课同伴互评有效性的影响研究 被引量:25
7
作者 范逸洲 冯菲 +1 位作者 刘玉 汪琼 《电化教育研究》 CSSCI 北大核心 2018年第11期45-51,共7页
同伴互评是MOOC常采用的学员作业评价方法,但是MOOC同伴互评的准确性和可靠性因学员知识水平程度差异过大而被质疑。为了研究如何通过改进评价量规来提高同伴互评的可靠性和准确性,在教师培训类MOOC"翻转课堂教学法"的两期教... 同伴互评是MOOC常采用的学员作业评价方法,但是MOOC同伴互评的准确性和可靠性因学员知识水平程度差异过大而被质疑。为了研究如何通过改进评价量规来提高同伴互评的可靠性和准确性,在教师培训类MOOC"翻转课堂教学法"的两期教学中,我们进行了若干设计研究。研究发现,在教学培训类MOOC的同伴互评活动中,学生评分和教师评分高度相关。细化评分量规的等级描述,以及采用是非选择型的评价量规都能显著提高评分者间信度和评分效度,且评分者间信度与评分效度的差异度与学生所提交作业文档本身的质量也有关系。在研究发现的基础上,文章提出了MOOC同伴互评评价量规的设计原则和使用建议。 展开更多
关键词 同伴互评 评价量规 设计研究 评分者间信度 评分效度 量规设计原则
下载PDF
交际语言测试理论视阈下的任务型日语口语测试的设计与开发 被引量:3
8
作者 董博 于飞 《科技资讯》 2016年第22期115-117,共3页
口语测试因操作性差、成本高效率低等原因很难实施运作,然而作为有效的语言行为测试却是可以直接考查学生二语运用能力的有效测试方法。该文在交际语言测试理论视阈下,设计开发一项日语口语测试,通过探讨在预测中如何完善评分量表、保... 口语测试因操作性差、成本高效率低等原因很难实施运作,然而作为有效的语言行为测试却是可以直接考查学生二语运用能力的有效测试方法。该文在交际语言测试理论视阈下,设计开发一项日语口语测试,通过探讨在预测中如何完善评分量表、保证评分者间信度、甄选任务课题3方面问题尝试为日语口语测试开发提供研发路径和设计框架。 展开更多
关键词 交际语言测试 预测 评分量表 评分者间信度 任务课题
下载PDF
化学实验操作考查能否得到可信的评价结果——以初三物质鉴别实验为例 被引量:5
9
作者 麦裕华 林建芬 《化学教育》 CAS 北大核心 2014年第15期36-40,共5页
以内地新疆高中班预科学生完成初三化学课程中3种固体粉末的鉴别实验为例,了解实验操作考查的评分者间信度的具体情况和影响因素.在本研究中,2位评分者的评分有较大的差异和较低的一致性,评分者间信度较低.试题的复杂性、监考学生的人... 以内地新疆高中班预科学生完成初三化学课程中3种固体粉末的鉴别实验为例,了解实验操作考查的评分者间信度的具体情况和影响因素.在本研究中,2位评分者的评分有较大的差异和较低的一致性,评分者间信度较低.试题的复杂性、监考学生的人数、评分标准的设计、评分者对评分标准的理解这4方面影响着评分者间信度.建议实验操作考查组织者控制监考学生的人数,加强评分者的培训工作,真正发挥实验操作考查的评价功能. 展开更多
关键词 评分者间信度 表现性评价 实验操作考查 物质鉴别实验
下载PDF
两种战伤编码的比较与转换研究
10
作者 胡鹏伟 解宏伟 +6 位作者 杨晨 秦宇迪 陈福兴 常旺 陈国良 张磊 刘晓荣 《中国急救复苏与灾害医学杂志》 2021年第6期675-679,共5页
目的目前美军较为成熟的战伤编码系统为美军战地医疗系统伤情编码(Deployable medical systems patient conditions,PCs)和美军战伤定级编码系统(Military Combat Injury Scale,MCIS)。PCs由于包含战伤诊断、救治概要、生存概率以及后... 目的目前美军较为成熟的战伤编码系统为美军战地医疗系统伤情编码(Deployable medical systems patient conditions,PCs)和美军战伤定级编码系统(Military Combat Injury Scale,MCIS)。PCs由于包含战伤诊断、救治概要、生存概率以及后送要求等要素,广泛应用于卫勤领域的模拟仿真系统,但对于真实战伤诊断数据的编码率较低,且无法对严重程度定级。MCIS具有针对强、简单易用等特点,能够较好地对真实战伤诊断进行编码并对战伤严重度定级,但目前仅包括战伤诊断要素,缺少卫勤决策支持的其他要素。因此本文通过对两套编码系统进行对比与转换研究,探究建立两套编码系统转换规则的可行性,从而使得真实战伤数据和模拟仿真数据相结合,共同为卫勤决策提供支持,并为构建我军战伤编码提供建议。方法提取PCs中187个战伤伤情编码,将PCs和MCIS编码指导手册分别交给3名资深编码员,分别将两套编码进行匹配并记录。计算不同编码员匹配记录的加权Kappa系数用以评价评分者间信度。结果两套编码匹配记录的评分者信度较差。结论亟待建立一套既能编码真实战伤诊断数据,又涵盖卫勤决策支持要素的战伤分类与编码系统,从而将真实数据与模拟仿真数据相结合,共同形成决策证据为卫勤保障提供决策支持。 展开更多
关键词 战伤 编码 匹配 转换 评分者间信度
下载PDF
我国抗肿瘤药物超说明书用药价值评价模型的探索性实证研究 被引量:5
11
作者 罗静 魏华 +3 位作者 藕顺龙 刘辉 李幼平 蒋倩 《中国医院药学杂志》 CAS 北大核心 2022年第2期184-188,201,共6页
目的:评价我国抗肿瘤药物超说明书用药价值评价模型(以下简称"中国模型")的科学性、实用性和可行性。方法:以卵巢癌为例,涵盖目前我院备案使用的5个药物,10个超说明书用药治疗方案。每位小组成员使用中国模型、美国临床肿瘤... 目的:评价我国抗肿瘤药物超说明书用药价值评价模型(以下简称"中国模型")的科学性、实用性和可行性。方法:以卵巢癌为例,涵盖目前我院备案使用的5个药物,10个超说明书用药治疗方案。每位小组成员使用中国模型、美国临床肿瘤学会价值框架(American Society of Clinical Oncology Value Framework,ASCO-VF)、欧洲肿瘤内科学会临床获益量表(European Society for Medical Oncology Magnitude of Clinical Benefit Scale,ESMO-MCBS)对其进行评价。计算各药物治疗方案的平均得分和标准差,肯德尔和谐系数(Kendall’s coefficient of concordance,Kendall’s W)和组内相关系数(intraclass correlation efficient,ICC)评估聚合效度和评分者间信度。使用SPSS 25.0软件进行分析。结果:盐酸多柔比星脂质体联合卡铂用于卵巢癌一线和维持治疗的价值评价结果得分最高。3种药物价值评价工具的Kendall’s W为0.706,P=0.048,两两比较时,中国模型与ESMO-MCBS组最高,中国模型与ASCO-VF组最低。3种工具中的临床获益Kendall’s W(0.778,P=0.030)最高,不良反应最低(0.302,P=0.490)。中国模型、ASCO-VF、ESMO-MCBS的ICC和95%CIs分别为0.633(0.410,0.860)、0.918(0.806,0.983)、0.827(0.634,0.960)。结论:我国抗肿瘤药物超说明书用药价值评价模型在预测抗肿瘤药物超说明书用药价值方面具有较高的可靠性和可行性,值得推广应用。 展开更多
关键词 卵巢癌 超说明书用药 价值评价 聚合效度 评分者间信度
原文传递
功能性动作筛查的可靠性与临床应用的研究进展
12
作者 祁旋 《运动精品》 2019年第2期73-75,共3页
自北美运动物理治疗杂志发表第一篇关于功能性动作筛查(FMS)论文后,一些作者个人或集体开始对FMS筛查的评分信度进行研究调查,主要集中在不同教育背景和经验水平的新手或专家的评分者间信度(Interrater Reliability),评分者内信度(Intra... 自北美运动物理治疗杂志发表第一篇关于功能性动作筛查(FMS)论文后,一些作者个人或集体开始对FMS筛查的评分信度进行研究调查,主要集中在不同教育背景和经验水平的新手或专家的评分者间信度(Interrater Reliability),评分者内信度(Intrarater Reliability)和重测信度(Test-retest Reliability)等,另外还增加了在临床环境中的应用的研究,但临床应用的可靠性尚未得到充分证实。总体上均显示出中等至良好的评分者间信度与评分者内信度,即使新手评估者之间的信度,误差也处于可接受范围之内;重测信度同样具有良好的水平;临床医生在将功能性动作筛查作为损伤预测工具广泛的应用于临床实践之前应谨慎。 展开更多
关键词 FMS 评分者间信度 评分者信度 损伤 临床应用
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部