期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
Bias and Mean Square Error of Reliability Estimators under the One and Two Random Effects Models: The Effect of Non-Normality
1
作者 Mohamed M. Shoukri Tusneem Al-Hassan +2 位作者 Michael DeNiro Abdelmoneim El Dali Futwan Al-Mohanna 《Open Journal of Statistics》 2016年第2期254-273,共20页
The coefficient of reliability is often estimated from a sample that includes few subjects. It is therefore expected that the precision of this estimate would be low. Measures of precision such as bias and variance de... The coefficient of reliability is often estimated from a sample that includes few subjects. It is therefore expected that the precision of this estimate would be low. Measures of precision such as bias and variance depend heavily on the assumption of normality, which may not be tenable in practice. Expressions for the bias and variance of the reliability coefficient in the one and two way random effects models using the multivariate Taylor’s expansion have been obtained under the assumption of normality of the score (Atenafu et al. [1]). In the present paper we derive analytic expressions for the bias and variance, hence the mean square error when the measured responses are not normal under the one-way data layout. Similar expressions are derived in the case of the two-way data layout. We assess the effect of departure from normality on the sample size requirements and on the power of Wald’s test on specified hypotheses. We analyze two data sets, and draw comparisons with results obtained via the Bootstrap methods. It was found that the estimated bias and variance based on the bootstrap method are quite close to those obtained by the first order approximation using the Taylor’s expansion. This is an indication that for the given data sets the approximations are quite adequate. 展开更多
关键词 rater’s Reliability Random effects Models Multivariate Taylor’s Expansion Wald’s Confidence Interval Bootstrap Methods
下载PDF
创造力测评中的评分者效应 被引量:4
2
作者 韩建涛 刘文令 庞维国 《心理科学进展》 CSSCI CSCD 北大核心 2019年第1期171-180,共10页
创造力测评中的评分者效应(ratereffects)是指在创造性测评过程中,由于评分者参与而对测评结果造成的影响。评分者效应本质上源于评分者内在认知加工的不同,具体体现在其评分结果的差异。本文首先概述了评分者认知的相关研究,以及评分... 创造力测评中的评分者效应(ratereffects)是指在创造性测评过程中,由于评分者参与而对测评结果造成的影响。评分者效应本质上源于评分者内在认知加工的不同,具体体现在其评分结果的差异。本文首先概述了评分者认知的相关研究,以及评分者、创作者、社会文化因素对测评的影响。其次在评分结果层面梳理了评分者一致性信度的指标及其局限,以及测验概化理论和多面Rasch模型在量化、控制该效应中的应用。最后基于当前研究仍存在的问题,指出了未来可能的研究方向,包括深化评分者认知研究、整合不同层面评分者效应的研究,以及拓展创造力测评方法和技术等。 展开更多
关键词 评分者效应 创造力 主观评分 评分者认知 评分者一致性
下载PDF
绩效考核中宽大效应的成因及控制方法 被引量:14
3
作者 周浩 龙立荣 《心理科学进展》 CSSCI CSCD 北大核心 2005年第6期806-813,共8页
绩效考核中宽大效应对于组织的人力资源管理有极大的危害性。该文从考核情境因素、考核工具因素以及考核者因素三方面分析了绩效考核中宽大效应的成因,考核情境因素主要包括组织文化、考核目的、考核的匿名性;考核工具因素主要指考核指... 绩效考核中宽大效应对于组织的人力资源管理有极大的危害性。该文从考核情境因素、考核工具因素以及考核者因素三方面分析了绩效考核中宽大效应的成因,考核情境因素主要包括组织文化、考核目的、考核的匿名性;考核工具因素主要指考核指标的清晰与结构化;考核者因素包括考核者的动机、认知过程、情感、情绪以及稳定的人格特质。同时,根据对成因的分析提出了对绩效考核中宽大效应的控制方法。最后,指出了以往研究的不足以及未来需要深入研究的几个问题。 展开更多
关键词 绩效考核 宽大效应 考核者
下载PDF
基于等级反应模型的多水平多侧面评分者模型 被引量:4
4
作者 康春花 孙小坚 曾平飞 《心理科学》 CSSCI CSCD 北大核心 2016年第1期214-223,共10页
国内外考试改革和大型测评实践越来越强调主观题的作用,则评分者信度研究又重新成为一个备受关注的议题。研究在Wang和Liu(2007)的广义多水平侧面模型基础上,提出并探讨了等级反应多水平侧面模型。结果表明:在评分者固定效应和随机效应... 国内外考试改革和大型测评实践越来越强调主观题的作用,则评分者信度研究又重新成为一个备受关注的议题。研究在Wang和Liu(2007)的广义多水平侧面模型基础上,提出并探讨了等级反应多水平侧面模型。结果表明:在评分者固定效应和随机效应两种实验条件下,各偏差值的均值与标准差均较小,说明模型在当前实验条件下,各参数估计值的返真性和稳健性均较好,可以检测出评分者效应,由此,后续可进一步加入评分者效应的影响因素,使其发展为可同时检测评分者效应及其影响因素的完整模型。 展开更多
关键词 主观评分 评分者效应 等级反应多水平侧面模型
下载PDF
无领导小组讨论的评分者效应分析 被引量:2
5
作者 姚若松 赵葆楠 +1 位作者 苗群鹰 梁乐瑶 《广州大学学报(社会科学版)》 CSSCI 2013年第2期60-65,共6页
以大学生为研究对象,实施无领导小组讨论测评,探讨培训组与非培训组评分者的信效度差异。通过相关分析、验证性因素分析等方法检验评分者的内部一致性、评分者间信度、组间与组内差异、结构效度及效标关联效度。结果显示,培训效应对评... 以大学生为研究对象,实施无领导小组讨论测评,探讨培训组与非培训组评分者的信效度差异。通过相关分析、验证性因素分析等方法检验评分者的内部一致性、评分者间信度、组间与组内差异、结构效度及效标关联效度。结果显示,培训效应对评分者影响显著,经培训与未经培训的评分者组间差异显著,培训组评分结果的效标关联效度优于非培训组。对评分者进行系统的培训能有效促进客观公正地实施测评,提高测评结果准确性。 展开更多
关键词 无领导小组讨论测评 评分者内部一致性 评分者间信度 评分者效应 效标关联效度
下载PDF
HSK作文客观化评分的研究 被引量:3
6
作者 田清源 赵刚 《汉语学习》 CSSCI 北大核心 2008年第5期103-107,共5页
作文是语言能力测试中一项重要的主观考试,是HSK高等考试的一个组成部分。主观考试可以弥补标准化试题的不足,但又存在评分依赖于评分员主观印象的问题,从而导致评分员自身的不稳定性和评分员之间的差异,它们统称为评分员效应。本文分... 作文是语言能力测试中一项重要的主观考试,是HSK高等考试的一个组成部分。主观考试可以弥补标准化试题的不足,但又存在评分依赖于评分员主观印象的问题,从而导致评分员自身的不稳定性和评分员之间的差异,它们统称为评分员效应。本文分析了评分员效应的来源,提出了使用专家系统利用计算机辅助评分以消除评分员效应的方案,通过模拟实验,验证了该方案的有效性。 展开更多
关键词 主观考试 作文 评分员效应 专家系统 汉语水平考试
下载PDF
磁控溅射制备In_2O_3-SnO_2薄膜与分析 被引量:6
7
作者 李世涛 乔学亮 陈建国 《中国有色金属学报》 EI CAS CSCD 北大核心 2005年第8期1214-1218,共5页
选择In2O3与SnO2质量比1:1的靶材为溅射源,采用磁控溅射法沉积了ITO薄膜,讨论了溅射氩气压强、氧流量、基体温度对薄膜透射率和方阻的影响,深入分析了其机理。研究结果表明:溅射时采用低Ar压强更有利于降低ITO薄膜的电阻率,并确... 选择In2O3与SnO2质量比1:1的靶材为溅射源,采用磁控溅射法沉积了ITO薄膜,讨论了溅射氩气压强、氧流量、基体温度对薄膜透射率和方阻的影响,深入分析了其机理。研究结果表明:溅射时采用低Ar压强更有利于降低ITO薄膜的电阻率,并确定最佳氩气压强为0.2Pa,厚度为120nm的ITO薄膜在可见光区的透过率可达到90%;氧流量能明显改变薄膜的性能,随着氧流量从0增加10L/min(标准状态下,下同),载流子浓度(N)则由3.2×10^20降低到1.2×10^19/cm^3,N值的变化与ITO薄膜光学禁带宽度(Eg)的变化密切相关。振子模型与实验结果吻合,并确定了ITO薄膜的等离子波长(λ=1510nm)。薄膜随方阻减小表现出明显的“B-M”效应。通过线性外推,建立了直接跃迁的(αE)^2模型,并确定了薄膜的Eg值(3.5~3.86eV)。 展开更多
关键词 ITO薄膜 磁控溅射 氧流量 “BM”效应
下载PDF
等级反应多水平侧面模型及其在主观题评分中的应用 被引量:2
8
作者 康春花 孙小坚 曾平飞 《心理科学》 CSSCI CSCD 北大核心 2017年第6期1483-1490,共8页
探讨了康春花,孙小坚和曾平飞(2016)提出的等级反应多水平侧面模型(GR-MLFM)在包含被试及评分者层面预测变量(完整模型)下的返真性和适用性。结果表明:(1)GR-MLFM完整模型具有逻辑上和数理上的合理性,可用于主观题的评分情境,能较好地... 探讨了康春花,孙小坚和曾平飞(2016)提出的等级反应多水平侧面模型(GR-MLFM)在包含被试及评分者层面预测变量(完整模型)下的返真性和适用性。结果表明:(1)GR-MLFM完整模型具有逻辑上和数理上的合理性,可用于主观题的评分情境,能较好地检测出评分者效应、影响因素及其影响程度;(2)在数学问题解决的评分实践中,评分员存在两种类型的评分倾向(宽松和严格效应),但绝大多数评分员的宽严度不明显;评分者的责任心可正向预测其严格程度,自信心可正向预测其宽松程度,而情绪稳定性和评分经验的预测作用不显著。 展开更多
关键词 等级反应多水平侧面模型 完整模型 评分者影响因素 评分者效应
下载PDF
PISA中国试测研究的评分者效应分析对高考网上阅卷的启示 被引量:2
9
作者 王蕾 张文静 《统计与信息论坛》 CSSCI 2012年第6期95-101,共7页
针对PISA 2009中国试测研究主观题评分环节所采用的多重编码设计,分析在阅读、数学和科学领域的评分中是否存在评分者效应。根据多侧面Rasch模型方法,分别对这三个领域进行评分者主效应的分析。结果显示:阅读和科学领域中,评分者之间的... 针对PISA 2009中国试测研究主观题评分环节所采用的多重编码设计,分析在阅读、数学和科学领域的评分中是否存在评分者效应。根据多侧面Rasch模型方法,分别对这三个领域进行评分者主效应的分析。结果显示:阅读和科学领域中,评分者之间的严苛度/宽松度差异非常显著;而数学领域中,评分者之间的严苛度/宽松度差异较小。最后,探讨了这些结果的可能原因以及对高考网上阅卷评分借鉴的建议。 展开更多
关键词 评分者效应 严苛度/宽松度 PISA 多重编码 高考网上阅卷
下载PDF
大规模教育考试作文评分中的严厉度漂移研究 被引量:1
10
作者 赵海燕 辛涛 田伟 《中国考试》 CSSCI 2019年第2期1-8,共8页
严厉度漂移是指在主观题评分过程中,评分员的严厉度效应的跨时间、场合或任务的波动。本研究基于某高利害性大规模教育考试的作文评分现场收集的操作性数据,借助传统检测方法侦测严厉度漂移,并比较不同模型变式和效应指标的结果。研究... 严厉度漂移是指在主观题评分过程中,评分员的严厉度效应的跨时间、场合或任务的波动。本研究基于某高利害性大规模教育考试的作文评分现场收集的操作性数据,借助传统检测方法侦测严厉度漂移,并比较不同模型变式和效应指标的结果。研究结果表明,在当前评分任务上,评分员在整体上并未发生明显的严厉度漂移,但有相当比例的个体评分员显示出波动现象,并且分离模型的检出率要明显高于交互作用模型。静态和动态严厉度效应间并不存在简单的加合或对应关系。评分员是否发生严厉度漂移并不取决于其静态效应的强度。 展开更多
关键词 主观题评分 作文评分 评分者效应 评分者漂移 严厉度漂移
下载PDF
基于IRT的评分者效应模型及其应用展望 被引量:4
11
作者 康春花 辛涛 《中国考试》 2010年第8期3-8,共6页
在教育测验理论与实践中,开放题或结构化题型越来越成为一种重要形式,当这种题型由多个评分者进行多重评定时.就必须考虑评分者偏差以及被试能力值估计的精确性.而基于IRT的评分者效应模型由于突破了CTT的局限而备受青睐。本文在介... 在教育测验理论与实践中,开放题或结构化题型越来越成为一种重要形式,当这种题型由多个评分者进行多重评定时.就必须考虑评分者偏差以及被试能力值估计的精确性.而基于IRT的评分者效应模型由于突破了CTT的局限而备受青睐。本文在介绍了三种比较有代表性的基于IRT的评分者效应模型基础上,对其在实践中的应用进行了展望。 展开更多
关键词 评分者效应 多面RASCH模型 评委束模型 阶层评分者模型
下载PDF
网络双评过程中作文评分误差以及评分者效应的分析——以大规模英语考试作文评分为例 被引量:3
12
作者 李美娟 刘红云 《中国考试》 2015年第2期39-48,共10页
目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文... 目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。 展开更多
关键词 主观题评分 多侧面Rasch模型 评分者误差分析
下载PDF
变革型领导风格的实证研究 被引量:43
13
作者 孟慧 《应用心理学》 CSSCI 2004年第2期18-22,共5页
以72家企业的193名管理者为被试,通过多来源评估法收集数据,采用因素分析、信度分析和回归分析等方法对变革型领导的理论结构及其与领导有效性的关系进行了深入研究。结果表明,变革型领导具有二阶单因素结构。即四个独立子因素为领导魅... 以72家企业的193名管理者为被试,通过多来源评估法收集数据,采用因素分析、信度分析和回归分析等方法对变革型领导的理论结构及其与领导有效性的关系进行了深入研究。结果表明,变革型领导具有二阶单因素结构。即四个独立子因素为领导魅力、感召力、智力激发和个性化关怀,这些子因素归属于一个单一二阶因素;研究所使用的《变革型领导问卷》具有良好的构想效度和信度,适用于中国文化;变革型领导及其子维度对领导有效性有一定的预测力。 展开更多
关键词 变革型领导 领导有效性 评分者一致性
下载PDF
评分人培训的研究现状及展望 被引量:5
14
作者 徐鹰 曾用强 《中国考试》 2014年第2期10-18,共9页
评分人培训是保证做事测试分数信、效度的重要方法,一直是国际语言测试界关注的重点。本文首先从理论框架、培训方法和培训效果等方面对评分人培训研究的现状进行了回顾,然后指出了当前研究中的两个问题:培训过程及内容不清楚,培训产生... 评分人培训是保证做事测试分数信、效度的重要方法,一直是国际语言测试界关注的重点。本文首先从理论框架、培训方法和培训效果等方面对评分人培训研究的现状进行了回顾,然后指出了当前研究中的两个问题:培训过程及内容不清楚,培训产生作用的机制不明确。最后,文章就下一步的研究进行了展望,希望能引起我国语言测试工作者对评分人培训的重视。 展开更多
关键词 做事测试 评分人培训 培训效果
下载PDF
基于多层面Rasch模型的评分员效应研究——以某市级青少年外语能力竞赛决赛为例 被引量:2
15
作者 程俊瑜 袁洁 《外语测试与教学》 2016年第1期32-38,共7页
本研究基于多层面Rasch模型,针对某市一次青少年外语能力竞赛决赛中的评分员效应进行研究,使用Facets软件分析了7名评分员对13名选手在外语能力竞赛中的评分。研究结果表明:1)评分员之间的严厉度有较为显著的差异,且有个别评分员自身一... 本研究基于多层面Rasch模型,针对某市一次青少年外语能力竞赛决赛中的评分员效应进行研究,使用Facets软件分析了7名评分员对13名选手在外语能力竞赛中的评分。研究结果表明:1)评分员之间的严厉度有较为显著的差异,且有个别评分员自身一致性较差;2)7位评分员总体并没出现显著的集中趋势和随机性,但是个别评分员在打分时可能出现集中趋势和随机效应;3)7位评分员出现了明显的晕轮效应;4)在区别性严厉度方面,评分员在对个别选手和不同性别的选手评分时出现偏差,在评分项目上不存在评分偏差。本文对产生上述评分偏差的原因进行了初步的探讨,并针对问题提出了相应的建议。 展开更多
关键词 多层面RASCH模型 评分员效应 严厉度 评分员偏差
下载PDF
主观题评分中的评分者漂移及其传统检测方法 被引量:5
16
作者 赵海燕 辛涛 田伟 《中国考试》 2018年第8期20-27,共8页
评分者漂移是指评分员跨时间、场合或任务的行为改变,即评分者效应的波动。该构念的提出反映了研究者对评分者效应的兴趣由静态转为动态。在高利害教育考试的背景下,对评分者漂移进行检测是保障结果分数的信度、效度和考试公平性的必然... 评分者漂移是指评分员跨时间、场合或任务的行为改变,即评分者效应的波动。该构念的提出反映了研究者对评分者效应的兴趣由静态转为动态。在高利害教育考试的背景下,对评分者漂移进行检测是保障结果分数的信度、效度和考试公平性的必然要求。目前,对评分者漂移的检测主要采取基于多面Rasch模型和差异检验的传统方法。评分者漂移的模型拓展、认知与测量结合以及改进评分设计等方面值得做进一步的研究。 展开更多
关键词 主观题评分 评分者效应 评分者漂移 传统检测方法
下载PDF
企业组织绩效管理问责制与绩效管理有效性:多层次线性模型的分析 被引量:12
17
作者 冯明 闫敏 《管理工程学报》 CSSCI CSCD 北大核心 2017年第4期26-33,共8页
研究以36家大型企业中的106名管理者和820名员工为调研对象,考察了组织绩效管理问责制、评估者责任心和被评估者责任心对绩效管理有效性的直接或间接影响。多层线性分析(HLM)的结果表明:组织绩效管理问责制对员工绩效管理有效性有显著... 研究以36家大型企业中的106名管理者和820名员工为调研对象,考察了组织绩效管理问责制、评估者责任心和被评估者责任心对绩效管理有效性的直接或间接影响。多层线性分析(HLM)的结果表明:组织绩效管理问责制对员工绩效管理有效性有显著的正向影响,评估者责任心和被评估者责任心在其间起跨层次的完全中介效应;组织绩效管理问责制在评估者责任心与绩效管理有效性的关系中存在显著的跨层次调节效应,绩效管理问责制的显著性和强度越高的组织中,评估者责任心对绩效管理有效性的影响作用就越强烈,但对被评估者责任心与绩效管理有效性之间关系的调节效应不够显著。 展开更多
关键词 组织绩效管理问责制 评估者责任心 被评估者责任心 绩效管理有效性 多层次线性模型
下载PDF
语言测试研究中的多层面Rasch模型——原理简介和研究综述 被引量:12
18
作者 张洁 《外语测试与教学》 2014年第3期50-59,共10页
语言运用测试(language performance assessment)是各种大规模语言考试中不可或缺的部分,但因为其测试环境中不可避免地引入了评分员的主观判断、测试任务的难度、评分标准的设定和使用情况等因素,使其信度、效度及考试的公平性都受到... 语言运用测试(language performance assessment)是各种大规模语言考试中不可或缺的部分,但因为其测试环境中不可避免地引入了评分员的主观判断、测试任务的难度、评分标准的设定和使用情况等因素,使其信度、效度及考试的公平性都受到了质疑。多层面Rasch模型是项目反应理论(IRT)中经典Rasch模型在多个维度上的延伸,它的主要优势在于可以将考试环境中多个影响考生最终得分的因素纳入同一个数学模型中进行分析,并估算出各个层面的因素对考生成绩的影响程度。本文旨在对MFRM的工作原理和基本模型进行简单介绍,并系统梳理语言测试领域运用MFRM进行的相关研究,以期让读者更好地了解如何在语言测试研究中有效地运用这种统计方法。 展开更多
关键词 语言运用测试 多层面RASCH模型 评分员效应
下载PDF
PETS三级口语考试评分误差研究——结合定量统计和定性描述的方法 被引量:10
19
作者 张洁 《外语测试与教学》 2012年第2期33-42,共10页
口语考试作为主观性考试,其评分准确性在很大程度上会影响考试的信度和整体效度。本研究结合对评分结果的多层面Rasch模型统计分析和对评分员评分依据的定性描述,探讨PETS三级口语考试中常见的评分误差类型、程度和造成误差的可能原因,... 口语考试作为主观性考试,其评分准确性在很大程度上会影响考试的信度和整体效度。本研究结合对评分结果的多层面Rasch模型统计分析和对评分员评分依据的定性描述,探讨PETS三级口语考试中常见的评分误差类型、程度和造成误差的可能原因,并据此提出了改进评分标准,评分流程和评分员培训的建议。 展开更多
关键词 PETS三级口语考试 评分员效应 多层面RASCH模型 定性描述
下载PDF
TEM8写作新评分标准反馈分析 被引量:6
20
作者 颜静兰 《外语测试与教学》 2012年第4期6-13,共8页
本文分析讨论了英语专业四、八级考试新的写作评分标准,通过问卷调查和评分员的访谈,本调查分析表明,新的TEM写作评分标准由于其具化、细化的特点使其具有了较好的科学化属性,得到了大部分评分员的认可。新评分标准能够帮助评分员有效... 本文分析讨论了英语专业四、八级考试新的写作评分标准,通过问卷调查和评分员的访谈,本调查分析表明,新的TEM写作评分标准由于其具化、细化的特点使其具有了较好的科学化属性,得到了大部分评分员的认可。新评分标准能够帮助评分员有效地区别不同水平的写作能力。调查同时表明,新的TEM写作评分标准对写作教学也起到了较好的正向反拨作用。 展开更多
关键词 八级写作 评分标准 评分员 反拨作用
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部