期刊文献+
共找到226篇文章
< 1 2 12 >
每页显示 20 50 100
Testing Rating Scale Unidimensionality Using the Principal Component Analysis (PCA)/<i>t</i>-Test Protocol with the Rasch Model: The Primacy of Theory over Statistics 被引量:1
1
作者 Peter Hagell 《Open Journal of Statistics》 2014年第6期456-465,共10页
Psychometric theory requires unidimensionality (i.e., scale items should represent a common latent variable). One advocated approach to test unidimensionality within the Rasch model is to identify two item sets from a... Psychometric theory requires unidimensionality (i.e., scale items should represent a common latent variable). One advocated approach to test unidimensionality within the Rasch model is to identify two item sets from a Principal Component Analysis (PCA) of residuals, estimate separate person measures based on the two item sets, compare the two estimates on a person-by-person basis using t-tests and determine the number of cases that differ significantly at the 0.05-level;if ≤5% of tests are significant, or the lower bound of a binomial 95% confidence interval (CI) of the observed proportion overlaps 5%, then it is suggested that strict unidimensionality can be inferred;otherwise the scale is multidimensional. Given its proposed significance and potential implications, this procedure needs detailed scrutiny. This paper explores the impact of sample size and method of estimating the 95% binomial CI upon conclusions according to recommended conventions. Normal approximation, “exact”, Wilson, Agresti-Coull, and Jeffreys binomial CIs were calculated for observed proportions of 0.06, 0.08 and 0.10 and sample sizes from n= 100 to n= 2500. Lower 95%CI boundaries were inspected regarding coverage of the 5% threshold. Results showed that all binomial 95% CIs included as well as excluded 5% as an effect of sample size for all three investigated proportions, except for the Wilson, Agresti-Coull, and JeffreysCIs, which did not include 5% for any sample size with a 10% observed proportion. The normal approximation CI was most sensitive to sample size. These data illustrate that the PCA/t-test protocol should be used and interpreted as any hypothesis testing procedure and is dependent on sample size as well as binomial CI estimation procedure. The PCA/t-test protocol should not be viewed as a “definite” test of unidimensionality and does not replace an integrated quantitative/qualitative interpretation based on an explicit variable definition in view of the perspective, context and purpose of measurement. 展开更多
关键词 CONFIDENCE INTERVALS Dimensionality PSYCHOMETRICS rasch model Validity
下载PDF
Rating Score Data Analysis by Classical Test Theory and Many-Facet Rasch Model
2
作者 Tsai-Wei Huang Gwo-Jen Guo +1 位作者 William Loadman Fang-Mei Law 《Psychology Research》 2014年第3期222-231,共10页
关键词 h模型 多层面 数据分析 评价 测验 可靠性参数 教育评估 试题难度
下载PDF
Computational Precision of the Power Function for Conditional Tests of Assumptions of the Rasch Model
3
作者 Clemens Draxler Jan Philipp Nolte 《Open Journal of Statistics》 2018年第6期873-884,共12页
Draxler and Zessin [1] derived the power function for a class of conditional tests of assumptions of a psychometric model known as the Rasch model and suggested an MCMC approach developed by Verhelst [2] for the numer... Draxler and Zessin [1] derived the power function for a class of conditional tests of assumptions of a psychometric model known as the Rasch model and suggested an MCMC approach developed by Verhelst [2] for the numerical approximation of the power of the tests. In this contribution, the precision of the Verhelst approach is investigated and compared with an exact sampling procedure proposed by Miller and Harrison [3] for which the discrete probability distribution to be sampled from is exactly known. Results show no substantial differences between the two numerical procedures and quite accurate power computations. Regarding the question of computing time the Verhelst approach will have to be considered much more efficient. 展开更多
关键词 CONDITIONAL Tests CONDITIONAL PROBABILITY DISTRIBUTION HYPERGEOMETRIC DISTRIBUTION Power Function Random Sampling rasch model
下载PDF
A Multi-facet Rasch Model Analyses of Internal Consistency and Rating Bias Detecting in English Tests
4
作者 Zhang Ni 《西安翻译学院学报》 2017年第3期48-53,共6页
下载PDF
基于Rasch模型的船舶舾装效率影响要素分析
5
作者 李晓萍 杨倩 张辉 《船舶工程》 CSCD 北大核心 2024年第5期129-137,共9页
针对现有提高舾装效率的研究局限于某一环节,缺乏全面系统性分析,难以客观准确评价各因素影响程度的问题,基于实地考察、专家访谈、问卷调查等方法,综合考虑舾装作业离散型特征,从策划和实施2个阶段分析涉及设计、设备、计划以及人机料... 针对现有提高舾装效率的研究局限于某一环节,缺乏全面系统性分析,难以客观准确评价各因素影响程度的问题,基于实地考察、专家访谈、问卷调查等方法,综合考虑舾装作业离散型特征,从策划和实施2个阶段分析涉及设计、设备、计划以及人机料法环等8个方面的38个影响舾装效率的因素,采用Vague集-熵权法进行主客观评估,筛选出28个关键因素,并采用Rasch模型方法对影响舾装效率的多重要素进行影响程度定量分析。研究发现:策划阶段对舾装效率的影响程度较大,其中因不可控要素供应链受阻是影响最大的要素。研究表明企业应对策划阶段重点改进;实施阶段对舾装效率影响较小,企业无需投入过多资源改进。 展开更多
关键词 舾装效率 影响要素 Vague集-熵权法 rasch模型
下载PDF
孕妇尿失禁知信行量表的汉化及在孕妇中的Rasch模型分析
6
作者 张璐 郭娜菲 余燕飞 《现代临床护理》 2024年第5期10-18,共9页
目的汉化孕妇尿失禁知信行量表(knowledge,attitude and practice assessment scale for pregnant women on UI,KAP-IU)并评价其信度、效度,为医护人员对孕妇尿失禁知信行情况的评估提供测量工具。方法2022年12月—2023年3月按照国际通... 目的汉化孕妇尿失禁知信行量表(knowledge,attitude and practice assessment scale for pregnant women on UI,KAP-IU)并评价其信度、效度,为医护人员对孕妇尿失禁知信行情况的评估提供测量工具。方法2022年12月—2023年3月按照国际通用量表跨文化调适流程对量表进行汉化,形成中文版KAP-IU量表。2023年3月—6月采用便利抽样选取门诊就诊孕妇456例进行调查,基于Rasch模型和经典测量学检验指标进行信度、效度检验。结果430例孕妇完成研究。中文版KAP-IU量表共由23个条目构成,符合Rasch模型单维性假设,Rasch模型解释了66.1%的变异;个人和条目的分隔信度均>0.8,分隔指数≈3,所有条目加权的均方拟合统计量(information-weighted mean square fit statistic,Infit MNSQ)和未加权的均方拟合统计量(unweighted mean square fit statistic,Outfit MNSQ)均方值在0.473~1.611之间,点测量相关系数(point-measure correlation,Pt-Measure Corr)在0.293~0.731之间,个体能力均值比条目难度均值高0.343 Logits;总量表Cronbachα系数为0.783,3个维度(知识、态度和行为)的重测信度分别为0.751、0.815、0.760;条目水平内容效度指数(item-level CVI,I-CVI)为0.810~1.000;量表水平内容效度(scale-level CVI,S-CVI)为0.824。结论中文版KAP-IU量表在国内孕妇人群中经验证信度、效度良好,难度适中,可作为孕妇尿失禁知信行情况评估的可靠工具。 展开更多
关键词 孕妇尿失禁知信行量表 rasch模型分析 信度 效度
下载PDF
基于Rasch模型的诊断性试卷编制研究——以“反应热”为例
7
作者 饶雯 郑柳萍 《宁德师范学院学报(自然科学版)》 2024年第1期105-112,共8页
结合新课程标准,基于Rasch模型,以“反应热”为例编制诊断性试卷,在福州市某一级达标中学进行试测,对所编制的试卷进行质量评析和试题优化.分析结果表明,编制的化学诊断性试卷信效度良好,具有良好的诊断功能.Rasch模型分析结果可以为试... 结合新课程标准,基于Rasch模型,以“反应热”为例编制诊断性试卷,在福州市某一级达标中学进行试测,对所编制的试卷进行质量评析和试题优化.分析结果表明,编制的化学诊断性试卷信效度良好,具有良好的诊断功能.Rasch模型分析结果可以为试题修订、形成最终试卷、评定学生水平提供有效参考. 展开更多
关键词 试卷编制 诊断性试卷 rasch模型
下载PDF
基于研究的早期数学能力评估工具的修订:应用Rasch模型分析
8
作者 蔡军 杨琼 《数学教育学报》 北大核心 2024年第3期64-70,共7页
儿童早期数学能力评估对数学能力的发展研究具有重要意义,研究修订了《早期数学能力评估工具》(Research-Based Early Math Assessment,REMA),并对其信度和效度进行检验.研究以上海市两所幼儿园313名儿童为研究对象,采用项目反应理论中... 儿童早期数学能力评估对数学能力的发展研究具有重要意义,研究修订了《早期数学能力评估工具》(Research-Based Early Math Assessment,REMA),并对其信度和效度进行检验.研究以上海市两所幼儿园313名儿童为研究对象,采用项目反应理论中的Rasch模型检验REMA的信效度.结果表明,REMA的信度较好,基本为单一的能力维度结构,怀特图说明量表整体适合中高水平的被试,各个项目的内外适合度指标在0.5~1.5之间,符合Rasch模型,早期数学能力与数学学习品质呈中高水平相关(相关系数在0.34~0.61之间).研究表明,REMA量表具有良好的信效度,适合作为评估3~6岁学前儿童数学能力的有效工具. 展开更多
关键词 早期数学能力 学前儿童 rasch模型 项目反应理论
下载PDF
基于Rasch模型的停车换乘服务满意度分析
9
作者 武娜娜 《内燃机与配件》 2024年第17期133-135,共3页
随着城市汽车数量快速增长及城市化进程的加快,停车系统与汽车规模不匹配的矛盾日益显著,停车换乘(P+R)模式一定程度上可以缓解停车及交通压力。本文以西安市停车换乘系统为研究对象,采用5点李克特量表设计调查问卷并获取数据,构建基于R... 随着城市汽车数量快速增长及城市化进程的加快,停车系统与汽车规模不匹配的矛盾日益显著,停车换乘(P+R)模式一定程度上可以缓解停车及交通压力。本文以西安市停车换乘系统为研究对象,采用5点李克特量表设计调查问卷并获取数据,构建基于Rasch模型的停车换乘服务满意度评价模型,将数据与模型进行拟合,估计项目参数并对西安市停车换乘服务满意度进行分析,研究结果显示,数据与模型拟合情况较好,出行者整体对停车换乘服务的满意程度较高。 展开更多
关键词 停车换乘 rasch模型 满意度
下载PDF
基于Rasch模型的理科生科学推理能力测评研究
10
作者 程朝娟 朱巧萍 《西华师范大学学报(自然科学版)》 2024年第3期335-342,共8页
科学推理是科学思维的重要组成部分。基于Rasch模型运用LCTSR 2000对419名理科生的科学推理能力进行测评研究,分析量表的质量和被试科学推理能力发展情况。研究表明:理科生的科学推理能力各维度发展不均衡;科学推理能力与学业成绩呈较... 科学推理是科学思维的重要组成部分。基于Rasch模型运用LCTSR 2000对419名理科生的科学推理能力进行测评研究,分析量表的质量和被试科学推理能力发展情况。研究表明:理科生的科学推理能力各维度发展不均衡;科学推理能力与学业成绩呈较低的正相关;男生的科学推理能力略高于女生,科学推理能力不存在显著的性别差异。依据实证研究结果,对影响科学推理能力发展的主要原因进行讨论,并提出相应的教学建议。 展开更多
关键词 rasch模型 科学推理能力 质量分析 测评研究 教学建议
下载PDF
基于多层面Rasch模型的英语口试信度分析
11
作者 邵健 《浙江工商职业技术学院学报》 2023年第4期60-67,共8页
英语口语考试涉及面广,难以用单一指标衡量信度,而多层面Rasch模型可以从考生、评分员、评分标准和评分量表等角度探讨影响成绩的测量误差。可以某校中外合作专业大一新生分级考试中的英语口试成绩为研究对象,运用Facets软件进行分析。... 英语口语考试涉及面广,难以用单一指标衡量信度,而多层面Rasch模型可以从考生、评分员、评分标准和评分量表等角度探讨影响成绩的测量误差。可以某校中外合作专业大一新生分级考试中的英语口试成绩为研究对象,运用Facets软件进行分析。研究发现,虽然评分员的主观评分会产生一定的测量误差,使考生实际测量值和预测值存在出入,但这差异并不足以影响考生的最终报道成绩。此外,多层面Rasch模型证明:考生、评分员、评分标准和量表这四个层面具有良好的内部一致性,总体较为理想,因此,可认为该校组织的英语口语考试具有良好的信度。 展开更多
关键词 多层面rasch模型 偏差分析 信度 口试 国际第二语言水平量表
下载PDF
基于Rasch模型的中国初中生营养健康素养问卷评价 被引量:2
12
作者 昝子晴 顾晗昕 +4 位作者 张玉 王焕倩 白媛媛 张羽欧 尤莉莉 《中国健康教育》 北大核心 2023年第3期233-236,共4页
目的基于项目反应理论开发并验证中国初中生营养健康素养问卷,探讨不同层次、不同类别青少年营养健康素养水平测量条目的形式与适宜性。方法通过政策梳理、文献研究及专家访谈等方法,开发形成问卷,选取不同经济发展水平的3个省份/直辖... 目的基于项目反应理论开发并验证中国初中生营养健康素养问卷,探讨不同层次、不同类别青少年营养健康素养水平测量条目的形式与适宜性。方法通过政策梳理、文献研究及专家访谈等方法,开发形成问卷,选取不同经济发展水平的3个省份/直辖市的城区与郊县986例初中生进行现场施测。使用Rasch模型对问卷进行质量分析,包括单维性检验、整体质量分析、难度分析、项目拟合情况等。结果问卷单维性通过,项目与被试信度均>0.7,分离度均>1.5。怀特图条目难度与被试能力符合正态分布,但上端条目没有被试与之对应。4项条目INFIT MNSQ值小于0.6,拟合过度;1项条目INFIT MNSQ值大于1.4,拟合不足。结论问卷数据与模型拟合情况良好,在被试青少年人群中具有较高的内部一致性与良好的拟合性。问卷有效性与灵敏度可以通过降低部分条目难度或增加低难度条目,以及删除第3项、第8项、第18项拟合欠佳条目以进一步提高。 展开更多
关键词 营养健康素养 中国初中生 rasch分析 信效度
下载PDF
营养自我效能量表的汉化及在老年慢性眼病患者中的Rasch模型分析 被引量:3
13
作者 雒培琳 万君丽 卞薇 《护理学杂志》 CSCD 北大核心 2023年第14期106-111,共6页
目的汉化营养自我效能量表,评估其在老年慢性眼病群体中的测量特性。方法采用Brislin模型对营养自我效能量表进行翻译、回译、文化调适及预调查,便利选取275例老年慢性眼病患者进行营养自我效能评估,并对测量数据进行Rasch模型分析。结... 目的汉化营养自我效能量表,评估其在老年慢性眼病群体中的测量特性。方法采用Brislin模型对营养自我效能量表进行翻译、回译、文化调适及预调查,便利选取275例老年慢性眼病患者进行营养自我效能评估,并对测量数据进行Rasch模型分析。结果营养自我效能量表中,3个维度都具备良好的单维性,各条目与所在维度拟合程度佳;各条目的Infit MNSQ和Outfit MNSQ为0.79~1.31;部分相邻两选项的阈值<1.4 logit;不同特征亚组患者DIF分析显示差异值的绝对值均<1 logit;量表的条目难度与平均能力水平的患者相适配;各维度的信度均为0.99,个体信度均>0.80,分离指数均>2。结论营养自我效能量表具有良好的信效度,适用于老年人营养自我效能的评定。但量表整体难度并不适配所有能力范围值的老年患者,后期研究中可以增设较高及较低难度的条目,调整条目之间的难度间距。 展开更多
关键词 老年人 眼病 营养自我效能 量表 信度 效度 rasch模型分析
下载PDF
基于Rasch模型的题库维护技术研究 被引量:1
14
作者 刘奕轩 姚建欣 《中国考试》 北大核心 2023年第4期68-77,共10页
随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型... 随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型的链接测评技术和题库维护方案,选择链接设计后重组题库,通过分析新、旧题库的试题所考查的能力维度、难度指标、功能差异等评估链接质量,将检验合格的18道试题存入题库。基于Rasch模型的题库维护方案提供了一套较为系统的工作程序和检验指标。 展开更多
关键词 题库维护 项目反应理论 rasch模型
下载PDF
基于Rasch模型的机场到港旅客换乘行为分析
15
作者 程雨婷 牟义强 徐勤思 《天津职业技术师范大学学报》 2023年第2期60-65,78,共7页
为提升机场的换乘效率和到港旅客换乘满意度,分析到港旅客换乘方式选择偏好的异质性,基于Rasch模型基本理论,构建包含心理潜变量的潜在类别条件logit模型进行实证研究。结果表明:加入心理潜变量的潜在类别条件logit模型相较于其他模型... 为提升机场的换乘效率和到港旅客换乘满意度,分析到港旅客换乘方式选择偏好的异质性,基于Rasch模型基本理论,构建包含心理潜变量的潜在类别条件logit模型进行实证研究。结果表明:加入心理潜变量的潜在类别条件logit模型相较于其他模型有着更高的拟合度和精度。受访换乘者可分为机场巴士偏好者、有轨电车偏好者及机场出租偏好者,分别占总样本的37.2%、53.5%、9.3%。对服务质量的要求等心理潜变量对换乘者潜在类别分类影响显著。 展开更多
关键词 换乘方式选择 rasch模型 心理潜变量 潜在类别条件logit模型
下载PDF
学习进阶视域下初中生科学能力测评工具的开发与检验 被引量:2
16
作者 邵川华 迟少辉 王祖浩 《中国考试》 北大核心 2024年第4期47-57,共11页
学习进阶不仅能反映学生能力发展的轨迹,还可以细致地揭示学习进程与认知路径,其测评工具的开发备受关注。立足学习进阶理论开发初中生科学能力测评工具,探索其科学能力发展路径,包括建构初中生科学能力进阶的理论框架、基于IRT理论组... 学习进阶不仅能反映学生能力发展的轨迹,还可以细致地揭示学习进程与认知路径,其测评工具的开发备受关注。立足学习进阶理论开发初中生科学能力测评工具,探索其科学能力发展路径,包括建构初中生科学能力进阶的理论框架、基于IRT理论组建测试题目、采用Rasch模型检验测评工具信效度、验证科学能力进阶预设四个步骤。结果表明,初中生科学能力的学习进阶理论假设与初中生能力发展水平基本相符,基于学习进阶理论开发的测评工具能够为了解学生能力发展和改进教学提供更多参考信息。 展开更多
关键词 学习进阶 科学能力 测评工具 rasch模型 锚题
下载PDF
初级卫生保健领域量表的设计与开发:实用步骤与统计方法 被引量:2
17
作者 王飞 汤靖琪 +4 位作者 孙小楠 孙昕霙 黎俊 孟星星 吴一波 《中国全科医学》 CAS 北大核心 2024年第13期1573-1583,共11页
本文概述了在初级卫生保健领域设计和开发有效、可靠问卷的统计学方法和实用步骤。回顾了一系列关于问卷编制和量表设计的研究,并制定了一套在初级卫生保健领域进行量表设计的标准化流程。该流程涉及量表设计过程中关键且实用的步骤及... 本文概述了在初级卫生保健领域设计和开发有效、可靠问卷的统计学方法和实用步骤。回顾了一系列关于问卷编制和量表设计的研究,并制定了一套在初级卫生保健领域进行量表设计的标准化流程。该流程涉及量表设计过程中关键且实用的步骤及统计学方法,并结合以往该领域的相关研究案例加以说明。建议的初级卫生保健领域问卷的七步编制方法为:(1)定义测量的构念;(2)生成条目池;(3)选择评分系统和响应格式;(4)预测试(评估内容效度和表面效度等);(5)通过项目分析剔除条目;(6)量表的初次评价,包括量表的信度和效度评价,以及因素分析或Rasch分析;(7)量表的再次评价,重新检验量表的性质,包括重测信度和结构效度。总的来说,量表设计类研究应严格按照量表编制的标准步骤,综合使用Rasch分析和因素分析的方法,这可以使量表的测量结果更加客观。 展开更多
关键词 初级卫生保健 量表设计 研究设计 因素分析 rasch模型
下载PDF
多维题组效应Rasch模型 被引量:11
18
作者 詹沛达 王文中 +1 位作者 王立君 李晓敏 《心理学报》 CSSCI CSCD 北大核心 2014年第8期1208-1222,共15页
首先,本文诠释了"题组"的本质即一个存在共同刺激的项目集合。并基于此,将题组效应划分为项目内单维题组效应和项目内多维题组效应。其次,本文基于Rasch模型开发了二级评分和多级评分的多维题组效应Rasch模型,以期较好地处理... 首先,本文诠释了"题组"的本质即一个存在共同刺激的项目集合。并基于此,将题组效应划分为项目内单维题组效应和项目内多维题组效应。其次,本文基于Rasch模型开发了二级评分和多级评分的多维题组效应Rasch模型,以期较好地处理项目内多维题组效应。最后,模拟研究结果显示新模型有效合理,与Rasch题组模型、分部评分模型对比研究后表明:(1)测验存在项目内多维题组效应时,仅把明显的捆绑式题组效应进行分离而忽略其他潜在的题组效应,仍会导致参数的偏差估计甚或高估测验信度;(2)新模型更具普适性,即便当被试作答数据不存在题组效应或只存在项目内单维题组效应,采用新模型进行测验分析也能得到较好的参数估计结果。 展开更多
关键词 题组反应模型 多维项目反应模型 项目内多维题组效应 多维题组效应模型 rasch模型
下载PDF
学业水平测试中作文评分误差的多面Rasch分析 被引量:9
19
作者 刘红云 陈阅 +1 位作者 骆方 王云峰 《心理科学》 CSSCI CSCD 北大核心 2010年第4期925-927,共3页
使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同... 使用多面Rasch模型,从评分量表、评分员等层面对参与2007年八年级语文学业水平测试作文评分的17名评分员的评分情况进行了研究。结果发现:(1)评分员的评分等级所对应的能力值呈正常的变化趋势,大部分评分员有较好的内部一致性;(2)不同评分员的宽严程度有显著差异,评分员之间的一致性整体较好;(3)此外,本文还就评分内部一致性较差的几个评分员的评分做了进一步研究。 展开更多
关键词 作文 评分误差 项目反应理论 多面rasch模型
下载PDF
中学生语文学科能力表现——基于Rasch模型的语文测试评价 被引量:13
20
作者 张燕华 郑国民 关惠文 《课程.教材.教法》 CSSCI 北大核心 2014年第11期69-74,共6页
以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研... 以能力考察为核心的语文测试评价框架包括学习理解、实践应用和创新迁移三个能力层级。在建构中学生语文学科能力构成体系的基础上,对北京市两个区的七年级至十一年级共4322名中学生的语文能力进行测试,运用Rasch模型进行分析与讨论,研究结果发现:从学习理解能力来说,中学生尤其应该加强分析概括能力和领会理解能力的培养;从实践应用能力来说,语文教学应该关注中学生应用交际能力的培养。针对不同的文类,应该培养学生的文类意识;从创新迁移能力来说,应该重视培养中学生的写作能力,尤其在内容创新、表达真情实感等方面更需要加强。 展开更多
关键词 rasch模型 语文学科能力 学生能力 测试评价
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部