为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性...为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度。分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现。仿真案例共模拟了30种监测场景。结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的。而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中。展开更多
文摘为了解决含顺序型和名义型变量混合型数据的监测问题,提出了一种基于LOF算法的多维混合型数据控制图(mixed-type data local outlier factor control chart,MLOF)。在监测过程变量变化的过程中,该控制图充分考虑了顺序型变量的等级特性和名义型变量的信息熵,基于数据的密度来衡量观测点的异常程度。分别使用基于信用卡申请数据集的仿真案例和基于德国信用卡数据集的实例,对比MLOF控制图和现有混合型数据控制图在异常点检测上的表现。仿真案例共模拟了30种监测场景。结果表明,在57%的场景中,MLOF控制图的综合表现都是最好的。而实例也验证了MLOF控制图更适用于数据量大、聚类情况复杂的混合型数据监测过程中。