摘要
针对传统SOD孤立点检测算法在处理高维数据时存在的问题,提出一种改进算法。通过对每一维的聚集度进行量化,确定各维的参考价值,从而降低算法结果对参数设定的敏感度,利用相对距离表示各点到中心值的偏离度,使其更利于不同密度子空间的孤立点检测。仿真实验结果表明,改进算法的检测精度优于传统SOD算法。
Aiming at the problems in process of dealing with high dimensional data for traditional SOD outlier detection algorithm,this paper presents an improved one.Through quantifying the aggregation of each dimension,the reference value of each dimension can be fixed,thus reducing the parameter settings impact on algorithm results.Using the relative distance to show the degree of deviation is convenient for detecting outlier in different densities subspace.Simulation results demonstrate the improved algorithm is better than traditional one in detection accuracy.
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第9期93-94,97,共3页
Computer Engineering
基金
河北省重大技术创新基金资助项目"河北省港口群生产管理集成信息系统"(09213562Z)
关键词
高维数据
子空间
孤立点检测
数据挖掘
high dimensional data
subspace
outlier detection
data mining