-
题名基于熵度量的空间邻域离群点查找
- 1
-
-
作者
苏锦旗
薛惠锋
吴慧欣
-
机构
西北工业大学自动化学院
华北水利水电学院信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第21期41-43,50,共4页
-
基金
陕西省自然科学基金(No.2005F45)
陕西科技攻关计划(2005K04-G13)~~
-
文摘
离群点的查找算法主要有两类:第一类是面向统计数据,把各种数据都看成是多维空间,没有区分空间维与非空间维,这类算法可能产生错误的判断或找到的是无意义的离群点;第二类算法面向空间数据,区分空间维与非空间维,但该类算法查找效率太低或不能查找邻域离群点。引入熵权的概念,提出了一种新的基于熵权的空间邻域离群点度量算法。算法面向空间数据,区分空间维与非空间维,利用空间索引划分空间邻域,用非空间属性计算空间偏离因子,由此度量空间邻域的离群点。理论分析表明,该算法是合理的。实验结果表明,算法具有对用户依赖性小、检测精度和计算效率高的优点。
-
关键词
熵度量
空间邻域离群点检测
空间邻域偏离因子
空间划分
-
Keywords
entropy measurement
spatial neighborhood outliers detections
spatial outlier factor
space division
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-