-
题名基于基尼指标加权的离群子空间与离群数据挖掘方法
被引量:1
- 1
-
-
作者
孙伟伟
-
机构
太原科技大学计算机科学与技术学院
-
出处
《电脑开发与应用》
2012年第10期35-37,共3页
-
文摘
针对大多数离群数据检测方法依赖于用户确定参数以及维灾现象,给出了一种基于基尼指标加权的离群子空间与离群数据挖掘方法。该方法通过计算各个维上去一划分的基尼指标值来生成数据对象的离群子空间及属性权向量,在子空间中采用基于统计离群数据挖掘的思想来挖掘离群数据;不需输入参数,结果更具客观性,并且能够适应高维离群数据挖掘;最后采用恒星光谱数据集,验证了可行性和有效性。
-
关键词
离群数据
基尼指标
属性权向量
离群子空间
-
Keywords
outlier
gini index
attribute weighted vectors
outlier subspace
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于空间局部偏离因子的离群点检测算法
被引量:2
- 2
-
-
作者
张天佑
王小玲
-
机构
中南大学信息科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第14期282-284,共3页
-
基金
国家自然科学基金资助项目(60773013)
-
文摘
针对空间数据集的特性,提出一种基于空间局部偏离因子(SLDF)的离群点检测算法。利用SLDF度量空间点对象的离群程度,计算空间数据集中点对象的SLDF值并对其进行排序,将取值较大的前M个点对象作为空间离群点。实验结果表明,该算法能较好地检测空间局部离群点,其有效性与准确性均优于SLZ算法,适用于高维大数据集的空间离群点检测。
-
关键词
属性权向量
空间离群点
空间对象距离
空间局部偏离因子
-
Keywords
attribute weighted vector
space outlier
space object distance
Space Local Deviation Factor(SLDF)
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-