-
题名基于密度的局部离群数据挖掘方法的改进
被引量:30
- 1
-
-
作者
王茜
刘书志
-
机构
重庆大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第6期1693-1696,1701,共5页
-
文摘
针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法。该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离群点检测(COF)中链式距离的思想,提出了基于相似k距离邻居序列(SKDNS)的离群因子计算方法。通过对比该算法和其他经典局部离群点检测算法在不同数据分布情况下的挖掘结果,该算法比LOF、INFLO和COF算法的离群挖掘准确性更高,能有效克服LOF算法的不足,提高局部离群数据挖掘的准确性和多样性。
-
关键词
离群数据挖掘
影响空间
链式距离
相似k距离邻居序列
离群因子
-
Keywords
outliers detection
influenced space
chaining distance
similar k_distance neighbor series
outlier factor
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于局部偏离因子的孤立点检测算法
被引量:5
- 2
-
-
作者
谭庆
张瑞玲
-
机构
洛阳师范学院信息技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第17期59-61,共3页
-
基金
河南省科技攻关基金资助项目(0524220059)
-
文摘
孤立点检测是知识发现中的一个活跃领域,如信用卡欺诈、入侵检测等。研究孤立点的异常行为能发现隐藏在数据集中更有价值的知识。该文提出基于局部偏离因子(LDF)的孤立点检测算法,利用每个数据点的LDF衡量该数据点的偏离程度。实验结果表明,该算法能有效检测孤立点,其效率高于LSC算法。
-
关键词
孤立点
k距离邻居
局部偏离因子
-
Keywords
outlier
k-distance neighbors
local deviation factor
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于GA/SVM的微阵列数据特征的选择与分类
被引量:3
- 3
-
-
作者
余伟峰
王广伦
钱夕元
-
机构
华东理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第19期204-206,共3页
-
文摘
微阵列数据样本小、维度高的特点给数据分析造成了困难,而主基因的挑选又十分的重要。该文采用遗传算法挑选主基因,其中,用k最邻居距离作为模式识别方法,用支持向量机构造了诊断系统,用不同核函数进行预测分类性能测试。在经典的白血病数据集上,对34个样本的测试集的分类准确率为100%。
-
关键词
微阵列数据
基因表达
遗传算法
k最邻居距离
支持向量机
-
Keywords
microarray data
gene expression
genetic algorithm
k nearest neighbors
support vector machine(SVM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-