-
题名基于逆k近邻计数和权值剪枝的离群数据挖掘算法
被引量:9
- 1
-
-
作者
朱云丽
张继福
-
机构
太原科技大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第8期1627-1632,共6页
-
基金
国家自然科学基金项目(61572343)资助
-
文摘
利用逆k近邻计数与k近邻距离均值相结合的方式,给出了一种无监督离群数据挖掘算法.该算法以k近邻对象集合、k近邻对象距离作为前提条件,首先计算数据集中对象的逆k近邻计数,求得每个对象的antihub分数;其次,根据k近邻距离得到每个对象KNN的antihub分数和权值,将权值大于等于1的对象保存在离群对象候选集List中;然后根据antihub分数以及k近邻距离均值,重新定义了离群分数公式,选取离群分数最大的若干个对象作为离群对象;最后,采用人工数据集和UCI标准数据集,实验验证了该算法的有效性.
-
关键词
离群挖掘
逆k近邻
k近邻距离
权值剪枝
antihub分数
-
Keywords
outlier mining
reverse k nearest neighbor
k nearest neighbor distance
weight pruning
antihub score
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于K近邻团的聚类算法
- 2
-
-
作者
曲超
袁瑞芬
魏小锐
-
机构
东莞理工学院计算机学院
华南理工大学计算机科学与工程学院
-
出处
《科学技术与工程》
北大核心
2013年第19期5696-5701,共6页
-
基金
国家自然科学基金项目(61100136)资助
-
文摘
在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。
-
关键词
k近邻
逆k近邻
k近邻团
聚类算法
-
Keywords
kNN RkNN k-nearest clique clustering
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于学习的迭代式优化编译中的经验适用性研究
- 3
-
-
作者
龙舜
朱蔚恒
-
机构
暨南大学计算机科学系
-
出处
《计算机工程与科学》
CSCD
北大核心
2010年第9期115-118,129,共5页
-
基金
中国科学院计算机系统结构重点实验室开放课题项目
暨南大学博士启动基金资助项目
-
文摘
迭代式优化编译方法能有效地使应用程序的运行充分发挥各种硬件平台的潜力。其中基于机器学习的方法显著提高了优化效率,但它忽视了编译程序的经验总是有限的现实,需要根据一个新程序的具体情况判断自己是否有足够的和适当的经验将其优化。这制约了在更广泛的应用领域内应用该技术。为此,本文提出采用逆K近邻法对新程序作孤立点检测。如果一个程序被判断为孤立点,表明已有经验并不适用,应该从零开始搜索优化空间;否则可直接利用已有经验。初步实验结果表明,本方法能有效判断一系列程序中的孤立点,使编译程序能对它们做恰当的处理,提高优化效率。
-
关键词
迭代式优化编译
机器学习
程序特征
孤立点
逆k近邻算法
-
Keywords
iterative optimization
machine-learning
program feature
outlier
reverse k-nearest neighbours
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于枢纽现象和加权离群分数的离群数据挖掘算法
被引量:6
- 4
-
-
作者
郭峰
张继福
-
机构
太原科技大学计算机科学技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第10期2248-2253,共6页
-
基金
国家自然科学基金项目(61572343)资助
-
文摘
针对高维数据集中出现的枢纽现象,本文给出了一种基于枢纽现象和加权离群分数的离群数据挖掘算法.该算法首先根据逆k近邻中出现的枢纽现象,以及与离群数据的关系,利用k近邻中的距离信息作为权值,对逆k近邻的离群分数进行加权;其次随机生成区分度阈值,根据该阈值判断区分度比例满意值,并根据满意值计算数据对象的离群程度,选取离群程度最大的若干数据对象作为离群数据;最后采用人工数据集和UCI标准数据集,实验验证了该算法的有效性.
-
关键词
离群挖掘
枢纽现象
逆k近邻
离群分数
满意值
-
Keywords
outlier mining
Hubness phenomenon
reverse k-nearest neighbor
outlier score
satisfaction value
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种面向枢纽现象的离群数据检测算法
被引量:2
- 5
-
-
作者
马文强
赵旭俊
张继福
饶元淇
-
机构
太原科技大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第5期919-924,共6页
-
基金
国家自然科学基金项目(61572343,U1731126,U1931209)资助
山西省应用基础研究计划项目(201901D111257,201901D211303)资助
+1 种基金
山西省重点研发计划项目(201803D121059)资助
太原科技大学科研启动基金项目(20192013)资助.
-
文摘
在高维数据中,逆k近邻查询会导致出现枢纽现象,这严重影响了基于逆k近邻离群检测算法的性能.为解决这一问题,提出了一种面向枢纽现象的双向近邻离群检测算法.该算法首先引入并重新定义了对象的影响空间,在影响空间中,同时兼顾了对象的k近邻和逆近邻的影响作用,有效提高了算法的准确性;其次,引入了启发式信息,不仅考虑对象的离群程度同时还考虑其k近邻的离群情况,显著降低了k的取值,从而减少了算法的计算量和运行时间;最后,采用真实数据集,实验验证了本文算法同传统的基于枢纽现象的离群挖掘算法相比具有更高的效率和准确性.
-
关键词
离群数据检测
影响空间
枢纽现象
逆k近邻
-
Keywords
outlier detection
influence space
hubness phenomenon
reverse k nearest neighbor
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-