期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Outlier detection based on multi-dimensional clustering and local density
1
作者 首照宇 李萌芽 李思敏 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1299-1306,共8页
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl... Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments. 展开更多
关键词 data mining outlier detection outlier detection method based on MULTI-DIMENSIONAL CLUSTERING and local density (ODBMCLD) algorithm deviation DEGREE
下载PDF
Anomalous Cell Detection with Kernel Density-Based Local Outlier Factor 被引量:2
2
作者 Miao Dandan Qin Xiaowei Wang Weidong 《China Communications》 SCIE CSCD 2015年第9期64-75,共12页
Since data services are penetrating into our daily life rapidly, the mobile network becomes more complicated, and the amount of data transmission is more and more increasing. In this case, the traditional statistical ... Since data services are penetrating into our daily life rapidly, the mobile network becomes more complicated, and the amount of data transmission is more and more increasing. In this case, the traditional statistical methods for anomalous cell detection cannot adapt to the evolution of networks, and data mining becomes the mainstream. In this paper, we propose a novel kernel density-based local outlier factor(KLOF) to assign a degree of being an outlier to each object. Firstly, the notion of KLOF is introduced, which captures exactly the relative degree of isolation. Then, by analyzing its properties, including the tightness of upper and lower bounds, sensitivity of density perturbation, we find that KLOF is much greater than 1 for outliers. Lastly, KLOFis applied on a real-world dataset to detect anomalous cells with abnormal key performance indicators(KPIs) to verify its reliability. The experiment shows that KLOF can find outliers efficiently. It can be a guideline for the operators to perform faster and more efficient trouble shooting. 展开更多
关键词 局部异常因子 细胞检测 核密度 移动网络 数据业务 数据传输 统计方法 数据挖掘
下载PDF
采用离群点检测技术的混合型数据聚类初始化方法 被引量:3
3
作者 杨志勇 江峰 +1 位作者 于旭 杜军威 《智能系统学报》 CSCD 北大核心 2023年第1期56-65,共10页
近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检... 近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检测的策略来为K-prototype算法选择初始中心,并提出一种新的混合型数据聚类初始化算法(initialization of K-prototype clustering based on outlier detection and density,IKP-ODD)。给定一个候选对象,IKP-ODD通过计算其距离离群因子、加权密度以及与已有初始中心之间的加权距离来判断候选对象是否是一个初始中心。IKP-ODD通过采用距离离群因子和加权密度,防止选择离群点作为初始中心。在计算对象的加权密度以及对象之间的加权距离时,采用邻域粗糙集中的粒度邻域熵来计算每一个属性的重要性,并根据属性重要性的大小为不同属性赋予不同的权重,有效地反映不同属性之间的差异性。在多个UCI数据集上的实验表明,相对于现有的初始化方法,IKP-ODD能够更好地解决K-prototype聚类的初始化问题。 展开更多
关键词 聚类初始化 混合型数据 离群点检测 邻域粗糙集 粒度邻域熵 距离离群因子 加权密度 加权距离
下载PDF
基于高斯核函数改进的电力用户用电数据离群点检测方法 被引量:52
4
作者 孙毅 李世豪 +3 位作者 崔灿 李彬 陈宋宋 崔高颖 《电网技术》 EI CSCD 北大核心 2018年第5期1595-1604,共10页
针对智能配用电大数据背景下用电数据离群点检测方法的适用性以及实际数据集中异常用电样本获取成本较高的问题,提出一种基于高斯核函数改进的电力用户用电数据离群点检测方法。首先通过模糊聚类的方法将用户分类;然后提取每一类用户的... 针对智能配用电大数据背景下用电数据离群点检测方法的适用性以及实际数据集中异常用电样本获取成本较高的问题,提出一种基于高斯核函数改进的电力用户用电数据离群点检测方法。首先通过模糊聚类的方法将用户分类;然后提取每一类用户的用电行为特征量,采用主成分分析法对特征集进行降维;最后利用高斯核函数改进局部离群因子算法,提出高斯核密度局部离群因子(Gaussian kernel densitybased local outlier factor,GKLOF)算法,通过理论推导与仿真实验相结合的方式分析了GKLOF算法的特性。选取了5000个用户真实的用电数据进行实验分析,实验结果表明,该方法具有较高的检测准确率以及较为稳定的判定阈值,并且受局部数据分布的影响较小,更加适用于用户用电行为复杂多样以及实际数据集中所有用户用电行为类型信息未知情况下的离群点检测。 展开更多
关键词 电力大数据 数据挖掘 离群点检测 高斯核密度局部离群因子 用电行为分析
下载PDF
IncLOF:动态环境下局部异常的增量挖掘算法 被引量:33
5
作者 杨风召 朱扬勇 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第3期477-484,共8页
异常检测是数据挖掘领域研究的最基本的问题之一 ,它在欺诈甄别、贷款审批、气象预报、客户分类等方面有广泛的应用 以前的异常检测算法只适应于静态环境 ,在数据更新时需要进行重新计算 在基于密度的局部异常检测算法LOF的基础上 ,提... 异常检测是数据挖掘领域研究的最基本的问题之一 ,它在欺诈甄别、贷款审批、气象预报、客户分类等方面有广泛的应用 以前的异常检测算法只适应于静态环境 ,在数据更新时需要进行重新计算 在基于密度的局部异常检测算法LOF的基础上 ,提出一种在动态环境下局部异常挖掘的增量算法IncLOF ,当数据库中的数据更新时 ,只对受到影响的点进行重新计算 ,这样可以大大提高异常的挖掘速度 实验表明 ,在动态环境下IncLOF的运行时间远远小于LOF的运行时间 ,并且用户定义的邻域中的最小对象个数与记录数之比越小 。 展开更多
关键词 数据挖掘 异常检测 局部异常因子 局部可达密度 增量挖掘算法
下载PDF
基于Voronoi图的异常检测算法 被引量:5
6
作者 曲吉林 寇纪淞 +1 位作者 李敏强 安世虎 《计算机工程》 CAS CSCD 北大核心 2007年第23期35-36,39,共3页
异常检测是数据挖掘的一个重要组成部分,其中基于密度的方法LOF是目前常用的主要方法。然而LOF方法进行检测时需要设定参数k和MinPts,检测结果对参数非常敏感,容易造成检测错误。该文提出了一种基于Voronoi图的异常检测算法VOD,采用Voro... 异常检测是数据挖掘的一个重要组成部分,其中基于密度的方法LOF是目前常用的主要方法。然而LOF方法进行检测时需要设定参数k和MinPts,检测结果对参数非常敏感,容易造成检测错误。该文提出了一种基于Voronoi图的异常检测算法VOD,采用Voronoi图来确定对象间的邻近关系,解决了基于密度方法存在的问题,算法的时间复杂性从O(N2)降低到O(NlogN)。 展开更多
关键词 数据挖掘 异常检测 基于密度 VORONOI图
下载PDF
基于高斯核函数的局部离群点检测算法 被引量:6
7
作者 关绍云 郑丽坤 +3 位作者 金一宁 郭靖天 张忠平 苗创业 《哈尔滨商业大学学报(自然科学版)》 CAS 2019年第2期185-190,203,共7页
随着信息技术的快速发展,数据资源的结构越来越复杂,离群点挖掘受到越来越多人关注.基于高斯核函数,考虑数据对象的k个最近邻居,反向k近邻居和共享最近邻居三种邻居关系,估计数据对象的密度,提出了一种基于高斯核函数的局部离群点检测算... 随着信息技术的快速发展,数据资源的结构越来越复杂,离群点挖掘受到越来越多人关注.基于高斯核函数,考虑数据对象的k个最近邻居,反向k近邻居和共享最近邻居三种邻居关系,估计数据对象的密度,提出了一种基于高斯核函数的局部离群点检测算法.该算法通过KNN图存储每个数据对象的最近邻,包括k最近邻,反向k近邻和共享最近邻,构成数据对象的邻居集合S;通过核密度估计KDE方法估计数据对象的密度;通过相对密度离群因子RDOF来估计数据对象偏离邻域的程度,进而判定数据对象是否为离群点,并在真实和合成的数据集上证明了该算法的有效性. 展开更多
关键词 离群点 高斯核函数 核密度 共享邻居 k最近邻 数据挖掘
下载PDF
基于邻域和密度的异常点检测算法 被引量:12
8
作者 陶运信 皮德常 《吉林大学学报(信息科学版)》 CAS 2008年第4期398-403,共6页
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Based onSquare Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点... 为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Based onSquare Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhood and Density based Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的"维灾"。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。 展开更多
关键词 数据挖掘 异常点 方形邻域 密度 局部异常因子
下载PDF
基于方形对称邻域的局部离群点检测方法 被引量:5
9
作者 揭财明 刘慧君 朱庆生 《计算机应用研究》 CSCD 北大核心 2012年第2期472-474,共3页
针对NDOD(outlier detection algorithm based on neighborhood and density)算法在判断具有不同密度分布的聚类间过渡区域对象时存在的不足,以及为了降低算法时间复杂度,提出一种基于方形对称邻域的局部离群点检测方法。该算法改用方... 针对NDOD(outlier detection algorithm based on neighborhood and density)算法在判断具有不同密度分布的聚类间过渡区域对象时存在的不足,以及为了降低算法时间复杂度,提出一种基于方形对称邻域的局部离群点检测方法。该算法改用方形邻域,吸收基于网格的思想,通过扩张方形邻域快速排除聚类点及避免"维灾";通过引入记忆思想,使得邻域查询次数及范围成倍地减小;同时新定义的离群度度量方法有利于提高检测精度。实验测试表明,该算法检测离群点的速度及精度均优于NDOD等算法。 展开更多
关键词 数据挖掘 离群检测 方形对称邻域 局部离群度
下载PDF
基于邻域密度的异构数据局部离群点挖掘算法 被引量:6
10
作者 王晓辉 宋学坤 王晓川 《计算机仿真》 北大核心 2021年第7期281-285,共5页
由于数据集规模、维数,以及复杂程度的不断提高,导致对其离群点的挖掘难度越来越大,提出了基于邻域密度的局部离群点挖掘算法。首先依据节点计算性能对高维数据进行区域分割,通过各个维度的数据分布来评价区域分割的效果。然后采取核密... 由于数据集规模、维数,以及复杂程度的不断提高,导致对其离群点的挖掘难度越来越大,提出了基于邻域密度的局部离群点挖掘算法。首先依据节点计算性能对高维数据进行区域分割,通过各个维度的数据分布来评价区域分割的效果。然后采取核密度来描述局部密度,根据高斯分布得到数据出现次数,进一步计算出数据邻域密度。再由邻域及密度关系计算得到各数据离群度,从而判断异构数据中的离群点。最后针对可能存在的离群误判情况,采取离群分数计算,为增强此过程的检测性能,利用权重进行剪枝处理。人工与UCI数据集上的仿真结果表明,当数据量和数据维数改变时,算法对离群点挖掘的准确度几乎不受影响,挖掘时间和覆盖率指标也显著优于其它方法;同时对于不同类型和复杂度的异构数据,算法仍然保持良好的挖掘准确度和效率。 展开更多
关键词 离群点挖掘 区域分割 邻域密度 异构数据 离群分数
下载PDF
PODKNN:面向大数据集的并行离群点检测算法 被引量:7
11
作者 苟杰 马自堂 张喆程 《计算机科学》 CSCD 北大核心 2016年第7期251-254,274,共5页
针对现有离群点检测算法在运用于大规模数据集时时间效率较低的问题,提出一种基于K近邻的并行离群点检测算法PODKNN(Parallel Outlier Detection Based on K-nearest Neighborhood)。该算法利用划分策略对数据集进行预处理,在规模较小... 针对现有离群点检测算法在运用于大规模数据集时时间效率较低的问题,提出一种基于K近邻的并行离群点检测算法PODKNN(Parallel Outlier Detection Based on K-nearest Neighborhood)。该算法利用划分策略对数据集进行预处理,在规模较小的子集中寻找K近邻并计算离群度,最后合并结果并遴选出离群点,设计算法过程使其符合MapReduce的编程模型,实现并行化,从而提高了离群点检测算法处理大规模数据的计算效率。实验结果表明,PODKNN具有较高的加速比及较好的扩展性。 展开更多
关键词 数据挖掘 离群点检测 K近邻 MAPREDUCE
下载PDF
服务于智能交通系统的离群交通数据识别 被引量:3
12
作者 陈淑燕 王炜 瞿高峰 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期723-726,共4页
为了提高交通建模的准确性和可靠性,或者提取重要的有价值的隐藏信息,将离群数据挖掘技术引入交通数据处理.首先分析了3种典型的离群数据挖掘算法:基于统计的方法、基于距离的方法以及基于密度的方法的原理、特点和时间复杂性;其次给出... 为了提高交通建模的准确性和可靠性,或者提取重要的有价值的隐藏信息,将离群数据挖掘技术引入交通数据处理.首先分析了3种典型的离群数据挖掘算法:基于统计的方法、基于距离的方法以及基于密度的方法的原理、特点和时间复杂性;其次给出了2个实例分析,一是在建立交通流量预测模型前,将基于统计的方法和基于距离的离群检测方法分别用于交通量时间序列,寻找离群数据;二是将基于距离的方法和基于密度的方法用于路面平整度检测.实例研究表明,离群数据挖掘算法可有效识别异常交通数据,在交通工程领域具有较大的应用潜力. 展开更多
关键词 交通数据 离群数据挖掘 识别 基于统计的方法 基于距离的方法 基于密度的方法
下载PDF
屏蔽输入参数敏感的异常点检测新方法 被引量:2
13
作者 陶运信 皮德常 《计算机科学》 CSCD 北大核心 2008年第12期192-195,206,共5页
大多数基于密度的异常点检测算法需要设置两个输入参数,并对输入参数很敏感,用户设置不正确会导致算法不能发现所有有意义的异常点,甚至是发现错误的异常点,这使得评价一个数据挖掘算法的"3-E"标准中"易于使用"这... 大多数基于密度的异常点检测算法需要设置两个输入参数,并对输入参数很敏感,用户设置不正确会导致算法不能发现所有有意义的异常点,甚至是发现错误的异常点,这使得评价一个数据挖掘算法的"3-E"标准中"易于使用"这一点不能得到满足。为此,首先根据对象的邻域、反邻域和局部密度构造基于邻域的局部密度因子NLDF,NLDF可指示异常点的异常程度,然后提出一种屏蔽输入参数敏感的异常点检测算法ODINP。ODINP的一个非常显著的优点就是只需要一个参数k并且对k不敏感。该算法在保持已有基于密度的异常点检测算法高效性的同时,具有很高的异常点检测精度。大规模、任意形状和高维数据集的测试结果表明该算法是有效的、可行的。 展开更多
关键词 数据挖掘 异常点检测 参数 邻域 密度
下载PDF
ERDOF:基于相对熵权密度离群因子的离群点检测算法 被引量:6
14
作者 张忠平 刘伟雄 +2 位作者 张玉停 邓禹 魏棉鑫 《通信学报》 EI CSCD 北大核心 2021年第9期133-143,共11页
针对现有离群点检测算法在复杂数据分布和高维度数据集上精度低的问题,提出了一种基于相对熵权密度离群因子的离群点检测算法。首先引入熵权距离取代欧氏距离以提高离群点检测精度。然后结合自然邻居的概念对数据对象进行高斯核密度估... 针对现有离群点检测算法在复杂数据分布和高维度数据集上精度低的问题,提出了一种基于相对熵权密度离群因子的离群点检测算法。首先引入熵权距离取代欧氏距离以提高离群点检测精度。然后结合自然邻居的概念对数据对象进行高斯核密度估计。同时提出相对距离来刻画数据对象偏离邻域的程度,提高所提算法在低密度区域检测离群点的能力。最后提出相对熵权密度离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集下进行的实验表明,所提算法能有效适应各种数据分布和高维数据的离群点检测。 展开更多
关键词 数据挖掘 离群点检测 信息熵 核密度估计
下载PDF
Continuous Outlier Monitoring on Uncertain Data Streams 被引量:1
15
作者 曹科研 王国仁 +3 位作者 韩东红 丁国辉 王爱侠 石凌旭 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第3期436-448,共13页
Outlier detection on data streams is an important task in data mining. The challenges become even larger when considering uncertain data. This paper studies the problem of outlier detection on uncertain data streams. ... Outlier detection on data streams is an important task in data mining. The challenges become even larger when considering uncertain data. This paper studies the problem of outlier detection on uncertain data streams. We propose Continuous Uncertain Outlier Detection (CUOD), which can quickly determine the nature of the uncertain elements by pruning to improve the efficiency. Furthermore, we propose a pruning approach -- Probability Pruning for Continuous Uncertain Outlier Detection (PCUOD) to reduce the detection cost. It is an estimated outlier probability method which can effectively reduce the amount of calculations. The cost of PCUOD incremental algorithm can satisfy the demand of uncertain data streams. Finally, a new method for parameter variable queries to CUOD is proposed, enabling the concurrent execution of different queries. To the best of our knowledge, this paper is the first work to perform outlier detection on uncertain data streams which can handle parameter variable queries simultaneously. Our methods are verified using both real data and synthetic data. The results show that they are able to reduce the required storage and running time. 展开更多
关键词 outlier detection uncertain data stream data mining parameter variable query
原文传递
高维空间下基于密度的离群点探测算法实现 被引量:6
16
作者 熊君丽 《现代电子技术》 2006年第15期67-69,共3页
离群点是数据仓库中表现行为异常的数据。对高维空间下离群点的性质进行了研究,采用高维空间数据在低维空间投影再进行探测的策略,解决了高维空间数据稀疏难以用数据点距离判断离群的问题。算法实现中选取彼此关联紧密的维,数据点之间... 离群点是数据仓库中表现行为异常的数据。对高维空间下离群点的性质进行了研究,采用高维空间数据在低维空间投影再进行探测的策略,解决了高维空间数据稀疏难以用数据点距离判断离群的问题。算法实现中选取彼此关联紧密的维,数据点之间的距离采用最近邻定义,用基于密度的离群点探测方法,能在局部空间内更有效地探测到离群点。 展开更多
关键词 离群点探测 最近邻 高维空间 基于密度 数据挖掘
下载PDF
分布式数据流上的连续异常检测 被引量:1
17
作者 王树广 《微电子学与计算机》 CSCD 北大核心 2008年第9期158-160,共3页
近年来,数据流异常检测在决策支持和监测等领域有着广泛的应用前景,并成为数据管理与挖掘的研究热点.针对该问题提出了相应的异常定义及检测算法,理论分析表明:与现有异常检测算法相比较,提出的算法具有良好的性能和效率,更适合于数据... 近年来,数据流异常检测在决策支持和监测等领域有着广泛的应用前景,并成为数据管理与挖掘的研究热点.针对该问题提出了相应的异常定义及检测算法,理论分析表明:与现有异常检测算法相比较,提出的算法具有良好的性能和效率,更适合于数据流应用. 展开更多
关键词 异常检测 核密度估计 分布数据流 数据流挖掘
下载PDF
基于双半径密度差异的孤立点检测算法
18
作者 牛琨 张舒博 陈俊亮 《高技术通讯》 EI CAS CSCD 北大核心 2008年第4期350-354,共5页
针对现有基于密度的孤立点检测算法的不足,给出了一种新的基于密度的孤立点定义,并提出了相应的基于双半径(DR)密度差异的孤立点检测(OD)算法——DROD。该算法通过考察数据空间内任一点的双邻域半径与邻域半径内的数据密度的差异,有效... 针对现有基于密度的孤立点检测算法的不足,给出了一种新的基于密度的孤立点定义,并提出了相应的基于双半径(DR)密度差异的孤立点检测(OD)算法——DROD。该算法通过考察数据空间内任一点的双邻域半径与邻域半径内的数据密度的差异,有效地识别孤立点。DROD 算法摒弃了传统孤立点检测方法中的 k-近邻查询,大大节省了时间开销。在人工数据集和真实数据集上的实验表明,与现有孤立点检测算法相比,DROD算法在时间复杂度和孤立点的寻找能力方面均有较优表现。 展开更多
关键词 数据挖掘 孤立点检测 密度差异 双半径
下载PDF
一种基于邻域系统密度差异度量的离群点检测算法 被引量:11
19
作者 杜旭升 于炯 +3 位作者 陈嘉颖 王跃飞 蒲勇霖 叶乐乐 《计算机应用研究》 CSCD 北大核心 2020年第7期1969-1973,共5页
针对离群点检测算法LOF在高维离散分布数据集中检测精度较低及参数敏感性较高的问题,提出了基于邻域系统密度差异度量的离群点检测NSD(neighborhood system density difference)算法。相较于传统基于密度的离群点检测方法,NSD算法引入... 针对离群点检测算法LOF在高维离散分布数据集中检测精度较低及参数敏感性较高的问题,提出了基于邻域系统密度差异度量的离群点检测NSD(neighborhood system density difference)算法。相较于传统基于密度的离群点检测方法,NSD算法引入了截取距离的概念。首先计算数据集中对象在截取距离内的邻居点个数;其次计算对象的邻域系统密度;然后将对象的密度与它邻居的密度进行比较,判定目标对象与其邻居趋向于同一簇的程度;最后输出最可能是离群点的对象。将NSD算法与LOF、LDOF、CBOF算法在真实数据集与合成数据集中对比实验发现,NSD算法具有较高的检测准确率和执行效率以及较低的参数敏感性,证明了NSD算法是有效可行的。 展开更多
关键词 数据挖掘 离群点检测 基于密度 LOF LDOF CBOF
下载PDF
邻域粗糙集中基于序列的混合型属性离群点检测 被引量:6
20
作者 袁钟 张贤勇 冯山 《小型微型计算机系统》 CSCD 北大核心 2018年第6期1317-1322,共6页
离群点检测具有广泛应用.传统粗糙集的离群点检测方法不能有效处理数值型属性数据,故提出邻域粗糙集中基于序列的混合型属性离群点检测方法.该方法采用每个属性值的均匀性来构建属性序列,以此定义属性集序列并构建邻域类序列;进而,通过... 离群点检测具有广泛应用.传统粗糙集的离群点检测方法不能有效处理数值型属性数据,故提出邻域粗糙集中基于序列的混合型属性离群点检测方法.该方法采用每个属性值的均匀性来构建属性序列,以此定义属性集序列并构建邻域类序列;进而,通过分析邻域类序列中对象的变化情况来检测离群点,并设计出相应的离群点检测算法(Sequence-based Mixed Attribute Outlier Detection,SM AOD),该算法在计算单属性邻域覆盖的方式上改进了传统的逐一比较计算模式.最后,在UCI标准数据集上与主要离群点检测方法进行实验比较与分析,结果表明所提方法的有效性. 展开更多
关键词 离群点检测 邻域粗糙集 序列 均匀性 混合型属性 数据挖掘
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部