期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于最近邻优先的高效聚类算法 被引量:24
1
作者 胡建军 唐常杰 +4 位作者 李川 彭京 元昌安 陈安龙 蒋永光 《四川大学学报(工程科学版)》 EI CAS CSCD 2004年第6期93-99,共7页
针对高维空间中任意形状的多层次聚类问题,基于"同类相近"的思想,提出并实现了最近邻优先吸收聚类算法NNAF算法。证明了最近邻点搜索定理,基于这一定理又提出了SNN(SearchingNearestNeighbors)算法和GSNN(Grid basedSearching... 针对高维空间中任意形状的多层次聚类问题,基于"同类相近"的思想,提出并实现了最近邻优先吸收聚类算法NNAF算法。证明了最近邻点搜索定理,基于这一定理又提出了SNN(SearchingNearestNeighbors)算法和GSNN(Grid basedSearchingNearestNeighbors)算法,其时间复杂度为O(n log(n)),当用扫描图像所得数据时,时间复杂度会降为O(n);而使用传统的搜索算法,时间复杂度为O(n2);提出了实现任意形状高维空间聚类的NNAF算法,时间复杂度为O(n);提出了MLCA(Multi layerClusterAlgorithm)算法并证明了两个相关的定理,在改变阈值后重新聚类时,使用MLCA算法可以节省90%以上的时间。实验结果显示,以上算法适应于任意形状的高维空间数据的聚类,可以有效过滤噪声数据,且用户需要的先验知识少、可快速获得各种层次的聚类结果。 展开更多
关键词 数据挖掘 聚类分析 最近邻优先吸收 多层次聚类
下载PDF
基于数据分区的最近邻优先聚类算法 被引量:4
2
作者 王鑫 王洪国 +1 位作者 张建喜 谷建军 《计算机科学》 CSCD 北大核心 2005年第12期188-190,共3页
聚类是数据挖掘领域的一个重要研究方向。最近邻优先吸收(NNAF)算法可以快速进行聚类并且能有效处理噪声点,但当数据密度和聚类间的距离不均匀时聚类质量较差。本文在分析NNAF算法不足的基础上,提出了一种基于数据分区的NNAF 算法-PNNAF... 聚类是数据挖掘领域的一个重要研究方向。最近邻优先吸收(NNAF)算法可以快速进行聚类并且能有效处理噪声点,但当数据密度和聚类间的距离不均匀时聚类质量较差。本文在分析NNAF算法不足的基础上,提出了一种基于数据分区的NNAF 算法-PNNAF 算法,较好地改善了聚类质量。 展开更多
关键词 数据挖掘 聚类 数据分区 最近邻优先吸收
下载PDF
一种基于最近邻优先的知识聚类算法 被引量:2
3
作者 胡健 董跃华 《江西理工大学学报》 CAS 2008年第5期72-74,共3页
基于"同类相近"的思想,构建了一种改进的最短距离聚类算法——最近邻优先聚类算法NNPC.该算法可以快速获得不同层次的高质量聚类,进而找到满足要求的阚值参数和聚类,并能够高效处理以任意形状分布的具有噪声数据的大数据量高... 基于"同类相近"的思想,构建了一种改进的最短距离聚类算法——最近邻优先聚类算法NNPC.该算法可以快速获得不同层次的高质量聚类,进而找到满足要求的阚值参数和聚类,并能够高效处理以任意形状分布的具有噪声数据的大数据量高维数据,且用户需要的先验知识少.通过3个定理的提出和证明,体现算法的先进性. 展开更多
关键词 聚类算法 最近邻优先 知识发现 阀值参数
下载PDF
面向海量数据的改进最近邻优先吸收聚类算法 被引量:5
4
作者 宁可 孙同晶 徐洁洁 《计算机工程》 CAS CSCD 北大核心 2018年第4期35-40,共6页
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,... 针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,与K-means算法和最近邻优先吸收聚类算法相比,改进算法在保证聚类质量的基础上具有较快的运行速度,并适用于海量数据的聚类分析。 展开更多
关键词 海量数据 聚类 MAPREDUCE框架 最近邻优先吸收聚类算法 Canopy算法 并行化
下载PDF
基于数据挖掘的入侵检测的研究与应用
5
作者 李广霞 朱峰 +1 位作者 王占锋 崔哲 《石家庄职业技术学院学报》 2007年第6期33-36,共4页
以基于数据挖掘方法的入侵检测技术研究为核心,对数据挖掘技术和入侵检测技术进行了研究和分析,探讨了数据挖掘方法中聚类算法在入侵检测中的应用,提出了一种基于最短距离算法的最近邻优先(NearestNeighbor First)算法,并采用KDD Cup 1... 以基于数据挖掘方法的入侵检测技术研究为核心,对数据挖掘技术和入侵检测技术进行了研究和分析,探讨了数据挖掘方法中聚类算法在入侵检测中的应用,提出了一种基于最短距离算法的最近邻优先(NearestNeighbor First)算法,并采用KDD Cup 1999数据集中的数据对该算法的执行效率进行检测. 展开更多
关键词 数据挖掘 聚类分析 最近邻优先 入侵检测
下载PDF
基于数据分区的负荷密度显示的实现 被引量:1
6
作者 李双伟 范斗 +2 位作者 王康元 邱家驹 鄢安河 《继电器》 CSCD 北大核心 2008年第3期42-44,55,共4页
以Arc/info作为开发平台,提出电力系统区域负荷密度分区显示的实现方法,将地理信息系统与电力系统节点数据相结合,应用最近邻优先吸收算法将区域负荷节点进行分区,并结合实例表明该方法简洁可靠,能够满足实际需要。
关键词 负荷密度 GIS ARC/INFO 最近邻优先吸收法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部