基于数据场的数据势能竞争与K-means融合的聚类算法被引量：2

CLUSTERING ALGORITHM FOR COMPETITION OF DATA POTENTIAL ENERGY AND K-MEANS BASED ON DATA FIELD

下载PDF

导出

摘要 K-means算法采用欧氏距离进行数据点的划分,不能够准确地刻画数据集特征,而随机选取聚类中心点的机制,也不能获得好的聚类结果。为此,提出一种基于数据场的数据势能竞争与K-means算法融合的聚类算法。算法中定义了数据场的概念,利用局部最小距离进行数据聚合势能的竞争,然后利用势能熵提取基于数据集分布的最优截断距离,根据截断距离与斜率确定出簇中心点,实现K-means聚类。在UCI数据集上的测试结果表明,融合后的算法具有更好的聚类结果。 The K-means algorithm uses the Euclidean distance to divide the data points, cannot accurately characterize the data set, and randomly select the clustering center point mechanism, and cannot get good clustering results. In this paper, a clustering algorithm based on data field-based data potential competition and K-means algorithm is proposed. In this algorithm, the concept of data field is defined, and the local minimum distance is used to compete the potential of data aggregation. The optimal truncation distance based on the distribution of data set is extracted by using potential energy entropy. The cluster center point is determined according to the truncation distance and slope, and the K-means clustering is realized. The results of the UCI dataset show that the fusion algorithm has better clustering results.

作者许家楠张桂珠

机构地区江南大学物联网工程学院

出处《计算机应用与软件》 2017年第12期266-272,共7页 Computer Applications and Software

基金江苏省自然科学基金项目(BK20140165)

关键词数据竞争数据场势能熵斜率复杂数据集 Data competition Data field Potential entropy Slope Complex dataset

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：20
2WANG Shuliang,FAN Jinghua,FANG Meng,YUAN Hanning.HGCUDF: Hierarchical Grid Clustering Using Data Field[J].Chinese Journal of Electronics,2014,23(1):37-42. 被引量：3
3周亚建,徐晨,李继国.基于改进CURE聚类算法的无监督异常检测方法[J].通信学报,2010,31(7):18-23. 被引量：22
4苏辉,葛洪伟,张欢庆,袁运浩.密度敏感的数据竞争聚类算法[J].计算机应用,2015,35(2):444-447. 被引量：2
5WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：61

二级参考文献61

1余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
2淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
3高能,冯登国,向继.一种基于数据挖掘的拒绝服务攻击检测技术[J].计算机学报,2006,29(6):944-951. 被引量：44
4ANDERSON J P.Computer Security Threat Monitoring and Surveillance[R].James P Anderson Co,Fort Washington,Pennsylvania,1980.
5PORTNOY L,ESKIN E,STOLFO S J.Intrusion detection with unlabeled data using clustering[A].Proceedings of ACM CSS Workshop on Data Mining Applied to Security (DMSA2001)[C].Philadelphia,2001.5-8.
6JIANG S Y,SONG X,WANG H,et al.A clustering-based method for unsupervised intrusion detections[J].Pattern Recognition Letters,2006,27(7):802-810.
7ESKIN E,ARNOLD A,PRERAU M,et al.A geometric framework for unsupervised anomaly detection:detecting intrusions in unlabeled data[A].Applications of Data Mining in Computer Security[C].Boston,2002.78-99.
8OLDMEADOW J,RAVINUTALA S,LECKIE C.Adaptive clustering for network intrusion detection[A].Advances in Knowledge Discovery and Data Mining[C].Heidelberg,2004.255-259.
9LEUNG K,LECKIE C.Unsupervised anomaly detection in network intrusion detection using clusters[A].Proceedings of the Twenty-Eighth Australasian Computer Science Conference[C].Sydney,2005.333-342.
10ZANERO S,SAVARESI S M.Unsupervised learning techniques for an intrusion detection system[A].Proceedings of the 2004 ACM Symposium on Applied Computing[C].New York,2004.412-419.

共引文献97

1刘友超,张曦煌.基于自然最近邻相似图的谱聚类[J].计算机应用研究,2020,37(1):30-33. 被引量：6
2陆小莉,刘强,徐生霞.中国产业转型升级的空间分异与影响机制研究[J].经济问题探索,2021(2):135-144. 被引量：3
3罗姗姗,杜庆治,杨秋萍,龙华.一种改进的孤立点消除及网络文本聚类算法[J].云南师范大学学报（自然科学版）,2012,32(1):48-51. 被引量：2
4陈平,宋玉蓉,蒋国平.基于多维聚类挖掘的异常检测方法研究[J].计算机技术与发展,2012,22(7):136-139. 被引量：1
5刘明辉,周磊,谢婷婷,霍烁烁.基于CURE算法的电子装备时变误差分析[J].无线电工程,2012,42(7):40-43.
6彭凌西,曾金全.基于免疫的网络动态实时异常检测模型[J].广州大学学报（自然科学版）,2012,11(6):73-77.
7白宁.一种基于k-均值聚类的异常检测技术[J].计算机与现代化,2014(1):93-95. 被引量：4
8赖锦辉,梁松.一种消除孤立点的微博热点话题发现方法[J].计算机应用与软件,2014,31(1):105-107. 被引量：9
9李延,王大魁,耿晶,王树良.数据质量聚类算法[J].武汉大学学报（信息科学版）,2019,44(1):153-158. 被引量：3
10WANG Shuliang,LI Qi,YUAN Hanning,GENG Jing,DAI Tianru,DENG Chenwei.Robust Clustering with Topological Graph Partition[J].Chinese Journal of Electronics,2019,28(1):76-84. 被引量：1

同被引文献25

1淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
2胡彩平,秦小麟.一种基于密度的局部离群点检测算法DLOF[J].计算机研究与发展,2010,47(12):2110-2116. 被引量：52
3杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：20
4古平,刘海波,罗志恒.一种基于多重聚类的离群点检测算法[J].计算机应用研究,2013,30(3):751-753. 被引量：21
5王敬华,赵新想,张国燕,刘建银.NLOF:一种新的基于密度的局部离群点检测算法[J].计算机科学,2013,40(8):181-185. 被引量：28
6王敬华,金鹏.基于粗约简和网格的离群点检测[J].计算机工程与应用,2015,51(3):133-137. 被引量：10
7王瑜,汪三贵.农村贫困人口的聚类与减贫对策分析[J].中国农业大学学报（社会科学版）,2015,32(2):98-109. 被引量：27
8朱付保,徐显景,白庆春,朱颢东.基于数据集对象平均离群因子的离群点选择算法[J].微电子学与计算机,2016,33(1):131-134. 被引量：2
9石美红,赵辉,贾郑磊,雷燕,张祥俊.基于数据场的无线传感网数据双重聚类算法[J].微电子学与计算机,2016,33(2):49-53. 被引量：2
10WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：61

引证文献2

1孟海东,孙新军,宋宇辰.基于数据场的改进LOF算法[J].计算机工程与应用,2019,55(3):154-158. 被引量：4
2龚艳冰,巢妍.基于数据场K-means聚类的农村贫困人口精准分级研究——以贵州省某镇为例[J].软科学,2019,33(6):135-139. 被引量：6

二级引证文献10

1薛善良,李晨.一种基于离群数据检测和线性回归的压装质量智能预警方法[J].Transactions of Nanjing University of Aeronautics and Astronautics,2020,37(4):597-606.
2李翔,李学军.连片贫困地区精准扶贫政策效应研究[J].干旱区资源与环境,2020,34(10):34-42. 被引量：11
3田世海,董月文,王健.基于NRL和k-means的舆情事件聚类研究[J].情报科学,2021,39(2):129-136. 被引量：8
4刘玉杰.多维贫困的空间聚类与相关性研究[J].云南农业大学学报（社会科学版）,2021,15(3):48-54. 被引量：2
5赵新正,沈文成,樊彤彤,韩静,芮旸.脱贫攻坚与乡村振兴有效衔接的地域评价及模式探究——以陕西省为例[J].河北师范大学学报（自然科学版）,2021,45(6):638-648. 被引量：4
6王金元,王宇,张亚松,林昊,龚致富,李盼,安新艳.基于Hadoop的分布式财务异常数据分析系统设计[J].信息技术,2022,46(1):21-25. 被引量：5
7宋美艳,王炎初,刘佩,王海东,贾泽冰.基于画面组态的聚类极值实时计算方法[J].热力发电,2022,51(3):187-190.
8韩传峰,宋府霖,滕敏敏.长三角地区碳排放时空特征、空间聚类与治理策略[J].华东经济管理,2022,36(5):24-33. 被引量：12
9吴琼,李永飞.基于机器学习的白洋淀生态数据的异常检测[J].电脑知识与技术,2022,18(35):7-9.
10李林威,刘帮成.区域城市群人才生态系统评价研究[J].重庆大学学报（社会科学版）,2023,29(1):135-150. 被引量：6

1范为.由“华为-腾讯事件”谈数据权益梳理与数据治理体系构建[J].信息安全与通信保密,2017,15(9):12-16. 被引量：1
2邓惠俊.一种基于数据场的图像分割方法与研究[J].长春工程学院学报（自然科学版）,2016,17(2):92-94.
3赛迪智库.大数据竞争从垄断向开放演变[J].软件和集成电路,2017,0(9):33-37.
4杜云开,顾乃杰,邵祎康,丁世举.一种基于Petri网验证的数据竞争检测方法[J].小型微型计算机系统,2017,38(10):2352-2357. 被引量：1
5张杜芳.基于新型谱聚类算法的提升机故障监测研究[J].江西煤炭科技,2017(4):83-85.
6杨霞.以平台聚合撬动行业前行——专访上海卡行天下供应链管理有限公司执行总裁钱钰[J].物流时代周刊,2017,0(11):54-57.
7人工智能识别植物准确率高达80%[J].科学家,2017,5(18):104-104.
8佘艺,唐弘胤,吴国全,陈伟,魏峻,黄涛.基于测试例生成的Android应用数据竞争验证方法[J].计算机科学,2017,44(11):27-32. 被引量：1
9陈睿,杨孟飞.航天嵌入式软件数据访问冲突基准测试集研究[J].中国空间科学技术,2017,37(3):62-70. 被引量：3
10王星,呙鹏程,王玉冰,程越.基于线性回归分析的快速搜索聚类中心算法[J].系统工程与电子技术,2017,39(11):2614-2622. 被引量：4

计算机应用与软件

2017年第12期

浏览历史

内容加载中请稍等...

基于数据场的数据势能竞争与K-means融合的聚类算法被引量：2

参考文献5

二级参考文献61

共引文献97

同被引文献25

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于数据场的数据势能竞争与K-means融合的聚类算法 被引量：2

参考文献5

二级参考文献61

共引文献97

同被引文献25

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于数据场的数据势能竞争与K-means融合的聚类算法被引量：2