基于数据场的粗糙聚类算法被引量：9

Rough Clustering Algorithm Based on Data Field

下载PDF

导出

摘要聚类分析是数据挖掘的研究热点。传统的聚类算法都是把一个对象精确地划分到一个聚类簇中,类别之间的界限是非常精确的。随着Web挖掘技术的发展,精确地划分每个对象的聚类算法面临着巨大的挑战。根据数据场理论和经典粗糙集理论所具有处理不精确与不确定性数据的特性,提出一种新的基于数据场的粗糙聚类算法,该粗糙聚类算法采用势值作为对象的划分依据,避免传统粗糙聚类算法一贯采用基于欧氏距离的划分方法。算法首先通过对数据对象进行粗分然后再不断迭代细分,直至形成稳定的聚类簇。实验分析过程中,把提出的算法与粗糙K-means算法和粗糙K-medoids算法进行了比较,结果表明该算法在交叉数据集上具有较好的聚类效果,而且收敛速度较快。 Clustering analysis is the hotspot in Data mining, all the conventional clustering algorithms precisely put the each object into one cluster, the bounders between clusters are precise, as the development of the Web mining, clustering algorithms that precisely divide each object face great challenges. Based on the data field theory and classic rough set theory＇s character that processes the uncertainty and imprecise data, a novel rough clustering algorithm based on data field was proposed, it divides the objects through computing potential value, which avoids the conventional rough clustering partition method based on euclidean distance. The approach iterates from rough to un-rough incessantly till the stable clusters form. At the experimental analysis process, we compared the algorithm that we proposed with rough K- means algorithm and rough K-medoids algorithm, the result shows the algorithm that we proposed has better clusters on the crossed datasets and fast convergence.

作者李学苗夺谦冯琴荣

机构地区同济大学计算机科学与技术系

出处《计算机科学》 CSCD 北大核心 2009年第2期203-206,244,共5页 Computer Science

基金国家自然科学基金资助项目(60475019 60775036) 2006年博士学科点专项科研基金(20060247039)资助

关键词粗糙聚类数据场势值 Davies-bouldin指标 Rough clustering, Data field, Potential value, Davies-bouldin index

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
2FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30

二级参考文献10

1Jain A K,Murty M N,Flynn P J.Data clustering:a review[J].ACM Computing Surveys,1999,31(3):264-323.
2Za(i)ane O R,Foss A,Lee C H,Wang W.On data clustering analysis:scalability,constraints and validation[A].Proceedings of the Sixth Pacific Asia Conference on Knowledge Discovery and Data Mining[C].Taiwan:Springer-Verlag,2002.28-39.
3Zhang T,Ramakrishnman R,Linvy M.BIRCH:an efficient method for very large databases[A].Proceedings of ACM SIGMOD International Conference on Manangement of Data[C].Canada:ACM Press,1996.103-114.
4Guha S,Rastogi R,Shim K.CURE:an efficient clustering algorithm for large databases[A].Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data[C].Seattle:ACM Press,1998.73-84.
5George K,Han E H,Kumar V.CHAMELEON:a hierarchical clustering algorithm using dynamic modeling[J].IEEE computer,1999,27(3):329-341.
6Wright W E.Gravitational clustering[J].Pattern Recognition,1977,9(3):151-166.
7Oyang Y J,Chen C Y,Yang T W.A study on the hierarchical data clustering algorithm based on gravity theory[A].The 5th European Conference on Principles and Practive of Knowledge Discovery in Databases(PKDD2001)[C].Freiburg:Springer-Verlag,2001.350-361.
8Landau L D,Lifshitz E M.The classical theory of fields[M].Beijing:Beijing World Publishing Ltd,1999.
9淦文燕.聚类-数据挖掘中的基础问题研究[D].南京:解放军理工大学,2003.
10钱卫宁,周傲英.从多角度分析现有聚类算法(英文)[J].软件学报,2002,13(8):1382-1394. 被引量：86

共引文献110

1董莉娜,王如琪,刘群.一种结合数据势能的图像补全方法[J].计算机应用研究,2020,37(S02):362-364.
2毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
3赫南,淦文燕,李德毅,康建初.一个小型演员合作网的拓扑性质分析[J].复杂系统与复杂性科学,2006,3(4):1-10. 被引量：16
4李凯,田双亮,耿丽君,丁丽丽.基于数据场的人脸特征提取[J].西北民族大学学报（自然科学版）,2009,30(4):32-36. 被引量：2
5王凌峰.基于构成要素的聚类算法[J].统计与决策,2007,23(19):26-28. 被引量：1
6符海东,李雪.免疫入侵检测中基于数据场的动态识别算法[J].计算机应用,2007,27(9):2160-2162. 被引量：2
7彭辉,任继平,吴兰兰,陆尚平.基于改进的K-均值聚类算法的农作物图像分割[J].农机化研究,2008,30(6):57-60.
8高哲,魏海平,王福威,赵晓碧.基于Web日志挖掘的Web文档聚类[J].计算机工程与设计,2008,29(18):4708-4710. 被引量：5
9高忠科,金宁德.基于K-means聚类和数据场理论的复杂网络社团结构探寻[J].控制与决策,2009,24(3):377-382. 被引量：9
10李琳,李肯立.基于图形处理器的划分聚类算法效率研究[J].计算机应用研究,2009,26(4):1276-1278. 被引量：2

同被引文献111

1伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
2余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
3李订芳,章文,何炎祥.一种新的带模糊权的粗糙聚类算法[J].信息与控制,2006,35(1):120-125. 被引量：3
4何明,冯博琴,马兆丰,傅向华.一种基于高斯混合模型的无监督粗糙聚类方法[J].哈尔滨工业大学学报,2006,38(2):256-259. 被引量：8
5淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
6邵超,黄厚宽.一种新的基于SOM的数据可视化算法[J].计算机研究与发展,2006,43(3):429-435. 被引量：9
7岳佳,王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息,2006,22(11X):244-246. 被引量：51
8金阳,左万利.一种基于动态近邻选择模型的聚类算法[J].计算机学报,2007,30(5):756-762. 被引量：18
9Z.Pawlak.Bough Sets[M].International Journal of Computer and Information Science,1982,11 (5):341 -356.
10Xu Rui. Donald Wunsch II. Survey of clustering algorithm [J]. IEEE transaction on neural networks (S1045- 9227), 2005, 10 (3) :645-678.

引证文献9

1钟诚.基于粗糙集的聚类方法研究[J].琼州学院学报,2011,18(2):8-10. 被引量：3
2周杨,苗夺谦,岳晓冬.基于自适应权重的粗糙K均值聚类算法[J].计算机科学,2011,38(6):237-241. 被引量：12
3杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：21
4段文影,李向军,邱桃荣,段隆振.一种具有自适应参数的基于密度加权的粗糙K-均值算法[J].南昌大学学报（理科版）,2012,36(5):498-501. 被引量：5
5张霓,陈天天,何熊熊.基于数据场和单次划分的聚类算法[J].浙江工业大学学报,2016,44(1):52-57. 被引量：9
6王钊,樊钊.基于多重特征的双层Web用户聚类方法[J].计算机应用研究,2018,35(1):93-96. 被引量：1
7刘维.数据挖掘中聚类算法综述[J].江苏商论,2018(7):120-125. 被引量：19
8郜丽鹏,沙作金.一种改进的数据场聚类算法[J].应用科技,2019,46(6):30-34. 被引量：4
9康磊,刘海砚,程维应,陈晓慧,李静.顾及属性特征的城市设施空间聚类分析[J].测绘与空间地理信息,2022,45(9):36-39.

二级引证文献72

1杨婷,郑雅玲,余帆,李应昆.基于CiteSpace对便秘研究的文献计量学及可视化分析[J].世界最新医学信息文摘,2019,19(76):51-54. 被引量：2
2刘友超,张曦煌.基于自然最近邻相似图的谱聚类[J].计算机应用研究,2020,37(1):30-33. 被引量：6
3赵根柱,巴特尔,王钢.基于均值汇总模型的网络流量评估方法的研究[J].广西大学学报（自然科学版）,2011,36(A01):27-30.
4申立平,王艳平.基于粗糙集属性贴近度的聚类方法与应用[J].辽宁工业大学学报（自然科学版）,2012,32(1):51-55. 被引量：2
5任丽娜,秦永彬,许道云.基于自适应权重的模糊C-均值聚类算法[J].计算机应用研究,2012,29(8):2849-2851. 被引量：8
6王学恩,韩德强,韩崇昭.采用不确定性度量的粗糙模糊C均值聚类参数获取方法[J].西安交通大学学报,2013,47(6):55-60. 被引量：9
7李莲,罗可,周博翔.基于粒计算的粗糙集聚类算法[J].计算机应用研究,2013,30(10):2916-2919. 被引量：9
8刘冲,李向军,沈华,邱桃荣,徐苏.基于基数排序及属性约简的雷电预报因子提取方法[J].南昌大学学报（理科版）,2013,37(4):344-349. 被引量：2
9钟诚.基于粗糙集理论的学生困难等级认定方法探究[J].琼州学院学报,2013,20(5):101-105.
10刘强,邓磊,贾振红,覃锡忠.一种改进的加权K-prototypes算法[J].激光杂志,2014,35(1):18-20. 被引量：5

1陈晓梅.入侵检测中的数据预处理问题研究[J].计算机科学,2006,33(1):81-83. 被引量：13
2周涛.具有自适应参数的粗糙k-means聚类算法[J].计算机工程与应用,2010,46(26):7-10. 被引量：8
3蒋无尘.基于改进的k均值图像分割算法研究[J].科教导刊（电子版）,2014(7):140-140. 被引量：1
4卜耀华,姜秀柱,李连习.基于数据场的粗糙聚类算法研究[J].福建电脑,2009,25(8):79-80. 被引量：1
5王慎超,苗夺谦,陈敏,王睿智.基于覆盖的粗糙聚类算法[J].电子与信息学报,2008,30(7):1713-1716. 被引量：2
6应文豪,许敏,王士同,邓赵红.在大规模数据集上进行快速自适应同步聚类[J].计算机研究与发展,2014,51(4):707-720. 被引量：11
7纪洲鹏,周军,何明.基于变精度粗糙集的Web用户聚类方法[J].计算机工程,2010,36(3):44-46. 被引量：2
8毕凯,王晓丹,邢雅琼.基于证据空间有效性指标的聚类选择性集成[J].通信学报,2015,36(8):135-145. 被引量：5
9郭晋华,苗夺谦,周杰.基于阴影集的粗糙聚类阈值选择[J].计算机科学,2011,38(10):209-210. 被引量：6
10周涛,张艳宁,袁和金,陆惠玲,邓方安.粗糙核k-means聚类算法[J].系统仿真学报,2008,20(4):921-925. 被引量：15

计算机科学

2009年第2期

浏览历史

内容加载中请稍等...

基于数据场的粗糙聚类算法被引量：9

参考文献2

二级参考文献10

共引文献110

同被引文献111

引证文献9

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

基于数据场的粗糙聚类算法 被引量：9

参考文献2

二级参考文献10

共引文献110

同被引文献111

引证文献9

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

基于数据场的粗糙聚类算法被引量：9