一种基于划分的动态聚类算法被引量：16

Partition-based dynamic clustering algorithm

下载PDF

导出

摘要聚类分析是数据挖掘的一个重要研究分支,已经提出了许多聚类算法,划分方法是其中之一。划分方法的缺点是要求事先给定聚类结果数,对初始划分和输入顺序敏感等。为克服这些缺陷,以划分方法为基础,提出了一种基于划分的动态聚类算法。该算法按密度从大到小,依距离选择较为分散的初始值,同时可以过滤噪声数据,并在聚类的过程中动态地改变聚类结果数,改善了聚类质量,获得了更自然的结果。 Clustering is a promising application area for many fields including data mining, statistical data analysis, pattern recognition, image processing, etc. Partitioning method is a clustering algorithm, which is sensible to initial partitions (values of k), initial values and input sequence. To overcome these disadvantages, a partition-based dynamic clustering algorithm is developed. At first, the data objects is sorted by their densities. Then some dispersive data objects is selected as initial cluster centers according to priority. At the same time, the outliers can be filtrated. And it changes the numbers of partitions during the clustering. The experiments demonstrate that the algorithm improves the partition method and gets the better results.

作者万志华欧阳为民张平庸

机构地区上海大学计算机工程与科学学院上海大学网络中心

出处《计算机工程与设计》 CSCD 北大核心 2005年第1期177-179,229,共4页 Computer Engineering and Design

关键词聚类分析数据挖掘划分方法 K-MEANS clustering data mining partition method k-means

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1杨广文,王鼎兴,郑纬民,李晓明.一种利用确定性退火技术的聚类模型与算法研究[J].软件学报,1999,10(6):663-667. 被引量：14
2HANJia-wei KAMBERM.数据挖掘概念与技术[M].北京：机械工业出版社,2001.1 51-161.
3罗可,蔡碧野,吴一帆,谢中科,张丽.数据挖掘中聚类的研究[J].计算机工程与应用,2003,39(20):182-184. 被引量：31
4周水庚,周傲英,曹晶,胡运发.一种基于密度的快速聚类算法[J].计算机研究与发展,2000,37(11):1287-1292. 被引量：88
5刘必红,符红光.快速发现任意形状的聚类[J].计算机应用,2002,22(4):22-24. 被引量：3

二级参考文献18

1[1]Han J., Kamber M.Data Mining: Concepts and Techniques[M].Morgan Kaufmann Publishers, 2000.
2[2]Zhang T., Ramakrishnan R., Livny M.BIRCH:An Efficient DataClustering Method for Very Large Databases[A].Proceeding of ACM SIGMOD Conference[C].Portland, Oregon, June,1996.103-114.
3[3]Ester M., Kriegel H.-P., Sander J., et al.A Density-BasedAlgorithm for Discovering Clusters in Large Spatial Databases with Noise[A].Proceeding 2nd International Conference on Knowledge Discovery and Data Mining(KDD′96)[C].Portland, 1996.226-231.
4[4]Kriegel H.-P., Seeger B., Beckmann N., et al.The R*-tree: An Efficient and Robust Access Method for Points and Rectangles[A].Proceeding ACM SIGMOD International Conference on Management of Data (SIGMOD′90)[C].Atlantic City,NJ,1990.322-331.
5A K Jain,M N Murty,P J Flynn.Data clustering:A survey[J].ACM Computer Surv, 1999 ;31 : 264-323.
6R Agrawal,J Gehrke,D Gonopolos et al.Automatic subspace clustering of high dimensional data for data mining applications[C].In :Proc 1995 ACM-SIGMOD Int Conf Management of Data,Seattle,WA,.1998:94-105.
7R Agrawal,R Srikant.Privacy-preserving data mining[C].In :Proc 2000 ACM-SIGMOD Int'l Conf.Management of Data,Dallas,TX,2000:439-450.
8P Bradley,U Fayyad,C Reina.Scaling Clustering Algorithms to Large Databases[C].In:Knowledge Discovery and Data Mining,AAAI Press, Menlo Park,Calif, 1998:9-15.
9V Ganti et al.Clustering Large Datasets in Arbitrary Metric Spaces [C].In : Data Engineering, IEEECS Press, Los Alamitos, Calif, 1999 : 502-511.
10M Goebel,L Gruenwald.A survey of data mining and knowledge discovery software tools[J].SIGKDD Explorations, 1999: ( 1 ) :20-33.

共引文献166

1梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
2周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
3王海,王忠民.一种基于密度和网格的聚类算法在KDD中的应用[J].计算机工程与应用,2004,40(24):180-182. 被引量：3
4周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
5董彩云,杜韬,郭春燕,曲守宁.聚类后的关联规则快速更新算法研究[J].计算机应用研究,2004,21(11):30-32. 被引量：3
6林小红,蒋伟进.基于RS近似算法的医疗诊断知识挖掘[J].海军工程大学学报,2004,16(5):48-51.
7曾红月,姚敏.时序数据挖掘方法研究[J].计算机工程与设计,2004,25(11):1999-2001. 被引量：4
8薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
9郭伟,唐晓君,刘万军.一种基于划分的聚类算法分析与改进[J].辽宁工程技术大学学报（自然科学版）,2004,23(6):826-828. 被引量：4
10曲守宁,董彩云,徐德军,吴桐.关联规则算法研究及其在教学系统中的应用[J].计算机系统应用,2005,14(4):20-23. 被引量：5

同被引文献127

1刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
2王建会,申展,胡运发.一种实用高效的聚类算法[J].软件学报,2004,15(5):697-705. 被引量：26
3沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
4赵霖,鲍善芬.中华民族传统膳食结构的特点和优势[J].中国食品学报,2004,4(4):1-6. 被引量：14
5王宇.K-maxmins聚类算法[J].计算机工程与设计,2004,25(11):1884-1885. 被引量：4
6陈云飞,刘玉树,钱越英,赵基海.一种基于密度的启发性群体智能聚类算法[J].北京理工大学学报,2005,25(1):45-48. 被引量：4
7陈梅兰.基于网格和密度聚类算法研究[J].计算机与现代化,2005(2):1-5. 被引量：9
8陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
9刘峰,孙超,李斌.一种改进的C均值法初始类划分方法[J].计算机工程与设计,2005,26(2):465-466. 被引量：4
10耿志强,朱群雄,顾祥柏.现代化工流程报警系统优化算法及应用[J].计算机与应用化学,2005,22(3):183-188. 被引量：5

引证文献16

1吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
2柳永念,郭会林.对C均值聚类算法的一些改进[J].广西大学学报（哲学社会科学版）,2007,29(S3):207-208.
3张春英,刘保相,刘凤春.基于SPA的动态聚类统计分析及其应用[J].计算机工程与设计,2006,27(20):3947-3948. 被引量：2
4黄建春,邹汉斌,李晓峰.基于文本聚类的映射聚类算法研究[J].计算机工程与设计,2007,28(6):1264-1266. 被引量：1
5宋殿霞,王艳,邹光辉.空间数据挖掘聚类算法研究[J].滨州学院学报,2006,22(6):43-48.
6杨鑫华,于宽.基于密度半径自适应选择的K-均值聚类算法[J].大连交通大学学报,2007,28(1):41-44. 被引量：2
7钱晓东.基于改进ART2算法的数据聚类方法[J].计算机工程与设计,2007,28(11):2629-2632. 被引量：2
8贾果.基于篇章结构的自动文摘方法研究[J].计算机与数字工程,2007,35(6):10-13. 被引量：1
9鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.欧氏距离的加权处理对K-means法聚类效果的改进[J].中国医院统计,2008,15(1):9-12. 被引量：1
10孙胜,王元珍.基于核的自适应K-Medoid聚类[J].计算机工程与设计,2009,30(3):674-675. 被引量：14

二级引证文献74

1刘琪,黄忻,史祖民,余灿清.膳食模式评价方法的研究进展[J].营养学报,2021,43(6):615-618. 被引量：7
2刘凤春,张春英,刘玉芳.基于复杂信息的绩效评价计算模型及算法[J].计算机工程与设计,2007,28(21):5273-5275. 被引量：2
3魏明军,张春英,周瑞英.基于SPA的体育彩票市场聚类统计分析及算法实现[J].微电子学与计算机,2009,26(6):193-197. 被引量：1
4俞辉.基于LSA和pLSA的多文档自动文摘[J].计算机工程与科学,2009,31(9):108-111. 被引量：6
5李乐,嵇成新,王春雨.基于ART神经网络的FCM聚类多目标跟踪方法[J].舰船电子对抗,2010,33(2):83-86.
6洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
7王世卿,张书春.基于网格结构的快速PAM算法[J].计算机工程与设计,2011,32(3):952-954. 被引量：2
8孟武胜,刘爱峰,程塨.改进ART Ⅱ算法的仿真研究[J].计算机工程与应用,2011,47(9):178-180. 被引量：3
9洪亮亮,罗可.动态的粗糙增量聚类方法[J].计算机工程与应用,2011,47(24):106-110. 被引量：5
10刘建华,王进,孟颖,王文生.基于模拟退火的粗糙集K均值电力负荷聚类分析[J].现代电力,2012,29(1):10-14. 被引量：5

1岚山.评说数码伴侣（下）[J].摄影与摄像,2008(7):45-47.
2石敦奇.相加相乘哪个大？[J].少年科普世界（快乐数学1-3年级版）,2013(6):17-17.
3刘胜久,李天瑞,贾真,景运革.基于搜索引擎的相似度研究与应用[J].计算机科学,2014,41(4):211-214. 被引量：3
4铁生.如何降低着陆页面跳出率[J].计算机与网络,2014,40(18):42-43.
5范茂志,林秀.基于局部特征Gabor小波的BP神经网络的人脸识别[J].科技传播,2012,4(1):183-184.
6郭玉龙,吴晓军.蚁群算法在P2P搜索中的应用研究[J].计算机技术与发展,2011,21(10):55-58. 被引量：1
7黄美璇.基于聚类分析的网络舆情监控系统的设计[J].宝鸡文理学院学报（自然科学版）,2011,31(4):40-44. 被引量：5
8HUANG Yi,JIA ZhongXiao.Some results on the regularization of LSQR for large-scale discrete ill-posed problems[J].Science China Mathematics,2017,60(4):701-718. 被引量：1
9彭雅琴,宫宁生.基于直觉模糊集的Tri-Training改进算法[J].微电子学与计算机,2016,33(3):134-137.
10田明浩,潘成胜,冯永新.低信噪比条件下扩频伪码均值捕获算法的改进[J].火力与指挥控制,2010,35(5):32-35. 被引量：1

计算机工程与设计

2005年第1期

浏览历史

内容加载中请稍等...

一种基于划分的动态聚类算法被引量：16

参考文献5

二级参考文献18

共引文献166

同被引文献127

引证文献16

二级引证文献74

相关作者

相关机构

相关主题

浏览历史

一种基于划分的动态聚类算法 被引量：16

参考文献5

二级参考文献18

共引文献166

同被引文献127

引证文献16

二级引证文献74

相关作者

相关机构

相关主题

浏览历史

一种基于划分的动态聚类算法被引量：16