用于数据挖掘的聚类算法被引量：67

Clustering Algorithms Used in Data Mining

下载PDF

导出

摘要数据挖掘用于从超大规模数据库中提取感兴趣的信息。聚类是数据挖掘的重要工具,根据数据间的相似性将数据库分成多个类,每类中数据应尽可能相似。从机器学习的观点来看,类相当于隐藏模式,寻找类是无监督学习过程。目前已有应用于统计、模式识别、机器学习等不同领域的几十种聚类算法。该文对数据挖掘中的聚类算法进行了归纳和分类,总结了7类算法并分析了其性能特点。 Data mining is used to draw interesting information from Very Large DataBases (VLDB). Clustering plays an outstanding role in data mining applications. Clustering is a division of databases into groups of similar objects based on the similarity. From a machine learning perspective clusters correspond to hidden patterns, the search for clusters is unsupervised learning. There are tens of clustering algorithms used in various fields such as statistics, pattern recognition and machine learning now. This paper concludes the clustering algorithms used in data mining and assorts them into 7 classes. Seven types of algorithms are summarized and their performances are analyzed here.

作者姜园张朝阳仇佩亮周东方

机构地区浙江大学信息与通信工程研究所解放军信息工程大学

出处《电子与信息学报》 EI CSCD 北大核心 2005年第4期655-662,共8页 Journal of Electronics & Information Technology

基金国家自然科学基金(60002003)资助课题

关键词数据挖掘聚类分层聚类分割聚类 K-MEANS Data mining, Clustering, Hierarchical clustering, Partitioning clustering, K-Means

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献52

1刘健庄,谢维信,黄建军,李文化.聚类分析的遗传算法方法[J].电子学报,1995,23(11):81-83. 被引量：27
2黄凤岗,宋克欧.一种集成模糊聚类神经网络[J].哈尔滨工程大学学报,1997,18(3):82-85. 被引量：2
3张志华,郑南宁,史罡.极大熵聚类算法及其全局收敛性分析[J].中国科学（E辑）,2001,31(1):59-70. 被引量：27
4高新波,裴继红,谢维信.模糊c-均值聚类算法中加权指数m的研究[J].电子学报,2000,28(4):80-83. 被引量：157
5刘静,钟伟才,刘芳,焦李成.免疫进化聚类算法[J].电子学报,2001,29(z1):1868-1872. 被引量：43
6黄敏超,张育林,陈启智.模糊超球神经网络在模式聚类中的应用[J].自动化学报,1997,23(2):279-282. 被引量：3
7杨志荣,李磊.用SOM聚类实现多级高维点数据索引[J].计算机研究与发展,2003,40(1):100-106. 被引量：6
8Guha S, Rastogi R, Sim K. CURE: An efficient clustering algorithm for large databases, In Proc, of the ACM SIGMOD Conference, Seattle, WA, 1998:73 - 84.
9Karypis G, Han E H, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling, Computer, 1999,32:68 - 75.
10Boley D L. Principal direction divisive partitioning. Data Mining and Knowledge Discovery, 1998, 2(4): 325 - 344.

二级参考文献61

1郝国才,冯珊.社会发展现状综合评价决策支持系统研究[J].决策与决策支持系统,1996(3):1-6. 被引量：2
2田建国,朱孔来,黄赐玺,李琳.企业活力测试与评价的数学模型[J].决策与决策支持系统,1996(3):73-78. 被引量：1
3王战军,赵瑜,林梦泉,王战军.中国普通高等学校研究生院评估指标体系的研究[J].学位与研究生教育,1996(4):52-55. 被引量：10
4李兴斯.一类不可微优化问题的有效解法[J].中国科学（A辑）,1994,24(4):371-377. 被引量：137
5刘健庄,谢维信,黄建军,李文化.聚类分析的遗传算法方法[J].电子学报,1995,23(11):81-83. 被引量：27
6郝强,朱梅林.内燃机性能的模糊评估方洁[J].内燃机学报,1995,13(3):217-223. 被引量：8
7钱云涛,谢维信.一种由模糊逻辑神经元网络实现的聚类分析方法[J].西安电子科技大学学报,1995,22(1):1-7. 被引量：12
8傅崇伦.利用WSEIAC模型进行通信系统效能评估[J].电子科技大学学报,1996,25(1):81-86. 被引量：3
9徐发强沈越泓.通信设备抗干扰性能模糊综合评估研究[J].通信工程学院学报,1998,12(1):42-48.
10[1]Holland J H. Adaptation in Nature and Artificial System[M]. MIT Press, 1992

共引文献318

1肖微炜,钱瑜,赵胜豪,王亚伟.基于模糊聚类的生态功能区若干指标定量划分的研究[J].四川环境,2008,27(3):57-60. 被引量：1
2刘静,钟伟才,刘芳,焦李成.免疫进化聚类算法[J].电子学报,2001,29(z1):1868-1872. 被引量：43
3阎岭,蒋静坪.基于进化策略的K-means聚类算法[J].江南大学学报（自然科学版）,2004,3(3):245-248. 被引量：3
4缪嘉嘉,李爱平,贾焰,吴泉源.信息集成中数据获取关键技术的研究[J].计算机研究与发展,2007,44(z3):452-457.
5王孙安,郭子龙.混沌免疫模糊聚类算法在图像边缘检测中的应用[J].西安交通大学学报,2004,38(7):712-716. 被引量：9
6王鹏,赵学亮,万林海,蔡美峰.基于GA和FCM的岩体结构面的混合聚类方法[J].北京科技大学学报,2004,26(3):227-232. 被引量：11
7吴成茂,范九伦.一种新的数据分类效果评价方法[J].计算机工程与应用,2004,40(25):171-172.
8王向军,嵇斗,杭义会.基于模糊贴近度的舰船辐射噪声分类[J].电声技术,2004,28(6):49-52.
9王向军,林春生,龚沈光.基于模糊贴近度的舰船辐射噪声分类方法[J].海军工程大学学报,2004,16(4):89-92.
10邓赵红,王士同,吴锡生,胡德文.鲁棒的极大熵聚类算法RMEC及其例外点标识[J].中国工程科学,2004,6(9):38-45. 被引量：12

同被引文献556

1Mei Lu,Fanzhang Li.Survey on Lie Group Machine Learning[J].Big Data Mining and Analytics,2020,3(4):235-258. 被引量：4
2李默.基于Web的数据挖掘技术在数字图书馆中的应用[J].大学图书情报学刊,2007,25(4):44-46. 被引量：13
3张哲,佟金.电子鼻和电子舌在食品检测中的研究和应用[J].华中农业大学学报,2005,24(S1):25-30. 被引量：26
4彭高辉,王志良.数据挖掘中的数据预处理方法[J].华北水利水电学院学报,2008,29(6):61-63. 被引量：19
5孔锐,张国宣,施泽生,郭立.基于核的K-均值聚类[J].计算机工程,2004,30(11):12-13. 被引量：46
6张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
7谭勇,荣秋生.一个基于DBSCAN聚类算法的实现[J].计算机工程,2004,30(13):119-121. 被引量：7
8荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
9陆小艺,程泽凯,林士敏.用Matlab语言建构贝叶斯分类器[J].微机发展,2004,14(9):33-35. 被引量：4
10程泽凯,林士敏.用Matlab语言实现BNC[J].安徽工业大学学报（自然科学版）,2004,21(4):324-327. 被引量：3

引证文献67

1赵大伟,肖周芳.一种改进的基于密度和样本数量的K-means算法[J].科技信息,2008(28):170-172. 被引量：1
2梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
3徐晓华.高中阶段教育面临的形势与发展策略[J].教育科学论坛,2005(12):57-58.
4吕巍,陈洁.基于K-means算法的中国商业银行零售业务顾客行为细分策略[J].系统工程理论方法应用,2005,14(6):502-505. 被引量：1
5李秀芳,李志成.基于数据挖掘的聚类算法研究[J].计算技术与自动化,2006,25(3):41-45. 被引量：3
6覃拥军,刘先锋.数据挖掘中的聚类分析研究[J].科技咨询导报,2007(16):28-30.
7陈宇.聚类算法研究[J].福建电脑,2007,23(7):27-29. 被引量：1
8周妍,孔晓玲,张然.数据挖掘中聚类算法研究[J].福建电脑,2007,23(8):9-10. 被引量：1
9张望,王辉.个性化服务中的并行K-Means聚类算法[J].微电子学与计算机,2007,24(10):65-67. 被引量：4
10徐克圣,王澜.一种自动获得k值的聚类算法[J].大连交通大学学报,2007,28(4):68-71. 被引量：3

二级引证文献159

1王灿,刘茜茜,田单单,白莉,苗明三,武香香.基于数据挖掘中药治疗中风病用药规律分析[J].辽宁中医药大学学报,2021,23(10):116-120. 被引量：4
2陈峰.基于AHP的家庭经济困难学生评价指标体系研究[J].开封教育学院学报,2013,33(4):58-60. 被引量：2
3吴晓璇,倪志伟,倪丽萍.基于分形维数的聚类融合算法[J].吉林大学学报（工学版）,2012,42(S1):364-367. 被引量：1
4祁巍,李一军,邹鹏.面向人口漂移的贝叶斯多网络客户细分方法[J].预测,2007,26(5):42-47.
5游芳,姜建国,张坤.基于二维属性的高维数据聚类算法研究[J].计算机技术与发展,2009,19(5):111-113. 被引量：2
6史小松,黄勇杰,刘永革.数据挖掘技术中聚类的几种常用方法比较[J].中国科技信息,2009(20):99-100. 被引量：2
7崔志刚.一种改进的混合遗传聚类算法的数据挖掘技术[J].网络安全技术与应用,2010(3):63-65.
8梁建武,田野.一种分布式的K-means聚类算法[J].现代电子技术,2010,33(10):11-14. 被引量：2
9马续补,郭菊娥.基于《知网》语义相似度的企业事实主题诊断研究[J].情报杂志,2010,29(5):54-57. 被引量：1
10顾洪博,张继怀.聚类算法初始聚类中心的优化[J].西安工程大学学报,2010,24(2):222-226. 被引量：7

1胡睿.基于模板的图像内容检索新算法[J].电子技术与软件工程,2014(13):116-120.
2张长胜,孙吉贵,崔妍,杨凤芹.一种基于PSO的分割聚类算法[J].吉林大学学报（工学版）,2008,38(6):1371-1377. 被引量：5
3吴敏君,陈天滋.基于分割聚类技术的R树结点分裂方案[J].计算机应用与软件,2007,24(10):42-43. 被引量：6
4王静雷,厉小润.基于Kmeans和图像熵聚类的热红外目标检测算法[J].机电工程,2012,29(12):1490-1493. 被引量：5
5张诤,王惠文.一种高效的并行频繁集挖掘算法[J].计算机工程,2008,34(11):55-57. 被引量：7
6Norton为MacOSX增加功能[J].电子与金系列工程信息,2002(4):19-19.
7郑细端.Oracle数据挖掘在城市能源计量数据平台的应用[J].计算机与数字工程,2014,42(7):1299-1302. 被引量：2
8谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：101
9谷波,李济洪,刘开瑛.基于COSA算法的中文文本聚类[J].中文信息学报,2007,21(6):65-70. 被引量：9
10梁雄,唐琎,蔡自兴.车载单线激光雷达成像分割及噪声检测算法[J].计算机应用研究,2011,28(5):1975-1977. 被引量：3

电子与信息学报

2005年第4期

浏览历史

内容加载中请稍等...

用于数据挖掘的聚类算法被引量：67

参考文献52

二级参考文献61

共引文献318

同被引文献556

引证文献67

二级引证文献159

相关作者

相关机构

相关主题

浏览历史

用于数据挖掘的聚类算法 被引量：67

参考文献52

二级参考文献61

共引文献318

同被引文献556

引证文献67

二级引证文献159

相关作者

相关机构

相关主题

浏览历史

用于数据挖掘的聚类算法被引量：67