K-Means聚类中序列模式和批量模式的比较研究被引量：5

Research on Comparing the Sequential Learning with Batch Learning for K-Means

下载PDF

导出

摘要数据挖掘中的聚类分析对发现数据中隐含的类别和分布有着重要的应用。传统的K-Means聚类算法在给出簇数目的条件下能够对数据进行较好的聚类,算法采用批量模式进行学习,在每一趟数据扫描结束后更新簇中心。序列模式是另外一种学习方式,它每扫描一条记录就更新簇中心。本文提出并实现了基于序列模式的K-Means算法,并与采用批量模式的K-Means算法进行了比较。 Clustering, in data mining, is useful for discovering groups and identifying interesting distributions underlying in the data. Classical K-Means algorithm can give a good result when given the cluster number. It uses batch mode to adjust the centers of clusters at the end of each epoch. Sequential mode is another method which updates the centers when each record is scanned. In this paper a K-Means algorithm employing sequential mode is proposed, implemented and compared with algorithm employing batch mode.

作者徐君黄亚楼李飞

机构地区南开大学信息技术科学学院

出处《计算机科学》 CSCD 北大核心 2004年第6期156-158,193,共4页 Computer Science

基金教育部重点科学技术研究项目(02038) 天津自然科学基金项目(023600611)资助

关键词数据挖掘聚类序列模式批量模式 K-MEANS算法 Data mining Clustering Sequential mode Batch mode

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Haykin S.Neural Networks:A Comprehensive Foundation,2nd Ed.1999,Prentice-Hall:Upper Sadle River,New Jersey
2An Introduction to Cluster Analysis for Data Mining,2000.http://www,cs.umn.edu/-han/dmclass/
3Baraldi A,Blonda P.A Survey of Fuzzy Clustering Algorithms for Pattern Recognition.Parts I and II.IEEE Trans.on Systems,Man and Cybernetics,1999,29:778-785,786-801
4Krishnapuram R,Keller J M.A Possibilistic Approach to Clustering.IEEE Transactions on Fuzzy Systems,1993,1:98-110
5HahJiawei MichelineKamber著范明译.数据挖掘:概念与技术[M].机械工业出版社,2001..
6李飞,薛彬,黄亚楼.初始中心优化的K-Means聚类算法[J].计算机科学,2002,29(7):94-96. 被引量：44

二级参考文献10

1Bezdek J C, et al. Multiple-Prototype Classifier Design. IEEE Trans Syst Man Cybern, 1998, 24(9):67～79
2Selim S Z. Ismail M A. K-Means-Type Algorithms: A Generalized Convergence Theorem and Characterization of Local Optimality. IEEE Trans Pattern Analysis and Machine Intelligence,1984, PAMI-6(1): 81～87
3Bradley P S, Fayyad U M. Refining Initial Points for K-Means Clustering. Advances in Knowledge Discovery and Data Mining.MIT Press, 1996
4Raymond T. Ng, Han Jiawei. Efficient and Effective Clustering Methods for Spatial Data Mining. In: Proc. of the 20th VLDB Conf. Santiago, Chile, 1994
5Selim S Z,Alsultan K. A Simulated Annealing Algorithms for the Clustering Problem. Pattern Recognition, 1991,24 (10): 1003 ～1008
6杨忠明,黄道,王行愚.基于模拟退火的动态聚类算法[J].控制与决策,1997,12(A00):520-523. 被引量：9
7李茂军,樊韶胜,童调生.单亲遗传算法在模式聚类中的应用[J].模式识别与人工智能,1999,12(1):32-37. 被引量：26
8王涛,沈谦,朱明星,张良震.遗传与C-均值混合算法用于聚类分析[J].模式识别与人工智能,1999,12(1):98-103. 被引量：11
9徐金梧,刘纪文.基于小生境技术的遗传算法[J].模式识别与人工智能,1999,12(1):104-108. 被引量：21
10王实,高文,李锦涛.Web数据挖掘[J].计算机科学,2000,27(4):28-31. 被引量：118

共引文献44

1陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16
2李伟,黄颖.文本聚类算法的比较[J].科技情报开发与经济,2006,16(22):234-236. 被引量：4
3龚静,李英杰.文本聚类算法的分析与比较[J].湖南环境生物职业技术学院学报,2006,12(3):283-286. 被引量：2
4赵锋,薛惠锋,王伟.基于复合形遗传算法的K-means优化聚类方法[J].航空计算技术,2006,36(5):59-61. 被引量：2
5杨昕,彭玉青.结合蚂蚁算法的K-Means聚类分析[J].河北工业大学学报,2007,36(3):48-52. 被引量：2
6朱贵良,赵凯,赵锋.基于组合优化方法的K-means聚类算法实现[J].华北水利水电学院学报,2007,28(5):43-45. 被引量：2
7鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.欧氏距离的加权处理对K-means法聚类效果的改进[J].中国医院统计,2008,15(1):9-12. 被引量：1
8邱苏林,王丽珍.基于Ward’s方法的k-平均优化算法及其应用[J].计算机工程与应用,2008,44(31):169-172. 被引量：7
9鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.各组内变异程度悬殊时传统K-means法的局限性及其改进[J].中国卫生统计,2009,26(1):18-21.
10于水英,丁华福,付志超.基于遗传算法和模糊聚类的文本分类研究[J].计算机技术与发展,2009,19(4):131-133. 被引量：6

同被引文献34

1王燕.一种改进的K-means聚类算法[J].计算机应用与软件,2004,21(10):122-123. 被引量：9
2文俊浩,胡显芝,何光辉,徐玲.小波在数据挖掘算法中的运用[J].重庆大学学报（自然科学版）,2004,27(12):111-115. 被引量：1
3袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
4袁雪庚,顾耀林.自动色彩均衡快速算法[J].计算机辅助设计与图形学学报,2005,17(10):2269-2274. 被引量：11
5杨峰,周宁,吴佳鑫.基于信息可视化技术的文本聚类方法研究[J].情报学报,2005,24(6):679-683. 被引量：18
6李培强,李欣然,陈辉华,唐外文.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78. 被引量：131
7赵国富,曲国庆.聚类分析中CLARA算法的分析与实现[J].山东理工大学学报（自然科学版）,2006,20(2):45-48. 被引量：9
8王轶,达新宇.分布式并行数据挖掘计算框架及其算法研究[J].微电子学与计算机,2006,23(9):223-225. 被引量：10
9段利国,李爱萍,曹啸.基于小波聚类的数据集简化算法研究[J].太原理工大学学报,2006,37(5):532-535. 被引量：3
10曾梦好.分类用户峰谷电价研究[D].2006:40.

引证文献5

1张素香,刘建明,赵丙镇,曹津平.基于云计算的居民用电行为分析模型研究[J].电网技术,2013,37(6):1542-1546. 被引量：133
2尹积栋,谢茶花,彭崧,刘红,曾昭虎.基于句法结构分析的中文文本聚类方法研究[J].计算机与数字工程,2018,46(5):933-935. 被引量：6
3吴明祥,于瓅.基于K-means图像深度聚类的自适应Retinex算法[J].电脑知识与技术,2020,16(28):29-33.
4亢娟娜,王淏.小波聚类算法的分析与研究[J].中国包装工业,2014,22(3X):85-86.
5Lin Liu.Cluster Analysis of Electrical Behavior[J].Journal of Computer and Communications,2015,3(5):88-93.

二级引证文献139

1姚栋方,吴瀛,罗磊,阎帅,武文广,丁宏.基于深度学习的短期电力负荷预测[J].国外电子测量技术,2020,39(1):44-48. 被引量：15
2王保义,赵硕,张少敏.基于云计算和极限学习机的分布式电力负荷预测算法[J].电网技术,2014,38(2):526-531. 被引量：76
3李青,齐林海,田璐,王红,田世明,卜凡鹏.一种融合降维和聚类的电力用户高效分类方法[J].电力信息与通信技术,2018,16(11):12-18. 被引量：4
4张中超,叶伟灵.基于用电行为习惯的家庭节能用电策略研究[J].电气应用,2019,38(2):91-96. 被引量：1
5杜乾,邓帅,王嗣常.计及温度区间的电网负荷典型日筛选方法研究[J].安徽电力,2017,34(4):27-30. 被引量：1
6王春雷,梁小放,章坚民,张远扬.基于用电采集系统的负荷特性曲线聚类分析[J].浙江电力,2014,33(7):6-10. 被引量：7
7赵莉,候兴哲,胡君,傅宏,孙洪亮.基于改进k-means算法的海量智能用电数据分析[J].电网技术,2014,38(10):2715-2720. 被引量：125
8李明,林彬,李作明.基于云平台的电力工程项目管理系统的设计与实现[J].科技管理研究,2014,34(23):162-166. 被引量：10
9赵腾,张焰,张东霞.智能配电网大数据应用技术与前景分析[J].电网技术,2014,38(12):3305-3312. 被引量：178
10马瑞,周谢,彭舟,刘道新,徐慧明,王军,王熙亮.考虑气温因素的负荷特性统计指标关联特征数据挖掘[J].中国电机工程学报,2015,35(1):43-51. 被引量：67

1常雨芳,周志锋,付建强.基于数据验证的诊断技术在FPGA中的应用[J].可编程控制器与工厂自动化（PLC FA）,2006(2):89-91.
2董付国,王平勤.分治法在中值滤波快速算法中的应用研究[J].电脑开发与应用,2007,20(6):42-43. 被引量：4
3吴冬妮,唐型基,杨建菊.关联规则Apriori算法在入侵检测中的应用分析[J].凯里学院学报,2011,29(6):112-113. 被引量：1
4周兴斌,迟殿委.一种Apriori算法的改进[J].南昌大学学报（工科版）,2008,30(2):184-187. 被引量：3
5赛弗莱电子贸易（上海）有限公司：掌上型BT扫描器1660[J].现代制造,2009(17):60-60.
6恩里克·杰姆斯,王庄林.文体用品产业3D技术动向与发展趋势(上)[J].文体用品与科技,2015,0(19):20-23.
7胡奇.益智小游戏设计与开发[J].消费电子,2014(12):178-178.
8diTTo胶片扫描仪[J].世界广播电视,2006,20(6):100-100.
9龚福秀.测井数据格式转换系统的开发[J].江汉石油科技,2006,16(1):65-68. 被引量：3
10杨立波.基于聚类的关联规则挖掘算法[J].太原大学学报,2011,12(3):113-116. 被引量：3

计算机科学

2004年第6期

浏览历史

内容加载中请稍等...

K-Means聚类中序列模式和批量模式的比较研究被引量：5

参考文献6

二级参考文献10

共引文献44

同被引文献34

引证文献5

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

K-Means聚类中序列模式和批量模式的比较研究 被引量：5

参考文献6

二级参考文献10

共引文献44

同被引文献34

引证文献5

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

K-Means聚类中序列模式和批量模式的比较研究被引量：5