基于混合差分进化的滑动窗口数据流聚类算法研究被引量：2

Research on sliding window data stream clustering algorithm based on hybrid differential evolution

下载PDF

导出

摘要针对传统的基于滑动窗口的数据流聚类算法存在的算法执行效率低、聚类质量较差等缺点,提出了一种基于混合差分进化的滑动窗口数据流聚类算法。该算法将数据流聚类过程分为两个部分:在线的时序窗口数据信息微簇特征向量生成和离线阶段的聚类优化。对在线生成的微簇进行微簇集合的更新与维护,利用改进的粒子群算法对离线的微簇数据信息进行适应度值的计算,将种群分为优势子种群和普通子种群,然后利用个体适应度值和平均适应度值的判别来生成当前个体环境的最优候选解,并迭代地对个体进行进化,输出具有最优适应度值的聚类集合,完成对数据流的聚类。仿真实验结果表明,算法在对数据流执行聚类时具有较高的执行效率,并且最后聚类的质量较好,算法实用性强。 In order to improve the execution efficiency and clustering quality of data stream clustering algorithm based on the sliding window, this paper presented a new a sliding window data stream clustering algorithm based on hybrid differential evolu- tion. First,it divided data stream clustering process into two parts that were micro-clusters eigenvector of online timing-window and the offline clustering optimization, thus to update and maintenance the collection of micro-clusters which were generated online. Second, it calculated fitness value of offline micro-cluster data by using the improved particle swarm optimization and divided the population into the advantaged sub-population and the normal one. Then generated individual environment optimal candidate solutions by using individual and average fitness value of the discriminant. Finally, it performed iteration of individual evolution and output the optimal fitness value clustering collection.

作者任永功胡志冬杨雪

机构地区辽宁师范大学计算机与信息技术学院

出处《计算机应用研究》 CSCD 北大核心 2014年第4期1009-1012,共4页 Application Research of Computers

基金国家自然科学基金资助项目(60603047) 国家教育部留学回国人员科研启动基金资助项目辽宁省计划项目(2012232001) 辽宁省自然科学基金资助项目(201202119)

关键词混合差分进化滑动窗口数据流聚类 hybrid differential evolution sliding window data flow clustering

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1孙玉芬,卢炎生.流数据挖掘综述[J].计算机科学,2007,34(1):1-5. 被引量：36
2AGGARWAL C C,HAN Jia-wei,WANG Jian-yong,et al. A frameworkfor clustering evolving data streams [C] //Proc of the 29th Internatio-nal Conference on Very Large Data Bases. [S. 1. .] : VLDB Endow-ment, 2003 :81-92.
3张忠平,王浩,薛伟,夏炎.动态滑动窗口的数据流聚类方法[J].计算机工程与应用,2011,47(7):135-138. 被引量：19
4肖裕权,周肆清.基于粒子群优化算法的数据流聚类算法[J].计算机技术与发展,2011,21(10):43-46. 被引量：6
5常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：61
6吴学雁,黄道平.基于形态特征的数据流聚类方法研究[J].计算机工程,2011,37(13):46-48. 被引量：3
7陈荣晖,王伦文.一种新的滑动窗口模型数据流聚类方法[J].小型微型计算机系统,2010,31(12):2355-2358. 被引量：7
8朱琳,刘晓东,朱参世.基于衰减滑动窗口数据流聚类算法研究[J].计算机工程与设计,2012,33(7):2659-2662. 被引量：6
9陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
10黄泽霞,俞攸红,黄德才.惯性权自适应调整的量子粒子群优化算法[J].上海交通大学学报,2012,46(2):228-232. 被引量：75

二级参考文献130

1金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
2张选平,杜玉平,秦国强,覃征.一种动态改变惯性权的自适应粒子群算法[J].西安交通大学学报,2005,39(10):1039-1042. 被引量：138
3陈贵敏,贾建援,韩琪.粒子群优化算法的惯性权值递减策略研究[J].西安交通大学学报,2006,40(1):53-56. 被引量：309
4朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报,2006,17(3):379-387. 被引量：51
5孙玉芬,卢炎生.流数据挖掘综述[J].计算机科学,2007,34(1):1-5. 被引量：36
6常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：61
7刘青宝,戴超凡,邓苏,张维明.基于网格的数据流聚类算法[J].计算机科学,2007,34(3):159-161. 被引量：10
8杨春宇,周杰.一种混合属性数据流聚类算法[J].计算机学报,2007,30(8):1364-1371. 被引量：22
9KENNDEY J, EBERHART R. Panicle swarm optimization [ C]// Proceedings of 1995 IEEE International Conference on Neural Networks. New Jersey: IEEE Press, 1995:1942-1948.
10EBERHART R. Empirical study of particle swarm optimization [ C]//Proceedings of 1999 IEEE International Conference on Evolutionary Computation. Washington, DC: IEEE Press, 1999:1945-1950.

共引文献203

1孙斌,周杭霞,於可广.基于遗传算法的多孔介质热物性参数的辨识方法[J].中国计量学院学报,2011,22(1):54-58. 被引量：2
2谭晓光.数据仓库技术在天气预报决策中的应用探讨[J].应用气象学报,2006,17(3):325-332. 被引量：9
3崔贯勋,朱庆生.一种改进的基于密度的离群数据挖掘算法[J].计算机应用,2007,27(3):559-560. 被引量：8
4宋殿霞,王艳,邹光辉.空间数据挖掘聚类算法研究[J].滨州学院学报,2006,22(6):43-48.
5陈燕.对两个经典聚类算法的分析[J].现代电子技术,2007,30(17):174-176. 被引量：1
6黄孝.数据流聚类算法分析[J].池州学院学报,2007,21(5):11-13. 被引量：1
7尹志武,黄上腾.一种自适应局部概念漂移的数据流分类算法[J].计算机科学,2008,35(2):138-139. 被引量：8
8胡彧,闫巧梅.滑动窗口模型下的优化数据流聚类算法[J].计算机应用,2008,28(6):1414-1416. 被引量：6
9胡彧,闫巧梅.基于滑动窗口的流数据聚类算法研究[J].计算机工程与设计,2008,29(21):5621-5623. 被引量：4
10张天成,岳德君,于戈,林树宽,谷峪.数据流挖掘研究及其进展[J].小型微型计算机系统,2008,29(12):2241-2246. 被引量：5

同被引文献18

1王伟平,李建中,张冬冬,郭龙江.基于滑动窗口的数据流连续J-A查询的处理方法[J].软件学报,2006,17(4):740-749. 被引量：18
2常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：61
3许宁,张毅坤.基于正交分层聚类算法软件可靠性模型的预测分析[J].计算机应用,2007,27(3):635-637. 被引量：6
4GALLUCCIO L,MICHEL 0,COMON P,et al. Cluste-ring with a new distance measure based on a dual-rootedtree[ J]. Information Sciences, 2013(251 ) : 96-113.
5KARABOGA D,OZTURK C. A novel clustering ap-proach :Artificial Bee Colony ( ABC) algorithm[ J]. Ap-plied Soft Computing, 2011,11 (1) : 652-657.
6LEE J, LEE D. An Improved Cluster Labeling Method forSupport Vector Clustering[ J] . IEEE Transactions on pat-tern analysis and machine intelligence, 2005 , 27 ( 3 ):461464.
7FU L,NIU B,ZHU Z, et al. CD-HIT: accelerated forclustering the next-generation sequencing data [ J ]. Bioin-formatics, 2012, 28(23) : 3150-3152.
8TIAN Zheng, LI Xiaobin, JU Yanwei. Disturbing Analy-sis on Spectrum Clustering[ J]. Science in China: SeriesE, 2007,37(4) : 527-543.
9JAIN A K. Data clustering : 50 years beyond K-means [ J ].Pattern Recognition Letters, 2010, 31(8) : 651-666.
10DOMINGOS P. Prospects and challenges for multi-rela-tional data mining[J]. ACM SIGKDD Explorations News-letter, 2003,5(1) : 80-83.

引证文献2

1曾令伟,伍振兴,杜文才.基于改进自监督学习群体智能(ISLCI)的高性能聚类算法[J].重庆邮电大学学报（自然科学版）,2016,28(1):131-137. 被引量：7
2李晓明,顾钰培,张俊涛.一种滑动窗口的GPS轨迹点地图匹配算法[J].西安工业大学学报,2017,37(6):459-462. 被引量：1

二级引证文献8

1刘建峰,吕佳.非对称稀疏图的半监督学习研究[J].重庆师范大学学报（自然科学版）,2017,34(2):76-80.
2卞则康,王士同.基于混合距离学习的鲁棒的模糊C均值聚类算法[J].智能系统学报,2017,12(4):450-458. 被引量：6
3蒋亦樟,朱丽,刘丽,王士同.多视角模糊双加权可能性聚类算法[J].智能系统学报,2017,12(6):806-815. 被引量：3
4闵帆,王宏杰,刘福伦,王轩.SUCE:基于聚类集成的半监督二分类方法[J].智能系统学报,2018,13(6):974-980. 被引量：4
5谢非凡,张世涛,黄威.BP神经网络滑动窗口算法在活跃火时空预测模型研究与实现[J].计算机时代,2023(9):124-128.
6古险峰,汤永利.基于群体智能算法的混合属性大数据聚类仿真[J].计算机仿真,2023,40(9):458-461. 被引量：1
7曾子文,袁操.基于图神经网络的个性化食谱推荐算法[J].武汉轻工大学学报,2024,43(3):82-89.
8王豪,凌基伟,陈昊,黄志勇,王岫鑫.基于改进非洲秃鹫优化算法的脑MRI图像分割[J].重庆邮电大学学报（自然科学版）,2024,36(4):687-696.

1张英杰,龚中汉.基于阈值统计学习的差分进化引力搜索算法[J].计算机研究与发展,2014,51(10):2187-2194. 被引量：6
2王钧炎,黄德先.基于混合差分进化算法的软测量时延参数估计[J].化工学报,2008,59(8):2058-2064. 被引量：12
3冯新营,计华,张化祥.基于聚类优化的RBF神经网络多标记学习算法[J].山东大学学报（理学版）,2012,47(5):63-67. 被引量：2
4胡先兵,赵国庆.引入时频聚集交叉项干扰抑制的大数据聚类算法[J].计算机科学,2016,43(4):197-201. 被引量：4
5王海燕,赵燕伟,张景玲,史文浩,张立萍.基于混合差分进化的混排Flow-shop分批优化调度[J].计算机集成制造系统,2013,19(7):1613-1625. 被引量：7
6罗中良,易明珠,刘小勇.最优化问题的蚁群混合差分进化算法研究[J].中山大学学报（自然科学版）,2008,47(3):33-36. 被引量：11
7张超,吴小培,吕钊.基于独立分量分析的运动目标检测算法中对通道数选择和观测向量生成方式的实验和分析[J].电子与信息学报,2015,37(1):137-142. 被引量：3
8曹晓霞.基于聚类优化的模糊OLAP查询技术研究[J].杭州电子科技大学学报（自然科学版）,2013,33(1):48-51.
9付杰,王沛,何艳.基于Sobel边缘检测与K-L变换的高效SIFT算法[J].电视技术,2013,37(9):26-29. 被引量：6
10徐小良,陈金奎,吴优.基于聚类优化的Web服务发现方法[J].计算机工程,2011,37(9):68-70. 被引量：9

计算机应用研究

2014年第4期

浏览历史

内容加载中请稍等...

基于混合差分进化的滑动窗口数据流聚类算法研究被引量：2

参考文献12

二级参考文献130

共引文献203

同被引文献18

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于混合差分进化的滑动窗口数据流聚类算法研究 被引量：2

参考文献12

二级参考文献130

共引文献203

同被引文献18

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于混合差分进化的滑动窗口数据流聚类算法研究被引量：2