时间序列下超大规模数据流聚类方法研究被引量：1

Research on Method of Super-large Scale Data Flow Clustering in Time Series

下载PDF

导出

摘要研究超大规模数据流聚类效率优化问题。时间序列下的数据流中元素的访问是单次线性的,即数据元素只能按其流入顺序依次读取一次。传统的方法对时间序列数据流聚类时,只是在方向上按照时间序列数据流元素的顺序进行聚类,效率较低。提出了基于微簇距离加权和属性信息贡献度的时序数据流聚类算法。在该算法中,首先以时间滑块窗口为时间单位对数据流数据进行实时获取,在线阶段对其数据流信息进行微簇的实时生成,并根据微簇的更新和删除对微簇集合进行维护;然后在离线阶段对微簇样本数据集合,依据样本数据的属性信息贡献度及其与样本类别的距离加权,对微簇进行实时聚类。实验证明,改进算法具有较高的执行效率,较高的吞吐量,并有效的降低了内存负载。 The efficiency optimization problem of super large scale data flow clustering was studied in this pa per. This paper proposed a time series data flow clustering algorithm based on micro cluster distance weighting and the degree of attribute information contribution. In the algorithm, first of all, the time slider window was looked as the unit of time to obtain the data flow in real time. In online phase, the data flow information was generated to mi cro cluster in real time. And according to the update and deletion of micro cluster, micro cluster set was main tained. Then, in the offiine phase, micro cluster sample data were collected. Based on the attribute information con tribution degree of sample data and its distance weighting with the sample category, real time clustering for micro clusters wer carried out. Experiment proves that the improved algorithm has higher execution efficiency, higher throughput, and effectively reduces the memory load.

作者张翼飞魏现辉

机构地区河南城建学院计算机科学与工程学院

出处《计算机仿真》 CSCD 北大核心 2014年第4期273-276,共4页 Computer Simulation

关键词数据流聚类微簇距离加权属性信息贡献度滑动窗口 Data flow Clustering Micro cluster Distance weighting Attribute information contribution degree Sliding window

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1于亚飞,周爱武.一种改进的DBSCAN密度算法[J].计算机技术与发展,2011,21(2):30-33. 被引量：35
2李娜,邢长征.时间滑动窗口内基于密度的数据流聚类算法[J].计算机应用,2011,31(5):1363-1366. 被引量：5
3胡睿,林昭文,柯宏力,马严.一种基于密度和滑动窗口的数据流聚类算法[J].计算机科学,2011,38(5):145-148. 被引量：12
4何成剑,洪汉玉,张天序,易新建.基于双重规整化的气动退化图像盲复原算法[J].红外与激光工程,2007,36(2):236-239. 被引量：5
5孙玉芬,卢炎生.流数据挖掘综述[J].计算机科学,2007,34(1):1-5. 被引量：36
6胡光波,梁红,徐骞.舰船辐射噪声混沌特征提取方法研究[J].计算机仿真,2011,28(2):22-24. 被引量：19
7李丽莉,章卫国,刘小雄,章萌.基于混沌差分进化FCM算法的舵回路故障诊断[J].测控技术,2009,28(5):90-93. 被引量：9
8张忠平,王浩,薛伟,夏炎.动态滑动窗口的数据流聚类方法[J].计算机工程与应用,2011,47(7):135-138. 被引量：19

二级参考文献96

1洪汉玉,张天序.基于多分辨率盲目去卷积的气动光学效应退化图像复原算法[J].计算机学报,2004,27(7):952-963. 被引量：22
2金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
3洪汉玉,张天序,余国亮.航天湍流退化图像的极大似然估计规整化复原算法[J].红外与毫米波学报,2005,24(2):130-134. 被引量：24
4XUZhi-gao,GUANZheng-xi,MAJing.Steady Fault Characteristic Analysis of a Missile Power System Based on a Differential Evolution Algorithm[J].International Journal of Plant Engineering and Management,2005,10(2):95-99. 被引量：3
5孙玉芬,卢炎生.流数据挖掘综述[J].计算机科学,2007,34(1):1-5. 被引量：36
6常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：61
7任兴平,何忠龙,孟增辉.改进DBSCAN算法中参数Eps值的确定[J].现代电子技术,2007,30(11):120-121. 被引量：5
8周艳平,顾幸生.差分进化算法研究进展[J].化工自动化及仪表,2007,34(3):1-6. 被引量：72
9刘波,王凌,金以慧.差分进化算法研究进展[J].控制与决策,2007,22(7):721-729. 被引量：291
10Storn R, Price K. Differential evolution- a simple and efficient adaptive scheme for global optimization over continuous spaces [ J ]. Technical Report International Computer Science Institute, 1995 ( 8 ) :22 - 25.

共引文献121

1钱志勤,王志鹏,曹群,刘长利.基于差分进化的信息融合故障诊断方法[J].振动．测试与诊断,2013,33(S2):137-143. 被引量：3
2尹志武,黄上腾.一种自适应局部概念漂移的数据流分类算法[J].计算机科学,2008,35(2):138-139. 被引量：8
3胡彧,闫巧梅.滑动窗口模型下的优化数据流聚类算法[J].计算机应用,2008,28(6):1414-1416. 被引量：6
4付长军,许东,赵剡.湍流退化图像的最大熵盲目复原方法[J].红外与激光工程,2008,37(3):542-546. 被引量：6
5黄超,龚惠群.时间序列数据流直方图构造方法研究[J].统计与决策,2009,25(4):24-25.
6王立锟,王君.流数据聚类中多属性的计算[J].重庆工学院学报（自然科学版）,2009,23(6):90-92.
7邹凌君,高开周.基于Web Service的多数据流聚类研究[J].广西轻工业,2009,25(11):85-87. 被引量：1
8仵雪婷,周明建.数据流挖掘方法研究[J].计算机与现代化,2010(4):46-50. 被引量：1
9顾伟,李丽莉,黄志毅,章卫国.飞机操纵面故障的模糊差分进化识别方法[J].计算机应用研究,2010,27(5):1782-1784. 被引量：2
10刘慧婷,倪志伟.经验模态分解在数据流概要生成中的应用[J].计算机工程与应用,2010,46(22):6-8.

同被引文献9

1蒋青,蒋毅,张浩.一种公网集群系统的资源预留和接纳控制策略[J].无线电通信技术,2014,40(1):1-4. 被引量：1
2赵季红,韩海芳,曲桦.LTE-Advanced中继系统基于资源共享的呼叫接纳控制方法[J].电信科学,2014,30(2):60-64. 被引量：3
3吴润泽,吕文涛,唐良瑞.复杂大电网下基于分层PCE的跨域分离通信路径建立机制[J].现代电力,2014,31(2):89-94. 被引量：1
4周本海.基于预留的信息物理融合系统动态内存分配方法研究[J].科学技术与工程,2014,22(13):57-61. 被引量：2
5吴以凡,张桦,戴国骏.面向多处理器资源预留的实时程序划分方法[J].电子学报,2014,42(4):717-722. 被引量：3
6梁洪泉,吴巍.增强RSVP-TE协议下的可信连接建立方法[J].计算机工程与科学,2015,37(8):1479-1485. 被引量：2
7林涵仙,陈世平.基于优先级的智慧道路无线网络资源预留模型[J].计算机工程,2016,42(4):276-281. 被引量：1
8王海娟.图书馆闭架书库控制系统的研究与实现[J].现代电子技术,2016,39(13):116-120. 被引量：2
9文静,李陶深,黄汝维.IaaS下基于预测的弹性云服务的研究[J].系统工程理论与实践,2014,34(S1):263-268. 被引量：5

引证文献1

1解敏.图书馆电子资源利用率均衡调度优化研究仿真[J].计算机仿真,2017,34(3):353-356. 被引量：2

二级引证文献2

1张牧宁,劉建宏.海量电子图书信息资源利用率均衡调度方法[J].科学技术与工程,2019,19(22):223-228. 被引量：2
2侯剑,张光勇.基于云计算的海量碎片资源动态调度仿真[J].计算机仿真,2020,37(1):360-364. 被引量：4

1张宗山.高帧率摄像机如何高“帧”无忧[J].A&S（安防工程商）,2014(3):46-46.
2第一体验第四代酷睿处理器 i7 4770K强芯来袭[J].数字时代,2013(7):70-71.
3曾志聪,姚国祥.基于Web使用挖掘的个性化系统[J].计算机工程与设计,2006,27(7):1155-1157. 被引量：5
4王铭坤,袁少光,朱永利,王德文.基于Storm的海量数据实时聚类[J].计算机应用,2014,34(11):3078-3081. 被引量：30
5小杰.你会设置暴风影音跳过片尾功能吗[J].网友世界,2009(3):119-119.
6周勇,王尤慧,程春田.Online-HHT方法在时间序列数据流预测中的应用[J].计算机工程与应用,2011,47(3):142-145. 被引量：1
7郭兆麟,周军.一种新的Web用户会话实时聚类算法[J].计算机工程与应用,2010,46(35):142-144. 被引量：1
8华为：模块化数据中心建设[J].网络运维与管理,2015,0(1):36-36.
9王凯丽.一种基于集合的Web用户会话实时聚类算法[J].价值工程,2010,29(13):182-183. 被引量：1
10张成叔.关于数据挖掘取样方式的若干分析[J].赤峰学院学报（自然科学版）,2014,30(9):10-11. 被引量：3

计算机仿真

2014年第4期

浏览历史

内容加载中请稍等...

时间序列下超大规模数据流聚类方法研究被引量：1

参考文献8

二级参考文献96

共引文献121

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

时间序列下超大规模数据流聚类方法研究 被引量：1

参考文献8

二级参考文献96

共引文献121

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

时间序列下超大规模数据流聚类方法研究被引量：1