数据流历史数据的存储与聚集查询处理算法被引量：17

Algorithms for Storing and Aggregating Historical Streaming Data

下载PDF

导出

摘要目前数据流的研究成果主要集中在分析处理存储于内存中的最近一段时间内的数据流数据,忽略了对数据流历史数据的分析处理与存储管理.提出了一种数据流历史数据的存储管理及聚集查询处理方法,通过对历史数据实施多层递阶抽样存储,并在内存中建立存储数据流历史数据聚集值的HDS-Tree索引,实现对无限数据流历史数据的存储管理,有效地支持各种聚集查询.同时,还给出了基于HDS-Tree的聚集查询算法的时间复杂性分析和查询误差分析.理论分析与实验结果表明,该方法可以有效地用于数据流历史数据的存储与分析.目前数据流的研究成果主要集中在分析处理存储于内存中的最近一段时间内的数据流数据,忽略了对数据流历史数据的分析处理与存储管理.提出了一种数据流历史数据的存储管理及聚集查询处理方法,通过对历史数据实施多层递阶抽样存储,并在内存中建立存储数据流历史数据聚集值的HDS-Tree索引,实现对无限数据流历史数据的存储管理,有效地支持各种聚集查询.同时,还给出了基于HDS-Tree的聚集查询算法的时间复杂性分析和查询误差分析.理论分析与实验结果表明,该方法可以有效地用于数据流历史数据的存储与分析. The current research work over data streams is mainly focused on dealing with the arrival of recent data in memory, neglecting the analysis and management of historical streaming data. An approach is proposed to store and query historical streaming data by using multi-layer recursive sampling method and HDS-Tree structure, which indexes the aggregation of historical streaming data and supports all kinds of aggregation queries over historical streaming data. The time-complexity and the error of aggregation algorithms are also analyzed based on HDS-Tree. The analytical and experimental results show that the approach can be effectively used to store and analyze the historical streaming data.

作者张冬冬李建中王伟平郭龙江

机构地区哈尔滨工业大学计算机科学与技术学院

出处《软件学报》 EI CSCD 北大核心 2005年第12期2089-2098,共10页 Journal of Software

基金国家自然科学基金国家高技术研究发展计划(863) 国家重点基础研究发展规划(973) 黑龙江省自然科学基金~~

关键词数据流历史数据聚集算法 HDS—Tree data streams historical data aggregation algorithm HDS-Tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1Babcock AK, Babu S, Datar M. Model and issues in data stream systems. In: Popa L, ed. Proc. of the 21st ACM SIGACT-SIGMOD-SIGART Symp. on Principles of Database Systems Madison: ACM, 2002. 1-16.
2Golab L, Ozsu MT. Issues in data stream management. SIGMOD Record, 2003,32(2)5-14.
3Araru A, Babu S, Widom J. An abstract semantics and concrete language for continuous queries over streams and relations.Technical Report, Stanford University Database Group, 2002.Available at http://dbpubs.stanford.edu/pub/2002-57
4Guha S, Koudas N. Approximating a data stream for querying and estimation: Algorithms and performance evaluation. In: Stefano C, Christoph F, Pat S, eds. Proc. of the 18th Int'l Conf. on Data Engineering San Jose: IEEE Computer Society, 2002. 567-576.
5Madden S, Shah M, Hellerstein JM, Raman V. Continuously adaptive continuous queries over streams. In: Franklin MJ, Moon B,Ailamaki A, eds. Proc. of the 2002 ACM SIGMOD Int'l Conf. on Management of Data Madison: ACM, 2002.49-60.
6Gehrke J, Korn F, Srivastava D. On computing correlated aggregates over continual data streams. In: Afef WG, ed. Proc. of the2001 ACM SIGMOD Int'l Conf. on Management of Data Santa Barbara: ACM, 2001. 13-24.
7Dobra A, Gehrke J, Garofalakis M, Rastogi R. Processing complex aggregate queries over data streams. In: Franklin MJ, Moon B,Ailamaki A, eds. Proc. of the 2002 ACM SIGMOD Int'l Conf. on Management of Data Madison: ACM, 2002. 61-72.
8Chen Y, Dong G, Han J, Wah BW, Wang J. Multi-Dimensional regression analysis of time-series data streams. In: Bernstein PA,Loannidis YE, Ramakrishnan R, eds. Proc. of the 28th Int'l Conf. on Very Large Data Bases Hong Kong: Morgan Kaufmann Publishers, 2002. 323-334.
9Zhang D, Gunopulos D, Tsotras V J, Seeger B. Temporal aggregation over data streams using multiple granularities. In: Jensen CS,Jeffery KG, eds. Proc. of the 8th Int'l Conf. on Extending Database Technology LNCS, 2002. 646-663.
10Olken F. Random Sampling from Databases [Ph.D. Thesis]. Berkeley, University of California, 1993.

同被引文献169

1王永利,徐宏炳,董逸生,钱江波,刘学军.配电自动化的数据流管理系统设计[J].电力系统自动化,2004,18(13):85-89. 被引量：13
2金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
3郭龙江,李建中,王伟平,张冬冬.数据流上的连续预测聚集查询[J].计算机研究与发展,2004,41(10):1690-1695. 被引量：4
4宋国杰,唐世渭,杨冬青,王腾蛟.数据流中异常模式的提取与趋势监测[J].计算机研究与发展,2004,41(10):1754-1759. 被引量：19
5李再进,谢勇,邬方,王红卫.物联网中PML服务器的设计和实现[J].物流技术,2004,23(11):80-82. 被引量：7
6刘建伟,乐嘉锦.流数据管理系统[J].计算机应用与软件,2005,22(8):1-3. 被引量：1
7陈明,杨广文,刘学铮,史树明,王鼎兴.面向点对点的安全可靠存储系统[J].软件学报,2005,16(10):1790-1797. 被引量：4
8王伟平,李建中,张冬冬,郭龙江.基于滑动窗口的数据流连续J-A查询的处理方法[J].软件学报,2006,17(4):740-749. 被引量：18
9吴今培,邹平.时间序列的稳健分析[J].长沙铁道学院学报,1990,8(1):1-13. 被引量：2
10赵凤展,杨仁刚.基于S变换和时域分析的电能质量扰动识别[J].电网技术,2006,30(15):90-94. 被引量：38

引证文献17

1刘青宝,金燕,侯东风,张维明.数据流层次窗口模型及聚集查询算法[J].计算机科学,2007,34(5):194-196. 被引量：3
2张育,沈鸿.基于Multi-Bloom Filters的数据流聚集查询[J].计算机工程,2009,35(5):28-30. 被引量：2
3孔英会,吕云洁,吕云清.改进的基于移动小波树的数据流异常检测方法[J].华北电力大学学报（自然科学版）,2009,36(4):67-72. 被引量：2
4金鑫,甘亮,周雄.一种大时间窗口StreamCube体系结构[J].武汉理工大学学报,2009,31(18):112-116.
5韩矞,贾焰,甘亮.一种基于网络安全数据流的混合CUBE模型[J].信息网络安全,2009(10):52-53. 被引量：1
6侯东风,刘青宝,张维明,邓苏.一种适应性的流式数据聚集计算方法[J].计算机科学,2010,37(3):152-155. 被引量：6
7檀宝权,刘奇志,王云汉.基于BD结构的历史数据流存储与查询[J].计算机应用与软件,2011,28(2):76-79. 被引量：2
8王立,乐嘉锦.基于度量波动时间框架的流立方体研究[J].计算机应用与软件,2011,28(3):169-172. 被引量：1
9亓开元,韩燕波,赵卓峰,房俊.支持高并发数据流处理的MapReduce中间结果缓存[J].计算机研究与发展,2013,50(1):111-121. 被引量：21
10李廷力,李宏宇,田野,延志伟,沈烁,毛伟.物联网存储模式与方案研究[J].计算机应用研究,2013,30(11):3201-3208. 被引量：9

二级引证文献63

1张冠豫,汤吕.多源异构数据存储模型在业务监控中的研究及应用[J].区域治理,2018,0(45):130-131.
2侯东风,刘青宝,张维明,邓苏.一种适应性的流式数据聚集计算方法[J].计算机科学,2010,37(3):152-155. 被引量：6
3安俊秀.基于服务器集群的云检索系统的研究与示范[J].计算机科学,2010,37(7):179-182. 被引量：7
4刘威,郭渊博,黄鹏.基于多维布隆过滤器的模式匹配引擎[J].计算机应用,2011,31(1):107-109. 被引量：8
5刘青宝,侯东风.基于查询索引树的多维连续查询计算方法[J].信息工程大学学报,2012,13(1):100-104. 被引量：1
6张毅,文俊浩,陈义.自治组件架构在存储业务仿真测试中的应用[J].计算机科学,2012,39(8):164-168. 被引量：1
7卢鑫,徐武.载舰环境仿真方法研究[J].舰船电子工程,2013,33(2):17-18.
8燕发文,黄敏,王中飞.基于BF算法的网络异常流量行为检测[J].计算机工程,2013,39(7):165-168. 被引量：12
9林佳华,任伟,贾磊雷.Android手机隐私保护系统的设计与实现[J].信息网络安全,2013(7):16-19. 被引量：8
10何渝蔺.基于知识管理的专家系统的研究[J].重庆航天职业技术学院学报,2013(3):31-34.

1葛君伟,公丕强,刘兆宏.一种存储和索引历史数据流数据的方法[J].计算机应用研究,2007,24(6):104-106. 被引量：2
2徐小平,王峰,胡钢.系统辨识研究的现状[J].现代电子技术,2007,30(15):112-116. 被引量：22
3刘亮,秦小麟,李博涵,刘宇雷.鲁棒的无线传感器网络空间范围聚集查询处理算法[J].电子学报,2012,40(7):1465-1470. 被引量：2
4杨慧松.多层递阶式的场景视觉监控系统[J].A&S（安防工程商）,2014(8):82-85.
5杜阿宁,程晓明.网络流量分析中的频繁项监测技术研究[J].通信学报,2006,27(2):9-15. 被引量：3
6张成叔.关于数据挖掘取样方式的若干分析[J].赤峰学院学报（自然科学版）,2014,30(9):10-11. 被引量：3
7许颖梅.基于数据流频繁模式挖掘的入侵检测模型[J].陕西理工学院学报（自然科学版）,2011,27(4):24-29.
8桂浩,冯玉才,李又奎.面向流数据的数据管理系统的研究[J].计算机应用研究,2005,22(1):88-90. 被引量：6
9董雷刚,刘国华,崔晓微,张东明.一种求解动态数据集中k-支配轮廓的算法[J].小型微型计算机系统,2009,30(4):617-622. 被引量：1
10葛如海,管军,虞小波,石存杰.车辆姿态感知与运动状态预测技术[J].计算机与现代化,2013(8):38-42. 被引量：7

软件学报

2005年第12期

浏览历史

内容加载中请稍等...

数据流历史数据的存储与聚集查询处理算法被引量：17

参考文献12

同被引文献169

引证文献17

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

数据流历史数据的存储与聚集查询处理算法 被引量：17

参考文献12

同被引文献169

引证文献17

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

数据流历史数据的存储与聚集查询处理算法被引量：17