MESHJOIN*:实时数据仓库环境下的数据流更新算法被引量：5

MESHJOIN*:An Algorithm Supporting Streaming Updates in a Real-time Data Warehouse

下载PDF

导出

摘要提出了一种新的实时数据仓库环境下的数据流更新算法——MESHJOIN*算法。算法的特性有:(1)关系R采用了分块和散列的组织形式,尽可能避免对当前连接无效元组的读取,减少连接操作所涉及元组的数量,从而提高连接算法的效率;(2)采用了多线程并发连接技术,并根据工程学原理,实现了连接操作和关系R读取操作的最佳调度,保证了连接算法效率的最大化;(3)根据当前系统的服务率和数据流元组的到达率之间的关系,合理调度实时元组和准实时元组的执行,保证了系统对实时元组的处理要求。实验结果表明,MESHJOIN*算法可以取得比MESHJOIN算法更好的性能。 A new algorithm called MESHJOIN＊ is proposed to support streaming updates under real-time data warehouse environment.It has the following distinct features：（1） Relation R is organized in blocks and hashes so as to avoid the reading of unusable tuples for the current join operation as much as possible,through which the amount of tuples involved in a join is much reduced,thus enhancing the efficiency of the join operation;（2） Multi-thread parallel execution technology is adopted here,and the order of read operation and join operation is optimized according to engineering theory so as to maximize the efficiency of join algorithm;（3） Reasonable scheduling of real-time tuples and near-real-time tuples is achieved according to the relationship between the current system service rate and the tuples arriving rate,so that the requirement for the processing of real-time tuples is satisfied.Experimental results show that MESHJOIN＊ can achieve much better performance than MESHJOIN.

作者林子雨林琛冯少荣张东站

机构地区厦门大学计算机科学系

出处《计算机科学与探索》 CSCD 2010年第10期927-939,共13页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金No.50604012~~

关键词数据仓库数据流更新连接 data warehouse； streaming update； join；

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1林子雨,杨冬青,宋国杰,王腾蛟,唐世渭.实时主动数据仓库中多维数据实视图的选择[J].软件学报,2008,19(2):301-313. 被引量：12

二级参考文献2

1薛永生,林子雨,段江娇,吕晓华,张伟.用多用户多窗口方法处理多维视图动态选择[J].计算机研究与发展,2004,41(10):1703-1711. 被引量：4
2谭红星,周龙骧.多维数据实视图的动态选择[J].软件学报,2002,13(6):1090-1096. 被引量：35

共引文献11

1林子雨,杨冬青,王腾蛟,宋国杰.实视图选择研究[J].软件学报,2009,20(2):193-213. 被引量：6
2冯少荣.利用维护代价约束的物化视图选择方法[J].华中科技大学学报（自然科学版）,2009,37(5):57-60.
3陈凌,王辉,张广泉.主动数据仓库规则模型及其相关语法的研究[J].计算机工程与设计,2009,30(16):3903-3905. 被引量：1
4赵雯,李保伟,蔺艺红,张莉,郑丽萍,王敏.建立医院多媒体动态数据仓库模式的探索[J].中国医院,2010,14(8):60-62.
5王迎霞.基于数据中心的决策支持系统在高校管理中的应用[J].中国教育信息化（高教职教）,2010(8):33-34. 被引量：1
6杨莉国,欧付娜,刘庆海,程海涛,卢亮.数据仓库相关技术研究综述[J].电脑知识与技术,2011,7(4):2234-2236. 被引量：4
7罗瑞评,许云林,张洪顺,巩艳.基于数据仓库的辅助决策系统研究[J].中国无线电,2012(5):51-53.
8林子雨,邹权,林琛,赖永炫,郑炜.基于视图树的实视图动态选择[J].计算机研究与发展,2012,49(10):2106-2117. 被引量：1
9沈燕,雷蕾.一种面向领域WEB服务的数据中心模型[J].计算机系统应用,2013,22(6):67-70. 被引量：3
10龚健虎.基于双曲游散牵引的飞行异常操作数据挖掘[J].控制工程,2014,21(4):617-620. 被引量：2

同被引文献41

1林子雨,杨冬青,宋国杰,王腾蛟.实时主动数据仓库中的变化数据捕捉研究综述[J].计算机研究与发展,2007,44(z3):447-451. 被引量：7
2Karakasidis A,Vassiliadis P,Pitoura E.ETL Queues for Active Data Warehousing[C] //Proc.of the 2nd International Workshop on Information Quality in Information Systems.New York,USA:ACM Press,2005:28-39.
3Golab L,Johnson T,Seidel J S,et al.Stream Warehousing with Data Depot[C] //Proc.of the 35th SIGMOD International Conference on Management of Data.New York,USA:ACM Press,2009:847-854.
4Polyzotis N,Skiadopoulos S,Vassiliadis P,et al.Supporting Streaming Updates in an Active Data Warehouse[C] //Proc.of the 23rd International Conference on Data Engineering.New Jersey,USA:IEEE Computer Society,2007:476-485.
5Polyzotis N,Skiadopoulos S,Vassiliadis P,et al.Meshing Streaming Updates with Persistent Data in an Active Data Warehouse[J].IEEE Transactions on Knowledge and Data Engineering,2008,20(7):976-991.
6Naeem M,Dobbie G,Weber G.R-MESHJOIN for Nearreal-time Data Warehousing[C] //Proc.of the 13th International Workshop on Data Warehousing and OLAP.New York,USA:ACM Press,2010:53-60.
7Chakraborty A,Singh A.A Partition-based Approach to Support Streaming Up-dates over Persistent Data in an Active Data Warehouse[C] //Proc.of 2009 IEEE International Symposium on Parallel&Distributed Processing.Washington D.C.,USA:IEEE Computer Society,2009:1-11.
8Chandrasekaran S,Franklin M J.PSoup:A System for Streaming Queries over Streaming Data[J].The VLDB Journal,2003,12(2):140-156.
9Tao Yufei,Yiu M,Papadias D.Producing Fast Join Results on Streams Through Rate-based Optimization[C] //Proc.of ACM SIGMOD International Conference on Management of Data.New York,USA:ACM Press,2005:371-382.
10Erik B,Hu Yu,Duncan S.Goodbye Pareto Principle,Hello Long Tail:The Effect of Search Costs on the Concentration of Product Sales[J].Management Science,2011,57(8):1373-1386.

引证文献5

1潘郑冰,戴牡红.实时数据仓库中一种改进的数据流更新算法[J].计算机工程,2014,40(10):43-46. 被引量：2
2杜威,邹先霞.数据流与磁盘存贮表的连接计算算法[J].控制工程,2014,21(6):904-908. 被引量：1
3李莉,朱永利,宋亚奇.电力设备监测数据的流式计算与动态可视化展示[J].电力建设,2017,38(5):91-97. 被引量：15
4赵恒泰,赵宇海,袁野,季航旭,乔百友,王国仁.分布式环境下大规模维表关联技术优化[J].计算机科学与探索,2022,16(2):337-347. 被引量：2
5张笑燕,刘志浩,杜晓峰,陆天波.流数据实时接收方案的研究[J].通信学报,2022,43(4):154-163.

二级引证文献20

1魏怀明.模糊关联规则结合动态树重建的数据流挖掘[J].控制工程,2018,25(12):2263-2268. 被引量：3
2李刚,张博,赵文清,刘云鹏,高树国.电力设备状态评估中的数据科学问题:挑战与展望[J].电力系统自动化,2018,42(21):10-20. 被引量：63
3黄震,孙伟,白霄磊,陈德高.基于三维场景的电力数据可视化研究[J].能源与环保,2018,40(3):120-125. 被引量：3
4叶远红,曾勇,勾清亮,何荣卜.电力无线单兵检测设备参数实时监测技术研究[J].自动化与仪器仪表,2020,0(3):205-208.
5邱帅,薛峰.高层房屋建筑安装工程质量可视化动态监测方法[J].科技通报,2019,35(12):150-154. 被引量：8
6郑博文,王秋雯,牛斌,问尤龙.基于大数据的变压器油色谱分析可视化诊断平台设计[J].粘接,2020,42(5):99-102. 被引量：2
7张华琛,李春华,陈宇航.基于增强虚拟现实的电力调度设备运行缺陷检测[J].信息技术,2020,44(6):158-161. 被引量：3
8王峰,冯桂玲,上官霞,吴骏,蔡荣彦.面向过程的敏锐决策动态分析看板平台设计[J].微型电脑应用,2020,36(7):58-60. 被引量：1
9常振云,胡碧金,李小红,赵琳.护理监测数据的Hadoop集群动态可视化模型仿真[J].计算机仿真,2020,37(8):153-156. 被引量：2
10李蕊,陈孝文,许家伟,吕志鹏,林树鸿.智能配电网运行数据可视化监控方法研究[J].自动化与仪器仪表,2020(11):223-226. 被引量：11

1王红兵.全局数据仓库环境中数据复制的研究[J].计算机系统应用,1999,8(12):35-37.
2李玲,周云,李鹏.基于ZigBee无线传感器网络的仓库环境监测系统设计[J].数字技术与应用,2012,30(10):146-147. 被引量：4
3刘佳.基于PLC+ARM的仓库环境监控系统设计[J].无线互联科技,2012,9(4):57-58. 被引量：3
4潘郑冰,戴牡红.实时数据仓库中一种改进的数据流更新算法[J].计算机工程,2014,40(10):43-46. 被引量：2
5范平,梁家荣,李天志.Vague集之间相似度量的新方法[J].计算机工程与应用,2006,42(34):70-72. 被引量：10
6范平.Vague集之间的相似度量分析[J].咸宁学院学报,2007,27(3):15-17.
7邢伟,周西军.基于80C196单片机的仓库环境智能控制系统研究[J].农机化研究,2007,29(7):104-105. 被引量：3
8张同杨,马睿,祁滢.星型模型在复杂数据仓库环境中应用研究[J].价值工程,2015,34(31):77-79.
9柳向斌,张志勇,黄涛.基于数据仓库环境下的数据可用性研究[J].计算机技术与发展,2006,16(5):16-17. 被引量：1
10王立冬,雷晴.基于B/S模式监控系统的设计[J].科技致富向导,2012(5):47-48. 被引量：1

计算机科学与探索

2010年第10期

浏览历史

内容加载中请稍等...

MESHJOIN*:实时数据仓库环境下的数据流更新算法被引量：5

参考文献1

二级参考文献2

共引文献11

同被引文献41

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

MESHJOIN*:实时数据仓库环境下的数据流更新算法 被引量：5

参考文献1

二级参考文献2

共引文献11

同被引文献41

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

MESHJOIN*:实时数据仓库环境下的数据流更新算法被引量：5