面向高速乱序流的top-k连续查询方法被引量：2

Continuous Top-k Query Method over High-speed Out-of-order Data Streams

下载PDF

导出

摘要提出一种面向高速乱序流的top-k连续查询方法。使用基于缓存的方法等待迟到元组,但不对缓冲区内数据进行排序,通过统计运行信息实现缓存时长自适应,然后使用改造的MinTopk算法计算当前窗口的top-k结果集。实验结果表明,该方法在高速乱序流上实现了高效的top-k查询,在保证用户允许的最小正确率的情况下计算出最小缓存时长,减少了查询时延。 The continuous top-k query approach over high-speed out-of-order data streams was proposed.Using a cache-based method to wait for late tuples without sorting the data in the buffer,the self-adaptive cache duration was realized by counting the running information.And the modified MinTopk algorithm was used to calculate the top-k result set of the current window.The experimental results showed that this approach could achieve efficient top-k query over high-speed out-of-order data streams.In case of ensuring the minimum accuracy allowed by users,the minimum cache duration was calculated to reduce the query delay.

作者武守晓房俊 WU Shouxiao;FANG Jun(Beijing Key Laboratory on Integration and Analysis of Large-scale Stream Data,North China University of Technology,Beijing 100144,China;Institute of Data Engineering,North China University of Technology,Beijing 100144,China)

机构地区北方工业大学大规模流数据集成与分析技术北京市重点实验室北方工业大学数据工程研究院

出处《郑州大学学报（理学版）》北大核心 2021年第3期93-99,共7页 Journal of Zhengzhou University:Natural Science Edition

基金国家重点研发计划项目(2017YFC0804406) 国家自然科学基金项目(61672042)。

关键词高速乱序流 top-k连续查询缓存时长自适应查询时延 high-speed out-of-order data stream continuous top-k query self-adaptive cache duration query latency

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1朱睿,王斌,杨晓春,王国仁.基于高速乱序流的Top-k连续查询算法[J].计算机学报,2018,41(8):1693-1708. 被引量：2
2杨宁,许嘉,吕品,李陶深.基于混合处理模型的乱序数据流分布式聚合查询处理技术[J].广西科学,2019,26(4):398-404. 被引量：2
3周春姐,戴鹏飞,李洪波,张振兴.物联网中具有时间持续性特征的乱序事件查询处理技术研究[J].计算机科学,2016,43(5):179-187. 被引量：2
4王青,谭良,杨显华.基于Spark的Apriori并行算法优化实现[J].郑州大学学报（理学版）,2016,48(4):60-64. 被引量：12
5曹原,刘英博,肖利,管冰,张力.状态监测数据流时间乱序问题建模与研究[J].计算机集成制造系统,2013,19(12):2960-2967. 被引量：5

二级参考文献40

1刘海龙,李战怀,陈群.乱序RFID数据流上的复杂事件检测方法[J].西北工业大学学报,2009,27(4):449-454. 被引量：3
2孙玉芬,卢炎生.流数据挖掘综述[J].计算机科学,2007,34(1):1-5. 被引量：36
3MRAD N,F(X)TE P, GIURGIUTIU V,et al. Condition-based maintenance[J]. International Journal of Aerospace En-gineering, DC)I:10. 1155/293/348532.
4PRAJAPATI A, GANESAN S. A generic framework for con-dition-based maintenance[J]. International Journal of Embed-ded Systems and Computer Engineering, 2010,2(2) :81-88.
5NIU G,YANG B S,PECHT M. Development of an optimizedcondition-based maintenance system by data fusion and relia-bility-centered maintenance [J ]. Reliability Engineering andSystem Safety, 2010,95(7) :786'796.
6TIAN Zhigang, LIAO Haitao. Condition based maintenanceoptimization for multi-component syvstems using proportionalhazards model [J]. Reliability Engineering and System Safety,2011,96(5):581-589.
7JARDINE A K S,LIN D,BANJEVIC D. A review on ma-chinery diagnostics and prognosticsimplementing condition-based maintenance [J]. Mechanical Systems and Signal Pro-cessing, 2006, 20(7); 1483-1510.
8GYLI^TORM D,WU E,CHAE H J,et al. SASE: complexevent processing over streamsLEB/OL][2013-05-20], http://citeseerx. ist. psu. edu/viewdoc/download; jsessionid =C97FE128C5E5355E6904126570851F5B. doi=10. 1. 1. 104.9487 &-rep= repl &-type== pdf.
9WU E, DIAO Y L, RIZVI S. High performance complex e-vent processing over streams[C]//Proceedings of the Interna-tional Conference on Management of Data. New York, N. Y.,USA: ACM, 2006 : 407-418.
10BRENNAL L, DEMERS A, GEHRKE J,et al. Cayuga : ahigh performance event processing engine [C]//Proceedings ofthe International Conference on Management of Data. NewYork, N.Y.,USA: ACM, 2007 : 1100-1 102.

共引文献16

1龚勋,王淑营,崔晓宇.面向生产管控的多源数据处理技术[J].计算机系统应用,2020,29(11):237-242. 被引量：2
2许冬冬,袁凌云,李晶.基于乱序修正框架的物联网复杂事件检测模型[J].计算机科学,2015,42(10):126-131.
3朱晓敏,祁建军.基于三支概念格线图的混合蕴含获取[J].郑州大学学报（理学版）,2017,49(4):16-21. 被引量：5
4柴文超,汤洪涛,吴光华.面向仓储的RFID数据清洗技术研究[J].机电工程,2017,34(12):1474-1479. 被引量：2
5李融,杨淙钧,高泽,李常宝,刘忠麟,艾中良.基于Spark的精准关联规则挖掘算法实现[J].信息技术,2018,42(2):153-158. 被引量：4
6曾洪哲.面向异构网络的并行传输乱序分析[J].信息技术,2018,42(6):136-141. 被引量：2
7高琪娟,刘锴,陈佳.面向Spark的图书借阅数据关联模型的研究[J].安徽农业大学学报,2018,45(4):768-771. 被引量：7
8令宝.基于数据挖掘的运动员神经类型特征评估系统构建[J].自动化与仪器仪表,2018,0(10):165-168. 被引量：2
9王进,晏世凯,高延雨,金理雄,胡明星,邓欣,陈乔松.基于MPI的ML-kNN算法并行[J].郑州大学学报（理学版）,2018,50(3):34-38. 被引量：4
10梁瑷云,袁丁,严清,刘小久.Spark平台下关联规则算法的优化实现[J].计算机工程与设计,2018,39(12):3692-3699. 被引量：4

同被引文献21

1武优西,周坤,刘靖宇,江贺,吴信东.周期性一般间隙约束的序列模式挖掘[J].计算机学报,2017,40(6):1338-1352. 被引量：12
2侯泳旭,段磊,李岭,卢莉,唐常杰.基于疾病信息网络的表型相似基因搜索[J].软件学报,2018,29(3):721-733. 被引量：7
3谭章禄,王兆刚,胡翰.时间序列趋势相似性度量方法研究[J].计算机工程与应用,2020,56(10):94-99. 被引量：10
4杨矫云,郭思伊,李廉.基于PAC算法的流数据Top-k实时查询[J].华中科技大学学报（自然科学版）,2021,49(2):56-61. 被引量：2
5余列冰,向隆刚,孙尚宇,关雪峰,吴华意.面向分布式列式存储的轨迹大数据k近邻查询[J].武汉大学学报（信息科学版）,2021,46(5):736-745. 被引量：9
6李靖,任丽芳,王文剑.一种响应时间感知的移动服务组合方法[J].郑州大学学报（理学版）,2021,53(3):30-36. 被引量：1
7宋栿尧,朱睿,张豪,邱涛,夏秀峰.数据流环境下的关键词轮廓查询算法[J].小型微型计算机系统,2021,42(9):2004-2010. 被引量：3
8谭凯中,秦勃,何亚文.面向过程的海洋时空数据分布式存储与并行检索[J].中国海洋大学学报（自然科学版）,2021,51(11):94-101. 被引量：12
9王芋人,武德安.一种提高小目标检测准确率的数据增强方法[J].激光杂志,2021,42(11):41-45. 被引量：3
10武优西,刘茜,闫文杰,郭磊,吴信东.无重叠条件严格模式匹配的高效求解算法[J].软件学报,2021,32(11):3331-3350. 被引量：5

引证文献2

1赵晓倩,武优西,王月华,李艳.一种保序序列快速挖掘算法:RSMM[J].郑州大学学报（理学版）,2022,54(4):64-70. 被引量：6
2谢妞妞.面向流式数据处理系统的目标数据自动化查询技术[J].自动化与仪器仪表,2023(9):237-240.

二级引证文献6

1毛华,郑博雅,胥德华,张植明,杨兰珍.中智模糊半概念知识提取研究[J].郑州大学学报（理学版）,2023,55(6):84-90. 被引量：1
2毛华,牛振华,马经泽,张植明,杨兰珍.基于模糊三支区间集半概念知识提取方法研究[J].郑州大学学报（理学版）,2024,56(1):81-87. 被引量：1
3王珍,武优西,孟玉飞,李艳.一种共生保序模式挖掘算法[J].小型微型计算机系统,2024,45(6):1384-1391.
4毛华,牛振华,马经泽,王刚,张植明,杨兰珍.三支区间集半概念的代数结构及覆盖粗糙近似算子[J].郑州大学学报（理学版）,2024,56(6):84-90.
5谢婷萱,武优西,王月华,李艳.一种对比序列模式挖掘算法[J].小型微型计算机系统,2024,45(8):1808-1815.
6张露迪.基于主成分分析的模糊概念格[J].应用数学进展,2023,12(12):4938-4945.

1李莉.谈人工智能时代财务会计向管理会计的转型[J].大众投资指南,2020(13):123-124.
2侯筠仪,赵黎晔,申景诗,冯飞,王韶波.基于SDN架构的NFV技术在低轨卫星网络中的应用[J].中国空间科学技术,2021,41(3):89-96. 被引量：3
3蔡莹.行政事业单位会计信息化建设研究[J].大众商务,2021(6):13-14.
4程为平,张钊.港口大型装卸机械设备运行状态智能监测技术研究[J].科技资讯,2021,19(10):62-64. 被引量：3

郑州大学学报（理学版）

2021年第3期

浏览历史

内容加载中请稍等...

面向高速乱序流的top-k连续查询方法被引量：2

参考文献5

二级参考文献40

共引文献16

同被引文献21

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

面向高速乱序流的top-k连续查询方法 被引量：2

参考文献5

二级参考文献40

共引文献16

同被引文献21

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

面向高速乱序流的top-k连续查询方法被引量：2