-
题名一种海量分布式数据Top-k查询算法
- 1
-
-
作者
魏贤全
郑洪源
丁秋林
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第10期110-115,共6页
-
文摘
针对现有分布式环境下Top-k查询算法的不足,提出了一种适用于海量分布式数据的Top-k查询算法(ECHT)。该算法充分考虑了数据分布情况,提出了一种改进的限定误差直方图描述数据分布算法,避免了节点数据分布不均时Top-k查询算法的低效性;另一方面,提高了Top-k算法的阈值计算精度,从而进一步降低了网络带宽消耗。此外,提出了一种早裁剪思想,在大量数据传输之前提前进行数据裁剪,避免了大量无用数据的传输。实验表明,ECHT算法在网络带宽消耗和网络响应时间方面均优于同类算法。
-
关键词
海量数据
TOP-K
早裁剪
改进限定误差直方图
-
Keywords
massive data
Top-k
early clipping
new error limited histogram
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-