-
题名大数据高性能排序算法的设计与实现
被引量:6
- 1
-
-
作者
陈洪雁
万俊伟
汪琦
-
机构
北京跟踪与通信技术研究所
-
出处
《飞行器测控学报》
CSCD
2015年第2期120-127,共8页
-
文摘
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用多线程处理任务,通过控制线程个数控制并行度。综合利用这些技术,该算法使得大数据的排序性能接近理论极限值,在CPU(Central Processing Unit,中央处理器)资源充裕的情况下,利用异步压缩技术,还可以突破这一极限,最终实现的系统2 000s就可以对超过500Gbyte的磁盘数据做一次完整的排序。在数据库设计中充分利用此思想,将会实现连接和线程的分离,数据库将可以支持更大的连接数,从而提高数据库支持的并发度。
-
关键词
国产数据库
海量数据
大数据
排序算法
自主可控
等价排序键
-
Keywords
homegrown database
mass data
big data
ranking algorithm
independent and controllable
equivalent sorting key
-
分类号
V556
[航空宇航科学与技术—人机与环境工程]
TP311.12
[自动化与计算机技术—计算机软件与理论]
-