期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
低熵多键排序问题的实用算法
1
作者 谢勰 方明 《西安石油大学学报(自然科学版)》 CAS 2008年第6期100-103,共4页
给出低熵情况下的多键排序改进算法.利用众数投票算法结合中位数选择算法产生枢纽元,对与枢纽元相等的元素使用改进算法,其他元素仍采用原算法.理论分析表明,重复数据较多时改进算法速度较快,且在数据量不大时其性能接近线性算法.
关键词 排序算法 众数投票算法 选择算法
下载PDF
大数据高性能排序算法的设计与实现 被引量:6
2
作者 陈洪雁 万俊伟 汪琦 《飞行器测控学报》 CSCD 2015年第2期120-127,共8页
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用... 针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用多线程处理任务,通过控制线程个数控制并行度。综合利用这些技术,该算法使得大数据的排序性能接近理论极限值,在CPU(Central Processing Unit,中央处理器)资源充裕的情况下,利用异步压缩技术,还可以突破这一极限,最终实现的系统2 000s就可以对超过500Gbyte的磁盘数据做一次完整的排序。在数据库设计中充分利用此思想,将会实现连接和线程的分离,数据库将可以支持更大的连接数,从而提高数据库支持的并发度。 展开更多
关键词 国产数据库 海量数据 大数据 排序算法 自主可控 等价排序键
下载PDF
西文编目输出系统
3
作者 杨华 金洲 +1 位作者 武明 苗莹 《现代图书情报技术》 1983年第4期32-36,共5页
关键词 标目 附加款目 西文编目 排序键 目录卡片 输出系统 工作区 MARC记录 主题文档 书卡
下载PDF
实体解析中基于相似性传递的增量分组研究 被引量:1
4
作者 高广尚 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2019年第5期1287-1297,共11页
本文探讨一种适应于大数据集的基于相似性传递的记录增量分组方法.论文首先分析如何逐步推算出记录之间的相似性,然后提出如何基于排序键构建基准组,如何基于相似性传递增量更新基准组,以及如何基于并查集实现基准组中的增量更新,最后... 本文探讨一种适应于大数据集的基于相似性传递的记录增量分组方法.论文首先分析如何逐步推算出记录之间的相似性,然后提出如何基于排序键构建基准组,如何基于相似性传递增量更新基准组,以及如何基于并查集实现基准组中的增量更新,最后通过实验验证提出方法的可行性和高效性.实验结果显示,提出的方法比传统方法更能提高分组质量,提升分组效率.论文没有对属性值本身存在的数据质量问题进行详细分析研究,并没有设计排序键生成算法.提出的方法不仅能有助于解决数据清洗、信息集成与管理等技术中的记录漏配问题,而且具有较好的可扩展性可重用性和不受领域限制等优点因为它仅从纯数据处理的角度来设计算法. 展开更多
关键词 排序键 相似性传递 并查集 实体解析 数据质量
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部