期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
低熵多键排序问题的实用算法
1
作者
谢勰
方明
《西安石油大学学报(自然科学版)》
CAS
2008年第6期100-103,共4页
给出低熵情况下的多键排序改进算法.利用众数投票算法结合中位数选择算法产生枢纽元,对与枢纽元相等的元素使用改进算法,其他元素仍采用原算法.理论分析表明,重复数据较多时改进算法速度较快,且在数据量不大时其性能接近线性算法.
关键词
熵
多
键
排序
算法
众数投票算法
选择算法
下载PDF
职称材料
大数据高性能排序算法的设计与实现
被引量:
6
2
作者
陈洪雁
万俊伟
汪琦
《飞行器测控学报》
CSCD
2015年第2期120-127,共8页
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用...
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用多线程处理任务,通过控制线程个数控制并行度。综合利用这些技术,该算法使得大数据的排序性能接近理论极限值,在CPU(Central Processing Unit,中央处理器)资源充裕的情况下,利用异步压缩技术,还可以突破这一极限,最终实现的系统2 000s就可以对超过500Gbyte的磁盘数据做一次完整的排序。在数据库设计中充分利用此思想,将会实现连接和线程的分离,数据库将可以支持更大的连接数,从而提高数据库支持的并发度。
展开更多
关键词
国产数据库
海量数据
大数据
排序
算法
自主可控
等价
排序键
下载PDF
职称材料
西文编目输出系统
3
作者
杨华
金洲
+1 位作者
武明
苗莹
《现代图书情报技术》
1983年第4期32-36,共5页
关键词
标目
附加款目
西文编目
排序键
目录卡片
输出系统
工作区
MARC记录
主题文档
书卡
下载PDF
职称材料
实体解析中基于相似性传递的增量分组研究
被引量:
1
4
作者
高广尚
《系统工程理论与实践》
EI
CSSCI
CSCD
北大核心
2019年第5期1287-1297,共11页
本文探讨一种适应于大数据集的基于相似性传递的记录增量分组方法.论文首先分析如何逐步推算出记录之间的相似性,然后提出如何基于排序键构建基准组,如何基于相似性传递增量更新基准组,以及如何基于并查集实现基准组中的增量更新,最后...
本文探讨一种适应于大数据集的基于相似性传递的记录增量分组方法.论文首先分析如何逐步推算出记录之间的相似性,然后提出如何基于排序键构建基准组,如何基于相似性传递增量更新基准组,以及如何基于并查集实现基准组中的增量更新,最后通过实验验证提出方法的可行性和高效性.实验结果显示,提出的方法比传统方法更能提高分组质量,提升分组效率.论文没有对属性值本身存在的数据质量问题进行详细分析研究,并没有设计排序键生成算法.提出的方法不仅能有助于解决数据清洗、信息集成与管理等技术中的记录漏配问题,而且具有较好的可扩展性可重用性和不受领域限制等优点因为它仅从纯数据处理的角度来设计算法.
展开更多
关键词
排序键
相似性传递
并查集
实体解析
数据质量
原文传递
题名
低熵多键排序问题的实用算法
1
作者
谢勰
方明
机构
西安石油大学计算机学院
西安邮电学院信息与控制系
出处
《西安石油大学学报(自然科学版)》
CAS
2008年第6期100-103,共4页
基金
陕西省自然科学基础研究计划(编号:SJ08F24)
文摘
给出低熵情况下的多键排序改进算法.利用众数投票算法结合中位数选择算法产生枢纽元,对与枢纽元相等的元素使用改进算法,其他元素仍采用原算法.理论分析表明,重复数据较多时改进算法速度较快,且在数据量不大时其性能接近线性算法.
关键词
熵
多
键
排序
算法
众数投票算法
选择算法
Keywords
low entropy
multi-key sorting algorithm
majority vote algorithm
selection algorithm
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
大数据高性能排序算法的设计与实现
被引量:
6
2
作者
陈洪雁
万俊伟
汪琦
机构
北京跟踪与通信技术研究所
出处
《飞行器测控学报》
CSCD
2015年第2期120-127,共8页
文摘
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用多线程处理任务,通过控制线程个数控制并行度。综合利用这些技术,该算法使得大数据的排序性能接近理论极限值,在CPU(Central Processing Unit,中央处理器)资源充裕的情况下,利用异步压缩技术,还可以突破这一极限,最终实现的系统2 000s就可以对超过500Gbyte的磁盘数据做一次完整的排序。在数据库设计中充分利用此思想,将会实现连接和线程的分离,数据库将可以支持更大的连接数,从而提高数据库支持的并发度。
关键词
国产数据库
海量数据
大数据
排序
算法
自主可控
等价
排序键
Keywords
homegrown database
mass data
big data
ranking algorithm
independent and controllable
equivalent sorting key
分类号
V556 [航空宇航科学与技术—人机与环境工程]
TP311.12 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
西文编目输出系统
3
作者
杨华
金洲
武明
苗莹
机构
北京大学一分校
出处
《现代图书情报技术》
1983年第4期32-36,共5页
关键词
标目
附加款目
西文编目
排序键
目录卡片
输出系统
工作区
MARC记录
主题文档
书卡
分类号
G25 [文化科学—图书馆学]
G35 [文化科学—情报学]
下载PDF
职称材料
题名
实体解析中基于相似性传递的增量分组研究
被引量:
1
4
作者
高广尚
机构
桂林理工大学现代企业管理研究中心
桂林理工大学商学院
出处
《系统工程理论与实践》
EI
CSSCI
CSCD
北大核心
2019年第5期1287-1297,共11页
基金
国家自然科学基金(71761008)
广西高校人文社会科学重点研究基地基金(16YB010)~~
文摘
本文探讨一种适应于大数据集的基于相似性传递的记录增量分组方法.论文首先分析如何逐步推算出记录之间的相似性,然后提出如何基于排序键构建基准组,如何基于相似性传递增量更新基准组,以及如何基于并查集实现基准组中的增量更新,最后通过实验验证提出方法的可行性和高效性.实验结果显示,提出的方法比传统方法更能提高分组质量,提升分组效率.论文没有对属性值本身存在的数据质量问题进行详细分析研究,并没有设计排序键生成算法.提出的方法不仅能有助于解决数据清洗、信息集成与管理等技术中的记录漏配问题,而且具有较好的可扩展性可重用性和不受领域限制等优点因为它仅从纯数据处理的角度来设计算法.
关键词
排序键
相似性传递
并查集
实体解析
数据质量
Keywords
sorting key
transferred similarityunion-find
entity resolution
data quality
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
低熵多键排序问题的实用算法
谢勰
方明
《西安石油大学学报(自然科学版)》
CAS
2008
0
下载PDF
职称材料
2
大数据高性能排序算法的设计与实现
陈洪雁
万俊伟
汪琦
《飞行器测控学报》
CSCD
2015
6
下载PDF
职称材料
3
西文编目输出系统
杨华
金洲
武明
苗莹
《现代图书情报技术》
1983
0
下载PDF
职称材料
4
实体解析中基于相似性传递的增量分组研究
高广尚
《系统工程理论与实践》
EI
CSSCI
CSCD
北大核心
2019
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部