期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
An Improved Hilbert Curve for Parallel Spatial Data Partitioning 被引量:7
1
作者 MENG Lingkui HUANG Changqing ZHAO Chunyu LIN Zhiyong 《Geo-Spatial Information Science》 2007年第4期282-286,共5页
A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on t... A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on the improved Hilbert curve, the algorithm can be designed to achieve almost-uniform spatial data partitioning among multiple disks in parallel spatial databases. Thus, the phenomenon of data imbalance can be significantly avoided and search and query efficiency can be enhanced. 展开更多
关键词 parallel spatial database spatial data partitioning data imbalance Hilbert curve
下载PDF
Storage and Parallel Loading System Based on Mode Network for Multimode Medical Image Data
2
作者 Xiao Zhai Haiwei Pan +2 位作者 Xiaoqin Xie Zhiqiang Zhang Qilong Han 《国际计算机前沿大会会议论文集》 2016年第2期61-62,共2页
Since Multimode data is composed of many modes and their complex relationships,it cannot be retrieved or mined effectively by utilizing traditional analysis and processing techniques for single mode data.To address th... Since Multimode data is composed of many modes and their complex relationships,it cannot be retrieved or mined effectively by utilizing traditional analysis and processing techniques for single mode data.To address the challenges,we design and implement a graph-based storage and parallel loading system aimed at multimode medical image data.The system is a framework designed to flexibly store and rapidly load these multimode data.Specifically,the system utilizes the Mode Network to model the modes and their relationships in multimode medical image data and the graph database to store the data with a parallel loading technique. 展开更多
关键词 MULTIMODE MEDICAL image data MODE NETWORK GRAPH database parallel loading
下载PDF
面向分布式数据库的算子并行优化策略
3
作者 刘文洁 吕靖超 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第3期453-459,共7页
随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,... 随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,存储节点的数据仅用作多备份的冗余,为系统故障时提供数据恢复,并未被利用起来改善查询效率。针对上述问题,提出了一种面向分布式数据库的算子并行优化策略,通过对关键物理算子进行拆分,将拆分后的子请求均匀分配到存储层多个节点,由多个节点并行处理,从而减少查询响应时间。上述策略已经在分布式数据库CBase上进行了应用,实验表明,提出的并行优化策略可显著缩短SQL请求查询时间,并提高系统资源利用率。 展开更多
关键词 分布式数据库 并行查询 查询优化 负载均衡 数据分区
下载PDF
一种基于Yarn云平台的基因启发式多序列比对算法
4
作者 杨波 徐胜超 +1 位作者 周继鹏 王志坚 《电子技术应用》 2024年第11期16-22,共7页
提出一种基于Yarn云平台的基因启发式多序列比对算法。建立核酸替换等价矩阵作为基因启发式数学模型,构建Yarn云平台逻辑架构,通过对基因数据预处理、基因数据存储、基因序列比对、基因数据管理、基因数据分析等步骤,对数据分类保存,划... 提出一种基于Yarn云平台的基因启发式多序列比对算法。建立核酸替换等价矩阵作为基因启发式数学模型,构建Yarn云平台逻辑架构,通过对基因数据预处理、基因数据存储、基因序列比对、基因数据管理、基因数据分析等步骤,对数据分类保存,划分错误率较高的长序列,得到多个较短的基因片段。对不同片段实施定位,将其中的变长种子生成,进行骨架构建和孔隙填补,可以实现基因启发式多序列比对。结果表明,设计的算法在不同数据集下处理时间缩短,多序列比对SP(Sum of Pairs)的分值较高,实验验证了该多序列比对方法具有很好的应用价值。 展开更多
关键词 生物数据 并行计算 分布式计算架构 分布式数据库系统 大数据处理平台
下载PDF
Database Research: Achievements and Challenges 被引量:4
5
作者 王珊 杜小勇 +1 位作者 孟小峰 陈红 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第5期823-837,共15页
Database system is the infrastructure of the modern information system. The R&D in the database system and its technologies is one of the important research topics in the field. The database R&D in China took off la... Database system is the infrastructure of the modern information system. The R&D in the database system and its technologies is one of the important research topics in the field. The database R&D in China took off later but it moves along by giant steps. This report presents the achievements Renmin University of China (RUC) has made in the past 25 years and at the same time addresses some of the research projects we, RUC, are currently working on. The National Natural Science Foundation of China supports and initiates most of our research projects and these successfully conducted projects have produced fruitful results. 展开更多
关键词 database management system parallel database systems Chinese database systems self-managing databases P2P computing and databases data warehousing OLAP Web data management XML mobile data management semantic web contextual information retrieval
原文传递
Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases 被引量:12
6
作者 周傲英 周水庚 +2 位作者 曹晶 范晔 胡运发 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第6期509-526,共18页
The huge amount of information stored in databases owned by corporations (e.g., retail, financial, telecom) has spurred a tremendous interest in the area of knowledge discovery and data mining. Clustering, in data mi... The huge amount of information stored in databases owned by corporations (e.g., retail, financial, telecom) has spurred a tremendous interest in the area of knowledge discovery and data mining. Clustering, in data mining, is a useful technique for discovering interesting data distributions and patterns in the underlying data, and has many application fields, such as statistical data analysis, pattern recognition, image processing, and other business applications. Although researchers have been working on clustering algorithms for decades, and a lot of algorithms for clustering have been developed, there is still no efficient algorithm for clustering very large databases and high dimensional data. As an outstanding representative of clustering algorithms, DBSCAN algorithm shows good performance in spatial data clustering. However, for large spatial databases, DBSCAN requires large volume of memory support and could incur substantial I/O costs because it operates directly on the entire database. In this paper, several approaches are proposed to scale DBSCAN algorithm to large spatial databases. To begin with, a fast DBSCAN algorithm is developed, which considerably speeds up the original DBSCAN algorithm. Then a sampling based DBSCAN algorithm, a partitioning-based DBSCAN algorithm, and a parallel DBSCAN algorithm are introduced consecutively. Following that, based on the above-proposed algorithms, a synthetic algorithm is also given. Finally, some experimental results are given to demonstrate the effectiveness and efficiency of these algorithms. 展开更多
关键词 spatial database CLUSTERING fast DBSCAN algorithm data sampling data partitioning parallel
原文传递
基于车辆的关系型数据库性能提升
7
作者 刘路 孙代青 +2 位作者 王瑞 王光福 张文成 《汽车实用技术》 2023年第9期124-128,共5页
随着电器架构的日益增多,车辆运行过程中会上报大量的行车数据,使用数据库处理的数据量增加,请求难度也在升级,为了能够长期稳定地保存大量的车辆数据,快速查询出所需数据为研发工程师提供数据分析,需要设计出适合存放车辆数据的关系型... 随着电器架构的日益增多,车辆运行过程中会上报大量的行车数据,使用数据库处理的数据量增加,请求难度也在升级,为了能够长期稳定地保存大量的车辆数据,快速查询出所需数据为研发工程师提供数据分析,需要设计出适合存放车辆数据的关系型数据库。PostgreSQL作为先进的开源数据库,支持复杂查询、并发控制等功能。文章针对基于车辆的关系型数据库提出多线程并行查询、创建数据表索引、添加数据库分区以及应用程序连接池的设计优化方法,针对性地对数据库的运行效率提供优化策略。测试结果表明,文章所提出的数据库性能提升方法能将数据请求效率提升数倍,数据库的性能得到极大提升。 展开更多
关键词 关系型数据库 POSTGRESQL 并行查询 数据表索引 数据库分区
下载PDF
一种面向并行空间数据库的数据划分算法研究 被引量:26
8
作者 赵春宇 孟令奎 林志勇 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2006年第11期962-965,共4页
面向基于对象关系型数据库而构建的并行空间数据库系统,提出了一种基于Hilbert空间填充曲线的适合于矢量空间数据的数据划分算法。在充分考虑空间信息的海量特征以及矢量数据存储记录的不定长等特点的前提下,该算法可实现并行空间数据... 面向基于对象关系型数据库而构建的并行空间数据库系统,提出了一种基于Hilbert空间填充曲线的适合于矢量空间数据的数据划分算法。在充分考虑空间信息的海量特征以及矢量数据存储记录的不定长等特点的前提下,该算法可实现并行空间数据库中海量空间数据记录在多个存储设备上的均衡划分,以避免出现数据倾斜现象,从而提高了空间数据的检索与查询效率。 展开更多
关键词 并行空间数据库 数据划分 数据倾斜 Hilbert空间填充曲线
下载PDF
一种并行XML数据库分片策略 被引量:7
9
作者 王国仁 汤南 +2 位作者 于亚新 孙冰 于戈 《软件学报》 EI CSCD 北大核心 2006年第4期770-781,共12页
主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查... 主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵XML数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个NP-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的XML数据分片算法WIN(workload-awareintermediarynodesdataplacementstrategy).大量实验结果证明:WIN算法的性能要优于以往的并行XML数据分片策略. 展开更多
关键词 并行数据库 XML文档 工作负载 数据分片 媒介节点
下载PDF
一种实现拓扑关系高效并行计算的矢量数据划分方法 被引量:9
10
作者 杨宜舟 吴立新 +2 位作者 郭甲腾 李志锋 刘善军 《地理与地理信息科学》 CSCD 北大核心 2013年第4期25-29,共5页
分析了拓扑关系并行算法的特点,为实现拓扑关系并行计算进程间的任务均衡与负载均衡,提出了一种矢量目标集的数据均衡划分方法,基于该划分方法设计了拓扑关系并行算法并测试了算法性能。测试表明:利用该方法可实现进程间计算负载的高度... 分析了拓扑关系并行算法的特点,为实现拓扑关系并行计算进程间的任务均衡与负载均衡,提出了一种矢量目标集的数据均衡划分方法,基于该划分方法设计了拓扑关系并行算法并测试了算法性能。测试表明:利用该方法可实现进程间计算负载的高度均衡与数据负载的基本均衡,加速比随进程数基本呈线性增长,算法并行效率基本不随进程数增加而衰减,基本稳定在80%。该方法为面向单机多核、众核和高性能集群环境下的海量数据拓扑关系分析软件的开发与服务提供一种高效的矢量数据划分方法。 展开更多
关键词 拓扑关系 并行计算 数据划分 负载均衡 任务均衡
下载PDF
并行数据库的改进Hash划分方法及并行Join算法 被引量:4
11
作者 陆丽娜 孟虹 +1 位作者 魏恒义 杨麦顺 《计算机研究与发展》 EI CSCD 北大核心 2000年第2期159-163,共5页
文中提出了Hash 划分的改进方法——IH 划分. IH划分为结点扩充时数据的重新划分提供了方便.在论述IH 划分的基础上,给出了基于该数据划分方法的并行Join 算法.利用已有的数据分布,文中提出的并行Join 算法提高... 文中提出了Hash 划分的改进方法——IH 划分. IH划分为结点扩充时数据的重新划分提供了方便.在论述IH 划分的基础上,给出了基于该数据划分方法的并行Join 算法.利用已有的数据分布,文中提出的并行Join 算法提高了算法的效率.最后,从理论上对以上并行算法的计算复杂性进行了分析. 展开更多
关键词 数据 并行数据库 数据划分 JOIN算法
下载PDF
大数据管理技术研究综述 被引量:14
12
作者 张滨 陈吉荣 乐嘉锦 《计算机应用与软件》 CSCD 北大核心 2014年第11期1-5,10,共6页
大数据具有规模大、深度大、宽度大、处理时间短、硬件系统普通化、软件系统开源化等特点。传统关系型数据库在对大数据进行操作时,系统性能严重下降。因此,大数据管理技术研究成为当前研究热点。分别从并行数据库,面向大数据处理的MapR... 大数据具有规模大、深度大、宽度大、处理时间短、硬件系统普通化、软件系统开源化等特点。传统关系型数据库在对大数据进行操作时,系统性能严重下降。因此,大数据管理技术研究成为当前研究热点。分别从并行数据库,面向大数据处理的MapReduce模型,NoSQL与数据库技术的对比以及MapReduce与数据库技术相结合四个方面,对国内外的研究发展状况进行分析和评述,最后展望了未来大数据研究发展方向。 展开更多
关键词 大数据 数据库 MAPREDUCE 并行数据库系统 非关系型数据库
下载PDF
大规模数据密集型系统中的去重查询优化 被引量:6
13
作者 宋怀明 安明远 +2 位作者 王洋 袁春阳 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2010年第4期581-588,共8页
针对shared-nothing结构下大规模数据密集型系统去重查询的挑战,提出了一种有效的数据分布策略和并行处理方法分别对相关属性和无关属性去重进行优化:即自适应的散列和直方图相结合的数据分布策略,以及异步式并行查询中间件.前者在数据... 针对shared-nothing结构下大规模数据密集型系统去重查询的挑战,提出了一种有效的数据分布策略和并行处理方法分别对相关属性和无关属性去重进行优化:即自适应的散列和直方图相结合的数据分布策略,以及异步式并行查询中间件.前者在数据写入时保证数据均衡,并在数据量发生倾斜时自动调整数据的分布;后者充分发掘了去重查询处理中的粗粒度流水级并行,并消除了多节点同步等待的开销,尽早地返回结果.在生产系统DBroker上的测试表明,数据分布策略极大地改善相关属性的去重查询性能,而异步式并行查询引擎能够充分发掘并行性,对不相关属性的去重查询具有显著的性能提升. 展开更多
关键词 去重查询 数据划分 大规模数据密集型系统 异步查询 并行查询引擎
下载PDF
基于数据中心的企业应用系统整合平台架构的研究和设计 被引量:5
14
作者 王柯柯 崔英志 +1 位作者 黄贤英 黄丽丰 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第11期129-132,共4页
讨论了数据中心的基本功能和设计原则,并以此为基础提出了面向企业的应用系统整合平台架构,详细分析了应用系统平台集群结构.该体系有助于提高企业信息化建设的水平、保障业务数据安全、构建一体化系统平台.
关键词 数据中心 系统集群 并行数据库
下载PDF
并行数据库系统的数据重组研究 被引量:3
15
作者 金树东 冯玉才 王元珍 《小型微型计算机系统》 EI CSCD 北大核心 1998年第3期28-33,共6页
数据倾斜对并行数据库系统性能的影响极大。本文提出解决初始数据倾斜的记录移动法 ,确定了数据平衡的记录移动法、负载平衡的记录移动法 ,及通常的重新划分法之间取舍的界线 ,并举例进行模拟研究。
关键词 并行数据库 数据划分 数据重组 数据库系统
下载PDF
调度自动化系统增强型数据仓库平台构建及应用 被引量:11
16
作者 何晓峰 王钢 李海锋 《电力系统自动化》 EI CSCD 北大核心 2008年第4期81-84,102,共5页
数据仓库是信息管理和分析型应用的有效平台。文中针对目前数据仓库不能支持实时数据存储处理和短时战术决策的局限性,提出了一种调度自动化系统增强型数据仓库平台体系结构,主要由信息一体化节点、实时数据处理中心、主动数据仓库和系... 数据仓库是信息管理和分析型应用的有效平台。文中针对目前数据仓库不能支持实时数据存储处理和短时战术决策的局限性,提出了一种调度自动化系统增强型数据仓库平台体系结构,主要由信息一体化节点、实时数据处理中心、主动数据仓库和系统管理工具等构成,从而实现了数据抽取和转换能力、实时响应性能以及对突发事件捕获能力的增强。在已投入电网运行的自开发SCUT2008电网调度自动化系统中的应用与测试,证明了其性能的增强。 展开更多
关键词 调度自动化系统 数据仓库 抽取 转换和加载(ETL) 实时数据库 主动规则
下载PDF
矢量多边形并行栅格化数据划分方法 被引量:4
17
作者 周琛 李满春 +2 位作者 陈振杰 姜朋辉 陈东 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第5期21-28,共8页
针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合... 针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合问题。在多核CPU环境下实现并行算法,选用多个典型土地利用现状数据集进行测试。结果表明:针对不同类型多边形数据集,所提方法较传统方法可获得更高的并行加速比和更好的负载均衡;针对大数据量数据集,以多边形节点数为度量标准可更精确地估算分块计算量,从而更好地实现负载均衡。 展开更多
关键词 地理信息系统 并行计算 多边形栅格化 数据划分 负载均衡
下载PDF
一个用于数据并行语言计算划分的时序优化模型(英文) 被引量:2
18
作者 余华山 胡长军 +2 位作者 黄其军 丁文魁 许卓群 《软件学报》 EI CSCD 北大核心 2001年第10期1434-1446,共13页
一个程序中数据并行语句的计算划分 (CP)对该程序的运行性能有决定性的作用 .尽管人们对这一问题已经进行了广泛的研究 ,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上 .针对并行循环结构的计算划分问题 ,提出了一个... 一个程序中数据并行语句的计算划分 (CP)对该程序的运行性能有决定性的作用 .尽管人们对这一问题已经进行了广泛的研究 ,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上 .针对并行循环结构的计算划分问题 ,提出了一个时序优化模型 .在该模型中 ,一个计算划分被表示成一个有向图 ,在把并行语句中的操作映射到各个处理器的同时 ,给出了被分配到不同处理器上的操作之间的相关性 .对于一条数据并行语句 ,时序优化模型对它的每个计算划分选择方案分别采用多种有效的优化策略进行优化 ;并综合考虑各个计算划分选择方案的负载平衡性、处理器间的操作依赖性、数据访问的空间局部性和时间局部性四个方面的因素 ,估算每个方案的执行效率 ;最后从这些方案中选择一个执行效率最优的方案作为该语句的计算划分 .作者已在 HPF编译器 p-HPF采用时序优化模型实现了对 FORAL L结构的支持 .实验结果表明 ,该模型具有非常好的通用性 ,对不同领域多种数据并行问题均取得了理想的加速比 .同时 ,只需略微改动 ,该模型也可用于其他类型数据并行语句的计算划分 . 展开更多
关键词 计算划分 数据相关 数据重用 时序优化模型 数据并行语言 程序
下载PDF
并行数据库系统原型PARO 被引量:12
19
作者 金树东 冯玉才 《计算机科学》 CSCD 北大核心 1997年第3期41-45,共5页
PARO系统是一个基于无共享硬件结构的并行数据库系统的原型。
关键词 PARO 并行数据库系统 设计
下载PDF
基于代理的并行空间查询语言 被引量:2
20
作者 范协裕 任应超 +1 位作者 邓富亮 王庆刚 《计算机工程》 CAS CSCD 2013年第11期61-64,共4页
目前针对并行空间数据处理的研究主要集中在空间数据划分及其在其基础上的并行空间算法,对空间并行数据库平台本身的可用性,如应用程序的开发模式、高并发请求支持等研究较少。为此,对开源并行关系数据库查询语言进行空间查询扩展,提出... 目前针对并行空间数据处理的研究主要集中在空间数据划分及其在其基础上的并行空间算法,对空间并行数据库平台本身的可用性,如应用程序的开发模式、高并发请求支持等研究较少。为此,对开源并行关系数据库查询语言进行空间查询扩展,提出一种基于代理的并行空间查询语言,并实现相应的并行数据库平台原型。基于该平台开发标准的网络地图绘图服务,在高并发环境下使用该服务对海量矢量数据进行实时渲染。实验结果表明,该平台具有与传统关系数据库一致的开发应用模式,可提供无缝的衔接方式,在海量数据高并发的情况下具有较高的可用性及查询性能。 展开更多
关键词 空间查询语言 并行空间数据处理 网络地图服务 并行数据库 空间查询 空间数据划分
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部