期刊文献+
共找到250篇文章
< 1 2 13 >
每页显示 20 50 100
POTENTIAL: A Highly Adaptive Core of Parallel Database System
1
作者 文继荣 陈红 王珊 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第6期527-541,共15页
POTENTIAL is a virtual database machine based on general computing platforms, especially parallel computing platforms. It provides a complete solution to high-performance database systems by a 'virtual processor ... POTENTIAL is a virtual database machine based on general computing platforms, especially parallel computing platforms. It provides a complete solution to high-performance database systems by a 'virtual processor + virtual data bus + virtual memory' architecture. Virtual processors manage all CPU resources in the system, on which various operations are running. Virtual data bus is responsible for the management of data transmission between associated operations, which forms the hinges of the entire system. Virtual memory provides efficient data storage and buffering mechanisms that conform to data reference behaviors in database systems. The architecture of POTENTIAL is very clear and has many good features, including high efficiency, high scalability, high extensibility, high portability, etc. 展开更多
关键词 virtual database machine virtual data bus virtual processor virtual memory parallel database
原文传递
PORLES:A Parallel Object Relational Database System
2
作者 Sun Yong\|qiang, Xu Shu\|ting, Zhu Feng\|hua, Lai Shu\|huaDepartment of Computer Science and Engineering, Shanghai Jiaotong University, Shanghai 200030,China 《Wuhan University Journal of Natural Sciences》 CAS 2001年第Z1期100-109,共10页
We developed a parallel object relational DBMS named PORLES. It uses BSP model as its parallel computing model, and monoid calculus as its basis of data model. In this paper, we introduce its data model, parallel que... We developed a parallel object relational DBMS named PORLES. It uses BSP model as its parallel computing model, and monoid calculus as its basis of data model. In this paper, we introduce its data model, parallel query optimization, transaction processing system and parallel access method in detail. 展开更多
关键词 parallel object relational database BSP model data model query optimization
下载PDF
An Improved Hilbert Curve for Parallel Spatial Data Partitioning 被引量:7
3
作者 MENG Lingkui HUANG Changqing ZHAO Chunyu LIN Zhiyong 《Geo-Spatial Information Science》 2007年第4期282-286,共5页
A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on t... A novel Hilbert-curve is introduced for parallel spatial data partitioning, with consideration of the huge-amount property of spatial information and the variable-length characteristic of vector data items. Based on the improved Hilbert curve, the algorithm can be designed to achieve almost-uniform spatial data partitioning among multiple disks in parallel spatial databases. Thus, the phenomenon of data imbalance can be significantly avoided and search and query efficiency can be enhanced. 展开更多
关键词 parallel spatial database spatial data partitioning data imbalance Hilbert curve
下载PDF
Storage and Parallel Loading System Based on Mode Network for Multimode Medical Image Data
4
作者 Xiao Zhai Haiwei Pan +2 位作者 Xiaoqin Xie Zhiqiang Zhang Qilong Han 《国际计算机前沿大会会议论文集》 2016年第2期61-62,共2页
Since Multimode data is composed of many modes and their complex relationships,it cannot be retrieved or mined effectively by utilizing traditional analysis and processing techniques for single mode data.To address th... Since Multimode data is composed of many modes and their complex relationships,it cannot be retrieved or mined effectively by utilizing traditional analysis and processing techniques for single mode data.To address the challenges,we design and implement a graph-based storage and parallel loading system aimed at multimode medical image data.The system is a framework designed to flexibly store and rapidly load these multimode data.Specifically,the system utilizes the Mode Network to model the modes and their relationships in multimode medical image data and the graph database to store the data with a parallel loading technique. 展开更多
关键词 MULTIMODE MEDICAL image data MODE NETWORK GRAPH database parallel loading
下载PDF
面向分布式数据库的算子并行优化策略
5
作者 刘文洁 吕靖超 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第3期453-459,共7页
随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,... 随着网络技术的不断发展,数据规模呈现爆发式增长,使得传统的单机数据库逐步被分布式数据库所取代。分布式数据库采用节点协同工作方式解决了大规模数据存储问题,但由于增加了节点间通信开销,查询效率却不如单机数据库。分布式架构下,存储节点的数据仅用作多备份的冗余,为系统故障时提供数据恢复,并未被利用起来改善查询效率。针对上述问题,提出了一种面向分布式数据库的算子并行优化策略,通过对关键物理算子进行拆分,将拆分后的子请求均匀分配到存储层多个节点,由多个节点并行处理,从而减少查询响应时间。上述策略已经在分布式数据库CBase上进行了应用,实验表明,提出的并行优化策略可显著缩短SQL请求查询时间,并提高系统资源利用率。 展开更多
关键词 分布式数据库 并行查询 查询优化 负载均衡 数据分区
下载PDF
基于流计算和大数据平台的实时交通流预测 被引量:1
6
作者 李星辉 曾碧 魏鹏飞 《计算机工程与设计》 北大核心 2024年第2期553-561,共9页
目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后... 目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后的数据sink到大数据的HDFS文件系统,交由下一步的大数据并行框架进行分析建模与训练,实现基于流计算和大数据平台的实时交通流预测。实验结果表明,Flink能够实时捕捉和预处理交通流数据,把数据准时无误送入分布式文件系统中,在此基础上借助大数据框架下的并行分析和建模优势,在实时性数据分析与预测方面取得了较好的效果。 展开更多
关键词 大数据 数据并行 流计算框架 实时处理 交通流预测 分布式系统 实时性分析
下载PDF
一种基于Yarn云平台的基因启发式多序列比对算法
7
作者 杨波 徐胜超 +1 位作者 周继鹏 王志坚 《电子技术应用》 2024年第11期16-22,共7页
提出一种基于Yarn云平台的基因启发式多序列比对算法。建立核酸替换等价矩阵作为基因启发式数学模型,构建Yarn云平台逻辑架构,通过对基因数据预处理、基因数据存储、基因序列比对、基因数据管理、基因数据分析等步骤,对数据分类保存,划... 提出一种基于Yarn云平台的基因启发式多序列比对算法。建立核酸替换等价矩阵作为基因启发式数学模型,构建Yarn云平台逻辑架构,通过对基因数据预处理、基因数据存储、基因序列比对、基因数据管理、基因数据分析等步骤,对数据分类保存,划分错误率较高的长序列,得到多个较短的基因片段。对不同片段实施定位,将其中的变长种子生成,进行骨架构建和孔隙填补,可以实现基因启发式多序列比对。结果表明,设计的算法在不同数据集下处理时间缩短,多序列比对SP(Sum of Pairs)的分值较高,实验验证了该多序列比对方法具有很好的应用价值。 展开更多
关键词 生物数据 并行计算 分布式计算架构 分布式数据库系统 大数据处理平台
下载PDF
异构信息网络中节点相似性搜索并行算法研究
8
作者 徐小玉 陈仲委 《浙江万里学院学报》 2024年第3期82-90,共9页
传统的基于串行计算的节点相似性搜索算法,在处理增量式异构信息网络数据流时面临效率低下、资源消耗过大等问题。为此,文章利用同构信息网络中并行约简的基本原理与基本方法,定义了异构信息网络的并行约简度量方法:值相似依赖度和余弦... 传统的基于串行计算的节点相似性搜索算法,在处理增量式异构信息网络数据流时面临效率低下、资源消耗过大等问题。为此,文章利用同构信息网络中并行约简的基本原理与基本方法,定义了异构信息网络的并行约简度量方法:值相似依赖度和余弦实体相似依赖度,提出异构数据流中元路径下节点相似性搜索并行算法(FPathSim),F-PathSim可以并行约简、并行计算,整体上删除对节点相似性搜索冗余的数据,减少对整个数据集的重复处理。在DBLP数据集上进行大量的实验,实验结果表明F-PathSim能较好的适应异构信息网络中增量式数据流中节点相似性搜索要求。 展开更多
关键词 异构信息网络 同构信息网络 并行约简 元路径 增量式数据流 相似依赖度
下载PDF
一种近似最小有效瓶颈优先的Coflow调度机制 被引量:1
9
作者 李文信 周晓波 +2 位作者 徐仁海 齐恒 李克秋 《计算机工程》 CAS CSCD 北大核心 2019年第10期19-25,32,共8页
针对先验知识未知场景下的Coflow调度问题,提出一种近似最小有效瓶颈优先的Coflow调度方法。通过结合Coflow当前大小和宽度决定Coflow的调度顺序,并区分出流大小以及短与长等特征的Coflow,从而加大调度优化的空间。实验结果表明,与先验... 针对先验知识未知场景下的Coflow调度问题,提出一种近似最小有效瓶颈优先的Coflow调度方法。通过结合Coflow当前大小和宽度决定Coflow的调度顺序,并区分出流大小以及短与长等特征的Coflow,从而加大调度优化的空间。实验结果表明,与先验知识未知场景下的Aalo方法相比,该方法可使Coflow的平均完成时间降低33.2%,相较于先验知识已知场景下的SEBF方法,Coflow平均完成时间与其仅有7.3%的性能差距。 展开更多
关键词 数据中心 并行计算 Coflow调度 流量调度 近似最小有效瓶颈优先
下载PDF
Database Research: Achievements and Challenges 被引量:4
10
作者 王珊 杜小勇 +1 位作者 孟小峰 陈红 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第5期823-837,共15页
Database system is the infrastructure of the modern information system. The R&D in the database system and its technologies is one of the important research topics in the field. The database R&D in China took off la... Database system is the infrastructure of the modern information system. The R&D in the database system and its technologies is one of the important research topics in the field. The database R&D in China took off later but it moves along by giant steps. This report presents the achievements Renmin University of China (RUC) has made in the past 25 years and at the same time addresses some of the research projects we, RUC, are currently working on. The National Natural Science Foundation of China supports and initiates most of our research projects and these successfully conducted projects have produced fruitful results. 展开更多
关键词 database management system parallel database systems Chinese database systems self-managing databases P2P computing and databases data warehousing OLAP Web data management XML mobile data management semantic web contextual information retrieval
原文传递
一种基于卷烟工业导流式数据传输的技术研究
11
作者 王正敏 汪炎平 +1 位作者 张敏 董惠良 《科技通报》 2023年第10期18-22,共5页
新一轮科技革命和产业变革正加快我国经济发展方式转变,制造业格局面临重大调整,云计算、大数据、物联网、移动互联网、人工智能等新一代信息技术的发展日新月异,为传统制造企业转型升级提供新方法和新思路。随着新一代信息技术在制造... 新一轮科技革命和产业变革正加快我国经济发展方式转变,制造业格局面临重大调整,云计算、大数据、物联网、移动互联网、人工智能等新一代信息技术的发展日新月异,为传统制造企业转型升级提供新方法和新思路。随着新一代信息技术在制造业的广泛普及和深度融合,工业数据量呈指数态势增长,本文引入一种基于卷烟工业导流式数据传输的技术研究,为海量的工业数据提供高效直达的传输通道,对助力制造企业转型升级具有重要的理论意义和实际价值。 展开更多
关键词 边缘计算 物联网平台 流式计算 时序数据库 数据治理
下载PDF
基于OpenMP的并行Fortran程序数据竞争静态检测方法
12
作者 葛优 金大海 宫云战 《小型微型计算机系统》 CSCD 北大核心 2023年第11期2377-2383,共7页
数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和... 数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和语义特性,构建并行程序的抽象语法树,并对控制流图进行扩展引入并行控制流图;然后将数据竞争问题抽象为一种故障模型,利用有限状态机来形式化的描述此类故障模型;最后对并行区域的潜在赋值操作进行并行数据流分析,在程序控制流图节点上进行故障状态机的状态转化来实现数据竞争的检测.该方法已在自研的缺陷检测系统(DTS)中应用,并通过DataRaceBench的实验数据证明本文方法可以有效的检测出数据竞争问题. 展开更多
关键词 OPENMP 静态分析 共享内存编程 数据竞争检测 并行数据流
下载PDF
申威处理器上数据流运行时系统的设计与实现
13
作者 张鹏飞 陈俊仕 +3 位作者 郑重 沈沛祺 安虹 许乐 《计算机工程》 CAS CSCD 北大核心 2023年第12期46-54,共9页
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、... 我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、点对点同步的特点能够很好地解决上述问题。基于Codelet程序执行模型和申威主从核架构特点,设计并实现面向申威处理器的数据流运行时系统swTasklet,通过对Codelet功能的进一步细化和对Codelet机器模型到主从核的映射,避免从核阵列上的同步操作,减少同步开销;由主核完成从核计算任务的调度分配,将计算和同步操作分离,保证运行时系统可以和从核计算库的共用。实验以NPB LU程序和向量-向量加作为测试用例,采用相同的优化方法分别对swTasklet和athread实现进行并行化。实验结果表明:在规模较大情况下,LU程序的swTasklet实现版本比athread版本快16%,向量-向量加swTasklet实现版本比athread版本快1倍;使用swTasklet实现的LU并行版本较主核本取得了平均8倍以上的加速,而向量-向量加swTasklet版本较主核版本取得30倍左右的加速。 展开更多
关键词 申威异构处理器 数据流运行时系统 Codelet程序执行模型 并行编程模型 众核加速
下载PDF
Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases 被引量:12
14
作者 周傲英 周水庚 +2 位作者 曹晶 范晔 胡运发 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第6期509-526,共18页
The huge amount of information stored in databases owned by corporations (e.g., retail, financial, telecom) has spurred a tremendous interest in the area of knowledge discovery and data mining. Clustering, in data mi... The huge amount of information stored in databases owned by corporations (e.g., retail, financial, telecom) has spurred a tremendous interest in the area of knowledge discovery and data mining. Clustering, in data mining, is a useful technique for discovering interesting data distributions and patterns in the underlying data, and has many application fields, such as statistical data analysis, pattern recognition, image processing, and other business applications. Although researchers have been working on clustering algorithms for decades, and a lot of algorithms for clustering have been developed, there is still no efficient algorithm for clustering very large databases and high dimensional data. As an outstanding representative of clustering algorithms, DBSCAN algorithm shows good performance in spatial data clustering. However, for large spatial databases, DBSCAN requires large volume of memory support and could incur substantial I/O costs because it operates directly on the entire database. In this paper, several approaches are proposed to scale DBSCAN algorithm to large spatial databases. To begin with, a fast DBSCAN algorithm is developed, which considerably speeds up the original DBSCAN algorithm. Then a sampling based DBSCAN algorithm, a partitioning-based DBSCAN algorithm, and a parallel DBSCAN algorithm are introduced consecutively. Following that, based on the above-proposed algorithms, a synthetic algorithm is also given. Finally, some experimental results are given to demonstrate the effectiveness and efficiency of these algorithms. 展开更多
关键词 spatial database CLUSTERING fast DBSCAN algorithm data sampling data partitioning parallel
原文传递
PERFORMANCE ANALYSIS OF STATIC DATA FLOW COMPUTERS
15
作者 刘桂仲 慈云桂 吴涛 《Science China Mathematics》 SCIE 1991年第7期857-865,共9页
First, a model of static data flow computer and a model of data flow graph are pro-posed; then a model of system is presented to calculate practical parallelism degree withoverhead of instruction execution on data flo... First, a model of static data flow computer and a model of data flow graph are pro-posed; then a model of system is presented to calculate practical parallelism degree withoverhead of instruction execution on data flow computers as its parameter. From the compu-tation, the maximum practical parallelism degree of a program running on a static dataflow computer is determined with MP/OH (MP is the mean parallelism degree of a program,OH is the overhead of instruction execution on the computer). Therefore the overhead hasgreat influence on the performance of a data flow computer. 展开更多
关键词 data flow performance analysis OVERHEAD parallelISM degree.
原文传递
基于车辆的关系型数据库性能提升
16
作者 刘路 孙代青 +2 位作者 王瑞 王光福 张文成 《汽车实用技术》 2023年第9期124-128,共5页
随着电器架构的日益增多,车辆运行过程中会上报大量的行车数据,使用数据库处理的数据量增加,请求难度也在升级,为了能够长期稳定地保存大量的车辆数据,快速查询出所需数据为研发工程师提供数据分析,需要设计出适合存放车辆数据的关系型... 随着电器架构的日益增多,车辆运行过程中会上报大量的行车数据,使用数据库处理的数据量增加,请求难度也在升级,为了能够长期稳定地保存大量的车辆数据,快速查询出所需数据为研发工程师提供数据分析,需要设计出适合存放车辆数据的关系型数据库。PostgreSQL作为先进的开源数据库,支持复杂查询、并发控制等功能。文章针对基于车辆的关系型数据库提出多线程并行查询、创建数据表索引、添加数据库分区以及应用程序连接池的设计优化方法,针对性地对数据库的运行效率提供优化策略。测试结果表明,文章所提出的数据库性能提升方法能将数据请求效率提升数倍,数据库的性能得到极大提升。 展开更多
关键词 关系型数据库 POSTGRESQL 并行查询 数据表索引 数据库分区
下载PDF
连铸机数据采集系统的设计与应用
17
作者 张瑞忠 郑京辉 +4 位作者 李杰 高宇 曹金帅 孙剑 刘小军 《河北冶金》 2023年第12期80-86,共7页
随着人工智能技术越来越广泛地应用于钢铁行业,对数字化和信息化技术在钢厂的应用提出了新的要求和挑战,目前国内钢铁企业数字化技术的应用还处于发展阶段,尤其是某些较早投产的产线信息化应用还较欠缺。连铸工序作为炼钢生产过程的重... 随着人工智能技术越来越广泛地应用于钢铁行业,对数字化和信息化技术在钢厂的应用提出了新的要求和挑战,目前国内钢铁企业数字化技术的应用还处于发展阶段,尤其是某些较早投产的产线信息化应用还较欠缺。连铸工序作为炼钢生产过程的重要一环,数字化应用还有很多有待开发和优化的工作,特别是从企业当前的实际情况和需求出发,自主开发模型化和数字化解决方案具有相当的必要性和重要性。以某厂板坯连铸机为例,探讨了连铸机设备和工艺参数的采集和存储特点,通过分析数据类型及用途,优化设计了表与表的关系,实现了高效的PLC数据采集和存储;通过优化数据库设计达到了存储容量和查询效率的平衡。同时在数据采集的基础上,面向当前数字化、智能化发展的趋势和应用需求,开展了数据采集和模型化框架研究,实现了基于C/S架构的分布式应用设计,并进一步实现了浇次、炉次、坯次识别、铸流跟踪和混浇模型的应用,为产线改造和自主数字化、模型化开发探索了可行的路径。 展开更多
关键词 连铸 数据采集 数据库 数字化 C/S架构 铸流跟踪
下载PDF
架构大数据:挑战、现状与展望 被引量:616
18
作者 王珊 王会举 +1 位作者 覃雄派 周烜 《计算机学报》 EI CSCD 北大核心 2011年第10期1741-1752,共12页
大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架... 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望. 展开更多
关键词 大数据 大规模可扩展 MAPREDUCE 并行数据库 深度分析
下载PDF
一种面向并行空间数据库的数据划分算法研究 被引量:26
19
作者 赵春宇 孟令奎 林志勇 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2006年第11期962-965,共4页
面向基于对象关系型数据库而构建的并行空间数据库系统,提出了一种基于Hilbert空间填充曲线的适合于矢量空间数据的数据划分算法。在充分考虑空间信息的海量特征以及矢量数据存储记录的不定长等特点的前提下,该算法可实现并行空间数据... 面向基于对象关系型数据库而构建的并行空间数据库系统,提出了一种基于Hilbert空间填充曲线的适合于矢量空间数据的数据划分算法。在充分考虑空间信息的海量特征以及矢量数据存储记录的不定长等特点的前提下,该算法可实现并行空间数据库中海量空间数据记录在多个存储设备上的均衡划分,以避免出现数据倾斜现象,从而提高了空间数据的检索与查询效率。 展开更多
关键词 并行空间数据库 数据划分 数据倾斜 Hilbert空间填充曲线
下载PDF
一种并行XML数据库分片策略 被引量:7
20
作者 王国仁 汤南 +2 位作者 于亚新 孙冰 于戈 《软件学报》 EI CSCD 北大核心 2006年第4期770-781,共12页
主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查... 主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵XML数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个NP-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的XML数据分片算法WIN(workload-awareintermediarynodesdataplacementstrategy).大量实验结果证明:WIN算法的性能要优于以往的并行XML数据分片策略. 展开更多
关键词 并行数据库 XML文档 工作负载 数据分片 媒介节点
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部