期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
Learned Distributed Query Optimizer:Architecture and Challenges
1
作者 GAO Jun HAN Yinjun +2 位作者 LIN Yang MIAO Hao XU Mo 《ZTE Communications》 2024年第2期49-54,共6页
The query processing in distributed database management systems(DBMS)faces more challenges,such as more operators,and more factors in cost models and meta-data,than that in a single-node DMBS,in which query optimizati... The query processing in distributed database management systems(DBMS)faces more challenges,such as more operators,and more factors in cost models and meta-data,than that in a single-node DMBS,in which query optimization is already an NP-hard problem.Learned query optimizers(mainly in the single-node DBMS)receive attention due to its capability to capture data distributions and flexible ways to avoid hard-craft rules in refinement and adaptation to new hardware.In this paper,we focus on extensions of learned query optimizers to distributed DBMSs.Specifically,we propose one possible but general architecture of the learned query optimizer in the distributed context and highlight differences from the learned optimizer in the single-node ones.In addition,we discuss the challenges and possible solutions. 展开更多
关键词 distributed query processing query optimization learned query optimizer
下载PDF
基于变分自编码器的近似聚合查询优化方法
2
作者 黄龙森 房俊 +1 位作者 周云亮 郭志城 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第5期931-940,共10页
针对偏态数据分布不平衡,传统近似聚合查询方法难以抽样生成偏态分布数据的问题,提出基于优化的变分自编码器的近似聚合查询方法,研究近似聚合查询方法对偏态分布数据的近似聚合查询准确率的影响.在预处理阶段对偏态分布数据进行分层分... 针对偏态数据分布不平衡,传统近似聚合查询方法难以抽样生成偏态分布数据的问题,提出基于优化的变分自编码器的近似聚合查询方法,研究近似聚合查询方法对偏态分布数据的近似聚合查询准确率的影响.在预处理阶段对偏态分布数据进行分层分组,对变分自编码器生成模型的网络结构和损失函数进行优化,降低近似聚合查询相对误差.实验结果表明,与基准方法相比,近似聚合查询对偏态分布数据的查询相对误差更小,且随着偏态系数的提高,查询相对误差的上升趋势更平缓. 展开更多
关键词 近似查询处理 偏态分布 机器学习 变分自编码器 分组抽样
下载PDF
面向服务的数字图书馆QGSA-DQP分布式信息查询研究 被引量:7
3
作者 李欣荣 《现代情报》 北大核心 2007年第9期106-108,共3页
同传统图书馆相比,数字图书馆在利用计算机技术、网络通信技术、面向对象的程序设计技术、数据库技术等方面集成了大量数字化资源;在资源的加工、交流传播的服务手段和形式、数字资源的共建和共享方面有了质的飞跃。然而,如何实现各个... 同传统图书馆相比,数字图书馆在利用计算机技术、网络通信技术、面向对象的程序设计技术、数据库技术等方面集成了大量数字化资源;在资源的加工、交流传播的服务手段和形式、数字资源的共建和共享方面有了质的飞跃。然而,如何实现各个操作系统不同、运行平台各异、分布的、多个异构数字图书馆间的共享与集成是一个非常迫切的问题。解决该问题的关键是如何将现有数据资源进行有效的整合。而网格理论的提出,为这一难题的解决提供了一个新的思路。结合我国数字图书馆的发展状况,提出了一个基于QGSA-DQP的分布式异构数据库信息检索模型,并从技术实现上进行了可行性的研究。 展开更多
关键词 数字图书馆 分布式查询处理 开放网格服务体系结构 QGSA—dqp 信息查询
下载PDF
IVDQP—物联网内基于兴趣向量的分布式查询处理方法 被引量:1
4
作者 张俊虎 彭辉 邵峰晶 《计算机应用与软件》 CSCD 2011年第11期207-210,共4页
物联网内资源按需检索是构建高效率物联网应用的必备功能。实现一种基于兴趣的数据单播查询处理方法IVDQP,采用一种单播的方式对任意物联网节点提出的数据检索请求进行节点间传递,并以一种累积的方式将中间节点上的检索结果按照查询单... 物联网内资源按需检索是构建高效率物联网应用的必备功能。实现一种基于兴趣的数据单播查询处理方法IVDQP,采用一种单播的方式对任意物联网节点提出的数据检索请求进行节点间传递,并以一种累积的方式将中间节点上的检索结果按照查询单播传递路径返回给查询节点。与Flooding算法的对比实验表明,提出的这种物联网内单播查询处理方法不仅能够迅速定位尽可能多的符合查询要求的数据,而且能够保证引入尽可能少的节点间的消息交换,从而为高效物联网应用的实现提供技术支持。 展开更多
关键词 物联网 分布式查询处理 兴趣向量
下载PDF
OGSA-DQP体系结构及其关键技术研究 被引量:2
5
作者 郭义锋 罗省贤 《长春工业大学学报》 CAS 2006年第4期315-319,共5页
介绍了OGSA-DAI的体系结构,分析了OGSA-DQP的功能和应用模型,详细讨论了OGSA-DQP接收和响应分布式数据查询请求的执行流程,并给出了应用关键技术的实例。
关键词 开放网格服务体系结构 数据访问与集成 分布式查询处理器
下载PDF
Improving the performance of query processing using proposed resilient distributed processing technique
6
作者 C.Lakshmi K.Usha Rani 《International Journal of Intelligent Computing and Cybernetics》 EI 2021年第2期158-169,共12页
Purpose-Resilient distributed processing technique(RDPT),in which mapper and reducer are simplified with the Spark contexts and support distributed parallel query processing.Design/methodology/approach-The proposed wo... Purpose-Resilient distributed processing technique(RDPT),in which mapper and reducer are simplified with the Spark contexts and support distributed parallel query processing.Design/methodology/approach-The proposed work is implemented with Pig Latin with Spark contexts to develop query processing in a distributed environment.Findings-Query processing in Hadoop influences the distributed processing with the MapReduce model.MapReduce caters to the works on different nodes with the implementation of complex mappers and reducers.Its results are valid for some extent size of the data.Originality/value-Pig supports the required parallel processing framework with the following constructs during the processing of queries:FOREACH;FLATTEN;COGROUP. 展开更多
关键词 query processing MAPREDUCE SCALABILITY Resilient distributed processing SPARK
原文传递
Effcient Distributed Skyline Queries for Mobile Applications 被引量:5
7
作者 肖迎元 陈跃国 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第3期523-536,共14页
In this paper, we consider skyline queries in a mobile and distributed environment, where data objects are distributed in some sites (database servers) which are interconnected through a high-speed wired network, an... In this paper, we consider skyline queries in a mobile and distributed environment, where data objects are distributed in some sites (database servers) which are interconnected through a high-speed wired network, and queries are issued by mobile units (laptop, cell phone, etc.) which access the data objects of database servers by wireless channels. The inherent properties of mobile computing environment such as mobility, limited wireless bandwidth, frequent disconnection, make skyline queries more complicated. We show how to efficiently perform distributed skyline queries in a mobile environment and propose a skyline query processing approach, called efficient distributed skyline based on mobile computing (EDS-MC). In EDS-MC, a distributed skyline query is decomposed into five processing phases and each phase is elaborately designed in order to reduce the network communication, network delay and query response time. We conduct extensive experiments in a simulated mobile database system, and the experimental results demonstrate the superiority of EDS-MC over other skyline query processing techniques on mobile computing. 展开更多
关键词 SKYLINE distributed query processing mobile database system
原文传递
HOS:一种基于HBase的分布式存储系统设计与实现 被引量:18
8
作者 季一木 张宁 +4 位作者 尧海昌 李奎 李航 刘尚东 王汝传 《南京邮电大学学报(自然科学版)》 北大核心 2019年第5期63-71,共9页
大数据时代,数据快速增长,迫切需要寻找有效的数据存储方案,HBase系统具有分布式、列式存储的特点,为大数据的存储管理提供了一种高效的解决方案。由于HBase只支持主键索引,对于非主键查询效率低下,难以满足实时需求。为此,提出一种分... 大数据时代,数据快速增长,迫切需要寻找有效的数据存储方案,HBase系统具有分布式、列式存储的特点,为大数据的存储管理提供了一种高效的解决方案。由于HBase只支持主键索引,对于非主键查询效率低下,难以满足实时需求。为此,提出一种分层式索引查询模型,该模型基于HBase建立持久性索引层,基于Redis建立分布式热点索引缓存层。前者为存储在HBase中的数据建立索引表,提高查询效率,后者基于Redis在内存中存储热点索引,降低磁盘访问开销,进一步提高查询效率。最终,依据此模型实现了分层式索引查询系统HOS,基于Imagenet图片数据集对HOS进行实验,实验结果表明,HOS数据查询性能优于标准HBase。 展开更多
关键词 HBASE 查询处理 分层式索引 分布式存储
下载PDF
Globus3下的数据访问方法 被引量:4
9
作者 庞雄文 齐德昱 李拥军 《计算机应用研究》 CSCD 北大核心 2006年第4期68-70,共3页
描述了G lobus 3.2环境下的数据访问特点,介绍了基于OGSA的数据访问集成工具OGSA-DAI以及分布数据查询处理工具OGSA-DQP的原理和使用方法,给出了具体的程序例子。
关键词 网格 数据库 数据访问集成(DAI) 分布式查询处理(dqp) GLOBUS
下载PDF
大规模分布式系统中的多属性查询处理 被引量:11
10
作者 周傲英 周敏奇 +1 位作者 钱卫宁 张蓉 《计算机学报》 EI CSCD 北大核心 2008年第9期1563-1572,共10页
大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹配查询也支持范围查... 大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹配查询也支持范围查询.和现有其它技术相比,对于任何数据元组,GChord只需要对其编码和索引一次,且能将查询处理的代价限制在一个很小的范围内.因此,它能在索引维护代价和查询效率之间达到平衡.GChord还提供优化技术以进一步提升性能.实验证实了GChord具有较高的查询处理效率以及较低的索引维护代价. 展开更多
关键词 多属性查询处理 重叠网络 分布式系统
下载PDF
WWW分布数据源研究——数据模型和查询语言 被引量:11
11
作者 陈滢 徐宏炳 王能斌 《软件学报》 EI CSCD 北大核心 1998年第8期566-573,共8页
该文提出了分布式WWW(world-wideweb)数据源WWWDS(WWWdatasources)概念,详细介绍了WWWDS的数据模型.该数据模型包括节点、节点容器、节点图和链接点等,简单且具有扩展性,同时提出相应... 该文提出了分布式WWW(world-wideweb)数据源WWWDS(WWWdatasources)概念,详细介绍了WWWDS的数据模型.该数据模型包括节点、节点容器、节点图和链接点等,简单且具有扩展性,同时提出相应的查询能力强的查询语言WWWQL(WWWquerylanguage),并进一步探讨了查询处理和优化问题. 展开更多
关键词 WWW 分布数据源 数据模型 查询语言 INTERNET网
下载PDF
利用MySQL构建分布式应用 被引量:12
12
作者 张飞 姜进磊 李庆虎 《计算机工程与应用》 CSCD 北大核心 2001年第18期102-104,112,共4页
计算机网络的发展为分布式数据处理提供了可能。然而分布式的引入给数据管理带来新的挑战。现有的数据库如何做才能满足分布式的要求?文章提出了分布式数据管理的一种实现方法,它采用MySQL作为底层的数据库,在上面增加了分布式处理... 计算机网络的发展为分布式数据处理提供了可能。然而分布式的引入给数据管理带来新的挑战。现有的数据库如何做才能满足分布式的要求?文章提出了分布式数据管理的一种实现方法,它采用MySQL作为底层的数据库,在上面增加了分布式处理模块。通过这种方式,很容易扩展原有的数据库使之满足分布式的要求。该方法同样适用于其他的数据库。 展开更多
关键词 分布式数据库 数据字典 MYSQL 消息平台 数据管理
下载PDF
基于统计方法的Hive数据仓库查询优化实现 被引量:16
13
作者 王有为 王伟平 孟丹 《计算机研究与发展》 EI CSCD 北大核心 2015年第6期1452-1462,共11页
Map/Reduce是海量离线数据分析中广泛应用的并行编程模型。Hive数据仓库基于Map/Reduce实现了查询处理引擎,然而Map/Reduce框架在处理偏斜数据时会出现工作负载分布不均的问题。均衡计算模型(computation balanced model,CBM),其核心... Map/Reduce是海量离线数据分析中广泛应用的并行编程模型。Hive数据仓库基于Map/Reduce实现了查询处理引擎,然而Map/Reduce框架在处理偏斜数据时会出现工作负载分布不均的问题。均衡计算模型(computation balanced model,CBM),其核心思想是通过数据分布特征指导查询计划优化。相应研究贡献包括2部分,首先针对应用极广的GroupBy查询和Join查询建立了运行估价模型,确定了不同场景下查询计划的优化选择分支;其次基于Hive ETL机制设计了一种统计信息收集方法,解决了统计海量数据分布特征的问题。实验数据表明,通过CBM优化的GroupBy查询耗时节省了8%~45%,Join查询耗时节省了12%~46%;集群CPU负载均衡指标优化了60%~80%,I/O负载均衡指标优化了60%~90%。实验结果证实了基于CBM模型优化的查询计划生成器能显著均衡化Hive查询运行时的集群负载,并优化了查询处理效率。 展开更多
关键词 海量数据离线处理 分布式数据仓库 负载均衡 统计信息收集 查询优化
下载PDF
分布式数据流处理中的负载分配策略 被引量:2
14
作者 王金栋 周良 +1 位作者 张磊 丁秋林 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第2期212-216,共5页
在分布式数据流系统中,连续查询网络数据流通常需要在多台计算机上运行,其中每台计算机运行连续查询网络的一个子网,它们相互合作共同完成连续查询任务。当输入数据流速发生较大波动时,会引起相关连续查询子网过载,从而影响整个连续查... 在分布式数据流系统中,连续查询网络数据流通常需要在多台计算机上运行,其中每台计算机运行连续查询网络的一个子网,它们相互合作共同完成连续查询任务。当输入数据流速发生较大波动时,会引起相关连续查询子网过载,从而影响整个连续查询网络的数据处理能力。针对这一实际问题,分析了分布式数据流系统和连续查询网络的特点以及现有负载处理方法,建立了问题的规划模型,提出了分布式数据流处理的一种负载分配策略。该策略以元操作为基本负载移动单元,在保证系统负载平衡的前提下,极小化节点间的数据传输量。实验测试了负载与延迟之间的关系以及负载随时间的波动情况,结果表明了策略的有效性。 展开更多
关键词 数据处理 负载 数据流 连续查询 负载分配
下载PDF
分布式RDF数据管理综述 被引量:15
15
作者 邹磊 彭鹏 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1213-1224,共12页
资源描述框架(resource description framework,RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行... 资源描述框架(resource description framework,RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行查询检索.随着RDF数据规模的日益增长,在现有RDF数据库上进行SPARQL查询处理已经超出了单机的处理能力.于是,人们需要设计出高性能的分布式RDF数据库以支持对SPARQL查询进行高效的处理.当前,已经有大量的工作来讨论如何搭建分布式RDF数据管理系统.对这些不同的分布式RDF数据管理方法进行综述,将现有的分布式RDF数据管理方法分成3类:基于云计算平台的分布式RDF数据管理方法、基于数据划分的分布式RDF数据管理方法和联邦式系统.基于云计算平台的分布式RDF数据管理方法利用已有云平台进行RDF数据的管理;基于数据划分的分布式RDF数据管理方法首先将RDF数据图划分成若干子图,然后将这些子图分配到不同计算节点上;联邦式系统的特点是数据已经分布在不同节点上,数据管理系统无法控制数据的分布.在每类分布式RDF数据管理方法的介绍中,将深入讨论以帮助读者了解各种方法的特点. 展开更多
关键词 RDF数据管理 SPARQL查询处理 分布式数据库系统 云计算 关联数据
下载PDF
基于不确定数据的分布式Top-k查询算法 被引量:2
16
作者 王爽 王国仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第2期177-180,共4页
目前基于不确定数据的Top-k查询算法仅考虑了集中式的环境,为了解决分布式系统中节省系统带宽的问题,在此基础上,提出了在分布式环境中基于不确定数据的Top-k查询算法UDTopk.该算法定义了一个候选集(candidate set),仅使用候选集中的数... 目前基于不确定数据的Top-k查询算法仅考虑了集中式的环境,为了解决分布式系统中节省系统带宽的问题,在此基础上,提出了在分布式环境中基于不确定数据的Top-k查询算法UDTopk.该算法定义了一个候选集(candidate set),仅使用候选集中的数据,而不用访问数据集中所有数据,就可以得到正确的Top-k查询答案.算法通过动态维护候选集、仅传输少量数据,达到减少网络中数据传输的目的.实验结果表明,该算法可以有效地节省网络带宽. 展开更多
关键词 TOP-K查询 不确定数据 分布式处理 通信代价 查询处理
下载PDF
科学数据网格中分布式查询处理体系结构的研究 被引量:2
17
作者 周园春 佟强 +1 位作者 吴开超 阎保平 《微电子学与计算机》 CSCD 北大核心 2006年第1期45-47,共3页
数据网格是一种有效的分布式数据管理体系结构,该结构下的分布式查询处理和其他环境下的分布式查询处理有很多不同的地方,如结点的自治性等。根据科学数据网格分布式查询处理的特点,提出了该环境下分布式查询处理的体系结构,并给出其协... 数据网格是一种有效的分布式数据管理体系结构,该结构下的分布式查询处理和其他环境下的分布式查询处理有很多不同的地方,如结点的自治性等。根据科学数据网格分布式查询处理的特点,提出了该环境下分布式查询处理的体系结构,并给出其协商机制。 展开更多
关键词 科学数据网格 分布式查询处理 移动代理 经济模型
下载PDF
分布式数据库半连接查询优化算法的研究 被引量:5
18
作者 于秀霞 宋雅娟 《长春理工大学学报(自然科学版)》 2006年第4期69-72,共4页
在分布式数据查询处理中,连接操作是最常用的、费时的而且代价较高的一种操作,也是影响查询效率的关键因素。在处理连接操作的优化时,通常采用半连接的方法来缩减操作数,减少网络传输代价,降低通信费用。本文在研究前人的传统算法基础上... 在分布式数据查询处理中,连接操作是最常用的、费时的而且代价较高的一种操作,也是影响查询效率的关键因素。在处理连接操作的优化时,通常采用半连接的方法来缩减操作数,减少网络传输代价,降低通信费用。本文在研究前人的传统算法基础上,针对半连接操作提出了一种新的改进算法,在处理分布式数据库中海量信息查询和复杂查询领域里具有实用的价值。 展开更多
关键词 分布式数据库 查询处理 优化算法 半连接
下载PDF
连续概率XML数据查询处理技术 被引量:1
19
作者 张晓琳 郑珍珍 +1 位作者 刘立新 李玉峰 《计算机工程与科学》 CSCD 北大核心 2012年第12期134-139,共6页
目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及... 目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。 展开更多
关键词 p-文档模型 概率XML 连续分布 查询处理
下载PDF
基于数据隐私保护的分布式索引算法研究 被引量:3
20
作者 苏燕 梁武 《科技通报》 2019年第1期164-168,共5页
为了保证查询者能够在云平台上更快速地得到相应的数据信息,本文首先构建了PR-CAN的整体层次,通过双层索引建立起本地-云端的索引形式,在各个服务器形成分布式的查询索引网络。在本地索引PR-tree结点和全局CAN结点之间找到合适的映射关... 为了保证查询者能够在云平台上更快速地得到相应的数据信息,本文首先构建了PR-CAN的整体层次,通过双层索引建立起本地-云端的索引形式,在各个服务器形成分布式的查询索引网络。在本地索引PR-tree结点和全局CAN结点之间找到合适的映射关系,并证明了该方式能够保证CAN索引覆盖到每一个PR-tree结点,保证了本系统查询的准确性。仿真实验表明:PR-CAN索引查询系统能够在搭建的实验云环境中正常运行,运行效率、可靠性、安全性均表现良好,能够有效适应各类云计算应用。 展开更多
关键词 数据隐私 隐私保护了 分布式 查询处理
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部