期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于机器学习的基数估计技术综述
1
作者 岳文静 屈稳稳 +1 位作者 林宽 王晓玲 《计算机研究与发展》 EI CSCD 北大核心 2024年第2期413-427,共15页
基数估计是数据库关系系统查询优化器的基础和核心.随着人工智能技术的发展,其在数据处理、提取数据之间的关系等方面显现出优越的性能.近年来,基于机器学习的基数估计技术取得了显著的进展,受到了学术界的广泛关注.首先总结了基于机器... 基数估计是数据库关系系统查询优化器的基础和核心.随着人工智能技术的发展,其在数据处理、提取数据之间的关系等方面显现出优越的性能.近年来,基于机器学习的基数估计技术取得了显著的进展,受到了学术界的广泛关注.首先总结了基于机器学习的技术估计技术的发展现状,其次给出了基数估计的相关概念及其特征编码技术.接着建立了基数估计技术的分类体系.在此基础上,进一步将基于机器学习的基数估计技术细分为查询驱动、数据驱动和混合模型这3类基数估计技术.然后重点分析了每一类技术的建模流程、典型技术和模型特点,并对其在SQL和NoSQL中的应用进行了分析和总结.最后讨论了基于机器学习的基数估计技术面临的挑战和未来的研究方向。 展开更多
关键词 数据库 基数估计 机器学习 查询优化 神经网络
下载PDF
基于TreeLSTM的查询基数估计
2
作者 齐凯阳 于炯 +1 位作者 何贞贞 苏子航 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第1期55-64,共10页
针对传统的数据库管理系统无法很好地学习谓词之间的交互以及无法准确地估计复杂查询的基数问题,提出了一种树形结构的长短期记忆神经网络(Tree Long Short Term Memory, TreeLSTM)模型建模查询,并使用该模型对新的查询基数进行估计.所... 针对传统的数据库管理系统无法很好地学习谓词之间的交互以及无法准确地估计复杂查询的基数问题,提出了一种树形结构的长短期记忆神经网络(Tree Long Short Term Memory, TreeLSTM)模型建模查询,并使用该模型对新的查询基数进行估计.所提出的模型考虑了查询语句中包含的合取和析取运算,根据谓词之间的操作符类型将子表达式构建为树形结构,根据组合子表达式向量来表示连续向量空间中的任意逻辑表达式.TreeLSTM模型通过捕捉查询谓词之间的顺序依赖关系从而提升基数估计的性能和准确度,将TreeLSTM与基于直方图方法、基于学习的MSCN和TreeRNN方法进行了比较.实验结果表明:TreeLSTM的估算误差比直方图、MSCN、TreeRNN方法的误差分别降低了60.41%,33.33%和11.57%,该方法显著提高了基数估计器的性能. 展开更多
关键词 基数估计 数据库管理系统 查询优化器 神经网络 长短期记忆网络
下载PDF
OLAP查询基数预估能力评估
3
作者 简炜 胡梓锐 张蓉 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期141-151,共11页
查询优化可以显著提升联机分析处理(online analytical processing,OLAP)数据库系统对海量教育数据的分析效率,为智能教学系统提供快速、精准的数据支持.优化器主要包含基数预估、空间枚举和代价模型3个模块.其中,基数预估决定代价模型... 查询优化可以显著提升联机分析处理(online analytical processing,OLAP)数据库系统对海量教育数据的分析效率,为智能教学系统提供快速、精准的数据支持.优化器主要包含基数预估、空间枚举和代价模型3个模块.其中,基数预估决定代价模型的结果,并指导查询计划的选择.因此,优化器的基数预估模块评估对OLAP数据库系统优化起到积极的推动作用.本文设计并实现了一套基于主键驱动的、构造多样化数据分布和数据关联关系的有效负载生成工具,包含自定义关联关系的数据生成技术、基于有限状态机的负载模版生成技术和目标基数驱动的参数实例化技术.并在3个数据库OceanBase、TiDB和PostgreSQL上进行了实验,分析了3个数据库优化器存在的问题,并给出了建议. 展开更多
关键词 分析型数据库 查询优化 基数预估
下载PDF
An accurate selectivity estimation method for window queries and an implementation thereof
4
作者 Changxiu CHENG Jing YANG +2 位作者 Xiaomei SONG Shanli YANG Lijun WANG 《Geo-Spatial Information Science》 SCIE CSCD 2015年第2期81-89,共9页
Spatial selectivity estimation is crucial to choose the cheapest execution plan for a given query in a query optimizer.This article proposes an accurate spatial selectivity estimation method based on the cumulative de... Spatial selectivity estimation is crucial to choose the cheapest execution plan for a given query in a query optimizer.This article proposes an accurate spatial selectivity estimation method based on the cumulative density(CD)histograms,which can deal with any arbitrary spatial query window.In this method,the selectivity can be estimated in original logic of the CD histogram,after the four corner values of a query window have been accurately interpolated on the continuous surface of the elevation histogram.For the interpolation of any corner points,we first identify the cells that can affect the value of point(x,y)in the CD histogram.These cells can be categorized into two classes:ones within the range from(0,0)to(x,y)and the other overlapping the range from(0,0)to(x,y).The values of the former class can be used directly,whereas we revise the values of any cells falling in the latter class by the number of vertices in the corresponding cell and the area ratio covered by the range from(0,0)to(x,y).This revision makes the estimation method more accurate.The CD histograms and estimation method have been implemented in INGRES.Experiment results show that the method can accurately estimate the selectivity of arbitrary query windows and can help the optimizer choose a cheaper query plan. 展开更多
关键词 cumulative density(CD)histogram selectivity estimation window queries spatial database spatial query optimization
原文传递
基于多头自注意力机制的基数估计研究
5
作者 王焱 陈珊珊 《智能计算机与应用》 2023年第10期151-155,共5页
基数估计是数据库查询中关键的一步,数据库的查询优化器会根据基数估计的预期结果来从多个物理执行计划中选择最终要执行的计划。针对传统的基数估计方法没有考虑数据各个列之间可能存在的逻辑关系,在数据量过大时估计准确性较低的问题... 基数估计是数据库查询中关键的一步,数据库的查询优化器会根据基数估计的预期结果来从多个物理执行计划中选择最终要执行的计划。针对传统的基数估计方法没有考虑数据各个列之间可能存在的逻辑关系,在数据量过大时估计准确性较低的问题,本文提出了一种基于神经网络的多头注意力机制的基数估计模型,利用数据列之间的逻辑关系提高SQL特征关系的提取效率,通过针对语句的不同组成部分,采用多种细粒度的编码方式有效提取数据之间的逻辑特征;利用多头自注意力机制对特征数据进行加权计算,提高模型的预判准确性。在IMDb数据集上的实验结果表明,该模型可以有效提高基数估计的准确性。 展开更多
关键词 数据库 查询优化 基数估计 多头自注意力机制
下载PDF
基于AI技术数据库查询优化的研究
6
作者 尹向兵 《安徽职业技术学院学报》 2023年第2期15-20,26,共7页
数据查询优化是数据库中最具有挑战性的问题之一,基数估计(CE)是数据库查询优化中的一个重要组成部分。本文应用基于神经网络的查询基数估计方法完成数据表示、模型构建,通过对比实验表明,与现有的基于深度学习算法相比,文中提出的基于... 数据查询优化是数据库中最具有挑战性的问题之一,基数估计(CE)是数据库查询优化中的一个重要组成部分。本文应用基于神经网络的查询基数估计方法完成数据表示、模型构建,通过对比实验表明,与现有的基于深度学习算法相比,文中提出的基于图神经网络的数据库查询优化方法,相较于传统的机器学习算法和基于卷积的深度学习算法,查询基数估计误差降低了30%。 展开更多
关键词 数据库 查询优化 图神经网络 基数估计
下载PDF
基于遗传算法的分布式数据库查询优化研究 被引量:23
7
作者 帅训波 马书南 +1 位作者 周相广 龚安 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1600-1604,共5页
在收益半连接研究基础之上,本文提出一种新的查询执行计划代价模型,它包括关系副本选择、查询多连接次序、操作站点的选择、数据的传输及数据局部处理等因素,准确地表示了分布式数据库查询执行代价,并且给出了解决基于此代价模型查询优... 在收益半连接研究基础之上,本文提出一种新的查询执行计划代价模型,它包括关系副本选择、查询多连接次序、操作站点的选择、数据的传输及数据局部处理等因素,准确地表示了分布式数据库查询执行代价,并且给出了解决基于此代价模型查询优化问题的遗传算法,实验结果表明,该算法有较好的寻优效果,更具有实际意义. 展开更多
关键词 分布式数据库 查询优化 代价模型 遗传算法
下载PDF
基于直方图的空间查询选择率估计研究 被引量:8
8
作者 朱焰炉 程昌秀 +1 位作者 陈荣国 颜勋 《计算机科学》 CSCD 北大核心 2010年第12期125-129,148,共6页
空间查询优化是空间数据库中的关键问题之一,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法,而估算代价的主要问题是估算查询结果(选择率)的大小。针对空间数据库中最常用的两种查询——空间选择和空间连接,阐述了... 空间查询优化是空间数据库中的关键问题之一,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法,而估算代价的主要问题是估算查询结果(选择率)的大小。针对空间数据库中最常用的两种查询——空间选择和空间连接,阐述了几种主要用于查询选择率估计的直方图算法,并对各算法的优缺点做了分析,最后对空间查询选择率估计的研究方向进行了展望。 展开更多
关键词 空间查询 直方图 选择率估计 空间查询优化
下载PDF
并行数据库基于多连接的查询优化算法的研究 被引量:10
9
作者 蔡亚杰 赵政文 +1 位作者 白松 肖玉泽 《计算机应用与软件》 CSCD 北大核心 2012年第12期182-185,共4页
多表连接查询是并行数据库中的一种常用且重要的操作,然而基于传统遗传算法所制定的多表连接查询计划,往往存在查询响应时间长的缺陷。根据无共享并行数据库的特点,将一种新的代价估计模型引入到传统遗传算法中,并对传统遗传算法进行了... 多表连接查询是并行数据库中的一种常用且重要的操作,然而基于传统遗传算法所制定的多表连接查询计划,往往存在查询响应时间长的缺陷。根据无共享并行数据库的特点,将一种新的代价估计模型引入到传统遗传算法中,并对传统遗传算法进行了改进。实验证明改进后的遗传算法能制定出更优的查询计划,从而减少多表连接时的查询响应时间。 展开更多
关键词 并行数据库 无共享架构 多表连接优化 代价估计 遗传算法
下载PDF
基于R-Tree的空间查询代价模型研究 被引量:5
10
作者 张志兵 王元珍 李华 《小型微型计算机系统》 CSCD 北大核心 2003年第6期1017-1020,共4页
本文对基于 R- Tree的空间查询代价模型进行了探讨 ,分析了 Y.Theodoridis等提出的矩形密度模型〔2 ,3〕,利用其结果提出了代价估计的概率模型 。
关键词 R-TREE 空间查询 代价模型 查询优化 空间数据库
下载PDF
面向对象数据库中查询代价的估算 被引量:7
11
作者 吴胜利 王能斌 《计算机研究与发展》 EI CSCD 北大核心 1998年第1期69-74,共6页
好的查询优化器都是基于代价的,因此查询代价的估算是数据库查询优化中一项不可缺少的工作.文中在联系代数的基础上,综合考虑了对象聚集、索引等因素,给出了面向对象数据库中查询代价的一种估算方法.
关键词 面向对象 数据库 查询优化 代价估算
下载PDF
一种新的用于估算查询结果大小的直方图方法 被引量:4
12
作者 马勇 王焱 《计算机工程与应用》 CSCD 北大核心 2004年第5期188-190,共3页
提出了一种新的用于估算查询结果大小的直方图方法。方法的基本思想与人类的思维机制是一致的,即在划分数据时,使所有直方开始于相对前一直方发生较大波动的项,并且结束于相对本直方发生较大波动的项之前。关于新的直方图方法,该文进行... 提出了一种新的用于估算查询结果大小的直方图方法。方法的基本思想与人类的思维机制是一致的,即在划分数据时,使所有直方开始于相对前一直方发生较大波动的项,并且结束于相对本直方发生较大波动的项之前。关于新的直方图方法,该文进行了大量的模拟实验。实验结果表明,该直方图方法估算精确,实现效率高,有较好的实用价值。 展开更多
关键词 数据库 查询优化 查询结果大小的估算 直方图
下载PDF
空间查询代价模型 被引量:4
13
作者 郭平 陈海珠 《计算机科学》 CSCD 北大核心 2004年第12期65-67,80,共4页
空间数据固有的复杂性使空间数据查询效率成为了空间信息处理和应用的关键与瓶颈,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法。本文分析比较了几种主要的查询代价估算模型,指出了它们的使用范围与存在的问题,最... 空间数据固有的复杂性使空间数据查询效率成为了空间信息处理和应用的关键与瓶颈,以查询代价估算为基础的查询优化技术是提高查询效率的一种重要方法。本文分析比较了几种主要的查询代价估算模型,指出了它们的使用范围与存在的问题,最后展望了空间查询代价模型研究的发展趋势。 展开更多
关键词 代价模型 查询效率 空间查询 查询优化技术 瓶颈 空间数据 复杂性 分析比较 发展趋势 展望
下载PDF
内存数据库查询优化 被引量:5
14
作者 李国徽 杨进才 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期21-23,29,共4页
基于一种广泛接受的内存数据库系统基本概念及内存数据库中的SB 树索引结构 ,提出了更方便关系代数操作的SB 树 .在此基础上 ,提出了优化的关系代数操作的实现算法 .根据这些算法和关系代数等价定理 ,给出了对关系代数查询树进行逻辑... 基于一种广泛接受的内存数据库系统基本概念及内存数据库中的SB 树索引结构 ,提出了更方便关系代数操作的SB 树 .在此基础上 ,提出了优化的关系代数操作的实现算法 .根据这些算法和关系代数等价定理 ,给出了对关系代数查询树进行逻辑优化的规则 ,并证明了逻辑优化的正确性 .最后给出了代价评估模型 ,实验表明提出的内存数据库查询优化算法相对于传统的优化算法具有更好的时间及空间性能 . 展开更多
关键词 内存数据库 查询优化 逻辑优化 等价定理 代价评估 SB-树 索引结构 关系代数
下载PDF
基于Greenplum数据库的查询优化 被引量:5
15
作者 邹承明 谢义 吴佩 《计算机应用》 CSCD 北大核心 2018年第2期478-482,共5页
针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出一个基于代价的最优查询计划生成方法。首先,该方法设计一种有效的代价模型来估算查询代价;然后,采用并行最大最... 针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出一个基于代价的最优查询计划生成方法。首先,该方法设计一种有效的代价模型来估算查询代价;然后,采用并行最大最小蚁群算法来搜索具有最小查询代价的连接顺序,即最优连接顺序;最后,根据Greenplum数据库对查询计划中不同操作的默认最优选择得到最优查询计划。采用该方法在自主生成的数据集与事务处理性能理事会测试基准(TPC-H)的标准数据集上进行了多组实验。实验结果表明,所提出的优化方法能有效地搜索出最优解,获得最优的查询计划,从而提升Greenplum数据库的查询效率。 展开更多
关键词 分布式数据库 Greenplum数据库 最优查询计划 代价模型 最优连接顺序
下载PDF
估算查询结果大小的直方图方法之研究 被引量:16
16
作者 吴胜利 《软件学报》 EI CSCD 北大核心 1998年第4期285-289,共5页
直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法.从实用的观点来看,过去已提出的一些直方图方法有局限性,主要是它们不能保证估算值的准确程度.本文将提出两种新的直方图方法,它们不仅使用方便,而且可以保证所... 直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法.从实用的观点来看,过去已提出的一些直方图方法有局限性,主要是它们不能保证估算值的准确程度.本文将提出两种新的直方图方法,它们不仅使用方便,而且可以保证所有的估算值均在给定的误差范围内.此外,本文还探讨了不同的数据分布对直方图的影响,通过运用一些重要的参数刻画数据分布,用以帮助生成效果较佳的直方图. 展开更多
关键词 数据库系统 查询优化 查询代价的估算 直方图
下载PDF
限定误差直方图的一个改进算法 被引量:3
17
作者 马勇 王炎 《计算机工程与应用》 CSCD 北大核心 2000年第2期63-64,共2页
直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法。限定误差的直方图是以任意给定的误差作为前提,生成满足误差要求的直方图。文章提出了一种新的限定误差直方图的算法。在限定相同误差及时间复杂度的前提下,生成的... 直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法。限定误差的直方图是以任意给定的误差作为前提,生成满足误差要求的直方图。文章提出了一种新的限定误差直方图的算法。在限定相同误差及时间复杂度的前提下,生成的直方数会更少。 展开更多
关键词 查询优化 限定误差 直方图 商用数据库系统
下载PDF
限定误差的直方图 被引量:7
18
作者 吴胜利 《计算机学报》 EI CSCD 北大核心 1998年第8期704-712,共9页
限定误差的直方图方法以任意给定的误差作为前提,生成满足要求的直方图.本文在作者已有工作的基础上,进一步探讨生成限定误差直方图的方法,以适用于等值和范围两种查询,并进行了大量的模拟实验.实验结果表明,限定误差的直方图不... 限定误差的直方图方法以任意给定的误差作为前提,生成满足要求的直方图.本文在作者已有工作的基础上,进一步探讨生成限定误差直方图的方法,以适用于等值和范围两种查询,并进行了大量的模拟实验.实验结果表明,限定误差的直方图不仅估算精确,肯定能满足预定的要求,而且算法简单,实现效率高,具有良好的应用前景. 展开更多
关键词 数据库系统 查询优化 查询代价的估算 直方图
下载PDF
基于Agent的分布式数据库查询优化研究 被引量:3
19
作者 许新华 黄胜运 +1 位作者 唐胜群 张少锋 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期216-219,共4页
目前分布式数据库查询优化器基于代价模型,总代价=CPU代价+I/O代价+通信代价,在远程通信网或数据传输率较低的系统中,通信代价应作为首要的优化目标来考虑;提出了一种基于Multi-Agent技术的查询模型(QMAS);同时为了保证系统组内、组间Ag... 目前分布式数据库查询优化器基于代价模型,总代价=CPU代价+I/O代价+通信代价,在远程通信网或数据传输率较低的系统中,通信代价应作为首要的优化目标来考虑;提出了一种基于Multi-Agent技术的查询模型(QMAS);同时为了保证系统组内、组间Agent之间的高效通信,采用了树型拓扑结构(TTMAS)的通信模型,系统内各Agent使用通信原语高效通信、协作,且满足Agent间的通信路由最优,从而保证了QMAS的查询效率. 展开更多
关键词 分布式数据库 查询优化 传输代价 AGENT QMAS TTMAS
下载PDF
限定误差直方图之进一步研究 被引量:1
20
作者 马勇 王焱 《计算机工程与应用》 CSCD 北大核心 2000年第3期80-81,共2页
直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法。作者在已有的研究基础上对限定误差直方图作了进一步研究,提出了一种新的限定误差直方图的算法。与以往限定误差直方图算法比较,生成的直方数进一步减少。并通过实... 直方图是许多商用数据库系统中最常用的一种估算查询结果大小的方法。作者在已有的研究基础上对限定误差直方图作了进一步研究,提出了一种新的限定误差直方图的算法。与以往限定误差直方图算法比较,生成的直方数进一步减少。并通过实验验证了新算法的时间复杂度接近线性。 展开更多
关键词 数据库 查询优化 直方图 估算查询
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部