数据库外基于多模型的学习式查询优化方法被引量：2

Learning query optimization method based on multi model outside database

下载PDF

导出

摘要对于AI与数据库优化问题,现有技术均须改动数据库底层,影响研究成果的应用且缺乏可扩展性.提出一种非嵌入数据库的学习式查询优化方法.在基数估计阶段,使用多模型的方法,对特定的子查询建立神经网络,独立训练不同的子模型,解决需要训练集过多且可扩展性差的问题;在连接优化阶段,应用基于代价的强化学习方法,提高查询优化性能.针对每个查询,从基数估计到连接排序的优化过程都在数据库外执行,按照得到的优化策略对查询重写,并将重写结果返回到数据库中,通过设置参数使该查询按照指定的计划执行.在包含8个表的数据集上进行实验验证,与未进行优化的查询进行比较,非嵌入数据库的优化方法具有良好的优化效果. For AI and database optimization problems, existing technologies need to change the bottom layer of database, which affects the application of research results and lacks scalability. A learning query optimization method for non-embedded database was proposed. In the cardinality estimation stage, the multi-model method is used to establish a neural network for specific sub queries and train different sub models independently, which solves the problem of too many training sets and poor scalability. In the join optimization stage, cost-based reinforcement learning is applied to improve the query optimization performance. For each query, the optimization processes from cardinality estimation to connection sorting are executed outside the database. The query is rewritten according to the obtained optimization strategy, and the rewriting results are returned to the database. The query is executed according to the specified plan by setting parameters. Experimental verification was carried out on the data set containing eight tables. Compared with the query not optimized, the optimization method of non-embedded database has good optimization effect.

作者李广龙申德荣聂铁铮寇月 LI Guang-long;SHEN De-rong;NIE Tie-zheng;KOU Yue(School of Computer Science and Engineering,Northeastern University,Shenyang 110169,China)

机构地区东北大学计算机科学与工程学院

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2022年第2期288-296,共9页 Journal of Zhejiang University：Engineering Science

基金国家自然科学基金资助项目(62172082,62072084,62072086)。

关键词查询优化基数估计连接排序神经网络强化学习 query optimization cardinality estimation join order neural network reinforcement learning

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1李国良,周煊赫,孙佶,余翔,袁海涛,刘佳斌,韩越.基于机器学习的数据库技术综述[J].计算机学报,2020,43(11):2019-2049. 被引量：48

共引文献47

1徐晴,王青洲,李元岳,贺英,姚钊.基于GA-BP模型的微带贴片天线设计和优化[J].电子测量技术,2023,46(21):55-62.
2李国良,周煊赫.轩辕:AI原生数据库系统[J].软件学报,2020,31(3):831-844. 被引量：10
3宋雨萌,谷峪,李芳芳,于戈.人工智能赋能的查询处理与优化新技术研究综述[J].计算机科学与探索,2020,14(7):1081-1103. 被引量：7
4李国良,周煊赫.面向AI的数据管理技术综述[J].软件学报,2021,32(1):21-40. 被引量：25
5邵荣强,陈燕,龚庆悦.基于API的疾病预测系统数据导入研究[J].软件导刊,2021,20(3):101-105.
6谢印宝.基于多智能代理的试题库设计与实现[J].软件工程,2021,24(5):17-21. 被引量：1
7张洲,金培权,谢希科.学习索引:现状与研究展望[J].软件学报,2021,32(4):1129-1150. 被引量：9
8钮泽平,李国良.数据库内AI模型优化[J].软件学报,2021,32(3):622-635. 被引量：6
9金连源,李国良.基于人工智能方法的数据库智能诊断[J].软件学报,2021,32(3):845-858. 被引量：9
10魏东,董博晨,刘亦青.改进神经网络的图像识别系统设计与硬件实现[J].电子与信息学报,2021,43(7):1828-1833. 被引量：4

同被引文献29

1王鑫,徐强,柴乐乐,杨雅君,柴云鹏.大规模RDF图数据上高效率分布式查询处理[J].软件学报,2019,30(3):498-514. 被引量：9
2王锐光,吴际,刘超,杨海燕.基于维修日志的飞机设备故障原因判别方法[J].软件学报,2019,30(5):1375-1385. 被引量：13
3王引娣,章哲庆,严丽.基于双时态RDF模型的索引方法[J].计算机科学,2021,48(4):63-69. 被引量：1
4宋邓强,周彬,申兴旺,鲍劲松,周亚勤.面向船舶分段制造过程的动态知识图谱建模方法[J].上海交通大学学报,2021,55(5):544-556. 被引量：12
5唐运乐,韦杏琼.基于动态分布式聚类算法的大数据查询处理方法[J].西南师范大学学报（自然科学版）,2021,46(5):134-139. 被引量：13
6欧一鸣,苏雍贺,靳健,倪玮晨,陶飞.基于知识图谱的分布式光伏运维方案匹配方法[J].计算机集成制造系统,2021,27(7):1860-1870. 被引量：8
7Guanghui Wu.A Trio of Commercial Aircraft Developments in China[J].Engineering,2021,7(4):424-426. 被引量：3
8杨茸,牛保宁.OIQ-tree:一种支持大规模空间文本数据流上连续k近邻查询的索引[J].计算机学报,2021,44(8):1732-1750. 被引量：2
9邓斌,陈会平,李凯勇.基于元数据关联特征的交互式数据快速查询[J].计算机仿真,2021,38(7):371-375. 被引量：4
10余敦辉,万鹏,王社.基于企业知识图谱构建的实体关联查询系统[J].计算机应用,2021,41(9):2510-2516. 被引量：3

引证文献2

1邢雪琪,丁雨童,夏唐斌,潘尔顺,奚立峰.基于知识图谱的商用飞机维修方案推荐系统集成建模[J].浙江大学学报（工学版）,2023,57(3):512-521. 被引量：4
2宋钰.基于代价模型的联邦知识图谱查询方法[J].软件,2023,44(11):71-75.

二级引证文献4

1尚金龙,顾振华.基于虚拟现实(VR)的飞机维修仿真研究[J].办公自动化,2023,28(13):56-58. 被引量：1
2唐荻音,丁奕州,王轩,赖李媛君,于劲松.知识图谱技术在预测与健康管理中的应用现状与研究展望[J].电光与控制,2024,31(2):1-11. 被引量：1
3罗顺财,李庆印,魏福禄,周昕.基于知识图谱的多源信息融合事故处理系统[J].山东理工大学学报（自然科学版）,2024,38(3):28-34.
4李贵霖,孙佳伟,于凤国,石瑾.基于知识图谱嵌入与补全的电梯故障预测技术研究[J].中国特种设备安全,2024,40(6):8-11.

1陆家俊,顾梅.Oracle查询优化的研究与应用[J].信息技术与信息化,2022(1):57-60. 被引量：4
2肖媛.影响Oracle数据库系统性能的因素与优化策略[J].电脑乐园,2021,6(9):73-74.
3宗枫博,赵宇海,王国仁,季航旭.面向多表数据连接投影和连接顺序的优化方法[J].计算机科学与探索,2022,16(1):106-119. 被引量：2
4冯钧,王秉发,陆佳民.分布式资源描述框架数据管理系统查询性能评价[J].计算机应用,2022,42(2):440-448. 被引量：1
5吴泽锐,刘冉,陈晓东,易延洪.数学优化和人工智能助力智能制造生产线--基于上汽大众新能源汽车生产的案例研究[J].工业工程与管理,2021,26(6):208-218. 被引量：6
6冯杰明,李战怀,陈群,陈肇强.基于增量局部加权学习的查询模板自适应基数估计[J].计算机学报,2022,45(1):17-34.
7张帧,李汉民,肖辉.基于全过程管理的Ⅰ期临床试验管理系统设计与实现[J].中国卫生信息管理杂志,2022,19(1):100-104. 被引量：7
8张得祥,王海荣,钟维幸,郭瑞萍.融合软奖励和退出机制的WGAN知识图谱补全方法[J].郑州大学学报（理学版）,2022,54(2):67-73. 被引量：4
9黄河,杨俊义.基于“三率合一”的电网项目计划进度执行偏差统计研究[J].工程建设与设计,2022(3):216-218. 被引量：1
10姜月秋,宗睿,关启学,关世杰,张昕.基于多约束投标策略的改进合同网算法[J].兵器装备工程学报,2022,43(1):206-211. 被引量：3

浙江大学学报（工学版）

2022年第2期

浏览历史

内容加载中请稍等...

数据库外基于多模型的学习式查询优化方法被引量：2

参考文献1

共引文献47

同被引文献29

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

数据库外基于多模型的学习式查询优化方法 被引量：2

参考文献1

共引文献47

同被引文献29

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

数据库外基于多模型的学习式查询优化方法被引量：2