内存列存储数据库中优化的混合自适应索引被引量：4

Optimized Adaptive Hybrid Indexing for In-memory Column Stores

下载PDF

导出

摘要分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐提高。大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过程中,由于查询负载模式无法预知,需要对某些属性反复构建索引,以满足查询的时间要求。显然,传统的索引构建维护技术不能完全满足新的应用环境。数据库分裂技术提出了一种不同的策略去解决这些问题。使用数据库分裂技术,DBA不需要对数据库进行细粒度的系统配置。在查询执行过程中,数据库能自动调整以适应查询负载;随着查询负载的变化,系统自动调整索引。近年来,一系列数据库分裂算法被提出,但已有的算法都各有优缺点。因此给出了一个cache conscious的数据库分裂代价模型,并基于该模型构建了一个新的自适应索引,其可以综合不同数据库分裂算法的优势。通过大量实验验证了这种新自适应索引技术的有效性。 Analytical database has been widely deployed in modern corporations which are posing increasing demand for the speed of data analysis. In the era of big data,analytical database is faced with a number of new challenges. Firstly, the complexity of data keeps increasing, therefore,more efforts have to be put into system configuration, such as index creation. Secondly, without prior knowledge about the patterns of workload, system administrators have to build and re- build indexes repeatedly, in order to meet the time constraints. Apparently, traditional approaches to index construction and maintenance can not work well in the new environment. Database cracking provides an alternative to solve the prob- lem. Using database cracking, a DBA does not need to fine-tune the system configuration. Instead, the database can auto- matically adjust itself to fit the workload during query execution. In recent years, a series of database cracking algo- rithms have been proposed,while none of them is optimal in all situations. The paper proposed a cache conscious cost model for database cracking. Based on the model,we created a new adaptive index, which can combine the advantages of several previous cracking approaches. Extensive experiments were conducted to demonstrate the effectiveness of our method.

作者薛忠斌周烜张延松周新王珊

机构地区教育部数据工程与知识工程重点实验室(中国人民大学) 中国人民大学信息学院

出处《计算机科学》 CSCD 北大核心 2015年第11期28-31,36,共5页 Computer Science

关键词自适应合并数据库分裂自适应索引混合算法 Adaptive merging,Database cracking, Adaptive indexing, Hybrid algorithm

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献15

1Chaudhuri S, Weikum G. Rethinking database system architec-ture: Towards a self-tuning risc-style database system [C] //Proceedings of the 26th In VLDB. 2000: 1-10.
2Graefe G,Idreos S,Kuno H,et al. Benchmarking adaptive inde-xing[C]^TPCTC. 2010: 169-184.
3Graefe G.Kuno H. Adaptive indexing for relational keys[C]//ICDE. 2010:69-74.
4Graefe G,Kuno H. Self-selecting, self-tuning, incrementally op-timized indexex[C]//EDBT. 2010:371-381.
5Idreos S,Kersten M L, Manegold S. Database cracking[C]//CI-DR. 2007:68-78.
6Idreos S, Kersten M L, Manegold S. Updating a cracked data-base[C]#SIGMOD. 2007:413-424.
7Idreos S. Kersten M L,Manegold S. Self-organizing tuple recon-struction in column stores[C] //SIGMOD. 2009:297-308.
8Idreos S,Manegold S,Kuno H, et al. Merging what’s cracked,cracking what’s merged: adaptive index in main-memory col-umn-stores[J]. PVLDB,2011,4C9) : 585-597.
9Halim F,Idreos S,Karras P,et al. Stochastic database cracking:Towards robust adaptive indexing in main-memory Column-stores[J]. PVLDB,2012,5(6) : 502-513.
10Kersten M, Manegold S. cracking the database store [C] // CI-DR. 2005:213-224.

同被引文献43

1程翔,刘升.云自适应混合细菌觅食优化算法[J].微电子学与计算机,2015,32(5):111-116. 被引量：5
2王华,刘焕敏,段慧芬,年福纯,施斌.航天测控信息数据库实时优化管理策略研究与应用[J].计算机系统应用,2014,23(2):195-199. 被引量：3
3周先存,黎明曦,陈振伟,徐英来,熊焰,李瑞霞.基于层次混合的高效概率包标记WSNs节点定位算法[J].电子与信息学报,2014,36(2):384-389. 被引量：3
4任智,刘艳伟,陈红,李季碧,陈前斌.基于自适应矢量压缩的机会网络高效低时延路由算法[J].系统工程与电子技术,2014,36(2):368-375. 被引量：1
5朱洪.循环椭圆曲线耦合一致分布混沌映射的混合图像加密算法研究[J].科学技术与工程,2014,22(8):222-227. 被引量：7
6张峰,董晓明,梁军,韩学山,孙舶皓,王洪涛.考虑目标分解及其互补平抑的风电场复合储能容量优化[J].电力系统自动化,2014,38(7):9-15. 被引量：22
7陈俊杰,黄松岭,赵伟.油气管道缺陷漏磁检测数据压缩算法研究[J].电测与仪表,2014,51(15):100-104. 被引量：8
8黄庆卿,汤宝平,邓蕾,肖鑫.无线传感器网络子带能量自适应数据压缩方法[J].仪器仪表学报,2014,35(9):1998-2003. 被引量：24
9甘杨兰,赵梅,牛森,邹国兵.基于云仿真环境数据挖掘的服务分类方法[J].计算机仿真,2014,31(10):460-465. 被引量：10
10王梅,邢露露,孙莉.混合存储下的MapReduce启发式多表连接优化[J].计算机科学与探索,2014,8(11):1334-1344. 被引量：3

引证文献4

1何勰绯,万加富.基于JADE的数据库自适应负载控制分析[J].现代电子技术,2017,40(16):50-52. 被引量：2
2王民川,赵冰,黄继海.行列混合存储数据库的数据分布自适应优化算法[J].科学技术与工程,2017,17(27):232-237.
3郭威,方宽,黄慧欣,林俊.DM数据库中大规模数据智能自适应压缩算法[J].科学技术与工程,2018,18(3):285-290. 被引量：3
4程海英.混合存储视频数据库中自适应数据分布优化方法研究[J].科技通报,2018,0(2):159-162.

二级引证文献5

1吴小欣.突出实时测控软件数据库系统设计与实现[J].电子设计工程,2020,28(1):23-26. 被引量：2
2孙志勇.压缩数据库中大规模电子信息缓存优化方法[J].电子设计工程,2020,28(7):95-98. 被引量：3
3王秀华.基于相似度分段的数据智能自适应压缩算法[J].信息通信,2020(8):59-60. 被引量：1
4姜庆彬,涂志莹.基于JADE的移动端个人服务系统设计与实现[J].智能计算机与应用,2020,10(9):120-123.
5尹玉峰,韩占港,朱群.基于DM8的建设项目管控系统的设计与应用[J].工业控制计算机,2022,35(5):119-121.

1袁通,刘志镜,刘慧.多核处理器中并行自适应索引算法优化[J].西安电子科技大学学报,2016,43(5):57-62.
2黄向忠,袁捷.基于JXTA的均衡负载模式[J].计算机工程与设计,2005,26(12):3375-3377. 被引量：1
3卢敏.点亮“重复数据删除”[J].软件世界,2008(6):66-66.
4王珏.重叠型P2P网络中的查询负载均衡策略研究[J].江西师范大学学报（自然科学版）,2012,36(3):292-296. 被引量：1
5张博,耿志华,周傲英.一种支持高效XML路径查询的自适应结构索引[J].软件学报,2009,20(7):1812-1824. 被引量：9
6冯国富,毛莺池,陆桑璐,陈道蓄.PeerRank:一种无结构P2P资源发现策略[J].软件学报,2006,17(5):1098-1106. 被引量：19
7张贝贝.更智能、更快捷的新应用[J].软件和信息服务,2013(4):36-36.
8陈一明,谢向军.操作型数据库与分析型数据库关系分析[J].教育信息化,2002(6):52-53. 被引量：1
9朱晓静,胡伟武,马可,章隆兵.Xmesh：一个mesh-like片上网络拓扑结构[J].软件学报,2007,18(9):2194-2204. 被引量：17
10赵德平,彭鹏,魏志勇,姜迎.M集在分形图像压缩编码中的应用[J].沈阳建筑大学学报（自然科学版）,2007,23(4):680-683.

计算机科学

2015年第11期

浏览历史

内容加载中请稍等...

内存列存储数据库中优化的混合自适应索引被引量：4

参考文献15

同被引文献43

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

内存列存储数据库中优化的混合自适应索引 被引量：4

参考文献15

同被引文献43

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

内存列存储数据库中优化的混合自适应索引被引量：4