基于行键的HBase大数据文件存储转换与快速检索研究被引量：11

Research on storage transformation and fast retrieval of big data files in HBase based on row-key

下载PDF

导出

摘要针对传统关系型数据库很难满足数据的快速存储与检索的问题,研究了基于数据文件字段映射表、文件对象字段、HBase列映射表和存储转换执行方案映射表解决文件对象的异构性和存储转换的通用性问题。提出了自定义RowKey行键的规则与生成算法,给出了基于映射表与行键的数据转换与存储流程及算法;最后基于行键前缀匹配或关键字匹配方式实现了不同需求的数据快速访问与检索,且具有较强的通用性。 In traditional and relational database,it is difficult to meet the needs of data storage and quick retrieval due to such huge amount of data. For this problem,this paper studied the mapping model of data file field,the relationship between data file field and HBase column,and the importing execution plan,which had solved the heterogeneity of file object and the universality of storage transformation. It put forward the"RowKey"generation rules and algorithm,and provided the algorithm of data transformation based on mapping model and "RowKey". Then according to the mapping rules of data file fields with HBase table column,the data in data file was transformed into HBase. It realized the fast data access and retrieval according to prefix matching in"RowKey"or keyword matching,which had strong commonality and could be widely used in HBase large data storage applications.

作者圣文顺徐爱萍 Sheng Wenshun;Xu Aiping(Pujiang Institute,Nanjing Tech University,Nanjing 211200,China;School of Computer,Wuhan University,Wuhan 430072,China)

机构地区南京工业大学浦江学院武汉大学计算机学院

出处《计算机应用研究》 CSCD 北大核心 2019年第12期3806-3810,共5页 Application Research of Computers

基金国家重点研发计划重点专项资助项目(2017YFC0803700) 江苏省高校自然科学研究面上项目(19KJD520005)

关键词大数据文件存储行键特征值快速检索 big data file storage row key eigenvalue rapid retrieval

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1孟辉,朱美正,张锋叶.基于Hadoop的矢量空间数据库技术[J].计算机与现代化,2014(2):63-68. 被引量：3
2张榆,马友忠,孟小峰.一种基于HBase的高效空间关键字查询策略[J].小型微型计算机系统,2012,33(10):2141-2146. 被引量：33
3马友忠,孟小峰.云数据管理索引技术研究[J].软件学报,2015,26(1):145-166. 被引量：43
4罗芳,李春花,周可,黄永峰,廖正霜.基于多属性的海量Web数据关联存储及检索系统[J].计算机工程与科学,2014,36(3):404-410. 被引量：9
5陈庆奎,周利珍.基于HBase的大规模无线传感网络数据存储系统[J].计算机应用,2012,32(7):1920-1923. 被引量：30

二级参考文献34

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2张洪岩,王钦敏,周成虎,励惠国.“数字地球”与地理信息科学[J].地球信息科学,2001,3(4):1-4. 被引量：11
3International Telecommunication Union. ITU Intemet Reports 2005: The Interact of Things [ R]. UIT, 2005.
4RFID WORKING GROUP. Interact of Things in 2020: Roadmap for the future [ EB/OL]. [ 2011 - 05 - 12]. http://www, smart-sys- tems-integration, org/public/intemet-of-things.
5CONTI J P. The lntemet of things [ J]. lET Communications Engi- neer, 2006, 4(6):20-25.
6CHAIKEN R, JENKINS B, LARSON P-A, et al. SCOPE: Easy and efficient parallel processing of massive data sets [ j]. Proceed- ings of the VLDB Endowment, 2008, 1(2) : 1265 - 1276.
7YICK J, MUKHERJEE B, GHOSAL D. Wireless sensor network survey [J]. Computer Networks, 2008, 52(12): 2292-2330.
8Oracle Corporation. Oracle real application elustem [EB/OL]. [ 2011 - 07 - 01 ]. http://www, oracle, eom/teehnology/produets/database/clustering.
9The Apache Software Foundation. Hadoop [ EB/OL]. [ 2011 - 08 - 12]. http://hadoop, apache, org/.
10The Apache Software Foundation. Apache HBase [ EB/OL]. [ 2011 -08 -04]. http://hadoop, apache, org,/hbase/.

共引文献110

1陈宁,陈孝文,冯世杰,吕志鹏,陈习,张娜,王岩.基于Hadoop的电力客户用电地址存储与结构化管理系统设计[J].微型电脑应用,2020,36(2):97-101. 被引量：4
2陈庆奎,那丽春,霍欢,彭顿陆,赵海燕,高丽萍.面向卓越工程师教育的数据库技术教学方法[J].计算机教育,2013(5):9-13. 被引量：1
3周相兵,马洪江,苗放.云计算环境下的一种基于Hbase的ORM设计实现[J].西南师范大学学报（自然科学版）,2013,38(8):130-135. 被引量：14
4郭荔荔,李敬兆.基于云存储的井下人员定位数据处理[J].电脑知识与技术,2014(2):844-846. 被引量：1
5陈娜,张金娟,刘智琼,徐歆壹.基于Hadoop平台的电信大数据入库及查询性能优化研究[J].移动通信,2014,38(7):58-63. 被引量：9
6王蒙,景旭,李书琴,戴涛,王晓琴.基于Hbase的农业微博数据存储与处理策略[J].中国农机化学报,2014,35(3):221-225. 被引量：2
7陈燕红,张太红,马健.中英文跨语种嵌入式数据库查询处理研究[J].计算机应用与软件,2014,31(6):244-247.
8项世军,何嘉勇.一种保序加密域数据库认证水印算法[J].软件学报,2018,29(12):3837-3852. 被引量：3
9王海荣,刘珂.基于Hadoop的海量数据存储系统设计[J].科技通报,2014,30(9):127-130. 被引量：12
10陈磊,封朝永.HBase下时态信息索引策略研究[J].广东工业大学学报,2014,31(3):102-108. 被引量：3

同被引文献116

1张榆,马友忠,孟小峰.一种基于HBase的高效空间关键字查询策略[J].小型微型计算机系统,2012,33(10):2141-2146. 被引量：33
2杨小牛,杨志邦,赖兰剑.下一代信号情报侦察体系架构:大数据概念的应用[J].中国电子科学研究院学报,2013,8(1):1-7. 被引量：36
3鲁达明.智慧水务的实践分析和研究[J].黑龙江水利科技,2019,47(1):35-36. 被引量：7
4张智,江果,蒋鸣远.面向军用网格的广域分布式数据处理框架[J].中国电子科学研究院学报,2019,14(1):20-25. 被引量：7
5石玉波.健全体制创新机制推进水务工作改革与发展[J].中国水利,2002(4):14-16. 被引量：7
6吴季松.水务管理体制改革的发展和深化[J].中国水利,2002(7):35-39. 被引量：11
7田雨,蒋云钟,杨明祥.智慧水务建设的基础及发展战略研究[J].中国水利,2014(20):14-17. 被引量：72
8周跃,臧斌宇.分布式NoSQL系统写操作性能优化设计与实现[J].计算机应用与软件,2014,31(11):25-28. 被引量：7
9钟华.基于NoSQL数据库的大数据存储安全技术的研究及应用[J].通讯世界（下半月）,2015(10):255-255. 被引量：4
10徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：506

引证文献11

1李兴菊,赵建军,聂红梅,王迎.HBase数据库行键设计及验证[J].软件导刊,2019,18(10):178-181. 被引量：2
2唐立,李亚平,曲金帅.基于HBase/Spark的教学大数据存储及索引模型研究[J].云南民族大学学报（自然科学版）,2020,29(5):486-492. 被引量：1
3林海霞.基于数据挖掘的图书馆海量信息快速检索方法[J].信息与电脑,2020,32(23):172-173. 被引量：1
4唐宇.基于云桌面技术的高校开放实验室信息管理系统设计[J].宁夏师范学院学报,2021,42(10):90-97. 被引量：1
5江果,王丽军,李高云,张毅.面向广域网的电磁数据分布式处理模型[J].电子信息对抗技术,2022,37(1):35-40.
6蒋贞慧.基于多层感知学习的工程档案大数据检索系统设计[J].自动化与仪器仪表,2022(2):69-72. 被引量：3
7苏余泉,王玮,谢海芳,苏锦青.基于HBase的乡村智能电网数据自动分析平台设计[J].电子设计工程,2022,30(17):141-145. 被引量：1
8王磊,陈磊,张明儒,魏敏,李晋先.面向数据库查询的非结构化数据融合存储系统[J].电子设计工程,2022,30(24):148-152. 被引量：1
9包空军,曹瑞.基于元素树的异质数据库间双向转换算法研究[J].计算机仿真,2023,40(6):411-414.
10杨旭明,王志,李忠,黄建平,杨百一,陈朝阳.大数据存储技术在张衡一号卫星数据服务中的应用[J].科学技术与工程,2023,23(25):10895-10901. 被引量：1

二级引证文献11

1高智衡.基于大数据的移动网络测评系统设计和优化[J].移动通信,2020,44(1):92-96. 被引量：1
2唐立,李亚平,曲金帅.基于HBase/Spark的教学大数据存储及索引模型研究[J].云南民族大学学报（自然科学版）,2020,29(5):486-492. 被引量：1
3梁方玮,薛涛.面向物流服务的海量日志实时流处理平台[J].计算机系统应用,2021,30(10):68-75. 被引量：2
4刘舸舸.结合MacBERT和多尺度融合网络的档案数据分类研究[J].电子设计工程,2022,30(19):65-68. 被引量：1
5穆歌.基于深度学习的图书馆信息资源推荐检索方法设计[J].信息与电脑,2022,34(18):149-151. 被引量：2
6曹芳芳,任慧敏,上官子粮,丁派克.面向装备试验数据的融合存储技术研究与应用[J].软件工程,2023,26(11):25-28. 被引量：1
7赵惠.基于校园网的开放实验室管理系统的设计[J].中国新通信,2023,25(20):74-76.
8徐征.基于人工智能技术的海量数据自动检索系统设计[J].信息与电脑,2023,35(21):120-122. 被引量：1
9李欣,程松,智远,王世杰,刘扬.基于N-k故障的电网数据通信业务保障分级方法[J].自动化与仪器仪表,2023(10):163-166. 被引量：1
10汤笛,吴长梦涛,张欣悦,尹茂鹏,张子涵,陈新房.基于Hadoop平台的灾害大数据处理及可视化[J].电脑与电信,2024(4):80-84.

1许鑫.论微课问题链中的课程设计——以动画《人物运动规律》课程为例[J].智富时代,2019(8):0282-0282.
2潘灏,丘刚玮,黄欣.一种小文件存储优化方法在云存储平台中的应用[J].轻工科技,2019,0(9):83-85. 被引量：2
3开心课间[J].今日中学生,2019,0(34):30-30.
4邓艾林,陈浩,陈茜,李志航,韩正阳.新经济背景下的互联网 + 大学生技能实践平台建设[J].智富时代,2019(9):0169-0169.
5夏欢.新时期档案信息化建设的创新探析[J].信息周刊,2019,0(48):0235-0235.
61=N视频实时结构化的智能大脑——评测深晶科技智能视频结构化存储一体机[J].中国公共安全,2019,0(11):196-197.
7开心课间[J].今日中学生,2019,0(36):37-37.
8李继辉.光电式数字日照计在气象观测中的应用[J].新疆农垦科技,2019,42(7):39-40.
9高盈盈.Excel对生产数据的分析应用[J].新商务周刊,2019,0(4):256-257.
10郝贤云.路由过滤的仿真设计[J].实验室研究与探索,2019,38(9):139-144. 被引量：10

计算机应用研究

2019年第12期

浏览历史

内容加载中请稍等...

基于行键的HBase大数据文件存储转换与快速检索研究被引量：11

参考文献5

二级参考文献34

共引文献110

同被引文献116

引证文献11

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于行键的HBase大数据文件存储转换与快速检索研究 被引量：11

参考文献5

二级参考文献34

共引文献110

同被引文献116

引证文献11

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于行键的HBase大数据文件存储转换与快速检索研究被引量：11