基于虚拟化的水务分布式大数据存储平台设计被引量：2

Virtualized water distributed large number is designed by storage platform

下载PDF

导出

摘要针对自然界与人类社会二元水循环产生的海量水务观测数据,现有水务数据管理系统存在存储负荷大,数据库扩展困难,查询速度慢的问题,无法满足存储与分析的需要。针对问题,首先,结合虚拟化技术、Hadoop基础架构,设计分布式大数据存储平台的基本架构;其次,依据现有水务大数据情况及实际业务数据库表,实现分布式大数据存储平台的设计;最后,完成从集中式平台到分布式平台的数据迁移代码实现,并进行数据迁移实验测试。实验结果验证了分布式大数据存储平台设计方案的可行性与有效性,可为大规模行业数据的存储与处理提供一种理想的分布式解决方案。 In view of the massive water observation data generated by the dual water cycle of nature and human society, the existing water data management system has the problems of large storage load, difficult database expansion and slow query speed, which cannot meet the needs of storage and analysis. To solve the problems, firstly, the basic architecture of distributed big data storage platform is designed by combining the popular virtualization technology and hadoop infrastructure. Secondly, the design of distributed big data storage platform is realized according to the existing big data of water utilities and the actual business database table. Finally, the data migration code from the centralized platform to the distributed platform is completed, and the data migration experiment is carried out. The experimental results verify the feasibility and effectiveness of the design scheme of the distributed big data storage platform, which can provide an ideal distributed solution for the storage and processing of large-scale industrial data.

作者闫健卓高凯丽许红霞于涌川 YAN Jianzhuo;GAO Kaili;XU Hongxia;YU Yongchuan(Engineering Research Center of Digital Community, Department of Information, Beijing University of Technology,Beijing 100124, China)

机构地区北京工业大学信息学部数字社区教育部工程研究中心

出处《水利信息化》 2019年第3期17-24,共8页 Water Resources Informatization

基金赛尔下一代互联网技术创新项目(NGII20170207)

关键词水务数据大数据分布式存储存储平台虚拟化 HADOOP集群数据迁移 water data big data distributed storage storage platform virtualization hadoop cluster data migration

分类号 TV213.4 [水利工程—水文学及水资源]

引文网络
相关文献

参考文献9

1李彭军,陈光杰,郭文明.基于HDFS的区域医学影像分布式存储架构设计[J].南方医科大学学报,2011,31(3):495-498. 被引量：29
2范建永,龙明,熊伟.基于HBase的矢量空间数据分布式存储研究[J].地理与地理信息科学,2012,28(5):39-42. 被引量：39
3杨明祥,蒋云钟,田雨,王浩.智慧水务建设需求探析[J].清华大学学报（自然科学版）,2014,54(1):133-136. 被引量：126
4史建兵.南京市高淳区智慧水务信息化系统建设初探[J].中国水利,2014(9):52-53. 被引量：7
5姚林,张永库.NoSQL的分布式存储与扩展解决方法[J].计算机工程,2012,38(6):40-42. 被引量：26
6吴润泽,蔡永涛,陈文伟,陈文刚,王一蓉.面向多源异构数据源的实际范围索引树索引方法[J].电力系统自动化,2016,40(11):121-125. 被引量：8
7刘坚,李盛乐,戴苗,陈晓琳,康凯,刘珠妹,郭啟倩.基于Hbase的地震大数据存储研究[J].大地测量与地球动力学,2015,35(5):890-893. 被引量：14
8胡传廉.基于新技术条件的城市“智慧水网”发展规划初探[J].中国水利,2011(11):39-41. 被引量：17
9胡文波,徐造林.分布式存储方案的设计与研究[J].计算机技术与发展,2010,20(4):65-68. 被引量：19

二级参考文献63

1刘仲明,王放,郑小林.医院影像归档与存储系统中影像数据长期存储问题的研究[J].第三军医大学学报,2005,27(11):1123-1126. 被引量：14
2鲍捷,宋靖雁.分布式网络计算机域的一种系统模型及其文件系统[J].计算机应用与软件,2006,23(5):86-89. 被引量：3
3田敬,代亚非.P2P持久存储研究[J].软件学报,2007,18(6):1379-1399. 被引量：52
4严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,2008:81-84.
5CORMEN T H. , LEISERSON C E, RONSLD L. 算法导论[M].北京:机械工业出版社,2006:1-8.
6Lin M, Marzullo K. Directional Gossip: Gossip in a Wide - Area Network[ R]. San Diego: Dept of Computer Science and Eng, University of California, 1999.
7Lamport L,Shostak R,Pease M. The Byzantine generals problem[J ]. ACM TO PLAS, 1982,4(3) :382 - 401.
8Weatherspoon H, Kubiatowicz J. Erasure coding vs. replication: A quantitative comparison[ C]//In: Proc. of the 1 st Int' l Workshop on Peer - to - Peer Systems. Berlin: Springer, 2002: 328 - 337.
9Hadoop. http://hadoop.apache.org.
10Tom W. Hadoop: The Definitive Guide[M]. USA: O' Reilly Media Inc., 2009: 41-2.

共引文献269

1韩福国,王育萱,余亚梅.国家应急体系中政府垂直管理体制与社会横向结构的互嵌[J].中国应急管理科学,2024(4):14-32.
2张嘉,白晓飞,陶超,张小桐.大规模空间矢量数据分布式存储与计算优化[J].计算机系统应用,2020,29(12):251-256. 被引量：6
3郑文勇.福建省城乡供水一体化数字水务建设研究[J].水利科技,2021(3):1-4. 被引量：1
4朱晓庆,殷峻暹,张丽丽,付敏.深圳市智慧水务应用体系研究[J].水利水电技术,2019,50(S02):176-180. 被引量：13
5全强,牟小龙,孙立新,刘健.流域多维度水系连通与智慧水利耦合研究进展[J].内蒙古水利,2023(12):4-5.
6李丹丹,齐光峰,张晓菡,宋泓霖,林强,岳宇,董伟佳.炼化企业节水技术现状及发展方向调研[J].给水排水,2020(S01):779-782. 被引量：6
7梁荣,许健.浅析城市智能水务管理系统的建设[J].地产,2019,0(18):75-75. 被引量：1
8杨素花,胡军,贾宇涵,王柏春,徐紫嫣.北京市智慧水务标准体系建设研究[J].北京水务,2021(S02):67-72. 被引量：3
9张慧娟,刘菁华.海淀区"水务大脑"建设思考[J].北京水务,2021(S02):9-13. 被引量：1
10郝仲勇.打造数字水务助力智慧城市全面推进北京市智慧水务1.0建设[J].北京水务,2021(S02):1-4. 被引量：4

同被引文献19

1陈吉荣,乐嘉锦.基于MapReduce的Hadoop大表导入编程模型[J].计算机应用,2013,33(9):2486-2489. 被引量：13
2王杰,何明祥,陈海燕.主动实时数据库在数字矿山中的应用[J].中国科技信息,2014(9):175-177. 被引量：3
3曾志浩,姚贝,张琼林,孙琪.基于Hadoop平台的用户行为挖掘[J].计算技术与自动化,2015,34(2):100-103. 被引量：6
4茅郭胤.电网监控中的主动实时数据库理论和技术探讨[J].通讯世界（下半月）,2015(12):98-99. 被引量：3
5于金良,朱志祥,梁小江.一种基于Sqoop的数据交换系统[J].物联网技术,2016,6(3):35-37. 被引量：17
6公怀予,徐劲松,王攀.一种关联感知的大数据导入方法[J].电信科学,2016,32(3):130-134. 被引量：2
7刘晨,焦合军.基于HADOOP集群的数据采集和清洗[J].软件工程,2016,19(11):20-24. 被引量：2
8孙浩,李猷.主动实时数据库技术在电网监测中的应用[J].信息系统工程,2017,30(4):89-89. 被引量：2
9刘洋,李筱楠,刘会杰.基于Hadoop的煤炭企业数据共享系统设计[J].煤炭技术,2017,36(6):326-328. 被引量：3
10蒙杰,杨生举,赵昕晖,赵凡.基于Hadoop的海量科技信息资源管理系统设计与实现[J].科技管理研究,2017,37(13):181-186. 被引量：18

引证文献2

1汪华,李波,王彪,廖婷婷.融合架构的分布式数据库技术在气象大数据平台上的应用实践[J].中低纬山地气象,2020,44(5):93-96. 被引量：8
2姜昱辰,韩晓云,汪明贵.主动实时数据库技术在电网状态监测中的应用[J].微型电脑应用,2021,37(8):127-129. 被引量：2

二级引证文献10

1郭宗睿,汤志凤.基于一致性哈希算法的分布式数据库高效扩展方法研究[J].通讯世界,2021,28(2):307-308. 被引量：2
2包迅格,张景明,张吉,尚天婷.电力大数据智能分析平台设计与实现[J].通信电源技术,2021,38(2):95-97. 被引量：3
3李珏,谭海波,李波,金石声,汪华.气象虚拟化云平台搭建及安全防护的探讨[J].中低纬山地气象,2021,45(4):108-110. 被引量：4
4吴军,张琳.数据库SQL语言中的难点讨论[J].信息与电脑,2021,33(18):53-55. 被引量：2
5李轩,吴门新,侯英雨,庄立伟,何延波,孙少杰.农业气象大数据共享平台设计与实现[J].中国农业气象,2022,43(8):657-669. 被引量：8
6杨远恒,李进讷,廖婷婷,莫仕灯,李波.气象业务系统融入“天擎”“天镜”技术要点分析[J].中低纬山地气象,2022,46(6):85-88. 被引量：14
7汪华,支亚京,郭茜,刘国强,李波.超融合架构在气象行业的应用效果分析[J].中低纬山地气象,2023,47(2):105-108.
8廖婷婷,支亚京,李进讷,虞雪莹,汪华.气象数据在多种类数据库上查询统计能力初探[J].中低纬山地气象,2023,47(3):108-112. 被引量：1
9崔梦璐.电网运行状态监测与预警系统[J].通信电源技术,2023,40(19):84-86.
10李国婷,张嘉男,马媛,张国瑞.分布式数据库技术在气象大数据平台中的应用研究[J].信息与电脑,2024,36(8):152-154. 被引量：1

1张卫.Hadoop集群实现之原理初步探讨[J].电脑知识与技术,2019,15(4Z):71-72.
2陈小中,冒志建.高校智能视频监控实训平台设计探究[J].实验室研究与探索,2019,38(1):128-132. 被引量：3
3解腾刚,马毓杰.基于Hadoop的数据云盘的设计与实现[J].现代计算机,2019,25(13):96-100. 被引量：2
4张雪飞,张秉海.基于Spark MLlib的罪犯数据聚类分析[J].科技经济导刊,2019(13):18-18. 被引量：1
5宾璐.基于RSYNC实现TeamCenter系统文件数据迁移[J].技术与市场,2019,26(7):171-171. 被引量：1
6陈佩婷.医学检验区域化集成平台的建立与应用[J].信息与电脑,2016,28(20):70-71. 被引量：2
7郑令晗,肖冬梅.欧盟非个人数据自由流动制度及其中国本土化[J].图书情报工作,2019,63(13):122-128. 被引量：8
8朱松鸟,耿红江,杨光辉,崔占茹,黄埔,王连君.云平台间地震工区数据的迁移与管理[J].石油地球物理勘探,2018,53(A01):303-309. 被引量：1
9谢地,王同喜.基于HBase的海量数据存储和快速检索[J].电脑知识与技术,2019,15(2):14-15. 被引量：5
10庄城城,易辉,张杰,刘帅.基于迁移学习LSSVM的模拟电路故障诊断[J].电子器件,2019,42(3):668-673. 被引量：6

水利信息化

2019年第3期

浏览历史

内容加载中请稍等...

基于虚拟化的水务分布式大数据存储平台设计被引量：2

参考文献9

二级参考文献63

共引文献269

同被引文献19

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于虚拟化的水务分布式大数据存储平台设计 被引量：2

参考文献9

二级参考文献63

共引文献269

同被引文献19

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于虚拟化的水务分布式大数据存储平台设计被引量：2