面向海量水利数据的索引方法研究被引量：2

Research on Index Method of Massive Hydrology Data

下载PDF

导出

摘要水利数据的存储形式多样、数据量庞大以及水利实体种类丰富,针对每一类水利实体对象,不仅存在基础描述信息,也存在一系列测量业务信息,这2类数据存储和更新频率不相同。水利业务检索不仅要求能实现对象基础信息的快速检索,还要求根据基础描述信息和业务信息之间的依赖进行组合查询,而目前云环境中,尚缺能满足此类兼顾多类型数据之间依赖关系的高效索引方法。此外,水利数据量的急剧增长,给系统检索性能带来了巨大的挑战。为此,本文提出基于Hadoop的分布式双层索引结构HRB,针对不同的数据类型建立不同的索引。经实验验证,HRB索引与常规分布式索引相比,索引创建效率更优,且在数据量达到千万级别时,HRB检索速度更快,表明HRB具有一定的使用价值。 A large amount of hydrology data are stored in different forms and there are rich varieties of hydrology entity classes.For every type of hydrology entities,some basic description information and series of measuring business data involved in these entities are stored in different way with different update frequency. Hydrology business retrieve requests the index to provide basic descriptive information searching and a kind of combined query based on the relation between basic descriptive information and the business information. However,there is not an efficient index method which can consider several kinds of data and their dependencies. Furthermore,the rapid increasing of hydrology data also brings big challenges to retrieval performance. So,this paper proposes a distributed two-level index HRB based on Hadoop,which creates different index to satisfy different data types and retrieve requirements. The Experiments show that HRB is better at creating index than traditional distributed index,and when the amount of data reaches 10 million levels,HRB index retrieve data is faster. So,HRB has definitive value.

作者冯钧徐维纲冯读庆陆佳民徐欢

机构地区河海大学计算机与信息学院

出处《计算机与现代化》 2017年第10期29-35,41,共8页 Computer and Modernization

基金国家自然科学基金资助项目(61370091 61602151)

关键词水利实体双层索引结构分布式索引 HADOOP hydrology entities, two-level index, distributed index, Hadoop

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1孟必平,王腾蛟,李红燕,杨冬青.分片位图索引:一种适用于云数据管理的辅助索引机制[J].计算机学报,2012,35(11):2306-2316. 被引量：30
2蔡阳.关于水利信息化资源整合共享的思考[J].水利信息化,2014(6):1-6. 被引量：59
3刘义,景宁,陈荦,熊伟.MapReduce框架下基于R-树的k-近邻连接算法[J].软件学报,2013,24(8):1836-1851. 被引量：60
4程益联,付静.水利数据整合共享研究[J].水利信息化,2014(6):13-17. 被引量：25
5冯钧,许潇,唐志贤,徐黎明.水利大数据及其资源化关键技术研究[J].水利信息化,2013(4):6-9. 被引量：42

二级参考文献31

1Armbrust Michael, Fox Armando, Griffith Rean et al. A view of cloud computing. Communications of the ACM, 2010, 53(4): 50-58.
2Yang H-C, Dasdan A, Hsiao R L, Parker D S. Map-reduce merge: Simplified relational data processing on large clus- ters//Proceedings of the SIGMOD 2007. Beijing, China, 2007:1029-1040.
3Chowdhury N M Mosharaf Kabir, Boutaba Raouf. A survey of network virtualization. Computer Networks, 2010, 54 (5) : 862-876.
4Seshadri P, Pirahesh H, Leung T Y C. Complex query decorrelation//Proceedings of the ICDE. New Orleans, LA, 1996 : 450-458.
5Canahuate Guadalupe, Apaydin Tan, Sacan Ahmet, Ferha- tosmanoglu Hakan. Secondary bitmap indexes with vertical and horizontal partitioning//Proeeedings of the EDBT. Saint Petersburg, Russia, 2009:600-611.
6Sadoghi Mohammad, Jacobsen Hans-Arno. Be-tree: An in- dex structure to efficiently match boolean expressions over high-dimensional discrete spaee//Proceedings of the S1G- MOD Conference. Athens, Greece, 2011:637-648.
7Chang Fay, Dean Jerey, Ghemawat Sanjay et al. Bigtable: A distributed storage system for structured data//Proceedings of the OSDI. Seattle, Washington, USA, 2006:205-218.
8Apache HBase Project. http: //hbase. apache, org/.
9HBase Transactional Index. https: //github. eom/hbase- trx/hbase-transactional-tableindexed.
10Aguilera Marcos Kawazoe, Golab Wojciech M, Shah Mehul A. A practical scalable distributed B-tree//Proceedings of the VLDB. Auckland, New Zealand, 2008:598-609.

共引文献200

1蒋云钟,冶运涛,赵红莉,梁犁丽,曹引,顾晶晶.水利大数据研究现状与展望[J].水力发电学报,2020,39(10):1-32. 被引量：80
2张洋,李建新,乔偼.海委综合政务系统集成技术研究与实践[J].海河水利,2022(S01):72-76.
3方庆,杜文.新疆生产建设兵团(XPCG)灌区信息化平台设计与关键技术[J].办公自动化,2021(2):61-62.
4Chun-Ling Cheng,Chun-Ju Sun,Xiao-Long Xu,Deng-Yin Zhang.A Multi-dimensional Index Structure Based on Improved VA-file and CAN in the Cloud[J].International Journal of Automation and computing,2014,11(1):109-117. 被引量：2
5吴俊,苏寅生,马骞,陈新,耿大庆.南方电网厂站接线图平台的设计与应用[J].自动化与仪器仪表,2016(3):132-134. 被引量：4
6李津军.植物也会“说话”[J].科学24小时,2000(7):42-42.
7申德荣,于戈,王习特,聂铁铮,寇月.支持大数据管理的NoSQL系统研究综述[J].软件学报,2013,24(8):1786-1803. 被引量：193
8张雯.一种基于网络资源的数据挖据方法[J].数字通信,2013,40(5):84-87. 被引量：1
9朱晓霄.大数据时代索引员的使命[J].中国索引,2013,11(4):38-43. 被引量：4
10罗芳,李春花,周可,黄永峰,廖正霜.基于多属性的海量Web数据关联存储及检索系统[J].计算机工程与科学,2014,36(3):404-410. 被引量：8

同被引文献19

1冯钧,唐志贤,朱跃龙,韦冕,卞一路,史涯晴.水利信息资源目录服务元数据定义研究[J].水利信息化,2011(S1):19-22. 被引量：6
2王喜春,孙志禹.基于大数据的水利水电云GIS平台概述[J].人民长江,2013,44(S1):182-184. 被引量：11
3冯钧,唐志贤,黄如春,成建国,韦冕,卞一路,顾忠国,徐黎明.水利信息资源元数据管理方法研究[J].水利信息化,2011(5):1-4. 被引量：7
4许峰,戚荣志.防汛防旱预警系统的设计与实现[J].水利信息化,2012(5):4-8. 被引量：2
5冯钧,许潇,唐志贤,徐黎明.水利大数据及其资源化关键技术研究[J].水利信息化,2013(4):6-9. 被引量：42
6刘俊婷,毛继国.基于实景3维GIS的水库移动巡查系统的总体设计[J].测绘与空间地理信息,2013,36(9):117-118. 被引量：5
7樊龙,万定生,顾昕辰.基于Hadoop云平台的水利普查数据挖掘系统的设计和实现[J].计算机与数字工程,2014,42(5):831-834. 被引量：9
8苗旺,刘春辰,耿直.因果推断的统计方法[J].中国科学：数学,2018,48(12):1753-1778. 被引量：34
9李超.云计算在水利信息化建设中的研究与应用[J].通讯世界,2016,22(3):14-15. 被引量：9
10葛从兵,王士军,严吉皞,陈剑.智慧水库探讨[J].水利信息化,2018(4):20-24. 被引量：5

引证文献2

1张玉炳,高大水,杨明化,何向阳.基于云服务的水库管理移动应用系统设计与实现[J].人民长江,2019,50(A01):342-345. 被引量：1
2冯钧,朱跃龙,王云峰,周思源.面向数字孪生流域的知识平台构建关键技术[J].人民长江,2023,54(3):229-235. 被引量：14

二级引证文献15

1梁艳.水利工程建设信息管理系统设计与实现[J].水上安全,2023(4):40-42. 被引量：1
2刘涛,姚静华,潘庆,胡萍,马志远,王坦克,张宇弛,彭然.四川省数字孪生流域知识图谱的设计与实现[J].水利信息化,2023(3):14-19. 被引量：1
3董万钧,王留杰,董波,陈黎明,胡腾飞,牛睿平.数字孪生潭江流域先行先试建设与实践[J].水利信息化,2023(4):20-27. 被引量：2
4王仲,李世强.数字孪生抽水蓄能电站建设研究[J].水利水电快报,2023,44(9):110-115.
5杜庆顺,于百奎,刘媛媛,刘业森,胡文才,金炎辉.南四湖二级坝泄量纠偏模型建设探讨[J].中国水利,2023(20):59-62.
6徐波,王昕.数字孪生水利工程网络安全风险分析和保障体系[J].人民长江,2023,54(11):242-250. 被引量：2
7张军珲,霍建伟,崔培,胡光亮,董泽亮.数字孪生小浪底知识库建设研究与实践[J].水利信息化,2024(1):13-18.
8陈才明,王玉铜,陈亚威,王浩翔.数字孪生飞云江流域水利知识平台建设研究[J].水利信息化,2024(1):73-77.
9谢明霞.数字孪生水利内涵及应用场景研究[J].人民长江,2024,55(2):245-251.
10张恩康,安帅,贾子敬,秦欢.数字孪生技术及其在协同制造中的应用探究[J].中国科技纵横,2024(1):29-31.

1赵亚楠,朱月琴,李朝奎,肖克炎,范建福,李秋平.全国矿产资源潜力评价成果数据智能检索方法研究[J].中国矿业,2017,26(9):72-78. 被引量：1
2一个并不复杂的命题如何选择智能时代的家用电脑[J].数字家庭,2017,0(9):72-81.
3李昕.7大热门玩具短视频节目[J].中外玩具制造,2017,0(10):16-17.
4祁娟.论剑“数据之道”,首届“交通大数据论坛”来袭![J].运输经理世界,2017,0(7):28-31.
5杨建顺.日本行政法及行政法学的历史发展及其特色[J].法学家,1998(4):112-123. 被引量：8
6张新英,付川南.一种高效的多类型数据挖掘算法[J].中国电子科学研究院学报,2017,12(4):359-364. 被引量：10
7田甜,林岳新.新媒体背景下青少年媒介依赖关系透析[J].伤害医学（电子版）,2017,6(2):57-62.
8杨雪,王引权.钾素营养对药用植物品质形成影响的研究进展[J].浙江中医药大学学报,2017,41(8):711-714. 被引量：10
9郭建伟.快速检索,抓取电影中的精彩篇章[J].电脑知识与技术（经验技巧）,2017,0(9):102-103.
10吴伟.媒介数字化记忆功能下的传播新象[J].青年记者,2017,0(29):10-11. 被引量：3

计算机与现代化

2017年第10期

浏览历史

内容加载中请稍等...

面向海量水利数据的索引方法研究被引量：2

参考文献5

二级参考文献31

共引文献200

同被引文献19

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向海量水利数据的索引方法研究 被引量：2

参考文献5

二级参考文献31

共引文献200

同被引文献19

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向海量水利数据的索引方法研究被引量：2