期刊文献+

基于Elasticsearch的气象数据检索技术研究 被引量:9

Research on Meteorological Data Retrieval Technology Based on Elasticsearch
下载PDF
导出
摘要 气象行业的数据量非常大,系统需要每天处理约有800 G的增量数据,总容量超过1 P的历史数据文件。为了能够及时、快速地存储这些数据,并且能解决气象数据服务的需求,构建一套科学、高效的数据服务系统迫在眉睫。基于Elasticsearch技术,采用元数据的管理方法,设计了一套数据管理系统。按照业务类型和数据名称特点,把所有数据分成了13个大类和260多个元数据类型,设计了相同的元数据模板,便于统一管理。同时对13个大类分别构建了索引,定义了气象行业专业的检索词条,实现了快速定位和访问数根据文件的需求。该设计方法实现了1~2秒钟内可以从5亿个文件库中搜索出某一大类的文件,在2~3秒钟可以更加精确地搜索出某一元数据类型的数据。基于以上设计方案,基本满足了当前的数据服务需要。 The amount of data in the meteorological industry is very large.The system needs to process about 800 G incremental data every day,with a total capacity of more than 1 P of historical data files.In order to store these data in time and quickly,and to meet the needs of meteorological data service,it is urgent to build a set of scientific and efficient data service system.Based on Elasticsearch technology and using metadata management method,we design a data management system.According to the characteristics of business type and data name,all data are divided into 13 categories and more than 260 metadata types.The same metadata template is designed to facilitate unified management.At the same time,the indexes of 13 categories are constructed separately.The retrieval terms of meteorological profession are defined,and the requirement of fast positioning and accessing data files is realized.The proposed method can search a large class of files from 500 million file libraries in 1~2 seconds.In 2~3 seconds,the data of a metadata type can be searched more accurately.Based on the above design scheme,it can basically meet the current data service needs.
作者 张恩红 尹海燕 李高洁 ZHANG En-hong;YIN Hai-yan;LI Gao-jie(Guangdong Meteorological Observation Data Center,Guangzhou 510641,China)
出处 《计算机技术与发展》 2019年第11期154-158,共5页 Computer Technology and Development
基金 国家自然科学基金(41805096) 江苏省自然科学基金(BK20180801)
关键词 Elasticsearch 海量数据 检索 元数据 数据服务 Elasticsearch massive data retrieval metadata data service
  • 相关文献

参考文献12

二级参考文献99

  • 1周炎涛,陈贤谋.ASP.NET中TreeView控件与数据库结合创建动态目录树[J].航空计算技术,2004,34(2):25-27. 被引量:5
  • 2季凯帆,曹文达,宋谦.FITS、BMP和SCR图象格式及相互转换[J].云南天文台台刊,1996(2):60-64. 被引量:10
  • 3王贺封.时空数据模型及TGIS研究[J].测绘与空间地理信息,2006,29(4):11-13. 被引量:25
  • 4杨海涛,石磊,卫琳.一个基于搜索结果的个性化推荐系统[J].计算机工程与应用,2006,42(32):150-153. 被引量:3
  • 5居锦武,王兰英.NTFS文件系统剖析[J].计算机工程与设计,2007,28(22):5437-5439. 被引量:14
  • 6水利部水利信息化工作领导小组办公室.2012年度中国水利信息化发展报告[M].北京:中国水利水电出版社, 2013.
  • 7Rafal Kuc.Elasticsearch Server[M].Packt Publishing Limited, 2013:2-80.
  • 8Bezemer C P, Zaidman A.Multi-tenant SaaS applications: Maintenance dream or nightmare[C]// Proceedings of the Joint ERCIM Workshop on Software Evolution(EVOL) andInternational Workshop on Principles of Software Evolution(IWPSE).ACM, 2010:88-92.
  • 9Jara A J, Lopez P, Fernandez D, et al.Mobile digcovery: Discovering and interacting with the world through the Internet of things[J].Personal and Ubiquitous Computing,2014,18(2):323-338.
  • 10Singh A, González-Vélez H.Hierarchical multi-log cloud-based search engine[C]// Eighth International Conference on Complex, Intelligent and Software IntensiveSystems.2014:211-219.

共引文献95

同被引文献82

引证文献9

二级引证文献29

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部