基于Apache Spark的地震观测数据噪声功率谱计算被引量：2

Noise Power Spectrum Calculation Method of Seismic Data Based on Apache Spark

下载PDF

导出

摘要为解决单机环境下海量地震观测数据计算和分析效率低下的问题,提出一种基于分布式架构的地震观测数据的存储、计算和分析处理方法,选择噪声功率谱复杂计算过程的应用场景进行实现.基于Hadoop在海量数据处理上的性能优势,在分布式文件存储系统HDFS上进行地震观测数据的存储和调度,研究测震数据噪声功率谱的质量评估方法在Spark分布式计算架构上的实现,采用弹性数据集Spark RDD将计算任务自动分配到计算节点,解析存储在HDFS中的测震波形数据,计算结果采用RowKey方式放入分布式数据库HBase中,实现了长周期地震噪声功率谱结果的存储和提取.计算结果表明,基于Spark分布式架构的该方法可以支撑TB级海量数据的处理,并且具有较高的处理效率,可应用于海量地震观测数据的分析计算. To solve the problem of inefficient calculation and analysis of massive seismic data in a single machine environment,we propose a distributed architecture based method for storage,calculation,and analysis of seismic data and select the complex calculation process of a noise power spectrum as the application scenario for implementation.In light of Hadoop’s performance advantage in massive data processing,the storage and scheduling of seismic data are carried out on the Hadoop Distributed File System(HDFS).The implementation of the quality evaluation method for the noise power spectrum of seismic data in Spark distributed computing architecture is studied.The elastic dataset Spark RDD is used to automatically allocate the tasks to the computing nodes,and the seismic waveform data stored in HDFS is analyzed.In addition,the calculation results are input into the distributed database HBase in the RowKey mode,realizing the storage and extraction of the power spectra of long-period seismic noise.The calculation results show that the method based on Spark distributed architecture can support the efficient processing of massive data at the TB level in volume,which can be applied to the analysis and calculation of massive seismic data.

作者郭凯黎建辉温亮明韩振华 GUO Kai;LI Jian-Hui;WEN Liang-Ming;HAN Zhen-Hua(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China;China Seismic Network Center,Beijing 100045,China;Taiyuan University of Technology,Taiyuan 030024,China)

机构地区中国科学院计算机网络信息中心中国科学院大学中国地震台网中心太原理工大学

出处《计算机系统应用》 2021年第8期126-132,共7页 Computer Systems & Applications

基金国家重点研发计划(2018YFC1504500) 中国地震局监测、预报、科研三结合课题(3JH-20200207)。

关键词地震观测数据噪声功率谱 SPARK HADOOP 分布式 seismic data noise power spectrum Spark Hadoop distributed

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] P315.63 [天文地球—地震学]

引文网络
相关文献

参考文献3

1谢江涛,林丽萍,谌亮,赵敏.地震台站台基噪声功率谱概率密度函数Matlab实现[J].地震地磁观测与研究,2018,39(2):84-89. 被引量：22
2胡俊,胡贤德,程家兴.基于Spark的大数据混合计算模型[J].计算机系统应用,2015,24(4):214-218. 被引量：56
3郭凯,黄金刚,彭克银,庞丽娜.大数据技术在海量测震数据中的研究应用[J].地震研究,2017,40(2):317-323. 被引量：12

二级参考文献20

1夏俊鸾,邵赛赛.Spark Streaming: 大规模流式数据处理的新贵. http://www.csdn.net/article/2014-01-28/2818282-Spark -Streaming-big-data. 2014.
2Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters. Communications of the ACM, 2008, 3(51-1): 107-113.
3耿益锋,陈冠诚.Impala:新一代开源大数据分析引擎. http://www.csdn.net/article/2013-12-04/2817707-ImpalaBig- Data-Engine. 2013.12.
4Strom. http://storm.incubator.apache.org/. 2014.
5Zaharia M, Chowdhury M, Das T, et al. Resilient distributed datasets: A fault-tolerant abstration for in-memory cluster computing. Proc. of the 9th USENIX Conference on NetWorked System Design and Implementation. 2012. 2-16.
6Gonzalez J, Low Y, Gu H. PowerGraph: Distributed garph-p arallel computation on natural graphs. Proc. of the 10th USENIX Symposium on Operating Systems Design and Implementatin. 2012. 17-30.
7Zaharia M, Chowdhury M, Franklin MJ, Shenker S, Stoica I. Spark: Cluster Computing with Working Sets. Technical Report No. UCB/ EECS- 2010-53May 7, 2010.
8Xin R, Rosen J, et al. Shark: SQL and Rich Analytics at Scale. Technical Report UCB/EECS. 2012.11.
9Engle C, Lupher A, et al. Shark: Fast Data Analysis Using Coarse-grained Distributed Memory. SIGMOD 2012. May 2012.
10Zaharia M, Das T, Li HY, Shenker S, Stoica I. Discretized streams: An efficient and fault-tolerant model for stream. Proc. on Large Clusters. HotCloud 2012. June 2012.

共引文献87

1韩亚兰,韩学明,白玲.用电子冷热针灸仪治疗糖尿病50例疗效观察[J].针灸临床杂志,2000,16(2):33-34. 被引量：1
2叶小榕,邵晴.基于Spark的大规模社交网络社区发现原型系统[J].科技导报,2018,36(23):93-101. 被引量：8
3陆韦,朱捷飞,崔德义,孟飞.基于“互联网+”的电网用电监察平台设计[J].自动化与仪器仪表,2019(1):103-105. 被引量：2
4汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(1):178-180. 被引量：2
5汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(2):193-196. 被引量：1
6张雄,陆路,石宣化.分布式数据处理系统内存对象管理问题分析[J].中兴通讯技术,2016,22(2):19-22. 被引量：2
7陈羽中,郭松荣,陈宏,李婉华,郭昆,黄启成.基于并行分类算法的电力客户欠费预警[J].计算机应用,2016,36(6):1757-1761. 被引量：11
8林穗,赵菲.基于Spark的线性模型在广告投放系统中的应用研究[J].广东工业大学学报,2016,33(5):28-33. 被引量：4
9张琦,张春平,杨志,刘铭.基于OPC框架的高效计算服务应用[J].计算机系统应用,2016,25(9):92-97.
10李玮.Apache Spark技术研究与应用前景分析[J].电信技术,2016(9):67-68. 被引量：3

同被引文献11

1马献,陈丽,郝冀皖,刘陆陆,高婧怡.利用kubernetes集群搭建基于容器技术的分布式架构数据中心研究[J].中国数字医学,2021,16(12):43-48. 被引量：6
2胡小刚,郝晓光.汶川大地震宽带地震仪短临异常及成因初探[J].地球物理学报,2008,51(6):1726-1734. 被引量：55
3郝春月,郑重,张爽.玉树地震前后当地的噪声变化研究[J].地球物理学进展,2012,27(6):2418-2428. 被引量：7
4杨立明,郝臻,王建军,胡永军.汶川、玉树地震临震波动现象的震例研究[J].国际地震动态,2015,36(9):62-62. 被引量：5
5马瑾.从“是否存在有助于预报的地震先兆”说起[J].科学通报,2016,61(4):409-414. 被引量：59
6蒋长胜,刘瑞丰.国家地震烈度速报与预警工程——测震台网的机遇与挑战[J].工程研究（跨学科视野中的工程）,2016,8(3):250-257. 被引量：23
7郭凯,黄金刚,彭克银,庞丽娜.大数据技术在海量测震数据中的研究应用[J].地震研究,2017,40(2):317-323. 被引量：12
8杨立明,郝臻,王建军,张素珍,石学录.“兰州地脉动实时跟踪技术系统”简介[J].国际地震动态,2017,38(8):77-78. 被引量：2
9杨立明,郝臻,王建军,张淑珍,姚家俊,董蕾.强震临震微波动现象初步研究(一)[J].中国地震,2018,34(2):219-233. 被引量：10
10杨立明,郝臻,王建军,张淑珍,姚家俊,董蕾.强震临震微波动现象初步研究(二)[J].中国地震,2018,34(2):234-243. 被引量：9

引证文献2

1郭凯,郑钰.基于大数据的强震临震前地震背景噪声异常分析--以2013年芦山7.0级地震为例[J].中国地震,2022,38(3):503-512. 被引量：1
2王翔.高并发访问下的分布式系统架构设计[J].智能城市,2023,9(3):5-7. 被引量：3

二级引证文献4

1蔡万元.计算机网络中的分布式系统与服务治理研究[J].电子技术与软件工程,2023(8):13-16. 被引量：2
2张平,李慧春.高并发性能问题优化方案研究[J].信息技术与信息化,2023(11):166-169. 被引量：1
3李旭方.基于PolarDB的分布式高并发系统架构设计[J].软件,2024,45(8):123-125.
4李晨阳,池成全.机器学习在地震观测异常数据提取中的应用[J].海南师范大学学报（自然科学版）,2024,37(3):348-356.

1金冉,陈伟,刘国富,王春羽,蒲红.压电加速度传感器H_n估计校准方法[J].噪声与振动控制,2021,41(2):255-260. 被引量：3
2黎雷生,杨文浩,马文静,张娅,赵慧,赵海涛,李会元,孙家昶.复杂异构计算系统HPL的优化[J].软件学报,2021,32(8):2307-2318. 被引量：2
3李姗姗,孙晓玲,袁国铭.基于大数据挖掘技术的地震舆情感知研究[J].防灾科技学院学报,2021,23(1):80-86. 被引量：2
4田亚军,高静怀,王大兴,陈道雨.基于深度神经网络的地震强反射剥离方法[J].地球物理学报,2021,64(8):2780-2794. 被引量：7
5刘琳琳.记忆力大比拼[J].初中生学习指导,2021(23):64-64.
6李宇.基于Hadoop的分布式外观专利图像检索系统研究[J].电脑知识与技术,2021,17(18):205-208.
7周少珂,张振平,邵华,徐茹茹,张瑛.基于Hadoop技术的物联网资产管理系统性能研究[J].河南科技,2021,40(12):22-25.
8王磊,柏庆国,任建峰.具有两种运输方式选择的物流排序问题[J].运筹与管理,2021,30(6):1-5.
9孙浚哲,曾显凤,韩乐乐,王元鹏.区块链技术为智慧医疗赋予新动能——以共享病历系统建设为例[J].消费电子,2021(8):80-80. 被引量：1
10袁志伟.在线学习行为日志数据挖掘算法优化[J].自动化与仪器仪表,2021(8):65-68. 被引量：1

计算机系统应用

2021年第8期

浏览历史

内容加载中请稍等...

基于Apache Spark的地震观测数据噪声功率谱计算被引量：2

参考文献3

二级参考文献20

共引文献87

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Apache Spark的地震观测数据噪声功率谱计算 被引量：2

参考文献3

二级参考文献20

共引文献87

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Apache Spark的地震观测数据噪声功率谱计算被引量：2