基于云计算系统的空间查询处理方法被引量：1

Spatial query processing approaches based on cloud computing system

导出

摘要针对传统的关系型空间数据库已经不能很好地适应于超大规模高并发空间查询访问的处理需要的问题,该文着眼于解决大数据时代下地理信息服务所面临的日益严峻的大规模空间查询访问需求,探索了一套基于Spark架构的空间查询实现技术,并给出相应的解决方案。提出一个基于Spark并提供类SQL访问接口的空间查询实现模型GeoSpark SQL,解决了以下关键问题:数据的外包矩形数据生成和标准地理信息数据对Spark的导入导出方法;Spark空间查询算子实现方法;Spark空间索引与查询优化方法。GeoSpark SQL模型在初步实验中,已可以满足实时性的要求,对复杂的空间查询也能有良好的性能表现。 For the traditional relational spatial database has been unable to meet the requirements of large scale and high concurrent access,this paper aimed to solve the increasingly large-scale spatial query access in the era of big data,and a set of methods and solutions of spatial query based on Spark was explored.An implementation model,GeoSpark SQL,based on Spark which provides SQL interface of spatial query were proposed,following key issues were researched and solved：the generation of bounding box to column and the import and export method of standard geographic spatial data;the expansion method for the access of spatial relationship operators in spatial query based on Spark;the accelerating method of spatial query parameter and the local cache of geometry deserialization.The model of GeoSpark SQL had been able to meet the demands of instantaneity in the preliminary experiments,which had a good performance in complex spatial join.

作者陈逸然黄舟

机构地区北京大学遥感与地理信息系统研究所

出处《测绘科学》 CSCD 北大核心 2016年第12期273-278,共6页 Science of Surveying and Mapping

关键词大数据 Spark架构空间关系空间查询云计算 big data Spark spatial relationship spatial query cloud computing

分类号 P209 [天文地球—测绘科学与技术]

引文网络
相关文献

参考文献3

1陈崇成,林剑峰,吴小竹,巫建伟,连惠群.基于NoSQL的海量空间数据云存储与服务方法[J].地球信息科学学报,2013,15(2):166-174. 被引量：61
2刘义,景宁,陈荦,熊伟.MapReduce框架下基于R-树的k-近邻连接算法[J].软件学报,2013,24(8):1836-1851. 被引量：60
3温馨,罗侃,陈荣国.基于Shark/Spark的分布式空间数据分析框架[J].地球信息科学学报,2015,17(4):401-407. 被引量：22

二级参考文献20

1张桂刚,李超,张勇,邢春晓.一种基于海量信息处理的云存储模型研究[J].计算机研究与发展,2012,49(S1):32-36. 被引量：23
2李德仁.论广义空间信息网格和狭义空间信息网格[J].遥感学报,2005,9(5):513-520. 被引量：75
3Bohm C, Krebs F. The k-nearest neighbor join: Turbo charging the KDD process. Knowledge Information System, 2004,6(6): 728-749. [doi: 10.1007/s10115-003-0122-9].
4Xia CY, Lu HJ, Coi BC, Hu J. Gorder: An efficient method for KDD joins processing. In: Proc. of the 30th Int'l Conf. on Very Large Data Bases (VLDB). 2004. 756-767.
5Yao B, Li FF, Kumar P. K nearest neighbor queries and KNN-joins in large relational databases (almost) for free. In: Proc. of the 26th Int'l Conf. on Data Engineering (ICDE). 2010.4-15. [doi: 10.1109/ICDE.2010.5447837].
6Yu C, Cui B, Wang SG, Su JW. Efficient index-based KNN join processing for high-dimensional data. Information and Software Technology, 2007,49(4):332-344. [doi: 10.1016/j.infsof.2006.05.006].
7Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters. Communications of the ACM, 2008,51(1):107-113 [doi: 10.1145/1327452.1327492].
8White T. Hadoop: The Definitive Guide. Sebastopol: Yahoo! Press, 2009.
9Zhang C, Li FF, Jestes J. Efficient parallel kNN joins for large data in MapReduce. In: Proc. of the 15th Int'l Conf. on Extending Database Technology (EDBT). 2012.38-49. [doi: 10.1145/2247596.2247602].
10Lu W, Shen YY, Chen S, Col BC. Efficient processing of k nearest neighbor joins using MapReduce. In: Proc. of the 38th lnt'l Conf. on Very Large Data Bases (VLDB). 2012. 1016-1027.

共引文献140

1张嘉,白晓飞,陶超,张小桐.大规模空间矢量数据分布式存储与计算优化[J].计算机系统应用,2020,29(12):251-256. 被引量：6
2巫建伟,陈崇成,吴小竹,林剑峰,黄昭,张锦福,郑师春,张颖.基于GeoKSCloud的地震影响场分析云服务研究——以福建省为例[J].地球信息科学学报,2013,15(5):695-704. 被引量：2
3刘中宇,刘海良.基于大数据的云教学环境设计[J].中国教育信息化（基础教育）,2013(12):18-21. 被引量：18
4吴小竹,陈崇成,林剑峰,巫建伟,林甲祥,雷德龙,蔡志明.地理知识云GeoKSCloud:动因、设计开发与应用[J].地球信息科学学报,2014,16(2):273-281. 被引量：1
5万川梅.基于大数据下的NOSQL和Mysql融合的数据存储模型研究[J].数字技术与应用,2014,32(2):96-96. 被引量：2
6刘琼,赵荣,孙立坚.Map/Reduce框架下的粗糙集空间数据挖掘改进算法[J].测绘科学,2014,39(5):49-53. 被引量：3
7马宏斌,王青山,王柯.一种地理空间数据即服务私有云设计[J].测绘与空间地理信息,2014,37(5):19-21. 被引量：9
8代亮,许宏科,陈婷,钱超,梁殿鹏.基于MapReduce的多元线性回归预测模型[J].计算机应用,2014,34(7):1862-1866. 被引量：17
9雷德龙,郭殿升,陈崇成,巫建伟,吴小竹.基于MongoDB的矢量空间数据云存储与处理系统[J].地球信息科学学报,2014,16(4):507-516. 被引量：42
10陆韦,朱捷飞,崔德义,孟飞.基于“互联网+”的电网用电监察平台设计[J].自动化与仪器仪表,2019(1):103-105. 被引量：2

同被引文献13

1郭清,何飞.空间信息技术在农业保险中的应用研究[J].地理信息世界,2014,21(1):79-84. 被引量：9
2张兵.遥感大数据时代与智能信息提取[J].武汉大学学报（信息科学版）,2018,43(12):1861-1871. 被引量：99
3翁海星,宫学庆,朱燕超,胡华梁.集群环境下分布式索引的实现[J].计算机应用,2016,36(1):1-7. 被引量：7
4王国军,庹国柱.乡村振兴战略中的农业保险--农业保险经营的风险及其防控[J].中国保险,2018,0(2):6-13. 被引量：17
5陈举平,丁建勋.矢量瓦片地图关键技术研究[J].地理空间信息,2017,15(8):44-47. 被引量：48
6韩衍欣,蒙继华.面向地块的农作物遥感分类研究进展[J].国土资源遥感,2019,31(2):1-9. 被引量：29
7贾旖旎,周新民,曹芳.基于HDFS+Spark的时空大数据存储与处理——以智慧无锡时空大数据为例[J].软件,2019,40(11):19-23. 被引量：8
8张哲,刘云鹤,王乃生.ElasticSearch分布式搜索引擎在地名地址检索中的应用[J].测绘与空间地理信息,2020,43(1):184-187. 被引量：4
9陈建海,陈淼,浦云明.基于微服务架构B/S系统的性能分析[J].计算机系统应用,2020,29(2):233-237. 被引量：19
10陈敬静,马明栋,王得玉.MongoDB负载均衡算法优化研究[J].计算机技术与发展,2020,30(3):88-92. 被引量：8

引证文献1

1姚雪,程立君,尚红英,庹国柱.基于“3S+ABC”技术的智慧农业保险系统设计与应用研究[J].保险职业学院学报,2020,34(5):53-62. 被引量：6

二级引证文献6

1冯文丽,郑昊宇.遥感技术在农业保险领域中的应用分析[J].农村金融研究,2021(7):3-8. 被引量：7
2马永海,胡庆毅,杨立凡,李臻园,焦淑亮,刘金涛,黄立钰.智慧农业发展现状及前景分析[J].现代农业研究,2021,27(11):11-15. 被引量：8
3赵思健,赖积保,李宏伟.农业保险精确承保精准理赔的科技赋能方案与路径[J].农业展望,2023,19(10):13-24. 被引量：3
4李子兆,信冠栋,胡畔,闪晓伟.空间遥感地理信息技术在农业保险中的应用探讨[J].南方农业,2024,18(4):110-113.
5庄家煜,包维嘉,苏武峥.农业遥感应用现状与展望[J].农业展望,2024,20(4):68-74. 被引量：2
6李维娜,张学之,高钰.农作物信息采集系统设计与实现[J].测绘与空间地理信息,2024,47(S01):167-170.

1靳凤营,张丰,杜震洪,刘仁义,李荣亚.基于Spark的土地利用矢量数据空间叠加分析方法[J].浙江大学学报（理学版）,2016,43(1):40-44. 被引量：10
2侯俊雄,李琦,朱亚杰,冯逍,毛曦.基于随机森林的PM2.5实时预报系统[J].测绘科学,2017,42(1):1-6. 被引量：32
3齐攀,刘伟平.WebGIS中空间数据库的研究与实现[J].科技信息,2009(13):54-55. 被引量：1
4王文青.大数据架构下的地震波形数据分析应用浅析[J].电脑编程技巧与维护,2016(9):64-64. 被引量：1
5刘刈,何险峰,刘德.卫星云图资料在降水量客观分析中的应用试验[J].高原山地气象研究,2017,37(1):80-83. 被引量：2
6温馨,罗侃,陈荣国.基于Shark/Spark的分布式空间数据分析框架[J].地球信息科学学报,2015,17(4):401-407. 被引量：22
7杨先洪.非关系型与关系型空间数据库对比分析[J].通讯世界,2015,21(1):221-222. 被引量：1
8陈增林.外貌协会专供中兴星星1号（星钻粉）[J].微型计算机,2014,0(34):48-49.
9J-H. Wang,S-S. Ou,姚雪绒.论地震断层的标度律[J].世界地震译丛,2001(2):73-83.
10姜晨光.精密三角高程测量严密计算的理论研究与初步实验[J].四川测绘,1996,19(3):125-128. 被引量：11

测绘科学

2016年第12期

浏览历史

内容加载中请稍等...

基于云计算系统的空间查询处理方法被引量：1

参考文献3

二级参考文献20

共引文献140

同被引文献13

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于云计算系统的空间查询处理方法 被引量：1

参考文献3

二级参考文献20

共引文献140

同被引文献13

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于云计算系统的空间查询处理方法被引量：1