基于MapReduce的多机并行DP算法与实验分析被引量：4

Research on Multi-machine Parallel DP Algorithm Based on MapReduce

导出

摘要随着网络地图不断发展,个性化网络地图也得到快速发展。个性化网络地图需要以矢量数据为数据基础,以满足人们对地图色彩、符号等个性化要求,所以需要实时、快速进行大量数据化简。本文以经典Douglas-Peucker算法作为曲线化简算法,利用开源云计算平台Hadoop建立多机协作的曲线并行化简服务框架,设计和实现了多机并行Douglas-Peucker算法,并在集群上进行实验分析,验证算法的效率和适用性。算法核心是设计数据的逻辑分片,利用MapReduce计算原理,将分片分配到集群中,实现并行运算。实验分别分为两个方面:(1)比较在固定阈值不同数据量情况下,传统DP算法与多机并行DP算法效率;(2)比较在相同数据量不同阈值情况下,传统DP算法与多机并行DP算法效率。实验表明,在大数据量和高复杂度情况下,多机并行DP算法的效率更高。 Real time and rapid simplification of large-scale data,required by personalized WebGIS service which is based on vector data,becomes more and more important.The study was based on Douglas-Peucker,one of classical curve simplification algorithms,but in the view of its low performance,it can hardly simplify large-scale data in real time and rapidly.At the same time,the development of cloud-computing offers new storage technologies and computational methods for real time and rapid simplification of large-scale data.So this study made use of hadoop,one of the open source cloud computing platforms,to design and realize multi-machine parallel Douglas-Peucker algorithm.In the algorithm,we deigned the logic slices of data,and assigned the slices to the clusters by MapReduce computing model,achieved parallel simplification.In order to verify the efficiency of the algorithm,we designed the experiments and compared the efficiency of traditional DP algorithm and multi-machine parallel DP algorithm in tow aspects： 1） the same threshold and different amount of data;and 2） the fixed amount of data and different thresholds.The（result of the experiments showed： the multi-machine parallel DP algorithm was more efficient than tradition DP algorithm for large-scale data and high-complexity computing.In this case,the data processing time was much longer than the data allocated in the inter-cluster and the transmission time,and every node was involved in a certain operation,improved the efficiency of operations.But for small scale data and low-complexity computing,the advantage of multi-machine parallel DP algorithm was non-obvious.Mainly due to a part of the nodes didn＇t participate in the operation,the computing potential of the cluster was not full play,while the data processing required time was very short,so the data allocation and transmission time impacted obviously.And,in order to meet the real time and rapid simplification of large-scale data,the multi-machine parallel DP algorithm should choose the appropriate simplification method for different amount of data and complexity computing in future.

作者张栋海黄丽娜刘晖唐健

机构地区武汉大学卫星导航技术研究中心武汉大学地理信息系统教育部重点实验室武汉大学资源与环境科学学院

出处《地球信息科学学报》 CSCD 北大核心 2013年第1期55-60,共6页 Journal of Geo-information Science

基金国家自然科学基金项目(41101448 51008138) 中央高校自主科研项目(274737) 中国博士后科学基金项目(2011M501230)

关键词多机并行DP算法 Douglas—Peucker算法曲线化简 MAPREDUCE multi-machine parallel DP algorithm Douglas-Peucker algorithm curve simplification MapReduce

分类号 P208 [天文地球—地图制图学与地理信息工程] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献19

1蔡晓桦.云计算及其在地理信息系统中的应用[J].江西测绘,2012(1):39-41. 被引量：6
2郭庆胜.线状要素图形综合的渐进方法研究[J].武汉测绘科技大学学报,1998,23(1):52-56. 被引量：36
3Li,Z,郭庆胜.基于客观综合自然规律的线状要素自动综合的算法[J].武测译文,1994(1):49-58. 被引量：20
4Buttenfield B P. Digital definitions of scale-dependentstructured]. Auto-Carto,1986,497 - 506.
5艾廷华,郭仁忠,刘耀林.曲线弯曲深度层次结构的二叉树表达[J].测绘学报,2001,30(4):343-348. 被引量：66
6应申,李霖.基于约束点的曲线一致性化简[J].武汉大学学报（信息科学版）,2003,28(4):488-491. 被引量：10
7任海艳,陈飞翔.一种基于遗传算法的曲线化简方法[J].测绘通报,2012(10):32-35. 被引量：2
8Douglas D H,Peucker T K. Algorithms for the reduc-tion of the number of points required to represent a digi-tized line or its character[J], The Canadian Cartogra-pher, 1973,10(2) . 112 - 123.
9毋河海.基于多叉树结构的曲线综合算法[J].武汉大学学报（信息科学版）,2004,29(6):479-483. 被引量：22
10张胜,朱才连,钟世明.Douglas-Peucker算法的改进及应用[J].武汉理工大学学报（交通科学与工程版）,2005,29(5):671-674. 被引量：23

二级参考文献70

1LIU Yaolin Martien Molenaar AI Tinghua LIU Yanfang.FRAMEWORKS FOR GENERALIZATION CONSTRAINTS AND OPERATIONS BASED ON OBJECT-ORIENTED DATA STRUCTURE IN DATABASE GENERALIZATION[J].Geo-Spatial Information Science,2001,4(3):42-49. 被引量：1
2朱长青,王玉海,李清泉,柳林涛.基于小波分析的等高线数据压缩模型[J].中国图象图形学报（A辑）,2004,9(7):841-845. 被引量：24
3张海堂,罗睿,郭建星,王天还.基于三角网渐进式简化的等高线多尺度综合[J].测绘信息与工程,2004,29(5):11-13. 被引量：7
4陈正鸣,李春雷.多边形链求交的改进算法[J].计算机辅助设计与图形学学报,2004,16(12):1713-1718. 被引量：15
5艾廷华,郭宝辰,黄亚峰.1∶5万地图数据库的计算机综合缩编[J].武汉大学学报（信息科学版）,2005,30(4):297-300. 被引量：49
6张胜,钟世明,朱才连.基于XML的WebGIS构架的设计与实现[J].武汉理工大学学报（交通科学与工程版）,2005,29(2):304-307. 被引量：17
7范庆.Delaunay三角剖分的递进构造算法[J].福州大学学报（自然科学版）,1995,23(5):7-11. 被引量：1
8王桥.线状地图要素的自相似性分析及其自动综合[J].武汉测绘科技大学学报,1995,20(2):123-128. 被引量：7
9焦健,魏立力,曾琪明.基于QTM的线状图形自动化简算法探讨[J].测绘科学,2005,30(5):89-91. 被引量：10
10任子武,伞冶.自适应遗传算法的改进及在系统辨识中应用研究[J].系统仿真学报,2006,18(1):41-43. 被引量：169

共引文献174

1许梁,石丽红,李丽,赵习枝.矢量行政区划界线数据压缩方法研究[J].测绘科学,2022,47(10):198-204.
2王杭宇,闫浩文.一种曲线分割与化简的并行算法[J].测绘科学,2020,45(1):194-198.
3黄继风.基于Delaunay三角网的城市多边形合并算法[J].计算机工程与设计,2004,25(7):1220-1222. 被引量：16
4艾廷华,郭宝辰,黄亚峰.1∶5万地图数据库的计算机综合缩编[J].武汉大学学报（信息科学版）,2005,30(4):297-300. 被引量：49
5姜永发,张书亮,兰小机,闾国年.长对角线法实现GIS中矢量地图面状地物汉字注记的自动配置[J].武汉大学学报（信息科学版）,2005,30(6):544-548. 被引量：18
6刘颖,翟京生.海岸线形态的表达与自动综合[J].测绘与空间地理信息,2005,28(4):78-81. 被引量：9
7温俊丽,刘艳芳,何建华,王振宇.湖北省农用地分等成果整合关键技术研究[J].测绘科学,2007,32(1):128-129. 被引量：3
8吴凡,粟卫民,杨英伟,邬金.基于联合Delaunay三角网的等高线地形特征提取研究[J].中国矿业大学学报,2007,36(2):172-176. 被引量：10
9张传明,潘懋,吴焕萍,徐绘宏.保持拓扑一致性的等高线化简算法研究[J].北京大学学报（自然科学版）,2007,43(2):216-222. 被引量：11
10陈波,朱鲲鹏,薛本新.线状要素化简算法的分析与评估[J].测绘科学技术学报,2007,24(2):121-124. 被引量：9

同被引文献60

1王明常,谷兰英,王宇,李建平.小波变换理论的线状要素制图综合研究[J].吉林大学学报（地球科学版）,2005,35(S1):147-150. 被引量：4
2卢浩,王少华,李绍俊,裘立,单庆超.基于OpenMP的并行化水文分析算法研究与实现[J].测绘与空间地理信息,2013,36(S1):7-10. 被引量：6
3朱长青,王玉海,李清泉,柳林涛.基于小波分析的等高线数据压缩模型[J].中国图象图形学报（A辑）,2004,9(7):841-845. 被引量：24
4Li,Z,郭庆胜.基于客观综合自然规律的线状要素自动综合的算法[J].武测译文,1994(1):49-58. 被引量：20
5艾廷华,郭宝辰,黄亚峰.1∶5万地图数据库的计算机综合缩编[J].武汉大学学报（信息科学版）,2005,30(4):297-300. 被引量：49
6朱鲲鹏,武芳,陈波,薛本新.基于约束条件的线要素化简算法质量评估[J].测绘科学,2007,32(3):28-30. 被引量：9
7王玉海,朱长青.基于小波分析的线状要素压缩优化的综合性研究[J].武汉大学学报（信息科学版）,2007,32(7):630-632. 被引量：4
8朱鲲鹏,武芳,王辉连,朱强.Li-Openshaw算法的改进与评价[J].测绘学报,2007,36(4):450-456. 被引量：32
9LIN C,SNYDER L.Principles of parallel programming. . 2008
10Zhan HS,Li G X.Progressive transmission of vector map data basedon polygonal chain simplification. Lecture Notes in ComputerScience . 2006

引证文献4

1王杭宇,闫浩文.一种曲线分割与化简的并行算法[J].测绘科学,2020,45(1):194-198.
2徐道柱,金澄,焦洋洋.并行处理技术在地理信息数据处理中的应用[J].测绘科学技术学报,2016,33(6):629-634. 被引量：1
3张振鑫,张维,刘嫔,寇一丹,邓浩.矢量地图数据简化研究进展[J].测绘工程,2016,25(6):10-14. 被引量：3
4黄飞龙,张吉才,宋默,郭力刚.基于共享内存方式化简矢量数据的并行策略[J].测绘科学与工程,2019,39(3):61-66.

二级引证文献4

1李世宝,陈通,刘建航,陈海华.基于交叉点的道路曲线化简算法研究[J].测绘工程,2017,26(7):1-4. 被引量：2
2黄飞龙,张吉才,宋默,郭力刚.基于共享内存方式化简矢量数据的并行策略[J].测绘科学与工程,2019,39(3):61-66.
3冯峰,蒋维.一种带约束限制的三次B样条曲线矢量数据压缩算法[J].数学杂志,2021,41(3):247-256. 被引量：5
4张磊.基于Winsock的分布式数据处理技术[J].地理空间信息,2022,20(7):61-64.

1谢立,胡玲玲,吕一品,熊刚,陈耀武.面向智能视频监控系统运动目标检测的轮廓提取方法[J].东南大学学报（自然科学版）,2012,42(A01):31-35. 被引量：11
2任海艳,陈飞翔.自适应遗传算法的改进及在曲线化简中的应用[J].计算机工程与应用,2012,48(11):152-155. 被引量：10
3周小斌,黄正军.多机协作在数字校园系统中的应用[J].计算机仿真,2005,22(3):184-187.
4胡秀珍,隋青美.基于机器视觉的铁芯表面缺陷检测系统研究[J].仪器仪表用户,2017,24(1):21-23. 被引量：6
5陈飞翔,于文洋,李华.基于GA的矢量数据压缩优化算法[J].计算机工程与应用,2007,43(34):185-187. 被引量：5
6张佐理.一种抗压缩的矢量地图水印算法[J].计算机工程,2010,36(20):137-139. 被引量：5
7柯敏毅,王治国.移动GIS中的空间矢量数据压缩方法[J].地理空间信息,2007,5(1):24-26. 被引量：8
8黄超,何治宇.基于SNMP数据采集系统的设计与实现[J].计算机与数字工程,2007,35(10):119-121.
9闫焱,刘允才.复杂背景下的角点检测[J].微型电脑应用,2009,25(1):51-53. 被引量：1
10张真.一种改进的基于Douglas—Peucker原理的轮廓采样算法[J].电脑知识与技术,2009,5(9):7214-7216. 被引量：3

地球信息科学学报

2013年第1期

浏览历史

内容加载中请稍等...

基于MapReduce的多机并行DP算法与实验分析被引量：4

参考文献19

二级参考文献70

共引文献174

同被引文献60

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的多机并行DP算法与实验分析 被引量：4

参考文献19

二级参考文献70

共引文献174

同被引文献60

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的多机并行DP算法与实验分析被引量：4