面向大数据应用的多层次混合式并行方法被引量：1

Multilevel hybrid parallel method for big data applications

下载PDF

导出

摘要基于很多大数据应用存在对数据进行多种并行处理的需求,提出两层混合式并行方法,即执行单元的混合并行和计算模型的混合并行.通过在同一个计算节点上执行单元的混合并行,充分挖掘基础设施的计算能力,从而提高数据处理性能;采用在同一个执行引擎中集成多个计算模型的并行方法,以适合应用多样异质处理模式.不同的混合并行方法可以契合不同的数据和计算特点,以满足不同的并行目标.介绍了混合式并行方法的基本思想,并以前期开发的并行编程模型BSPCloud为基础,阐述了进程和线程混合并行、BSP和Map Reduce混合并行的主要实现机制. Many large data applications require a variety of parallel data processing. This paper presents a two-layer hybrid parallel method, i.e., hybrid parallel of execution units and hybrid parallel of computing model. By hybrid parallel of execution units on the same computing node. The computing power of infrastructure can be fully taped, and thus data processing performance can be improved. By integrating several calculation models into the same execution engine in a parallel way, diverse heterogeneous processing modes may be applied. Different hybrid parallel ways can meet different data and calculation characteristics, and meet different parallel objectives as well. This paper introduces the basic ideas of hybrid parallel methods, and describes main implementation mechanisms ofhybrid parallelism.

作者黄磊支小莉郑圣安

机构地区上海大学计算机工程与科学学院上海交通大学计算机科学与工程系

出处《上海大学学报（自然科学版）》 CAS CSCD 北大核心 2016年第1期69-80,共12页 Journal of Shanghai University:Natural Science Edition

基金上海市科委科研计划资助项目(15DZ1100305)

关键词混合并行编程模型整体同步并行(bulk SYNCHRONOUS parallel BSP) MAPREDUCE hybrid parallelism programming model bulk synchronous parallel （BSP） MapReduce

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献21

1Lynch C. Big data: how do your data grow? [J]. Nature, 2008, 455(4): 28-29.
2Goldston D. Big data: data wrangling [J]. Nature, 2008, 455(4): 15.
3王珊,王会举,覃雄派,周烜.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752. 被引量：615
4覃雄派,王会举,李芙蓉,李翠平,陈红,周烜,杜小勇,王珊.数据管理技术的新格局[J].软件学报,2013,24(2):175-197. 被引量：110
5张延松,焦敏,王占伟,王珊,周烜.海量数据分析的One-size-fits-all OLAP技术[J].计算机学报,2011,34(10):1936-1946. 被引量：30
6宫学庆,金澈清,王晓玲,张蓉,周傲英.数据密集型科学与工程：需求和挑战[J].计算机学报,2012,35(8):1563-1578. 被引量：79
7Ma K, Yang B. Log-based change data capture from schema-free document stores using Map-Reduce [C]//2015 International Conference on Cloud Technologies and Applications (CloudTech). 2015: 1-6.
8Jung G, Gnanasambandam N, Mukherjee T. Synchronous parallel processing of bigdata [C]//2012 IEEE fifth International Conference on Cloud Computing. 2012: 811-818.
9刘鑫,高伟,胡占义.Hybrid Parallel Bundle Adjustment for 3D Scene Reconstruction with Massive Points[J].Journal of Computer Science & Technology,2012,27(6):1269-1280. 被引量：4
10Feinbube F, Sobania J A, Tr¨oger P, et al. Light-weight programming of hybrid systems [J]. Parallel & Cloud Computing, 2012, 1(2): 34-44.

二级参考文献304

1周红福,宫学庆,郑凯,周傲英.基于高维空间的在线高效子空间Skyline算法——CSky[J].计算机学报,2007,30(8):1409-1417. 被引量：8
2[OL].<http://hadoop.apache.org.>.
3WinterCorp: 2005 TopTen Program Summary. http:// www. wintercorp, com/WhitePapers/WC TopTenWP. pdf.
4TDWI Checklist Report: Big Data Analytics. http://tdwi. org/research/2010/08/Big-Data-Analytics, aspx.
5Chaudhuri S, Dayal U. An overview of data warehousing and OLAP technology. SIGMOD Rec, 1997,26(1): 65-74.
6Madden S, DeWitt D J, Stonebraker M. Database parallelism choices greatly impact scalability. DatabaseColumn Blog. http://www, databasecolumn, com/2007/10/database-parallelism-choices, html.
7Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters//Proceedings of the 6th Symposium on Operating System Design and Implementation (OSDI ' 04). San Francisco, California, USA, 2004: 137-150.
8DeWitt D J, Gerber R H, Graefe G, Heytens M L, Kumar K B, Muralikrishna M. GAMMA--A high performance dataflow database machine//Proceedings of the 12th International Conference on Very Large Data Bases (VLDB' 86). Kyoto, Japan, 1986:228-237.
9Fushimi S, Kitsuregawa M, Tanaka H. An overview of the system software of a parallel relational database machine// Proceedings of the 12th International Conference on Very Large DataBases(VLDB'86). Kyoto, Japan, 1986:209-219.
10Brewer E A. Towards robust distributed systems//Proceedings of the 19th Annual ACM Symposium on Principles of Distributed Computing (PODC' 00). Portland, Oregon, USA, 2000:7.

共引文献1147

1张刘玲.会展行业发展现状及未来发展趋势[J].质量与市场,2023(12):31-33. 被引量：2
2李明建.试论大数据技术的图书馆特色馆藏文化建设[J].作家天地,2020(21):189-190.
3蔡维,尚雷明,杨子辉,石志勇,郝丽娟,胡丽琴.聚变实验装置数据库设计[J].计算机系统应用,2020,29(10):109-113.
4许瑞,谷守珍,沙行勉,诸葛晴凤,石亮,高思远.面向多读/写头磁畴壁存储器的优化研究[J].软件学报,2020(9):2723-2740.
5张安珍,李建中,高宏.基于符号语义的不完整数据聚集查询处理算法[J].软件学报,2020,31(2):406-420. 被引量：7
6王海音,孙连山,祁志斌.一种可视化数据起源管理工具[J].网络安全技术与应用,2020,0(3):59-61.
7陈然.大数据时代下企业精准营销发展难题及破解[J].中国经贸导刊,2019,0(5Z):95-96. 被引量：4
8梅傲.数据治理的逻辑基础和实现路径[J].经济法论丛,2023(2):309-325.
9刘汉龙,马彦彬,仉文岗.大数据技术在地质灾害防治中的应用综述[J].防灾减灾工程学报,2021,41(4):710-722. 被引量：22
10郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.

同被引文献12

1谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1):73-83. 被引量：198
2申德荣,于戈,王习特,聂铁铮,寇月.支持大数据管理的NoSQL系统研究综述[J].软件学报,2013,24(8):1786-1803. 被引量：193
3范玉雷,孟小峰.基于相变存储器和闪存的数据库事务恢复模型[J].计算机学报,2013,36(8):1582-1591. 被引量：3
4马洪宾,陈贵海.图引擎底层存储的设计与实现[J].计算机工程,2014,40(11):60-64. 被引量：1
5刘超,唐郑望,姚宏,胡成玉,梁庆中.云平台下图数据处理技术[J].计算机应用,2015,35(1):43-47. 被引量：4
6王有为,王伟平,孟丹.基于统计方法的Hive数据仓库查询优化实现[J].计算机研究与发展,2015,52(6):1452-1462. 被引量：16
7冯亮.差异分布式存储系统资源调度的优化仿真[J].计算机仿真,2016,33(3):343-346. 被引量：4
8罗波,李涛,王杰.基于图的服务起源追踪机制[J].计算机应用,2016,36(6):1650-1653. 被引量：1
9夏秀峰,梁利亮,李佳佳.PDM中单一BOM数据源的NoSQL数据组织研究[J].小型微型计算机系统,2016,37(7):1440-1444. 被引量：8
10于述春,叶青,王鹏.基于消息队列的在线编译系统[J].怀化学院学报,2016,35(5):56-59. 被引量：1

引证文献1

1刘玉芳.大规模关系图增量计算框架研究[J].自动化与仪器仪表,2017(7):33-35.

1罗四维,宋立丹,马桂祥.同步并行神经网络计算机典型算法的实现[J].北方交通大学学报,1992,16(3):52-57. 被引量：1
2马强,郎岩梅,唐文彦.同步并行图像采集系统的设计[J].仪器仪表学报,2003,24(z1):137-139. 被引量：6
3罗四维.神经网同步并行计算机[J].高技术通讯,1995,5(1):25-28.
4覃俊.用于图像处理的二元同步并行小波变换算法[J].微机发展,2000,10(4):38-39.
5杨轩,舒红平.基于形式化构件集成的研究[J].信息通信,2016,29(4):126-128.
6洪刚.同步并行总线在安全系统中的应用[J].铁道通信信号,2014,50(2):57-60. 被引量：1
7鄢勇,刘键.同步并行任务流图的最佳近似调度[J].电子学报,1989,17(5):22-27.
8方禹润,蔺兵兵,齐浩亮,白旭峰.基于Map Reduce海量教学资源存储模型研究[J].价值工程,2017,36(8):247-248.
9王子健.基于嵌入式操作系统的工业采集板设计[J].通信电源技术,2016,33(4):107-108. 被引量：1
10曹杰.存储技术的应用发展[J].中国金融电脑,2007(9):72-73. 被引量：1

上海大学学报（自然科学版）

2016年第1期

浏览历史

内容加载中请稍等...

面向大数据应用的多层次混合式并行方法被引量：1

参考文献21

二级参考文献304

共引文献1147

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向大数据应用的多层次混合式并行方法 被引量：1

参考文献21

二级参考文献304

共引文献1147

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向大数据应用的多层次混合式并行方法被引量：1