一种粗粒度可重构体系结构多目标优化映射算法被引量：4

A Multi-Objective Optimization Mapping Algorithm for Coarse Grained Reconfigurable Architectures

下载PDF

导出

摘要针对多约束下的行流水粗粒度可重构体系结构的硬件任务划分映射问题,提出了一种多目标优化映射算法.该算法根据运算节点执行时延、依赖度等因素构造了累加概率权值函数,在满足可重构单元面积和互连等约束下,通过该函数值动态调整就绪节点的映射调度次序,当一块可重构单元阵列当前行映射完毕后,就自动换行,当一块阵列被填满,就切换到下一块,当一个数据流图映射完毕后,就自动计算划分块数等参数.实验结果表明,与层贪婪映射算法相比,文中算法平均执行总周期降低了8.4%(RCA4×4)和5.3%(RCA6×6),与分裂压缩内核映射算法相比,文中算法平均执行总周期降低了20.6%(RCA4×4)和21.0%(RCA6×6),从而验证了文中提出算法的有效性. Based on rowpipelining coarse grained reconfigurable architecture（ CGRA）,we presented MOM（ multiobjective optimization mapping） algorithm to solve the multi-constraints hardware task partitioning-mapping problem. The cumulative probability weight function was constructed by the execution delay of computing nodes and the dependence between two nodes,etc. With the constraints of reconfigurable cell area and interconnection,the proposed algorithm could adjust dynamically the scheduling order of the ready nodes by thefunction values. When a rowof the RCA was mapped completely,MOM began on a newrow. When the RCA was filled,MOM switched to the next one. When a DFG（ data flowgraph） was mapped completely,the number of modules and etc were calculated automatically in MOM. Experiment results showthat the average execution total cycles of MOM decrease by 8. 4%（ RCA4 × 4） and 5. 3%（ RCA6 × 6） comparing with LBGM（ level based greedy mapping） algorithm. Comparing with SPKM（ split-push kernel mapping） algorithm,the average execution total cycles of MOM decrease by 20. 6%（ RCA4 × 4） and 21%（ RCA6 × 6）. Experimental evaluation confirms the efficiency of our approach.

作者陈乃金江建慧

机构地区安徽工程大学计算机与信息学院天津大学计算机科学与技术学院同济大学软件学院

出处《电子学报》 EI CAS CSCD 北大核心 2015年第11期2151-2160,共10页 Acta Electronica Sinica

基金国家863高技术研究发展计划(No.2009AA011705,No.2013AA013204) 国家自然科学基金重点项目(No.61432017) 安徽省自然科学基金(No.1408085MF124) 芜湖市科技计划自然科学基金(No.芜科计字[2012]94号) 安徽工程大学国家自然科学预研基金安徽省高校省级自然科学基金重点项目(No.Kj2015A003)

关键词可重构单元阵列时域映射累加概率权值异步计算时延资源约束 reconfigurable cell array temporal mapping accumulation probability weight asynchronous computation delay resource constraint

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1Cardoso J M P,Diniz C D,Weinhardt M.Compiling for reconfigurable computing:a survey[J]. ACM Computing Surveys,2010,42(4):1301-1365.
2Yoon J W,Lee J,Park S,et al. Architecture customization of on-chip reconfigurable accelerators[J]. ACM Transactions on Design Automation of Electronic Systems,2013,18(4):52:1-52:22.
3Zhao X,Erdogan A T,Arslan T.High-efficiency customized coarse-grained dynamically reconfigurable architecture for JPEG2000[J]. IEEE Transactions on Very Large Scale Integration Systems,2013,21(12):2343-2348.
4Kim Y,Lee J,Shrivastava A,et al.High throughput data mapping for coarse-grained reconfigurable architectures[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2011,30(11):1599-1609.
5杨子煜,严明,王大伟,李思昆.面向CGRA循环流水映射的数据并行优化[J].计算机学报,2013,36(6):1280-1289. 被引量：5
6Han K,Lee G,Choi K.Software-level approaches for tolerating transient faults in a coarse-grained reconfigurable architecture[J]. IEEE Transactions on Dependable and Secure Computing,2014,11(4):392-398.
7Yoon J W,Shrivastava A,Park S,et al.A graph drawing based spatial mapping algorithm for coarse-grained reconfigurable architectures[J]. IEEE Transactions on Very Large Scale Integration Systems,2009,17(11):1565-1578.
8Ferreira R S,Cardoso J M P,Damiany A,et al.Fast placement and routing by extending coarse-grained reconfigurable arrays with Omega Networks[J]. Journal of Systems Architecture,2011,57(8):761-777.
9Lee G,Choi K,Dutt N D.Mapping multi-domain applications onto coarse-grained reconfigurable architectures[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2011,30(5):637-650.
10Ansaloni G,Tanimura K,Pozzi L,et al.Integrated kernel partitioning and scheduling for coarse-grained reconfigurable arrays[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2012,31(12):1803-1816.

二级参考文献48

1潘雪增,孙康,陆魁军,王继民,平玲娣.动态可重构系统任务时域划分算法[J].浙江大学学报（工学版）,2007,41(11):1839-1844. 被引量：7
2周博,邱卫东,谌勇辉,彭澄廉.基于簇的层次敏感的可重构系统任务划分算法[J].计算机辅助设计与图形学学报,2006,18(5):667-673. 被引量：12
3Estrin G, Bussel B, Turn R et al. Parallel processing in a re- structurable computer system [ J]. IEEE Transactions on Elec- Ironic Computers, 1963,12(6) : 747 - 755.
4Campi F,Toma M,Lodi A,et al.A VLIW processor with re- configurable instruction set for embedded applications [ J ]. IEEE Journal of Solid-State Circuits, 2003, 38 ( 11 ) : 1876 - 1886.
5Fatahalian K, Houston M . GPUs: A closer look [ J]. ACM Queue,2008,6(2) : 18 - 28.
6Joao M.P. Cardoso, Pedro C. Diniz, Markus Weinha_rdt. Com- piling for reconfigurable computing: A survey [ J]. ACM Com- puting Surveys, 2010.42(4) : 1301 - 1365.
7Karthikeya M, Puma G and Bhatia D. Temporal partitioning and scheduling data flow graphs for reconfigurable computers [J]. IEEE Transactions on Computers, 1999, 48( 6): 579 - 590.
8Jo~o M P Cardoso,Neto H. An enhanced static-list scheduling algorithm for temporal partitioning onto RPUs [ C ]. In: Pro- eeedings of 1999 IFIP International Conference on Very Large Scale Integration, Lisbon, IEEE CS Press, December 1999. 485 - 496.
9Mahmoud M, Masato M.A combined approach to high-level synthesis for dynamically reconfigurable systems [ J ]. IEEE Transactions on Computers,2004,53( 12):1508- 1522.
10Joao M P Cardoso. On combining temporal partitioning and sharing of functional units in compilation for reconfigurable architectures [ J]. IEEE Transactions on Computers, 2003.52 (10) : 1362 - 1375.

共引文献28

1陈乃金,江建慧.考虑通信成本和硬件碎片利用的簇划分算法[J].计算机辅助设计与图形学学报,2015,27(4):754-763. 被引量：1
2陈乃金,江建慧.融合面积估算和多目标优化的硬件任务划分算法[J].通信学报,2013,34(2):40-55. 被引量：3
3胡国,赵小冬,李明娟.可重构芯片体系结构及其发展趋势[J].航空计算技术,2014,44(4):116-120. 被引量：1
4陈锐,杨海钢,王飞,贾瑞,王新刚.基于自路由互连网络的粗粒度可重构阵列结构[J].电子与信息学报,2014,36(9):2251-2257. 被引量：5
5陈锐,杨海钢,王飞,贾瑞,喻伟.基于粗粒度可重构阵列结构的多标准离散余弦变换设计[J].电子与信息学报,2015,37(1):206-213. 被引量：3
6陈乃金,冯志勇,江建慧.用于二维RCA跨层数据传输的旁节点无冗余添加算法[J].通信学报,2015,36(4):35-51. 被引量：4
7郭振华,吴艳霞,张国印,戴葵.面向ASCRA的循环流水启动间距自动分析及优化[J].计算机学报,2015,38(10):1946-1958.
8朱雨雯,张红旗,包义保,杜学绘.反馈移位寄存器在通用可重构处理器上的配置生成与优化设计[J].计算机应用研究,2016,33(6):1811-1813.
9陈乃金,江建慧.多叉树数据流图粗粒度可重构单元阵列映射算法[J].计算机辅助设计与图形学学报,2016,28(7):1180-1187. 被引量：4
10何国强,李丽,李世平.面向雷达信号处理应用的可重构处理器设计[J].现代雷达,2016,38(8):46-50. 被引量：4

同被引文献26

1窦勇,邬贵明,徐进辉,周兴铭.支持循环自动流水线的粗粒度可重构阵列体系结构[J].中国科学（E辑）,2008,38(4):579-591. 被引量：11
2陈乃金.基于深度优先贪婪搜索的可重构硬件任务划分算法[J].计算机应用,2012,32(1):158-162. 被引量：3
3陈乃金,江建慧,陈昕,周洲,徐莹.一种考虑执行延迟最小化和资源约束的改进层划分算法[J].电子学报,2012,40(5):1055-1066. 被引量：7
4魏少军,刘雷波,尹首一.可重构计算处理器技术[J].中国科学：信息科学,2012,42(12):1559-1576. 被引量：22
5仲亚,叶瑶瑶.基于新型压缩器的乘法器设计[J].微电子学与计算机,2019,36(3):28-31. 被引量：7
6李列文,桂卫华,阳春华,胡小龙.面向FPGA的低功耗多路选择器设计方法[J].中南大学学报（自然科学版）,2014,45(5):1496-1502. 被引量：3
7陈乃金,冯志勇,江建慧.用于二维RCA跨层数据传输的旁节点无冗余添加算法[J].通信学报,2015,36(4):35-51. 被引量：4
8陈乃金,江建慧.多叉树数据流图粗粒度可重构单元阵列映射算法[J].计算机辅助设计与图形学学报,2016,28(7):1180-1187. 被引量：4
9陈乃金,冯志勇,江建慧,何瑞祥,王真.行并行可重构单元阵列流水映射性能评估[J].同济大学学报（自然科学版）,2017,45(8):1218-1226. 被引量：3
10冯广博,何安平,吴尽昭,冯志华.基于异步NoC机制的Booth乘法器设计[J].内蒙古大学学报（自然科学版）,2017,48(6):703-710. 被引量：1

引证文献4

1陈乃金,冯志勇,江建慧,何瑞祥,王真.行并行可重构单元阵列流水映射性能评估[J].同济大学学报（自然科学版）,2017,45(8):1218-1226. 被引量：3
2方冉,沈丽娜.一种网格型异构可重构计算系统设计与验证[J].安徽师范大学学报（自然科学版）,2018,41(6):552-556.
3林谊东,陈乃金.二维网格型粗粒度可重构系统乘法器和全加器设计与验证[J].绵阳师范学院学报,2020,39(2):86-92. 被引量：1
4姚英,田心宇,韩晓聪.一种新型高速低功耗可重构流水线乘法器设计[J].电子设计工程,2022,30(1):131-134. 被引量：1

二级引证文献5

1林谊东,陈乃金.二维网格型粗粒度可重构系统乘法器和全加器设计与验证[J].绵阳师范学院学报,2020,39(2):86-92. 被引量：1
2余景.支持嵌入式Web服务器的多层级力觉交互仿真[J].计算机仿真,2021,38(7):256-260. 被引量：1
3姚英,田心宇,韩晓聪.一种新型高速低功耗可重构流水线乘法器设计[J].电子设计工程,2022,30(1):131-134. 被引量：1
4何瑞祥,王树跃,宋孟洁,施海林,武国威,陆林.高可靠变电站二次系统间隔成图技术研究[J].农村电气化,2023(6):32-36.
5苏成,夏宏.一种高效能可重构1024位大数乘法器的设计[J].电子技术应用,2024,50(3):31-35.

1陈乃金,江建慧.多叉树数据流图粗粒度可重构单元阵列映射算法[J].计算机辅助设计与图形学学报,2016,28(7):1180-1187. 被引量：4
2陈乃金,冯志勇,江建慧.用于二维RCA跨层数据传输的旁节点无冗余添加算法[J].通信学报,2015,36(4):35-51. 被引量：4
3陈乃金.二维RCA空域映射Petri网时间性能分析[J].计算机工程与应用,2014,50(23):41-46.
4罗莉,何鸿君,胡守仁.一种通用的神经网络映射调度遗传算法[J].计算机研究与发展,1997,34(11):872-876.
5周红.Word97使用技巧数例[J].计算机时代,2001(1):26-27.
6王超.我的表格更能装[J].电脑迷,2007,0(15):75-75.
7hup.让你的Opera能够自动换行[J].电脑界（应用文萃）,2000(12):98-99.
8Word表格文字自动适应单元格[J].电脑高手,2005(10):87-87.
9电脑迷典藏技巧集办公篇[J].电脑迷,2007,0(22):106-111.
10苏长明,黄荣兵,陶醉.基于J2ME的字符串自动换行算法在手机游戏开发中的实现[J].成都大学学报（自然科学版）,2010,29(4):329-330.

电子学报

2015年第11期

浏览历史

内容加载中请稍等...

一种粗粒度可重构体系结构多目标优化映射算法被引量：4

参考文献16

二级参考文献48

共引文献28

同被引文献26

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种粗粒度可重构体系结构多目标优化映射算法 被引量：4

参考文献16

二级参考文献48

共引文献28

同被引文献26

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种粗粒度可重构体系结构多目标优化映射算法被引量：4