不跨层行操作并行RCA互连时延性能评估被引量：1

Interconnect Delay Performance Evaluation for Non-Crossing Level and Row Operands Parallel RCA

下载PDF

导出

摘要针对三类行并行重构单元阵列互连时延性能评估问题,提出了一种通过节点映射和运行机制来评测互连时延的方法,基于前驱回溯不加旁节点不跨层时域映射算法,对点到点、路由传输、行列总线等互连RCA进行了时延分析和计算.实验结果表明,与路由传输和行列总线互连相比,点到点互连在最大不跨层互连、不跨层累加互连、考虑互连执行总时延等方面均是最小的,从而表明了点到点重构单元阵列的互连时延优于路由器传输和行列总线互连. In order to assess three types of row parallel reconfigurable cell array(RCA)interconnect delay performance,this paper presented a method for evaluating interconnect delay by means of node mapping and operation running mechanism.Based on preorder traversing backtracking no adding-bypass-node(PTBNA)non-crossing level temporal mapping algorithm,this paper analyzed and computed RCA interconnect delay of point to point(PP),router transmission(RT),and row column bus(RCB).Compared with RT and RCB,PP can get the least in maximum noncrossing level interconnect delay,non-crossing level accumulation interconnect delay and considering interconn ectexecution total delay.Thus PP-RCA interconnect delay is better than that of RT and RCB.

作者陈乃金冯志勇 Chen Naijin;Feng Zhiyong(School of Computer Science and Technology,Tianjin University,Tianjin 300072,China;College of Computer and Information Science,Anhui Polytechnic University,Wuhu 241000,China)

机构地区天津大学计算机科学与技术学院安徽工程大学计算机与信息学院

出处《天津大学学报（自然科学与工程技术版）》 EI CSCD 北大核心 2017年第4期429-436,共8页 Journal of Tianjin University：Science and Technology

基金国家高技术研究发展计划(863计划)资助项目(2013AA013204) 安徽省自然科学基金资助项目(1408085MF124) 安徽省高校自然科学研究基金重点资助项目(KJ2015A003) 安徽省高校优秀中青年骨干人才国内外访学研修重点项目(gxfx ZD2016102) 安徽工程大学国家自然科学预研基金资助项目~~

关键词互连模式粗粒度可重构体系结构点到点互连路由传输互连行列总线互连 interconnect mode coarse grained reconfigurable architecture point to point interconnect router transmission interconnect row column bus interconnect

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1王大伟,窦勇,李思昆.核心循环到粗粒度可重构体系结构的流水化映射[J].计算机学报,2009,32(6):1089-1099. 被引量：10
2陈乃金,冯志勇,江建慧.用于二维RCA跨层数据传输的旁节点无冗余添加算法[J].通信学报,2015,36(4):35-51. 被引量：4
3窦勇,邬贵明,徐进辉,周兴铭.支持循环自动流水线的粗粒度可重构阵列体系结构[J].中国科学（E辑）,2008,38(4):579-591. 被引量：11
4魏少军,刘雷波,尹首一.可重构计算处理器技术[J].中国科学：信息科学,2012,42(12):1559-1576. 被引量：22

二级参考文献51

1Cardoso J M P. Dynamic loop pipelining in data-driven architectures. In: Bagherzadeh N, Valero M, Ramirez A,eds. Proc 2nd Int Conf Comput Front. New York: ACM Press, 2005. 106-115.
2Baumgarte V, Ehlers G, May F, et al. PACT XPP-A self-reconfigurable data processing architecture. J Super- comput, 2003, 26(2): 167--184.
3Mei B, Vernalde S, Verkest D, et al. Exploiting loop-level parallelism on coarse-grained reconfigurable architectures using modulo scheduling. In: When N, Verkest Di, eds. Proc Conf Des, Aurora Test Eur. New York: IEEE Press, 2003. 10296--10301.
4Barat F, Jayapala M, Beeck P O. Software pipelining for coarse-grained reconfigurable instruction set processors. In: Proc IEEE Int Conf VLSI Des. New York: IEEE Press, 2002. 338--344.
5Hauser J R, Wawrzynek J. Garp: A MIPS processor with a reconfigurable coprocessor. In: Proc IEEE Int Syrup Field-Programmable Custom Computing Machines. New York: IEEE Press, 1997.16--21.
6Rau B R. Iterative modulo scheduling: An algorithm for software pipelining loops. In: Proc ACM 27th Int Symp Microarchitecture. New York: IEEE Press, 1994. 63--74.
7Lee M H, Singh H, Lu G, et al. Design and implementation of the MorphoSys reconfigurable computing processor. J VLSI Signal Processing-Systems for Signal, Image and Video Technology, 2000, 24:147--164.
8Dennis J B, Gao G R. An efficient pipelined dataflow processor architecture. In: Proc ACM Int Conf on Supercomputing, New York: IEEE Press, 1988. 363--373.
9Arvind, Nikhil R S. Executing a program on the MIT tagged-token dataflow architecture. IEEE Trans Comput, 1990, 39(3): 300--318.
10Iannucci R A. Toward a dataflow/von Neumann hybrid architecture. In: Siegel H, ed. Proc Int Symp Computer Architecture. New York: IEEE Press, 1988. 131--140.

共引文献33

1王大伟,窦勇,李思昆.核心循环到粗粒度可重构体系结构的流水化映射[J].计算机学报,2009,32(6):1089-1099. 被引量：10
2吴巨红,刘万全,鲍庆龙,陈曾平.多功能复杂信号侦察可配置计算模型[J].国防科技大学学报,2010,32(6):8-14.
3宋奂寰,王树宗,邵利兵.基于可重构计算技术的ASIP设计与实现[J].舰船科学技术,2012,34(5):78-82. 被引量：1
4杨子煜,李思昆,赵鹏.虚拟环境下可重构流媒体处理的应用分析方法[J].系统仿真学报,2012,24(9):1790-1794. 被引量：1
5杨子煜,赵鹏,王大伟,李思昆.关键循环到粗粒度可重构体系结构的存储感知映射[J].国防科技大学学报,2012,34(6):46-53. 被引量：1
6陈乃金,江建慧.融合面积估算和多目标优化的硬件任务划分算法[J].通信学报,2013,34(2):40-55. 被引量：3
7杨子煜,严明,王大伟,李思昆.面向CGRA循环流水映射的数据并行优化[J].计算机学报,2013,36(6):1280-1289. 被引量：5
8王海峰,陈庆奎.静态程序切片的GPU通用计算功耗预测模型[J].软件学报,2013,24(8):1746-1760. 被引量：6
9胡国,赵小冬,李明娟.可重构芯片体系结构及其发展趋势[J].航空计算技术,2014,44(4):116-120. 被引量：1
10陈锐,杨海钢,王飞,贾瑞,王新刚.基于自路由互连网络的粗粒度可重构阵列结构[J].电子与信息学报,2014,36(9):2251-2257. 被引量：5

同被引文献5

1窦勇,邬贵明,徐进辉,周兴铭.支持循环自动流水线的粗粒度可重构阵列体系结构[J].中国科学（E辑）,2008,38(4):579-591. 被引量：11
2陈乃金,江建慧,陈昕,周洲,徐莹.一种考虑执行延迟最小化和资源约束的改进层划分算法[J].电子学报,2012,40(5):1055-1066. 被引量：7
3魏少军,刘雷波,尹首一.可重构计算处理器技术[J].中国科学：信息科学,2012,42(12):1559-1576. 被引量：22
4陈乃金,冯志勇,江建慧.用于二维RCA跨层数据传输的旁节点无冗余添加算法[J].通信学报,2015,36(4):35-51. 被引量：4
5陈乃金,江建慧.一种粗粒度可重构体系结构多目标优化映射算法[J].电子学报,2015,43(11):2151-2160. 被引量：4

引证文献1

1陈乃金,冯志勇,江建慧,何瑞祥,王真.行并行可重构单元阵列流水映射性能评估[J].同济大学学报（自然科学版）,2017,45(8):1218-1226. 被引量：3

二级引证文献3

1林谊东,陈乃金.二维网格型粗粒度可重构系统乘法器和全加器设计与验证[J].绵阳师范学院学报,2020,39(2):86-92. 被引量：1
2余景.支持嵌入式Web服务器的多层级力觉交互仿真[J].计算机仿真,2021,38(7):256-260. 被引量：1
3何瑞祥,王树跃,宋孟洁,施海林,武国威,陆林.高可靠变电站二次系统间隔成图技术研究[J].农村电气化,2023(6):32-36.

1姚玉钦.一种基于FPGA的ARM与PCI接口设计方案[J].信阳师范学院学报（自然科学版）,2009,22(2):304-306.
2邓盈.神经网络及应用研究[J].机械工程与自动化,2010(6):209-210. 被引量：1
3梁君,熊华钢.1553B与CAN总线的互连[J].遥测遥控,2003,24(5):30-34. 被引量：4
4李瑞芳,谭永东,沈宏涛,姚兰.无线传感器网络分层设计问题探讨[J].自动化博览,2004,21(5):84-86.
5邓欣伟,徐皓.企业集散控制系统总线型控制器的设计[J].微计算机信息,2008,24(29):48-49.
6李杨,乔毅,吴化柱.TMS320f2812芯片中的CAN口C语言通信编程[J].控制工程,2004,11(2):168-170. 被引量：5
7李新,孙丹丹,丁炜.Ad hoc网络中一种新的路由选择算法[J].计算机应用研究,2007,24(2):316-317.
8刘干,刘代,蒋燕.关于最小时延问题的讨论[J].当代继续教育,2000,30(1):62-63.
9王义,何立仁.CAN总线时延网络控制系统稳定性研究[J].中北大学学报（自然科学版）,2014,35(2):132-135. 被引量：4
10孙秀娟.基于HPI互连的紧耦合双CPU弹上信息处理系统[J].系统工程与电子技术,2004,26(11):1616-1619. 被引量：1

天津大学学报（自然科学与工程技术版）

2017年第4期

浏览历史

内容加载中请稍等...

不跨层行操作并行RCA互连时延性能评估被引量：1

参考文献4

二级参考文献51

共引文献33

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

不跨层行操作并行RCA互连时延性能评估 被引量：1

参考文献4

二级参考文献51

共引文献33

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

不跨层行操作并行RCA互连时延性能评估被引量：1