期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
99
篇文章
<
1
2
…
5
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种运行时消除指针别名歧义的新方法
被引量:
2
1
作者
汤志忠
乔林
+1 位作者
张赤红
苏伯珙
《软件学报》
EI
CSCD
北大核心
1999年第7期685-689,共5页
提出一种采用软硬件结合的运行时消除指针别名歧义的新方法SHRTD(softw are/hardw arerun-tim e disam biguation).为延迟运行时不正确的内存访问及其后继操作,SHRTD的功能单元...
提出一种采用软硬件结合的运行时消除指针别名歧义的新方法SHRTD(softw are/hardw arerun-tim e disam biguation).为延迟运行时不正确的内存访问及其后继操作,SHRTD的功能单元执行NOP操作.为保证所有延迟操作执行顺序的一致性,编译时就确定执行NOP操作的所有功能单元的顺序和NOP操作的数目.SHRTD方法适用于不可逆代码,同时它的代码空间受限,也不存在严重的代码可重入性问题.新方法有效地解决了指针别名问题。
展开更多
关键词
指令级并行性
指针别名
运行时补偿
并行计算机
下载PDF
职称材料
一个新的多分支全局软件流水方法
被引量:
1
2
作者
汤志忠
张赤红
陈刚
《软件学报》
EI
CSCD
北大核心
1996年第1期16-24,共9页
在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销...
在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销和空间开销把我们的方法与其它几种全局软件流水方法进行了比较.模拟实验结果表明:GPMB方法的时间开销和空间开销都比较小,所需要的硬件支持也比较少.
展开更多
关键词
多分支循环
软件流水
指令级
程序
并行性
下载PDF
职称材料
流水安全法─—一个面向软件流水技术的新的数据相关性分析方法
被引量:
2
3
作者
汤志忠
张赤红
乔林
《计算机学报》
EI
CSCD
北大核心
1998年第S1期201-206,共6页
软件流水是一种很有效的指令级并行优化技术,而能否进行尽可能精确的数据相关性分析是决定软件流水优化效果的一个非常重要的因素.本文通过分析软件流水技术本身的特点,从保障软件流水安全为出发点,导出了一组更严洛有效的相关方程...
软件流水是一种很有效的指令级并行优化技术,而能否进行尽可能精确的数据相关性分析是决定软件流水优化效果的一个非常重要的因素.本文通过分析软件流水技术本身的特点,从保障软件流水安全为出发点,导出了一组更严洛有效的相关方程和限制不等式,大大提高了相关性判别的能力,最后与现有工作进行了比较,并用一个例子加以验证.
展开更多
关键词
数据相关性分析
指令级并行
软件流水
并行优化编译
下载PDF
职称材料
清华“计算机专业实践”课程的创新与实践
被引量:
13
4
作者
汤志忠
《计算机教育》
2006年第7期7-9,共3页
清华大学计算机系于2001年决定开设“计算机专业实践”课程,作为全系本科生的必修课。经过两年的准备,于2003年夏季学期在30多名本科生中进行了试点,2004年在全系185名本科生中授课,2005年在全系195名本科生中正式开课,效果很好。...
清华大学计算机系于2001年决定开设“计算机专业实践”课程,作为全系本科生的必修课。经过两年的准备,于2003年夏季学期在30多名本科生中进行了试点,2004年在全系185名本科生中授课,2005年在全系195名本科生中正式开课,效果很好。该课程经过4年多的建设,取得了如下主要成果。
展开更多
关键词
计算机系
专业实践
清华大学
课程
2003年夏季
创新
本科生
必修课
下载PDF
职称材料
多重循环的软件流水技术
被引量:
1
5
作者
汤志忠
王雷
钱江
《软件学报》
EI
CSCD
北大核心
1996年第7期422-427,共6页
为了解决多重循环的指令级并行编译问题,本文提出了反刍方法,以一种新的思维方式处理多重循环,将其视为一个程序流整体,有效地开发了多重循环的并行度.另外,本文还给出了实现反刍方法的基本步骤以及相应的硬件支持.最后,通过一...
为了解决多重循环的指令级并行编译问题,本文提出了反刍方法,以一种新的思维方式处理多重循环,将其视为一个程序流整体,有效地开发了多重循环的并行度.另外,本文还给出了实现反刍方法的基本步骤以及相应的硬件支持.最后,通过一些初步实验的结果验证了本算法的有效性,并讨论了其时间和空间效益。
展开更多
关键词
软件流水
多重循环
并行性
并行编译
下载PDF
职称材料
一种软件流水的反流水算法
被引量:
1
6
作者
汤志忠
李文龙
苏伯珙
《软件学报》
EI
CSCD
北大核心
2004年第7期987-993,共7页
软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIWDSP处理机的指令级并行性,必须使用软件流水技术对DSP程序进行优化.然而,在串行源代码不存在的情况下,对软件流水后的原始代码进行变换、理解、测试...
软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIWDSP处理机的指令级并行性,必须使用软件流水技术对DSP程序进行优化.然而,在串行源代码不存在的情况下,对软件流水后的原始代码进行变换、理解、测试和调试,并转换成其他处理机的代码是非常困难的.提出了一种反流水技术,它能够将软件流水后的优化汇编代码反向转换成语义等价的相应代码.通过20个程序的初步实验,验证了所提出的反流水算法的正确性.
展开更多
关键词
软件流水
反流水
指令级并行
下载PDF
职称材料
一个支持多分支循环最优执行的VLIW体系结构
7
作者
汤志忠
张赤红
+1 位作者
苏伯珙
赵巍
《计算机研究与发展》
EI
CSCD
北大核心
1995年第8期1-9,共9页
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环...
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环体的多个分支操作可以在一个节拍内同时被执行,因此可以在更大范围内开发指令级并行性。同时还提出了一种叫作流水控制黑板的机制来支持条件分支操作。URPR-2不仅能够以很高的速度执行只含有基本块的循环程序,而且还能够以较低的时间及空间开销来运行含有多个分支的循环程序。
展开更多
关键词
VLIW
体系结构
多分支循环
流水控制黑板
下载PDF
职称材料
支持多重循环软件流水的循环控制机制
8
作者
汤志忠
于涛
+1 位作者
张赤红
罗军
《计算机研究与发展》
EI
CSCD
北大核心
1998年第6期511-515,共5页
ILSP(interlacedinnerandouterloopsoftwarepipelining)——内外层交替执行的多重循环的软件流水算法是对多重循环进行优化的有效方法.为了保证ILSP算法具有良好的时间效益和...
ILSP(interlacedinnerandouterloopsoftwarepipelining)——内外层交替执行的多重循环的软件流水算法是对多重循环进行优化的有效方法.为了保证ILSP算法具有良好的时间效益和空间效益,就必须有一套支持这个算法的行之有效的多重循环软件流水控制机制.文中将比较详细地介绍一套控制机制.它与多重循环优化编译器相配合,可以有效地支持多重循环的软件流水。
展开更多
关键词
VLIW
软件流水
多重循环
数据流
ILSP
下载PDF
职称材料
URPR-1多处理机设计
9
作者
汤志忠
郑海清
《计算机工程与应用》
CSCD
北大核心
1990年第10期212-217,共6页
URPR-1机器是一个采用VLIW体系结构的数字信号单片多处理机,具有极高的运算速度和良好的性能价格比。本文描述了URPR-1机器的硬件组成,体系结构设计上的考虑和URPR-1机器的逻辑设计特点。
关键词
多处理机
URPR-1
设计
计算机
下载PDF
职称材料
一个VLIW体系结构的单片多处理机
10
作者
汤志忠
张赤红
《计算机研究与发展》
EI
CSCD
北大核心
1993年第10期1-8,共8页
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很...
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。
展开更多
关键词
VLIW
体系结构
单片多处理机
下载PDF
职称材料
VLIW多处理机接口部件的设计
11
作者
汤志忠
朱莉
《计算机工程与应用》
CSCD
北大核心
1992年第8期45-49,共5页
URPR-1机器是一台采用多处理单元的VLIW体系结构单片机。它面向数字信号处理和图象处理,具有极高的运算速度和良好的性能价格比,接口部件位于主机和URPR-1机器之间。负责主机与URPR-1之间的通信,本文描述了接口部件的硬件组成,体系结构...
URPR-1机器是一台采用多处理单元的VLIW体系结构单片机。它面向数字信号处理和图象处理,具有极高的运算速度和良好的性能价格比,接口部件位于主机和URPR-1机器之间。负责主机与URPR-1之间的通信,本文描述了接口部件的硬件组成,体系结构设计上的考虑和接口部件上软件的设计思想。
展开更多
关键词
多处理机
接口装置
WLIW
下载PDF
职称材料
基于乐观性策略的分支消去法
12
作者
汤志忠
张赤红
《计算机工程与应用》
CSCD
北大核心
1992年第8期38-40,共3页
在细粒度并行优化领域,带分支的程序较难取得好的优化结果,主要问题是空间开销在理论上是指数级上升的。本文在分析了程序的执行机制与条件分支的关系后。改进了Allen提出的分支消去法,使之无须特殊硬件的支持,使分支消去法更易于实用化。
关键词
分支消去法
程序设计
下载PDF
职称材料
计算机串行接口网的研究与实践
13
作者
汤志忠
《计算机应用》
CSCD
1990年第1期1-6,共6页
用串行接口连网由于不需要配置专门硬件,成本极低。对网上的结点不限机种,对通讯线路要求也不高,因此有极其广泛的应用前景。本文以已经实现的一个串行接口网为背景,介绍了串行接口网的机间连接方式,虚拟终端功能,文件传送功能及远程系...
用串行接口连网由于不需要配置专门硬件,成本极低。对网上的结点不限机种,对通讯线路要求也不高,因此有极其广泛的应用前景。本文以已经实现的一个串行接口网为背景,介绍了串行接口网的机间连接方式,虚拟终端功能,文件传送功能及远程系统调用等关键技术。
展开更多
关键词
计算机
串行接口网
计算机网络
下载PDF
职称材料
计算机串行接口网
14
作者
汤志忠
《实验技术与管理》
CAS
1991年第5期39-41,43,共4页
把多台同种或不同种的计算机连网,通常需要一套硬件和软件。例如,使用很广泛的以太网,在每台计算机上都要配置网络控制器、缓冲存贮器和网络收发器等硬件及一套网络软件。其主要优点是速度快,然而成本很高。一个四台计算机的网络,其网...
把多台同种或不同种的计算机连网,通常需要一套硬件和软件。例如,使用很广泛的以太网,在每台计算机上都要配置网络控制器、缓冲存贮器和网络收发器等硬件及一套网络软件。其主要优点是速度快,然而成本很高。一个四台计算机的网络,其网络硬件一般要花二万到三万美元。
展开更多
关键词
计算机
串行
接口
下载PDF
职称材料
双亲嵌段共聚物PSt-b-PAA在甲苯中的自聚集行为
被引量:
6
15
作者
汤誌忠
高保娇
何三雄
《高等学校化学学报》
SCIE
EI
CAS
CSCD
北大核心
2005年第12期2381-2385,共5页
以α-溴乙苯为引发剂, 溴化亚铜为催化剂, 2,2′-联吡啶为配体, 用原子转移自由基聚合(ATRP)法合成了结构一定的嵌段共聚物聚苯乙烯-b-聚丙烯酸丁酯(PSt-b-PBA). 经水解制备了双亲性嵌段共聚物聚苯乙烯-b-聚丙烯酸(PSt-b-PAA);采用单溶...
以α-溴乙苯为引发剂, 溴化亚铜为催化剂, 2,2′-联吡啶为配体, 用原子转移自由基聚合(ATRP)法合成了结构一定的嵌段共聚物聚苯乙烯-b-聚丙烯酸丁酯(PSt-b-PBA). 经水解制备了双亲性嵌段共聚物聚苯乙烯-b-聚丙烯酸(PSt-b-PAA);采用单溶剂溶解法配制了PSt-b-PAA在甲苯中的反胶束溶液;以极性荧光化合物N-1-萘乙二胺盐酸盐(NEAH)为极性微区探针, 用荧光光谱法并配合透射电镜观察探索了双亲嵌段共聚物PSt-b-PAA在甲苯溶液中的自聚集行为, 考察了双亲性嵌段共聚物浓度、链结构及温度等因素对反胶束化行为的影响规律. 结果表明, 亲水链PAA短而亲油链PSt长的双亲嵌段共聚物PSt-b-PAA, 用单溶剂溶解法可使其在甲苯中发生自聚集, 形成以亲水段为核, 疏水段为壳的星状反胶束结构;反胶束为10~20 nm的球形聚集态结构;PSt-b-PAA的自聚集行为及临界胶束浓度与分子链的微结构和温度等因素相关, 且随着共聚物浓度的增大, 小胶束会逐渐结合形成大的纺垂状聚集体.
展开更多
关键词
自聚集
反胶束
极性荧光探针
苯乙烯-丙烯酸双亲嵌段共聚物
下载PDF
职称材料
软件流水中的循环展开优化
被引量:
16
16
作者
李文龙
刘利
汤志忠
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2004年第11期1111-1115,共5页
在软件流水中应用循环展开可以实现分数值的启动间距 ,提高资源的利用率 ,同时基于展开的优化技术可以降低程序的资源需求和关键路径的长度 .提出了基于程序特性的展开因子算法UTBPC(UnrollingTimesBasedProgramCharacter istics) ,解...
在软件流水中应用循环展开可以实现分数值的启动间距 ,提高资源的利用率 ,同时基于展开的优化技术可以降低程序的资源需求和关键路径的长度 .提出了基于程序特性的展开因子算法UTBPC(UnrollingTimesBasedProgramCharacter istics) ,解决了循环展开的核心问题———展开因子的确定 ,同时提出了基于展开的软件数据预取优化技术 ,提高了软件数据预取的效率 .所有这些都在ORC(OpenRe searchCompiler)中实现 ,并对SPEC 2 0 0 0中的程序进行了测试 ,平均性能提高了 2 .6% .实验结果表明新提出的算法和基于展开的数据预取优化技术提高了编译器的整体性能 .
展开更多
关键词
计算机软件
软件流水
循环展开
展开因子
数据预取
下载PDF
职称材料
基于FPGA的开放式教学CPU的设计与测试系统
被引量:
14
17
作者
李山山
汤志忠
周继群
《计算机工程与应用》
CSCD
北大核心
2005年第14期98-100,198,共4页
设计并实现了一个CPU设计与测试实验装置,适合于计算机原理和系统结构课程的综合实验。该实验装置采用EDA工具在FPGA上实现了CPU设计,应用M CU和上位机软件对所设计的CPU进行了监控和调试,保证了CPU在实验系统上能够运行起来。
关键词
CPU设计与测试
FPGA
计算机原理
系统结构
单片机
下载PDF
职称材料
片上二维网络互连性能分析
被引量:
8
18
作者
王炜
乔林
+1 位作者
杨广文
汤志忠
《计算机研究与发展》
EI
CSCD
北大核心
2009年第10期1601-1611,共11页
片上互连网络已日益成为影响片上多处理器性能的重要因素之一.几乎所有的互连结构均是在二维网络的基础上演变发展而来的.首先分析了几种常见的内部结点度均为4的二维网络的静态特性,提出了一种新的二维片上网络互连路由结构和通信协议...
片上互连网络已日益成为影响片上多处理器性能的重要因素之一.几乎所有的互连结构均是在二维网络的基础上演变发展而来的.首先分析了几种常见的内部结点度均为4的二维网络的静态特性,提出了一种新的二维片上网络互连路由结构和通信协议,基于全局均匀随机通信模型,通过改变网络规模和变换通信强度,分析了不同结构网络的动态特性,然后用链接数表示通信成本,提出了一种新的网络互连综合性能评估指标网络单位成本延迟负载能力,最后对二维网络片上互连的综合性能进行了对比分析,指出了其各自适用的场合.
展开更多
关键词
片上多处理器
片上网络
拓扑
性能分析
单位成本延迟负载能力
下载PDF
职称材料
软件流水中隐藏存储延迟的方法
被引量:
6
19
作者
刘利
李文龙
+2 位作者
陈彧
李胜梅
汤志忠
《软件学报》
EI
CSCD
北大核心
2005年第10期1833-1841,共9页
软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环体的指令来加快循环的执行速度.随着处理机运行速度的逐渐提高,存储访问延迟成为性能提高的瓶颈.为了减轻存储系统影响,软件流水结合了一些存储优化技术,通过隐藏存储延迟...
软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环体的指令来加快循环的执行速度.随着处理机运行速度的逐渐提高,存储访问延迟成为性能提高的瓶颈.为了减轻存储系统影响,软件流水结合了一些存储优化技术,通过隐藏存储延迟来提高性能.提出了一种延迟可预测的模调度算法(foresightedlatencymoduloscheduling,简称FLMS),它根据循环的特点来确定load指令延迟.实验结果表明,FLMS算法减少了阻塞时间,提高了程序性能.
展开更多
关键词
软件流水
模调度涪储延迟
FLMS(foresighted
LATENCY
modulo
scheduling)
下载PDF
职称材料
主成分线性回归模型分析应用程序性能
被引量:
6
20
作者
李胜梅
程步奇
+2 位作者
高兴誉
乔林
汤志忠
《计算机研究与发展》
EI
CSCD
北大核心
2009年第11期1949-1955,共7页
应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主...
应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主成分分析法消除了性能事件之间的相关性.实验结果表明,模型的拟合优度在90%以上,对性能进行预测的平均相对误差为15%.模型从量化上分析了L1,L2高速缓存缺失作为影响性能的关键因素是怎样影响程序性能的.
展开更多
关键词
性能分析
cache缺失
主成分分析
线性回归
SPEC
CPU2006
下载PDF
职称材料
题名
一种运行时消除指针别名歧义的新方法
被引量:
2
1
作者
汤志忠
乔林
张赤红
苏伯珙
机构
清华大学计算机科学与技术系
WilliamPaterson大学计算机科学系
出处
《软件学报》
EI
CSCD
北大核心
1999年第7期685-689,共5页
基金
国家自然科学基金
文摘
提出一种采用软硬件结合的运行时消除指针别名歧义的新方法SHRTD(softw are/hardw arerun-tim e disam biguation).为延迟运行时不正确的内存访问及其后继操作,SHRTD的功能单元执行NOP操作.为保证所有延迟操作执行顺序的一致性,编译时就确定执行NOP操作的所有功能单元的顺序和NOP操作的数目.SHRTD方法适用于不可逆代码,同时它的代码空间受限,也不存在严重的代码可重入性问题.新方法有效地解决了指针别名问题。
关键词
指令级并行性
指针别名
运行时补偿
并行计算机
Keywords
Instruction level parallelism, very long instruction word, pointer aliasing, run time checking, run time compensation.
分类号
TP338.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一个新的多分支全局软件流水方法
被引量:
1
2
作者
汤志忠
张赤红
陈刚
机构
清华大学计算机系
出处
《软件学报》
EI
CSCD
北大核心
1996年第1期16-24,共9页
基金
国家863高技术发展计划
国家自然科学基金
文摘
在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销和空间开销把我们的方法与其它几种全局软件流水方法进行了比较.模拟实验结果表明:GPMB方法的时间开销和空间开销都比较小,所需要的硬件支持也比较少.
关键词
多分支循环
软件流水
指令级
程序
并行性
Keywords
Branch intensive loops, software pipelining, instruction level parallelism,multi branch switch, branch overlapping, processing element.
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
流水安全法─—一个面向软件流水技术的新的数据相关性分析方法
被引量:
2
3
作者
汤志忠
张赤红
乔林
机构
清华大学计算机科学与技术系
出处
《计算机学报》
EI
CSCD
北大核心
1998年第S1期201-206,共6页
基金
国家自然科学基金!69773028
文摘
软件流水是一种很有效的指令级并行优化技术,而能否进行尽可能精确的数据相关性分析是决定软件流水优化效果的一个非常重要的因素.本文通过分析软件流水技术本身的特点,从保障软件流水安全为出发点,导出了一组更严洛有效的相关方程和限制不等式,大大提高了相关性判别的能力,最后与现有工作进行了比较,并用一个例子加以验证.
关键词
数据相关性分析
指令级并行
软件流水
并行优化编译
Keywords
Data dependence analysis, instruction level parallelism, software pipelining, parallel optimizing compilation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
清华“计算机专业实践”课程的创新与实践
被引量:
13
4
作者
汤志忠
机构
清华大学计算机系
出处
《计算机教育》
2006年第7期7-9,共3页
文摘
清华大学计算机系于2001年决定开设“计算机专业实践”课程,作为全系本科生的必修课。经过两年的准备,于2003年夏季学期在30多名本科生中进行了试点,2004年在全系185名本科生中授课,2005年在全系195名本科生中正式开课,效果很好。该课程经过4年多的建设,取得了如下主要成果。
关键词
计算机系
专业实践
清华大学
课程
2003年夏季
创新
本科生
必修课
分类号
TP3-4 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
多重循环的软件流水技术
被引量:
1
5
作者
汤志忠
王雷
钱江
机构
清华大学计算机系
出处
《软件学报》
EI
CSCD
北大核心
1996年第7期422-427,共6页
文摘
为了解决多重循环的指令级并行编译问题,本文提出了反刍方法,以一种新的思维方式处理多重循环,将其视为一个程序流整体,有效地开发了多重循环的并行度.另外,本文还给出了实现反刍方法的基本步骤以及相应的硬件支持.最后,通过一些初步实验的结果验证了本算法的有效性,并讨论了其时间和空间效益。
关键词
软件流水
多重循环
并行性
并行编译
Keywords
Software pipelining, complicated loops, ruminate method, loop scheduling,instruction - level parallelism.
分类号
TP314 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种软件流水的反流水算法
被引量:
1
6
作者
汤志忠
李文龙
苏伯珙
机构
清华大学计算机科学与技术系
William Paterson大学计算机科学系
出处
《软件学报》
EI
CSCD
北大核心
2004年第7期987-993,共7页
基金
国家自然科学基金~~
文摘
软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIWDSP处理机的指令级并行性,必须使用软件流水技术对DSP程序进行优化.然而,在串行源代码不存在的情况下,对软件流水后的原始代码进行变换、理解、测试和调试,并转换成其他处理机的代码是非常困难的.提出了一种反流水技术,它能够将软件流水后的优化汇编代码反向转换成语义等价的相应代码.通过20个程序的初步实验,验证了所提出的反流水算法的正确性.
关键词
软件流水
反流水
指令级并行
Keywords
software pipelining
de-pipelining
instruction level parallelism
分类号
TP338 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一个支持多分支循环最优执行的VLIW体系结构
7
作者
汤志忠
张赤红
苏伯珙
赵巍
机构
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
1995年第8期1-9,共9页
基金
国家自然科学基金
国家863高技术发展计划的资助
文摘
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环体的多个分支操作可以在一个节拍内同时被执行,因此可以在更大范围内开发指令级并行性。同时还提出了一种叫作流水控制黑板的机制来支持条件分支操作。URPR-2不仅能够以很高的速度执行只含有基本块的循环程序,而且还能够以较低的时间及空间开销来运行含有多个分支的循环程序。
关键词
VLIW
体系结构
多分支循环
流水控制黑板
Keywords
Instruction level parallelism, VLIW architecture, branch-intensive loops, pipeline control blackboard.
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
支持多重循环软件流水的循环控制机制
8
作者
汤志忠
于涛
张赤红
罗军
机构
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
1998年第6期511-515,共5页
基金
国家自然科学基金
文摘
ILSP(interlacedinnerandouterloopsoftwarepipelining)——内外层交替执行的多重循环的软件流水算法是对多重循环进行优化的有效方法.为了保证ILSP算法具有良好的时间效益和空间效益,就必须有一套支持这个算法的行之有效的多重循环软件流水控制机制.文中将比较详细地介绍一套控制机制.它与多重循环优化编译器相配合,可以有效地支持多重循环的软件流水。
关键词
VLIW
软件流水
多重循环
数据流
ILSP
Keywords
VLIW,software pipelining,nested loop,dataflow,ILSP
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
URPR-1多处理机设计
9
作者
汤志忠
郑海清
机构
清华大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
1990年第10期212-217,共6页
文摘
URPR-1机器是一个采用VLIW体系结构的数字信号单片多处理机,具有极高的运算速度和良好的性能价格比。本文描述了URPR-1机器的硬件组成,体系结构设计上的考虑和URPR-1机器的逻辑设计特点。
关键词
多处理机
URPR-1
设计
计算机
分类号
TP338.02 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一个VLIW体系结构的单片多处理机
10
作者
汤志忠
张赤红
机构
清华大学计算机系
出处
《计算机研究与发展》
EI
CSCD
北大核心
1993年第10期1-8,共8页
文摘
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。
关键词
VLIW
体系结构
单片多处理机
Keywords
VLIW architecture
pipelining register file
data dependencies
instruction level parallelism
optimizing compiler.
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
VLIW多处理机接口部件的设计
11
作者
汤志忠
朱莉
机构
清华大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
1992年第8期45-49,共5页
文摘
URPR-1机器是一台采用多处理单元的VLIW体系结构单片机。它面向数字信号处理和图象处理,具有极高的运算速度和良好的性能价格比,接口部件位于主机和URPR-1机器之间。负责主机与URPR-1之间的通信,本文描述了接口部件的硬件组成,体系结构设计上的考虑和接口部件上软件的设计思想。
关键词
多处理机
接口装置
WLIW
分类号
TP334.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于乐观性策略的分支消去法
12
作者
汤志忠
张赤红
机构
清华大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
1992年第8期38-40,共3页
文摘
在细粒度并行优化领域,带分支的程序较难取得好的优化结果,主要问题是空间开销在理论上是指数级上升的。本文在分析了程序的执行机制与条件分支的关系后。改进了Allen提出的分支消去法,使之无须特殊硬件的支持,使分支消去法更易于实用化。
关键词
分支消去法
程序设计
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
计算机串行接口网的研究与实践
13
作者
汤志忠
机构
清华大学计算极系
出处
《计算机应用》
CSCD
1990年第1期1-6,共6页
文摘
用串行接口连网由于不需要配置专门硬件,成本极低。对网上的结点不限机种,对通讯线路要求也不高,因此有极其广泛的应用前景。本文以已经实现的一个串行接口网为背景,介绍了串行接口网的机间连接方式,虚拟终端功能,文件传送功能及远程系统调用等关键技术。
关键词
计算机
串行接口网
计算机网络
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
计算机串行接口网
14
作者
汤志忠
机构
清华大学
出处
《实验技术与管理》
CAS
1991年第5期39-41,43,共4页
文摘
把多台同种或不同种的计算机连网,通常需要一套硬件和软件。例如,使用很广泛的以太网,在每台计算机上都要配置网络控制器、缓冲存贮器和网络收发器等硬件及一套网络软件。其主要优点是速度快,然而成本很高。一个四台计算机的网络,其网络硬件一般要花二万到三万美元。
关键词
计算机
串行
接口
分类号
TP334.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
双亲嵌段共聚物PSt-b-PAA在甲苯中的自聚集行为
被引量:
6
15
作者
汤誌忠
高保娇
何三雄
机构
中北大学化工系
出处
《高等学校化学学报》
SCIE
EI
CAS
CSCD
北大核心
2005年第12期2381-2385,共5页
基金
山西省自然基金项目(批准号:20040402)资助
文摘
以α-溴乙苯为引发剂, 溴化亚铜为催化剂, 2,2′-联吡啶为配体, 用原子转移自由基聚合(ATRP)法合成了结构一定的嵌段共聚物聚苯乙烯-b-聚丙烯酸丁酯(PSt-b-PBA). 经水解制备了双亲性嵌段共聚物聚苯乙烯-b-聚丙烯酸(PSt-b-PAA);采用单溶剂溶解法配制了PSt-b-PAA在甲苯中的反胶束溶液;以极性荧光化合物N-1-萘乙二胺盐酸盐(NEAH)为极性微区探针, 用荧光光谱法并配合透射电镜观察探索了双亲嵌段共聚物PSt-b-PAA在甲苯溶液中的自聚集行为, 考察了双亲性嵌段共聚物浓度、链结构及温度等因素对反胶束化行为的影响规律. 结果表明, 亲水链PAA短而亲油链PSt长的双亲嵌段共聚物PSt-b-PAA, 用单溶剂溶解法可使其在甲苯中发生自聚集, 形成以亲水段为核, 疏水段为壳的星状反胶束结构;反胶束为10~20 nm的球形聚集态结构;PSt-b-PAA的自聚集行为及临界胶束浓度与分子链的微结构和温度等因素相关, 且随着共聚物浓度的增大, 小胶束会逐渐结合形成大的纺垂状聚集体.
关键词
自聚集
反胶束
极性荧光探针
苯乙烯-丙烯酸双亲嵌段共聚物
Keywords
Self-aggregation
Reversed micelle
Polar fluorescence probe
Amphiphilic block copolymer ofstyrene-acrylic acid
分类号
O631.1 [理学—高分子化学]
下载PDF
职称材料
题名
软件流水中的循环展开优化
被引量:
16
16
作者
李文龙
刘利
汤志忠
机构
清华大学计算机科学与技术系
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2004年第11期1111-1115,共5页
基金
国家自然科学基金资助项目 (60 173 0 10 )
文摘
在软件流水中应用循环展开可以实现分数值的启动间距 ,提高资源的利用率 ,同时基于展开的优化技术可以降低程序的资源需求和关键路径的长度 .提出了基于程序特性的展开因子算法UTBPC(UnrollingTimesBasedProgramCharacter istics) ,解决了循环展开的核心问题———展开因子的确定 ,同时提出了基于展开的软件数据预取优化技术 ,提高了软件数据预取的效率 .所有这些都在ORC(OpenRe searchCompiler)中实现 ,并对SPEC 2 0 0 0中的程序进行了测试 ,平均性能提高了 2 .6% .实验结果表明新提出的算法和基于展开的数据预取优化技术提高了编译器的整体性能 .
关键词
计算机软件
软件流水
循环展开
展开因子
数据预取
Keywords
Algorithms
Computer programming
Critical path analysis
Data processing
Optimization
Requirements engineering
Software engineering
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于FPGA的开放式教学CPU的设计与测试系统
被引量:
14
17
作者
李山山
汤志忠
周继群
机构
清华大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
2005年第14期98-100,198,共4页
文摘
设计并实现了一个CPU设计与测试实验装置,适合于计算机原理和系统结构课程的综合实验。该实验装置采用EDA工具在FPGA上实现了CPU设计,应用M CU和上位机软件对所设计的CPU进行了监控和调试,保证了CPU在实验系统上能够运行起来。
关键词
CPU设计与测试
FPGA
计算机原理
系统结构
单片机
Keywords
CPU design and test,FPGA,computer principle,system architecture,MCU
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
片上二维网络互连性能分析
被引量:
8
18
作者
王炜
乔林
杨广文
汤志忠
机构
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第10期1601-1611,共11页
基金
国家自然科学基金项目(60573100
60573110
+4 种基金
60673152
60773149)
国家"八六三"高技术研究发展计划基金项目(2006AA01A101
2008AA01Z108)
国家"九七三"重点基础研究发展计划基金项目(2007CB310900)~~
文摘
片上互连网络已日益成为影响片上多处理器性能的重要因素之一.几乎所有的互连结构均是在二维网络的基础上演变发展而来的.首先分析了几种常见的内部结点度均为4的二维网络的静态特性,提出了一种新的二维片上网络互连路由结构和通信协议,基于全局均匀随机通信模型,通过改变网络规模和变换通信强度,分析了不同结构网络的动态特性,然后用链接数表示通信成本,提出了一种新的网络互连综合性能评估指标网络单位成本延迟负载能力,最后对二维网络片上互连的综合性能进行了对比分析,指出了其各自适用的场合.
关键词
片上多处理器
片上网络
拓扑
性能分析
单位成本延迟负载能力
Keywords
chip multiprocessor
networks-on-chip
topology
performance analysis
load capacity percost-delay product
分类号
TP393.03 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
软件流水中隐藏存储延迟的方法
被引量:
6
19
作者
刘利
李文龙
陈彧
李胜梅
汤志忠
机构
清华大学计算机科学与技术系
Intel中国研究中心编译组
出处
《软件学报》
EI
CSCD
北大核心
2005年第10期1833-1841,共9页
基金
国家自然科学基金~~
文摘
软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环体的指令来加快循环的执行速度.随着处理机运行速度的逐渐提高,存储访问延迟成为性能提高的瓶颈.为了减轻存储系统影响,软件流水结合了一些存储优化技术,通过隐藏存储延迟来提高性能.提出了一种延迟可预测的模调度算法(foresightedlatencymoduloscheduling,简称FLMS),它根据循环的特点来确定load指令延迟.实验结果表明,FLMS算法减少了阻塞时间,提高了程序性能.
关键词
软件流水
模调度涪储延迟
FLMS(foresighted
LATENCY
modulo
scheduling)
Keywords
software pipeline
modulo scheduling
memory access latency
FLMS (foresighted latency moduloscheduling)
分类号
TP338 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
主成分线性回归模型分析应用程序性能
被引量:
6
20
作者
李胜梅
程步奇
高兴誉
乔林
汤志忠
机构
清华大学计算机科学与技术系
英特尔中国研究中心编程系统实验室
中国科学院数学与系统科学研究院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第11期1949-1955,共7页
基金
国家自然科学基金项目(60773149
10425105)
+1 种基金
国家"八六三"高技术研究发展计划基金项目(2008AA01Z108)
国家"九七三"重点基础研究发展计划基金项目(2007CB310900)~~
文摘
应用程序的性能分析能够给体系架构设计者和性能优化者提供有效的参考和指导.采用主成分线性回归模型分析了SPEC CPU2006的整型程序性能.模型选取性能监测单元采样到的事件为自变量,每条指令的时钟周期数(CPI)作为因变量.模型中采用主成分分析法消除了性能事件之间的相关性.实验结果表明,模型的拟合优度在90%以上,对性能进行预测的平均相对误差为15%.模型从量化上分析了L1,L2高速缓存缺失作为影响性能的关键因素是怎样影响程序性能的.
关键词
性能分析
cache缺失
主成分分析
线性回归
SPEC
CPU2006
Keywords
performance analysis
cache miss
principal component analysis
linear regression analysis
SPEC CPU2006
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种运行时消除指针别名歧义的新方法
汤志忠
乔林
张赤红
苏伯珙
《软件学报》
EI
CSCD
北大核心
1999
2
下载PDF
职称材料
2
一个新的多分支全局软件流水方法
汤志忠
张赤红
陈刚
《软件学报》
EI
CSCD
北大核心
1996
1
下载PDF
职称材料
3
流水安全法─—一个面向软件流水技术的新的数据相关性分析方法
汤志忠
张赤红
乔林
《计算机学报》
EI
CSCD
北大核心
1998
2
下载PDF
职称材料
4
清华“计算机专业实践”课程的创新与实践
汤志忠
《计算机教育》
2006
13
下载PDF
职称材料
5
多重循环的软件流水技术
汤志忠
王雷
钱江
《软件学报》
EI
CSCD
北大核心
1996
1
下载PDF
职称材料
6
一种软件流水的反流水算法
汤志忠
李文龙
苏伯珙
《软件学报》
EI
CSCD
北大核心
2004
1
下载PDF
职称材料
7
一个支持多分支循环最优执行的VLIW体系结构
汤志忠
张赤红
苏伯珙
赵巍
《计算机研究与发展》
EI
CSCD
北大核心
1995
0
下载PDF
职称材料
8
支持多重循环软件流水的循环控制机制
汤志忠
于涛
张赤红
罗军
《计算机研究与发展》
EI
CSCD
北大核心
1998
0
下载PDF
职称材料
9
URPR-1多处理机设计
汤志忠
郑海清
《计算机工程与应用》
CSCD
北大核心
1990
0
下载PDF
职称材料
10
一个VLIW体系结构的单片多处理机
汤志忠
张赤红
《计算机研究与发展》
EI
CSCD
北大核心
1993
0
下载PDF
职称材料
11
VLIW多处理机接口部件的设计
汤志忠
朱莉
《计算机工程与应用》
CSCD
北大核心
1992
0
下载PDF
职称材料
12
基于乐观性策略的分支消去法
汤志忠
张赤红
《计算机工程与应用》
CSCD
北大核心
1992
0
下载PDF
职称材料
13
计算机串行接口网的研究与实践
汤志忠
《计算机应用》
CSCD
1990
0
下载PDF
职称材料
14
计算机串行接口网
汤志忠
《实验技术与管理》
CAS
1991
0
下载PDF
职称材料
15
双亲嵌段共聚物PSt-b-PAA在甲苯中的自聚集行为
汤誌忠
高保娇
何三雄
《高等学校化学学报》
SCIE
EI
CAS
CSCD
北大核心
2005
6
下载PDF
职称材料
16
软件流水中的循环展开优化
李文龙
刘利
汤志忠
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2004
16
下载PDF
职称材料
17
基于FPGA的开放式教学CPU的设计与测试系统
李山山
汤志忠
周继群
《计算机工程与应用》
CSCD
北大核心
2005
14
下载PDF
职称材料
18
片上二维网络互连性能分析
王炜
乔林
杨广文
汤志忠
《计算机研究与发展》
EI
CSCD
北大核心
2009
8
下载PDF
职称材料
19
软件流水中隐藏存储延迟的方法
刘利
李文龙
陈彧
李胜梅
汤志忠
《软件学报》
EI
CSCD
北大核心
2005
6
下载PDF
职称材料
20
主成分线性回归模型分析应用程序性能
李胜梅
程步奇
高兴誉
乔林
汤志忠
《计算机研究与发展》
EI
CSCD
北大核心
2009
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
5
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部