-
题名OpenCL的动态执行模式在静态编译支持下的实现
被引量:1
- 1
-
-
作者
文延华
何王全
尉红梅
-
机构
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第10期16-19,共4页
-
基金
国家高技术研究发展计划项目(2012AA010903)
-
文摘
OpenCL的动态执行模式要求底层平台支持device文件的动态生成、编译和加载运行。对于不具备这些特性的平台,必须从软件层面考虑支持方法。通过采用函数更名技术解决同名函数正确识别问题,基于动态执行流的predo策略可以在静态编译环境下实现OpenCL的动态执行模式。
-
关键词
动态执行模式
函数更名技术
执行流
predo策略
-
Keywords
Dynamic execution mode
Function-rename technology
Execution flow
Predo strategy
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名SPM结构上冗余读延迟写优化的设计与实现
- 2
-
-
作者
文延华
冯冬明
尉红梅
-
机构
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
2015年第2期10-13,共4页
-
基金
国家高技术研究发展计划项目(2012AA010903)
-
文摘
随着微处理器架构的发展,将片上SRAM组织成SPM这种软件管理的非cache结构成为众多处理器的选择。SPM结构的特点是实现简单,访问延迟低、带宽高。要有效利用有限的片上SPM空间提升程序性能,必须由用户显式进行数据的布局和传送,或者由编译器进行高效的自动访存优化。冗余读延迟写优化从循环中多个主存访问之间的关联性出发,自动进行了数据传送和缓存优化,提高了SPM上的数据重用率。经过测试,可以有效提升程序性能。
-
关键词
SPM
访存优化
关联性
冗余读延迟写
数据重用
-
Keywords
SPM Memory access optimisation Association Redundant read & delay write Data reuse
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名计算机浮点功能测试方法
被引量:3
- 3
-
-
作者
王俊
文延华
漆锋滨
-
机构
信息工程大学
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2006年第6期68-70,共3页
-
基金
国家863高技术研究发展计划项目(编号:2002AA112010)
-
文摘
浮点运算对衡量一台计算机的性能和可用性占着很大的比重,浮点功能测试是计算机功能测试的重要组成部分。在研究分析了IEEE754浮点标准相关内容和现有浮点测试包的基础上,提出了浮点测试技术的基本方法和策略。
-
关键词
IEEE754舍入模式
相对误差
异常
-
Keywords
IEEE754 Rounding-modes Relative error Exception
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名动态二进制翻译中的冗余LOAD删除优化技术
被引量:2
- 4
-
-
作者
王丽一
文延华
-
机构
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第6期40-43,共4页
-
基金
国家"八六三"高技术研究发展计划项目支持(2002AA112010)
-
文摘
动态二进制翻译系统是根据程序的动态执行信息来将源机器上的可执行代码翻译成目标机器上的可执行代码。在翻译成中间表示的过程中会产生一些冗余的LOAD指令,为提高代码的执行效率,提出对这些LOAD指令进行冗余删除优化。该优化技术可以使优化效果超过其自身的开销,达到优化的目的。
-
关键词
动态二进制翻译
动态优化
冗余删除
-
Keywords
Dynamic binary translation Dynamic optimization Redundancy elimination
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种关于浮点乘加的测试方法
- 5
-
-
作者
王俊
文延华
漆锋滨
-
机构
信息工程大学
江南计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第5期85-87,116,共4页
-
基金
国家863高技术研究发展计划资助项目(编号:2002AA112010)
-
文摘
目前浮点乘加部件的算法研究和实现已成为高性能微处理器研究的热点之一,对其进行测试也显得尤为重要和必要。论文介绍了一种浮点乘加的测试方法,并从特殊值和随机数两个角度进行测试。
-
关键词
浮点乘加
中间乘积
随机数值
-
Keywords
floating point multiply add,middle product,random value
-
分类号
TP368.1
[自动化与计算机技术—计算机系统结构]
-
-
题名异构多核系统中编译器指导的I/O代理技术
被引量:1
- 6
-
-
作者
王珊珊
魏迪
文延华
何王全
-
机构
江南计算技术研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第21期282-284,共3页
-
基金
国家"973"计划基金资助项目(2007CB310900)
-
文摘
在异构多核系统中,精简设计的从处理器核无法运行操作系统,且不支持终端打印和读写文件等常用I/O操作。为此,提出编译器指导、主处理器代理执行的I/O操作技术,采用信息交互、中断处理等方法,实现聚合代理并优化从处理器代码中的I/O操作功能。实验证明,编译器指导的I/O代理性能比系统级I/O代理高5倍以上。
-
关键词
异构多核系统
I/O代理
聚合优化
编译器指导
主处理器
从处理器
-
Keywords
isomerous multi-core system
I/O agent
combination optimization
compiler-directed
master processor
slave processor
-
分类号
TP334.4
[自动化与计算机技术—计算机系统结构]
-
-
题名动态二进制翻译中的指令调度技术研究与实现
- 7
-
-
作者
孙俊
文延华
漆锋滨
-
机构
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第1期17-19,共3页
-
基金
国家863高技术研究发展计划(2002AA112010)
-
文摘
动态二进制翻译提供了无需重新编译源代码就能将源机器生成的可执行代码自动转换到目标机器的方法,很好地解决了代码兼容性问题。其核心思想是根据程序的动态运行信息找到反复执行的代码序列,对代码序列进行翻译和优化,并将结果多次重用。指令调度作为一种有效的编译优化手段,也适用于动态二进制翻译。在对gcc的指令调度器分析研究的基础上,结合动态二进制翻译的实时性特点,提出了适合动态二进制翻译的效率高、开销小的指令调度算法。
-
关键词
动态二进制翻译
指令调度
列表调度
寄存器分配
-
Keywords
Dynamic binary translation Instruction scheduling List scheduling Register allocation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-