期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种图形加速器和着色器的体系结构
被引量:
31
1
作者
韩俊刚
蒋林
+6 位作者
杜慧敏
曹小鹏
董梁
孟李林
赵全良
殷诚信
张军
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010年第3期363-372,共10页
为了适应智能手机和网本机对于图形加速器的需求,提出一种二维图形加速器和三维像素着色器的体系结构.该体系结构包括自主设计的VLIW指令集和可重组的数据驱动流水线.针对通常将图像帧划分成多个块,且每块由一个微引擎处理的方法可能造...
为了适应智能手机和网本机对于图形加速器的需求,提出一种二维图形加速器和三维像素着色器的体系结构.该体系结构包括自主设计的VLIW指令集和可重组的数据驱动流水线.针对通常将图像帧划分成多个块,且每块由一个微引擎处理的方法可能造成微引擎的负载不均衡的问题,采用按扫描行分配的并行存储和处理结构,其中每个扫描行的处理任务按照需要动态地分配给微引擎.为了评估和实现该体系结构,建立了性能仿真平台、系统仿真平台和RTL仿真平台,并用C++语言编写性能仿真平台评估了该体系结构对性能的影响.模拟实验结果表明,新颖的存储/任务映射方法可以充分地利用处理器资源,降低存储访问的冲突,有利于改善并行处理的可扩展性.文中还讨论了自主设计的图形产生器、图像变换器和VLIW微引擎的结构以及相关的图形硬件加速算法.
展开更多
关键词
GPU
图形硬件加速器
着色微引擎
下载PDF
职称材料
自适应多采样扫描转换算法
被引量:
4
2
作者
韩俊刚
殷诚信
曹小鹏
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2012年第4期451-458,共8页
随着片元着色器的可编程能力不断提高和新型图元的出现,扫描转换必须加强多采样时的处理能力.经典的边方程扫描转换算法便于实现多采样,但采样点测试的计算量大并且存在冗余测试,为此提出一种自适应多采样扫描转换算法.该算法的多采样...
随着片元着色器的可编程能力不断提高和新型图元的出现,扫描转换必须加强多采样时的处理能力.经典的边方程扫描转换算法便于实现多采样,但采样点测试的计算量大并且存在冗余测试,为此提出一种自适应多采样扫描转换算法.该算法的多采样集中在"边界片元",并结合点采样和区域采样技术根据自适应细分规则细分边界片元进行采样点的测试;避免了边方程算法中进行采样点测试时的乘法运算,减少了采样点的冗余测试,提高了多采样时扫描转换的性能.实验结果表明,文中算法在较小代价下达到或接近有相同采样点数的超采样反走样能力.
展开更多
关键词
GPU
扫描转换
反走样
自适应多采样
下载PDF
职称材料
并行扫描转换结构中的状态管理
3
作者
殷诚信
韩俊刚
黄虎才
《中国图象图形学报》
CSCD
北大核心
2013年第9期1149-1155,共7页
扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元...
扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元的停顿,降低系统的吞吐能力。提出一种新的状态管理方法,将命令分为计算与控制两类,对于控制类的命令由状态处理单元生成状态掩模(state-mask),减少了状态管理中的广播通信,降低了保持命令顺序性和状态管理的复杂性。仿真结果表明所提出状态管理方法同传统的状态管理方法相比,在游戏等后端状态变化明显的图形应用中,扫描引擎利用率提高了5%~9%。
展开更多
关键词
状态管理及命令顺序性
扫描转换
图形处理器
并行处理
原文传递
题名
一种图形加速器和着色器的体系结构
被引量:
31
1
作者
韩俊刚
蒋林
杜慧敏
曹小鹏
董梁
孟李林
赵全良
殷诚信
张军
机构
西安邮电学院专用集成电路设计中心
空军工程大学电子工程系
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010年第3期363-372,共10页
文摘
为了适应智能手机和网本机对于图形加速器的需求,提出一种二维图形加速器和三维像素着色器的体系结构.该体系结构包括自主设计的VLIW指令集和可重组的数据驱动流水线.针对通常将图像帧划分成多个块,且每块由一个微引擎处理的方法可能造成微引擎的负载不均衡的问题,采用按扫描行分配的并行存储和处理结构,其中每个扫描行的处理任务按照需要动态地分配给微引擎.为了评估和实现该体系结构,建立了性能仿真平台、系统仿真平台和RTL仿真平台,并用C++语言编写性能仿真平台评估了该体系结构对性能的影响.模拟实验结果表明,新颖的存储/任务映射方法可以充分地利用处理器资源,降低存储访问的冲突,有利于改善并行处理的可扩展性.文中还讨论了自主设计的图形产生器、图像变换器和VLIW微引擎的结构以及相关的图形硬件加速算法.
关键词
GPU
图形硬件加速器
着色微引擎
Keywords
GPU
graphics hardware accelerator
micro-engine shader
分类号
TP302.4 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
自适应多采样扫描转换算法
被引量:
4
2
作者
韩俊刚
殷诚信
曹小鹏
机构
西安邮电学院计算机学院
西安电子科技大学计算机学院
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2012年第4期451-458,共8页
基金
国家自然科学基金重点项目(61136002)
文摘
随着片元着色器的可编程能力不断提高和新型图元的出现,扫描转换必须加强多采样时的处理能力.经典的边方程扫描转换算法便于实现多采样,但采样点测试的计算量大并且存在冗余测试,为此提出一种自适应多采样扫描转换算法.该算法的多采样集中在"边界片元",并结合点采样和区域采样技术根据自适应细分规则细分边界片元进行采样点的测试;避免了边方程算法中进行采样点测试时的乘法运算,减少了采样点的冗余测试,提高了多采样时扫描转换的性能.实验结果表明,文中算法在较小代价下达到或接近有相同采样点数的超采样反走样能力.
关键词
GPU
扫描转换
反走样
自适应多采样
Keywords
GPU
scan conversion
anti-aliasing
adaptive multi-sampling
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
并行扫描转换结构中的状态管理
3
作者
殷诚信
韩俊刚
黄虎才
机构
西安邮电大学计算机学院
出处
《中国图象图形学报》
CSCD
北大核心
2013年第9期1149-1155,共7页
基金
国家自然科学基金重点项目(61136002)
文摘
扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元的停顿,降低系统的吞吐能力。提出一种新的状态管理方法,将命令分为计算与控制两类,对于控制类的命令由状态处理单元生成状态掩模(state-mask),减少了状态管理中的广播通信,降低了保持命令顺序性和状态管理的复杂性。仿真结果表明所提出状态管理方法同传统的状态管理方法相比,在游戏等后端状态变化明显的图形应用中,扫描引擎利用率提高了5%~9%。
关键词
状态管理及命令顺序性
扫描转换
图形处理器
并行处理
Keywords
state management and ordering
scan-convention
GPU(graphic processing unit)
parallel processing
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种图形加速器和着色器的体系结构
韩俊刚
蒋林
杜慧敏
曹小鹏
董梁
孟李林
赵全良
殷诚信
张军
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010
31
下载PDF
职称材料
2
自适应多采样扫描转换算法
韩俊刚
殷诚信
曹小鹏
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2012
4
下载PDF
职称材料
3
并行扫描转换结构中的状态管理
殷诚信
韩俊刚
黄虎才
《中国图象图形学报》
CSCD
北大核心
2013
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部