期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种图形加速器和着色器的体系结构 被引量:31
1
作者 韩俊刚 蒋林 +6 位作者 杜慧敏 曹小鹏 董梁 孟李林 赵全良 殷诚信 张军 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第3期363-372,共10页
为了适应智能手机和网本机对于图形加速器的需求,提出一种二维图形加速器和三维像素着色器的体系结构.该体系结构包括自主设计的VLIW指令集和可重组的数据驱动流水线.针对通常将图像帧划分成多个块,且每块由一个微引擎处理的方法可能造... 为了适应智能手机和网本机对于图形加速器的需求,提出一种二维图形加速器和三维像素着色器的体系结构.该体系结构包括自主设计的VLIW指令集和可重组的数据驱动流水线.针对通常将图像帧划分成多个块,且每块由一个微引擎处理的方法可能造成微引擎的负载不均衡的问题,采用按扫描行分配的并行存储和处理结构,其中每个扫描行的处理任务按照需要动态地分配给微引擎.为了评估和实现该体系结构,建立了性能仿真平台、系统仿真平台和RTL仿真平台,并用C++语言编写性能仿真平台评估了该体系结构对性能的影响.模拟实验结果表明,新颖的存储/任务映射方法可以充分地利用处理器资源,降低存储访问的冲突,有利于改善并行处理的可扩展性.文中还讨论了自主设计的图形产生器、图像变换器和VLIW微引擎的结构以及相关的图形硬件加速算法. 展开更多
关键词 GPU 图形硬件加速器 着色微引擎
下载PDF
自适应多采样扫描转换算法 被引量:4
2
作者 韩俊刚 殷诚信 曹小鹏 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第4期451-458,共8页
随着片元着色器的可编程能力不断提高和新型图元的出现,扫描转换必须加强多采样时的处理能力.经典的边方程扫描转换算法便于实现多采样,但采样点测试的计算量大并且存在冗余测试,为此提出一种自适应多采样扫描转换算法.该算法的多采样... 随着片元着色器的可编程能力不断提高和新型图元的出现,扫描转换必须加强多采样时的处理能力.经典的边方程扫描转换算法便于实现多采样,但采样点测试的计算量大并且存在冗余测试,为此提出一种自适应多采样扫描转换算法.该算法的多采样集中在"边界片元",并结合点采样和区域采样技术根据自适应细分规则细分边界片元进行采样点的测试;避免了边方程算法中进行采样点测试时的乘法运算,减少了采样点的冗余测试,提高了多采样时扫描转换的性能.实验结果表明,文中算法在较小代价下达到或接近有相同采样点数的超采样反走样能力. 展开更多
关键词 GPU 扫描转换 反走样 自适应多采样
下载PDF
并行扫描转换结构中的状态管理
3
作者 殷诚信 韩俊刚 黄虎才 《中国图象图形学报》 CSCD 北大核心 2013年第9期1149-1155,共7页
扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元... 扫描转换为图形流水线的核心部分,许多高性能的图形硬件都是采用并行的扫描转换结构。现代GPU(graphic processing unit)用于高性能计算时,主要依靠其极大的系统吞吐率,但是用基于传统的状态管理方法维持命令顺序性时会造成处理单元的停顿,降低系统的吞吐能力。提出一种新的状态管理方法,将命令分为计算与控制两类,对于控制类的命令由状态处理单元生成状态掩模(state-mask),减少了状态管理中的广播通信,降低了保持命令顺序性和状态管理的复杂性。仿真结果表明所提出状态管理方法同传统的状态管理方法相比,在游戏等后端状态变化明显的图形应用中,扫描引擎利用率提高了5%~9%。 展开更多
关键词 状态管理及命令顺序性 扫描转换 图形处理器 并行处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部