期刊文献+
共找到2,610篇文章
< 1 2 131 >
每页显示 20 50 100
基于无裁剪图形流水线的三维图形处理器
1
作者 赵皓宇 王重熙 +1 位作者 宋鹏皓 章隆兵 《高技术通讯》 CAS 北大核心 2024年第7期681-691,共11页
传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2.0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采... 传统的三维图形处理器通过裁剪操作获取三角形的可见区域。然而,裁剪操作的延迟长且硬件开销高,大量的裁剪操作会降低图形处理器的性能。本文设计了一款基于OpenGL ES 2.0标准的三维图形处理器芯片,采用了统一渲染架构。该图形处理器采用高效的无裁剪图形流水线结构,消除了裁剪所带来的硬件开销和性能损耗。此外,本文为该图形处理器设计了一个符合IEEE-754标准的三维向量内积(DP3)计算单元,用于固定功能流水线,以提高图形处理器的性能,并消除图形渲染过程中浮点乘加操作的误差,增强了图形处理器的图形渲染鲁棒性。该三维图形处理器每秒能够处理500 M个顶点和8 G个纹素,功耗为1000 mW,采用了28 nm工艺,面积为7.92 mm^(2)。实现结果表明,与之前的工作相比,本文设计的图形处理器的性能-功耗比提高了27.8%。 展开更多
关键词 三维图形处理器 图形流水线 裁剪 向量内积
下载PDF
基于“承影”GPGPU的张量处理器设计
2
作者 师雨洁 杨轲翔 +1 位作者 刘旭东 何虎 《微电子学与计算机》 2024年第5期109-116,共8页
针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于... 针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于三维乘法树结构的张量处理器设计,将其部署在Xilinx VCU128开发板上。在VCU128开发板上,张量处理器的工作频率为222 MHz。同时,开发了指数运算单元,辅助完成神经网络运算。在VCU128开发板上的工作频率为159 MHz。最后,利用编写汇编程序的方法,验证张量处理器的功能正确性。引入张量处理器后,预期运行时间明显减少。 展开更多
关键词 通用图形处理器 张量处理器 卷积 通用矩阵乘 指数运算
下载PDF
基于通用处理器的图形软绘制引擎设计
3
作者 廖科 周皙 《航空电子技术》 2024年第2期20-26,共7页
机载图形绘制引擎是座舱显示设备的核心组成部分,针对部分机载座舱显示设备低成本、低功耗需求,提出了一种基于通用处理器的图形软绘制引擎实现方案,通过软件实现OpenGL渲染管线的功能,并在嵌入式硬件平台上进行了测试验证,结果证明了... 机载图形绘制引擎是座舱显示设备的核心组成部分,针对部分机载座舱显示设备低成本、低功耗需求,提出了一种基于通用处理器的图形软绘制引擎实现方案,通过软件实现OpenGL渲染管线的功能,并在嵌入式硬件平台上进行了测试验证,结果证明了本方案的有效性和优越性。 展开更多
关键词 软绘制 图形引擎 通用处理器
下载PDF
NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法
4
作者 姜晶菲 何源宏 +2 位作者 许金伟 许诗瑶 钱希福 《计算机工程与科学》 CSCD 北大核心 2024年第7期1141-1150,共10页
深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产... 深度神经网络在自然语言处理、计算机视觉等领域取得了优异的成果,由于智能应用处理数据规模的增长和大模型的快速发展,对深度神经网络的推理性能要求越来越高,N∶M半结构化稀疏化技术成为平衡算力需求和应用效果的热点技术之一。国产异构向量处理器FT-M7032为智能模型处理中的数据并行和指令并行开发提供了较大空间。针对N∶M半结构化稀疏模型计算稀疏模式多样性,提出了一种面向FT-M7032的可灵活配置的稀疏矩阵乘算法NM-SpMM。NM-SpMM设计了一种高效的压缩偏移地址稀疏编码格式COA,避免了半结构化参数配置对稀疏数据访存计算的影响。基于COA编码,NM-SpMM对不同维度稀疏矩阵计算进行了细粒度优化。在FT-M7032单核上的实验结果表明,相较于稠密矩阵乘,NM-SpMM能获得1.73~21.00倍的加速,相较于采用CuSPARSE稀疏计算库的NVIDIA V100 GPU,能获得0.04~1.04倍的加速。 展开更多
关键词 深度神经网络 图形处理器 向量处理器 稀疏矩阵乘 流水线
下载PDF
我国图形处理器(GPU)产业现状及发展建议
5
作者 张雷 张宇华 +1 位作者 李红阳 刘述 《山东工业技术》 2023年第5期53-57,共5页
近年来,图形处理器(GPU)在通用计算领域得到了广泛应用,逐渐在数据中心扮演核心算力的角色。目前,图形处理器领域由国际三巨头(英伟达、超威半导体、英特尔)把持,我国图形处理器产业处于起步阶段。国内企业在企业规模、技术水平、软件... 近年来,图形处理器(GPU)在通用计算领域得到了广泛应用,逐渐在数据中心扮演核心算力的角色。目前,图形处理器领域由国际三巨头(英伟达、超威半导体、英特尔)把持,我国图形处理器产业处于起步阶段。国内企业在企业规模、技术水平、软件应用、人才储备、上下游产业链等方面与国外主流企业相比存在较大的差距。本文结合国际、国内图形处理器产业现状,在保持企业发展定力、找准企业发展方向、打造协同发展生态三方面提出我国图形处理器产业发展建议。 展开更多
关键词 图形处理器 国产化 发展建议
下载PDF
基于图形处理器(GPU)的通用计算 被引量:227
6
作者 吴恩华 柳有权 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第5期601-612,共12页
伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年... 伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年来 ,随着图形处理器 (GPU)性能的大幅度提高以及可编程特性的发展 ,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移 除了计算机图形学本身的应用 ,涉及到其他领域的计算 ,以至于通用计算近 2~ 3年来成为GPU的应用之一 ,并成为研究热点 文中从若干图形硬件发展的历史开始 ,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况 。 展开更多
关键词 图形处理器 通用计算 gpu 图形硬件 可编程性 代数运算 性能分析
下载PDF
MIGPU-9多核交互式图形处理器的设计 被引量:11
7
作者 邓军勇 李涛 +8 位作者 蒋林 韩俊刚 杜慧敏 沈绪榜 黄光新 常立博 山蕊 黄虎才 马栋 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第9期1468-1478,共11页
鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理... 鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理器VSP、双模式的剪裁投影处理器PCPTC,以及数个像素染色处理器PSP等共计9个微处理器核;MIGPU-9将这9个具有不同功能和不同结构的微处理器核以及各种专用加速电路以双轨握手的流水线形式集成到一块XC6VLX550T FPGA上,实现了图形处理任务在不同处理器核及专用电路上的并行计算.测试结果表明,MIGPU-9支持OpenGL2.0和DirectDraw,像素填充率最高可达40 M/s,电路规模超过527万门. 展开更多
关键词 多核染色器 图形处理器 硬件流水线 操作并行
下载PDF
消费级处理器中的生产力王者——AMD Zen 5锐龙99950X、9900X处理器首测
8
《计算机应用文摘》 2024年第17期195-199,共5页
尽管锐龙79700X、锐龙59600X拥有突出的单核性能、优秀的游戏表现,但要满足视频转码、科学计算、图形渲染、商务办公需求,需多核性能强悍、支持先进指令集的处理器,因此在AMD的首发Zen 5处理器中包含了2款定位高端的旗舰处理器——16核... 尽管锐龙79700X、锐龙59600X拥有突出的单核性能、优秀的游戏表现,但要满足视频转码、科学计算、图形渲染、商务办公需求,需多核性能强悍、支持先进指令集的处理器,因此在AMD的首发Zen 5处理器中包含了2款定位高端的旗舰处理器——16核心、32线程的锐龙99950X及12核心、24线程的锐龙99900X。在这些专业应用中,它们是否有优秀的表现,是否能与竞争对手的英特尔第14代酷睿旗舰处理器相匹敌呢? 展开更多
关键词 商务办公 图形渲染 指令集 处理器 线程 AMD 视频转码 酷睿
下载PDF
旗舰处理器谁的生产力更高?锐龙99950X VS.酷睿i9-14900K
9
《计算机应用文摘》 2024年第21期198-200,共3页
为了满足不同预算、需求的客户,一种处理器架构会衍生出多个不同规格、型号的产品。其中,核心与计算线程数不多的处理器一般适合用来娱乐与日常办公;核心数与计算线程数多的处理器不仅包含上述功能,还被用来进行音视频转码、图形渲染、A... 为了满足不同预算、需求的客户,一种处理器架构会衍生出多个不同规格、型号的产品。其中,核心与计算线程数不多的处理器一般适合用来娱乐与日常办公;核心数与计算线程数多的处理器不仅包含上述功能,还被用来进行音视频转码、图形渲染、AI计算等。在当前市场上,哪种产品有助于用户更好地应用专业软件呢? 展开更多
关键词 图形渲染 日常办公 处理器 视频转码 酷睿 不同规格 VS 生产力
下载PDF
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
10
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(gpu) 时域有限元(TD-FEM) 通用计算图形处理单元 (GPgpu)
下载PDF
用图形处理器(GPU)实现矩阵乘法的方法 被引量:1
11
作者 张经宇 《职大学报》 2007年第4期27-29,15,共4页
随着计算机图形处理器(GPU)性能的大幅度提高以及编程接口的发展,人们开始关注通过GPU处理通用计算。通用计算在近年米也成为GPU的应用的发展方向之一。本文将讨论如何使用图形处理器(GPU),通过OPENGL来完成矩阵乘法,并结合实践探讨其... 随着计算机图形处理器(GPU)性能的大幅度提高以及编程接口的发展,人们开始关注通过GPU处理通用计算。通用计算在近年米也成为GPU的应用的发展方向之一。本文将讨论如何使用图形处理器(GPU),通过OPENGL来完成矩阵乘法,并结合实践探讨其发展前景。 展开更多
关键词 图形处理器(gpu) 矩阵乘法 0PENGL
下载PDF
图形处理器(GPU)专利态势研究 被引量:3
12
作者 万雪佼 徐步陆 《集成电路应用》 2017年第7期6-9,共4页
作为图形处理器(GPU)技术发展的风向标,报告对全球和中国的GPU技术发展历史、专利发展状况和主要厂商分别进行了分析,包括年度公开趋势、专利公开国分布、专利技术趋势、重点发明人,专利引证排名等分析,可供产业发展和投资决策参考。
关键词 图形处理器 gpu 专利 集成电路产业
下载PDF
地震叠前时间偏移的一种图形处理器提速实现方法 被引量:74
13
作者 李博 刘国峰 刘洪 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2009年第1期245-252,共8页
新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技... 新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技术在石油工业中的应用研究正在有效开展.本文仅借助于油气勘探中广泛使用的叠前时间偏移,旨在于扼要阐明其基于GPU应用的有效性;文中还提出一种利用GPU实现地震叠前时间偏移的软件构件方法,并针对非对称走时叠前时间偏移所拓展的应用软件提供一种具体实现架构.与以往用个人计算机(PC,Personal Computer)或者PC集群所用的叠前时间偏移相比,本文方法可甚大地提高计算效率,从而在石油物探资料处理中可显著地节约计算成本和维护费用.文中实际例证也表明,基于GPU进行高性能并行计算,当是适应目前石油工业中大规模计算需求的一个重要发展途径. 展开更多
关键词 非对称走时叠前时间偏移 图形处理器 gpu通用计算 统一计算设备架构
下载PDF
图形处理器通用计算的研究综述 被引量:6
14
作者 陈庆奎 王海峰 +3 位作者 那丽春 霍欢 郝聚涛 刘伯成 《黑龙江大学自然科学学报》 CAS 北大核心 2012年第5期672-679,共8页
从2004年开始,图形处理器GPU的通用计算成为一个新研究热点,此后GPGPU(Gen-eral-Purpose Graphics Processing Unit)在最近几年中取得长足发展。从介绍GPGPU硬件体系结构的改变和软件技术的发展开始,阐述GPGPU主要应用领域中的研究成果... 从2004年开始,图形处理器GPU的通用计算成为一个新研究热点,此后GPGPU(Gen-eral-Purpose Graphics Processing Unit)在最近几年中取得长足发展。从介绍GPGPU硬件体系结构的改变和软件技术的发展开始,阐述GPGPU主要应用领域中的研究成果及最新发展。针对各种应用领域中计算数据大规模增加的趋势,出现单个GPU计算节点无法克服的硬件限制问题,为解决该问题出现多GPU计算和GPU集群的解决方案。详细地讨论通用计算GPU集群的研究进展和应用技术,包括GPU集群硬件异构性的问题和软件框架的三个研究趋势,对几种典型的软件框架Glift、Zippy、CUDASA的特性和缺点进行较详细的分析。最后,总结GPU通用计算研究发展中存在的问题和未来的挑战。 展开更多
关键词 图形处理器 通用计算 可编程性 gpu集群
下载PDF
图形处理器通用计算关键技术研究综述 被引量:27
15
作者 王海峰 陈庆奎 《计算机学报》 EI CSCD 北大核心 2013年第4期757-772,共16页
当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依... 当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战. 展开更多
关键词 图形处理器 通用计算 可编程性 gpu集群
下载PDF
图形处理器低功耗设计技术研究 被引量:9
16
作者 田泽 张骏 +2 位作者 许宏杰 郭亮 黎小玉 《计算机科学》 CSCD 北大核心 2013年第06A期210-216,共7页
图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2~3倍。高功耗带来的可靠性、稳定性以及芯片成本... 图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2~3倍。高功耗带来的可靠性、稳定性以及芯片成本问题使"功耗墙"已经成为未来GPU设计过程中需要突破的关键问题之一。立足于体系结构层次,结合图形处理器的渲染流水线的结构特点,从深度测试和消隐、染色器数据通路、纹理映射和压缩、渲染策略、寄存器文件和片上Cache等角度描述了图形处理器的低功耗设计技术,并指出了GPU低功耗设计技术的进一步研究方向。 展开更多
关键词 图形处理器 低功耗 渲染 CACHE
下载PDF
面向移动设备的3D图形处理器设计 被引量:8
17
作者 杨毅 郭立 +1 位作者 史鸿声 郭安泰 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1668-1674,共7页
提出一种面向移动设备的3D图形处理器的设计方法,从图形算法和硬件架构两个层次进行优化.对图形算法进行C语言的仿真模拟,并设计高效的具有并行和流水线结构的图形处理器架构.该架构采用定点的数据通道,拥有一个可编程的顶点处理器和基... 提出一种面向移动设备的3D图形处理器的设计方法,从图形算法和硬件架构两个层次进行优化.对图形算法进行C语言的仿真模拟,并设计高效的具有并行和流水线结构的图形处理器架构.该架构采用定点的数据通道,拥有一个可编程的顶点处理器和基于像素块的光栅扫描转换模块,降低电路复杂度的同时提高了整体性能.该设计已经在FPGA上验证,并给出了实验结果.实验结果显示该图形处理器结构可以满足移动设备的图形应用要求,具有可行性. 展开更多
关键词 图形处理器 可编程顶点处理器 光栅阶段 FPGA验证
下载PDF
图形处理器片段处理单元的设计与实现 被引量:5
18
作者 田泽 张淑 +3 位作者 张骏 许宏杰 黎小玉 郭蒙 《计算机应用》 CSCD 北大核心 2014年第A02期357-360,共4页
针对图形处理器三维引擎中对图形的后期处理需求,实现片段写入帧缓冲区前的测试、混合、逻辑操作、累积、清除和屏蔽等关键功能。分析并提取了Open GL核心库中的片段处理相关函数,确定了片段处理单元要实现的功能;合理安排多个片段处理... 针对图形处理器三维引擎中对图形的后期处理需求,实现片段写入帧缓冲区前的测试、混合、逻辑操作、累积、清除和屏蔽等关键功能。分析并提取了Open GL核心库中的片段处理相关函数,确定了片段处理单元要实现的功能;合理安排多个片段处理功能的执行顺序,设计了基于流水线的片段处理单元结构;采用Verilog HDL对电路进行描述,采用Cadence NC-Verilog仿真工具进行虚拟验证,采用Xilinx的ISE工具进行综合,并在Xilinx Virtex6XC6VLX760 FPGA上进行原型验证,电路工作频率可以达到180 MHz,测试功能正确。在SMIC 65 nm CMOS工艺下,采用Synopsys Design-Compiler对设计进行综合,电路工作频率达到300 MHz,满足设计需求。 展开更多
关键词 片段处理 图形处理器 现场可编程门阵列 开放图形语言
下载PDF
运用ESL模型对通用图形处理器(GPGPU)进行的能耗分析
19
作者 王潇 杜家宽 《电子技术与软件工程》 2015年第23期109-113,共5页
通过在不同的CPU和GPGPU体系结构上执行并行归并排序算法,运用ESL模型分析不同体系结构的性能和能耗,得出CPU和GPU合并是处理器设计的正确趋势的结论。
关键词 通用图形处理器 GPgpu ESL 模型 能耗分析 处理器设计
下载PDF
基于图形处理器的数据流快速聚类 被引量:24
20
作者 曹锋 周傲英 《软件学报》 EI CSCD 北大核心 2007年第2期291-302,共12页
在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类以及数据流簇进化... 在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基本聚类方法、基于GPU的数据流聚类以及数据流簇进化分析方法.这些方法的共同特点是充分利用了GPU强大的处理能力和流水线特性.与以往具有独立框架的数据流聚类算法不同,这些基于GPU的聚类算法具有同一框架和多种聚类分析功能,为数据流聚类分析提供了统一的平台.从分析可知,数据流聚类分析的核心操作实际上就是距离计算和比较.基于这一认识,利用GPU的子素向量处理功能进行距离计算.性能验证实验是在配有Pentium IV3.4G CPU和NVIDIA GeForce 6800 GT显卡的PC上进行的.综合分析和实验结果表明,基于GPU的数据流聚类算法比传统的CPU算法平均快7倍,从而为高速数据流应用提供了良好的支持. 展开更多
关键词 数据流 聚类 图形处理器 进化 窗口
下载PDF
上一页 1 2 131 下一页 到第
使用帮助 返回顶部