期刊文献+
共找到106篇文章
< 1 2 6 >
每页显示 20 50 100
基于“CPU+GPU”的人工智能运行平台的实时监控方法
1
作者 吴文炤 王卫卫 +2 位作者 邱镇 郭庆 程琳 《计算技术与自动化》 2023年第2期86-90,共5页
人工智能运行平台监控的实时性要求相当高,单CPU难以满足实时人工智能运行平台的实际应用要求。为了改善人工智能运行平台的监控效率,设计了基于“CPU+GPU”的人工智能运行平台的实时监控方法。首先分析了当前人工智能运行平台的监控研... 人工智能运行平台监控的实时性要求相当高,单CPU难以满足实时人工智能运行平台的实际应用要求。为了改善人工智能运行平台的监控效率,设计了基于“CPU+GPU”的人工智能运行平台的实时监控方法。首先分析了当前人工智能运行平台的监控研究进展,然后设计了人工智能运行平台整体流程,采用GPU作为加速部分,配合CPU共同承担实时监控任务,最后进行了仿真对比测试,相对于单CPU,CPU+GPU的平台监控速度更快,可以满足平台实时控制要求,具有更高的实际应用价值。 展开更多
关键词 人工智能 中央处理器 图形处理器 对比测试 实时控制
下载PDF
基于飞腾CPU的雷达信号处理算法实现与优化
2
作者 张越 马艳艳 《舰船电子对抗》 2023年第5期60-64,共5页
基于国产化飞腾中央处理器(CPU),利用矢量信号图像处理库(VSIPL)将雷达信号处理算法软件化,以自适应副瓣对消(ASLC)和动目标检测(MTD)算法为例具体实现,利用NEON高级单指令多数据技术进行并行计算加速的优化,并利用仿真数据进行了算法... 基于国产化飞腾中央处理器(CPU),利用矢量信号图像处理库(VSIPL)将雷达信号处理算法软件化,以自适应副瓣对消(ASLC)和动目标检测(MTD)算法为例具体实现,利用NEON高级单指令多数据技术进行并行计算加速的优化,并利用仿真数据进行了算法正确性验证和计算速度对比。 展开更多
关键词 飞腾cpu 自适应副瓣对消 动目标检测 矢量信号图像处理库 并行计算
下载PDF
地震叠前逆时偏移算法的CPU/GPU实施对策 被引量:83
3
作者 李博 刘红伟 +4 位作者 刘国峰 佟小龙 刘洪 郭建 裴江云 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2938-2943,共6页
相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O... 相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O(输入/输出)量却是最大的.针对此问题,本文在分析现行逆时偏移的多种算法基础上,提出利用CPU/GPU(中央处理器/图形处理器)作为数值计算核心,建立随机边界模型,从而克服存储I/O难题和提高计算效率.在实际的数据测试中,本文的方法可以大幅度的提高计算效率和减少存储单元,从而促使其高效地应用于生产实际. 展开更多
关键词 逆时偏移 波动方程 随机边界 中央处理器 图形处理器
下载PDF
基于数据-模型混合驱动的电力系统机电暂态快速仿真方法
4
作者 王鑫 杨珂 +3 位作者 黄文琦 马云飞 耿光超 江全元 《中国电机工程学报》 EI CSCD 北大核心 2024年第8期2955-2964,I0002,共11页
数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-T... 数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-TDS)算法。算法中发电机状态变量与节点注入电流通过数据驱动模型推理计算,并通过网络方程完成节点电压计算,两者交替求解完成仿真。算法提出一种混合驱动范式下的网络代数方程组预处理方法,用以改善仿真的收敛性;算法设计一种中央处理器单元-神经网络处理器单元(central processing unit-neural network processing unit,CPU-NPU)异构计算框架以加速仿真,CPU进行机理模型的微分代数方程求解;NPU作协处理器完成数据驱动模型的前向推理。最后在IEEE-39和Polish-2383系统中将部分或全部发电机替换为数据驱动模型进行验证,仿真结果表明,所提出的仿真算法收敛性好,计算速度快,结果准确。 展开更多
关键词 机电暂态 时域仿真 数据-模型混合驱动 收敛性 cpu-NPU异构运算
下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
5
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
6
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
下载PDF
独立翅片式液体自循环CPU散热器 被引量:2
7
作者 马国远 刘思光 彭珑 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第11期1203-1206,共4页
通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123... 通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123的散热性能最好且最佳充液率为80%~100%。 展开更多
关键词 散热器 液体自循环冷却 计算机中央处理器(cpu)
下载PDF
基于VHDL之CPU设计与实践 被引量:13
8
作者 徐爱萍 张玉萍 涂国庆 《实验室研究与探索》 CAS 北大核心 2014年第5期120-124,共5页
随着大规模可编程逻辑器件的发展,EDA技术已成为硬件系统电路设计的重要手段。基于EDA技术的计算机组成原理整机实习通常在Quartus II仿真平台上实现。早期均采用Block Diagram的设计方式,虽然设计过程直观,但仿真调试困难,难以完全调... 随着大规模可编程逻辑器件的发展,EDA技术已成为硬件系统电路设计的重要手段。基于EDA技术的计算机组成原理整机实习通常在Quartus II仿真平台上实现。早期均采用Block Diagram的设计方式,虽然设计过程直观,但仿真调试困难,难以完全调试成功。本文研究了基于VHDL的灵活方便的CPU设计过程,该设计由取指、指令译码、指令执行、存储器接口、通用寄存器组和寄存器输出六个组成部分,最后通过调试软件直接观察寄存器的值来验证了设计的准确性。本研究方法对改革该课程的整机实习,发挥学生的主动能动性,提高学生的自主创造能力具有很好的指导意义和实际参考价值。 展开更多
关键词 计算机组成原理 cpu设计 整机实习 VHDL
下载PDF
CPLD在ADS7812与CPU之间的接口应用 被引量:2
9
作者 傅晓程 胡东海 《宁波职业技术学院学报》 2006年第2期56-57,共2页
介绍了应用CPLD器件设计ADS7812与CPU之间的接口——“串并”转换电路。ADS7812是BB公司生产的高性能、低功耗12位串行A/D转换器。ispLSI1016是Lattice公司生产的低密度ispPLD器件。
关键词 转换电路 cpu CPLD
下载PDF
基于人员出入的激光检索系统设计
10
作者 陆锋 史依姗 杨紫江 《山西电子技术》 2024年第2期23-25,共3页
激光由于具有方向性好,亮度高,单色性好等特点而被广泛应用,基于激光的特点,设计了一个基于人员出入的激光检索系统。本系统采用Arduino uno开发板来控制激光发射与接收,通过屏幕操作启动中央处理器进行数据处理,在集成开发板的控制下,... 激光由于具有方向性好,亮度高,单色性好等特点而被广泛应用,基于激光的特点,设计了一个基于人员出入的激光检索系统。本系统采用Arduino uno开发板来控制激光发射与接收,通过屏幕操作启动中央处理器进行数据处理,在集成开发板的控制下,对出入的人员进行计数,在LED屏幕上显示当前到达的总人数,通过实验测试,本系统实现无接触检测某些场所内的人流量。 展开更多
关键词 激光检索 Arduino uno开发板 中央处理器 LED屏
下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
11
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 OPENMP
下载PDF
自主CPU发展道路及在航天领域应用 被引量:18
12
作者 胡伟武 《上海航天》 CSCD 2019年第1期1-9,共9页
目前,我国中央处理器(CPU)的发展主要有自主研发和引进技术两条路线。自主研发的CPU在性能和软件生态上能否赶超引进技术的CPU成为争论的焦点。首先论述了我国CPU发展不能仅着眼于单项技术瓶颈的突破和产品市场占有率的提高,还必须建立... 目前,我国中央处理器(CPU)的发展主要有自主研发和引进技术两条路线。自主研发的CPU在性能和软件生态上能否赶超引进技术的CPU成为争论的焦点。首先论述了我国CPU发展不能仅着眼于单项技术瓶颈的突破和产品市场占有率的提高,还必须建立起自主可控的信息技术与产业生态体系;然后结合龙芯CPU研发和产业化的实践,论述了只要结合应用需求进行持续改进,自主研发的CPU在性能和软件生态上就能赶超引进技术的CPU,满足我国自主信息化应用的需求;最后论述了自主抗辐照CPU的发展及在航天领域应用情况。 展开更多
关键词 中央处理器 软件生态 抗辐照 自主可控
下载PDF
基于嵌入式CPU-GPU的高清鱼眼视频实时校正系统 被引量:4
13
作者 公维理 《计算机工程与应用》 CSCD 北大核心 2016年第14期172-179,201,共9页
在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问... 在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问题,提出了基于嵌入式平台STi H418的CPU-GPU高速通信协议和基于可编程着色器的嵌入式CPU-GPU内存共享方法,并利用GPU的纹理映射技术实现了全景高清鱼眼视频实时校正系统。实验结果表明,与相关校正系统相比,该系统很好地兼顾到算法效率、图像校正效果和完整性,可以完全满足360°×180°的全景高清(400万像素,2 048×2 048p30)鱼眼视频实时监控,而且与使用PC服务器相比嵌入式系统降低了系统整体成本,ARM CPU软件生成更新校正算法和可事时实时和事后的虚拟PTZ提高系统灵活性和稳定性,因此该系统具有很高的实用价值。 展开更多
关键词 全景高清鱼眼视频实时校正 嵌入式中央处理器-图形处理器(cpu-GPU) 线性等距球面透视投影 纹理映射
下载PDF
CPU与GPU之间接口电路的设计与实现 被引量:1
14
作者 石茉莉 蒋林 刘有耀 《微电子学与计算机》 CSCD 北大核心 2013年第11期23-26,共4页
在构建CPU(Central Process Unit,CPU)与GPU(Graphic Process Unit)或者CPU与其它设备协同计算的过程中,通过PCI(Peripheral Component Interconnect)总线将GPU等其他设备连接至CPU,承担并行计算的任务.为了解决PCI接口芯片与GPU芯片之... 在构建CPU(Central Process Unit,CPU)与GPU(Graphic Process Unit)或者CPU与其它设备协同计算的过程中,通过PCI(Peripheral Component Interconnect)总线将GPU等其他设备连接至CPU,承担并行计算的任务.为了解决PCI接口芯片与GPU芯片之间的异步传输和时序匹配问题,基于PCI总线规范与GPU芯片的时序规范,采用跨时钟域信号的处理方法,设计了一个CPU与GPU之间跨时钟域连接的时序匹配接口电路.通过仿真,验证了该电路的正确性.结果表明,该电路可工作在252 MHz频率下,能够满足GPU与CPU间接口电路对速率和带宽的要求. 展开更多
关键词 PCI总线 GPU cpu 总线仲裁 异构计算
下载PDF
基于负载均衡的CPU-GPU异构计算平台任务调度策略 被引量:5
15
作者 方娟 章佳兴 《北京工业大学学报》 CAS CSCD 北大核心 2020年第7期782-787,共6页
针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计... 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能. 展开更多
关键词 中央处理单元-图形处理单元(central processing unit-graphics processing unit cpu-GPU) 异构计算 高性能计算 任务调度 负载均衡 负载感知
下载PDF
关于CPU+GPU异构计算的研究与分析 被引量:5
16
作者 许桢 《科技信息》 2010年第17期I0097-I0097,I0014,共2页
在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是... 在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是随着通用计算程序接口(OpenCL)的发布,CPU+GPU的异构化计算这种看起来像是CPU和GPU混合体的出现,相信这将使计算机处理器又将迈上一个新台阶,这种异构化成就的是更加高性能,更加高性价比的处理器,而这必将掀起GPU和CPU革命的高潮。 展开更多
关键词 中央处理器(cpu) 图形处理器(GPU) 整合 异构计算
下载PDF
一种CPU模块的测试设计 被引量:2
17
作者 田晓波 唐琰 于水游 《光电技术应用》 2021年第2期50-55,共6页
论述了对一种CPU模块的测试设计,此测试设计为了检测该种CPU模块的功能和性能。在设计过程中,首先,对该CPU模块的功能和性能进行了分析,并在此基础上,提出了测试需求,同时根据测试需求设计了测试方法。最后,通过对这种CPU模块的功能和... 论述了对一种CPU模块的测试设计,此测试设计为了检测该种CPU模块的功能和性能。在设计过程中,首先,对该CPU模块的功能和性能进行了分析,并在此基础上,提出了测试需求,同时根据测试需求设计了测试方法。最后,通过对这种CPU模块的功能和性能进行测试和验证,为设计人员提供了设计和测试建议。 展开更多
关键词 cpu模块 CPLD 以太网接口 I^(2)C总线接口 A/D采集接口
下载PDF
高性能CPU电源Droop检测优化设计实现
18
作者 杨丽琼 章隆兵 +1 位作者 肖俊华 王剑 《高技术通讯》 CAS 2022年第9期894-902,共9页
高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本... 高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本文提出了一种基于全数字快速高精度Droop Sensor的供电监测优化方法。该方法采用易于集成于处理器核数字域内的单数字供电Droop Sensor进行本地供电实时监测。当Droop Sensor检测到电压快速垂降时,实时指导所在处理器核的时钟域进行时钟降频,帮助处理器度过低压危险时期,待垂降结束后再恢复正常的时钟频率。实现了局部压降的针对性时钟优化,避免了整体功耗性能损失。本文采用12 nm数字工艺实现了Droop Sensor设计。仿真结果表明,该传感器可在100 ps内进行一阶Droop的快速响应,帮助CPU度过瞬间大幅度的压降期;高阶Droop响应的阈值调节精度可达3%,支持CPU的供电水平多阈值控制。 展开更多
关键词 高性能中央处理器(cpu) 供电检测 Droop Sensor
下载PDF
Implementing Delay Multiply and Sum Beamformer on a Hybrid CPU-GPU Platform for Medical Ultrasound Imaging Using Open MP and CUDA 被引量:2
19
作者 Ke Song Paul Liu Dongquan Liu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2021年第9期1133-1150,共18页
Anovel beamforming algorithmnamed Delay Multiply and Sum(DMAS),which excels at enhancing the resolution and contrast of ultrasonic image,has recently been proposed.However,there are nested loops in this algorithm,so t... Anovel beamforming algorithmnamed Delay Multiply and Sum(DMAS),which excels at enhancing the resolution and contrast of ultrasonic image,has recently been proposed.However,there are nested loops in this algorithm,so the calculation complexity is higher compared to the Delay and Sum(DAS)beamformer which is widely used in industry.Thus,we proposed a simple vector-based method to lower its complexity.The key point is to transform the nested loops into several vector operations,which can be efficiently implemented on many parallel platforms,such as Graphics Processing Units(GPUs),and multi-core Central Processing Units(CPUs).Consequently,we considered to implement this algorithm on such a platform.In order to maximize the use of computing power,we use the GPUs andmulti-core CPUs inmixture.The platform used in our test is a low cost Personal Computer(PC),where a GPU and a multi-core CPU are installed.The results show that the hybrid use of a CPU and a GPU can get a significant performance improvement in comparison with using a GPU or using amulti-core CPU alone.The performance of the hybrid system is increased by about 47%–63%compared to a single GPU.When 32 elements are used in receiving,the fame rate basically can reach 30 fps.In the best case,the frame rate can be increased to 40 fps. 展开更多
关键词 BEAMFORMING delay multiply and sum graphics processing unit multi-core central processing unit
下载PDF
关于GPU+CPU整合发展的趋势探索 被引量:2
20
作者 许桢 《微计算机信息》 2010年第20期212-214,共3页
在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。随着,NVIDIA率先引入了Tesla通用GPU计算架构,其最终目的是将CPU和GPU... 在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。随着,NVIDIA率先引入了Tesla通用GPU计算架构,其最终目的是将CPU和GPU合二为一,然而NVIDIA并没有CPU的研发历史,在整合的道路上遇到了重重困难。另一方面,AMD又计划推出内建GPU核心的Fusion处理器,而Intel整合GPU的Nehalem处理器将与之正面交火,各大计算机巨头的行为似乎在预示处理器将全面进入整合GPU时代。 展开更多
关键词 中央处理器 图形处理器 整合
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部