期刊文献+
共找到159篇文章
< 1 2 8 >
每页显示 20 50 100
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:4
1
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理器硬件性能计数器 复用技术 性能分析 性能计算 估计方法
下载PDF
OpenRISC处理器内的性能计数器的设计和实现
2
作者 吴睍 祝永新 《微电子学与计算机》 CSCD 北大核心 2009年第11期34-38,42,共6页
性能计数器(Performance Counter)位于处理器内部,负责对特定触发事件进行计数,可以实时反馈处理器内部性能参数.OpenRISC 1200是一种免费的开源处理器核.通过处理器内部设计在OpenRISC 1200处理器核内设计实现了可配置性能计数器单元.... 性能计数器(Performance Counter)位于处理器内部,负责对特定触发事件进行计数,可以实时反馈处理器内部性能参数.OpenRISC 1200是一种免费的开源处理器核.通过处理器内部设计在OpenRISC 1200处理器核内设计实现了可配置性能计数器单元.并基于该新处理器核建立了SOPC系统,在FPGA上验证了新核的应用和性能计数器单元的功能. 展开更多
关键词 性能计数器 OpenRISC FPGA 处理器内部设计
下载PDF
一种基于硬件计数器的虚拟机性能干扰估算方法 被引量:7
3
作者 王卅 张文博 +4 位作者 吴恒 宋云奎 魏峻 钟华 黄涛 《软件学报》 EI CSCD 北大核心 2015年第8期2074-2090,共17页
虚拟化技术已成为云计算平台中的关键性支撑技术.它极大地提高了数据中心的资源利用率,降低了管理成本和能源消耗,但同时也为数据中心带来了新的问题——性能干扰.同一平台上的多虚拟机过度竞争某一底层硬件资源(如CPU,Cache等),会造成... 虚拟化技术已成为云计算平台中的关键性支撑技术.它极大地提高了数据中心的资源利用率,降低了管理成本和能源消耗,但同时也为数据中心带来了新的问题——性能干扰.同一平台上的多虚拟机过度竞争某一底层硬件资源(如CPU,Cache等),会造成虚拟机性能严重下降;而出于安全性和可移植性的考虑,底层平台管理者需要尽量避免侵入式监测上层虚拟机,因而,如何透明而有效地从底层估算虚拟机性能干扰,成为虚拟化平台管理者必须面临的一个挑战.为应对以上挑战,提出了一种基于硬件计数器的虚拟机性能干扰估算方法.硬件计数器是程序运行期间产生的硬件事件信息(如CPU时间片、缓存失效次数等),已有工作主要利用大规模分布式系统任务相似性查找产生异常硬件计数器数据的节点,而没有探究硬件事件变化与性能干扰之间的直接关系.通过实验研究发现,硬件计数器(last level cache misses rates,简称LLC misses rates)与不同资源需求的应用性能干扰存在不同的关联关系;以此建立虚拟机性能干扰估算模型,估算虚拟机性能.实验结果表明:该方法可以有效地预测CPU密集型应用和网络密集型应用的性能干扰大小,并仅为系统带来小于10%的开销. 展开更多
关键词 云计算 虚拟化 性能干扰 硬件计数器 性能建模
下载PDF
硬件加速对处理器性能提高的探索
4
作者 刘超 刘召庆 +2 位作者 雒俊 赵博 张丹惠 《中国军转民》 2017年第4期56-57,共2页
FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)三种信号处理技术被广泛应用于硬件加速器的实现上。硬件加速器能减轻CPU的负担,潜在的提升处理器的计算吞吐率,一般认为其效能至少不低于CPU效能的2倍。本文以某型DSP处理... FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)三种信号处理技术被广泛应用于硬件加速器的实现上。硬件加速器能减轻CPU的负担,潜在的提升处理器的计算吞吐率,一般认为其效能至少不低于CPU效能的2倍。本文以某型DSP处理器处理模拟量输入系统为例,说明硬件加速器在这方面的应用。 展开更多
关键词 硬件加速器 处理器性能 有限冲激响应 模拟量输入 飞行器控制系统 变换处理 编码算法 快速傅里叶变换 处理器 实序列
下载PDF
一个基于硬件计数器的程序性能测试与分析工具 被引量:3
5
作者 车永刚 王正华 李晓梅 《计算机科学》 CSCD 北大核心 2004年第1期170-174,共5页
在IntelP6系列处理器与Microsoft Windows NT平台上开发了一个工具软件PTracker,它利用处理器中的硬件性能计数器来获取程序性能数据,并结合机器体系结构参数对数据进行分析。它无需用户编程,与应用程序所使用的编程语言无关,使用很方... 在IntelP6系列处理器与Microsoft Windows NT平台上开发了一个工具软件PTracker,它利用处理器中的硬件性能计数器来获取程序性能数据,并结合机器体系结构参数对数据进行分析。它无需用户编程,与应用程序所使用的编程语言无关,使用很方便。它不仅能够通过性能计数器获得精确的性能参数,而且还能通过对测试得到的性能数据的分析,揭示程序高层次的性能特征,对程序性能评价与优化具有一定的指导作用。本文介绍了PTracker的技术背景、设计与系统实现,并给出了一个应用实例。 展开更多
关键词 硬件计数器 处理器 程序性能 性能测试 数据分析
下载PDF
基于硬件性能计数器的软件性能数据采集与分析研究 被引量:3
6
作者 程克非 张聪 +1 位作者 汪林林 张勤 《计算机应用》 CSCD 北大核心 2005年第10期2431-2433,共3页
引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非... 引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非常有效的分析数据,同时也在一定程度上对编译器的性能优化给出了相关参考数据。 展开更多
关键词 数据采集 硬件性能计数器 性能分析
下载PDF
性能不对称多核处理器负载均衡调度研究 被引量:2
7
作者 徐远超 谭旭 +2 位作者 范灵俊 孙卫真 张志敏 《计算机工程与科学》 CSCD 北大核心 2013年第11期80-86,共7页
同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载... 同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载均衡优先原则,无需定义阈值区分程序类别。测试结果表明,该算法既能做到负载均衡,又能实现异构感知。 展开更多
关键词 调度 异构多核处理器 负载均衡 程序行为分析 硬件性能计数器
下载PDF
ROPDetector:一种基于硬件性能计数器的ROP攻击实时检测方法 被引量:6
8
作者 牛伟纳 赵成洋 +3 位作者 张小松 黄晓祥 蒋廉 张钶旋 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期761-772,共12页
面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器... 面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器支持)和二进制重写的情况下,利用现代CPU中的硬件性能计数器监控目标程序执行过程,提取ROP攻击发生时底层硬件事件特征来实时检测ROP攻击.然后,在32位Linux实验环境下实现了原型系统ROPDetector,使用真实的ROP攻击与漏洞进行实验,并与同类方法进行了对比实验,最后评估了系统的性能消耗.实验结果表明,该方法能有效地检测真实的ROP攻击,在分别以6次和9次错误预测返回指令为检测周期时,系统性能消耗仅有5.05%和5.25%,磁盘I/O性能消耗仅有0.94%和2%,网络I/O性能消耗仅有0.06%和0.78%. 展开更多
关键词 面向返回编程 硬件事件 实时检测 硬件性能计数器 错误预测返回指令
下载PDF
利用硬件加速器提高处理器的性能 被引量:1
9
作者 Paul Beckmann 《今日电子》 2008年第11期37-38,共2页
处理器内部集成的硬件加速器可以实现三种广泛使用的信号处理操作:FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)。硬件加速器减轻了核处理器的负担,能潜在的提升处理器的计算吞吐率超过两倍。本文以下一代音频... 处理器内部集成的硬件加速器可以实现三种广泛使用的信号处理操作:FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)。硬件加速器减轻了核处理器的负担,能潜在的提升处理器的计算吞吐率超过两倍。本文以下一代音频系统为例,说明硬件加速器在这方面的应用。 展开更多
关键词 处理器 加速器 硬件 快速傅里叶变换 性能 有限冲激响应 无限冲激响应 信号处理
下载PDF
乱序超标量处理器核的性能分析与优化 被引量:1
10
作者 孙彩霞 隋兵才 +4 位作者 王蕾 王永文 黄立波 李文哲 王俊辉 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第5期14-19,共6页
随着处理器微体系结构日益复杂,性能分析在处理器研制过程中的作用越来越重要。常用的性能分析方法是建立性能模型,该方法主要用于研制初期的设计空间探索,如果用于微体系结构级的分析和优化,速度和精度都会成为限制因素。因此,提出一... 随着处理器微体系结构日益复杂,性能分析在处理器研制过程中的作用越来越重要。常用的性能分析方法是建立性能模型,该方法主要用于研制初期的设计空间探索,如果用于微体系结构级的分析和优化,速度和精度都会成为限制因素。因此,提出一种基于计数器的性能分析方法,该方法以项目组已经完成的一款处理器核的硬件实现代码为基础,在处理器核外部添加一个专用性能监测单元,收集微体系结构分析和优化需要的各种事件,并通过结果分析器对统计的事件进行分析,得到微体系结构实现的性能受限因素。采用此方法,在现场可编程门阵列原型系统上对SPEC CPU2000测试程序运行时的性能受限因素进行分析,并根据分析结果采取相应的优化措施,优化后的处理器核性能得到了明显提升。 展开更多
关键词 性能分析 计数器 处理器 微体系结构
下载PDF
基于硬件性能计数器的编译器性能测试与分析 被引量:2
11
作者 朱艳玲 朱怡安 王云岚 《微电子学与计算机》 CSCD 北大核心 2008年第3期193-196,共4页
Itanium 2处理器提供的性能监控单元实现了在程序运行过程中捕捉微结构事件的功能.利用GNU Gcc、Intel Icc和HP-Opencc编译器的不同优化选项编译并运行SPEC2006基准程序.通过CPU硬件计数器(HPCs)采集的性能数据,了解特定程序特征,分析... Itanium 2处理器提供的性能监控单元实现了在程序运行过程中捕捉微结构事件的功能.利用GNU Gcc、Intel Icc和HP-Opencc编译器的不同优化选项编译并运行SPEC2006基准程序.通过CPU硬件计数器(HPCs)采集的性能数据,了解特定程序特征,分析比较编译器性能差异,对HP-Opencc编译器的性能优化给出相关参考数据.实验表明HP-Opencc编译器的的分支预测优化技术可再改进. 展开更多
关键词 HP—Opencc 硬件性能计数器 Intd VTune 性能测试 性能分析
下载PDF
基于硬件性能计数器的恶意软件检测技术综述 被引量:1
12
作者 户彦飞 文雨 《计算机科学与应用》 2022年第12期2896-2909,共14页
随着各种任务交由计算机系统或移动设备处理,大量应用软件走进人们的生活,与之而来的是恶意软件越来越多。对此,主流的恶意软件检测技术弊端凸显,基于硬件性能计数器的恶意软件检测以其独特的优势在安全领域越来越广。据此,本文首先介... 随着各种任务交由计算机系统或移动设备处理,大量应用软件走进人们的生活,与之而来的是恶意软件越来越多。对此,主流的恶意软件检测技术弊端凸显,基于硬件性能计数器的恶意软件检测以其独特的优势在安全领域越来越广。据此,本文首先介绍了当前恶意软件的组成及攻防趋势,然后讨论了基于硬件性能计数器的恶意软件检测技术的基本模块,并在此基础上对各项技术中的难点问题进行了阐释,接着梳理了基于硬件性能计数器的恶意软件检测技术的研究现状,最后对其未来发展趋势进行了总结和展望。 展开更多
关键词 恶意软件 硬件性能计数器 恶意软件检测
下载PDF
基于System C的多处理器片上系统软硬件协同仿真
13
作者 吴伟 朱樟明 《电子质量》 2004年第8期60-62,84,共4页
给出了基于SystemC的处理器片上系统(System On a Chip)的协同仿真的两种方法。并通过对系统的仿真,对两个方法进行了对比,给出了在仿真间隔时间、速度和其他性能之间的比较。对目前SOC的软硬件协同设计验证有一定的实际意义。
关键词 片上系统 硬件协同仿真 SOC 硬件协同设计 处理器 验证 性能 速度
下载PDF
Cyclone II FPGA和Nios II嵌入式处理器具有低成本性能优势 被引量:1
14
作者 Gordon Pocock 《单片机与嵌入式系统应用》 2005年第4期84-85,共2页
关键词 嵌入式处理器 FPGA 硬件性能 软核 逻辑单元 逻辑密度 器件 性能优势 同类 低成本
下载PDF
高性能计算处理器进展
15
作者 季冬 《中国教育网络》 2013年第11期33-34,共2页
如何从软件和硬件两个方面来实现一个可靠和稳定的高性能计算机,是当前面临的主要问题。
关键词 性能计算机 处理器 硬件 软件
下载PDF
基于RISC-V的新型硬件性能计数器
16
作者 薛子涵 解达 宋威 《计算机系统应用》 2021年第11期3-10,共8页
经过多年的发展, X86架构与ARM架构的处理器逐渐分别占据了桌面端和移动端市场的主导地位.虽然无论从技术角度还是从生态体系方面,这两类架构的处理器性能越来越高,但是由于其指令集臃肿、技术复杂、授权困难等原因,使得开发这两类架构... 经过多年的发展, X86架构与ARM架构的处理器逐渐分别占据了桌面端和移动端市场的主导地位.虽然无论从技术角度还是从生态体系方面,这两类架构的处理器性能越来越高,但是由于其指令集臃肿、技术复杂、授权困难等原因,使得开发这两类架构的处理器的门槛较高.研究院所还没有一个合适的指令集用于体系结构的研究和创新. RISC-V指令集的开源使得这一局面得以缓解.其具备精简、开源、敏捷开发等特点引起了工业界与学术界的广泛关注与积极参与.性能计数器(Hardware Performance Counter, HPC)是处理器研究和性能调优的重要工具.由于RISC-V制定的标准性能计数器的可拓展性欠佳、可同时捕获事件的数量有限等不足,本文提出一种新的基于RISC-V的分布式硬件性能计数器.本文使用Genesys2开发板作为实验平台,将这种性能计数器适配到lowRISC-v0.4开源SoC项目上,完成了对该设计方案的验证与评估.该性能计数器只占用3个控制状态寄存器(Control and Status Registers, CSRs)就可以同时捕获比标准的性能计数器多近乎一个数量级的事件,在RISC-V处理器的性能分析、结构优化、侧信道攻防等方面为研究者提供了翔实的统计数据. 展开更多
关键词 RISC-V 分布式硬件性能计数器 控制状态寄存器
下载PDF
德州仪器新型OMAP2处理器使视频性能提高4倍
17
《单片机与嵌入式系统应用》 2006年第1期87-88,共2页
OMAP2430采用TI最新一代影像与音视频加速器IVA2,是TI近期宣布推出的达芬奇(DaVinci)信号处理器技术的功率优化型版本。IVA2加速器使视频性能提高了4倍,影像性能提高了L5倍,用户可明显感到移动电话的视频与影像变得比目前更加清晰... OMAP2430采用TI最新一代影像与音视频加速器IVA2,是TI近期宣布推出的达芬奇(DaVinci)信号处理器技术的功率优化型版本。IVA2加速器使视频性能提高了4倍,影像性能提高了L5倍,用户可明显感到移动电话的视频与影像变得比目前更加清晰锐利。 展开更多
关键词 德州仪器公司 OMAP2处理器 视频性能 IVA2加速器 图形硬件加速功能
下载PDF
基于图形处理器(GPU)的通用计算 被引量:227
18
作者 吴恩华 柳有权 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第5期601-612,共12页
伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年... 伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年来 ,随着图形处理器 (GPU)性能的大幅度提高以及可编程特性的发展 ,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移 除了计算机图形学本身的应用 ,涉及到其他领域的计算 ,以至于通用计算近 2~ 3年来成为GPU的应用之一 ,并成为研究热点 文中从若干图形硬件发展的历史开始 ,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况 。 展开更多
关键词 图形处理器 通用计算 GPU 图形硬件 可编程性 代数运算 性能分析
下载PDF
使用性能计数器监视Windows Server根据基准来测量四个关键的服务器硬件组件
19
作者 Tom Carpenter 老田(译者) 《Windows IT Pro Magazine(国际中文版)》 2010年第1期30-33,共4页
使用10个性能计数器来跟踪Windows Server2003R2和Windows Server2003系统的核心性能因素。 如果你希望你的服务器能以最佳的性能运行,WindowsServer内置的性能监测与分析工具可以让你通过监视当前的性能信息和记录某个时间段的信息... 使用10个性能计数器来跟踪Windows Server2003R2和Windows Server2003系统的核心性能因素。 如果你希望你的服务器能以最佳的性能运行,WindowsServer内置的性能监测与分析工具可以让你通过监视当前的性能信息和记录某个时间段的信息,以了解问题所在,为改善性能提供依据。 展开更多
关键词 SERVER2003 WINDOWS 使用性能 计数器 服务器 组件 硬件 测量
下载PDF
挖矿、渲染、转码都必须行 高性能工作站如何选择处理器?
20
作者 马宇川(文/图) 《微型计算机》 2020年第24期94-96,共3页
对于专业人士而言,要想高效地完成工作,一台高性能的个人工作站显然必不可少。不过一台工作站往往由定位高端、价值不菲的各类配件组成,而在众多高端硬件中百里挑一并不是一件容易的事,尤其是要选出在工作站中起到性能决定作用的处理器... 对于专业人士而言,要想高效地完成工作,一台高性能的个人工作站显然必不可少。不过一台工作站往往由定位高端、价值不菲的各类配件组成,而在众多高端硬件中百里挑一并不是一件容易的事,尤其是要选出在工作站中起到性能决定作用的处理器,更是颇有难度。那么用户应如何选择才能保证工作站的“心脏”可以释放出最大的能量,自己的投资能得到最大的回报呢? 展开更多
关键词 性能工作站 处理器 渲染 专业人士 硬件
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部