期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于硬件性能计数器的软件性能数据采集与分析研究 被引量:3
1
作者 程克非 张聪 +1 位作者 汪林林 张勤 《计算机应用》 CSCD 北大核心 2005年第10期2431-2433,共3页
引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非... 引入了基于CPU硬件性能计数器的性能数据采集和分析方法,从软件运行时刻的细粒度参数入手分析软件运行时刻的性能表现,从而更为准确地反映系统实际的动态运行状态。实验证明,这种方法对于需要详细掌握系统动态运行状态的应用能够提供非常有效的分析数据,同时也在一定程度上对编译器的性能优化给出了相关参考数据。 展开更多
关键词 数据采集 硬件性能计数器 性能分析
下载PDF
ROPDetector:一种基于硬件性能计数器的ROP攻击实时检测方法 被引量:6
2
作者 牛伟纳 赵成洋 +3 位作者 张小松 黄晓祥 蒋廉 张钶旋 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期761-772,共12页
面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器... 面向返回编程(Return-Oriented Programming,ROP)是针对软件漏洞利用最广泛的攻击技术之一,能够绕过数据执行保护、地址空间布局随机化等防御机制.本文提出了一种基于硬件的ROP攻击实时检测方法,在不需要任何边缘信息(如源代码、编译器支持)和二进制重写的情况下,利用现代CPU中的硬件性能计数器监控目标程序执行过程,提取ROP攻击发生时底层硬件事件特征来实时检测ROP攻击.然后,在32位Linux实验环境下实现了原型系统ROPDetector,使用真实的ROP攻击与漏洞进行实验,并与同类方法进行了对比实验,最后评估了系统的性能消耗.实验结果表明,该方法能有效地检测真实的ROP攻击,在分别以6次和9次错误预测返回指令为检测周期时,系统性能消耗仅有5.05%和5.25%,磁盘I/O性能消耗仅有0.94%和2%,网络I/O性能消耗仅有0.06%和0.78%. 展开更多
关键词 面向返回编程 硬件事件 实时检测 硬件性能计数器 错误预测返回指令
下载PDF
基于硬件性能计数器的编译器性能测试与分析 被引量:2
3
作者 朱艳玲 朱怡安 王云岚 《微电子学与计算机》 CSCD 北大核心 2008年第3期193-196,共4页
Itanium 2处理器提供的性能监控单元实现了在程序运行过程中捕捉微结构事件的功能.利用GNU Gcc、Intel Icc和HP-Opencc编译器的不同优化选项编译并运行SPEC2006基准程序.通过CPU硬件计数器(HPCs)采集的性能数据,了解特定程序特征,分析... Itanium 2处理器提供的性能监控单元实现了在程序运行过程中捕捉微结构事件的功能.利用GNU Gcc、Intel Icc和HP-Opencc编译器的不同优化选项编译并运行SPEC2006基准程序.通过CPU硬件计数器(HPCs)采集的性能数据,了解特定程序特征,分析比较编译器性能差异,对HP-Opencc编译器的性能优化给出相关参考数据.实验表明HP-Opencc编译器的的分支预测优化技术可再改进. 展开更多
关键词 HP—Opencc 硬件性能计数器 Intd VTune 性能测试 性能分析
下载PDF
基于硬件性能计数器的恶意软件检测技术综述 被引量:1
4
作者 户彦飞 文雨 《计算机科学与应用》 2022年第12期2896-2909,共14页
随着各种任务交由计算机系统或移动设备处理,大量应用软件走进人们的生活,与之而来的是恶意软件越来越多。对此,主流的恶意软件检测技术弊端凸显,基于硬件性能计数器的恶意软件检测以其独特的优势在安全领域越来越广。据此,本文首先介... 随着各种任务交由计算机系统或移动设备处理,大量应用软件走进人们的生活,与之而来的是恶意软件越来越多。对此,主流的恶意软件检测技术弊端凸显,基于硬件性能计数器的恶意软件检测以其独特的优势在安全领域越来越广。据此,本文首先介绍了当前恶意软件的组成及攻防趋势,然后讨论了基于硬件性能计数器的恶意软件检测技术的基本模块,并在此基础上对各项技术中的难点问题进行了阐释,接着梳理了基于硬件性能计数器的恶意软件检测技术的研究现状,最后对其未来发展趋势进行了总结和展望。 展开更多
关键词 恶意软件 硬件性能计数器 恶意软件检测
下载PDF
基于数据分布一致性的处理器硬件性能计数器复用估计方法 被引量:4
5
作者 林新华 王杰 +1 位作者 王一超 左思成 《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1192-1201,共10页
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,M... 同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%. 展开更多
关键词 处理器硬件性能计数器 复用技术 性能分析 性能计算 估计方法
下载PDF
基于RISC-V的新型硬件性能计数器
6
作者 薛子涵 解达 宋威 《计算机系统应用》 2021年第11期3-10,共8页
经过多年的发展, X86架构与ARM架构的处理器逐渐分别占据了桌面端和移动端市场的主导地位.虽然无论从技术角度还是从生态体系方面,这两类架构的处理器性能越来越高,但是由于其指令集臃肿、技术复杂、授权困难等原因,使得开发这两类架构... 经过多年的发展, X86架构与ARM架构的处理器逐渐分别占据了桌面端和移动端市场的主导地位.虽然无论从技术角度还是从生态体系方面,这两类架构的处理器性能越来越高,但是由于其指令集臃肿、技术复杂、授权困难等原因,使得开发这两类架构的处理器的门槛较高.研究院所还没有一个合适的指令集用于体系结构的研究和创新. RISC-V指令集的开源使得这一局面得以缓解.其具备精简、开源、敏捷开发等特点引起了工业界与学术界的广泛关注与积极参与.性能计数器(Hardware Performance Counter, HPC)是处理器研究和性能调优的重要工具.由于RISC-V制定的标准性能计数器的可拓展性欠佳、可同时捕获事件的数量有限等不足,本文提出一种新的基于RISC-V的分布式硬件性能计数器.本文使用Genesys2开发板作为实验平台,将这种性能计数器适配到lowRISC-v0.4开源SoC项目上,完成了对该设计方案的验证与评估.该性能计数器只占用3个控制状态寄存器(Control and Status Registers, CSRs)就可以同时捕获比标准的性能计数器多近乎一个数量级的事件,在RISC-V处理器的性能分析、结构优化、侧信道攻防等方面为研究者提供了翔实的统计数据. 展开更多
关键词 RISC-V 分布式硬件性能计数器 控制状态寄存器
下载PDF
HBROP:基于硬件性能计数器的函数级ROP检测 被引量:3
7
作者 严飞 彭慧容 +1 位作者 何凡 黄凡 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2017年第2期109-116,共8页
ROP(return oriented programming)能够绕过数据执行保护,并结合内存泄漏和暴力破解突破ASLR等现有系统防御机制,具有极大危害,为此本文基于ROP shellcode不满足时间和空间局部性原理,会影响分支预测不命中、缓存命中率等性能事件值的现... ROP(return oriented programming)能够绕过数据执行保护,并结合内存泄漏和暴力破解突破ASLR等现有系统防御机制,具有极大危害,为此本文基于ROP shellcode不满足时间和空间局部性原理,会影响分支预测不命中、缓存命中率等性能事件值的现象,提出了一种利用硬件性能计数器(hardware performance counters,HPCs)进行的ROP检测方法 HBROP,该方法分为离线预处理和动态监控两个阶段.在离线预处理阶段收集并存储所有函数正常的性能事件值,在动态监控阶段监测程序执行,在调用敏感系统函数前检测同一函数相同性能事件值是否异常变化.基于该方法,本文实现了一个HBROP的实验系统,实验表明,本文所选取的8个性能事件具有较好的ROP检测特征;本文的方法,与同类工作相比较,性能开销在可接受范围内. 展开更多
关键词 ROP 分支预测不命中 缓存命中率 硬件性能计数器
原文传递
基于采样的并行程序性能测量分析工具研究
8
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
下载PDF
性能不对称多核处理器负载均衡调度研究 被引量:3
9
作者 徐远超 谭旭 +2 位作者 范灵俊 孙卫真 张志敏 《计算机工程与科学》 CSCD 北大核心 2013年第11期80-86,共7页
同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载... 同等面积条件下,性能不对称异构多核处理器比同构多核处理器具有更好的性能功耗比,重要前提是操作系统要能够进行合理的任务调度。针对已有算法的不足,基于Linux现有调度框架提出了一种全面的异构感知负载均衡策略,保证了处理器核负载均衡优先原则,无需定义阈值区分程序类别。测试结果表明,该算法既能做到负载均衡,又能实现异构感知。 展开更多
关键词 调度 异构多核处理器 负载均衡 程序行为分析 硬件性能计数器
下载PDF
基于动态指令编译的软件性能分析方法
10
作者 程克非 张聪 +1 位作者 张勤 汪林林 《计算机科学》 CSCD 北大核心 2006年第4期292-294,F0003,共4页
进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译... 进行精确的软件性能分析,需要在代码中插入测量和控制代码,并根据具体运行状态动态的检查多个不同的参数。但是,用静态类型的程序语言,如 C 语言等书写的代码,一经编译和链接,其处理逻辑即不可更改。因此,在无法获取源代码或者重新编译和重新启动代价较高的应用中,对软件进行动态性能分析非常困难。本文将介绍一种在软件运行时刻动态插入监控点的动态指令编译技术对软件进行监控,从而在上述情况下达到对软件的监控目的。这种方法是基于 DynInst API 和 PAPI 技术的。实验表明,这种方法在去掉了对源代码的依赖的情况下,仍然与在源代码级插入监控点的方法具有同等的采集效率,在很大程度上增强了基于硬件性能计数器方法的软件监控技术的应用范围,达到了较好的性能分析效果。 展开更多
关键词 动态指令编译 性能分析 Dyninst API PAPI 硬件性能计数器
下载PDF
Pview:一种基于PMU的支持并行程序性能分析的新方法 被引量:4
11
作者 闫洁 徐恒阳 +2 位作者 安虹 刘玉 王耀彬 《计算机科学》 CSCD 北大核心 2011年第2期288-292,共5页
近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对... 近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。 展开更多
关键词 硬件性能计数器 性能监测 多线程程序分析
下载PDF
智能网卡驱动程序的性能评价 被引量:4
12
作者 刘勇 杨卫兵 +1 位作者 陈曜 孙凝晖 《计算机工程》 EI CAS CSCD 北大核心 2005年第14期42-44,47,共4页
通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡... 通信网络对机群系统的性能影响很大,建立高效的通信网络依赖快速网络硬件支持。智能网卡用于机群的快速接入,提高了Internet应用的性能,其中驱动程序是发挥智能网卡能力的关键,因而对驱动程序的性能评价很有必要。性能评价利用智能网卡提供的硬件性能计数器,采用性能测试法对智能网卡驱动程序进行性能分析。结果表明智能网卡驱动程序的性能瓶颈在于驱动程序较大的数据相关性。 展开更多
关键词 智能网卡 性能评价 硬件性能计数器
下载PDF
基于HPC的网络安全应用研究综述
13
作者 王珏 朱俊虎 杨铠铭 《信息工程大学学报》 2024年第3期338-342,357,共6页
随着网络安全技术的发展,基于硬件的网络安全解决方案受到广泛关注和研究。近年来,使用硬件性能计数器(Hardware Performance Counter,HPC)检测恶意软件的研究不断出现,并发展到控制流完整性检测和侧信道攻击检测等领域。对基于HPC的网... 随着网络安全技术的发展,基于硬件的网络安全解决方案受到广泛关注和研究。近年来,使用硬件性能计数器(Hardware Performance Counter,HPC)检测恶意软件的研究不断出现,并发展到控制流完整性检测和侧信道攻击检测等领域。对基于HPC的网络安全技术进行了研究总结。首先概述了现有基于HPC的网络空间安全应用相关技术方案;其次对基于HPC的网络安全应用技术方法进行了分类,总结了其特点和适用场景;最后讨论了HPC安全研究的发展趋势和仍需解决的挑战。 展开更多
关键词 硬件性能计数器 网络空间安全 恶意软件检测 控制流完整性
下载PDF
基于机器学习的多目标缓存侧信道攻击检测模型 被引量:1
14
作者 姚梓豪 栗远明 +2 位作者 马自强 李扬 魏良根 《计算机应用》 CSCD 北大核心 2024年第6期1862-1871,共10页
当前缓存侧信道攻击检测技术主要针对单一攻击模式,对2~3种攻击的检测方法有限,无法全面覆盖;此外,尽管对单一攻击的检测精度高,但随着攻击数增加,精度下降,容易产生误报。为了有效检测缓存侧信道攻击,利用硬件性能计数器(HPC)采集不同... 当前缓存侧信道攻击检测技术主要针对单一攻击模式,对2~3种攻击的检测方法有限,无法全面覆盖;此外,尽管对单一攻击的检测精度高,但随着攻击数增加,精度下降,容易产生误报。为了有效检测缓存侧信道攻击,利用硬件性能计数器(HPC)采集不同的缓存侧信道攻击特征,结合机器学习算法,提出一种基于机器学习的多目标缓存侧信道攻击检测模型。首先,分析不同缓存侧信道攻击方式的相关特征,精选关键特征并收集数据集;其次,进行独立的训练,建立针对每种攻击方式的检测模型;最后,在检测时将测试数据并行送入多个模型中,根据检测结果判断是否存在某种缓存侧信道攻击。实验结果显示,所提模型在检测Flush+Reload、Flush+Flush和Prime+Probe这3种缓存侧信道攻击时,分别达到99.91%、98.69%和99.54%的高准确率,即使在同时存在多种攻击的情况下,也能准确识别各种攻击方式。 展开更多
关键词 缓存侧信道攻击 缓存侧信道攻击检测 硬件性能计数器 特征分析 机器学习
下载PDF
基于系统调用监控的主动反勒索技术研究
15
作者 张雅勤 陈慧 马升 《工业信息安全》 2024年第4期19-31,共13页
勒索软件作为网络安全问题中最重要的威胁之一,给企业组织造成了严重的安全威胁和经济损失。传统的勒索软件检测方法往往基于静态分析,只能检测和处理已知的勒索软件,具有一定的局限性。随着勒索软件变种层出不穷,新型勒索软件不断出现... 勒索软件作为网络安全问题中最重要的威胁之一,给企业组织造成了严重的安全威胁和经济损失。传统的勒索软件检测方法往往基于静态分析,只能检测和处理已知的勒索软件,具有一定的局限性。随着勒索软件变种层出不穷,新型勒索软件不断出现,传统网络安全解决方案存在明显的滞后性、被动性及低效性,因此需要探索积极主动的反勒索防御方法。本文针对真实恶意勒索软件,以系统调用为切入点,根据勒索软件与良性软件运行时系统调用序列存在差异的特征,使用基于多层感知机的机器学习方法,实现对恶意勒索软件的检测。最终试验结果显示模型在测试集上的准确率达到82%。实验结果表明,该方法在恶意勒索软件检测方面具有较高的准确率。 展开更多
关键词 勒索软件检测 系统调用 硬件性能计数器 多层感知机
下载PDF
面向多核处理器系统的Cache感知调度算法
16
作者 徐远超 沈岩 +2 位作者 谭旭 万虎 张志敏 《小型微型计算机系统》 CSCD 北大核心 2013年第2期365-369,共5页
Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环... Cache空间的不公平使用和争用直接影响系统的整体性能,现有Linux操作系统的默认调度算法不能感知程序的行为,包括访问cache的失效次数,不了解线程之间访存模式和频度上可能存在的差异,因而无法做出更加合理的调度.本文提出并在Linux环境下实现了一种Cache感知的调度算法CAS,通过监测每个任务每千条指令的共享cache失效次数,把cache失效次数相近的任务聚合到同一个核上,使得cache失效次数差异较大的任务运行在不同的核上,避免了cache失效次数都很大的任务在不同的核上同时运行,从而减小了cache空间的不公平使用和争用.实验表明,CAS算法在大多数情况下,减少了整个负载的共享cache失效次数,提高系统的平均吞吐量约5%左右. 展开更多
关键词 任务调度 多核处理器 Cache感知 硬件性能计数器
下载PDF
基于HPC的虚拟化平台异常检测技术研究与实现 被引量:1
17
作者 邢凌凯 张健 《信息网络安全》 CSCD 北大核心 2023年第10期64-69,共6页
文章针对虚拟化平台异常行为检测问题提出一种基于硬件性能计数器(Hardware Performance Counter,HPC)和集成学习的动态检测方法。该方法基于KVM虚拟化平台,采集平台运行样本时的HPC值,按照随机森林(Random Forest,RF)学习时产生的特征... 文章针对虚拟化平台异常行为检测问题提出一种基于硬件性能计数器(Hardware Performance Counter,HPC)和集成学习的动态检测方法。该方法基于KVM虚拟化平台,采集平台运行样本时的HPC值,按照随机森林(Random Forest,RF)学习时产生的特征重要性分数进行特征筛选,提高RF分类模型的准确率,实现异常检测。文章在平台上采集了1040个良性程序样本和1040个恶意程序样本,在特征筛选阶段选取8个判断恶意样本的重要HPC事件。实验结果表明,特征筛选后的RF分类模型在测试集上可以达到95.38%的准确率,相较于特征筛选前的同类模型和其他传统机器学习模型具有更高的准确性和稳定性。 展开更多
关键词 异常行为检测 虚拟化 硬件性能计数器 集成学习
下载PDF
Characterizing big data analytics workloads on POWER8 SMT processors
18
作者 贾禛 Zhan Jianfeng +1 位作者 Wang Lei Zhang Lixin 《High Technology Letters》 EI CAS 2017年第3期245-251,共7页
Big data analytics is emerging as one kind of the most important workloads in modern data centers. Hence,it is of great interest to identify the method of achieving the best performance for big data analytics workload... Big data analytics is emerging as one kind of the most important workloads in modern data centers. Hence,it is of great interest to identify the method of achieving the best performance for big data analytics workloads running on state-of-the-art SMT( simultaneous multithreading) processors,which needs comprehensive understanding to workload characteristics. This paper chooses the Spark workloads as the representative big data analytics workloads and performs comprehensive measurements on the POWER8 platform,which supports a wide range of multithreading. The research finds that the thread assignment policy and cache contention have significant impacts on application performance. In order to identify the potential optimization method from the experiment results,this study performs micro-architecture level characterizations by means of hardware performance counters and gives implications accordingly. 展开更多
关键词 simultaneous multithreading(SMT) workloads characterization POWER8 big data analytics
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部