期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
大规模多串匹配算法的访存行为分析 被引量:1
1
作者 陈小军 张志斌 +1 位作者 刘燕兵 郭莉 《计算机工程与应用》 CSCD 北大核心 2007年第26期106-109,共4页
随着网络带宽的日益增长,病毒和非法信息的形式越来越多,网络安全系统处理的压力越来越大。多串匹配算法作为大部分网络安全系统中的核心扫描部分其性能尤为重要。从微处理器体系结构的角度,用模拟的方法分析了SBOM、AC、WM等三种精确... 随着网络带宽的日益增长,病毒和非法信息的形式越来越多,网络安全系统处理的压力越来越大。多串匹配算法作为大部分网络安全系统中的核心扫描部分其性能尤为重要。从微处理器体系结构的角度,用模拟的方法分析了SBOM、AC、WM等三种精确多串匹配算法在大规模规则库的情况下,其性能影响的各种因素,特别是其访存行为特征,并从算法原理上解释了访存性为是如何被影响的。指出当规则库规模增到5000时,由Cache失效引起的性能损失占全部开销的近10%,而且比重随着规则库规模增大而继续变大。 展开更多
关键词 多串匹配 网络安全 访存行为 Cache失效
下载PDF
一种软硬件结合的大数据访存踪迹收集分析工具集
2
作者 李作骏 潘海洋 +1 位作者 陈明宇 包云岗 《大数据》 2019年第4期41-49,共9页
以Spark为代表的内存计算框架的兴起、新型非易失性内存研究的逐步深入以及数据安全形势的日益严峻,使得现有的访存行为分析工具无法满足对大数据应用访存行为进行分析的需求。提出了一种软硬件结合的大数据访存踪迹收集分析工具集,在... 以Spark为代表的内存计算框架的兴起、新型非易失性内存研究的逐步深入以及数据安全形势的日益严峻,使得现有的访存行为分析工具无法满足对大数据应用访存行为进行分析的需求。提出了一种软硬件结合的大数据访存踪迹收集分析工具集,在由硬件收集的基本访存踪迹的基础上,结合软件信息同步及离线标注的方式,可以高速、准确、无失真地获取具备丰富语义信息的访存行为信息,且为大数据访存的实时安全监控提供了一种实现方式。最后,通过实验对一组真实的大数据应用进行了访存踪迹采集和分析。 展开更多
关键词 访踪迹 访存行为 大数据
下载PDF
面向大数据应用的众核处理器缓存结构设计 被引量:3
3
作者 万虎 徐远超 +1 位作者 孙凤芸 闫俊峰 《计算机工程与科学》 CSCD 北大核心 2015年第1期28-35,共8页
大规模数据排序、搜索引擎、流媒体等大数据应用在面向延迟的多核/众核处理器上运行时资源利用率低下,一级缓存命中率高,二级/三级缓存命中率低,LLC容量的增加对IPC的提升并不明显。针对缓存资源利用率低的问题,分析了大数据应用的访存... 大规模数据排序、搜索引擎、流媒体等大数据应用在面向延迟的多核/众核处理器上运行时资源利用率低下,一级缓存命中率高,二级/三级缓存命中率低,LLC容量的增加对IPC的提升并不明显。针对缓存资源利用率低的问题,分析了大数据应用的访存行为特点,提出了针对大数据应用的两种众核处理器缓存结构设计方案,两种结构均只有一级缓存,Share结构为完全共享缓存,Partition结构为部分共享缓存。评估结果表明,两种方案在访存延迟增加不多的前提下能大幅节省芯片面积,其中缓存容量较低时,Partition结构优于Share结构,缓存容量较高时,Share结构要逐渐优于Partition结构。由于众核处理器中分配到每个处理器核的容量有限,因此Partition结构有一定的优势。 展开更多
关键词 众核处理器 大数据应用 设计 访存行为 数据中心
下载PDF
基于硬件的内存trace工具--MTT的设计与实现 被引量:2
4
作者 阮元 包云岗 +1 位作者 陈明宇 樊建平 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1519-1525,共7页
本文提出了一种全新的获得访存trace的方式,并设计实现了基于硬件的零开销多平台实时访存Trace工具——MTT(Memory Trace Tool).详细介绍了MTT在采样配置、地址识别t、race输出等方面的设计细节,以及接收端配合MTT高效接收分析trace的流... 本文提出了一种全新的获得访存trace的方式,并设计实现了基于硬件的零开销多平台实时访存Trace工具——MTT(Memory Trace Tool).详细介绍了MTT在采样配置、地址识别t、race输出等方面的设计细节,以及接收端配合MTT高效接收分析trace的流程,实现了一个通过MTT获得程序访存trace的完整方案.相比已有方法,MTT具有许多特点:(1)对程序透明;(2)零开销,无内存污染问题;(3)实时获取完整的全系统访存Trace;(4)可实时配置的多种在线Trace分析手段;(5)具有操作系统平台无关性. 展开更多
关键词 访轨迹 插桩 访存行为分析 现场可编程门阵列(FPGA)
下载PDF
基于TVM平台的MEC卷积算法优化
5
作者 王朝闻 蒋林 +1 位作者 李远成 朱筠 《计算机工程与应用》 CSCD 北大核心 2023年第1期180-186,共7页
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部... 针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部分,采用修改数据读取顺序的方式对其进行优化,使读取方式符合算法的访存行为。对于矩阵运算部分,采用更加适合矩阵运算的内存数据布局对卷积核矩阵修改,并利用TVM(tensor virtual machine)平台封装的计算函数,重新设计中间矩阵同卷积核矩阵的计算方式。使用平台自带并行库对运算过程进行加速。实验结果表明,相比传统MEC算法,提出的优化方法可以有效解决缓存命中率低、内存访问延时长等问题,同MEC算法的运算时间对比,在单个卷积层上平均获得了50%的速度提升,在多层神经网络中最低获得了57%以上的速度提升,同空间组合算法的运算时间对比,最高获得了80%的速度提升。 展开更多
关键词 卷积计算 访存行为 技术 MEC算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部