期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
P2P文件完整性校验延迟隐藏算法 被引量:4
1
作者 贺鹏程 王劲林 +1 位作者 邓浩江 孙鹏 《计算机工程》 CAS CSCD 北大核心 2010年第15期29-31,共3页
P2P下载中文件完整性校验会影响下载性能,针对该问题,提出一种校验延迟的隐藏算法。利用文件完整性校验中使用的哈希算法的流式特性和TCP异步接收缓冲区的特点,将大文件块的哈希计算分成多次对较小的子数据块的计算,收到一个子数据块后... P2P下载中文件完整性校验会影响下载性能,针对该问题,提出一种校验延迟的隐藏算法。利用文件完整性校验中使用的哈希算法的流式特性和TCP异步接收缓冲区的特点,将大文件块的哈希计算分成多次对较小的子数据块的计算,收到一个子数据块后,就开始计算哈希。由于计算每一个子数据块的哈希的时间开销很小,保证了计算延迟可以被TCP异步接收缓冲区所隐藏,使哈希计算与数据接收几乎可以并行进行,消除其对P2P文件下载性能的影响,提高了下载效率。 展开更多
关键词 P2P下载 文件校验 延迟隐藏 SHA1算法 MD4算法
下载PDF
流处理器延迟隐藏机制的优化及实现
2
作者 李礼 文梅 +2 位作者 伍楠 李海燕 张春元 《计算机工程与科学》 CSCD 2007年第3期74-76,共3页
流体系结构在新兴的高性能计算机体系结构中备受关注,通过多种技术途径,流处理器能广泛深入地挖掘程序各种并行性。本文首先介绍流处理器访存延迟隐藏的技术,然后引入“链接”思想以进一步优化访存延迟隐藏机制,最后讨论了“链接”机制... 流体系结构在新兴的高性能计算机体系结构中备受关注,通过多种技术途径,流处理器能广泛深入地挖掘程序各种并行性。本文首先介绍流处理器访存延迟隐藏的技术,然后引入“链接”思想以进一步优化访存延迟隐藏机制,最后讨论了“链接”机制在流处理器上的实现。 展开更多
关键词 流体系结构 延迟隐藏 链接
下载PDF
面向替换延迟隐藏的Cache空间预约技术
3
作者 张骏 田泽 +2 位作者 韩立敏 牛少平 裴希杰 《航空计算技术》 2020年第3期82-86,共5页
快速发展的集成电路制造工艺与相对滞后的设计技术形成的"存储墙"问题已经成为制约限制处理器潜在性能提升的主要障碍,构建高性能片上存储系统一直是处理器微体系结构研究的重要内容。提出Cache空间预约技术--CSPO,为片上Cach... 快速发展的集成电路制造工艺与相对滞后的设计技术形成的"存储墙"问题已经成为制约限制处理器潜在性能提升的主要障碍,构建高性能片上存储系统一直是处理器微体系结构研究的重要内容。提出Cache空间预约技术--CSPO,为片上Cache增加预约空间计数器POC,以及Cache行预约标志POT,使Cache替换目标选择与片外存储器访问并行执行,同时具备将POT标识为1的脏Cache数据行尽快提前写回的能力,从而在片外数据返回前提前完成Cache替换目标行选择和脏数据写回,并将替换目标Cache行地址存入专用寄存器中,数据返回后直接写入替换目标Cache行,从而有效隐藏Cache替换操作延迟、提升IPC。实验结果表明,CSPO技术能有效提升IPC性能,范围为2.46%~11.11%,平均为5.37%。 展开更多
关键词 微处理器 存储系统 CACHE 替换算法 延迟隐藏
下载PDF
基于集群平台的SAR成像算法多级通信延迟隐藏技术 被引量:1
4
作者 杜静 敖富江 +1 位作者 郭晋 周颖 《计算机工程与科学》 CSCD 北大核心 2013年第11期48-53,共6页
实时合成孔径雷达(SAR)成像技术是当前军事和遥感领域的研究热点。SAR成像算法具有庞大的数据量和运算量,对高性能计算的需求巨大,适合采用以集群系统为代表的高性能计算机进行性能加速。依据集群系统的分布存储特性,通信延迟是集群上... 实时合成孔径雷达(SAR)成像技术是当前军事和遥感领域的研究热点。SAR成像算法具有庞大的数据量和运算量,对高性能计算的需求巨大,适合采用以集群系统为代表的高性能计算机进行性能加速。依据集群系统的分布存储特性,通信延迟是集群上程序性能提升的首要优化因素。为此,以集群系统为平台,深入研究SAR成像算法的多级延迟隐藏技术,重点对线程安全队列、非阻塞通信和多线程分块通信三种关键技术进行研究,并确定了适合于通信延迟隐藏的最优通信块规模。实验结果表明,经过通信延迟隐藏优化的SAR成像程序具有较高的网络利用率,能显著提升性能。 展开更多
关键词 SAR成像算法 通信延迟隐藏 线程安全队列 通信块 网络利用率
下载PDF
网络处理器体系结构分析 被引量:7
5
作者 李秋江 韦卫 贺志强 《计算机工程与应用》 CSCD 北大核心 2004年第5期135-138,共4页
该文旨在分析网络处理器能够同时满足高性能和灵活性要求的体系结构。而传统的网络设备单纯采用专用芯片或者基于RISC的通用处理器(GPPs),很难兼顾这两者要求。该文根据网络处理器的处理空间,将其映射为5个逻辑模块,这些模块由网络处理... 该文旨在分析网络处理器能够同时满足高性能和灵活性要求的体系结构。而传统的网络设备单纯采用专用芯片或者基于RISC的通用处理器(GPPs),很难兼顾这两者要求。该文根据网络处理器的处理空间,将其映射为5个逻辑模块,这些模块由网络处理器中各个功能部件实现。然后分析了网络处理器的SMP和Pipeline两种并行结构,并进一步分析了隐藏延迟等实现加速的技术。最后分析了网络应用发展变化对网络处理器体系结构设计的挑战,并提出了解决办法。 展开更多
关键词 网络处理器 体系结构 并行处理 隐藏延迟 网络应用
下载PDF
通用图形处理器缓存子系统性能优化方法综述 被引量:4
6
作者 张军 谢竟成 +3 位作者 沈凡凡 谭海 汪吕蒙 何炎祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1191-1207,共17页
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大... 随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义. 展开更多
关键词 通用图形处理器 缓存子系统 性能优化 延迟隐藏 缓存争用
下载PDF
多核计算机上非递归并行计算矩阵乘积 被引量:5
7
作者 鹿中龙 钟诚 黄华林 《小型微型计算机系统》 CSCD 北大核心 2011年第5期860-866,共7页
提出"延迟隐藏"的数据预取模型,实现计算与访存的重叠操作,以达到共享二级缓存零缺失;给出"基本块"的概念,以简化算法的数据结构和减少存储开销;按基本块连续存储方式存储矩阵元素,从存储层次上优化算法,显著地减... 提出"延迟隐藏"的数据预取模型,实现计算与访存的重叠操作,以达到共享二级缓存零缺失;给出"基本块"的概念,以简化算法的数据结构和减少存储开销;按基本块连续存储方式存储矩阵元素,从存储层次上优化算法,显著地减少页表缓冲缺失;采取非递归调度基本块的策略,充分利用多核计算机的共享二级缓存来减少访问主存的次数,并且不局限于某种特定的存储结构,实现算法缓存无关.多核计算机上的实验结果表明,给出的非递归计算矩阵乘积的线程级并行算法高效、可扩展. 展开更多
关键词 多核计算机 矩阵乘积 并行算法 延迟隐藏 缓存无关
下载PDF
基于ESCA系统的层次化显式访存机制研究 被引量:2
8
作者 饶金理 吴丹 +4 位作者 陈攀 董冕 邓承诺 戴葵 邹雪城 《计算机工程》 CAS CSCD 北大核心 2011年第22期24-27,34,共5页
针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏... 针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏能够占据整体运行时间的56%,并获得1.5倍的加速比,能弥补计算与存储访问间的速度差异,提高系统计算效率。 展开更多
关键词 混合计算 存储墙 多核处理器 ESCA系统 层次化显示存储访问 延迟隐藏
下载PDF
分布式文件系统的流式数据预读 被引量:1
9
作者 闫鹤 李小勇 +1 位作者 胡鹏 刘海涛 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期252-256,共5页
在分布式文件系统中,网络和磁盘往往是影响IO性能的主要因素.如何最大限度地挖掘网络和磁盘的性能潜力,长期以来一直都是非常活跃的研究课题.已有研究工作主要侧重于预取策略和数据的缓存策略,而未能将网络和服务器端磁盘I/O统一进行调... 在分布式文件系统中,网络和磁盘往往是影响IO性能的主要因素.如何最大限度地挖掘网络和磁盘的性能潜力,长期以来一直都是非常活跃的研究课题.已有研究工作主要侧重于预取策略和数据的缓存策略,而未能将网络和服务器端磁盘I/O统一进行调度.提出并设计实现了一种流式预读方法,通过在客户端改变发送预读请求和接收预读数据的顺序,交错网络传输和磁盘访问,实现了延迟隐藏.测试表明,这种方法确实显著提高了顺序读性能. 展开更多
关键词 分布式文件系统 预读 延迟隐藏 网络传输 磁盘IO
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部