-
题名P2P文件完整性校验延迟隐藏算法
被引量:4
- 1
-
-
作者
贺鹏程
王劲林
邓浩江
孙鹏
-
机构
中国科学院研究生院
中国科学院声学研究所国家网络新媒体工程技术研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第15期29-31,共3页
-
基金
国家"863"计划基金资助项目(2008AA01A317)
-
文摘
P2P下载中文件完整性校验会影响下载性能,针对该问题,提出一种校验延迟的隐藏算法。利用文件完整性校验中使用的哈希算法的流式特性和TCP异步接收缓冲区的特点,将大文件块的哈希计算分成多次对较小的子数据块的计算,收到一个子数据块后,就开始计算哈希。由于计算每一个子数据块的哈希的时间开销很小,保证了计算延迟可以被TCP异步接收缓冲区所隐藏,使哈希计算与数据接收几乎可以并行进行,消除其对P2P文件下载性能的影响,提高了下载效率。
-
关键词
P2P下载
文件校验
延迟隐藏
SHA1算法
MD4算法
-
Keywords
P2P downloading
file verification
latency hiding
SHA1 algorithm
MD4 algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名流处理器延迟隐藏机制的优化及实现
- 2
-
-
作者
李礼
文梅
伍楠
李海燕
张春元
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
2007年第3期74-76,共3页
-
基金
国家自然科学基金资助项目(60473080)
-
文摘
流体系结构在新兴的高性能计算机体系结构中备受关注,通过多种技术途径,流处理器能广泛深入地挖掘程序各种并行性。本文首先介绍流处理器访存延迟隐藏的技术,然后引入“链接”思想以进一步优化访存延迟隐藏机制,最后讨论了“链接”机制在流处理器上的实现。
-
关键词
流体系结构
延迟隐藏
链接
-
Keywords
stream architecture
latency hiding
chaining
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名面向替换延迟隐藏的Cache空间预约技术
- 3
-
-
作者
张骏
田泽
韩立敏
牛少平
裴希杰
-
机构
航空工业西安航空计算技术研究所
集成电路与微系统航空科技重点实验室
-
出处
《航空计算技术》
2020年第3期82-86,共5页
-
基金
国家核高基重大专项资助(2016ZX01012101-004)。
-
文摘
快速发展的集成电路制造工艺与相对滞后的设计技术形成的"存储墙"问题已经成为制约限制处理器潜在性能提升的主要障碍,构建高性能片上存储系统一直是处理器微体系结构研究的重要内容。提出Cache空间预约技术--CSPO,为片上Cache增加预约空间计数器POC,以及Cache行预约标志POT,使Cache替换目标选择与片外存储器访问并行执行,同时具备将POT标识为1的脏Cache数据行尽快提前写回的能力,从而在片外数据返回前提前完成Cache替换目标行选择和脏数据写回,并将替换目标Cache行地址存入专用寄存器中,数据返回后直接写入替换目标Cache行,从而有效隐藏Cache替换操作延迟、提升IPC。实验结果表明,CSPO技术能有效提升IPC性能,范围为2.46%~11.11%,平均为5.37%。
-
关键词
微处理器
存储系统
CACHE
替换算法
延迟隐藏
-
Keywords
micoprocessor
memory system
Cache
replacement policy
latency hiding
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于集群平台的SAR成像算法多级通信延迟隐藏技术
被引量:1
- 4
-
-
作者
杜静
敖富江
郭晋
周颖
-
机构
洛阳电子装备试验中心
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第11期48-53,共6页
-
基金
973国家安全重大基础项目(613900103)
国家自然科学基金资助项目(61303061)
-
文摘
实时合成孔径雷达(SAR)成像技术是当前军事和遥感领域的研究热点。SAR成像算法具有庞大的数据量和运算量,对高性能计算的需求巨大,适合采用以集群系统为代表的高性能计算机进行性能加速。依据集群系统的分布存储特性,通信延迟是集群上程序性能提升的首要优化因素。为此,以集群系统为平台,深入研究SAR成像算法的多级延迟隐藏技术,重点对线程安全队列、非阻塞通信和多线程分块通信三种关键技术进行研究,并确定了适合于通信延迟隐藏的最优通信块规模。实验结果表明,经过通信延迟隐藏优化的SAR成像程序具有较高的网络利用率,能显著提升性能。
-
关键词
SAR成像算法
通信延迟隐藏
线程安全队列
通信块
网络利用率
-
Keywords
SAR imaging algorithm
communication latency hiding
thread safety queue
communica- tion block
net utilization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名网络处理器体系结构分析
被引量:7
- 5
-
-
作者
李秋江
韦卫
贺志强
-
机构
中国科学院计算技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第5期135-138,共4页
-
基金
国家863高技术研究发展计划基金(编号:2002AA142030)
-
文摘
该文旨在分析网络处理器能够同时满足高性能和灵活性要求的体系结构。而传统的网络设备单纯采用专用芯片或者基于RISC的通用处理器(GPPs),很难兼顾这两者要求。该文根据网络处理器的处理空间,将其映射为5个逻辑模块,这些模块由网络处理器中各个功能部件实现。然后分析了网络处理器的SMP和Pipeline两种并行结构,并进一步分析了隐藏延迟等实现加速的技术。最后分析了网络应用发展变化对网络处理器体系结构设计的挑战,并提出了解决办法。
-
关键词
网络处理器
体系结构
并行处理
隐藏延迟
网络应用
-
Keywords
networ k processor,architecture,parallel processing,hide latency,network applicatio n
-
分类号
TP38
[自动化与计算机技术—计算机系统结构]
-
-
题名通用图形处理器缓存子系统性能优化方法综述
被引量:4
- 6
-
-
作者
张军
谢竟成
沈凡凡
谭海
汪吕蒙
何炎祥
-
机构
东华理工大学江西省放射性地学大数据技术工程实验室
东华理工大学信息工程学院
东华理工大学创新创业学院
武汉大学计算机学院
南京审计大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第6期1191-1207,共17页
-
基金
国家自然科学基金项目(61662002,61972293,61902189)
江西省放射性地学大数据技术工程实验室项目(JELRGBDT201905)
江苏省基础研究计划(自然科学基金)项目(BK20180821)。
-
文摘
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义.
-
关键词
通用图形处理器
缓存子系统
性能优化
延迟隐藏
缓存争用
-
Keywords
general purpose graphics processing units(GPGPU)
cache subsystem
performance optimization
latency hiding
cache contention
-
分类号
TP303.1
[自动化与计算机技术—计算机系统结构]
-
-
题名多核计算机上非递归并行计算矩阵乘积
被引量:5
- 7
-
-
作者
鹿中龙
钟诚
黄华林
-
机构
广西大学计算机与电子信息学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第5期860-866,共7页
-
基金
国家自然科学基金项目(60963001)资助
广西研究生教育创新计划项目资助
+1 种基金
广西高校人才小高地建设创新团队计划项目(桂教人[2007]71号)资助
广西大学拨尖创新项目资助
-
文摘
提出"延迟隐藏"的数据预取模型,实现计算与访存的重叠操作,以达到共享二级缓存零缺失;给出"基本块"的概念,以简化算法的数据结构和减少存储开销;按基本块连续存储方式存储矩阵元素,从存储层次上优化算法,显著地减少页表缓冲缺失;采取非递归调度基本块的策略,充分利用多核计算机的共享二级缓存来减少访问主存的次数,并且不局限于某种特定的存储结构,实现算法缓存无关.多核计算机上的实验结果表明,给出的非递归计算矩阵乘积的线程级并行算法高效、可扩展.
-
关键词
多核计算机
矩阵乘积
并行算法
延迟隐藏
缓存无关
-
Keywords
multi-core computer
matrix multiplication
parallel algorithm
delay hiding
cache oblivious
-
分类号
TP338
[自动化与计算机技术—计算机系统结构]
-
-
题名基于ESCA系统的层次化显式访存机制研究
被引量:2
- 8
-
-
作者
饶金理
吴丹
陈攀
董冕
邓承诺
戴葵
邹雪城
-
机构
华中科技大学电子科学与技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第22期24-27,34,共5页
-
基金
国家自然科学基金资助项目(NSFC60973035
NSFC60976027)
湖北省自然科学基金资助项目(2010CBD02705)
-
文摘
针对高性能混合计算系统中的存储墙问题,在分析其计算模式特点及传统访存机制局限性的基础上,提出适用于混合计算系统的层次化显式存储访问机制,并基于ESCA多核处理器系统进行实现和评测。实验结果显示,针对核心应用程序DGEMM,延迟隐藏能够占据整体运行时间的56%,并获得1.5倍的加速比,能弥补计算与存储访问间的速度差异,提高系统计算效率。
-
关键词
混合计算
存储墙
多核处理器
ESCA系统
层次化显示存储访问
延迟隐藏
-
Keywords
hybrid computing
memory wall
multi-core processor
Engineering and Scientific Computing Architecture(ESCA) system
hierarchical explicit memory access
hidden of latency
-
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
-
-
题名分布式文件系统的流式数据预读
被引量:1
- 9
-
-
作者
闫鹤
李小勇
胡鹏
刘海涛
-
机构
上海交通大学信息安全工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第S1期252-256,共5页
-
基金
上海市科委基金资助重大项目(10DZ1500200)
-
文摘
在分布式文件系统中,网络和磁盘往往是影响IO性能的主要因素.如何最大限度地挖掘网络和磁盘的性能潜力,长期以来一直都是非常活跃的研究课题.已有研究工作主要侧重于预取策略和数据的缓存策略,而未能将网络和服务器端磁盘I/O统一进行调度.提出并设计实现了一种流式预读方法,通过在客户端改变发送预读请求和接收预读数据的顺序,交错网络传输和磁盘访问,实现了延迟隐藏.测试表明,这种方法确实显著提高了顺序读性能.
-
关键词
分布式文件系统
预读
延迟隐藏
网络传输
磁盘IO
-
Keywords
distribute file system
readahead
latency hiding
network transmission
disk IO
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-