期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
异构多核处理器多发射动态调度技术研究
1
作者 唐旭 张多利 +1 位作者 王杰 宋宇鲲 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第5期632-640,共9页
随着多核处理器片上集成核数的不断增多,并行任务的调度能力越来越成为制约性能提升的关键因素。文章设计一种面向异构多核计算系统的动态任务调度控制器,主要实现动态监控处理单元的负载情况、动态任务唤醒、乱序任务发射、任务写回安... 随着多核处理器片上集成核数的不断增多,并行任务的调度能力越来越成为制约性能提升的关键因素。文章设计一种面向异构多核计算系统的动态任务调度控制器,主要实现动态监控处理单元的负载情况、动态任务唤醒、乱序任务发射、任务写回安全管理等功能;研究一种降低计算任务结果数据回写双倍数据速率(double data rate,DDR)外存储器次数的方法,大幅节省了访存开销,进一步提升了计算性能。仿真及性能测试显示,在典型应用场景下,与已有的无动态调度功能的任务发射控制器相比,实现了显示并行化编程向任务并行的自动化控制过渡,编程友好度显著提高,在不同类型的测试案例中,分别提升了11.3%~37.9%的计算性能。 展开更多
关键词 异构多核处理器 动态任务调度 乱序多发射 编程友好 片上网络 片上节点缓存
下载PDF
龙芯2号处理器设计和性能分析 被引量:37
2
作者 胡伟武 张福新 李祖松 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期959-966,共8页
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等... 介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求. 展开更多
关键词 超标量流水线 乱序执行 转移猜测 寄存器重命名 动态调度 非阻塞的cache load指令猜测执行 性能分析
下载PDF
基于混合模式的流媒体缓存调度算法 被引量:6
3
作者 叶剑虹 叶双 《计算机科学》 CSCD 北大核心 2013年第2期61-64,83,共5页
介绍了一种结合了CDN和P2P互补优势的流媒体混合内容分发网络(HyCDN)。针对HyCDN不同区域提出了相应的缓存算法,域内用户端综合考虑了流媒体前缀字节的有用性、文件的传输代价及点播热度,在此基础上提出缓存替换算法(Comprehensive Valu... 介绍了一种结合了CDN和P2P互补优势的流媒体混合内容分发网络(HyCDN)。针对HyCDN不同区域提出了相应的缓存算法,域内用户端综合考虑了流媒体前缀字节的有用性、文件的传输代价及点播热度,在此基础上提出缓存替换算法(Comprehensive Value Cache Replacement Algorithm for P2P,CVCR4P2P);对域间边缘服务器采用补丁预取与调度算法(Dynamic Scheduling Algorithm for Proxy Caching,DSA4ProxyC),通过基于用户访问情况自适应伸缩缓存的分配方案,使流媒体后缀部分在边缘服务器中缓存的数据段与其流行度成正比。理论分析及实验结果表明,混合流媒体缓存调度策略的实施能有效地降低骨干网络带宽资源消耗,对用户请求到达速率的变化具有良好的适应性。 展开更多
关键词 流媒体 补丁预取 缓存替换 调度算法
下载PDF
基于协作缓存的视频点播系统中调度设计 被引量:1
4
作者 周刚 张潇 +2 位作者 胡南军 陈道蓄 谢立 《计算机工程与应用》 CSCD 北大核心 2002年第11期212-215,共4页
随着计算机技术和网络技术的不断进步,视频点播服务已经逐渐变成现实,基于协作缓存的视频点播系统是一个分布式结构,中心集群存放影片数据,本地集群缓存数据并提供视频点播服务,具有很好的可扩展性。该文针对VOD系统的协作缓存,提出了... 随着计算机技术和网络技术的不断进步,视频点播服务已经逐渐变成现实,基于协作缓存的视频点播系统是一个分布式结构,中心集群存放影片数据,本地集群缓存数据并提供视频点播服务,具有很好的可扩展性。该文针对VOD系统的协作缓存,提出了静态调度和动态迁移相结合的调度策略,静态调度能够根据影片数据的缓存分布情况,实时调度服务请求,并同时考虑多个VOD服务器的负载动态平衡;动态任务迁移能对服务流分布进行实时分析,并根据服务数据本地化的原则进行服务迁移,进一步提高了协作缓存的命中率。该文阐述了基于协作缓存的视频点播系统的拓扑结构,对静态调度和动态迁移进行了详细设计,并给出了相应的形式化表示。 展开更多
关键词 动态迁移 服务质量 协作缓存 视频点播系统 调度 设计
下载PDF
网络环境下海量数据存储与3维可视化研究 被引量:3
5
作者 王军 邓开艳 《测绘与空间地理信息》 2009年第3期28-30,共3页
重点探讨了网络环境下3维可视化系统整体架构、数据组织存储方式以及可视化表现的策略。提出了在网络环境下海量空间数据的组织、管理、传输以及客户端的快速高效访问的体系构架与解决方案,并取得了良好的效果。
关键词 3维可视化系统 海量数据 数据存储 动态数据调度策略 数据缓存
下载PDF
面向混杂流计算的适应性存储器体系结构 被引量:1
6
作者 张萌 赵磊 +1 位作者 樊晓桠 田杭沛 《西北工业大学学报》 EI CAS CSCD 北大核心 2012年第6期961-967,共7页
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结... 可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。 展开更多
关键词 片内高速缓存 计算机体系结构 计算机硬件 计算机仿真 计算机软件 数据处理 高效率 微处理器芯片 多处理系统 优化 资源配置 调度 结构框图 DAMS动态地址映射流
下载PDF
基于缓存层级结构的多核Web服务器动态请求调度算法
7
作者 尤国华 谭杨 赵英 《计算机应用研究》 CSCD 北大核心 2016年第1期87-91,共5页
针对Web服务器中传统的动态请求调度算法,如先到先服务算法等,不能充分利用多核处理器并行性的问题,根据多核Web服务器缓存结构的特点提出了基于缓存层级结构的多核Web服务器动态请求调度算法。该算法从处理器核心间的负载均衡和多核处... 针对Web服务器中传统的动态请求调度算法,如先到先服务算法等,不能充分利用多核处理器并行性的问题,根据多核Web服务器缓存结构的特点提出了基于缓存层级结构的多核Web服务器动态请求调度算法。该算法从处理器核心间的负载均衡和多核处理器的缓存层级结构特点两个方面对动态请求进行调度。基于此算法进行了仿真实验,实验结果表明该算法可保持多核处理器核心间的负载均衡,并能有效缓解多核Web服务器的乒乓效应。 展开更多
关键词 WEB服务器 多核处理器 调度 动态请求 缓存结构
下载PDF
Microarchitecture of the Godson-2 Processor 被引量:52
8
作者 Wei-WuHu Fu-XinZhang Zu-SongLi 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第2期243-249,共7页
The Godson project is the first attempt to design high performancegeneral-purpose microprocessors in China. This paper introduces the microarchitecture of theGodson-2 processor which is a 64-bit, 4-issue, out-of-order... The Godson project is the first attempt to design high performancegeneral-purpose microprocessors in China. This paper introduces the microarchitecture of theGodson-2 processor which is a 64-bit, 4-issue, out-of-order execution RISC processor that implementsthe 64-bit MIPS-like instruction set. The adoption of the aggressive out-of-order executiontechniques (such as register mapping, branch prediction, and dynamic scheduling) and cachetechniques (such as non-blocking cache, load speculation, dynamic memory disambiguation) helps theGodson-2 processor to achieve high performance even at not so high frequency. The Godson-2 processorhas been physically implemented on a 6-metal 0.18 μm CMOS technology based on the automaticplacing and routing flow with the help of some crafted library cells and macros. The area of thechip is 6,700 micrometers by 6,200 micrometers and the clock cycle at typical corner is 2.3 ns. 展开更多
关键词 superscalar pipeline out-of-order execution branch prediction registerrenaming dynamic scheduling non-blocking cache load speculation
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部