期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
FT64并行系统上的EP和GEMM并行算法设计与实现 被引量:2
1
作者 晏小波 唐滔 杨学军 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期87-92,共6页
EP和GEMM是科学计算领域中常用的计算核心,并广泛应用于高性能计算机体系结构的性能评测.基于一种当今热门的体系结构——流体系结构,设计实现了这两个测试程序在FT64并行系统上的并行算法,并取得了很好的效果.
关键词 并行算法 核心 运算簇
下载PDF
多核处理器验证中存储数据错误快速定位机制 被引量:2
2
作者 周宏伟 邓让钰 +2 位作者 李永进 晏小波 窦强 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第6期1-6,共6页
提出并实现的一种数据错误快速定位机制(Fast Fault Location Mechanism,FFLM)面向多核处理器存储系统的功能验证,FFLM基于硬件仿真器构建多端口存储器黄金模型,通过在仿真过程中实时监控存储系统与处理器核之间的访存报文,在线比较被... 提出并实现的一种数据错误快速定位机制(Fast Fault Location Mechanism,FFLM)面向多核处理器存储系统的功能验证,FFLM基于硬件仿真器构建多端口存储器黄金模型,通过在仿真过程中实时监控存储系统与处理器核之间的访存报文,在线比较被测系统访问真实存储器的数据与黄金模型中的对应数据是否一致,在错误数据从存储系统送入处理器核的时刻就能够发现数据错误。与传统方法相比,FFLM具有仿真速度快、硬件资源代价低以及定位错误时间短的优点。对自主设计的CMP-16多核处理器进行仿真时的统计数据表明:使用FFLM后定位数据错误的速度能够比未使用FFLM时平均提高6.5倍。 展开更多
关键词 多核处理器 验证 存储数据错误 定位机制
下载PDF
流处理器技术研究与发展 被引量:1
3
作者 杨学军 晏小波 唐滔 《计算机工程与科学》 CSCD 2008年第4期113-117,共5页
高性能计算技术在过去十年中不断向前发展,但片外存储、通信延迟等问题一直得不到本质改善,线延迟和功耗问题也越来越突出。高性能计算领域正在寻求能够解决这一问题的新型处理器体系结构。流处理器是在众多新兴的处理器体系结构中发展... 高性能计算技术在过去十年中不断向前发展,但片外存储、通信延迟等问题一直得不到本质改善,线延迟和功耗问题也越来越突出。高性能计算领域正在寻求能够解决这一问题的新型处理器体系结构。流处理器是在众多新兴的处理器体系结构中发展非常迅速、被学界和业界广泛关注的一种新型处理器,它在数字处理、多媒体以及图像等领域已取得很好的效果。本文分析了当前流行的几种流处理器,指出了流体系结构在科学计算领域的应用前景和所面临的挑战。 展开更多
关键词 流体系结构 科学计算 流处理器
下载PDF
V-PPIM:基于V-PIM的高性能PIM并行系统
4
作者 温璞 杨学军 +2 位作者 晏小波 邓宇 唐玉华 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期75-81,共7页
PIM (processor-in-memory)结构把高密度DRAM存储器和CMOS处理逻辑集成在一个芯片上,具有高带宽、低延迟特点.基于PIM技术的高性能并行系统具有更好的可扩展性、自适应性、鲁棒性和低功耗等特性,有望成为未来构建超千万亿次计算系统的... PIM (processor-in-memory)结构把高密度DRAM存储器和CMOS处理逻辑集成在一个芯片上,具有高带宽、低延迟特点.基于PIM技术的高性能并行系统具有更好的可扩展性、自适应性、鲁棒性和低功耗等特性,有望成为未来构建超千万亿次计算系统的基石之一.向量处理技术可充分发挥PIM的结构优势,结合向量处理和PIM的结构特点提出基于向量PIM结构的V-PPIM并行系统,描述了V-PPIM及其处理元--基于向量的PIM(Vector-based PIM, V-PIM)--结构及设计思想,讨论了V-PIM的关键特点并指出了进一步的研究方向. 展开更多
关键词 存储器内置处理器 向量处理 并行系统 存储墙
下载PDF
基于超完美图着色的存储分配算法
5
作者 邓宇 汪黎 +2 位作者 晏小波 王桂彬 唐滔 《计算机科学》 CSCD 北大核心 2008年第9期233-236,257,共5页
为了提高性能,一些应用需要在编译时对主存进行针对性的管理。提出了基于超完美图的主存分配方法,其基本思想是通过生命周期分割将一般的相干图转换为超完美图,从而可以使用已有的线性时间的区间着色算法完成主存的分配。分别基于自底... 为了提高性能,一些应用需要在编译时对主存进行针对性的管理。提出了基于超完美图的主存分配方法,其基本思想是通过生命周期分割将一般的相干图转换为超完美图,从而可以使用已有的线性时间的区间着色算法完成主存的分配。分别基于自底向上的积极生命周期分割策略和自顶向下的被动生命周期分割策略,实现了两个分配算法。初步评测表明,我们的分配算法是有效的编译时管理主存手段。 展开更多
关键词 编译时存储分配 主存管理 区间着色 超完美图
下载PDF
频率2GHz的16核处理器二级缓存设计
6
作者 李永进 邓让钰 +3 位作者 晏小波 衣晓飞 周宏伟 张英 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第1期108-112,117,共6页
提出了针对多核处理器的2级缓存L2Cache设计方案,以高效地处理访存请求.采用优化的目录协议维护与1级缓存L1Cache的数据一致性,并结合片上目录来维护L2Cache之间及其与3级缓存L3Cache之间的一致性;在L2Cache设计中,提出了基于MESIA-F的C... 提出了针对多核处理器的2级缓存L2Cache设计方案,以高效地处理访存请求.采用优化的目录协议维护与1级缓存L1Cache的数据一致性,并结合片上目录来维护L2Cache之间及其与3级缓存L3Cache之间的一致性;在L2Cache设计中,提出了基于MESIA-F的Cache一致性协议,实现了最早返回取数数据的短流水线设计;采用相关链和远程链机制解决了监听应答导致的死锁问题;通过基于流水线的睡眠与唤醒技术降低了漏流功耗;通过细粒度门控时钟降低了其动态功耗.后端设计结果表明,经过优化设计的L2Cache达到了频率2GHz的设计目标,并已成功应用于某16核处理器芯片. 展开更多
关键词 多核处理器 2级缓存 MESIA-F协议
下载PDF
科学计算程序在FT64流处理器上的实现、优化和评测
7
作者 邓宇 晏小波 +2 位作者 杜静 张英 杨学军 《计算机工程与科学》 CSCD 2008年第9期107-110,共4页
流体系结构是一种适应VLSI工艺发展的新型体系结构,它是否对科学计算程序有效是一个广泛关注的问题。本文选取NASA并行测试程序集中的一个数据密集型程序MG,研究了它在一个64位的面向科学计算设计的流处理器FT64上的实现和优化问题。在F... 流体系结构是一种适应VLSI工艺发展的新型体系结构,它是否对科学计算程序有效是一个广泛关注的问题。本文选取NASA并行测试程序集中的一个数据密集型程序MG,研究了它在一个64位的面向科学计算设计的流处理器FT64上的实现和优化问题。在FT64上的实测表明,经过面向片上存储层次的优化,FT64能够达到与Itanium 2处理器相当的性能。 展开更多
关键词 FT64 流处理器 存储层次 性能评测
下载PDF
城市轨道交通三线换乘形式研究 被引量:1
8
作者 赖丽萍 晏小波 《大陆桥视野》 2015年第22期89-90,共2页
国外的城市轨道交通发展比较早,且已形成了一定的线网规模,三线换乘站也有一定的数量;我国城市轨道交通则处在刚发展的阶段,但是各大城市都对城市轨道交通的建设做了详细和科学的规划,都有适合城市发展的城市轨道交通规划网,在规划的线... 国外的城市轨道交通发展比较早,且已形成了一定的线网规模,三线换乘站也有一定的数量;我国城市轨道交通则处在刚发展的阶段,但是各大城市都对城市轨道交通的建设做了详细和科学的规划,都有适合城市发展的城市轨道交通规划网,在规划的线网中也有一定数量的三线换乘站. 展开更多
关键词 城市轨道交通 三线换乘
下载PDF
国内外地铁车站楼扶梯设计方法比较分析 被引量:9
9
作者 赖丽萍 陈勇烽 晏小波 《城市轨道交通研究》 北大核心 2012年第10期17-20,42,共5页
地铁车站楼扶梯的通过能力直接影响着整个车站的交通效率,必须对其进行合理的规划与设计。英国在地铁车站楼扶梯设计方面有成熟的设计理论。介绍了英国关于地铁车站楼扶梯设计影响因素、楼梯设置宽度、自动扶梯技术参数和数量、楼扶梯... 地铁车站楼扶梯的通过能力直接影响着整个车站的交通效率,必须对其进行合理的规划与设计。英国在地铁车站楼扶梯设计方面有成熟的设计理论。介绍了英国关于地铁车站楼扶梯设计影响因素、楼梯设置宽度、自动扶梯技术参数和数量、楼扶梯通过能力和排队区域等的设计方法和规范,并将其与我国楼扶梯相关设计规范进行对比,总结出值得我国地铁设计工作者借鉴的国外设计经验。 展开更多
关键词 地铁车站 楼梯 自动扶梯 设计方法
下载PDF
北京地铁13号线西二旗至上地区间改线方案研究 被引量:3
10
作者 晏小波 张梦然 《铁道勘察》 2020年第5期96-100,共5页
清河站作为京张高铁始发站之一,是集地铁、公交车、出租车、私家车为一体的大型综合交通枢纽。为提高枢纽的服务水平,决定将地铁13号线上地至西二旗区间改线引入该枢纽内。首先通过理论分析,提出地面线路改线的原则;再对线路周边控制因... 清河站作为京张高铁始发站之一,是集地铁、公交车、出租车、私家车为一体的大型综合交通枢纽。为提高枢纽的服务水平,决定将地铁13号线上地至西二旗区间改线引入该枢纽内。首先通过理论分析,提出地面线路改线的原则;再对线路周边控制因素进行分析,梳理出合适的改线点位置。从减少对运营线路的影响、缩短停运时间、降低施工难度、节省投资等方面出发,对小营西路2个接线方案进行了比选。研究表明,小营西路以北接线方案虽然停运时间稍长,但可利用13号线既有桥梁,极大降低了运营风险,且工程总投资较省,故推荐该方案。 展开更多
关键词 地铁工程 地面线 既有线 改线 方案研究
下载PDF
海口消防“五四”系列活动丰富多彩
11
作者 晏小波 林宇 《中国消防》 2010年第10期27-27,共1页
为引导和教育消防部队广大团员青年继承和弘扬“五四”精神,积极投身部队建设和发展,增强官兵的爱国热情,提高部队的凝聚力和战斗力,海南省海口市公安消防支队开展了一系列活动,引导青年官兵以实际行动为“海南国际旅游岛”建设作... 为引导和教育消防部队广大团员青年继承和弘扬“五四”精神,积极投身部队建设和发展,增强官兵的爱国热情,提高部队的凝聚力和战斗力,海南省海口市公安消防支队开展了一系列活动,引导青年官兵以实际行动为“海南国际旅游岛”建设作出贡献。 展开更多
关键词 消防部队 海口市 多彩 公安消防支队 部队建设 海南省 战斗力 凝聚力
原文传递
SRF Coloring:Stream Register File Allocation via Graph Coloring 被引量:1
12
作者 杨学军 邓宇 +5 位作者 汪黎 晏小波 杜静 张英 王桂彬 唐滔 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第1期152-164,共13页
Stream Register File (SRF) is a large on-chip memory of the stream processor and its efficient management is essential for good performance. Current stream programming languages expose the management of SRF to the p... Stream Register File (SRF) is a large on-chip memory of the stream processor and its efficient management is essential for good performance. Current stream programming languages expose the management of SRF to the programmer, incurring heavy burden on the programmer and bringing difficulties to inheriting the legacy codes. SF95 is the language developed for FT64 which is the first 64-bit stream processor designed for scientific applications. SF95 conceals SRF from the programmer and leaves the management of SRF to its compiler. In this paper, we present a compiler approach named SRF Coloring to manage SRF automatically. The novelties of this paper are: first, it is the first time to use the graph coloring-based algorithm for the SRF management; second, an algorithm framework for SRF Coloring that is well suited to the FT64 architecture is proposed this framework is based on a well-understood graph coloring algorithm for register allocation, together with some modifications to deal with the unusual aspects of SRF problem; third, the SRF Coloring algorithm is implemented in SF95Compiler, a compiler designed for FT64 and SF95. The experimental results show that our approach represents a practical and promising solution to SRF allocation. 展开更多
关键词 memory management SRF coloring graph coloring stream processor stream register file compiler optimization
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部