摘要
随着集群系统的广泛应用,用户对系统的综合性能要求显得越来越重要。该文在基于InfiniBand[1]ⅢPC集群的平台上,通过对目前常用的监测系统的分析,针对它们所共有的一些不足之处,在其基础上开发了一个实用的对并行处理过程的可视化监测工具。工具通过lm_sensors获取硬件信息,以proc文件获取负载信息,并通过MPE生成记录并行程序执行过程的log文件,具有能以图形方式实时显示硬件信息和系统节点负载信息,以及需要时可以用图形方式重现程序执行过程的功能。
As the cluster system being widely used,the performance for the user is of great importance.In this paper,by studying the existent cluster monitor systems base on InfiniBand Ⅲ PC cluster,we analyses the common disadvantages of them,and develop a visual tool for parallel computing monitor and evaluation,using lm_sensors for hardware information,advantage proc file system for node load information and MPE for log file recording the program running, which is capable of showing all this information in graph mode.
出处
《计算机工程与应用》
CSCD
北大核心
2005年第22期87-90,156,共5页
Computer Engineering and Applications
基金
国家重点新产品计划项目(编号:2002ED782017)资助