期刊文献+
共找到454篇文章
< 1 2 23 >
每页显示 20 50 100
The Design and Implementation of SMS Gateway Interface for Early Warning Plan for Meteorological Hazards Based on CMPP Protocol 被引量:2
1
作者 苗传海 潘静 张超 《Meteorological and Environmental Research》 CAS 2010年第1期71-74,共4页
Relying on CMPP (China Mobile Peer to Peer) protocol,we propose and design SMS (Short Message Service) gateway interface for early warning plan based on real-time meteorological database application,in order to form t... Relying on CMPP (China Mobile Peer to Peer) protocol,we propose and design SMS (Short Message Service) gateway interface for early warning plan based on real-time meteorological database application,in order to form the meteorological mobile internet service system which is 'One point connect,service the whole province' for short.Accessing interface system to each city's SMG (Short Message Gateway) through standard protocol,we establish the information transmitting channel of short message platform and mobile SMG to realize the store-forward and flow control of short message.In addition,the stable and dependable communication connect of interface system and mobile SMG should be ensure,and the connect could be reconstructed while encountering any error,as well as committing short message would be stopped due to interruption of connect. 展开更多
关键词 CMPP protocol Meteorological warning Disaster prevention and reduction Short message interface Short message routing China
下载PDF
Common interface for connecting of low profile biometric modules
2
作者 Raul Sanchez-Reillo Luis Mengtbar-Pozo +1 位作者 Michael G. Lorenz Raul Alonso-Moreno 《通讯和计算机(中英文版)》 2009年第5期1-8,共8页
关键词 地质勘探 石油地质 计算机 API
下载PDF
基于CGA的MPI程序分支覆盖测试套件生成
3
作者 袁剑锋 刘佳 郭建卫 《计算机技术与发展》 2024年第7期78-86,共9页
针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutiona... 针对程序的分支覆盖测试,元启发式搜索技术已经被广泛应用于测试数据生成中。然而,当前的研究成果主要适用于串行程序。因此,为覆盖消息传递接口(Message Passing Interface,MPI)程序的分支,该文研究基于协同进化遗传算法(Co-evolutionary Genetic Algorithm,CGA)的测试套件生成方法(简称为:CGA生成法),该方法具有不受不可行分支影响的优势。首先,基于收集覆盖信息的探针,定义最小归一化分支距离,并以此设计出相应的适应度值函数;然后,使用CGA生成进化个体,并基于设计的适应度值函数,计算这些个体的适应值;最后,基于计算的适应值,选择子种群中代表个体,以构成合作种群。所提CGA生成法应用于7个基准MPI程序,并与其他多种方法进行比较。实验结果表明,CGA生成法的覆盖率通常高于其他搜索算法。 展开更多
关键词 消息传递接口程序 协同进化遗传算法 分支覆盖测试 测试套件生成 适应度值函数
下载PDF
高分三号数据分布式负载均衡并行转换算法
4
作者 邱祥峰 《厦门理工学院学报》 2024年第5期33-39,共7页
针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,... 针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,中间层采用MapReduce按景并行处理,内层采用OpenMP按极化方式并行计算,并采用“Z”字形数据负载均衡策略,将高分三号不同成像模式下的多极化数据快速精确定标及格式转换,以抗数据偏斜。实际数据的测试结果表明,该算法的整体性能提升了约50%,验证了算法的可行性、高效性和正确性。 展开更多
关键词 高分三号卫星 合成孔径雷达 分布式负载均衡 并行转换算法 共享存储并行编程 映射归约编程模型 消息传递接口
下载PDF
An MPI parallel DEM-IMB-LBM framework for simulating fluid-solid interaction problems 被引量:2
5
作者 Ming Xia Liuhong Deng +3 位作者 Fengqiang Gong Tongming Qu Y.T.Feng Jin Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第6期2219-2231,共13页
The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive comp... The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive computational costs.To overcome this limitation,a message passing interface(MPI)parallel DEM-IMB-LBM framework is proposed aimed at enhancing computation efficiency.This framework utilises a static domain decomposition scheme,with the entire computation domain being decomposed into multiple subdomains according to predefined processors.A detailed parallel strategy is employed for both contact detection and hydrodynamic force calculation.In particular,a particle ID re-numbering scheme is proposed to handle particle transitions across sub-domain interfaces.Two benchmarks are conducted to validate the accuracy and overall performance of the proposed framework.Subsequently,the framework is applied to simulate scenarios involving multi-particle sedimentation and submarine landslides.The numerical examples effectively demonstrate the robustness and applicability of the MPI parallel DEM-IMB-LBM framework. 展开更多
关键词 Discrete element method(DEM) Lattice Boltzmann method(LBM) Immersed moving boundary(IMB) Multi-cores parallelization message passing interface(MPI) CPU Submarine landslides
下载PDF
基于MPI的鲲鹏CPU核间通信研究
6
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
Static Analysis Techniques for Fixing Software Defects in MPI-Based Parallel Programs
7
作者 Norah Abdullah Al-Johany Sanaa Abdullah Sharaf +1 位作者 Fathy Elbouraey Eassa Reem Abdulaziz Alnanih 《Computers, Materials & Continua》 SCIE EI 2024年第5期3139-3173,共35页
The Message Passing Interface (MPI) is a widely accepted standard for parallel computing on distributed memorysystems.However, MPI implementations can contain defects that impact the reliability and performance of par... The Message Passing Interface (MPI) is a widely accepted standard for parallel computing on distributed memorysystems.However, MPI implementations can contain defects that impact the reliability and performance of parallelapplications. Detecting and correcting these defects is crucial, yet there is a lack of published models specificallydesigned for correctingMPI defects. To address this, we propose a model for detecting and correcting MPI defects(DC_MPI), which aims to detect and correct defects in various types of MPI communication, including blockingpoint-to-point (BPTP), nonblocking point-to-point (NBPTP), and collective communication (CC). The defectsaddressed by the DC_MPI model include illegal MPI calls, deadlocks (DL), race conditions (RC), and messagemismatches (MM). To assess the effectiveness of the DC_MPI model, we performed experiments on a datasetconsisting of 40 MPI codes. The results indicate that the model achieved a detection rate of 37 out of 40 codes,resulting in an overall detection accuracy of 92.5%. Additionally, the execution duration of the DC_MPI modelranged from 0.81 to 1.36 s. These findings show that the DC_MPI model is useful in detecting and correctingdefects in MPI implementations, thereby enhancing the reliability and performance of parallel applications. TheDC_MPImodel fills an important research gap and provides a valuable tool for improving the quality ofMPI-basedparallel computing systems. 展开更多
关键词 High-performance computing parallel computing software engineering software defect message passing interface DEADLOCK
下载PDF
一种对基于云上的并行应用的性能分析模型
8
作者 陈亮 陈文智 +2 位作者 张紫徽 曹学锋 杨德华 《计算机应用与软件》 北大核心 2024年第6期45-54,84,共11页
由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息... 由于部署高性能计算相对昂贵,人们利用云计算来作为替代方案。然而,由于资源共享,增加对云访问的处理和网络资源的延迟,导致云环境对长期运行时程序来说变得不可预测。因此,建模和理解性能对于开发这种环境至关重要。该文针对基于消息传递接口的应用程序在云上的执行时间提供了一个预测器。该预测器基于性能分析模型,将云资源视为排队网络,将并行应用程序视为争夺共享资源的任务。实验表明,所提方法的总体准确率为89%。 展开更多
关键词 高性能计算 云计算 性能分析 消息传递接口
下载PDF
基于MPI和MapReduce混合编程的高分三号多模数据分布式并行转换算法
9
作者 张如明 蔡剑英 +2 位作者 王锡航 刘子立 欧阳波 《科技资讯》 2024年第14期34-36,共3页
我国高分三号形成三星陆海雷达卫星星座。为了提升PolSARpro极化SAR图像处理的开源软件在高分三号数据转换环节的处理能力,提出了基于OpenMP、MapReduce和MPI并按照PolSARpro软件的数据格式要求进行分布式并行转换处理算法,将不同成像... 我国高分三号形成三星陆海雷达卫星星座。为了提升PolSARpro极化SAR图像处理的开源软件在高分三号数据转换环节的处理能力,提出了基于OpenMP、MapReduce和MPI并按照PolSARpro软件的数据格式要求进行分布式并行转换处理算法,将不同成像模式下的多极化数据实现快速定标和格式转换,并且通过KingMap V10.0 GIS平台实现了算法并在实际数据中进行测试,验证了算法的高效性、可靠性、易扩展性和正确性。 展开更多
关键词 高分三号 合成孔径雷达 定标 消息传递接口 分布式并行计算
下载PDF
北斗三号短报文在水文自动测报系统中的应用研究
10
作者 郭广涛 熊启龙 《水利信息化》 2024年第4期66-70,共5页
为保障在极端自然灾害条件下水文自动测报系统中应用北斗三号短报文可靠传输数据,研究北斗三号短报文的技术特点和发送接收方式,结合水文自动测报系统的应用需求,提出在自动测报系统中应用北斗三号短报文传输和接收数据的技术方案。分... 为保障在极端自然灾害条件下水文自动测报系统中应用北斗三号短报文可靠传输数据,研究北斗三号短报文的技术特点和发送接收方式,结合水文自动测报系统的应用需求,提出在自动测报系统中应用北斗三号短报文传输和接收数据的技术方案。分析北斗三号短报文应用特点,以常用的雨水情遥测站为例总结北斗三号通信终端的集成方式、现场应用环境条件、遵循的通信协议和控制流程,选取适合的链路传输模式和报文编报方式,提出一种采用前置机FIU接收短报文的方案,分析其他北斗三号短报文数据接收方式的特点。应用北斗三号短报文可保障遥测站的数据稳定、可靠传输和接收,作为通信信道可广泛应用于各类型水文自动测报系统。 展开更多
关键词 北斗三号短报文 水文自动测报系统 遥测终端机 报文编报 链路传输模式 短报文接收方式 前置机
下载PDF
转播车电视节目录制系统的IP化应用
11
作者 谭光伟 《电视技术》 2024年第8期219-223,共5页
针对转播车电视节目录制系统面临的节目信源多样化和网络化现状,分析比较ST 2110、实时消息传输协议(Real Time Messaging Protocol,RTMP)、安全可靠传输(Secure Reliable Transport,SRT)、网络设备接口(Network Device Interface,NDI)... 针对转播车电视节目录制系统面临的节目信源多样化和网络化现状,分析比较ST 2110、实时消息传输协议(Real Time Messaging Protocol,RTMP)、安全可靠传输(Secure Reliable Transport,SRT)、网络设备接口(Network Device Interface,NDI)等主流网际互连协议(Internet Protocol,IP)信号格式中节目信号传输和切换层面的技术差异,结合转播车电视节目录制系统的IP化技术应用实践,提出对IP流信号传输、调度的应用方案。 展开更多
关键词 ST 2110 网络设备接口(NDI) 安全可靠传输(SRT) 实时消息传输协议(RTMP) 信号调度
下载PDF
MIMS:Towards a Message Interface Based Memory System 被引量:1
12
作者 陈荔城 陈明宇 +4 位作者 阮元 黄永兵 崔泽汉 卢天越 包云岗 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第2期255-272,共18页
The decades-old synchronous memory bus interface has restricted many innovations in the memory system, which is facing various challenges (or walls) in the era of multi-core and big data. In this paper, we argue tha... The decades-old synchronous memory bus interface has restricted many innovations in the memory system, which is facing various challenges (or walls) in the era of multi-core and big data. In this paper, we argue that a message- based interface should be adopted to replace the traditional bus-based interface in the memory system. A novel message interface based memory system called MIMS is proposed. The key innovation of MIMS is that processors communicate with the memory system through a universal and flexible message packet interface. Each message packet is allowed to encapsulate multiple memory requests (or commands) and additional semantic information. The memory system is more intelligent and active by equipping with a local buffer scheduler, which is responsible for processing packets, scheduling memory requests, preparing responses, and executing specific commands with the help of semantic information. Under the MIMS framework, many previous innovations on memory architecture as well as new optimization opportunities such as address compression and continuous requests combination can be naturally incorporated. The experimental results on a 16-core cycle-detailed simulation system show that: with accurate granularity message, MIMS can improve system performance by 53.21% and reduce energy delay product (EDP) by 55.90%. Furthermore, it can improve effective bandwidth utilization by 62.42% and reduce memory access latency by 51% on average. 展开更多
关键词 message interface memory system ASYNCHRONOUS GRANULARITY semantic information
原文传递
Technology acceptance comparison between on-road dynamic message sign and on-board human machine interface for connected vehicle-based variable speed limit in fog area 被引量:1
13
作者 Jia Li Wenxiang Xu Xiaohua Zhao 《Journal of Intelligent and Connected Vehicles》 2019年第2期33-40,共8页
Purpose–Connected vehicle-based variable speed limit(CV-VSL)systems in fog area use multi-source detection data to indicate drivers to make uniform change in speed when low visibility conditions suddenly occur.The pu... Purpose–Connected vehicle-based variable speed limit(CV-VSL)systems in fog area use multi-source detection data to indicate drivers to make uniform change in speed when low visibility conditions suddenly occur.The purpose of the speed limit is to make the driver’s driving behavior more consistent,so as to improve traffic safety and relieve traffic congestion.The on-road dynamic message sign(DMS)and on-board human–machine interface(HMI)are two types of warning technologies for CV-VSL systems.This study aims to analyze drivers’acceptance of the two types of warning technologies in fog area and its influencing factors.Design/methodology/approach–This study developed DMS and on-board HMI for the CV-VSL system in fog area on a driving simulator.The DMS and on-board HMI provided the driver with weather and speed limit information.In all,38 participants participated in the experiment and completed questionnaires on drivers’basic information,perceived usefulness and ease of use of the CV-VSL systems.Technology acceptance model(TAM)was developed to evaluate the drivers’acceptance of CV-VSL systems.A variance analysis method was used to study the influencing factors of drivers’acceptance including drivers’characteristics,technology types and fog density.Findings–The results showed that drivers’acceptance of on-road DMS was significantly higher than that of on-board HMI.The fog density had no significant effect on drivers’acceptance of on-road DMS or on-board HMI.Drivers’gender,age,driving year and driving personality were associated with the acceptance of the two CV-VSL technologies differently.This study is beneficial to the functional improvement of on-road DMS,on-board HMI and their market prospects.Originality/value–Previous studies have been conducted to evaluate the effectiveness of CV-VSL systems.However,there were rare studies focused on the drivers’attitude toward using which was also called as acceptance of the CV-VSL systems.Therefore,this research calculated the drivers’acceptance of two normally used CV-VSL systems including on-road DMS and on-board HMI using TAM.Furthermore,variance analysis was conducted to explore whether the factors such as drivers’characteristics(gender,age,driving year and driving personality),technology types and fog density affected the drivers’acceptance of the CV-VSL systems. 展开更多
关键词 Technology acceptance model(TAM) Connected vehicle(CV) Dynamic message sign(DMS) Human machine interface(HMI) Variable speed limit(VSL)
原文传递
基于流式处理架构的日志采集系统的设计与实现
14
作者 邵旭东 樊志杰 +4 位作者 张敬锋 曹志威 周明富 熊已兴 张林 《计算机测量与控制》 2023年第4期272-280,共9页
对信息系统运行记录、操作日志、告警信息的采集问题进行了研究,提出了一种面向泛政府行业安全运行管理平台的统一日志采集系统;采用基于消息队列的流式处理架构,实现日志采集、日志处理、日志上报等各个环节的解耦;采用标准化接口和插... 对信息系统运行记录、操作日志、告警信息的采集问题进行了研究,提出了一种面向泛政府行业安全运行管理平台的统一日志采集系统;采用基于消息队列的流式处理架构,实现日志采集、日志处理、日志上报等各个环节的解耦;采用标准化接口和插件技术,实现各种异构日志信息的采集和数据上报;采用消息队列的流量削峰技术,保证日志传输的安全可靠;依据日志流量特征,提出一种支持动态调整消费组的设计模式,达到超过20000条日志/每秒的高性能采集要求;整个系统由日志采集、数据上报、数据管理、系统管理、策略管理、Agent管理、日志源管理模块和日志采集代理(Agent)子系统组成,可满足对各类安全数据的集中分析、安全威胁感知和智能研判。 展开更多
关键词 安全运行管理平台 标准化接口 插件技术 消息队列 流式架构
下载PDF
基于分布式数据集的并行计算框架内存优化方法 被引量:5
15
作者 夏立斌 刘晓宇 +1 位作者 姜晓巍 孙功星 《计算机工程》 CAS CSCD 北大核心 2023年第4期43-51,共9页
随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型... 随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型和计算框架难以兼顾易用性和计算性能,并且在数据格式定义、内存分配、内存使用效率等方面存在不足。提出一种基于分布式数据集的并行计算方法,分别从模型理论和系统开销两个角度对内存计算进行优化。在理论上,通过对计算过程进行建模分析,以解决Spark在科学计算环境下表达能力不足的问题,同时给出计算框架的开销模型,为后续性能优化提供支持。在系统上,提出一种框架级的内存优化方法,该方法主要包括对跨语言分布式内存数据集的重构、分布式共享内存的管理、消息传递过程的优化等模块。实验结果表明,基于该优化方法实现的并行计算框架可以显著提升数据集的内存分配效率,减少序列化/反序列化开销,缓解内存占用压力,应用测试的执行时间相比Spark减少了69%~92%。 展开更多
关键词 内存计算 并行计算 内存优化 Spark框架 消息传递接口
下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:4
16
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
下载PDF
北斗短报文服务系统与终端接口设计 被引量:1
17
作者 李晨浩 宁蓓 +1 位作者 杨淙喜 何泽骅 《船电技术》 2023年第2期9-13,共5页
北斗短报文服务系统决定申请成为符合全球海上遇险与安全系统(GMDSS)要求的卫星通信服务提供方。本文在不较多改变现有北斗短报文体制的大框架之下,设计出一种兼容北斗GMDSS短报文服务系统与终端之间短报文接口,并通过“报警”、“位置... 北斗短报文服务系统决定申请成为符合全球海上遇险与安全系统(GMDSS)要求的卫星通信服务提供方。本文在不较多改变现有北斗短报文体制的大框架之下,设计出一种兼容北斗GMDSS短报文服务系统与终端之间短报文接口,并通过“报警”、“位置报告”、“一般通信”、“广播”四个类型分别描述。接口满足国际海事组织(IMO)和国际电工委员会(IEC)的相关要求,而无需变更北斗短报文空间接口和终端模块设计,降低了终端的研发成本和北斗短报文服务系统加入GMDSS的改造难度。 展开更多
关键词 GMDSS 北斗短报文 终端 接口设计
下载PDF
基于“嵩山”超级计算机的UCX库分析与优化
18
作者 刘康 万伟 +2 位作者 刘波 李俊宏 李柱 《计算机工程》 CAS CSCD 北大核心 2023年第12期274-281,共8页
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能... UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。 展开更多
关键词 UCX框架 高性能计算 集合通信 InfiniBand协议 共享内存 消息传递接口 高速网络
下载PDF
基于北斗压缩编码传输的海气界面监测系统 被引量:3
19
作者 杨少龙 黄金 +1 位作者 李伟超 陈松豪 《中国航海》 CSCD 北大核心 2023年第1期66-72,共7页
研究一种基于北斗短报文压缩编码传输的海气界面监测系统,以海气界面探测气象站为离岸平台,实现分钟级高频采集海上特定位置风速、风向和卫星数量等气象数据,将原始气象数据经数据压缩和传输压缩处理后由北斗二代通信终端传至岸基海洋... 研究一种基于北斗短报文压缩编码传输的海气界面监测系统,以海气界面探测气象站为离岸平台,实现分钟级高频采集海上特定位置风速、风向和卫星数量等气象数据,将原始气象数据经数据压缩和传输压缩处理后由北斗二代通信终端传至岸基海洋气象监测站。数据压缩中针对风向数据均值过程中存在跨越0°~360°线以及低速风向测量误差大等问题,提出一种基于概率统计的改进单位矢量平均算法,试验表明:处理后的平均风向数据更加平滑;针对北斗小通信量所面临的数据传输压缩问题,提出一种部分增量式取整定长字典编码方法数据压缩率达36.0%,正确率达97.8%,满足北斗民用级别短报文通信传输限制。 展开更多
关键词 海气界面监测 北斗短报文通信 改进单位矢量平均 压缩编码 数据字典
下载PDF
三维声传播模型BELLHOP3D的信息传递接口并行优化
20
作者 周益清 骆文于 吴双林 《应用声学》 CSCD 北大核心 2023年第1期93-99,共7页
近些年,我国对海洋不断深入的探索对复杂环境中声场的快速预报提出了越来越高的需求。BELLHOP3D是一种基于射线法的三维声传播计算模型,在海洋声学中应用十分广泛。BELLHOP3D的计算效率比其他常用模型高,但是仍然有非常大的提升空间。... 近些年,我国对海洋不断深入的探索对复杂环境中声场的快速预报提出了越来越高的需求。BELLHOP3D是一种基于射线法的三维声传播计算模型,在海洋声学中应用十分广泛。BELLHOP3D的计算效率比其他常用模型高,但是仍然有非常大的提升空间。该文使用信息传递接口对BELLHOP3D进行粗粒度的并行优化,并行后的程序计算结果稳定可靠,并行效率高,更适合在实际应用中实现快速的声场预报。并行BELLHOP3D程序可以在https://github.com/nj-zyq/BELLHOP3D_MPI.git下载。 展开更多
关键词 海洋声学 水下声传播 射线法 BELLHOP3D 信息传递接口并行
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部