期刊文献+
共找到391篇文章
< 1 2 20 >
每页显示 20 50 100
Typhoon Case Comparison Analysis Between Heterogeneous Many-Core and Homogenous Multicore Supercomputing Platforms
1
作者 LIU Xin YU Xiaolin +5 位作者 ZHAO Haoran HAN Qiqi ZHANG Jie WANG Chengzhi MA Weiwei XU Da 《Journal of Ocean University of China》 SCIE CAS CSCD 2023年第2期324-334,共11页
In this paper,a typical experiment is carried out based on a high-resolution air-sea coupled model,namely,the coupled ocean-atmosphere-wave-sediment transport(COAWST)model,on both heterogeneous many-core(SW)and homoge... In this paper,a typical experiment is carried out based on a high-resolution air-sea coupled model,namely,the coupled ocean-atmosphere-wave-sediment transport(COAWST)model,on both heterogeneous many-core(SW)and homogenous multicore(Intel)supercomputing platforms.We construct a hindcast of Typhoon Lekima on both the SW and Intel platforms,compare the simulation results between these two platforms and compare the key elements of the atmospheric and ocean modules to reanalysis data.The comparative experiment in this typhoon case indicates that the domestic many-core computing platform and general cluster yield almost no differences in the simulated typhoon path and intensity,and the differences in surface pressure(PSFC)in the WRF model and sea surface temperature(SST)in the short-range forecast are very small,whereas a major difference can be identified at high latitudes after the first 10 days.Further heat budget analysis verifies that the differences in SST after 10 days are mainly caused by shortwave radiation variations,as influenced by subsequently generated typhoons in the system.These typhoons generated in the hindcast after the first 10 days attain obviously different trajectories between the two platforms. 展开更多
关键词 heterogeneous many-core supercomputing platform homogenous multicore supercomputing platform comparison analysis typhoon case
下载PDF
Cosimulation Platform for Distributed Control System via Heterogeneous Network
2
作者 宋杨 胡春燕 +1 位作者 胡佳磊 侯维岩 《Journal of Donghua University(English Edition)》 EI CAS 2016年第5期729-733,共5页
A cosimulation platform was established for distributed control systems via heterogeneous network,which integrated OPNET and Matlab/Simulink.The communication node in this cosimulation platform was built based on OSI ... A cosimulation platform was established for distributed control systems via heterogeneous network,which integrated OPNET and Matlab/Simulink.The communication node in this cosimulation platform was built based on OSI model and UDP protocol,which was adopted as the transportation layer protocol.Data exchanged between the data source module and the specified node.It was fulfilled by revising the corresponding protocol modules based on the characteristics of UDP.The effectiveness of the constructed simulation platform was demonstrated by a numerical example. 展开更多
关键词 heterogeneous OPNET exchanged specified routing transportation handle packet throughput adjust
下载PDF
智能云平台异构数据库协同检索算法研究 被引量:1
3
作者 倪强 周守东 宋婷婷 《保定学院学报》 2024年第2期91-97,共7页
智能云平台是一种集成各种资源和功能的高效计算平台,可以为用户提供灵活的数据存储和高效的数据检索服务.随着信息技术飞速发展,异构数据库中数据呈爆炸式增长.为了提升网络异构数据库检索效果,提出智能云平台异构数据库协同检索算法.... 智能云平台是一种集成各种资源和功能的高效计算平台,可以为用户提供灵活的数据存储和高效的数据检索服务.随着信息技术飞速发展,异构数据库中数据呈爆炸式增长.为了提升网络异构数据库检索效果,提出智能云平台异构数据库协同检索算法.构建智能云平台异构数据库,均衡异构数据库中的节点能耗;排序云平台多源异构数据,预处理异构数据;建立以索引库为核心的检索服务引擎,利用神经网络提取多源异构数据特征,实现异构数据库的匹配检索.测试结果表明,所提算法查准率为96%,查全率为94%,数据丢失量仅为1.由此证明,所提方法有效提高了网络异构数据库检索效果. 展开更多
关键词 云平台 异构数据库 索引库 神经网络 匹配检索
下载PDF
电力系统全纯嵌入潮流的并行计算
4
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 CPU-GPU异构运算平台 预处理器
下载PDF
融合跨平台用户偏好与异质信息网络的推荐算法研究
5
作者 张雪 毕达天 +1 位作者 陈功坤 杜小民 《现代情报》 CSSCI 北大核心 2024年第9期31-41,共11页
[目的/意义]本文基于跨平台用户的异构大数据,提出一种融合跨平台用户偏好与异质信息网络的推荐算法(CPHAR),对于缓解个性化推荐的稀疏性和冷启动问题具有重要意义。[方法/过程]首先,根据跨平台用户信息构建核心兴趣朋友圈,使用卷积神... [目的/意义]本文基于跨平台用户的异构大数据,提出一种融合跨平台用户偏好与异质信息网络的推荐算法(CPHAR),对于缓解个性化推荐的稀疏性和冷启动问题具有重要意义。[方法/过程]首先,根据跨平台用户信息构建核心兴趣朋友圈,使用卷积神经网络和自注意力机制捕捉用户在源平台和目标平台中的信息偏好特征;其次,根据核心兴趣网络以及推荐项目之间的关系构建异质信息网络,使用异质图注意力网络模型进行特征聚合;最后,将以上特征嵌入改进后的矩阵分解模型,计算推荐得分。[结果/结论]模型在自主构建的4个跨平台数据集中均表现出优越的性能,本文不仅弥补了推荐领域中跨平台多属性和细粒度数据集的空缺,而且通过引入跨平台特征进一步完善了推荐系统相关的理论与方法体系。 展开更多
关键词 推荐算法 跨平台 异质信息网络 用户偏好 深度学习
下载PDF
基于知识标注平台的水利枢纽工程知识图谱构建及应用
6
作者 张军珲 昝红英 +2 位作者 欧佳乐 阎子悦 张坤丽 《计算机科学》 CSCD 北大核心 2024年第11期255-264,共10页
大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知... 大量水利异构数据的产生,为领域知识图谱的构建及应用提供了场景,但也导致了水利知识图谱构建过程的差异。针对现有水利知识图谱构建流程复杂的问题,提出了一套有效的基于知识标注平台的水利知识图谱构建流程。以小浪底水利枢纽工程知识的智能应用为例,使用该枢纽的工程数据,应用提出的流程在水利领域构建水利枢纽工程知识图谱(Water Conservancy Hub Project Knowledge Graph,WCHP-KG)。首先以小浪底水利枢纽工程为中心,依据行业术语标准和现有词汇表,制定了概念分类和关系描述体系,形成了WCHP-KG的模式层。通过BiLSTM-CRF和序列标注模型,在水利专家的指导下,使用知识标注平台对非结构化文本进行了半自动标注和人工校对,实现了知识融合,进而构建了WCHP-KG的数据层。结果表明WCHP-KG涵盖了43种水利实体以及110种实体关系。经过实践验证,构建的WCHP-KG为小浪底水利枢纽工程的相关应用提供了有力的结构化知识基础,为工程决策和管理提供了可靠的参考依据,进而证明了所提构建流程的有效性。未来将进一步扩展WCHP-KG和完善水利知识图谱的构建流程,以适应更多的应用场景和领域需求。 展开更多
关键词 异构数据 领域知识图谱 知识图谱构建 水利枢纽 知识标注平台
下载PDF
基于云边协同的通用板级自动测试系统方案设计
7
作者 林连冬 于化男 +2 位作者 朱贺 蓝润泽 陈滨 《黑龙江大学自然科学学报》 CAS 2024年第4期485-495,共11页
针对当前数字电路自动测试领域,对通用板级自动测试系统进行了设计,完成了系统方案的设计开发和测试验证。为了解决通用板级自动测试系统的测试数据量大、本地存储容量不足、测试向量与被测试目标无法自动化匹配、无法进行批量快速测试... 针对当前数字电路自动测试领域,对通用板级自动测试系统进行了设计,完成了系统方案的设计开发和测试验证。为了解决通用板级自动测试系统的测试数据量大、本地存储容量不足、测试向量与被测试目标无法自动化匹配、无法进行批量快速测试等问题,采用云边协同架构设计了通用板级自动测试系统,避免了大量数据传输和数据集中式处理,使得云端计算资源能够集中解决关键数据处理任务。为了提高板级测试平台的通用性,使平台适配不同接口的电路板,同时具有高速网络数据处理能力,系统选用精简命令集处理器和现场可编程门阵列(Advanced RISC machines,Filed programmable gate array,ARM+FPGA)的异构计算平台作为边缘设备。为了提高系统的测试效率,采用模块化的设计思想,系统硬件测试平台设计了多总线分布式结构。系统采用扇出导向(Fan-out-oriented,FAN)算法生成测试向量,并基于浏览器/服务器(Brower/Server,B/S)架构设计了用户操作界面,用户可通过浏览器进行测试操作,完成板级自动故障测试,并自动生成故障诊断报告。实验结果表明,对两个待测板卡进行测试验证,通用板级自动测试系统可以自动识别目标板卡,自动匹配测试向量,进行自动测试,生成测试报表。基于云边协同的通用板级自动测试系统提高了测试效率,满足数字电路板卡出厂前批量测试的需求,具有实际应用价值。 展开更多
关键词 云边协同 通用板级自动测试 FAN算法 异构计算平台
下载PDF
基于异构平台的卷积神经网络加速系统设计 被引量:2
8
作者 秦文强 吴仲城 +1 位作者 张俊 李芳 《计算机工程与科学》 CSCD 北大核心 2024年第1期12-20,共9页
在计算和存储资源受限的嵌入式设备上部署卷积神经网络,存在执行速度慢、计算效率低、功耗高的问题。提出了一种基于异构平台的新型卷积神经网络加速架构,设计并实现了基于MobileNet的轻量化卷积神经网络加速系统。首先,为降低硬件资源... 在计算和存储资源受限的嵌入式设备上部署卷积神经网络,存在执行速度慢、计算效率低、功耗高的问题。提出了一种基于异构平台的新型卷积神经网络加速架构,设计并实现了基于MobileNet的轻量化卷积神经网络加速系统。首先,为降低硬件资源消耗以及数据传输成本,采用动态定点数量化和批标准化融合的设计方法,对网络模型进行了优化,并降低了加速系统的硬件设计复杂度;其次,通过实现卷积分块、并行卷积计算、数据流优化,有效提高了卷积运算效率和系统吞吐率。在PYNQ-Z2平台上的实验结果表明,此加速系统实现的MobileNet网络推理加速方案对单幅图像的识别时间为0.18 s,系统功耗为2.62 W,相较于ARM单核处理器加速效果提升了128倍。 展开更多
关键词 现场可编程门阵列(FPGA) Vivado高层次综合 卷积神经网络 异构平台 硬件加速
下载PDF
基于改进蚁群的异构平台负载均衡调度算法 被引量:1
9
作者 李宇东 马金全 +2 位作者 胡泽明 岳春生 谢宗甫 《信息工程大学学报》 2024年第1期30-38,共9页
针对目前异构平台中信号处理任务的调度算法单一、处理器资源浪费等问题,提出了一种面向异构系统的Q学习改进蚁群算法的负载均衡调度算法。算法针对计算密集型和通信密集型任务的不同需求,设计了分流排序法进行任务优先级排序;通过场景... 针对目前异构平台中信号处理任务的调度算法单一、处理器资源浪费等问题,提出了一种面向异构系统的Q学习改进蚁群算法的负载均衡调度算法。算法针对计算密集型和通信密集型任务的不同需求,设计了分流排序法进行任务优先级排序;通过场景适配将Q学习和蚁群算法,与异构平台中的任务调度进行映射。通过奖励函数计算Q-Table,作为蚁群算法的初始信息素,加快了蚁群的收敛速度;根据处理器的实时负载,设计负载矩阵,实现了动态调整系统负载均衡;利用伪随机比例规则选择处理器,通过任务之间的约束关系形成调度列表来完成任务的分配。最后,通过随机生成的有向无环图进行仿真实验,结果表明算法在减小最大完工时间(调度长度)和提高处理器利用率方面均有明显的改进。 展开更多
关键词 任务调度 异构信号处理平台 Q学习 蚁群算法
下载PDF
面向异构处理平台任务调度的麻雀优化算法 被引量:2
10
作者 沈小龙 马金全 +3 位作者 冀亚玮 谢宗甫 李宜亭 李宇东 《电子科技》 2024年第1期33-40,共8页
针对当前异构信号处理平台中各处理器任务数量分配不均衡、处理器性能发挥不完全以及系统运行效率低的问题,文中提出一种面向异构处理平台的麻雀优化算法。该算法利用了麻雀算法较强的全局寻优能力和麻雀种群内部的高效工作机制。在经... 针对当前异构信号处理平台中各处理器任务数量分配不均衡、处理器性能发挥不完全以及系统运行效率低的问题,文中提出一种面向异构处理平台的麻雀优化算法。该算法利用了麻雀算法较强的全局寻优能力和麻雀种群内部的高效工作机制。在经典麻雀算法基础上,文中提出了符合任务调度的二进制异或编解码规则,将离散的任务分配方案映射为连续的麻雀位置信息。将处理器负载均衡指数作为适应度函数,选取每次迭代中的最优解;在麻雀遍历任务时,采用任务优先级分流排序策略。对通信密集型任务和计算密集型任务采取不同的计算式得到更符合任务特点的遍历顺序,生成随机任务图,并将所提算法同ICPA(Improved Critical Path Algortthm)算法进行对比。仿真结果表明,相比于ICPA算法,所提算法的负载均衡指数平均优化率为60%,各处理器负载情况更加均衡,能更好地发挥异构处理平台的整体效能。 展开更多
关键词 异构处理平台 任务调度 麻雀算法 负载均衡 DAG 编码规则 适应度函数 信号处理
下载PDF
面向大规模异构计算平台的MiniGo高效训练方法
11
作者 李荣春 贺周雨 +3 位作者 乔鹏 姜晶菲 窦勇 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期209-218,共10页
提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入... 提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入/输出部署,消除网络通信瓶颈。提出了面向CPU-DSP共享内存结构的异构计算内存管理,减少异构设备间的数据搬运。实现了共享内存编程优化,并利用DSP实现密集卷积计算算子加速优化。结果表明,与16核CPU计算相比,单核DSP算子加速最大加速比达16.44;该方法实现计算节点规模从1 067扩展至4 139,得到达到给定终止条件所需时间从43.02 h降至16.05 h,可扩展效率为69.1%。评估表明,该方法能够实现MiniGo在大规模异构计算平台的高效并行训练。 展开更多
关键词 MiniGo 大规模异构计算平台 数字信号处理器
下载PDF
基于国产DCU异构平台的图匹配算法移植与优化
12
作者 郝萌 田雪洋 +3 位作者 鲁刚钊 刘义 张伟哲 何慧 《计算机科学》 CSCD 北大核心 2024年第4期67-77,共11页
子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅... 子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅度减少存储开销,提升子图匹配性能。但由于平台底层硬件架构和编译环境的不同,GENEVA无法直接应用到国产DCU异构平台。为了解决该问题,提出了GENEVA面向国产DCU的移植和优化方案。IO时间开销是GENEVA算法主要的性能瓶颈,文中采用锁页内存、预加载、调度器3种优化策略来突破该瓶颈。其中,锁页内存技术避免了从可分页内存到临时锁页内存的额外数据传输,在DCU平台上大幅度减少了IO传输的时间开销;预加载技术将IO数据传输与DCU核函数计算重叠,掩盖了IO时间开销;调度器在满足预加载需求的同时,减少了冗余数据的传输。在3个不同规模的真实数据集上进行实验,结果表明,采用优化策略后算法性能显著提高。在92.6%的测试用例上,经过优化的GENEVA-HIP算法在国产DCU平台的执行时间比移植前的GENEVA算法在GPU服务器的执行时间短。在较大规模的数据集上,优化的GENEVA-HIP算法在DCU平台上的执行时间相比移植前的GENEVA算法在GPU服务器的执行时间减少了52.73%。 展开更多
关键词 子图匹配 DCU 异构平台 HIP 移植和优化
下载PDF
异构多平台信号处理任务调度研究 被引量:1
13
作者 李宇东 马金全 +1 位作者 谢宗甫 沈小龙 《电子科技》 2024年第1期24-32,共9页
简单的并行计算或单一异构平台已经无法满足计算量大、复杂度高的信号处理和任务调度需求,异构多平台系统已经成为信号处理和任务调度的发展趋势。针对提高平台的吞吐量、处理器的利用率以及任务的感知等问题,文中对异构多平台信号处理... 简单的并行计算或单一异构平台已经无法满足计算量大、复杂度高的信号处理和任务调度需求,异构多平台系统已经成为信号处理和任务调度的发展趋势。针对提高平台的吞吐量、处理器的利用率以及任务的感知等问题,文中对异构多平台信号处理模型进行了研究,并利用有向无环图对调度任务和软硬件资源建模。基于已提出的调度算法,对任务调度进行了归纳总结、对比分析,发现基于任务感知的混合调度算法能够较好地满足平台调度需求。利用基于任务感知的混合调度算法解决信号处理中的任务调度将是未来研究发展的趋势。 展开更多
关键词 异构多平台信号处理 软件体系 硬件架构 任务调度 任务感知 算法分类 有向无环图 混合算法
下载PDF
面向国产异构DCU平台的大规模并行矩量法研究
14
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
下载PDF
基于向量引用Platform-Oblivious内存连接优化技术 被引量:2
15
作者 张延松 张宇 王珊 《软件学报》 EI CSCD 北大核心 2018年第3期883-895,共13页
以MapD为代表的图分析数据库系统通过GPU、Phi等新型众核处理器来支持高性能分析处理,在面向复杂数据模式时,连接操作仍然是重要的性能瓶颈.近年来,异构处理器逐渐成为高性能计算的主流平台,内存连接性能的研究从多核CPU平台扩展到新兴... 以MapD为代表的图分析数据库系统通过GPU、Phi等新型众核处理器来支持高性能分析处理,在面向复杂数据模式时,连接操作仍然是重要的性能瓶颈.近年来,异构处理器逐渐成为高性能计算的主流平台,内存连接性能的研究从多核CPU平台扩展到新兴的众核处理器,但众多的研究成果并未系统地揭示连接算法性能、连接数据集大小、硬件架构之间的内在联系,难以为未来异构处理器平台的数据库提供连接平台优化选择策略.以面向多核CPU、Xeon Phi、GPU处理器平台的内存连接优化技术为目标,通过优化内存哈希表设计,实现以向量映射替代哈希映射操作,消除哈希代价对内存连接算法的影响,从而更加准确地测量内存连接算法在多核CPU的cache大小、Xeon Phi的cache大小、Xeon Phi的并发多线程、GPU的SIMT(单指令多线程)机制等硬件相关因素影响下的性能特征.实验结果表明,缓存与并发多线程机制是提高内存连接算法性能的重要影响因素.缓存机制对于满足cache大小的连接操作具有性能优势,而GPU的并发多线程机制则在较大表的连接操作中具有较高的性能,Xeon Phi则在满足其L2 cache大小的连接操作中具有最高性能.实验结果揭示了内存连接操作性能与异构处理器硬件特性的联系,为未来异构处理器平台内存数据库查询优化器提供了优化策略. 展开更多
关键词 内存连接操作 哈希连接 向量映射 异构处理器平台
下载PDF
基于鲲鹏和昇腾异构平台的单节点HPL-AI设计与优化
16
作者 吴昊天 任长青 +2 位作者 陆璐 徐鹏翔 杨凯 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期13-22,共10页
鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试... 鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试被提出,用于评估高性能系统的混合精度运算性能。针对该基准测试,本研究在鲲鹏和昇腾异构平台上设计并优化了单节点HPL-AI基准测试的实现。其主要通过循环任务分配的策略将任务均匀地分配给AI处理器以平衡AI处理器的负载;通过带间隔值的任务分配策略提高数据传输的连续性来减少CPU和AI处理器之间的数据传输时间;在不影响计算精度的情况下,通过取消数据缩放的策略来减少CPU侧的计算量。最终实验结果表明:当间隔值为8时,HPL-AI基准测试的混合精度浮点运算速度最快;同时,取消数据缩放不会对HPL-AI基准测试的结果精度产生影响;在鲲鹏和昇腾异构平台上,与非优化的HPL-AI基准测试方法相比,本研究提出的优化策略使混合精度浮点运算速度提升了29%左右,为单节点HPL-AI基准测试的进一步优化和部署多节点HPL-AI基准测试奠定了坚实的基础。 展开更多
关键词 鲲鹏 昇腾 异构平台 基准测试 高性能计算 混合精度
下载PDF
异构无人平台软件框架的研究综述
17
作者 李墈婧 叶亚峰 张宁 《计算机工程与设计》 北大核心 2024年第4期1272-1280,F0003,共10页
通过对异构无人平台软件框架的研究开展相关综述,对该研究的必要性及关键性进行全面总结。介绍目前无人平台软件框架的研究现状,重点关注目前基于云平台的软件框架的优缺点及发展趋势;考虑智能汽车和无人平台具有相通之处,进一步说明智... 通过对异构无人平台软件框架的研究开展相关综述,对该研究的必要性及关键性进行全面总结。介绍目前无人平台软件框架的研究现状,重点关注目前基于云平台的软件框架的优缺点及发展趋势;考虑智能汽车和无人平台具有相通之处,进一步说明智能汽车领域软件框架的研究现状,针对“软件定义汽车”的发展思路真正实现软硬解耦和远程升级;分析异构无人平台软件框架涉及的关键性技术,对该领域的未来发展趋势进行展望。 展开更多
关键词 异构无人平台 软件框架 云平台 智能汽车 软件定义汽车 软硬解耦 远程升级
下载PDF
面向异构信号处理平台的量子调度算法
18
作者 沈小龙 马金全 +2 位作者 胡泽明 李娜 李宇东 《电子科技》 2024年第3期84-90,共7页
针对异构信号处理平台中已有调度算法的调度长度较大导致信号处理应用实时性下降问题,文中提出一种面向异构信号处理平台的量子调度算法。该算法采用任务优先级分流排序策略,得到更加准确的任务调度顺序。使用量子比特对任务分配方案进... 针对异构信号处理平台中已有调度算法的调度长度较大导致信号处理应用实时性下降问题,文中提出一种面向异构信号处理平台的量子调度算法。该算法采用任务优先级分流排序策略,得到更加准确的任务调度顺序。使用量子比特对任务分配方案进行编码,增加任务分配方案的多样性,且编码规则有助于跳出局部最优找到全局最优解。按照最小计算开销原则和任务复制思想进行处理器分配,减少任务间通信开销,并通过量子旋转门对量子编码方案进行更新,不断逼近最优解。仿真结果表明,所提算法能够减少调度长度,提升信号处理应用的实时性,进而提高平台的工作效率。 展开更多
关键词 任务调度 异构信号处理平台 DAG 量子算法 量子比特 量子旋转门 调度长度 信号处理
下载PDF
基于OpenVPX标准的异构融合处理模块软硬件协同设计研究
19
作者 文敏华 石添介 田径 《弹箭与制导学报》 北大核心 2024年第3期103-108,共6页
随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并... 随着计算机软硬件技术的持续进步,机载计算平台集成的任务功能日益增多,导致平台内部的计算需求在规模和复杂性上不断攀升。面对智能化应用的迅猛增长,传统的单一处理器架构已不足以应对多样化的复杂任务。为此,基于OpenVPX标准,定义并设计了一种符合硬件开放式架构的3U异构融合处理模块,以适应多种复杂任务的需求。文中还提出了一种异构计算资源池化技术,旨在实现多类型任务应用的快速部署和高效运行,同时降低通信延迟,显著提升计算平台的处理能力和适用性。最后进行了实验验证,结果表明与多CPU架构相比,文中所设计的异构融合处理模块在执行特定神经网络算法时,处理时间缩短了约4.8倍,证明了其在性能上的显著提升。该研究成果不仅展示了异构融合处理模块在机载智能计算应用中的显著性能优势,而且为航空计算平台的未来发展提供了创新的解决方案和技术支持。 展开更多
关键词 机载计算平台 OpenVPX 硬件开放式架构 异构融合处理 资源池化
下载PDF
基于联盟博弈的无人机/无人车异构集群验证
20
作者 王浩淼 袁莞迈 +3 位作者 马可 张颖 申燕凯 魏晨 《工程科学学报》 EI CSCD 北大核心 2024年第7期1207-1215,共9页
无人异构集群相较于单一类型、单一个体的无人平台,能够完成更为复杂的任务,同时对严苛战场环境有着更高的适应度.在无人异构集群协同执行任务时,任务分配是至关重要的环节,需要考虑异构无人平台和任务的多种约束和目标.传统的任务分配... 无人异构集群相较于单一类型、单一个体的无人平台,能够完成更为复杂的任务,同时对严苛战场环境有着更高的适应度.在无人异构集群协同执行任务时,任务分配是至关重要的环节,需要考虑异构无人平台和任务的多种约束和目标.传统的任务分配方法分配效率低且难以处理大规模复杂任务.联盟博弈通过形成由若干参与者组成的联盟,根据个体的属性、偏好对群体进行划分,从而实现个体以及群体利益的最大化.本文以无人异构集群任务分配为背景,研究了基于改进联盟博弈算法的最优分配策略,基于可能的战场环境设计了模拟任务场景并完成实验验证.首先,考虑异构平台在任务中的初始位置、速度、携带资源以及个体声誉等因素,建立了基于空间自适应博弈(Spatial adaptive play algorithm, SAP)的联盟博弈的任务分配算法模型.其次,基于任务场景,搭建了任务所需的软件与硬件平台.最后,针对模拟的战场环境,对所提算法及搭建的异构无人集群平台进行了实验验证.验证结果表明,在异构无人集群平台重分配的任务背景下,本平台能综合考虑战场态势,寻找最优的任务分配方式,协调各作战单位完成任务目标. 展开更多
关键词 联盟博弈 无人集群系统 异构平台 任务分配 战场态势 空间自适应博弈
下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部