期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向ARM64架构多核微处理器的模板计算性能优化研究 被引量:3
1
作者 冯璐霞 李春江 黄亚斌 《计算机工程与科学》 CSCD 北大核心 2017年第5期829-833,共5页
模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC... 模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC X-GENE2和飞腾FT-1500A多核微处理器特点,提出了基于两维度绑定的优化方法,该方法通过线程与CPU绑定以及线程与数据块绑定,减少了线程调度的并行开销,增加了Cache的命中率。实验结果表明,该方法提升了模板计算在ARM64架构多核微处理器上的性能,且在两种ARM64架构多核微处理器平台上都表现出较好的可扩展性。 展开更多
关键词 模板计算 arm64 AMCC X-GENE2 FT-1500A 并行化 线程绑定
下载PDF
基于ARM64与X86混合云的NFV媒体服务器并发性能对比测试研究
2
作者 陈杨 刘作 +1 位作者 龙俊霖 黎聪 《通信技术》 2021年第8期2051-2056,共6页
以5G与云计算技术的日益发展为背景,以对比国产化ARM64与X86指令集架构处理器承载5G VNF应用的性能差异为目的,组建基于指令集异构服务器的网络功能虚拟化(Network Function Virtualization,NFV)基础环境,介绍NFV与容器云技术,着重分析... 以5G与云计算技术的日益发展为背景,以对比国产化ARM64与X86指令集架构处理器承载5G VNF应用的性能差异为目的,组建基于指令集异构服务器的网络功能虚拟化(Network Function Virtualization,NFV)基础环境,介绍NFV与容器云技术,着重分析两者相结合所形成的技术优势,提出了针对异构网络性能对比的测试框架与方法。通过以50话路并发为粒度递增并发呼叫量采集系统资源用量数据的方式,对结果数据进行分析与对比,得出性能对比结论,为VNF应用国产化ARM64环境部署提供参考经验。 展开更多
关键词 网络功能虚拟化 媒体服务器 arm64 异构网络 虚拟化技术
下载PDF
ARM计算环境下堆芯程序的移植
3
作者 明平洲 李治刚 +4 位作者 刘婷 芦韡 刘东 曾辉 余红星 《计算机工程与科学》 CSCD 北大核心 2021年第4期681-688,共8页
为了论证国产芯片在堆芯数值计算领域的可行性,对多个堆芯程序在飞腾处理器的ARM通用计算环境中进行了移植,涉及堆芯燃料管理软件的扩散原型程序NACK-R、子通道分析程序CORTH、特征线输运程序OpenMOC和堆芯组件程序KYLIN2。移植过程在AR... 为了论证国产芯片在堆芯数值计算领域的可行性,对多个堆芯程序在飞腾处理器的ARM通用计算环境中进行了移植,涉及堆芯燃料管理软件的扩散原型程序NACK-R、子通道分析程序CORTH、特征线输运程序OpenMOC和堆芯组件程序KYLIN2。移植过程在ARM计算环境中通过合理的程序代码修订,去除对商业函数库的依赖,且在移植过程中对KYLIN2的特征线循环扫描计算过程引入OpenMP多线程并行,论证单结点多个飞腾处理器核心的并行能力。参照对象Intel商用处理器的频率约为飞腾处理器频率的2倍,堆芯程序移植后的串行运行效率与在Intel计算环境中的串行运行效率差异保持在3~4倍,受限于所使用飞腾处理器型号的缓存大小,部分数据量较大例题的性能差异可能更大。KYLIN2完成多线程并行后计算效率接近在Intel处理器上的串行效率,证明单结点多个飞腾处理器核心能够替换部分堆芯数值计算既有的应用场景。移植结果也表明,混合不同处理器的异构设计,能够在计算资源紧张的情况下充分利用国产硬件,提升计算环境的整体利用效率。 展开更多
关键词 堆芯计算 节块法 子通道 特征线方法 arm64 程序移植 OPENMP
下载PDF
ARM计算环境下堆芯程序CORTH和KYLIN2的移植
4
作者 明平洲 芦韡 +2 位作者 刘东 曾辉 余红星 《中国核电》 2021年第1期26-30,共5页
为了论证国产芯片在堆芯数值计算领域的可行性,对子通道计算软件CORTH和堆芯组件程序KYLIN2的串行版本在飞腾处理器的ARM计算环境进行了移植。移植过程在ARM计算环境下通过合理的程序代码修订,去除对商业函数库的依赖,且在特征线循环结... 为了论证国产芯片在堆芯数值计算领域的可行性,对子通道计算软件CORTH和堆芯组件程序KYLIN2的串行版本在飞腾处理器的ARM计算环境进行了移植。移植过程在ARM计算环境下通过合理的程序代码修订,去除对商业函数库的依赖,且在特征线循环结构的扫描计算过程引入OpenMP多线程并行。实验参照对象为频率两倍差异的Intel商用处理器。结果表明CORTH程序和KYLIN2均能够成功移植,且与Intel商用处理器的数值稳定性保持一致。计算效率方面CORTH程序移植后的串行效率与Intel计算环境差异较小;KYLIN2移植后的串行效率较低,但通过线程并行后计算效率接近Intel处理器的串行效率。移植结果论证集群系统这种混合国际和国内处理器的资源结构,能够在计算资源紧张的情况下充分利用国产硬件,提升计算环境的整体利用效率。 展开更多
关键词 堆芯计算 子通道方法 特征线方法 arm64 程序移植
下载PDF
基于鲲鹏处理器的媒体网关适配及稳定性研究 被引量:3
5
作者 刘作 陈杨 陈雄博 《现代信息科技》 2020年第20期74-77,共4页
实现关键IT基础设施国产化自研,以及基于国产化环境的应用适配,符合未来可持续长远发展趋势,为了实现媒体网关向国产化服务器基础环境平稳迁移部署,搭建了国产化ARM64架构服务器环境,进行容器化媒体网关镜像制作及适配部署,对依赖组件... 实现关键IT基础设施国产化自研,以及基于国产化环境的应用适配,符合未来可持续长远发展趋势,为了实现媒体网关向国产化服务器基础环境平稳迁移部署,搭建了国产化ARM64架构服务器环境,进行容器化媒体网关镜像制作及适配部署,对依赖组件进行全量分析与整合,通过阶梯性增加并发通话数量对部署后的应用服务进行了稳定性测试及长通话测试,测试结果满足媒体网关线上使用要求,为电信业务迁移适配国产化服务器提供了参考经验。 展开更多
关键词 arm64架构 容器化部署 国产化适配 媒体网关
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部