期刊文献+
共找到20,506篇文章
< 1 2 250 >
每页显示 20 50 100
基于PCIe总线的主从CPU数据传输系统设计与实现
1
作者 龚行梁 李德文 +1 位作者 陈龙 王亮 《工业控制计算机》 2024年第5期1-3,6,共4页
电力系统保护自动化设备存在多CPU板卡间高速数据传输和存储需求,介绍了一种基于PCIe总线接口实现的主从CPU数据传输系统。采用飞腾FT2000/4处理器为核心构建硬件系统,通过嵌入式Linux操作系统、PCIe设备驱动和应用程序部署软件系统,主... 电力系统保护自动化设备存在多CPU板卡间高速数据传输和存储需求,介绍了一种基于PCIe总线接口实现的主从CPU数据传输系统。采用飞腾FT2000/4处理器为核心构建硬件系统,通过嵌入式Linux操作系统、PCIe设备驱动和应用程序部署软件系统,主CPU侧负责数据采集和处理,从CPU侧通过PCIe总线读取数据完成传输和存储功能。测试情况表明,该方案实现的系统稳定可靠,能够有效地满足高速传输、实时存储的应用业务需求,具有较高的工程应用价值。 展开更多
关键词 PCIe总线 主从cpu 数据传输
下载PDF
应用n-LSTM的云平台任务CPU负载预测方法 被引量:1
2
作者 曹振 邓莉 +1 位作者 谢同磊 梁晨君 《小型微型计算机系统》 CSCD 北大核心 2024年第1期75-83,共9页
云平台任务的CPU负载预测有助于云平台资源的优化配置,以改善资源利用率.它是有效管理云资源的重要手段.为提高任务CPU负载预测精度,本文主要做了以下工作:1)利用热度图提取用于进行CPU负载预测的资源使用特征;2)设计并实现了一种基于n-... 云平台任务的CPU负载预测有助于云平台资源的优化配置,以改善资源利用率.它是有效管理云资源的重要手段.为提高任务CPU负载预测精度,本文主要做了以下工作:1)利用热度图提取用于进行CPU负载预测的资源使用特征;2)设计并实现了一种基于n-LSTM的云平台任务的CPU负载预测方法DPFE-n-LSTM;3)分别在阿里云平台数据集和Google云平台数据集上进行了实验,结果表明,相对于目前已经提出的CPU负载预测模型BP、LSTM和CNN-LSTM,DPFE-n-LSTM方法具有更好的预测性能. 展开更多
关键词 特征选择 cpu负载 n-LSTM 时间序列
下载PDF
基于国产ARM架构CPU的导航卫星精密定轨解算效率优化方法
3
作者 廖敏 唐成盼 +5 位作者 周善石 陈建兵 胡小工 冯学斌 陈桂根 李凯 《大地测量与地球动力学》 CSCD 北大核心 2024年第4期366-371,共6页
以国产飞腾CPU为例,讨论在国产ARM架构CPU基础上的导航卫星精密定轨解算效率优化方法。基于导航卫星精密定轨解算流程中钟差约化和法方程求逆耗时较多,分别利用多线程和OpenBlas对上述2个过程进行优化。结果表明,优化后解算效率大幅提... 以国产飞腾CPU为例,讨论在国产ARM架构CPU基础上的导航卫星精密定轨解算效率优化方法。基于导航卫星精密定轨解算流程中钟差约化和法方程求逆耗时较多,分别利用多线程和OpenBlas对上述2个过程进行优化。结果表明,优化后解算效率大幅提升。钟差约化方面,采用100个测站32颗导航卫星进行解算时,原始单历元平均耗时1.105 s,优化后为0.188 s;法方程求逆方面,原始求逆平均耗时2 264 s,优化后仅需78 s。 展开更多
关键词 精密定轨 ARM架构cpu 多线程 OpenBlas
下载PDF
基于MPI的鲲鹏CPU核间通信研究
4
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏cpu 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
面向多核CPU与GPU平台的图处理系统关键技术综述
5
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核cpu与GPU平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
下载PDF
CPU环境下多传感器数据融合的机器人3D目标检测方法
6
作者 楼进 刘恩博 +1 位作者 唐炜 张仁远 《计算机工程与应用》 CSCD 北大核心 2024年第19期120-129,共10页
实时、准确的3D目标检测算法能提供目标的位置和形态信息,为移动机器人实现高效导航、有效避障等各项任务提供保障。现有的3D目标检测算法对硬件设备运算能力的依赖较为严重,为了在确保检测精度的同时降低方法对硬件设备的要求,提出一... 实时、准确的3D目标检测算法能提供目标的位置和形态信息,为移动机器人实现高效导航、有效避障等各项任务提供保障。现有的3D目标检测算法对硬件设备运算能力的依赖较为严重,为了在确保检测精度的同时降低方法对硬件设备的要求,提出一种能部署在移动机器人CPU环境下的多传感器融合3D目标检测方法。方法结合了2D目标检测和点云聚类技术,利用2D目标检测技术从图像中获取目标的检测信息,根据相机与雷达的空间映射关系对检测框内的点云进行分割,并对分割后的点云进行聚类和信息提取,从而实现3D目标的检测和定位功能。通过与经典的多传感器3D目标检测算法MVX-Net的对比,该算法有更优的检测精度,同时具有更小的计算复杂度。此外,该方法在实际移动机器人CPU设备的边缘终端上进行部署分析,算法的处理速度达到0.069s/帧,满足10Hz激光雷达频率的需求。 展开更多
关键词 3D目标检测 多传感器数据融合 cpu 移动机器人
下载PDF
面向众核CPU的稠密线性求解器性能评测与优化
7
作者 付晓 苏醒 +1 位作者 董德尊 钱程东 《计算机工程与科学》 CSCD 北大核心 2024年第6期984-992,共9页
稠密线性求解器在高性能计算和机器学习等领域扮演着重要的角色。其典型的并行算法实现通常构建在著名的fork-join或task-based编程模型之上。尽管采用fork-join模型的主流稠密线性代数库能将大部分的计算转移到高度优化、高性能的BLAS ... 稠密线性求解器在高性能计算和机器学习等领域扮演着重要的角色。其典型的并行算法实现通常构建在著名的fork-join或task-based编程模型之上。尽管采用fork-join模型的主流稠密线性代数库能将大部分的计算转移到高度优化、高性能的BLAS 3例程上,由于fork-join不灵活的执行流,它们仍然未能高效地利用众核CPU的计算资源。采用task-based编程模型的开源库能实现更加灵活、负载更均衡的算法,因此能获得明显的性能提升。然而,在众核CPU平台上,尤其是对于中等矩阵规模的问题而言,它们仍然有较大的优化空间。对稠密线性求解器的性能进行了全面的测评,以定位性能瓶颈,并提出了2种优化策略,以提高程序性能。具体地,通过重叠LU分解和下三角求解的计算过程,减少同步开销线程的空等,从而提高算法的并行性;进一步通过减少冗余的矩阵打包操作,降低算法的访存开销。分别在2个主流的众核CPU平台(Intel®Xeon Gold®6252N(48核)和HiSilicon Kunpeng 920(64核))上进行了性能评估。实验结果表明,该优化的稠密线性求解器在上述两个CPU平台上,相比最佳开源实现分别取得了10.05%(Xeon)和13.63%(Kunpeng 920)的性能提升。 展开更多
关键词 稠密线性求解器 LU分解 fork-join模型 task-based模型 众核cpu
下载PDF
MQTT物联网平台在国产申威CPU平台上的移植部署 被引量:2
8
作者 刘豪杰 艾旭东 《电脑与信息技术》 2024年第3期108-111,共4页
当前国产芯片正在得到大力的推广,国产芯片软件生态也在迅速建设中,文章围绕开源MQTT服务软件在国产申威CPU平台的移植、部署、测试应用,主要讨论MQTT协议以及基于国产申威CPU平台移植部署MQTT服务器的方法,移植完成后通过基于国产CPU... 当前国产芯片正在得到大力的推广,国产芯片软件生态也在迅速建设中,文章围绕开源MQTT服务软件在国产申威CPU平台的移植、部署、测试应用,主要讨论MQTT协议以及基于国产申威CPU平台移植部署MQTT服务器的方法,移植完成后通过基于国产CPU服务器搭建物联网平台进行测试,测试系统采用B/S系统架构,实现了多个客户端之间通过MQTT服务实现数据的交换。目的在于推广基于国产芯片的国产软件生态建设,让更多的人参与到国产芯片的软件生态建设中,有利于积极推进各种软件项目从底层到应用层的国产化发展,为信创国产化事业添砖加瓦。 展开更多
关键词 cpu 申威 物联网 MQTT 国产芯片
下载PDF
信创CPU与Intel CPU在NUMA架构方面的调优实践
9
作者 徐光龙 金鹰 《计算机应用文摘》 2024年第3期35-37,共3页
通过选取具有代表性的基准测试工具,文章对比了信创CPU和IntelCPU在多核性能方面的表现。同时,针对NUMA架构的特点进行了调优实验,并通过分析性能数据得出了调优前后的性能差异。结果表明,通过NUMA调优可以有效提高处理器的性能。
关键词 NUMA调优 信创cpu Intelcpu 性能对比测试 基准测试工具 处理器性能
下载PDF
基于SPEC CPU 2006的国产处理器性能测试设计与分析
10
作者 刘建 李晓静 +2 位作者 刘阳 张明娟 吴宸 《电子质量》 2024年第4期105-110,共6页
通过研究不同架构的国产处理器,介绍了国产处理器发展现状。基于处理器的工作过程,分析了影响处理器性能的内部与外部因素。分别设计使用不同内存容量、不同内存速率与不同版本GCC编译器的试测场景,使用国际权威的CPU性能测试工具SPEC C... 通过研究不同架构的国产处理器,介绍了国产处理器发展现状。基于处理器的工作过程,分析了影响处理器性能的内部与外部因素。分别设计使用不同内存容量、不同内存速率与不同版本GCC编译器的试测场景,使用国际权威的CPU性能测试工具SPEC CPU2006对基于ARM、X86架构的国产处理器的计算速度性能和吞吐量性能进行了测试,并对比基准程序的得分情况,分析不同配置对测试结果的影响。结果显示,内存容量大、速率高对处理器的计算速度性能影响不大,但吞吐量性能表现更好;GCC编译器版本越高,处理器吞吐量性能测试得分越高。 展开更多
关键词 国产处理器 SPEC cpu2006 性能测试 内存容量 速度 计算速度 吞吐量
下载PDF
基于CPU+GPU混合架构的雷达信号处理方法
11
作者 常艳 何涛 朱占宇 《火力与指挥控制》 CSCD 北大核心 2024年第7期80-85,90,共7页
针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积... 针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积累、目标检测、目标检测后处理及解模糊过程,将对应处理映射到CPU+GPU核心以提高加速比。实验结果表明,相比多核DSP信号处理方法,该方法具有更好的性能。 展开更多
关键词 cpu+GPU 混合架构 信号处理 多核DSP
下载PDF
C++实现X86架构计算机CPU加速的路径研究
12
作者 王艳玲 《昆明冶金高等专科学校学报》 CAS 2024年第4期82-88,共7页
计算机CPU加速可以提高处理器性能,更快地执行相关指令,完成数据处理任务。伴随大数据时代到来,计算任务增多、应用程序的负载增高,更需要通过CPU加速,为计算机提供必要的计算能力,确保系统的兼容性和未来的可扩展性。C++语言可以通过... 计算机CPU加速可以提高处理器性能,更快地执行相关指令,完成数据处理任务。伴随大数据时代到来,计算任务增多、应用程序的负载增高,更需要通过CPU加速,为计算机提供必要的计算能力,确保系统的兼容性和未来的可扩展性。C++语言可以通过编写利用CPU特定指令集的程序间接实现CPU加速,显著提高计算密集型任务的性能。围绕C++实现X86架构计算机CPU加速的路径进行研究和分析,就X86架构的CPU加速要点进行阐述,分析C++语言实现CPU加速的策略,为提高计算机性能提供支持。 展开更多
关键词 X86架构 C++ cpu
下载PDF
基于训练集聚类选择优化的CPU功耗建模精度提升方法
13
作者 李泽锴 钟佳卿 +7 位作者 冯绍骏 陈娟 邓荣宇 徐涛 谭政源 周柯杏 朱鹏志 马兆阳 《计算机科学》 CSCD 北大核心 2024年第9期59-70,共12页
建立高精度、低开销的CPU功耗模型对于计算机系统的功耗管理与功耗优化至关重要。一般认为训练集规模越大,CPU功耗模型精度越高。但有研究发现增大训练集规模不一定会提高功耗建模精度,有时甚至会导致精度下降,因此,如何选择功耗模型训... 建立高精度、低开销的CPU功耗模型对于计算机系统的功耗管理与功耗优化至关重要。一般认为训练集规模越大,CPU功耗模型精度越高。但有研究发现增大训练集规模不一定会提高功耗建模精度,有时甚至会导致精度下降,因此,如何选择功耗模型训练集以保证CPU功耗模型精度达到要求具有重要意义。文中提出一种基于聚类的训练集选择优化算法来解决上述问题,在有效保证CPU功耗建模精度的同时降低了CPU功耗建模的开销。该算法首先通过主成分分析将基于PMC的程序特征转换为p维向量特征空间,然后根据找到的最优聚类数按照程序特征对程序进行聚类,从每个聚类簇中选出代表程序;最后根据“单聚类簇内代表性最强原则”与“多聚类簇间代表程序数最少原则”形成最优训练集,模型精度相比Baseline精度有明显提高。在x86和ARM两类处理器平台上分别采用线性功耗建模和神经网络功耗建模两种方式,对算法进行了实验评估,实验结果表明所提算法的功耗建模精度有效显著提升。 展开更多
关键词 CP功耗建模 训练集选择 主成分分析 K-MEANS聚类
下载PDF
基于Moldflow优化的计算机CPU涡轮风扇模具设计
14
作者 刘雷 《塑料》 CAS CSCD 北大核心 2024年第2期184-188,共5页
结合CPU涡轮风扇的注射成型要求,采用CAE辅助分析优化得到了塑件的成型方案为1模1腔、正面中心轴顶端进浇模腔布局,单点热嘴环形热浇口浇注。利用分层抽芯的方法将单个涡轮叶槽的脱模采用上、中、下3层滑块的顺序实施抽芯的方法进行侧... 结合CPU涡轮风扇的注射成型要求,采用CAE辅助分析优化得到了塑件的成型方案为1模1腔、正面中心轴顶端进浇模腔布局,单点热嘴环形热浇口浇注。利用分层抽芯的方法将单个涡轮叶槽的脱模采用上、中、下3层滑块的顺序实施抽芯的方法进行侧抽芯脱模,从而得到整个涡轮风扇叶槽的所需脱模机构为27个滑块机构,分别为上层9个上滑块机构、中层9个中滑块机构、下层9个下滑块机构。根据滑块机构的抽芯驱动需要,将模具的整体结构采用一种假三板模结构,分3次开模,第一次开模用作下层9个滑块机构的侧抽芯驱动;第二次开模用作上层9个滑块机构的侧抽芯驱动;第三次开模用作塑件的完全脱模,第三次开模打开后,随着中层9个油缸驱动9个中滑块侧抽芯动作的完成,塑件自动脱落而实现完全脱模。结合涡轮风扇叶槽难以脱模的实践难题,设计了3层滑块机构按序抽芯,根据模具开模提供的驱动进行设计,有效地解决了涡轮风扇塑件的成型难题,机构动作可靠,生产效率较高。 展开更多
关键词 cpu涡轮风扇 CAE分析 成型 热流道 注射模设计 设计优化
下载PDF
一种遥测智能终端设备双CPU架构系统软件升级的方案研究
15
作者 龙荣平 梁祖丹 唐洁 《广西水利水电》 2024年第2期105-107,113,共4页
针对双CPU架构的遥测智能终端设备提出了一种基于Inotify机制与NFS文件系统的系统软件升级方案。Inotify是Linux操作系统中一种实时监控文件系统变化的机制,NFS(Network File System)文件系统是一种网络文件系统,允许用户在不同的计算... 针对双CPU架构的遥测智能终端设备提出了一种基于Inotify机制与NFS文件系统的系统软件升级方案。Inotify是Linux操作系统中一种实时监控文件系统变化的机制,NFS(Network File System)文件系统是一种网络文件系统,允许用户在不同的计算机或者各节点之间共享文件和存储资源。详细介绍了该方案的设计和实现,并对方案的性能进行了分析和评估。实验结果表明,该方案具有较高的实时性和可靠性,可有效提高遥测智能终端设备多CPU架构的升级效率。 展开更多
关键词 遥测智能终端设备 Inotify机制 NFS文件系统 cpu架构 远程升级 实时监控 性能分析
下载PDF
国产CPU的现状与发展展望综述
16
作者 高志腾 王昭 《集成电路应用》 2024年第6期42-43,共2页
阐述国产CPU在我国信息化进程中的作用。介绍国产CPU的发展现状,分析国产CPU在性能、市场占有率、生态、指令集安全方面所面临的问题,结合现状及问题提出思考与建议。
关键词 国产cpu 指令集 cpu架构
下载PDF
基于CPU环境的多类型数据库同步方法、装置及设备 被引量:1
17
作者 张浩 朱志强 陈志强 《信息技术与信息化》 2024年第2期84-87,共4页
目前基于国产CPU和操作系统的全国产环境下应用生态日益完善,在国产环境下WEB应用系统需要支持神通、达梦、金仓、翰高等多种国产数据库,以满足不同客户的需求。日常WEB应用系统迭代开发过程中,存在不同数据库间存在关键字不统一、支持... 目前基于国产CPU和操作系统的全国产环境下应用生态日益完善,在国产环境下WEB应用系统需要支持神通、达梦、金仓、翰高等多种国产数据库,以满足不同客户的需求。日常WEB应用系统迭代开发过程中,存在不同数据库间存在关键字不统一、支持的数据类型不一致、SQL语句语法格式不相同、自带的函数存在差异、支持的数据库操作不完全相同等问题,开发维护及问题定位困难。通过应用多类型数据库适配与同步方法,开发人员只需要输入基准数据库的连接信息,导出XML数据库结构描述模板,导出的XML文件包含数据库类型、数据表结构等信息,项目实施人员只需要输入数据库的基本信息后,将基准数据库生成的XML文件导入,点击生成SQL。就可以生成与基准数据库有差异性的SQL语句,或者直接点击同步,也可以将目标数据库的表结构与基准数据库的表结构进行同步,简化了项目组人员的升级过程。 展开更多
关键词 国产cpu 数据库适配 微服务 跨平台
下载PDF
Investigation of Liquid Cooling Plate for Server CPUs Based on Topology Optimization
18
作者 Guijun Ai Yingying Luo Wei Su 《Journal of Electronics Cooling and Thermal Control》 2024年第1期1-34,共34页
In this study, a microchannel liquid cooling plate (LCP) is proposed for Intel Xeon 52.5 mm * 45 mm packaged architecture processors based on topology optimization (TO). Firstly, a mathematical model for topology opti... In this study, a microchannel liquid cooling plate (LCP) is proposed for Intel Xeon 52.5 mm * 45 mm packaged architecture processors based on topology optimization (TO). Firstly, a mathematical model for topology optimization design of the LCP is established based on heat dissipation and pressure drop objectives. We obtain a series of two-dimensional (2D) topology optimization configurations with different weighting factors for two objectives. It is found that the biomimetic phenomenon of the topologically optimized flow channel structure is more pronounced at low Reynolds numbers. Secondly, the topology configuration is stretched into a three-dimensional (3D) model to perform CFD simulations under actual operating conditions. The results show that the thermal resistance and pressure drop of the LCP based on topology optimization achieve a reduction of approximately 20% - 50% compared to traditional serpentine and microchannel straight flow channel structures. The Nusselt number can be improved by up to 76.1% compared to microchannel straight designs. Moreover, it is observed that under high flow rates, straight microchannel LCPs exhibit significant backflow, vortex phenomena, and topology optimization structures LCPs also tend to lead to loss of effectiveness in the form of tree root-shaped branch flows. Suitable flow rate ranges for LCPs are provided. Furthermore, the temperature and pressure drop of experimental results are consistent with the numerical ones, which verifies the effectiveness of performance for topology optimization flow channel LCP. 展开更多
关键词 cpu SEVER Data Center Topology Optimization Liquid Cooling Plate
下载PDF
A Hybrid Parallel Strategy for Isogeometric Topology Optimization via CPU/GPU Heterogeneous Computing
19
作者 Zhaohui Xia Baichuan Gao +3 位作者 Chen Yu Haotian Han Haobo Zhang Shuting Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第2期1103-1137,共35页
This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstr... This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstrategy of CPU/GPU is proposed, while the hybrid parallel strategies for stiffness matrix assembly, equationsolving, sensitivity analysis, and design variable update are discussed in detail. To ensure the high efficiency ofCPU/GPU computing, a workload balancing strategy is presented for optimally distributing the workload betweenCPU and GPU. To illustrate the advantages of the proposedmethod, three benchmark examples are tested to verifythe hybrid parallel strategy in this paper. The results show that the efficiency of the hybrid method is faster thanserial CPU and parallel GPU, while the speedups can be up to two orders of magnitude. 展开更多
关键词 Topology optimization high-efficiency isogeometric analysis cpu/GPU parallel computing hybrid OpenMPCUDA
下载PDF
通用CPU外部接口激励设计
20
作者 毛茏玮 黄博 李勇 《自动化应用》 2024年第10期245-250,共6页
现场可编程门阵列(FPGA)软件设计愈发复杂,片间驱动的设计尤其明显。可编程逻辑器件软件测试要求中对片间驱动的测试涉及接口测试、时序测试2种常规测试类型;而部件测试和系统测试往往存在多个软件单元和模块,待测接口数量较多且分立,... 现场可编程门阵列(FPGA)软件设计愈发复杂,片间驱动的设计尤其明显。可编程逻辑器件软件测试要求中对片间驱动的测试涉及接口测试、时序测试2种常规测试类型;而部件测试和系统测试往往存在多个软件单元和模块,待测接口数量较多且分立,片间驱动的测试质量通常受接口激励设计制约。通常FPGA设计框架中会使用较多的通用CPU外部控制接口,通过统一常见通用CPU外部接口验证激励设计规范,对被测模块每个外部输入/输出接口的信息格式、数据特性等进行验证。对异步串口、同步串口、IIC、SPI、CAN、EMIF、GPMC、LOCAL BUS、PCI 9种通用CPU外部接口进行激励设计,分析了各类接口的时序及通信约束,借助QuestaSim仿真平台对相应接口进行仿真,逐项比对输出波形验证激励设计的正确性。 展开更多
关键词 片间驱动 FPGA软件 通用cpu外部接口
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部