期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
并行建表化学加速算法研究及其在气相斜爆轰模拟中的应用
1
作者 吴锦涛 吕一品 +2 位作者 董刚 王帅 唐科 《气体物理》 2022年第1期9-21,共13页
采用详细化学反应机理对气相斜爆轰问题开展数值计算时,由于组分之间的特征时间尺度相差很大,反应源项的直接积分(direct integration,DI)求解通常存在强烈的刚性及非线性现象,导致计算量很大.为了在不损失计算精度的基础上有效减少化... 采用详细化学反应机理对气相斜爆轰问题开展数值计算时,由于组分之间的特征时间尺度相差很大,反应源项的直接积分(direct integration,DI)求解通常存在强烈的刚性及非线性现象,导致计算量很大.为了在不损失计算精度的基础上有效减少化学反应过程的计算时间,针对包含2H_(2)+O_(2)详细机理的二维斜爆轰并行计算,提出两类不同的并行策略并组成一系列并行建表化学加速算法,用以取代化学反应过程的刚性求解.结果表明,提出的所有算法均能满足二维斜爆轰计算的精度要求,并能提升反应源项的计算效率,计算结束时刻化学反应加速比最大可达3.71.通过爆轰波流场热力学状态分布规律进一步发现,并行策略的选取对计算效率的影响由状态空间内可重复区域占可达区域的比例决定. 展开更多
关键词 并行建表化学加速算法 斜爆轰 详细化学反应机理 数值模拟 化学热力学状态
下载PDF
基于多线程并行的动态自适应建表加速算法在气相爆轰模拟中的应用 被引量:2
2
作者 吴锦涛 董刚 栗保明 《兵工学报》 EI CAS CSCD 北大核心 2018年第5期934-944,共11页
在带详细化学反应机理的气相爆轰过程数值模拟中,化学反应源项的刚性和非线性会使计算花费大量时间。为了提高化学反应的计算效率同时不降低计算精度,针对包含氢气与氧气详细化学反应机理的二维气相爆轰过程,提出了各线程独自建表和所... 在带详细化学反应机理的气相爆轰过程数值模拟中,化学反应源项的刚性和非线性会使计算花费大量时间。为了提高化学反应的计算效率同时不降低计算精度,针对包含氢气与氧气详细化学反应机理的二维气相爆轰过程,提出了各线程独自建表和所有线程共有单表两种基于多线程并行的动态自适应建表(ISAT)算法,以取代原始的直接积分(DI),在不损失计算精度的条件下提高计算效率。两种并行算法分别采用了各线程独立建表和所有线程共建单表的方式,以此分析建表方式对计算效率的影响。在此基础上,还分析了建表容差判据和数值格式对计算效率的影响。研究结果表明:基于ISAT的并行算法在所有条件下均能提供与DI结果相当的计算精度,各线程独立建表的计算效率较共建单表的方法有更高的计算效率,其化学反应计算的加速比为2.17~2.43;并行建表算法不仅能够准确地描述二维气相爆轰波的传播过程,还可以提高化学反应流并行计算的计算效率。 展开更多
关键词 爆轰波 多线程并行计算 动态自适应加速算法 直接积分 数值格式
下载PDF
斜爆轰波并行数值模拟的化学加速算法性能研究
3
作者 姜长磊 董刚 吴锦涛 《推进技术》 EI CAS CSCD 北大核心 2021年第4期765-775,共11页
考虑基元反应条件下的爆轰波精细结构的数值模拟计算量巨大,发展高精度和高效率的计算方法十分必要。以Ma=7的H_(2)/O_(2)/N_(2)预混气来流形成的斜爆轰波为数值模拟对象,研究了一种基于并行计算架构的用于加速化学反应计算的建表算法... 考虑基元反应条件下的爆轰波精细结构的数值模拟计算量巨大,发展高精度和高效率的计算方法十分必要。以Ma=7的H_(2)/O_(2)/N_(2)预混气来流形成的斜爆轰波为数值模拟对象,研究了一种基于并行计算架构的用于加速化学反应计算的建表算法的计算性能,考察了不同建表策略,即TP(Transposed processing)策略和PLP(Purely local processing)策略,以及不同并行分区数量对算法性能的影响。研究结果显示,本文采用的建表算法能够很好地再现斜爆轰结构,其计算精度不受建表策略和并行计算分区数量的影响;而算法的计算效率则取决于不同分区对应的数据表之间操作的同步性,其中,数据表中节点数据的取回率和数据表设定的尺寸上限都会影响数据表操作的同步性。本文采用的两种建表策略的计算结果表明,TP策略数据表中节点取回率高于PLP策略,故计算效率更高;而计算分区数量越少,则分区对应的数据表尺寸上限越大,数据表的同步性就越好,计算效率也越高。 展开更多
关键词 斜爆轰波 算法 并行计算 计算性能 数值模拟
下载PDF
激波诱导火焰界面失稳的并行化学加速计算
4
作者 苏月涵 沈小东 +1 位作者 傅嘉琛 董刚 《气体物理》 2020年第1期56-65,共10页
在带有详细化学反应机理的可压缩反应流数值模拟中,化学反应源项的计算会极大增加计算时间,基于建表技术的化学加速算法可以通过查找数据表中的数据来替代化学反应计算,从而有效提高计算效率,但数据表尺寸的过度增长会导致计算的中断.... 在带有详细化学反应机理的可压缩反应流数值模拟中,化学反应源项的计算会极大增加计算时间,基于建表技术的化学加速算法可以通过查找数据表中的数据来替代化学反应计算,从而有效提高计算效率,但数据表尺寸的过度增长会导致计算的中断.文章提出了基于两种数据表容量控制策略的并行动态存储/删除算法,并在激波诱导火焰界面失稳的数值模拟中进行了应用,以考察算法的性能.两种数据表容量控制策略分别为单表容量(M sin)控制和总表容量(M tot)控制,当单个数据表尺寸达到M sin或总数据表尺寸达到M tot时,对数据表进行节点删除,以保证计算的正常进行.计算结果表明,文章提出的基于表容量控制的并行加速算法,其计算准确度和计算效率之间存在关联,具有较好计算准确度算例显示了较高的计算效率.在不同的M sin和M tot条件下,计算的化学加速比在2.73~3.93之间.两种表控策略的组合影响了数据表删除的频率和删除之间的同步性,当数据表删除频率小、删除同步性强时,化学加速比要更高. 展开更多
关键词 反应流 化学加速算法 化学加速 容量 火焰界面失稳
下载PDF
FAQ-CNN:面向量化卷积神经网络的嵌入式FPGA可扩展加速框架 被引量:7
5
作者 谢坤鹏 卢冶 +4 位作者 靳宗明 刘义情 龚成 陈新伟 李涛 《计算机研究与发展》 EI CSCD 北大核心 2022年第7期1409-1427,共19页
卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量... 卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量化CNN的嵌入式FPGA加速框架FAQ-CNN,从计算、通信和存储3方面进行联合优化,FAQ-CNN以软件工具的形式支持快速部署量化CNN模型.首先,设计面向量化算法的组件,将量化算法自身的运算操作和数值映射过程进行分离;综合运用算子融合、双缓冲和流水线等优化技术,提升CNN推理任务内部的并行执行效率.然后,提出分级编码与位宽无关编码规则和并行解码方法,支持低位宽数据的高效批量传输和并行计算.最后,建立资源配置优化模型并转为整数非线性规划问题,在求解时采用启发式剪枝策略缩小设计空间规模.实验结果表明,FAQ-CNN能够高效灵活地实现各类量化CNN加速器.在激活值和权值为16 b时,FAQ-CNN的加速器计算性能是Caffeine的1.4倍;在激活值和权值为8 b时,FAQ-CNN可获得高达1.23TOPS的优越性能. 展开更多
关键词 卷积神经网络量化 量化算法解耦 并行编解码 片上资源 加速器设计
下载PDF
基于动态分区概念的高超声速燃烧大涡模拟
6
作者 姚卫 刘杭 +2 位作者 张政 肖雅彬 岳连捷 《力学学报》 EI CAS CSCD 北大核心 2022年第4期954-974,I0003,共22页
本文基于动态分区概念开展了亿级网格的高马赫数全尺寸超燃冲压发动机内外流耦合一体化改进延迟分离涡(IDDES)模拟研究.研究建立了包括动态分区火焰面湍流燃烧模型(DZFM)、分区自适应化学(ZDAC)和分区并行自适应建表(Z-ISAT)的完整动态... 本文基于动态分区概念开展了亿级网格的高马赫数全尺寸超燃冲压发动机内外流耦合一体化改进延迟分离涡(IDDES)模拟研究.研究建立了包括动态分区火焰面湍流燃烧模型(DZFM)、分区自适应化学(ZDAC)和分区并行自适应建表(Z-ISAT)的完整动态分区燃烧模拟框架,并通过1.15亿网格的马赫数12 REST标准高超声速燃烧室模型初步验证了分区模拟框架的保真性.DZFM通过分区解耦的思想既准确表征了当地湍流化学交互作用关系,又有效提升了整场湍流燃烧的计算效率.Z-DAC和Z-ISAT通过在分区框架内对化学反应机理进行动态实时简化和建表查询,可进一步提升当前分区内化学反应的求解效率.基于1.25和1.4亿网格动态分区框架对比分析了马赫数10条件下中心支板(strut)和壁面撑挡型(pylon)两类构型氢气高超声速燃烧室特性.支板或撑挡结构均诱发了明显的边界层分离和头部回流区,由此两种燃烧室均出现了较长区域的喷注点前部燃烧现象.基于Borghi图的数值分析表明当前氢气高超声速燃烧室中广泛存在扩散控制为主的火焰面模式,效率提升的瓶颈在于高效增混.壁面撑挡燃烧室具有较高的穿透深度和近场混合效率,因而燃烧效率高于净推力准则80%,相应的比冲1234 s也远高于中心支板燃烧室的437 s.分区自适应化学方法在将近一半的计算域上降低了反应求解计算代价,特别是在无燃料区反应机理的简化幅度更加明显.相比与传统的有限速率PaSR模型,DZFM模型实现了高达11倍的加速比. 展开更多
关键词 高超声速燃烧 动态分区火焰面 分区自适应化学 分区并行自适应 改进延迟分离涡模拟
下载PDF
基于加速遗传算法在城市排涝计算中的应用
7
作者 徐大平 《内蒙古水利》 2020年第11期20-22,共3页
加速遗传算法(AGA)是一种改进遗传因子的随机搜索算法,应用优胜劣汰的生物学概念来搜索问题的最佳解决方案。研究结果表明,针对多标准环境中的城市化排水任务,总运行时间可从12.8h减少到4.8 h。
关键词 加速遗传算法 城市排水 多目标优化 并行计算
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部