结构拓扑优化的Q学习-元胞方法研究

Study on structural topology optimization of Q-learning cell method

下载PDF

导出

摘要传统的拓扑优化算法均基于灵敏度分析的方式求解,如渐进结构优化法(Evolutionary Structural Optimization, ESO)和变密度法(Solid Isotropic Material with Penalization, SIMP)等,灵敏度分析依赖于严谨的数学模型,结果可信度高,但面对不同的结构和约束条件都需要反复重新推导单元灵敏度,对使用人员的数学能力有较高要求,而且也导致了收敛速度慢、迭代步数多的问题。针对现有优化方法中存在的缺陷,结合强化学习Q学习理论和元胞自动机原理,提出一种新的拓扑优化方法:Q学习-元胞法(Q-learning-Cellular Automaton, QCA),尝试为工程构件的优化设计提供一种新思路。这种方法以有限元单元作为元胞,将所有元胞的智能行为集成为一个Q-learning智能体。训练过程中,各个元胞首先完成对自身环境的感知,然后调用智能体进行决策并通过环境交互得到反馈,智能体也借此得到大量数据来学习更新,整个过程不涉及数学模型推导,通过智能体和元胞的不断探索即可完成优化。在此基础上,探讨元胞的选择及其邻域和状态的描述方式,针对元胞的动作空间及收益函数进行比选,进而编制相关拓扑优化软件。优化算例表明,QCA方法优化后的拓扑构型与传统优化方法的构型基本一致,迭代步数较SIMP法降低了64%,且柔顺度更低。Q学习-元胞法在结构拓扑优化中具备良好的可行性,计算效率高且具有迁移优化能力,在结构拓扑优化领域极具潜力。 Conventional topology optimization algorithms are based on the solution of sensitivity analysis,such as evolutionary structural optimization(ESO)and solid isotropic material with penalization(SIMP).Sensitivity analysis relies on rigorous mathematical models and the results are highly credible.However,it requires repeated re-derivation of unit sensitivity for diverse structures and constraints,which requires high level of mathematical proficiency of the user.This drawback also leads to slow convergence and high number of iteration steps.In response to the limitations in existing optimization methods,a new topology optimization approach by merging Q-learning theory with Cellular Automata principles:Q-learning-Cellular Automation(QCA)was proposed.This approach attempted to provide a new idea for the optimal design of engineering components.Finite elements were treated as cells,and the intelligent behaviors of all cells were integrated into a Q-learning Agent.Throughout the learning process,each cell initially completed the perception of its own environment,and subsequently called on the Agent to complete the decision-making.In turn,the Agent was learnt and updated based on feedback from the environment.The entire process circumvented the need for mathematical model derivations,allowing optimization through continuous exploration by the Agent and cells.On this basis,the selection of cells and the description of their neighborhoods and states were discussed.A comparison was made on the action space and benefit function of cells,and relevant topology optimization software was developed.The optimization example illustrated that the topological configuration of the QCA method is basically similar to that of the traditional optimization method.Notably,its iterative steps were 64%lower than SIMP with a lower degree of compliance.In summary,the QCA method has good feasibility in structural topological optimization.With high computational efficiency and adept migration optimization capability,it holds great potential in the field of structural topological optimization.

作者宋旭明史哲宇包世鹏唐冕 SONG Xuming;SHI Zheyu;BAO Shipeng;TANG Mian(School of Civil Engineering,Central South University,Changsha 410075,China;Guangzhou Metro Design&Research Institute Co.,Ltd.,Guangzhou 510010,China)

机构地区中南大学土木工程学院广州地铁设计研究院股份有限公司

出处《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3274-3285,共12页 Journal of Railway Science and Engineering

基金国家自然科学基金资助项目(52078486)。

关键词拓扑优化强化学习 Q学习元胞自动机优化计算 topological optimization reinforcement learning Q-learning cellular automata optimization design

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1王帅,洪振宇.基于强化学习的机场行李装箱优化方法[J].包装工程,2022,43(3):257-263. 被引量：4
2秦智慧,李宁,刘晓彤,刘秀磊,佟强,刘旭红.无模型强化学习研究综述[J].计算机科学,2021,48(3):180-187. 被引量：28
3王冠,张骞,寇琳媛,刘志文,李世康.基于混合元胞自动机算法的连续体结构非线性拓扑优化[J].中国机械工程,2020,31(18):2161-2173. 被引量：3
4陈建桥,周珍珍.基于混合元胞自动机的结构拓扑优化研究[J].武汉理工大学学报,2014,36(1):140-144. 被引量：5
5郑中华,杨宏卫.基于GESO的钢筋混凝土梁拓扑优化方法研究[J].交通科学与工程,2022,38(2):95-101. 被引量：1
6吴贝尼,夏利娟.基于改进遗传算法的双向渐进结构优化方法研究[J].船舶力学,2021,25(2):193-201. 被引量：8
7金栋平,纪斌.机翼后缘柔性支撑结构的拓扑优化[J].航空学报,2015,36(8):2681-2687. 被引量：19
8包世鹏,宋旭明,唐冕.基于向量化的BESO方法灵敏度过滤快速算法[J].铁道科学与工程学报,2023,20(5):1810-1820. 被引量：2
9廉睿超,敬石开,何志军,史泽芳.拓扑优化变密度法的灰度单元分层双重惩罚方法[J].计算机辅助设计与图形学学报,2020,32(8):1349-1356. 被引量：8
10王章骏,许平,邢杰,赵紫亮,蔡隽堃.基于改进BESO算法的带隔板薄壁方管耐撞性拓扑优化[J].铁道科学与工程学报,2021,18(6):1573-1581. 被引量：5

二级参考文献72

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
2易伟建,刘霞.遗传演化结构优化算法[J].工程力学,2004,21(3):66-71. 被引量：31
3左孔天,王书亭,张云清,陈立平.拓扑优化中两类不同优化数值算法的研究[J].华中科技大学学报（自然科学版）,2004,32(9):63-65. 被引量：18
4郭旭,赵康.拓扑相关荷载作用下结构拓扑优化的水平集方法[J].工程力学,2005,22(5):69-77. 被引量：9
5隋允康,叶红玲,彭细荣.应力约束全局化策略下的连续体结构拓扑优化[J].力学学报,2006,38(3):364-370. 被引量：18
6陈国宏,蔡彬清,李美娟.元胞自动机:一种探索管理系统复杂性的有效工具[J].中国工程科学,2007,9(1):28-32. 被引量：14
7葛锐,陈建桥,魏俊红.基于改进粒子群优化算法的复合材料可靠性优化设计[J].机械科学与技术,2007,26(2):257-260. 被引量：9
8黄杰,葛文杰,杨方.实现机翼前缘形状连续变化柔性机构的拓扑优化[J].航空学报,2007,28(4):988-992. 被引量：34
9郭中泽,张卫红,陈裕泽.结构拓扑优化设计综述[J].机械设计,2007,24(8):1-6. 被引量：144
10陈秀,葛文杰,张永红,刘世丽.基于遗传算法的柔性机构形状变化综合优化研究[J].航空学报,2007,28(5):1230-1235. 被引量：16

共引文献73

1王昊,林远山,李然,于红,王芳.面向养殖网箱巡检任务的强化学习训练系统[J].计算机与数字工程,2023,51(1):103-111.
2谢军,王贺贺,阎杰,郭飞,朱守芹,符怡.基于拟满内力算法的方钢管混凝土桁架拓扑优化[J].河北建筑工程学院学报,2022,40(3):1-6.
3李曌晴,张博,和欣辉,闫书峰,王勃.中央大翼结构优化设计与分析[J].飞机设计,2023,43(3):15-20.
4田启华,王进学,杜义贤,王涛.基于密度-敏度层次更新策略的三维连续体结构拓扑优化[J].工程设计学报,2015,22(2):155-160. 被引量：2
5何旅洋,郑百林,杨彪,张锴.航空发动机叶片抗冲击动力学拓扑优化研究[J].力学季刊,2016,37(3):513-521. 被引量：6
6温晶晶,吴斌,刘承骛.导弹整体式翼面骨架结构的拓扑优化设计[J].兵工学报,2017,38(1):81-88. 被引量：7
7张节,沈建新,田威.基于工艺特征约束的改进遗传算法[J].计算机系统应用,2017,26(7):245-251. 被引量：1
8李文成,金栋平.变厚度翼型的非定常气动力模型降阶及影响分析[J].应用力学学报,2018,35(2):339-345. 被引量：1
9李英磊,曹宗杰.飞机结构拓扑优化方法研究[J].机械制造,2018,56(7):14-17. 被引量：6
10李英磊,曹宗杰.基于变密度法的某飞机隔框结构拓扑优化[J].计算机应用,2018,38(A01):232-235. 被引量：4

1郭振宇.基于有限元法的煤矿锚杆钻机伸缩轨道拓扑优化[J].机械管理开发,2024,39(8):171-173.
2易少强,赵晓明,刘健鑫.粘弹性阻尼结构拓扑优化研究进展[J].材料研究与应用,2022,16(6):971-975.
3谢军,梁金晓,赵国帆,郭飞.基于天牛须算法的钢筋混凝土框架结构优化[J].河北建筑工程学院学报,2024,42(1):22-27.
4王崇交,姚昌荣,赵思光,赵实达,强斌,李亚东.基于实测数据的公路桥梁动态养修策略自适应优化模型[J].运筹与管理,2024,33(3):22-27.
5徐中明,李丹彤,张志飞,范维春,许恩永.结合单元渐进删除的变密度拓扑优化方法[J].计算机辅助设计与图形学学报,2023,35(3):482-490. 被引量：1
6程自然,王宇,高剑,黄守道,阮琳.计及电磁-传热影响的蒸发冷却风力发电机定子铁心穿管结构优化设计[J].电工技术学报,2024,39(6):1684-1697.
7杨昆,陈红彬,陈龙淼.基于变密度法考虑制造约束的摇架拓扑优化设计[J].火炮发射与控制学报,2024,45(4):69-75.
8方志凌,宋燕利,康洁,张杏红,张丹.一体化压铸铝合金前机舱轻量化设计与优化[J].汽车工程,2024,46(7):1314-1322.
9张嘉铭.行为识别技术在福利机构安防监控中的应用探讨[J].科技资讯,2024,22(15):12-16.
10凡健,易振峰,姚兴智,谢锦鹏,谭文超,王昱.考虑机械载荷和热载荷的温室大棚骨架结构轻量化设计[J].中国农机化学报,2024,45(6):77-81.

铁道科学与工程学报

2024年第8期

浏览历史

内容加载中请稍等...

结构拓扑优化的Q学习-元胞方法研究

参考文献11

二级参考文献72

共引文献73

相关作者

相关机构

相关主题

浏览历史