基于强化学习的艾灸机器人温度控制策略研究

Study on temperature control strategy of moxibustion robot based on reinforcement learning

下载PDF

导出

摘要针对传统PID控制算法在艾灸机器人温度控制中存在参数辨识复杂、适应性差等问题,将强化学习引入到艾灸机器人温控领域中,提出了一种改进强化学习算法。首先,通过多物理场仿真软件和神经网络联合搭建智能体离线训练仿真环境,以解决智能体在线训练效率低下的问题;然后,提出一种结合奖励引导和余弦退火策略的改进强化学习算法,提高算法的收敛性和成功率;最后,将仿真环境训练后的模型迁移到真实环境进行实验验证。实验结果表明,温度超调量为0.2℃,稳态温度保持在43.1℃±0.4℃内,改进后的强化学习算法相比于传统PID控制算法的温度控制能力更好。 Aiming at the problems of complex parameter identification and poor adaptability of traditional PID control algorithm in temperature control of moxibustion robot,reinforcement learning is introduced into the field of temperature control of moxibustion robot,and an improved reinforcement learning algorithm is proposed.First,the offline training simulation environment of the agent is jointly built by multi-physics simulation software and neural network to solve the problem of low efficiency of online training of the agent;then,an improved reinforcement learning algorithm combining reward guidance and cosine annealing strategy is proposed to improve the convergence and success rate of the algorithm;finally,the model trained in the simulation environment is transferred to the real environment for experimental verification.The experimental results show that the temperature overshoot is 0.2℃,and the steady-state temperature is kept within 43.1±0.4℃.The improved reinforcement learning algorithm has better temperature control ability than the traditional PID control algorithm.

作者张博黄山张浛芮李应昆涂海燕 Zhang Bo;Huang Shan;Zhang Hanrui;Li Yingkun;Tu Haiyan(School of Electrical Engineering,Sichuan University,Chengdu 610065,China;Department of Rehabilitation Medicine,Chengdu Fifth People′s Hospital,Chengdu 611130,China;Department of Acupuncture and Rehabilitation,Affiliated Hospital of Chengdu University of Traditional Chinese Medicine,Chengdu 610072,China)

机构地区四川大学电气工程学院四川省成都市第五人民医院康复医学科四川省成都中医药大学附属医院针灸康复科

出处《电子测量技术》北大核心 2022年第24期60-66,共7页 Electronic Measurement Technology

基金四川省重大科技专项(2019ZDZX0019) 四川省中医药管理局项目(2018KF013)资助

关键词艾灸机器人温度控制强化学习奖励引导余弦退火 moxibustion robot temperature control reinforcement learning reward guidance cosine annealing

分类号 R245-33 [医药卫生—针灸推拿学] TP242 [自动化与计算机技术—检测技术与自动化装置] TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献22

1李珊,任安虎,白静静.基于DQN算法的倒计时交叉口信号灯配时研究[J].国外电子测量技术,2021,40(10):91-97. 被引量：3
2周攀,张建斌,王玲玲,季辉,谢波.不同灸温的艾灸抗炎效应及TRPV1作用机制研究[J].中国中医基础医学杂志,2015,21(9):1143-1145. 被引量：55
3高希言,陈岩,王鑫,陈新旺,高肞,杨旭光,周艳丽,任珊.腹部透灸时温度变化的研究[J].中国针灸,2015,35(1):45-49. 被引量：26
4夏世林,佃松宜,张浛芮,李应昆,涂海燕,赵国友.一种适用于多关节艾灸机械臂艾灸器的设计与应用[J].中国针灸,2021,41(2):221-224. 被引量：8
5尹旷,王红斌,方健,莫文雄,叶建斌,张宇.基于强化学习的移动机器人路径规划优化[J].电子测量技术,2021,44(10):91-95. 被引量：9
6杨惟轶,白辰甲,蔡超,赵英男,刘鹏.深度强化学习中稀疏奖励问题研究综述[J].计算机科学,2020,47(3):182-191. 被引量：35
7路玫,张丽繁,袁晔,于冬冬.隔姜灸、悬灸对不同穴位各时段热感度的对比研究[J].中国针灸,2011,31(3):232-235. 被引量：40
8许培昌,李达良,崔淑丽.不同施灸距离对人体体表皮肤温度的影响——论施灸的安全距离[J].中国针灸,2012,32(7):611-614. 被引量：54
9石欣,田文彬,冷正立,卢灏.基于CFD和LightGBM算法的建筑室内温度全局预测模型[J].仪器仪表学报,2021,42(1):237-247. 被引量：7
10王军,杨云霄,李莉.基于改进深度强化学习的移动机器人路径规划[J].电子测量技术,2021,44(22):19-24. 被引量：16

二级参考文献172

1康守强,刘哲,王玉静,王庆岩,兰朝凤.基于改进DQN网络的滚动轴承故障诊断方法[J].仪器仪表学报,2021,42(3):201-212. 被引量：21
2林依凡,陈彦杰,何炳蔚,黄益斌,王耀南.无碰撞检测RRT^*的移动机器人运动规划方法[J].仪器仪表学报,2020(10):257-267. 被引量：38
3毕付,张东亮,鹿利单,孙广开,孟凡勇.基于全保偏光纤的反射式双折射干涉温度传感器[J].仪器仪表学报,2020,41(8):120-128. 被引量：7
4赵其杰,周安稳,朱俊豪,沈礼权,邵辉.基于PE-Vnet网络的三维骨骼图像分割方法[J].仪器仪表学报,2020,41(7):243-251. 被引量：7
5于宁波,刘嘉男,高丽,孙泽文,韩建达.基于深度学习的膝关节MR图像自动分割方法[J].仪器仪表学报,2020(6):140-149. 被引量：27
6张志强,王萍,于旭东,张剑,李婷.高精度红外热成像测温技术研究[J].仪器仪表学报,2020(5):10-18. 被引量：44
7李卫硕,孙剑,陈伟.基于BP神经网络机器人实时避障算法[J].仪器仪表学报,2019,40(11):204-211. 被引量：36
8Yunfei ZHANG,Yanjun WANG,Haoxiang LANG,Ying WANG,Clarence W.DE SILVA.Visual Avoidance of Collision with Randomly Moving Obstacles through Approximate Reinforcement Learning[J].Instrumentation,2019,6(3):59-66. 被引量：1
9陈立,詹跃东.基于变论域模糊PID的PEMFC温度控制[J].电子测量技术,2020,43(7):1-5. 被引量：11
10高希言.透灸法应用探讨[J].中国针灸,2013,33(S1):54-55. 被引量：18

共引文献432

1王亭,娄冉,许珊珊,黄克勤.小儿推拿结合艾灸治疗上气道咳嗽综合征的疗效观察[J].中医外治杂志,2020(5):54-55. 被引量：3
2李毅,李盛华,周明旺,陈威,卢冠锦,岳百川,王鹏志,赵秋玥.温针灸治疗早中期膝骨关节炎镇痛机制研究进展[J].中医临床研究,2022,14(24):108-111. 被引量：5
3荣培晶,陈瑜,王瑜,赵亚楠,张帅.面向未来的中国医学——针灸篇[J].世界科学技术-中医药现代化,2021,23(8):2884-2888. 被引量：7
4田好超,李哲,张宏军.针灸治疗强直性脊柱炎研究现状[J].辽宁中医药大学学报,2020,0(2):153-156. 被引量：9
5郑海珍,熊俊.穴位皮肤温度与针灸效应研究进展[J].辽宁中医杂志,2022,49(9):209-213. 被引量：2
6朱丹,李连江.温阳补肾灸辅助治疗对糖尿病肾病患者的影响[J].辽宁中医杂志,2022,49(5):176-179. 被引量：2
7苏妆,于本性,田辉,刘丽莎,杨成朋,陈诗博,王淑娟.基于“培土生金”理论探讨灸法对Lewis肺癌小鼠IL-8、TGF-β1及VEGF表达的影响[J].辽宁中医杂志,2020(5):186-188. 被引量：4
8马琳,刘春阳,谢赛宝,班宇煊,隋新,黄艳,杨晓康.基于人像识别和感兴趣区域定位的红外图像测温研究[J].电子测量与仪器学报,2023,37(2):186-192. 被引量：5
9洪锋,鲁昌华,蒋薇薇,王涛,方恒阳.基于时空一致性约束视频目标车辆的检测与跟踪算法研究[J].电子测量与仪器学报,2022,36(3):105-112. 被引量：2
10黄天艺,吴华瑞,朱华吉.基于多模态数据驱动的黄瓜温室湿度预测方法[J].电子测量技术,2023,46(16):97-104.

1杨光辉,李德文,张冬华.混合溶剂蒸汽退火策略制备高效钙钛矿太阳能电池[J].分子科学学报,2022,38(6):486-492.
2李弟文,潘伟.改进的残差网络和混合注意力的人脸表情识别[J].智能计算机与应用,2023,13(5):9-17.
3石祥滨,吴天宇.适应跨域的行人重识别算法[J].沈阳航空航天大学学报,2022,39(6):46-56.
4靳艺香,杨卫华.无公共边的双圈图上置信传播算法的收敛性和正确性[J].新疆大学学报（自然科学版）（中英文）,2023,40(3):274-285.
5吴文军,唐嘉.基于ADMM迭代法的PageRank问题的求解[J].平顶山学院学报,2023,38(2):8-13.
6江浩.基于改进粒子群算法的多无人车协同侦察路径规划[J].电脑编程技巧与维护,2023(4):155-157.
7李红,任永峰.含可再生能源的多微网系统负荷频率控制策略[J].可再生能源,2023,41(5):699-704. 被引量：2
8张昭昭,代强,朱应钦.改进模糊神经网络PID的瓦斯掺混浓度控制[J].西安科技大学学报,2023,43(2):388-397.
9徐坤.基于集成学习的极化码BP译码算法[J].软件工程与应用,2023,12(2):354-365.
10梁涛,陈春宇,谭建鑫,井延伟.基于多方面特征提取和迁移学习的风速预测[J].太阳能学报,2023,44(4):132-139. 被引量：1

电子测量技术

2022年第24期

浏览历史

内容加载中请稍等...

基于强化学习的艾灸机器人温度控制策略研究

参考文献22

二级参考文献172

共引文献432

相关作者

相关机构

相关主题

浏览历史