两轮机器人自平衡稳定性控制仿真研究被引量：5

Simulation Research on Self Balancing Stability Control of Two-Wheeled Robot

下载PDF

导出

摘要两轮机器人自平衡控制的难点在于提高机器人达到平衡的快速性和稳定性的能力。为解决传统强化学习算法收敛速度慢,系统易发散的问题,提出一种分层强化学习算法。将目标任务分解为若干个子任务,为每个子任务寻找最优策略,当所有的子目标都收敛到最优值时,目标任务也收敛到最优。在上述算法中,报酬函数可以从启发式的环境中学习,加快对未知环境的探索,快速达到自平衡并保持稳定。对两轮机器人进行自平衡仿真实验。仿真结果表明,相对于传统的强化学习算法,应用改进算法的两轮机器人的各控制状态的收敛特性及机器人的学习性能更强,有效的提高了机器人系统的稳定性控制性能。 The difficulty of self balancing control of two wheeled robot is to improve the ability of the robot to a- chieve the balance rapidly and stably. In order to solve the problems of slow convergence speed and divergent system of traditional reinforcement learning algorithm, a hierarchical reinforcement learning algorithm was proposed in the paper. The algorithm decomposes target task into several subtasks and searches the optimal strategy for each task. When all sub-goals converge to the optimal value, the target task also converges to the optimal. In this algorithm, the compensation function can learn from the environment of heuristic, speed up the exploration of the unknown environment, achieve self balance quickly and maintain stability. The self balancing simulation experiment of two-wheeled robot was carried out using this algorithm. Simulation results show that compared with traditional reinforcement learning al- gorithm, the convergence properties of each control state and the learning performance of the two-wheeled robots are stronger by using this algorithm. Stability control of the robot system is improved.

作者闫娟杨慧斌程武山

机构地区上海工程技术大学机械工程学院

出处《计算机仿真》 CSCD 北大核心 2016年第7期383-387,共5页 Computer Simulation

基金高等学校骨干教师资助计划-高等学校青年骨干教师国内访问学者进修项目(A1-5300-15-020201) 上海市高等学校科学技术发展基金-上海市高校实验技术队伍建设计划项目(A2-B-8950-13-0714)

关键词两轮机器人平衡控制分层强化学习 Two-wheeled robot Balancing control Hierarchical reinforcement learning

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献9

1杨凌霄,梁书田.两轮自平衡机器人的自适应模糊平衡控制[J].计算机仿真,2015,32(5):411-415. 被引量：10
2J Wu, Y Liang, Z Wang. A robust control method of two-wheeled self-balancing robot [ C ]. In : Strategic Technology ( IFOST), 6th International Forum On, 2011,2 ( 1 ) : 1031-1035.
3C J Watkins, P Dayan. Q - learning [ J ]. Machine Learning, 1992,8(3) :279-292.
4A Goh. Back-propagation neural networks for modeling complex systems [ J 1. Artificial Intelligence in Engineering, 1995,9 ( 3 ) : 143-151.
5杨凌霄,李晓阳.基于卡尔曼滤波的两轮自平衡车姿态检测方法[J].计算机仿真,2014,31(6):406-409. 被引量：43
6S Jeong, T Takahashi. Wheeled inverted pendulum type assistant robot : inverted mobile, standing, and sitting motions [ J ]. Intelli- gent Robots and Systems, 2007,1 (1) :1932 - 1937.
7齐光景,谢刚,柳英杰.一种双轮小车的自平衡运动控制系统[J].计算机仿真,2014,31(4):212-218. 被引量：2
8S Adam, Bu soniu. Experience replay for real-time reinforcement learning control [ C ]. Systems, Man, and Cybernetics, Part C : Applications and Reviews, IEEE Transactions on, 2012,42 (2): 201 - 212.
9T G Dietterich. Hierarchical reinforcement learning with the maxq value function decomposition ~ J 1. Artif |ntell. Res. ( JAIR ), 2000,13:227 - 303.

二级参考文献44

1赵建伟,阮晓钢.两轮直立式自平衡移动机器人的控制系统设计[J].北京工业大学学报,2009,35(1):25-29. 被引量：5
2蔡建羡,阮晓刚,甘家飞.两轮自平衡机器人系统建模与模糊自整定PID控制[J].北京工业大学学报,2009,35(12):1603-1607. 被引量：20
3朱丽业,吴惕华,方园.直接自适应模糊算法参数的选取以及仿真分析[J].系统仿真学报,2006,18(11):3063-3066. 被引量：10
4刘金琨,孙富春.滑模变结构控制理论及其算法研究与进展[J].控制理论与应用,2007,24(3):407-418. 被引量：575
5赵蕊,贺建军.多传感器信息融合技术[J].计算机测量与控制,2007,15(9):1124-1126. 被引量：23
6阮晓钢,蔡建羡,李欣源,等.两轮自平衡机器人的研究与设计[M].北京:科学出版社,2012:39-52.
7M. Muhamma, S Buyamin, M N Ahmad, S W Nawawi. Dynamic Modeling and Analysis of a Two - Wheeled Inverted Pendulum Ro- bot [ C ]. The Third International Conference on Computational In- telligence, Modelling &Simulation, Langkawi, 2011 : 159 - 164.
8Wu Junfeng, Zhang Wanying. Design of fuzzy logic controller for two - wheeled self - balancing robot [ C ]. Proceedings of the 6th International Forum on Strategic Technology, Harbin, 2011:1266 - 1270.
9Junfeng Wu, Zhe Wang. Research on Fuzzy Control of Inverted Pendulum [ C 1. International Conference on Instrumentation, Measurement, Computer, Communication and Control, Beijing, 2011 : 868 -871.
10Wang Luhao, Sheng Zhanshi. LQR - Fuzzy Control for Double Inverted Pendulum[ C:. International Conference on Digital Man- ufacturing and Automation ( ICDMA ), Changsha, 2010 : 900 - 903.

共引文献51

1罗鹏.Visual C++用不同的视图窗口显示同一份文档[J].电脑编程技巧与维护,2000(5):49-51.
2高建明.自适应模糊控制的自平衡机器人设计[J].计算机测量与控制,2015,23(3):773-776. 被引量：2
3杨凌霄,梁书田.两轮自平衡机器人的自适应模糊平衡控制[J].计算机仿真,2015,32(5):411-415. 被引量：10
4刘春阳,徐军领,程洪涛,王东方,薛玉君.MPU9250传感器的姿态检测与数据融合[J].河南科技大学学报（自然科学版）,2015,36(4):14-17. 被引量：52
5任向阳,许江淳,黄生旺,尚华,王晴.基于主动安全防护的车辆侧翻预警系统设计[J].工业仪表与自动化装置,2016(2):39-42. 被引量：3
6樊炳辉,张凯丽,王传江,刘圭圭,张芳丽.基于四元数的前臂假肢手部自平衡的设计[J].电子技术应用,2016,42(5):78-81. 被引量：5
7胥芳,倪紫京,占红武.自平衡小车的模型分析与数据处理[J].浙江工业大学学报,2016,44(3):288-291. 被引量：4
8王素青,熊维堂.基于STM32的两轮自平衡小车系统设计[J].实验室研究与探索,2016,35(5):146-150. 被引量：37
9陈国军.基于CCD和STM32的两轮智能机器人系统[J].电子技术与软件工程,2016(19):141-141.
10刘瑞歌,宋锋,张胜金.两轮自平衡车的设计与实现[J].滨州学院学报,2016,32(4):75-79. 被引量：2

同被引文献36

1高键,姜长生,李众.一种新的云模型控制器设计[J].信息与控制,2005,34(2):157-162. 被引量：41
2付宜利,李寒,徐贺,马玉林.轮式全方位移动机器人几种转向方式的研究[J].制造业自动化,2005,27(10):33-37. 被引量：19
3高键,李众.一维云模型映射器设计及其应用研究[J].系统仿真学报,2006,18(7):1861-1865. 被引量：33
4刘艳,李众,吴晓庆.基于映射关系的云模型控制器研究[J].微计算机信息,2007(06S):47-49. 被引量：6
5秦勇,闫继宏,王晓宇,赵杰.两轮自平衡机器人运动控制研究[J].哈尔滨工业大学学报,2008,40(5):721-726. 被引量：12
6付斌,李道国,王慕快.云模型研究的回顾与展望[J].计算机应用研究,2011,28(2):420-426. 被引量：118
7高键,周海龙,李众.一维云模型控制器在轮式机器人中的应用[J].自动化与仪表,2011,26(2):28-32. 被引量：5
8李众,李政.基于DSP的一维云模型控制器的设计[J].科学技术与工程,2011,11(25):6207-6209. 被引量：3
9阮晓钢,陈静,蔡建羡,李欣源.复杂环境下两轮自平衡机器人稳定控制研究[J].北京工业大学学报,2011,37(9):1310-1316. 被引量：4
10林文建,钟杭,黎福海,肖祥慧,钱馨然.两轮自平衡机器人控制系统设计与实现[J].电子测量与仪器学报,2013,27(8):750-759. 被引量：33

引证文献5

1徐子为,李众.云模型控制器在两轮自平衡机器人中的应用[J].自动化仪表,2019,40(5):70-74. 被引量：2
2李晓彤,崔承刚,杨宁,陈辉.基于强化学习的中央空调系统温度控制与节能[J].计算机仿真,2021,38(4):198-202. 被引量：16
3黄泽琼,谢小鹏.结合融合函数的双轮机器人二型模糊控制[J].计算机仿真,2022,39(2):380-386. 被引量：3
4周鑫强,石晓辉,黄剑鸣.非同轴两轮机器人自平衡与转向闭环控制[J].计算机测量与控制,2023,31(3):140-148.
5刘恒,李哲,杨明辉,邓晓刚,曹玉苹.基于模糊控制的全位移平衡机器人设计[J].测控技术,2023,42(7):102-109. 被引量：1

二级引证文献21

1曾鹏,刘君,郑功倍,高丙团.双轮驱动球形机器人的模糊控制设计[J].自动化仪表,2020,41(8):70-74.
2王爽.化工厂区抗爆控制室空调系统设计[J].化工管理,2021(27):122-123.
3高磊,陶彦飞,刘祥言.基于单神经元的温箱自适应控制系统[J].自动化与仪表,2022,37(1):26-29. 被引量：5
4王振,李志博.基于节能理念的公共场所建筑空调智能控制系统设计[J].造纸装备及材料,2022,51(5):96-98.
5黄广国,薛彦飞.基于模糊决策算法的室内空调温度远程优化控制系统设计[J].现代信息科技,2022,6(20):19-21. 被引量：2
6耿婧.基于模糊PID的智能小车单片机温度控制技术[J].廊坊师范学院学报（自然科学版）,2022,22(4):30-36. 被引量：6
7马麟,梁安琪,王立永,曾爽,杨婷,王钊.公共楼宇可调负荷资源调控技术研究综述[J].电测与仪表,2023,60(5):1-10. 被引量：5
8陈鑫星,宋晔皓.碳中和视角下的公共建筑主动感知与智能控制研究[J].艺术与设计（城市空间设计）,2022(4):6-9.
9刘恒,李哲,杨明辉,邓晓刚,曹玉苹.基于模糊控制的全位移平衡机器人设计[J].测控技术,2023,42(7):102-109. 被引量：1
10李韫莛,周玖,梁东贵.基于鲁棒极限学习机的居民空调负荷能耗预测方法[J].沈阳工业大学学报,2023,45(5):481-485. 被引量：2

1卢锋.两轮小车姿态检测与平衡控制研究[J].工业仪表与自动化装置,2014(3):26-28. 被引量：4
2胡健.基于Q学习的无线传感器网络路由协议[J].计算机与现代化,2013(3):131-134.
3石川,史忠植,王茂光.基于路径匹配的在线分层强化学习方法[J].计算机研究与发展,2008,45(9):1470-1476. 被引量：4
4季鹏飞,朱燕,程传统,杜晓.基于STM32的两轮自平衡小车控制系统设计[J].电子科技,2014,27(11):96-99. 被引量：20
5高亮.基于姿态传感器的自平衡系统设计[J].山东工业技术,2015(12):40-41. 被引量：1
6王加兵,金京,刑永波.一种载人球形载具的运动分析与自平衡控制[J].科技资讯,2015,13(12):86-87.
7张洪伟.基于STM32的平衡车设计[J].科技创新与应用,2016,6(2):78-79. 被引量：7
8程晓北,沈晶,刘海波,顾国昌,张国印.分层强化学习研究进展[J].计算机工程与应用,2008,44(13):1-5. 被引量：1
9金鑫,疏国会,方莉.单轮机器人自平衡控制方法的改进[J].荆楚理工学院学报,2013,28(4):43-48.
10王利清.基于终端滑模控制的两轮移动机器人自平衡实现方法研究[J].制造业自动化,2015,37(13):16-18. 被引量：2

计算机仿真

2016年第7期

浏览历史

内容加载中请稍等...

两轮机器人自平衡稳定性控制仿真研究被引量：5

参考文献9

二级参考文献44

共引文献51

同被引文献36

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

两轮机器人自平衡稳定性控制仿真研究 被引量：5

参考文献9

二级参考文献44

共引文献51

同被引文献36

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

两轮机器人自平衡稳定性控制仿真研究被引量：5