基于模糊神经网络的强化学习及其在机器人导航中的应用被引量：13

Reinforcement learning based on FNN and its application in robot navigation

下载PDF

导出

摘要研究基于行为的移动机器人控制方法.将模糊神经网络与强化学习理论相结合,构成模糊强化系统.它既可获取模糊规则的结论部分和模糊隶属度函数参数,也可解决连续状态空间和动作空间的强化学习问题.将残差算法用于神经网络的学习,保证了函数逼近的快速性和收敛性.将该系统的学习结果作为反应式自主机器人的行为控制器。 Behavior-based robot navigation is studied. The fuzzy neural network（FNN）and reinforcement learning （RL） are integrated. RL is utilized for structure identification and parameters tuning of FNN. The problem of continuous, infinite states and actions in RL is solved by using the function approximationof FNN. Furthermore, the residual algorithm is applied to the FNN learning, which guarantees the convergence and rapidity. Then, the learning results are employed to design the controller of the reactive robot system, by which the problem of navigation under complicated environment is solved effectively.

作者段勇徐心和

机构地区东北大学信息科学与工程学院

出处《控制与决策》 EI CSCD 北大核心 2007年第5期525-529,534,共6页 Control and Decision

基金国家自然科学基金项目(60475036)

关键词强化学习模糊神经网络 Q(λ)学习机器人导航 Reinforcement learning Fuzzy neural network Q（λ）-learning Robot navigation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1孙增圻.智能控制理论与技术[M].北京：清华大学出版社,2000..
2Sutton R S,Barto A G.Reinforcement learning:An introduction[M].Cambridge:MIT Press,1998.
3蒋国飞,吴沧浦.基于Q学习算法和BP神经网络的倒立摆控制[J].自动化学报,1998,24(5):662-666. 被引量：55
4Claude F T.Neural reinforcement learning for behaviour synthesis[J].Robotics and Autonomous Systems,1997,22(3/4):251-281.
5Jouffe L.Fuzzy inference system learning by reinforcement methods[J].IEEE Trans on Systems,Man and Cybernetics,1998,28(3):338-355.
6Baird L C.Residual algorithms:Reinforcement learning with function approximation[C].Proc of the 12nd Int Conf on Machine Learning.San Francisco,1995:9-12.
7张汝波.强化学习理论及应用[M]．哈尔滨：哈尔滨工程大学出版社，2000.
8Watkins C J,Dayan P.Q-learning[J].Machine Learning,1992,8(3):279-292.
9Peng J,Williams R J.Incremental multi-step Q-learning[C].Proc of the 11th Int Conf on Machine Learning.New Brunswick:Morgan Kaufmann,1995:226-232.
10Lin C H,Wang L L.Intelligent collision avoidance by fuzzy logic control[J].Robotics and Autonomous Systems,1997,20(1):61-83.

二级参考文献1

1Peng J，博士学位论文，1993年

共引文献93

1窦春红,黄明键,王中华,王新江.倒立摆系统及其控制策略研究现状[J].中南大学学报（自然科学版）,2003,34(z1):96-99.
2周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
3陈树挺,李日隆,陈少华.SPDS神经网络式单相自动重合闸[J].电力科学与工程,2004,20(2):42-44. 被引量：1
4蔡增威,刘德春,张晓华.一种基于鲁棒性设计的一阶倒立摆双闭环控制方法[J].自动化技术与应用,2004,23(4):11-15. 被引量：4
5强宇,刘宗田,林炜,时百胜,李云.一种模糊概念格构造算法研究[J].计算机工程与应用,2004,40(29):50-53. 被引量：4
6王瑞霞,孙亮,阮晓刚.基于内部回归神经网络的强化学习[J].控制工程,2005,12(2):138-140. 被引量：4
7孙亚宁,乔登攀.焙烧过程中的智能控制[J].有色金属设计,2005,32(2):39-41.
8张宇飞,李文,邵秀丽,李丹.中药滴丸制剂质量控制数字化的研究与实践[J].南开大学学报（自然科学版）,2005,38(3):34-38. 被引量：5
9高建立,马福军.神经网络和模糊控制在电梯群控中的应用[J].机电工程,2005,22(9):18-20. 被引量：3
10张玉梅,阮晓钢.一种生长型神经网络的倒立摆控制方案[J].微计算机信息,2005,21(11S):91-93. 被引量：1

同被引文献117

1曾智刚.基于强化学习的神经网络在船模速度控制中的应用[J].计算机时代,2009(4):24-25. 被引量：1
2冯青春,郑文刚,姜凯,邱权,郭瑞.高架栽培草莓采摘机器人系统设计[J].农机化研究,2012,34(7):122-126. 被引量：24
3张毅,李想,罗元.基于腕势控制的智能轮椅无障碍人机交互系统[J].华中科技大学学报（自然科学版）,2011,39(S2):248-251. 被引量：2
4张毅,代凌凌,罗元.基于SEMG控制的智能轮椅无障碍人机交互系统[J].华中科技大学学报（自然科学版）,2011,39(S2):264-267. 被引量：14
5邱恺,魏瑞轩,张宗麟.一种基于RBF网络的自适应容错联邦滤波算法研究[J].控制与决策,2004,19(12):1420-1424. 被引量：8
6刘新宇,洪炳鎔.基于BDI框架的多Agent动态协作模型与应用研究[J].计算机研究与发展,2002,39(7):797-801. 被引量：4
7段凡丁.关于最短路径的SPFA快速算法[J].西南交通大学学报,1994,29(2):207-212. 被引量：57
8李季,严东超.BP神经网络改进算法在电气故障诊断系统中的应用[J].电力科学与工程,2005,21(1):69-72. 被引量：21
9王玉甲,张铭钧.基于模糊神经网络的水下机器人实时状态监测模型[J].中国造船,2005,46(1):71-79. 被引量：5
10李医民,胡寿松.模糊神经网络技术在故障诊断中的应用[J].系统工程与电子技术,2005,27(5):948-952. 被引量：8

引证文献13

1周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
2卢海曦,周百令.自适应联邦滤波器及其在组合导航系统中的应用[J].中国惯性技术学报,2007,15(6):678-681. 被引量：7
3陈延伟,施江天,吴艳茹,路红伟,贾菲,庞博.基于神经网络的多传感器信息融合技术在移动机器人中的应用[J].长春工业大学学报,2008,29(5):550-555. 被引量：6
4王雪松,张政,程玉虎,张依阳.基于测地高斯基函数的递归最小二乘策略迭代[J].信息与控制,2009,38(4):406-411.
5刘胜,李高云,宋佳.基于FNN的船舶舵伺服系统故障诊断研究[J].中国造船,2010,51(1):162-169. 被引量：3
6徐明亮,柴志雷,须文波.移动机器人模糊Q-学习沿墙导航[J].电机与控制学报,2010,14(6):83-88. 被引量：7
7龚君,郑启文,赵瑾.基于ZigBee多智能小车无线控制系统的设计[J].上海电机学院学报,2012,15(2):91-96. 被引量：4
8尤树华,周谊成,王辉.基于神经网络的强化学习研究概述[J].电脑知识与技术,2012,8(10):6782-6786. 被引量：4
9贾松敏,高立文,樊劲辉,严骏.模糊神经网络在智能轮椅避障中的应用[J].华中科技大学学报（自然科学版）,2013,41(5):77-81. 被引量：5
10樊劲辉,贾松敏,李秀智.基于RBF神经网络的全向智能轮椅自适应控制[J].华中科技大学学报（自然科学版）,2014,42(2):111-115. 被引量：5

二级引证文献53

1黄敏,路飞,李晓磊,田国会,孟可.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人,2019,41(5):609-619. 被引量：6
2高金辉,汪晓晨,贾利锋.车载GPS/DR组合导航系统卡尔曼滤波方法的改进[J].河南师范大学学报（自然科学版）,2009,37(2):67-69. 被引量：3
3卜波.基于DSP平面关节机器人通用运动控制器设计[J].长春工业大学学报,2009,30(6):706-710. 被引量：2
4王龙,张拥军,张文山,董继鹏.地面系下的GPS/SINS组合导航算法设计[J].航空兵器,2010,17(3):15-17. 被引量：3
5吴玲,孙永荣,陈传德.多星座组合导航自适应信息融合滤波算法[J].航天控制,2010,28(6):38-42. 被引量：3
6柳虹亮,蔡赟,姜大伟.移动机器人控制系统硬件设计与开发[J].长春工业大学学报,2011,32(6):543-547. 被引量：1
7袁赣南,袁克非,张红伟,李宁.基于时间序列分析的自适应联邦滤波算法[J].中国惯性技术学报,2011,19(6):725-729. 被引量：1
8蔡建羡,孙旭光,杨秋格.映射领域可自主收缩的操作条件反射自动机[J].电机与控制学报,2012,16(9):83-90. 被引量：1
9肖寒春,孙鹏飞,李津.基于模糊神经网络在智能轮椅避障中的应用[J].计算机工程与设计,2013,34(2):665-669. 被引量：2
10王伟,白玉成,吴功平,肖华,杨智勇,徐显金.一种基于信息融合的巡线机器人电磁导航方法[J].电力系统自动化,2013,37(16):73-79. 被引量：10

1段勇,刘兴刚,徐心和.基于强化学习的机器人模糊控制系统设计[J].系统仿真学报,2006,18(6):1597-1600. 被引量：4
2江加加,杨成忠,周韵.一种提高视频压缩速度的改进算法[J].电子技术应用,2007,33(11):68-70.
3航海,苏华.高校网络安全问题探析[J].科技风,2016(13):142-142.
4王进,朱文晓,孙开伟,邓欣,陈乔松.基于残差超网络的DNA微阵列数据分类[J].重庆邮电大学学报（自然科学版）,2015,27(5):647-653. 被引量：4
5周红莉,刘满强,郭戈.一种基于改进Elman神经网络的机器人行为控制器[J].微计算机信息,2006(09Z):213-215. 被引量：1
6张文志,吕恬生.强化学习理论在机器人应用中的几个关键问题探讨[J].计算机工程与应用,2004,40(4):69-71. 被引量：2
7班晓娟,艾冬梅,曾广平,尹怡欣.计算机动画角色的高级行为控制[J].北京科技大学学报,2004,26(5):556-559. 被引量：1
8王剑虹,何晓行.蜜罐取证的技术及法律问题研究[J].计算机科学,2011,38(8):121-124. 被引量：7
9朱垣.湖北电大提出2012年工作要求把握机遇推进改革重视质量强化系统[J].湖北广播电视大学学报,2012,32(3).
10张汝波,顾国昌,刘照德,王醒策.强化学习理论、算法及应用[J].控制理论与应用,2000,17(5):637-642. 被引量：92

控制与决策

2007年第5期

浏览历史

内容加载中请稍等...

基于模糊神经网络的强化学习及其在机器人导航中的应用被引量：13

参考文献11

二级参考文献1

共引文献93

同被引文献117

引证文献13

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于模糊神经网络的强化学习及其在机器人导航中的应用 被引量：13

参考文献11

二级参考文献1

共引文献93

同被引文献117

引证文献13

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于模糊神经网络的强化学习及其在机器人导航中的应用被引量：13