映射领域可自主收缩的操作条件反射自动机被引量：1

Operant conditioning automaton with mapping fields of spontaneous contraction

下载PDF

导出

摘要为避免操作条件反射学习模型中存在发生小概率操作行为所引发的不良操作后果,设计了一种映射领域可在线自主收缩移动的操作条件反射自动机,映射领域指机器人各状态映射的操作行为集合,其收缩是通过定义学习误差的界限值和操作行为选取的概率阈值两个指标来实现的。对映射领域可自主收缩的操作条件反射学习的收敛性进行了分析,从理论上证明:操作行为熵随映射领域的收缩收敛至极小。针对两轮机器人运动平衡控制的仿真结果表明,映射领域的收缩性使操作条件反射自动机可以在线地在最有意义的映射领域内搜索学习,通过有效的动态的消除无用的映射区域,提高了系统的学习速度和精度。 The phenomenon of small probabilities operant action exists in operant conditioning learning model and the occurring of small probabilities operant action will lead to bad consequence.To avoid the phenomenon,an operant conditioning automaton is designed in which the mapping fields could contract spontaneously.The mapping field was defined as the mapping operant action set of each state and the contracted mapping field was implemented by defining two index values,i.e.,the bound value of learning error and the threshold value of probability.Theory analysis was made for the convergence of operant conditioning learning of operant conditioning with mapping fields of spontaneous contraction,which theoretically proves that the operant action entropy can converge to minimum with the contraction of mapping fields.The result of the simulation experiment in the motion balanced control of two-wheeled robot show that contracting the mapping action fields in this way automatically eliminates unnecessary operant actions and the automaton can learn in the most significant action fields,thereby increasing the learning speed and learning precision.

作者蔡建羡孙旭光杨秋格

机构地区防灾科技学院防灾仪器系防灾科技学院灾害信息工程系

出处《电机与控制学报》 EI CSCD 北大核心 2012年第9期83-90,共8页 Electric Machines and Control

基金中国地震局教师科研基金(20110122) 防灾减灾青年科技基金(201014) 国家自然科学基金(61004012)

关键词操作条件反射自动机映射领域自主收缩移动操作行为熵运动平衡控制 operant conditioning automaton mapping fields contract spontaneously operant action entropy motion balanced control

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1SKINNER B F. The behavior of organisms : An experimental anal- ysis[ M ]. New York : Appleton-Century-Crofts, 1938.
2徐明亮,柴志雷,须文波.移动机器人模糊Q-学习沿墙导航[J].电机与控制学报,2010,14(6):83-88. 被引量：7
3TOURETZK~ D S, TRIRA-THOMPSON E J. Tekkotsu : a Frame- work for AIBO cognitive robotics[ C ]//The National Conference on Artificial Intelligence, July 9- 13, 2005, Pittsburgh, USA. 2005:1741 - 1742.
4VELOSO M M, RYBSKI P E, LENSER S, et al. CMRoboBits: creating an intelligent AIBO robot [ J ]. AI Magazine, 2006, 27 (1) : 67 -82.
5蔡建羡,阮晓钢,郜园园.随机模糊控制策略及其在机器人控制中的应用[J].电机与控制学报,2009,13(5):754-761. 被引量：4
6THATHACHAR M A L, HARITA B R. Learning automata with changing number of actions [ J ]. IEEE Trans. Syst. , Man, Cy- bern, 1987, 17(6) :1095 - 1100.
7NAJIM K, POZNYAK A S. Multimodal searching technique based on learning automata with continuous input and changing number of actions[J]. IEEE Trans. Syst. , Man, Cybem, 1987, 26(4): 666 - 673.
8POZNYAK A S, NAJIM K. Learning automata with continuous in- put and changing number of actions [ J ]. International Journal of Systems Science, 1996, 27 ( 12 ) : 1467 - 1472.
9ZENG X, LIU Z. A learning automata based algorithm for optimi- zation of continuous complex functions [ J ]. Information Science, 2005, 174(3/4) :165 - 175.
10阮晓钢,蔡建羡,戴丽珍.基于概率自动机的操作条件反射计算模型[J].北京工业大学学报,2010,36(8):1025-1030. 被引量：3

二级参考文献39

1张文志,吕恬生.Reactive fuzzy controller design by Q-learning for mobile robot navigation[J].Journal of Harbin Institute of Technology(New Series),2005,12(3):319-324. 被引量：5
2戴学丰,孙立宁,蔡鹤皋.自组织模糊控制及在机器人中的应用[J].电机与控制学报,2005,9(5):495-499. 被引量：1
3叶晓燕,傅保川,王俭,仲嘉霖,杨西侠.基于模糊控制的旋转倒立摆系统[J].电机与控制学报,2005,9(5):508-511. 被引量：4
4彭一准,原魁,刘俊承,邹伟.室内移动机器人的三层规划导航策略[J].电机与控制学报,2006,10(4):380-384. 被引量：3
5段勇,徐心和.基于模糊神经网络的强化学习及其在机器人导航中的应用[J].控制与决策,2007,22(5):525-529. 被引量：13
6ZHU Jing. Fuzzy Control Theory and Applications [ M ]. Beijing: Machinery Industry Press, 1995.
7REILLY D, COOPER L, EIBAUM C. A neural model for category learning [J]. Biol Cybern, 1982,45( 1 ) :35 -41.
8MCFARLAND D, BOSSER T. Intelligent Behavior in Animals and Robots[M]. Cambridge: Bradford Books, MIT Press, 1993.
9SKINNER B F. The Behavior of Organisms [ M ]. New York : Appleton-Century-Crofts, 1938.
10SAKSIDA L M, TOURETZKY D S. Application of a model of instrumental conditioning to mobile robot control [ J ]. Sensor Fusion and Decentralized Control in Autonomous Robotic Systems, 1997, 32 (9) : 55 -66.

共引文献11

1蔡建羡,阮晓钢.基于FBFN的鲁棒仿生学习系统设计及在运动平衡控制中的应用[J].机器人,2010,32(6):732-740.
2阮晓钢,戴丽珍,于乃功,于建均.一种自治操作条件反射自动机[J].控制理论与应用,2012,29(11):1452-1457. 被引量：2
3潘强,鞠玉涛.一种步进电机模糊自整定PID闭环控制系统设计[J].机床与液压,2013,41(13):81-85. 被引量：9
4陈卫东,关永贞,朱奇光,赵成龙.移动机器人模糊Sarsa(λ)学习导航研究[J].小型微型计算机系统,2013,34(11):2599-2602.
5袁宇龙,李军.基于模糊逻辑的移动机器人沿墙行为精准控制[J].世界科技研究与发展,2013,35(6):704-708. 被引量：1
6阮晓钢,黄静,范青武,魏若岩.一种基于操作条件反射原理的学习模型[J].控制与决策,2014,29(6):1016-1020. 被引量：4
7马磊,张文旭,戴朝华.多机器人系统强化学习研究综述[J].西南交通大学学报,2014,49(6):1032-1044. 被引量：14
8居锦,刘继展,李男,李萍萍.基于侧向光电圆弧阵列的温室路沿检测与导航方法[J].农业工程学报,2017,33(18):180-187. 被引量：10
9马晓敏,刘丁,辛菁,张友民.移动机器人生物启发式变结构轨迹跟踪控制[J].电机与控制学报,2018,22(7):97-106. 被引量：11
10蒋林,张燕飞,朱建阳,雷斌,王翰,高旭敏.结合历史运动状态的机器人高效沿墙算法研究[J].自动化学报,2020,46(6):1166-1177. 被引量：5

同被引文献9

1常丹华,王新生,王兴英.一种大功率电炉的智能控制[J].工业仪表与自动化装置,1994(3):32-35. 被引量：3
2柏建国.人工智能与控制决策[J].自动化与仪器仪表,1996(3):5-9. 被引量：11
3李林琛,杨晓雪.电加热炉温度控制系统数学模型的建立及验证[J].北京工业职业技术学院学报,2010,9(4):21-25. 被引量：18
4平洋,罗雄麟.电加热器温度仿人智能多模型控制[J].化工自动化及仪表,2010,37(8):30-33. 被引量：16
5冯爱祥,周小娜,罗雄麟.基于Petri网的电加热炉温度控制系统[J].化工自动化及仪表,2011,38(10):1168-1170. 被引量：7
6祝军,乔非,李莉,李桂琴.基于混杂Petri网的钢铁企业煤气能量流网络建模与权函数优化[J].东南大学学报（自然科学版）,2012,42(A01):122-126. 被引量：3
7方贤文,陶小燕,刘祥伟.基于模态Petri网的行为有效区间寻找最优路径的方法[J].计算机科学,2014,41(7):91-96. 被引量：1
8罗雄麟,左瑞香,冯爱祥,许锋.化工过程非稳态开工的缓冲升温修正切换控制[J].化工学报,2015,66(2):647-654. 被引量：3
9刘伯春.离散系统采样周期的选择[J].化工自动化及仪表,1989,16(1):28-33. 被引量：7

引证文献1

1徐宝昌,蔡胜清,冯爱祥,罗雄麟.变工况切换过程的Petri网自主预测与控制[J].化工学报,2016,67(3):839-845. 被引量：2

二级引证文献2

1冯爱祥,李明骏,罗雄麟.变工况条件下Bang-Bang与常规控制集成的选择性控制工程设计与运行[J].化工自动化及仪表,2017,44(2):119-124.
2万军,赵不贿.基于自控网系统的混杂控制[J].控制理论与应用,2019,36(9):1528-1535. 被引量：2

1史涛,杨卫东,任红格.轮式机器人鲁棒仿生自主学习算法的研究[J].计算机测量与控制,2014,22(4):1209-1211.
2阮晓钢,戴丽珍,于乃功,于建均.一种自治操作条件反射自动机[J].控制理论与应用,2012,29(11):1452-1457. 被引量：2
3阮晓钢,郜园园,宋洪军.基于操作条件反射自动机的仿生自主学习方法[J].北京工业大学学报,2011,37(11):1631-1637.
4戴丽珍,杨刚,阮晓钢.基于AOCA仿生学习模型的两轮机器人自主平衡学习研究[J].自动化学报,2014,40(9):1951-1957. 被引量：3
5蔡建羡,阮晓钢.基于遗传算法的Skinner操作条件反射学习模型[J].系统工程与电子技术,2011,33(6):1370-1376. 被引量：3
6邱阿瑞,孙健.用模糊逻辑方法优化多层前馈网络结构[J].电工电能新技术,1999,18(4):1-4.
7徐杰.基于遗传算法的RBF神经网络的优化与应用[J].信息技术,2011,35(5):166-168. 被引量：3
8王帅,李光泽,李宾泽.基于操作条件反射的自主学习型智能系统[J].科技创新导报,2014,11(10):223-223.
9安志远,刘海燕,吴俊聪.SHP点文件数字水印的理论方法与实现[J].北华航天工业学院学报,2015,25(6):1-3.
10阮晓钢,胡敬敏,王启源,刘航.一种独轮机器人的滑模控制[J].控制工程,2011,18(1):128-132. 被引量：8

电机与控制学报

2012年第9期

浏览历史

内容加载中请稍等...

映射领域可自主收缩的操作条件反射自动机被引量：1

参考文献10

二级参考文献39

共引文献11

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

映射领域可自主收缩的操作条件反射自动机 被引量：1

参考文献10

二级参考文献39

共引文献11

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

映射领域可自主收缩的操作条件反射自动机被引量：1