期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
模糊操作条件概率自动机仿生自主学习系统和机器人自平衡控制 被引量:2
1
作者 阮晓钢 蔡建羡 《控制理论与应用》 EI CAS CSCD 北大核心 2010年第7期960-964,共5页
为了实现两轮机器人的自平衡控制,利用Skinner操作条件反射机理,以概率自动机为平台,融入模糊推理,构造了模糊操作条件概率自动机(OCPA)仿生自主学习系统.该学习系统是一个从状态集合到操作行为集合的随机映射,采用操作条件反射学习机制... 为了实现两轮机器人的自平衡控制,利用Skinner操作条件反射机理,以概率自动机为平台,融入模糊推理,构造了模糊操作条件概率自动机(OCPA)仿生自主学习系统.该学习系统是一个从状态集合到操作行为集合的随机映射,采用操作条件反射学习机制,从操作行为集合中随机学习作为控制系统控制信号的最优行为,并利用学习到的操作行为取向值信息,调整操作条件反射学习算法.此外,学习系统还引入行为熵,以验证其自学习和自组织能力.应用于两轮机器人自平衡控制的仿真结果,验证了模糊OCPA学习系统的可行性. 展开更多
关键词 操作条件反射 概率自动机 模糊推理 仿生自主学习系统 自平衡控制
下载PDF
轮式机器人鲁棒仿生自主学习算法的研究
2
作者 史涛 杨卫东 任红格 《计算机测量与控制》 北大核心 2014年第4期1209-1211,共3页
针对本质不稳定的轮式机器人运动平衡问题,基于操作条件反射原理,结合鲁棒控制,提出了一种鲁棒仿生自主学习算法作为轮式机器人的学习机制;该算法利用鲁棒控制可以提高系统抑制干扰的能力,产生最优控制行为的特点,将其与操作条件反射原... 针对本质不稳定的轮式机器人运动平衡问题,基于操作条件反射原理,结合鲁棒控制,提出了一种鲁棒仿生自主学习算法作为轮式机器人的学习机制;该算法利用鲁棒控制可以提高系统抑制干扰的能力,产生最优控制行为的特点,将其与操作条件反射原理相结合,使机器人通过与未知环境的交互、学习和训练,模拟生物操作条件反射机制以及自学习和自适应技能,实现对轮式机器人的运动平衡控制,并从理论上证明了算法的稳定性;最后,分别用该算法在无干扰和有干扰的两种情况下对机器人做了仿真实验并进行了比较,结果表明,鲁棒仿生自主学习算法能够使机器人获得自主学习和平衡控制的技能,并体现出了较好的学习性能抗干扰能力。 展开更多
关键词 鲁棒控制 操作条件反射 仿生自主学习 运动平衡控制 轮式机器人
下载PDF
OCPA仿生自主学习系统及在机器人姿态平衡控制上的应用 被引量:5
3
作者 蔡建羡 阮晓钢 《模式识别与人工智能》 EI CSCD 北大核心 2011年第1期138-146,共9页
针对本质上非线性、强耦合的两轮自平衡机器人复杂动态系统,构造操作条件反射概率自动机(OCPA)仿生自主学习系统.OCPA仿生自主学习系统是一个基于Skinner操作条件反射的概率自动机,主要特征在于模拟生物的操作条件反射机制,具有仿生的... 针对本质上非线性、强耦合的两轮自平衡机器人复杂动态系统,构造操作条件反射概率自动机(OCPA)仿生自主学习系统.OCPA仿生自主学习系统是一个基于Skinner操作条件反射的概率自动机,主要特征在于模拟生物的操作条件反射机制,具有仿生的自组织功能,包括自学习和自适应功能,可用于描述、模拟、设计各种自组织系统.从理论上分析OCPA学习系统的操作条件反射学习机制的收敛性.应用于两轮机器人姿态平衡控制的仿真和实验结果均表明,设计的OCPA仿生自主学习系统不需要系统的模型,通过模拟生物的操作条件反射机制,自组织地渐进形成、发展和完善其姿态平衡控制技能. 展开更多
关键词 操作条件反射概率自动机(OCPA)仿生自主学习 操作条件反射 两轮机器人 姿态平衡控制
原文传递
动态FOCPA学习系统设计及在机器人运动平衡控制中的应用
4
作者 蔡建羡 阮晓钢 《信息与控制》 CSCD 北大核心 2010年第5期662-672,共11页
针对仿生自主学习系统的自组织和泛化能力问题,基于Skinner操作条件反射原理和模糊聚类算法设计了动态FOCPA(fuzzy operant conditioning probabilistic automaton)仿生自主学习系统.动态FOCPA学习系统不仅具有仿生的自学习和自组织能力... 针对仿生自主学习系统的自组织和泛化能力问题,基于Skinner操作条件反射原理和模糊聚类算法设计了动态FOCPA(fuzzy operant conditioning probabilistic automaton)仿生自主学习系统.动态FOCPA学习系统不仅具有仿生的自学习和自组织能力,而且提高了学习的精度和速度.其在仅能获得环境微弱反馈信息的前提下,首先采用在线聚类的方法实现对输入空间的灵活划分,以确保映射规则的数目是最经济的;然后以取向值为评价信号,采用OC学习算法,在线自主学习输入状态到输出操作行为的最佳映射,并加入一个高斯噪声项对映射结果进行实时优化.此外,动态FOCPA学习系统还利用信息熵的评价能力,来验证自身的自学习和自组织能力.理论上分析了设计的OC学习算法的收敛性;通过对两轮柔性直立式机器人姿态平衡控制和速度控制的实验分析,验证了动态FOCPA学习系统的有效性. 展开更多
关键词 操作条件反射 模糊聚类 仿生自主学习系统 信息熵 姿态平衡控制 速度控制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部