期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
强化学习在足球机器人基本动作学习中的应用 被引量:6
1
作者 段勇 杨淮清 +1 位作者 崔宝侠 徐心和 《机器人》 EI CSCD 北大核心 2008年第5期453-459,共7页
主要研究了强化学习算法及其在机器人足球比赛技术动作学习问题中的应用.强化学习的状态空间和动作空间过大或变量连续,往往导致学习的速度过慢甚至难于收敛.针对这一问题,提出了基于T-S模型模糊神经网络的强化学习方法,能够有效地实现... 主要研究了强化学习算法及其在机器人足球比赛技术动作学习问题中的应用.强化学习的状态空间和动作空间过大或变量连续,往往导致学习的速度过慢甚至难于收敛.针对这一问题,提出了基于T-S模型模糊神经网络的强化学习方法,能够有效地实现强化学习状态空间到动作空间的映射.此外,使用提出的强化学习方法设计了足球机器人的技术动作,研究了在不需要专家知识和环境模型情况下机器人的行为学习问题.最后,通过实验证明了所研究方法的有效性,其能够满足机器人足球比赛的需要. 展开更多
关键词 强化学习 机器人足球比赛 行为学习 T-S模糊神经网络
下载PDF
基于模糊神经网络的强化学习及其在机器人导航中的应用 被引量:13
2
作者 段勇 徐心和 《控制与决策》 EI CSCD 北大核心 2007年第5期525-529,534,共6页
研究基于行为的移动机器人控制方法.将模糊神经网络与强化学习理论相结合,构成模糊强化系统.它既可获取模糊规则的结论部分和模糊隶属度函数参数,也可解决连续状态空间和动作空间的强化学习问题.将残差算法用于神经网络的学习,保证了函... 研究基于行为的移动机器人控制方法.将模糊神经网络与强化学习理论相结合,构成模糊强化系统.它既可获取模糊规则的结论部分和模糊隶属度函数参数,也可解决连续状态空间和动作空间的强化学习问题.将残差算法用于神经网络的学习,保证了函数逼近的快速性和收敛性.将该系统的学习结果作为反应式自主机器人的行为控制器。 展开更多
关键词 强化学习 模糊神经网络 Q(λ)学习 机器人导航
下载PDF
基于强化学习规则的两轮机器人自平衡控制 被引量:6
3
作者 阮晓钢 蔡建羡 陈静 《计算机测量与控制》 CSCD 北大核心 2009年第2期321-323,共3页
两轮机器人是一个典型的不稳定,非线性,强耦合的自平衡系统,在两轮机器人系统模型未知和没有先验经验的条件下,将强化学习算法和模糊神经网络有效结合,保证了函数逼近的快速性和收敛性,成功地实现两轮机器人的自学习平衡控制,并解决了... 两轮机器人是一个典型的不稳定,非线性,强耦合的自平衡系统,在两轮机器人系统模型未知和没有先验经验的条件下,将强化学习算法和模糊神经网络有效结合,保证了函数逼近的快速性和收敛性,成功地实现两轮机器人的自学习平衡控制,并解决了两轮机器人连续状态空间和动作空间的强化学习问题;仿真和实验表明:该方法不仅在很短的时间内成功地完成对两轮机器人的平衡控制,而且在两轮机器人参数变化较大时,仍能维持两轮机器人的平衡。 展开更多
关键词 强化学习 模糊神经网络 两轮机器人系统 平衡控制
下载PDF
基于模糊小波网络的强化学习及其在多机器人决策策略中的应用
4
作者 段勇 李程 徐心和 《高技术通讯》 CAS CSCD 北大核心 2013年第4期407-412,共6页
给出了一种基于模糊小波神经网络(FWNN)的强化学习方法,并研究了应用该方法解决多机器人足球比赛中的决策策略问题。首先,使用FWNN来实现强化学习状态空间到动作空间的映射,从而解决大规格或连续状态空间所导致的学习速度过慢甚至难以... 给出了一种基于模糊小波神经网络(FWNN)的强化学习方法,并研究了应用该方法解决多机器人足球比赛中的决策策略问题。首先,使用FWNN来实现强化学习状态空间到动作空间的映射,从而解决大规格或连续状态空间所导致的学习速度过慢甚至难以收敛等问题。然后,研究了提出的方法在机器人足球比赛的复杂决策策略学习中的应用,证明机器人球员能够通过学习掌握根据比赛状态信息选择合理动作的能力。最后,通过实验验证了该学习方法的有效性,它能够满足机器人足球比赛的需要。 展开更多
关键词 强化学习(RL) 模糊小波神经网络(FWNN) 机器人足球比赛 动作选择 决策
下载PDF
发育学习在足球机器人基本动作技能中的应用
5
作者 朱智华 《科学技术与工程》 2010年第8期1989-1992,共4页
研究了发育学习算法及其在机器人足球比赛技术动作学习问题中的应用。结合发育学习算法的优点,选用合适的强化学习算法,并将其应用于足球机器人动作技能的学习中。无需任何先验知识和环境模型,通过不断与环境交互获得知识,自主地进行动... 研究了发育学习算法及其在机器人足球比赛技术动作学习问题中的应用。结合发育学习算法的优点,选用合适的强化学习算法,并将其应用于足球机器人动作技能的学习中。无需任何先验知识和环境模型,通过不断与环境交互获得知识,自主地进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视。最后,给出了试验结果分析,并验证了该算法的优越性和有效性,并且能够满足高水准机器人足球比赛的需要。 展开更多
关键词 发育学习 足球机器人比赛 强化学习 模糊神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部