-
题名基于替代传导径迹增强式学习的自主式微直升机控制
- 1
-
-
作者
杨玉君
程君实
陈佳品
张琛
肖永利
-
机构
上海交通大学信息存储研究中心
-
出处
《信息与控制》
CSCD
北大核心
2003年第3期229-233,共5页
-
基金
国家自然科学基金资助项目 ( 698890 5 0 )
863计划资助项目 ( 863 5 12 0 4 0 1)
总装备部资助项目
-
文摘
随着微电子机械系统 (MEMS)的迅猛发展 ,自主式微直升机的研究也已成为这一领域内的研究热点之一 .由于微直升机尺寸的限制 ,不能安装功能很强的传感器和处理器 ,难以获得完全的环境信息 ,所以传统的基于模型的控制方法不适用于环境是动态的自主微直升机控制 .基于行为的控制方法采用累次逼近的方法 ,不需要环境的精确模型 ,因此系统的稳定性较好 .本文采用基于替代传导径迹的增强式学习 ,结合即时差分方法 ,提高其学习效率 ,仿真实验验证了该学习算法的有效性 .最后 。
-
关键词
自主式微直升机
控制方法
微电子机械系统
增强式学习
智能体
传导径迹
传感器
-
Keywords
MEMS, autonomous micro helicopter, reinforcement learning, replacing eligibility trace,temporal difference
-
分类号
V275.1
[航空宇航科学与技术—飞行器设计]
-
-
题名基于协作增强式学习的自主式微直升机控制
- 2
-
-
作者
杨玉君
程君实
陈佳品
张琛
肖永利
-
机构
上海交通大学信息存储研究中心
-
出处
《测控技术》
CSCD
2003年第2期23-26,共4页
-
基金
国家自然科学基金资助 ( 698890 5 0 )
863计划资助项目 ( 863 5 12 0 4 0 1)
总装备部资助项目
-
文摘
自主式微直升机为了获得完成任务的行为 ,可以通过在任务环境中飞行来学习控制规则。由于增强式学习不需要精确的环境模型 ,而是采用逐次逼近的机理 ,所以微直升机需要很大的计算开销 ,难以满足实时性要求。另外由于微直升机尺寸的限制 ,不能安装功能很强的传感器来获得完全的环境信息 ,所以微直升机必须通过其他智能体协作来获得环境信息。本文利用高档台式机强大的计算和扩展功能 ,将其作为一个协作智能体与微直升机协作来完成增强式学习 ,仿真实验结果和理论分析证明这种方法的有效性 ,最后 。
-
关键词
协作增强式学习
自主式微直升机
控制
协作学习
智能体
增强式学习
仿真
-
Keywords
autonomous micro helicopter
cooperation learning
agent
reinforcement learning
-
分类号
V275.1
[航空宇航科学与技术—飞行器设计]
-