基于IHDR自主学习框架的无人机3维路径规划被引量：14

UAV 3D Path Planning Based on IHDR Autonomous-Learning-Framework

导出

摘要提出一种基于自主学习框架的无人机3维路径规划方法.该自主学习框架由知识学习、知识检索和在线更新三部分组成.在该框架中,无人机在线路径规划时首先从过去的规划经验中提取控制量直接用于指导当前机器人的行动,另一方面,如果检索结果对于当前无人机的状态是无效的,可以在线启动常规3维路径规划算法,实时计算机器人的控制量,在控制机器人运动的同时将当前状态下的新决策量添加到知识库中从而对其进行更新.此外,分别采用增量分层判别回归算法(IHDR)和k-D树方法建立了路径规划知识库.其中,IHDR方法通过增量方式,可将以往的路径样本建立为一棵分层树.大量的仿真结果对比表明,在本文提出的框架下,基于IHDR的方法比传统的k-D树方法具有更好的实时性. An autonomous learning framework for UAV （unmanned aerial vehicle） 3D path planning is proposed. This framework consists of three parts, i.e. knowledge learning, knowledge retrieving and updating online. In this framework, the control value will be retrieved firstly from the existed knowledge when UAV runs online, so as the current action of the robot can be guided by the results. If the decisions retrieved from the knowledge base are invalid for the current UAV states, the custom algorithm for UAV path planning will be launched online and it generates the decisions for UAV＇s movement in real time. In the meanwhile, the knowledge library is updated by adding the new decisions for the current states. Additionally, the knowledge library is constructed by the algorithm of incremental hierarchical discriminant regression （IHDR） and k-D tree, respectively. Among these methods, IHDR can construct a hierarchical tree by using the past path planning samples. By several simulations, IHDR method demonstrates better real time performance than the traditional k-D tree method under the proposed framework.

作者陈洋张道辉赵新刚韩建达

机构地区武汉科技大学信息科学与工程学院中国科学院沈阳自动化研究所机器人学国家重点实验室沈阳理工大学信息科学与工程学院

出处《机器人》 EI CSCD 北大核心 2012年第5期513-518,共6页 Robot

基金国家自然科学基金资助项目(61035005 61075087 61203331) 湖北省自然科学基金资助项目(2010CDA005) 湖北省教育厅基金资助项目(Q20111105)

关键词无人机 3维路径规划自主学习框架 IHDR K-D树 UAV （unmanned aerial vehicle） 3D path planning autonomous learning framework IHDR （incrementalhierarchical discriminant regression） k-D tree

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献17

1LaValle S M. Planning algorithms[M]. 2nd ed. New York, NY, USA: Cambridge University Press, 2006.
2Tisdale J, Kim Z, Hedrick J. Autonomous UAV path planning and estimation[J]. IEEE Robotics and Automation Magazine, 2009, 16(2): 35-42.
3Fahimi E Autonomous robots modeling, path planning, and control[M]. Boston, USA: Springer Science+Business Media, LLC, 2009.
4Kuwata Y, How J. Three dimensional receding horizon control for UAVs[C]//AIAA Guidance, Navigation, and Control Conference. Reston, VA, USA: AIAA, 2004:2100-2113.
5Earl M G, D'Andrea R. Iterative MILP methods for vehicle con- trol problems[J]. IEEE Transactions on Robotics, 2005, 21(6): 1158-1167.
6Chen Y, Han J D. LP-based path planning for target pursuit and obstacle avoidance in 3D relative coordinates[C]//American Control Conference. Piseataway, NJ, USA: IEEE, 2010: 5394- 5399.
7Goerzen C, Kong Z, Mettler B. A survey of motion planning al- gorithms from the perspective of autonomous UAV guidance[J]. Journal of Intelligent and Robotic Systems, 2010, 57(1-4): 65- 100.
8Vasudevan C, Ganesan K. Case-based path planning for autonomous underwater vehicles[J]. Autonomous Robots, 1996, 3(2/3): 79-89.
9Kruusmaa M. Global level path planning for mobile robots in dynamic environments[J]. Journal of Intelligent and Robotic Systems, 2003, 38(1): 55-83.
10Chen C L, Li H X, Dong D Y. Hybrid control for robot navigation - A hierarchical Q-learning algorithm[J]. IEEE Robotics and Automation Magazine, 2008, 15(2): 37-47.

二级参考文献27

1杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
2SUTTON R S, BARTO A G. Reinforcement learning:an introduction[M]. Cambridge, Mass., USA:MIT Press, 1998.
3BRATMAN M E. Intentions, plans, and practical reason[M]. Cambridge, Mass., USA:Harvard University Press, 1987.
4DIETTERICH T. The MAXQ method for hierarchical reinforcement learning[C]//Proceedings of the 15th ICML. San Francisco, Cal. , USA : Morgan Kaufmann, 1998 :118-126.
5SPIROS K, DANIEL K. Reinforcement learning of coordination in cooperative MAS[C]//Proceedings of the 8th National Conference on AI. Alberta, Canada:ACM Press, 2002:326-331.
6TESSIER C, CHAUDRON L. Confilicting Agents-conflict management in multi Agent systems[M]. Dordrecht, Netherlands: Kluwer Academic Publishers, 2001.
7RAO A S, GEORGEFF M P. BDI Agents:from theory to practice[C]//Proeeedings of the 1st International Conference on Multi-Agent Systems. New York, N. Y. , USA: ACM Press, 1995:312-319.
8WOOLDRIDGE M J, JENNINGS N R. Pitfalls of Agent-oriented development[C]//Proceedings of the 2nd International Conference on Autonomous Agents. New York, N. Y. , USA:ACM Press, 1998:385-391.
9GAT E. On three-layer architectures [C]//Proceedings of Artificial Intelligence and Mobile Robots. Menlo Park:Cal. , USA:AAAI Press, 1998:195 210.
10SU'fTON R S , BARTO A G. Reinforcement learning: an introduction [ M ]. London : MIT Press ,2005.

共引文献11

1李璠,郝应光.基于改进混沌遗传算法的无人机航迹规划[J].电光与控制,2012,19(8):15-19. 被引量：7
2吴德伟,杜佳,戚君宜,杨俊强.向人脑学习的UCAV认知导航航迹规划研究[J].空军工程大学学报（自然科学版）,2014,15(5):46-51. 被引量：3
3孙艺彬,杨慧珍.基于定向约束的脉冲耦合神经网络路径规划[J].计算机科学,2019,46(S11):28-32. 被引量：4
4陈晓倩,刘瑞祥.基于最小二乘策略迭代的无人机航迹规划方法[J].计算机工程与应用,2020,56(1):191-195. 被引量：6
5代晓清,赵旭.一种基于无限时域无模型的在线Q学习算法[J].电光与控制,2022,29(2):53-57.
6杨琪森,王慎执,桑金楠,王朝飞,黄高,吴澄,宋士吉.复杂开放水域下智能船舶路径规划与避障方法[J].计算机集成制造系统,2022,28(7):2030-2040. 被引量：17
7李伟科,岳洪伟,王宏民,杨勇,赵敏,邓辅秦.基于改进强化学习的模块化自重构机器人编队[J].计算技术与自动化,2022,41(3):6-13. 被引量：3
8李波,黄晶益,万开方,宋超.基于深度强化学习的无人机系统应用研究综述[J].战术导弹技术,2023(1):58-68. 被引量：1
9王步云,刘聚.作战Agent的学习算法研究进展与发展趋势[J].兵工自动化,2023,42(9):74-78.
10李子怡,胡祥涛,张勇乐,许建军.基于虚拟目标制导的自适应Q学习路径规划算法[J].计算机集成制造系统,2024,30(2):553-568.

同被引文献186

1黄敏,路飞,李晓磊,田国会,孟可.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人,2019,41(5):609-619. 被引量：6
2赵文婷,彭俊毅.基于VORONOI图的无人机航迹规划[J].系统仿真学报,2006,18(z2):159-162. 被引量：50
3胡晓峰.战争工程:信息时代的战争方法学[J].军事运筹与系统工程,2004,18(2):3-7. 被引量：14
4任敏,霍霄华.基于异步双精度滚动窗口的无人机实时航迹规划方法[J].中国科学：信息科学,2010,40(4):561-568. 被引量：11
5王和平,柳长安,李为吉.基于蚁群算法的无人机任务规划[J].西北工业大学学报,2005,23(1):98-101. 被引量：11
6李桂芝,安成万,杨国胜,谭民,涂序彦.基于场景识别的移动机器人定位方法研究[J].机器人,2005,27(2):123-127. 被引量：20
7叶媛媛,闵春平,沈林成,常文森.基于VORONOI图的无人机空域任务规划方法研究[J].系统仿真学报,2005,17(6):1353-1355. 被引量：45
8高颖,陈东岳,张立明.一种带有实时视觉特征学习的自主发育机器人探索[J].复旦学报（自然科学版）,2005,44(6):964-970. 被引量：6
9黄河,史忠植,郑征.基于形状特征k-d树的多维时间序列相似搜索[J].软件学报,2006,17(10):2048-2056. 被引量：11
10段勇,徐心和.基于模糊神经网络的强化学习及其在机器人导航中的应用[J].控制与决策,2007,22(5):525-529. 被引量：13

引证文献14

1黄敏,路飞,李晓磊,田国会,孟可.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人,2019,41(5):609-619. 被引量：6
2姜军,齐俊桐,韩建达.面向机动飞行的多旋翼飞行器设计和建模与控制[J].科学通报,2013,58(S2):135-144. 被引量：8
3钱夔,宋爱国,章华涛,张立云.基于自主发育神经网络的机器人室内场景识别[J].机器人,2013,35(6):703-708. 被引量：8
4钱夔,宋爱国,章华涛,张立云.基于单胺类神经递质调节发育算法的机器人视觉定位[J].机器人,2014,36(3):362-368. 被引量：6
5吴德伟,杜佳,戚君宜,杨俊强.向人脑学习的UCAV认知导航航迹规划研究[J].空军工程大学学报（自然科学版）,2014,15(5):46-51. 被引量：3
6陈成,何玉庆,卜春光,韩建达.基于四阶贝塞尔曲线的无人车可行轨迹规划[J].自动化学报,2015,41(3):486-496. 被引量：85
7张德龙,李威凌,吴怀宇,陈洋.基于学习机制的移动机器人动态场景自适应导航方法[J].信息与控制,2016,45(5):521-529. 被引量：7
8张阳,司光亚,王艳正.无人集群作战建模与仿真综述[J].电子信息对抗技术,2018,33(3):30-36. 被引量：16
9张蓬郁,王煜,江旻宇,邵嘉琳,张洪滨.基于K-D树和机器学习的时空数据检索-预测系统[J].软件,2018,39(8):215-218. 被引量：4
10魏瑞轩,张启瑞,许卓凡,周凯,赵晓林.类脑发育无人机防碰撞控制[J].控制理论与应用,2019,36(2):175-182. 被引量：13

二级引证文献167

1黄敏,路飞,李晓磊,田国会,孟可.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人,2019,41(5):609-619. 被引量：6
2沈笑云,张硕,张思远.终端区航空器三维实时监视系统仿真[J].航空学报,2023,44(S01):190-199.
3姜龙亭,魏瑞轩,张启瑞,王栋.基于群智机理的集群防碰撞控制[J].航空学报,2020(S02):161-170. 被引量：10
4张岩,王美清.子宫内膜间质肿瘤[J].中国肿瘤临床,2000,27(1):75-76. 被引量：1
5胡建人,胡达人.捻绳股数与结构因子互换关系及其对自稳定性影响研究[J].包装工程,2000,21(3):9-10. 被引量：1
6吴德伟,何晶,韩昆,李卉.无人作战平台认知导航及其类脑实现思想[J].空军工程大学学报（自然科学版）,2018,19(6):33-38. 被引量：7
7邓娜,董迪娅,李翊硕.一种基于A*算法的路径平滑设计及仿真[J].电子技术与软件工程,2016(2):167-168. 被引量：2
8于佳琳,言勇华,王嘉宁.基于改进Bezier拟合算法的工业机器人轨迹规划[J].机电一体化,2016,22(2):12-17. 被引量：3
9符长友,蔡洪斌,刘昊,李行.基于物联网的微型四旋翼飞行器的设计[J].现代电子技术,2016,39(13):108-111. 被引量：3
10刘延柱,庄表中.多旋翼飞行器[J].力学与实践,2016,38(3):338-340. 被引量：1

1李贻斌,周凤余,李彩虹,刘明.移动机器人在线路径规划算法研究[J].系统工程与电子技术,2000,22(2):79-81. 被引量：13
2李铁,孙劲光,张新君,王星.基于分层稀疏表示特征学习的高光谱图像分类研究[J].激光与光电子学进展,2016,53(9):72-79. 被引量：8
3曾佳,李菁菁.面向复杂环境的移动机器人在线路径规划[J].上海电气技术,2009,2(1):32-35.
4张小庆,李腊元.基于分层簇树结构的无线传感器网络的设计与仿真[J].武汉理工大学学报（交通科学与工程版）,2008,32(6):1137-1140. 被引量：2
5刘玉顺.较量(续3)——HD-DVD和BD标准大战纪实[J].卫星电视与宽带多媒体,2006(3):65-68.
6李建华,李俊山,陈霞,朱秋旭.基于空间约束分层树模型的彩色图像分割[J].微电子学与计算机,2012,29(12):55-58.
7梁柱.基于视觉单词树的快速图像检索[J].西南师范大学学报（自然科学版）,2010,35(3):235-238. 被引量：2
8张连斗,吴彦鹏,赵欢,张建民.基于对象的分层树状装配数据模型设计与实现[J].计算机仿真,2005,22(2):133-135.
9王耀南,陈彦杰,缪志强.基于粒子群模糊的除冰机器人越障规划[J].控制工程,2014,21(2):298-302. 被引量：4
10郭天楚,吴晓雨,杨磊,黄向生.基于改进的随机森林的人体部件识别[J].中国传媒大学学报（自然科学版）,2014,21(5):32-38. 被引量：1

机器人

2012年第5期

浏览历史

内容加载中请稍等...

基于IHDR自主学习框架的无人机3维路径规划被引量：14

参考文献17

二级参考文献27

共引文献11

同被引文献186

引证文献14

二级引证文献167

相关作者

相关机构

相关主题

浏览历史

基于IHDR自主学习框架的无人机3维路径规划 被引量：14

参考文献17

二级参考文献27

共引文献11

同被引文献186

引证文献14

二级引证文献167

相关作者

相关机构

相关主题

浏览历史

基于IHDR自主学习框架的无人机3维路径规划被引量：14