基于改进CB-HAQL算法的无人机导航方法研究被引量：1

Research on UAV navigation method based on improved CB-HAQL algorithm

下载PDF

导出

摘要针对基于案例推理启发式Q学习(CB-HAQL)算法受案例库质量影响而无法收敛到较优策略的问题,提出基于有效触发机制改进的CB-HAQL算法。首先,根据迭代次数设置触发式案例库更新机制,只在达到阈值时生成或更新案例库,保证案例库质量;其次,设置动态参数调整案例对动作选取影响,使智能体根据对环境掌握程度决定启发影响大小;最后,加入经验倾向性探索动作加快学习效率。实验证明,改进后的算法提升了策略质量和训练速度,无人机完成导航任务证明了学习策略的有效性。 The quality of case base would affect the convergence effect of CB-HAQL algorithm strategy.Aiming at the fact,this paper developed an improved CB-HAQL algorithm based on effective triggering mechanism.Firstly,the algorithm set the trigger case base update mechanism according to the number of iterations.In order to ensure the quality of the case base,only when the threshold was reached,the algorithm generated or update the case base.Secondly,the dynamic parameter was set to adjust the impact of the case on action selection,so that the agent could determine the size of heuristic influence according to the degree of mastery of the environment.Finally,the algorithm added experience-oriented exploratory action to accelerate the learning efficiency.Experiments show that the algorithm improves the strategy quality and training speed,and the UAV’s navigation task proves the effectiveness of learning strategy.

作者胡丹丹莫宇帅 Hu Dandan;Mo Yushuai(Robotics Institute,Civil Aviation University of China,Tianjin 300300,China)

机构地区中国民航大学机器人研究所

出处《计算机应用研究》 CSCD 北大核心 2020年第7期2068-2071,共4页 Application Research of Computers

关键词无人机避障自主导航 CB-HAQL 触发机制 UAV obstacle avoidance autonomous navigation case based heuristically accelerated Q-learning(CB-HAQL) trigger mechanism

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张晶晶,周德云,张堃.一种基于强化学习的UAV目标搜索算法[J].计算机应用研究,2011,28(10):3659-3661. 被引量：4
2郝钏钏,方舟,李平.基于Q学习的无人机三维航迹规划算法[J].上海交通大学学报,2012,46(12):1931-1935. 被引量：14

二级参考文献18

1李伟,何雪松,叶庆泰,朱昌明.基于先验知识的强化学习系统[J].上海交通大学学报,2004,38(8):1362-1365. 被引量：5
2彭辉,沈林成,霍霄华.多UAV协同区域覆盖搜索研究[J].系统仿真学报,2007,19(11):2472-2476. 被引量：40
3范洪迭,马向玲,叶文.飞机低空突防航路规划技术[M].北京:国防工业出版社.2007:92-113.
4YANG Yan-li, MINAI A A, POLYCARPOU M M. Evidential map- building approaches for multi-UAV cooperative search [ C ]//Proc of American Control Conference. 2005 : 116-121.
5MAZA I, OLLERO A. Multiple UAV cooperative searching operation using polygon area decomosition and efficient coverage algorithms [ C ]//Proc of the 7th International Symposium on Distributed Autono- mous Robotics Systems. 2004:211-220.
6BAB A, BRAFMAN R I. Multi-agent reinforcement learning in common interest and fixed sum stochastic games:an experimental study[J]. Jour- nal of Machine Learning Research,2008,9:2635-2675.
7GREENWALD A, HALL K, ZINKEVICH M. Correlated Q-learning [ C ]//Proc of International Conference on Machine Learning. 2003 : 242 - 249.
8KOK J R, VLASSISS N. Collaborative multiagent reinforcement learning by payoff propagation[ J]. Journal of Machine Learning Research,2006,7 ( 2 ) : 1789-1828.
9ALPAYDIN E.机器学习导论[M].北京:机械工业出版社,2009:245-251.
10夏欢,周德云,陈龙建.多无人机协同搜索路径规划方法研究[C]//中国航空学会航空武器系统分会2010年学术年会暨第三届“中国航空武器装备试验与发展学术论坛”论文集.西安:西北工业大学出版社,2010:432-436.

共引文献16

1吴德伟,杜佳,戚君宜,杨俊强.向人脑学习的UCAV认知导航航迹规划研究[J].空军工程大学学报（自然科学版）,2014,15(5):46-51. 被引量：3
2陈彦杰,王耀南,钟杭,缪志强.动态环境中服务机器人的改进型地图学习规划[J].控制理论与应用,2015,32(2):162-168. 被引量：3
3王勋,姚佩阳,梅权.多无人机协同运动目标搜索问题研究[J].电光与控制,2016,23(8):18-22. 被引量：13
4刘鑫,杨霄鹏,刘雨帆,姚昆.基于GA-OCPA学习系统的无人机路径规划方法[J].航空学报,2017,38(11):282-292. 被引量：11
5张阳,司光亚,王艳正.无人集群作战建模与仿真综述[J].电子信息对抗技术,2018,33(3):30-36. 被引量：14
6丁林静,杨啟明.基于强化学习的无人机空战机动决策[J].航空电子技术,2018,49(2):29-35. 被引量：14
7陈晓倩,刘瑞祥.基于最小二乘策略迭代的无人机航迹规划方法[J].计算机工程与应用,2020,56(1):191-195. 被引量：6
8张秦浩,敖百强,张秦雪.Q-learning强化学习制导律[J].系统工程与电子技术,2020,42(2):414-419. 被引量：21
9曹家敏,付琦玮,周丘实,秦筱楲,蔡超.航迹规划策略学习方法研究[J].计算机工程,2020,46(5):282-290. 被引量：2
10赖俊,饶瑞.深度强化学习在室内无人机目标搜索中的应用[J].计算机工程与应用,2020,56(17):156-160. 被引量：9

同被引文献7

1刘宇硕,秦翔,郭万钦,高思如,陈记祖,王利辉,李延召,晋子振.控制点布设对冰川区无人机摄影测量精度的影响[J].遥感学报,2020,24(2):161-172. 被引量：19
2徐晨晨,廖小罕,岳焕印,鹿明,陈西旺.基于改进蚁群算法的无人机低空公共航路构建方法[J].地球信息科学学报,2019,21(4):570-579. 被引量：26
3邹松,唐娉,胡昌苗,单小军.基于三维重建的大区域无人机影像全自动拼接方法[J].计算机工程,2019,45(4):235-240. 被引量：8
4贺少帅,周乃恩,朱振宇.稀无控制点无人机遥感影像几何定位方法研究[J].地理信息世界,2019,26(2):96-99. 被引量：7
5刘浩,杨薇秀,焦胜海,陈洋,韩一帜.基于AHRS算法的小型无人机导航精度改进方法[J].中国电子科学研究院学报,2020,15(5):461-469. 被引量：4
6徐利锋,杨中柱,黄祖胜,丁维龙.结合混合粒子群算法的植保无人机航线设计方法[J].小型微型计算机系统,2020,41(9):1826-1832. 被引量：20
7刘祖均,何明,马子玉,顾凌枫.基于分布式一致性的无人机编队控制方法[J].计算机工程与应用,2020,56(23):146-152. 被引量：9

引证文献1

1顾荣军,夏雅琴.基于CFSFDP聚类算法的无人机航摄控制点布设方法[J].自动化技术与应用,2022,41(12):51-54.

1陈双,李龙,罗海南.基于神经网络的强化学习在服务机器人导航中的研究[J].现代计算机,2020,26(12):62-67.
2习近平.习近平:改革创新关键在人[J].中国人才,2020(7):4-4.
3李标.基于无人机技术的煤矿带式输送机巡检方案[J].煤矿安全,2020,51(7):128-131. 被引量：10
4谭睿璞,张文德,陈圣群,杨乐华.异质信息环境下基于案例推理的应急决策方法[J].控制与决策,2020,35(8):1966-1976. 被引量：7
5詹金武,李涛,黄建华,孙明社,陈军浩.基于案例推理的TBM选型适应性评价系统开发及应用[J].铁道科学与工程学报,2020,17(6):1562-1570. 被引量：6
6张媛.适度与包容理念下的老社区街道微更新策略——以天门市天门街道为例[J].规划师,2019(S02):53-57. 被引量：4
7廖志强.基于MAPublisher的地图快速更新机制研究[J].测绘与空间地理信息,2020,43(7):88-92. 被引量：6
8方梦琳,唐文兵,黄鸿云,丁佐华.基于模糊信息分解与控制规则的移动机器人沿墙导航[J].计算机科学,2020,47(S01):79-83. 被引量：4
9陈婷婷,林宝军,龚文斌,常家超.基于星间链路的导航卫星时间自主恢复策略[J].空间科学学报,2020,40(3):419-424. 被引量：1
10宋小健,左平兵,沈晓晨.行星际激波导致的磁尾等离子片中ULF波动事件[J].空间科学学报,2020,40(4):462-470.

计算机应用研究

2020年第7期

浏览历史

内容加载中请稍等...

基于改进CB-HAQL算法的无人机导航方法研究被引量：1

参考文献2

二级参考文献18

共引文献16

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进CB-HAQL算法的无人机导航方法研究 被引量：1

参考文献2

二级参考文献18

共引文献16

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进CB-HAQL算法的无人机导航方法研究被引量：1