基于深度强化学习的无人机辅助物联网多目标优化被引量：1

Multi-objective optimization of unmanned aerial vehicle assisted internet of things based on deep reinforcement learning

下载PDF

导出

摘要无人机辅助无线供电物联网是一种创新的网络架构,利用无人机作为能量传输中介,能够解决物联网设备电力供应的限制和局限性。针对无人机辅助无线供电物联网网络中多目标控制策略学习的问题,提出了一种基于深度强化学习的多目标双延迟深度确定性策略梯度(MOTD3)算法,旨在满足偏航角、飞行速度以及发射功率约束条件下,实现总数据速率、总收获能量最大化以及能耗和悬停时间最小化的多目标联合优化,同时因需求动态变化无人机进行在线路径规划。仿真结果表明,该算法在保证良好的收敛情况和稳定性前提下,较其他算法在总数据速率、总收获能量、能耗与悬停时间方面分别提高14.7%、10.6%、6.1%和10.3%,且具有较强泛化能力,可适用于实际中不同通信场景。 The unmanned aerial vehicle(UAV)-assisted wireless power supply for the internet of things(IoT)is an innovative network architecture where UAVs serve as energy transmission intermediaries,effectively addressing the limitations and constraints of power supply for IoT devices.In addressing the challenge of multi-objective control policy learning in UAV-assisted wireless power supply for the IoT,this study proposes a multi-objective twin-delay deep deterministic policy gradient(MOTD3)algorithm based on deep reinforcement learning.The MOTD3 algorithm aims to achieve joint optimization of multiple objectives,including maximizing the total data rate and total harvested energy,while minimizing energy consumption and hover time,under constraints such as yaw angle,flight speed,and transmission power.Additionally,it adapts UAVs to dynamic demand changes through online path planning.Simulation results demonstrate that the proposed algorithm can improve the total data rate,total harvest energy,energy consumption and hover time by 14.7%,10.6%,6.1%and 10.3%respectively compared with other algorithms,and has strong generalization ability,which can be applied to different communication scenarios in practice.

作者徐钰龙李君李正权胡静张圣王子威 Xu Yulong;Li Jun;Li Zhengquan;Hu Jing;Zhang Sheng;Wang Ziwei(College of Electronic and Information Engineering,Nanjing University of Information Science&Technology,Nanjing 210044,China;Wuxi University,Wuxi 214105,China;State Key Laboratory of Network and Switching Technology,Beijing University of Posts and Telecommunications,Beijing 100876,China)

机构地区南京信息工程大学电子与信息工程学院无锡学院北京邮电大学网络与交换技术国家重点实验室

出处《国外电子测量技术》 2024年第5期26-35,共10页 Foreign Electronic Measurement Technology

基金网络与交换技术全国重点实验室(北京邮电大学)开放课题项目(SKLNST-2023-1-13)资助。

关键词物联网无人机深度强化学习多目标优化路径规划 internet of things(IoT) unmanned aerial vehicle(UAV) deep reinforcement learning(DRL) multi objective optimization trajectory optimization

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1彭艺,唐剑,杨青青,李睿.基于强化学习的应急无人机通信中继选择策略[J].电子测量与仪器学报,2022,36(7):9-15. 被引量：8
2谭建豪,马小萍,李希.无人机3D航迹规划及动态避障算法研究[J].仪器仪表学报,2019,40(12):224-233. 被引量：18
3姚昌华,韩贵真,安蕾,高泽郃.多无人机协同侦察时间资源分配优化[J].电子测量技术,2022,45(18):106-113. 被引量：1
4翟璐璐.基于能量效率和覆盖率优化的UAV部署算法[J].国外电子测量技术,2021,40(12):24-29. 被引量：2
5张建行,康凯,钱骅,杨淼.面向物联网的深度Q网络无人机路径规划[J].电子与信息学报,2022,44(11):3850-3857. 被引量：4

二级参考文献34

1吴钟博,易建强.无人机编队支撑网络的协同通信中继策略[J].航空学报,2020(S02):187-194. 被引量：13
2刘晓锋,关志伟,宋裕庆,陈大山.An optimization model of UAV route planning for road segment surveillance[J].Journal of Central South University,2014,21(6):2501-2510. 被引量：1
3陈豪,李勇,罗靖迪.基于改进A*算法优化的移动机器人路径规划研究[J].自动化与仪器仪表,2018,0(12):1-4. 被引量：25
4田震,王晓芳.基于多基因遗传算法的异构多无人机协同任务分配[J].飞行力学,2019,37(1):39-44. 被引量：22
5林勇,徐智勇,汪井源,宋超,王荣,耿常锁.雾环境下非视距散射光通信最佳链路分析[J].红外与激光工程,2015,44(2):705-710. 被引量：6
6高申勇,许方镇,郭鸿杰.基于弹簧模型的移动机器人路径规划研究[J].仪器仪表学报,2016,37(4):796-803. 被引量：33
7张成,凌有铸,陈孟元.改进蚁群算法求解移动机器人路径规划[J].电子测量与仪器学报,2016,30(11):1758-1764. 被引量：50
8张艺巍,谭建豪,王耀南.3维复杂山地环境下旋翼无人飞行器高时效航迹规划策略[J].机器人,2016,38(6):727-737. 被引量：7
9陈彦杰,王耀南,谭建豪,毛建旭.局部环境增量采样的服务机器人路径规划[J].仪器仪表学报,2017,38(5):1093-1100. 被引量：23
10穆文静,李勇朝,阮玉晗,张海林.基于遍历容量的低轨卫星协作通信中继选择算法[J].信号处理,2017,33(10):1317-1323. 被引量：6

共引文献28

1林依凡,陈彦杰,何炳蔚,黄益斌,王耀南.无碰撞检测RRT^*的移动机器人运动规划方法[J].仪器仪表学报,2020(10):257-267. 被引量：40
2韩东升,念欣然,李然.无人机辅助无线通信位置和波束联合优化方法[J].电子测量技术,2023,46(20):88-97.
3杨张海,张阳亮.无人机在应急通信中的应用[J].光源与照明,2023(4):98-100.
4徐喆,柳新.基于城市车道撒点策略的RT-RRT^*智能车局部路径规划[J].国外电子测量技术,2020,39(6):137-143. 被引量：3
5李玉衡,李雨佳,饶启明,易映萍,姚磊.基于权重PID和激光测距斯特林自控车设计[J].电子测量技术,2020,43(13):1-6. 被引量：3
6杨苡辰,孙日明.基于python的非线性方程组求解方法研究[J].电子测量技术,2020,43(14):55-59. 被引量：1
7侯力扬,李金宝.煤矿井下水仓智能清淤机器人的路径规划算法研究[J].电子测量技术,2020,43(19):75-79. 被引量：3
8倪昌浩,邹海.在复杂地形下三维UAV航迹规划的改进A^(*)算法[J].传感器与微系统,2021,40(2):136-138. 被引量：6
9刘亚威,敖佳钰,唐梦玲,赵烨,郭昕曜.智能化无人机火灾监测及救援灭火系统构建[J].滨州学院学报,2021,37(2):23-27. 被引量：2
10夏勇生,吴东升,平兰兰.基于MPC的爆胎车辆轨迹控制研究[J].电子测量与仪器学报,2021,35(6):154-160. 被引量：7

同被引文献6

1刘磊,李宇,张春华,黄海宁.延迟容忍及冲突避免的水声网络S-Aloha协议[J].仪器仪表学报,2014,35(3):513-519. 被引量：5
2马助兴,付炜平,李焱,谷浩,康哲.基于物联网技术的变电站智能安全管控系统的设计及实现[J].电子测量技术,2019,42(23):6-14. 被引量：17
3王瑶,卢先领,沈义峰.移动边缘计算中依赖型任务的调度模型研究[J].电子测量与仪器学报,2022,36(8):60-68. 被引量：2
4吴钢,周金辉,李慧.面向边缘增强分布式电力无线传感网的资源分配[J].中国电力,2023,56(8):77-85. 被引量：2
5邓集检,张月霞.基于用户意愿度D2D协助的工业物联网资源分配[J].国外电子测量技术,2024,43(2):193-200. 被引量：1
6李焕焕,彭盛亮,陈铮,秦雄飞.认知无线电中基于LSTM网络的MAC协议识别[J].信号处理,2019,35(5):837-842. 被引量：5

引证文献1

1刘宇鹏,雷少波,樊浩研,牛虹.基于深度强化学习的无线多址接入方法研究[J].国外电子测量技术,2024,43(8):10-16.

1丁建晖.融媒体时代下晋商博物院转型发展的策略探究[J].经济师,2024(5):286-287.
2罗杨,石超峰.垃圾量有限预知下环卫车在线调度策略[J].黑龙江交通科技,2024,47(3):160-163.

国外电子测量技术

2024年第5期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人机辅助物联网多目标优化被引量：1

参考文献5

二级参考文献34

共引文献28

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人机辅助物联网多目标优化 被引量：1

参考文献5

二级参考文献34

共引文献28

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人机辅助物联网多目标优化被引量：1