基于Q学习的无人机辅助WSN数据采集轨迹规划被引量：4

Trajectory Planning for Unmanned Aerial Vehicle Assisted WSN Data Collection Based on Q-Learning

下载PDF

导出

摘要针对无人机辅助采集无线传感器网络数据时各节点数据产生速率随机和汇聚节点状态不一致的场景,提出基于Q学习的非连续无人机轨迹规划算法Q-TDUD,以提高无人机能量效率和数据采集效率。基于各节点在周期内数据产生速率的随机性建立汇聚节点的汇聚延时模型,应用强化学习中的Q学习算法将各汇聚节点的延迟时间和采集链路的上行传输速率归一化到奖励函数中,通过迭代计算得到最佳非连续无人机飞行轨迹。实验结果表明,与TSP-continues、TSP、NJS-continues和NJS算法相比,Q-TDUD算法能够缩短无人机的任务完成时间,提高无人机能效和数据采集效率。 In some scenarios where UnmannedAerial Vehicle(UAV)assists inWireless Sensor Network(WSN)data collection,the data generation rate of each node is random and the states of sink node are inconsistent.To address the problem,this paper proposes a Q-learning-based algorithm called Q-TDUD for discontinuous UAV trajectory planning,which can improve the energy efficiency of UAV and data collection efficiency.Based on the randomness of the data generation rate of each node in the cycle,the aggregation delay model of the sink node is established.The Q-learning algorithm in reinforcement learning is used to normalize the delay time of each sink node and the uplink transmission rate of the collection link into the reward function,and the optimal discontinuous flight trajectory of the UAV is obtained through iterative calculation.Experimental results show that,compared with TSP-continues,TSP,NJS-continues and NJS algorithms,the proposed Q-TDUD algorithm can reduce the task completion time of UAV,and improve the energy efficiency and data collection efficiency of UAV.

作者蒋宝庆陈宏滨 JIANG Baoqing;CHEN Hongbin(School of Information and Communication,Guilin University of Electronic Technology,Guilin,Guangxi 541004,China)

机构地区桂林电子科技大学信息与通信学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第4期127-134,165,共9页 Computer Engineering

基金国家自然科学基金(61671165)。

关键词无线传感器网络数据采集无人机轨迹规划 Q学习算法 Wireless Sensor Network(WSN) data collection Unmanned Aerial Vehicle(UAV) trajectory planning Q-learning algorithm

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1戴葵,仇广煜,胡守仁.一种基于离散马尔科夫模型的神经网络可靠性设计方法[J].计算机工程与科学,1999,21(3):10-14. 被引量：7
2刘建伟,高峰,罗雄麟.基于值函数和策略梯度的深度强化学习综述[J].计算机学报,2019,42(6):1406-1438. 被引量：133
3李双虎,王铁洪.Kmeans聚类分析算法中一个新的确定聚类个数有效性的指标[J].河北省科学院学报,2003,20(4):199-202. 被引量：25
4陈琪,陈宏滨.无线传感器网络中移动节点辅助的数据采集效率优化研究[J].计算机应用研究,2020,37(11):3467-3471. 被引量：18
5张汝波,杨广铭,顾国昌,张国印.Q-学习及其在智能机器人局部路径规划中的应用研究[J].计算机研究与发展,1999,36(12):1430-1436. 被引量：17
6汪成亮,严君辉.大规模无线传感网络数据收集的无人机路径规划[J].北京理工大学学报,2015,35(10):1044-1049. 被引量：7
7夏梁盛,严卫生.基于栅格法的移动机器人运动规划研究[J].计算机仿真,2012,29(12):229-233. 被引量：24
8李勇,段正澄.动态蚁群算法求解TSP问题[J].计算机工程与应用,2003,39(17):103-106. 被引量：12

二级参考文献61

1阎平凡.再励学习——原理、算法及其在智能控制中的应用[J].信息与控制,1996,25(1):28-34. 被引量：30
2高庆吉,张友谊,王红星,洪炳熔.非完整移动机器人鲁棒控制方法研究[J].东北电力大学学报,2006,26(2):19-23. 被引量：1
3[1]Usama M.Fayyad Cory A.Reina Paul S.Bradley,Initialization of Iterative Refinement Clustering Algorithms[C].Proc.4th International Conf.On Knowledge Discovery & Data Mining,1998.
4[2]Pena J M ,J.A.Lozano,and P.Larranaga,An Empirical Comparison of four Initialization Methods for the K-Means Algorithm[J].Pattern Recognition Letters, 1999,20:1027-1040.
5[3]Pal N R and J.C.Bezdek,On Cluster Validity for the Fuzzy c-Means Model,IEEE Transactions on Fuzzy Systems[J].1995,3:370-390.
6[4]Rezaee M R, B P F Lelieveldt and J.H.C.Reiber,A New Cluster Validity Index for Fuzzy c-Means[J].Pattern Recognition Letters ,1998,19:237-246.
7[5]Ray S and R H Turi,Determination of Number of Clusters in K-Means Clustering and Application in Colour Image Segmentation[C].ICAPRDT'99,Calcutta,India,27-29 December,1999.
8Marco Dorgio,Gianni Di Caro.Ant Algorithms for Discrete Optimization[J].Artificial Life, 1999;5(3) : 137-172.
9Luca M Gambardella,Marco Dorgio.Ant-Q :A reinforcement Learning approach to the traveling salesman problem[C].In :Proceeding of ML-95,Twelfthlntem Conf on Machine Learning,Morgan Kanfmann,1995 252-260.
10Hidenori KAWAMURA,Masahito YAMAMOTO,Keiji SUZUKI et al. Multiple Ant Colonies Algorithm Based on Colony Level Interactions[J]. IEICE TRANS Fundamentals,2000;E83-A(2).

共引文献235

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：46
2张磊,母亚双,潘泉.基于改进深度双Q网络的移动机器人路径规划算法[J].信息与控制,2024,53(3):365-376. 被引量：1
3戴丽.混合Nash均衡的无人机航路规划应用案例[J].数学理论与应用,2019(3):121-128.
4马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1
5闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17
6周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
7马荣国,李铁强,肖代全.灰关联决策在公路建设项目方案比选中的应用[J].长安大学学报（自然科学版）,2004,24(6):67-70. 被引量：18
8高燕,康重庆,夏清.发电企业绩效评估问题分析及其静态评估方法[J].中国电力,2005,38(3):29-34. 被引量：3
9王强,许红民.主成分分析在基因芯片分析中的应用[J].军医进修学院学报,2005,26(2):145-147. 被引量：9
10张汝波,施洋.基于模糊Q学习的多机器人系统研究[J].哈尔滨工程大学学报,2005,26(4):477-481. 被引量：4

同被引文献33

1王芳,华伟,宋晓宁.无线传感器网络安全路由协议SNEP的分析与仿真实现[J].江苏科技大学学报（自然科学版）,2009,23(5):425-429. 被引量：2
2吴毅凌,李红滨,赵玉萍.一种适用于时不变信道的信道估计方法[J].高技术通讯,2010,20(1):1-7. 被引量：1
3孙玲芳,李烁朋.基于K-means聚类与张量分解的社会化标签推荐系统研究[J].江苏科技大学学报（自然科学版）,2012,26(6):597-601. 被引量：8
4侯艳丽,苏佳,胡佳伟.基于有限反馈机会波束的无线传感器网络[J].传感器与微系统,2014,33(2):57-60. 被引量：1
5朱金奇,冯勇,孙华志,刘明,张兆年.无线可充电传感器网络中能量饥饿避免的移动充电[J].软件学报,2018,29(12):3868-3885. 被引量：9
6陈艳,王子健,赵泽,李栋,崔莉.传感器网络环境监测时间序列数据的高斯过程建模与多步预测[J].通信学报,2015,36(10):252-262. 被引量：11
7王芳,陈勇,叶志清,万建伟.基于CVX工具箱的自适应波束形成实验[J].电气电子教学学报,2016,38(2):136-139. 被引量：6
8何灏,陈永锐,易卫东,李鸣.无线可充电传感器网络中固定充电器的部署策略[J].通信学报,2017,38(A01):156-164. 被引量：5
9顾剑,李文钧.轻量级WSN分层协议栈的设计与实现[J].太赫兹科学与电子信息学报,2018,16(2):312-316. 被引量：4
10张自东,邱才明,张东霞,徐舒玮,贺兴.基于深度强化学习的微电网复合储能协调控制方法[J].电网技术,2019,43(6):1914-1921. 被引量：73

引证文献4

1刘洋,王军,吴云鹏.改进Q-Learning的WRSN充电路径规划算法[J].太赫兹科学与电子信息学报,2022,20(4):393-401. 被引量：1
2胡洁,张亚莉,王团,望梦成,兰玉彬,张植勋.基于深度强化学习的农田节点数据无人机采集方法[J].农业工程学报,2022,38(22):41-51. 被引量：4
3王琦,沈宏杰,潘秀卫,高尚,于化龙.基于聚类算法的无人机辅助WSN节点能量优化方案[J].江苏科技大学学报（自然科学版）,2022,36(6):68-74.
4王哲,王启名,李陶深,葛丽娜.基于深度强化学习的SWIPT边缘网络联合优化方法[J].计算机应用,2023,43(11):3540-3550. 被引量：3

二级引证文献8

1郭宇骞.基于边缘计算与物联网技术的信息系统项目实时监测及控制平台开发[J].科技创新与应用,2023,13(34):132-135. 被引量：4
2沈跃,李奕岑,沈亚运,王德伟,刘慧.基于改进最小化SNAP的植保无人机作业轨迹优化算法[J].农业工程学报,2023,39(17):51-59. 被引量：1
3莫春梅,王骥,谢再秘.基于UAV-WSN MAC的海水稻生长环境信息感知[J].农业工程学报,2023,39(17):141-152. 被引量：1
4谢庆助.深度学习算法在有线宽带网络中的应用与性能评估[J].通信电源技术,2024,41(3):158-160.
5杨惠.传感器网络中基于深度强化学习的路由优化算法[J].电子制作,2024,32(10):53-56.
6李子康,张璠,滕桂法,李政,王梓怡,马世纪.基于深度强化学习的收割机省内协同调度优化策略[J].农业工程学报,2024,40(14):23-32.
7沈跃,张凌飞,沈亚运,储金城,刘慧.基于相邻争夺算法的无人机多架次植保作业路径规划[J].农业工程学报,2024,40(16):44-51. 被引量：1
8赵锴,沙杰,丛尤嘉.基于Q‒learning的变电站无线传感器网络路由算法[J].太赫兹科学与电子信息学报,2024,22(9):952-958.

1Samuel Ndichu,Sangwook Kim,Seiichi Ozawa.Deobfuscation,unpacking,and decoding of obfuscated malicious JavaScript for machine learning models detection performance improvement[J].CAAI Transactions on Intelligence Technology,2020,5(3):184-192. 被引量：1
2孙辑凯,张梅娟,张宏莲,李宏铃,董巍.UPLC-Q-Trip-MS/MS法测定赤芍中4种成分的含量[J].化学试剂,2021,43(2):216-219. 被引量：4
3井照敬,张玉.NA序列随机和的几乎处处中心极限定理[J].吉首大学学报（自然科学版）,2020,41(5):9-13.
4郭虎锋,张五悦,刘霄,兰岚.锡盟-泰州特高压直流输电工程受端串联阀组中点分压器电压采集异常解决策略[J].电气技术,2020,21(6):73-77. 被引量：7
5崔月婷,柴培钰,胡欣,时小莹,李婷,张迪.安徽省医疗大数据知晓、应用情况及影响因素分析[J].现代医药卫生,2021,37(8):1416-1420. 被引量：1
6张居力.基于三维GIS的铁路固定设施维修管理系统数据接口研究与设计[J].中小企业管理与科技,2021(11):172-173.
7马生昀,王璇,张军.带有非期望输出的广义随机DEA方法[J].内蒙古农业大学学报（自然科学版）,2021,42(2):108-115.
8刘亚丽,徐贞权,李泽协,周明月,魏韶锋,王萌,张凌,管咏梅,李翔,张靖,苏丹.有机阴离子转运多肽对白头翁五环三萜皂苷在大鼠肠道吸收的影响[J].医药导报,2021,40(5):606-611. 被引量：1
9蒋家璐,孙溧,倪姐,徐坠成,宋蒙蒙,姚卫峰,程海波,康安,孙东东.肠道菌群对半枝莲中活性成分的代谢及其抑制CYP1A1酶的影响[J].南京中医药大学学报,2021,37(2):225-230. 被引量：4

计算机工程

2021年第4期

浏览历史

内容加载中请稍等...

基于Q学习的无人机辅助WSN数据采集轨迹规划被引量：4

参考文献8

二级参考文献61

共引文献235

同被引文献33

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Q学习的无人机辅助WSN数据采集轨迹规划 被引量：4

参考文献8

二级参考文献61

共引文献235

同被引文献33

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Q学习的无人机辅助WSN数据采集轨迹规划被引量：4