基于SARSA算法的水声通信自适应调制被引量：4

Adaptive Modulation of Underwater Acoustic Communication Based on SARSA Algorithm

下载PDF

导出

摘要水声信道复杂多变,自适应调制系统中反馈信息存在较大的时延,实际信道状态与接收到的反馈信息无法匹配,带来反馈信道状态信息过时问题,发送端不能准确做出自适应决策进而导致传输误码高及吞吐量低等问题。针对该问题,利用强化学习中的SARSA算法学习信道的变化并进行行为策略的选择,根据信道的变化,择优选出最佳的调制方式,以改善系统的传输误码和通信吞吐量。对比固定调制方式和直接反馈情况下的系统的误码率和吞吐量,结果表明,经强化学习后的系统误码率和吞吐量均优于其他两种方式,可见,强化学习算法在时变水声信道自适应调制中改善传输误码和吞吐量的问题上是有效可行的。 The underwater acoustic channel is complex and variable.The feedback information in the adaptive modulation system has a large delay.The actual channel state cannot be matched with the received feedback information,which leads to the feedback channel state information outdated.The transmitter cannot accurately make adaptive decisions,leading to high transmission errors and low throughput.Aiming at this problem,the SARSA algorithm in reinforcement learning was used to learn the channel variation and selected the behavior strategy.According to the channel variation,the optimal modulation mode was selected to improve the transmission error and communication throughput of the system.The results show that the bit error rate and throughput of the system after reinforcement learning is better than the other two methods in comparison to the bit error rate and throughput of the system under fixed modulation and direct feedback.It can be seen that the reinforcement learning algorithm is effective and feasible in improving the performance of transmission error and throughput in adaptive modulation of time-varying underwater acoustic channels.

作者王安义李萍张育芝 WANG An-yi;LI Ping;ZHANG Yu-zhi(School of Communication and Information Engineering, Xi’an University of Science and Technology, Xi’an 710054, China)

机构地区西安科技大学通信与信息工程学院

出处《科学技术与工程》北大核心 2020年第16期6505-6509,共5页 Science Technology and Engineering

基金国家自然科学基金(61801372) 陕西省教育厅科研计划(18JK0499) 西安科技大学培育基金(201747)。

关键词水声通信自适应调制强化学习 SARSA算法 underwater acoustic communication adaptive modulation reinforcement learning SARSA algorithm

分类号 TN929.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1李文武,张雪映,Daniel Eliote Mbanze,吴巍.基于SARSA算法的水库长期随机优化调度研究[J].水电能源科学,2018,36(9):72-75. 被引量：12
2颛孙少帅,杨俊安,刘辉,黄科举.采用双层强化学习的干扰决策算法[J].西安交通大学学报,2018,52(2):63-69. 被引量：12
3王安义,余龙,张育芝.基于马尔科夫状态空间的水声正交频分复用技术资源分配[J].科学技术与工程,2018,18(32):195-199. 被引量：3
4徐少毅,郑姗姗.M2M通信中基于多智能体强化学习的无线资源分配算法[J].北京交通大学学报,2018,42(5):1-9. 被引量：3
5高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：268
6罗亚松,胡生亮,刘志坤,吕显春.正交频分复用水声通信自适应调制算法[J].国防科技大学学报,2017,39(1):153-158. 被引量：32
7陈学松,杨宜民.强化学习研究综述[J].计算机应用研究,2010,27(8):2834-2838. 被引量：61

二级参考文献79

1杨洋,陈小平.动态不确定环境下的决策:一种分层决策模型[J].计算机科学,2005,32(1):151-154. 被引量：1
2苏畅,高阳,陈世福,陈兆乾.基于SMDP环境的自主生成options算法的研究[J].模式识别与人工智能,2005,18(6):679-684. 被引量：9
3秦志斌,钱徽,朱淼良.自主移动机器人混合式体系结构的一种Multi-agent实现方法[J].机器人,2006,28(5):478-482. 被引量：8
4原魁,李园,房立新.多移动机器人系统研究发展近况[J].自动化学报,2007,33(8):785-794. 被引量：73
5AL-BATAH M S,MATISA N A,ZAMLI K Z,et al.Modified recursive least squares algorithm to train the hybrid multilayered perceptron (HMLP) network[J].Applied Soft Computing,2010,10(1):236-244.
6BOWLING M.Multi agent learning in the presence of agents with limi-tations[R].Pittsburgh:Carnegie Mellon University,2003.
7KYUN Y,OH S-Y.Hybrid control for autonomous mobile robotnavigation using neural network based behavior modules and environment classification[J].Autonomous Robots,2003,15(2):193-206.
8ARAI S,SYCARA K.Multi-agent reinforcement learning for planning and conflict resolution in a dynamic domain[C] //Proc of the 4th International Conference on Autonomous agents.2000:104-105.
9VRANCY P,VERBEEK K,NOWE A.Decetralized learning in Markov games[J].IEEE Trans on Systems,Man and Cyberne-tics Part B:Cybernetics,2008,38(4):976-981.
10LUCIAN B,ROBERT B,BART D S.A comprehension survey of multiagent reinforcement learning[J].IEEE Trans on Systems,Man and Cybernetics Part C:Applications and Reviews,2008,68(2):156-172.

共引文献373

1李小强,杨凯,代龙飞,夏炜豪,蔡正鑫.冷轧连退机组中央段自动控制系统开发[J].冶金自动化,2023,47(S01):121-124.
2项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
3支悦,艾学山,董祚,陈森林.水库发电优化调度模型的快速求解算法及应用[J].水力发电学报,2020(6):49-61. 被引量：17
4张雨.基于马尔科夫过程状态转移矩阵的桥梁结构技术状态预测方法研究[J].四川水泥,2023(3):212-214. 被引量：1
5安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：8
6丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：7
7王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
8林涛,郭建松.自导飞行器控制指令传输均衡技术优化设计[J].智能计算机与应用,2020,10(7):166-169.
9郭建松,林涛.基于高速DSP的水下声探测系统设计[J].智能计算机与应用,2020(7):109-112. 被引量：1
10马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1

同被引文献21

1帅路军,王旭东,宫宇,高春禹.不同Nakagami-m信道仿真方法的性能[J].大连海事大学学报,2006,32(3):89-92. 被引量：2
2陈若山,王艳芬.UWB定位算法在煤矿井下的应用研究[J].工矿自动化,2008,34(6):5-8. 被引量：2
3范新越,杨维.井下多媒体无线传感器网络自适应调制研究[J].煤炭学报,2009,34(9):1291-1296. 被引量：5
4王娟,付家才.煤矿井下OFDM自适应调制技术[J].黑龙江科技学院学报,2010,20(2):135-137. 被引量：1
5陈学松,杨宜民.强化学习研究综述[J].计算机应用研究,2010,27(8):2834-2838. 被引量：61
6李轩,王磊,孙长瑜.基于正交频分复用的水声自适应通信系统性能仿真研究[J].应用声学,2011,30(1):1-12. 被引量：2
7周跃海,李芳兰,陈楷,童峰.低信噪比条件下时间反转扩频水声通信研究[J].电子与信息学报,2012,34(7):1685-1689. 被引量：13
8余涛,张水平.在策略SARSA算法在互联电网CPS最优控制中的应用[J].电力系统保护与控制,2013,41(1):211-216. 被引量：15
9李宁.自适应OFDM算法在矿井无线通信中的应用研究[J].煤矿机电,2015,36(4):12-16. 被引量：2
10曹秀岭,陈东升,童峰.浅海信道下的时间反转MFSK水声通信[J].南京大学学报（自然科学版）,2015,51(6):1189-1194. 被引量：3

引证文献4

1朱静茹,张育芝,王安义,李萍.基于Q-学习算法的矿井自适应OFDM调制研究[J].工矿自动化,2021,47(6):109-115. 被引量：1
2邱逸凡,李爽,童峰.一种浅海信道自适应调制水声通信方案[J].舰船科学技术,2021,43(10):158-162. 被引量：3
3邱逸凡,张小康,陈东升,童峰.一种适用于非稳态浅海信道的强化学习自适应调制方案[J].厦门大学学报（自然科学版）,2022,61(6):1072-1081.
4陈一波,赵知劲.基于SARSA学习的跳频系统智能抗干扰决策算法[J].现代电子技术,2023,46(1):31-35.

二级引证文献4

1续丹,余雷,胡桥,冯兴龙,陆涛.水下机器人集群通信系统设计及实验分析[J].西安交通大学学报,2022,56(6):40-49. 被引量：4
2栗雅清.OFDM系统中自适应调制与编码技术分析[J].通信电源技术,2022,39(3):121-123. 被引量：1
3邱逸凡,张小康,陈东升,童峰.一种适用于非稳态浅海信道的强化学习自适应调制方案[J].厦门大学学报（自然科学版）,2022,61(6):1072-1081.
4杨健敏,王佳惠,乔钢,刘凇佐,马璐,何鹏.水声通信及网络技术综述[J].电子与信息学报,2024,46(1):1-21. 被引量：5

1晋帅,李煊鹏,何嘉颖,李纾昶,周敬淞.基于强化学习的两轮模型车控制仿真分析[J].测控技术,2019,38(12):115-121. 被引量：3
2汪浩,王峰.强化学习算法在雷达智能抗干扰中的应用[J].现代雷达,2020,42(3):40-44. 被引量：12
3赵敏,王慧卿,张超,李洋,张建亮,高枫,任学武.基于自编码的电力信息通信资产数据清洗算法[J].山东农业大学学报（自然科学版）,2019,50(6):1093-1096. 被引量：2
4杨瑾,陈琳,许玲,卢有雄,黄双红.基于移动通信系统的车联网通信资源管理[J].移动通信,2019,43(11):81-87.
5王晓晖,陈纲.火箭地面测控系统的电磁兼容性设计[J].计算机测量与控制,2019,27(11):20-24. 被引量：1
6胡丽青,赵静媛.高中英文名著阅读与英语学科核心素养[J].山东教育,2020,0(19):34-35. 被引量：2
7赵源筱,耿光超,江全元,刘文龙,陈义宣,李玲芳.考虑功率变化速率的储能辅助单机调频控制策略[J].电力自动化设备,2020,40(1):141-147. 被引量：11
8李毅敏,王培红,张吟.某院2018年上半年重点科室抗菌药物使用合理性分析[J].海峡药学,2020,32(5):184-186. 被引量：1
9杜高艺.我国猕猴桃黑斑病研究进展[J].数码设计,2019,8(22):107-107.
10白志峰,于艳梅.高考圆锥曲线解题教学关键——坐标法[J].教学考试,2020,0(20):56-58.

科学技术与工程

2020年第16期

浏览历史

内容加载中请稍等...

基于SARSA算法的水声通信自适应调制被引量：4

参考文献7

二级参考文献79

共引文献373

同被引文献21

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于SARSA算法的水声通信自适应调制 被引量：4

参考文献7

二级参考文献79

共引文献373

同被引文献21

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于SARSA算法的水声通信自适应调制被引量：4