一种基于深度强化学习的TCP网络拥塞控制协议被引量：1

A TCP NETWORK CONGESTION CONTROL PROTOCOL BASED ON DEEP REINFORCEMENT LEARNING

下载PDF

导出

摘要在面对网络变化时,传统的TCP拥塞控制协议因其固有的规则机制只能做出固定的动作,既未充分利用链路带宽,也未从历史经验中学习,并且在发生拥塞时带宽恢复所用时间较长。近年来基于强化学习的拥塞控制协议(Reinforcement Learning Congestion Control,RL-CC)虽然可以有效地从历史经验中学习,但是它没有考虑历史经验在时序上存在的因果关系。对这种因果关系进行隐式提取,提出一种基于时序卷积网络和强化学习的拥塞窗口自适应智能化拥塞控制协议(Temporal convolutional network and Reinforcement Learning Congestion Control,TRL-CC)。TRL-CC通过NS-3仿真不同带宽的网络环境。大量的仿真实验表明,与NewReno和RL-CC做对比,TRL-CC在吞吐量方面提升32.8%和8.5%,时延降低41.3%和12%。 When the network changes,the protocol of traditional TCP congestion control can only make fixed actions due to its inherent rule mechanism,neither fully utilizes the link bandwidth,nor learns from historical experience,and when congestion occurs,it takes a long time to restore bandwidth.The congestion control protocol based on reinforcement learning(RL-CC)can effectively learn from historical experience,but it does not consider the causality of historical experience of time series.By implicitly extracting this causal relationship,a congestion window adaptive intelligent congestion control protocol based on temporal convolutional network and reinforcement learning(TRL-CC)is proposed.TRL-CC simulated network environments with different bandwidths through NS-3.A large number of simulation experiments show that compared with NewReno and RL-CC,TRL-CC has a 32.8%and 8.5%increase in throughput,and a delay reduction of 41.3%and 12%.

作者卢光全李建波吕志强 Lu Guangquan;Li Jianbo;LüZhiqiang(College of Computer Science&Technology,Qingdao University,Qingdao 266071,Shandong,China)

机构地区青岛大学计算机科学技术学院

出处《计算机应用与软件》北大核心 2023年第3期179-187,共9页 Computer Applications and Software

基金国家重点研发计划重点专项项目(2018YFB2100303) 山东省高等学校青创科技计划创新团队项目(2020KJN011) 山东省博士后创新人才支持计划项目(40618030001) 国家自然科学基金项目(61802216) 中国博士后基金项目(2018M642613)。

关键词 TCP AIMD 拥塞控制强化学习时序卷积网络 TCP AIMD Congestion control Reinforcement learning Temporal convolutional network

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1罗颖,林茂松,江虹.无线网络中基于强化学习的拥塞控制算法改进[J].自动化仪表,2014,35(6):65-68. 被引量：1

二级参考文献11

1Ghassan A A,Mahamod I,Kasmiran J. Exploration and evaluation oftraditional TCP congestion control techniques [ J ]. Computer andInformation Sciences,2012,24(2) :145-155.
2Badarla V,Murthy C S R. Leaming-TCP: A stochastic approach forefficient update in TCP congestion window in Ad Hoc wirelessnetworks[ J] . Journal of Parallel and Distributied Computing,2011,71(6) :863-878.
3Hiroki N,Nirwan A,Nei K. Wireless loss-tolerant congestion controlprotocol based on dynamic AIMD theory [ J ]. IEEE WirelessCommunications,2010,17(2) :7-14.
4Kento T, Junichi M. A study on use of prior information foracceleration of reinforcement learning [ C ] // SICE AnnualConference ,2011:537-543.
5Nicholas M,Mihaela V S. Reinforcement learning for energy-efficientwireless communications [ C ] // IEEE Transactions on SignalProcessing, 2011 : 6262-6266.
6NS2. The network simulator ns-2 [ EB/OL ]. [ 2010 - 10 - 25 ].http://www. isi. edu/nsnam/ns.
7Marek G,Daniel K. Online learning of shaping rewards in reinforcementleaming[ J]. Neural Networks,2010,23 :541-550.
8Maryam S. Knowledge ofopposite actions for reinforcement leaming[ J].Applied Soft Computing ,2011(11) :4097-4109.
9Nadim P, Anirban M, Carey W. An analytic throughput model forTCP NewReno[ J]. IEEE/ACM Transmission on Networking,2010,18(2) :448-461.
10宋军,李浩,李嫄源,李霖.Ad Hoc中的TCP改进方案——Adaptive ADTCP[J].计算机应用,2010,30(7):1750-1753. 被引量：8

同被引文献5

1史磊,姜有奇,娄勇.带宽受限下的复合材料缺陷检测及传输网络拥塞问题研究[J].粘接,2021(5):54-57. 被引量：2
2傅学磊,左敬龙.基于AODV协议的无线Ad-hoc网络拥塞控制技术研究[J].信息技术,2022,46(7):81-86. 被引量：2
3李莉莉,周建二,李清,段经璞,王志强.蜂窝移动网络拥塞控制机制研究综述[J].高技术通讯,2022,32(10):1036-1048. 被引量：1
4刘鹏辉,琚贇,高维星,张彦彦.基于强化学习的网络拥塞控制优化算法[J].电力科学与工程,2023,39(4):20-27. 被引量：2
5王公晗,姜胜兰.基于局部离群点检测算法的电力通信网络拥塞安全控制方法[J].计算技术与自动化,2023,42(2):75-80. 被引量：1

引证文献1

1钟坚.基于模糊神经网络的通信网络拥塞控制方法研究[J].信息记录材料,2024,25(1):32-34.

1袁学松.基于改良UWB室内定位的隐私保护算法[J].长春师范大学学报,2022,41(12):27-34.
2陈进,傅晟捷,关卓怀,朱富豪,朱林军,夏慧,邢立成.基于LoRa技术的联合收获机群通信方法[J].农业工程学报,2022,38(16):81-89. 被引量：2
3牛娇红,方琰崴,章璐.5G-A空天地融合核心网方案及关键技术[J].移动通信,2022,46(10):12-19. 被引量：2
4Lei Zhang,Kewei Zhu,Yong Cui,Yong Jiang.QoS-Aware Congestion Control with Online Learning[J].China Communications,2023,20(2):168-178.
5刘玉军.突变工况下采煤机的智能化自适应降载控制策略研究[J].机械管理开发,2022,37(4):158-160.
6戴越刚.动脉粥样硬化患者血清载脂蛋白C3检测的临床意义[J].中文科技期刊数据库（全文版）医药卫生,2021(4):277-277.
7贝歌,张义红,叶晓娴,彩虹,海荣,李帅,阿门德.Intelligent Greedy Perimeter Stateless Routing Scheme for Unmanned Aerial Vehicles[J].Journal of Donghua University(English Edition),2022,39(6):603-613.
8胡海岩,康巧燕,赵朔,王建峰,付有斌.基于节点综合重要度排序的服务功能链部署优化方法[J].计算机应用,2023,43(3):860-868.
9王平,张科.电厂凝泵并列运行时管道易泄漏的改造优化[J].今日制造与升级,2023(1):119-121.
10赵鑫,赵光,陈睿,王文鼐.低轨卫星网络的航点分段路由及业务性能分析[J].电信科学,2023,39(2):48-58.

计算机应用与软件

2023年第3期

浏览历史

内容加载中请稍等...

一种基于深度强化学习的TCP网络拥塞控制协议被引量：1

参考文献1

二级参考文献11

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的TCP网络拥塞控制协议 被引量：1

参考文献1

二级参考文献11

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的TCP网络拥塞控制协议被引量：1