无线网络中基于深度Q学习的传输调度方案被引量：6

Transmission scheduling scheme based on deep Q learning in wireless network

下载PDF

导出

摘要针对无线网络中的数据传输问题,提出一种基于深度Q学习(QL,Q learning)的传输调度方案。该方案通过建立马尔可夫决策过程(MDP,Markov decision process)系统模型来描述系统的状态转移情况;使用Q学习算法在系统状态转移概率未知的情况下学习和探索系统的状态转移信息,以获取调度节点的近似最优策略。另外,当系统状态的规模较大时,采用深度学习(DL,deep learning)的方法来建立状态和行为之间的映射关系,以避免策略求解中产生的较大计算量和存储空间。仿真结果表明,该方法在功耗、吞吐量、分组丢失率方面的性能逼近基于策略迭代的最优策略,且算法复杂度较低,解决了维灾问题。 To cope with the problem of data transmission in wireless networks,a deep Q learning based transmission scheduling scheme was proposed.The Markov decision process system model was formulated to describe the state transition of the system.The Q learning algorithm was adopted to learn and explore the system states transition information in the case of unknown system states transition probability to obtain the approximate optimal strategy of the schedule node.In addition,when the system state scale was big,the deep learning method was employed to map the relation between state and behavior to solve the problem of the large amount of computation and storage space in Q learning process.The simulation results show that the proposed scheme can approach the optimal strategy based on strategy iteration in terms of power consumption,throughput,packets loss rate.And the proposed scheme has a lower complexity,which can solve the problem of the curse of dimensionality.

作者朱江王婷婷宋永辉刘亚利 ZHU Jiang;WANG Tingting;SONG Yonghui;LIU Yali(Key Laboratory of Information and Communication Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065)

机构地区重庆邮电大学移动通信技术重点实验室

出处《通信学报》 EI CSCD 北大核心 2018年第4期35-44,共10页 Journal on Communications

基金国家自然科学基金资助项目(No.61102062 No.61271260 No.61301122) 重庆市基础与前沿研究计划基金资助项目(No.cstc2015jcyj A40050)~~

关键词无线网络传输马尔可夫决策过程 Q学习深度学习 wireless network transmission Markov decision process Q learning deep learning

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1朱江,徐斌阳,李少谦.一种基于马尔可夫决策过程的认知无线电网络传输调度方案[J].电子与信息学报,2009,31(8):2019-2023. 被引量：5
2林晓辉,谭宇,张俊玲,杨超,刘静.无线传输中基于马尔可夫决策的高能效策略[J].系统工程与电子技术,2014,36(7):1433-1438. 被引量：1

二级参考文献22

1Hossain E and Bhargava V.Cognitive Wireless Communication Networks[M].First Edition,New York:Springer,2007:1-301.
2Djonin D V,et al..Joint rate and power adaptation for type-I hybrid ARQ systems over correlated fading channels under different buffer cost constraints[J].IEEE Transactions.on Wireless Communications,2008,57(1):421-435.
3Bolch G,et al..Queueing Networks and Markov Chains:Modeling and Performance Evaluation with Computer Science Applications[M].Second Edition,New York:John Wiley & Sons,2006:185-206.
4Chung Seong Taek and Goldsmith A.Degrees of freedom in adaptive modulation:A unified view[J].IEEE Transactions.on Communications,2001,49(9):1561-1571.
5Chang H S,et al..Simulation-based Algorithms for Markov Decision Processes[M].First Edition,London:Springer-Verlag,2007:9-167.
6Beutle F J and Ross K W.Optimal policies for controlled markov chains with a constraint[J].Journal of Mathematical Analysis and Application,1985,112(1):236-252.
7Hossain M J,et al..Delay limited optimal and suboptimal power and bit loading algorithms for OFDM systems over correlated fading[C].IEEE GLOBECOM,St.Louis,USA,Dec.1-2,2005:3448-3453.
8Pandana C and Liu K J R.Near-optimal reinforcement learning framework for energy-aware sensor communications[J].IEEE Transactions.on Wireless Communications,2005,23(4):788-797.
9Uysal B E, Prabhakar B, Gamal A E. Energy-efficient packet transmission over a wirdess link. IEEE/ACM Trans. on Netzvorking, 2002, 10(4) : 487 - 499.
10Shurgers C, Aberthorne O, Srivastava M B. Modulation scaling for energy aware communication systems:C://Proc, of the In- ternational symposium on Low Power Electronics and Design, 2001:96 - 99.

共引文献4

1杨健,王永华,蔡庆玲,詹宜巨,万频.EHiQ:一种基于增强型HiQ的RFID读写器MAC协议[J].计算机科学,2011,38(7):85-87. 被引量：3
2罗丽平,秦家银.认知无线电研究进展及应用前景[J].科技导报,2012,30(3):74-79. 被引量：5
3张明杰,朱江.WSN中基于强化学习的能效优化任务处理机制[J].信号处理,2022,38(3):609-618.
4卢明松.传输网络的节点分配与传输调度方案[J].通信电源技术,2023,40(4):228-231.

同被引文献54

1韦再雪,张涛,杨大成.一种无线网络规划中的双斜率传播模型校正算法[J].电子与信息学报,2007,29(10):2414-2417. 被引量：9
2刘宴兵,杨茜惠,孙世新.IEEE 802.11宽带无线局域网负载均衡优化研究[J].计算机应用研究,2008,25(7):2135-2137. 被引量：1
3田彩霞,吴克军.采用方向性天线的Ad Hoc网络邻居发现策略研究[J].测控技术,2008,27(12):3-6. 被引量：3
4李本亮,王厚军,师奕兵,李力,闫斌.IEEE 802.11的DCF机制媒介接入延时分析与仿真[J].计算机应用研究,2009,26(6):2202-2204. 被引量：2
5姚程,俞能海,王松.SCWGF：802.11 DCF竞争窗口增长因子自适应调整算法[J].电子学报,2009,37(10):2134-2138. 被引量：2
6陈辉林,夏道勋.基于CART决策树数据挖掘算法的应用研究[J].煤炭技术,2011,30(10):164-166. 被引量：37
7孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：631
8王莹,王中武,莫娴.定向Ad Hoc网络中邻居发现与跟踪技术研究[J].通信技术,2013,46(2):82-85. 被引量：6
9罗庆云,陈敏,赵巾帼.基于均衡算法的协作信道分配策略[J].计算机科学,2013,40(4):96-101. 被引量：2
10边明明,王世涛,雷利华,麻丽香.太赫兹技术及空间应用国内外发展现状研究[J].空间电子技术,2013,10(4):80-84. 被引量：7

引证文献6

1邓瑞.虚拟现实视频无线传输研究现状及发展动态分析[J].移动通信,2019,43(3):54-63. 被引量：1
2段宝峰,李翠然,周冬梅,吴卫.基于二维差异化调度的高铁场景网络负荷降低方法[J].兰州交通大学学报,2019,38(6):29-35.
3谢莎,李浩然,李玲香,陈智,李少谦.太赫兹通信技术综述[J].通信学报,2020,41(5):168-186. 被引量：46
4朱家鹏,段宇帅.基于XGBoost的无线传播预测模型[J].软件导刊,2020,19(8):35-39.
5缪巍巍,曾锃,张明轩,张厦千,张伯雷,钱柱中.基于多智能体强化学习的边缘物联代理资源分配算法[J].电力信息与通信技术,2021,19(12):9-15. 被引量：2
6詹御,张郭健,彭麟杰,文军.基于DRL的MEC卸载网络竞争窗口优化[J].计算机技术与发展,2022,32(6):99-105.

二级引证文献49

1翟荣锭,吴倩楠,王俊强,苏宁宁,李孟委.太赫兹石墨烯贴片式高温传感器的设计与研究[J].电子测量技术,2023,46(3):6-11.
2马秦龙,陈纯海,林敏,陶嘉雯,邓平,高鹏,卢永辉,皮会丰,何旻蒂,张蕾,张彦文,余争平.0.22太赫兹电磁辐射暴露致神经母细胞瘤Neuro-2a细胞损伤的非热效应研究[J].第三军医大学学报,2020,42(23):2267-2273. 被引量：8
3Sha Xie,Haoran Li,Lingxiang Li,Zhi Chen,Shaoqian Li.Reliable and Energy-Aware Job Offloading at Terahertz Frequencies for Mobile Edge Computing[J].China Communications,2020,17(12):17-36. 被引量：2
4刘松卓,于伟华,邓长江,李尧,吕昕.面向通信系统的太赫兹调制技术进展现状[J].无线电通信技术,2021,47(1):44-50. 被引量：7
5Shanyun Liu,Xianbin Yu,Rongbin Guo,Yajie Tang,Zhifeng Zhao.THz Channel Modeling: Consolidating the Road to THz Communications[J].China Communications,2021,18(5):33-49. 被引量：3
6田泽中,朱艳,王浩洋.双色光激发液体介质辐射太赫兹波的仿真研究[J].通信技术,2021,54(6):1307-1313.
7刘欣缘,曾昊旻,田昕,李松.太赫兹辐射在皮肤中的传输仿真与安全性分析[J].光学精密工程,2021,29(5):999-1007. 被引量：8
8任智,苏新,郭黎,吴本源.低干扰多PAN太赫兹无线个域网MAC协议[J].光通信研究,2021(4):66-71. 被引量：2
9李维轩,朱晓松,石艺尉.介质/金属波导在G波段的损耗和色散特性[J].光学学报,2021,41(18):42-49. 被引量：1
10刘颖出,李宁.基于OPNET开发平台的太赫兹MAC协议仿真模型设计[J].无线电通信技术,2021,47(6):765-771. 被引量：2

1殷林飞,余涛.基于深度Q学习的强鲁棒性智能发电控制器设计[J].电力自动化设备,2018,38(5):12-19. 被引量：14
2杨健,王建,赵昌盛.TD-LTE系统VoLTE语音质量影响因素及提升措施分析[J].电信工程技术与标准化,2018,31(5):35-39.
3胡艳丽,徐梅玉,梁丽萍.心理疏导和精神护理在老年抑郁症患者中的应用[J].中国乡村医药,2017,24(4):72-73. 被引量：8
4卢光增.老年病患者的生活质量[J].老年学杂志,1990,10(1):56-58. 被引量：3
5汪立波.高中化学酸碱盐知识点学习中的常见误区及避免策略[J].教育观察,2018,7(2):126-127. 被引量：1
6苏长青,周堤基,徐荣生.超快速数码缓冲存贮器自动调度方案[J].计算机工程与科学,1980,10(1):233-248.
7Feng Li,Lijing Xie,Guohua Sun,Fangyuan Su,Qingqiang Kong,Yufang Cao,Xiangyun Guo,Chengmeng Chen.Structural evolution of carbon aerogel microspheres by thermal treatment for high–power supercapacitors[J].Journal of Energy Chemistry,2018,27(2):439-446. 被引量：1
8季挺,张华.基于状态聚类的非参数化近似广义策略迭代增强学习算法[J].控制与决策,2017,32(12):2153-2161. 被引量：1
9QLY-8A型轮胎起重机改进说明[J].工程机械,1981,14(8):50-50.
10牛允鹏,宿华.汽车运输企业的计算机管理[J].安徽工学院学报,1983,0(2):9-16.

通信学报

2018年第4期

浏览历史

内容加载中请稍等...

无线网络中基于深度Q学习的传输调度方案被引量：6

参考文献2

二级参考文献22

共引文献4

同被引文献54

引证文献6

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

无线网络中基于深度Q学习的传输调度方案 被引量：6

参考文献2

二级参考文献22

共引文献4

同被引文献54

引证文献6

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

无线网络中基于深度Q学习的传输调度方案被引量：6