基于强化学习的异构无线网络资源管理算法被引量：5

Heterogeneous Wireless Network Resource Management Algorithm Based on Reinforcement Learning

下载PDF

导出

摘要为了充分利用各种无线网络的资源,需要实现异构网络的融合,而异构网络的融合又面临接入控制与资源分配的问题。为此,提出一种基于强化学习的异构无线网络资源管理算法,该算法引入D2D(device-to-device)通信模式,并可以根据终端不同的业务类型、终端移动性及网络负载条件等状态,选择合适的网络接入方式。同时,为降低存储需求,采用神经网络技术解决连续状态空间问题。仿真结果表明,该算法具有高效的在线学习能力,能够有效地提升网络的频谱效用,降低阻塞率,从而实现自主的无线资源管理。 In order to make full use of the resources of all kinds of wireless network, the integration of heterogeneous network is necessary. However, when it comes to the heterogeneous network integration, the problems of call request access control and resource management emerge. A reinforcement-learning-based algorithm was presented for heterogeneous wireless network resource management. D2D （device-to-device） communication was introduced into the proposed algorithm and the appropriate network for access could be selected according to different traffic types, terminal mobility, network load status and so on. Meanwhile, to reduce the storage requirement, the neural network technology was used to solve the problem of continuous state space. Simulation results show that the proposed algorithm has an efficient learning ability to achieve autonomous radio resource management, which effectively improves the spectrum utility and reduces the blocking probability.

作者冯陈伟袁江南

机构地区厦门理工学院光电与通信工程学院

出处《电信科学》北大核心 2015年第8期99-106,共8页 Telecommunications Science

基金福建省中青年教师教育科研项目A类资助项目(No.JA14233) 国家自然科学基金青年科学基金资助项目(No.61202013) 福建省自然科学基金资助项目(No.2015J01670)~~

关键词异构无线网络接入控制资源管理强化学习 Q学习 heterogeneous wireless network, access control, resource management, reinforcement learning, Q-learning

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献21

1Luo J, Mukerjee R, Dillinger M, et al. Investigation of radio resource scheduling in WLANs coupled with 3G cellular network. IEEE Communications Magazine, 2003, 41(6): 108-115.
23GPP TR 25.881 v5.0.0. Improvement of RRM across RNS and RNS/BSS (Release5). http://www.3gpp.org, 2001.
3Song Q, Jamalipour A. Network selection in an integrated wireless LAN and UMTS environment using mathematical modeling and computing techniques~ IEEE Wireless Communications, 2005, 12(3): 42~48.
4Zhang Y, Chela J, Zhang P. Autonomic joint radio resource management in B3G environment using reinforcement learning. Proceedings of the 6th Annual Wireless Telecommunications Symposium (WTS 2007), Pomona, California, USA, 2007.
5Barto A G. Reinforcement Learning: an Introduction. Cambridge: MIT Press, 1998.
6Kaelbling L P, Littman M L, Moore A W. Reinforcement learning: a survey. Journal of Artificial Intelligence Research, 1996 (4): 237-285.
7Nie J, Haykin S. A Q-learning-based dynamic channel assignment technique for mobile eommunieation systems. IEEE Transactions on Vehicular Technology, 1999, 48(5): 1676~1687.
8Senouci S M, Beylot A L, Pujolle G. Call admission control in eellular networks: a reinforcement learning solution. International Journal of Network Management, 2004, 14(2): 89~103.
9Haddad M, Altman Z, Elayoubi S E, et a/. A nash-stackelberg fuzzy Q-learning decision approach in heterogeneous cognitive networks. Proceedings of Global Telecommunications Conference (GLOBECOM 2010), Miami, Florida, USA, 2010:1~6.
10Simsek M, Czylwik A. Decentralized Q-learning of LTE-femtoeells for interference reduction in heterogeneous networks using cooperation. Proceedings of 2012 International ITG Workshop on Smart Antennas (WSA), Dresden, Germany, 2012:86~91.

二级参考文献10

1Song Q and Jamalipour A. Network selection in an integrated wireless LAN and UMTS environment using mathematical modeling and computing techniques[J]. IEEE Wireless Commun., 2005, 12(3): 42-48.
23GPP TR 25.881 v5.0.0. Improvement of RRM across RNS and RNS/BSS (Release 5) [OL]. http://www.3gpp.org, Dec. 2001.
3IST-2003-507995 Project E2R (End-to-End Reconfigurability) [OL]. http://e2r.motlabs.com, Jan. 2004.
4Agusti R, Salient O, and Perez-Romero J, et al.. A fuzzyneural based approach for joint radio resource management in a beyond 3G framework[C]. First Int. Conf. on Quality of Service in Heterogeneous Wired/Wireless Networks, Barcelona, Mar. 2004: 216-224.
5Luo J, Mohyeldin E, and Dillinger M, et al.. Performance analysis of joint radio resource management for reconfigurable terminals with multi-class circuit-switched services[C]. Wireless World Research Forum 12th Meeting, Toronto, Nov. 2004: 138-150.
6Zhang Y, Zhang K, and Ji Y, et al.. Adaptive threshold joint load control in an end-to-end reconfigurable systemiC]. IST Mobile and Wireless Summit 2006, Mykonos, Jun. 2006: 332-337.
7Kaelbling L P, Littman M L, and Wang X, et al..Reinforcement learning: a survey[J]. Journal of Artificial Intelligence Research, 1996, 4(2): 237-285.
8Nie J and Haykin S. A Q-learning-based dynamic channel assignment technique for mobile communication systems[J]. IEEE Trans. on Vehicular Technology, 1999, 48(5): 1676- 1687.
9Watkins C J C H and Dayan P. Q-learning[J]. Machine Learning, 1992, 8(3): 279-292.
10Radunovic B, Le Boudec J Y. Rate performance objectives of multihop wireless networks[J]. IEEE Trans. on Mobile Computing, 2004, 3(4): 334-349.

共引文献8

1吴启晖,刘琼俐.基于DAQL算法的动态频谱接入方案[J].解放军理工大学学报（自然科学版）,2008,9(6):607-611. 被引量：3
2李默,徐友云,蔡跃明.基于Q-Learning的认知无线电系统感知管理算法[J].电子与信息学报,2010,32(3):623-628. 被引量：3
3吴爱军,李屹.异构无线网络中支持端到端重配置的资源管理技术[J].信息化研究,2010,36(8):5-7. 被引量：1
4赵彦清,朱琦.基于Q学习的异构网络选择新算法[J].计算机应用,2011,31(6):1461-1464. 被引量：4
5江虹,伍春,刘勇.基于强化学习的频谱决策与传输算法[J].系统仿真学报,2013,25(3):565-570. 被引量：1
6赵彪,李鸥,栾红志.Q学习算法在机会频谱接入信道选择中的应用[J].信号处理,2014,30(3):298-305. 被引量：4
7冯陈伟,张璘.一种基于Q学习的网络接入控制算法[J].计算机工程,2015,41(10):99-104. 被引量：5
8刘惠茹,马琳,徐玉滨.基于Q学习的CDMA/WLAN异构网络接入控制算法[J].通信技术,2016,49(8):1017-1022.

同被引文献17

1胡图,景志宏,张磊,张秋林.认知Ad hoc网络中基于凸优化的功率控制算法[J].空军工程大学学报（自然科学版）,2012,13(1):79-84. 被引量：1
2梁泉.未知环境中基于强化学习的移动机器人路径规划[J].机电工程,2012,29(4):477-481. 被引量：10
3范文浩,刘元安,吴帆.异构无线网络中多模终端多接入选择机制研究[J].通信学报,2012,33(7):183-190. 被引量：13
4赖海超,赵知劲,郑仕链.应用案例推理技术的快速认知引擎[J].信号处理,2012,28(12):1700-1705. 被引量：2
5张玲.OFDM系统中基于能量效率的低复杂度算法的研究与仿真[J].软件,2012,33(11):137-140. 被引量：1
6王军红,江虹,黄玉清,伍晓利.基于RPkNN-Sarsa(λ)强化学习的机器人路径规划方法[J].计算机应用研究,2013,30(1):199-201. 被引量：4
7盛洁,唐良瑞,郝建红.异构无线网络中基于业务转移和接入控制的混合负载均衡[J].电子学报,2013,41(2):321-328. 被引量：15
8伍春,江虹,易克初.聚类多Agent强化学习认知无线电资源分配[J].北京邮电大学学报,2014,37(1):80-84. 被引量：6
9刁鸣,张志强,高洪元.离散量子粒子群优化的认知无线电频谱分配[J].计算机工程,2015,41(11):126-130. 被引量：3
10康俊丽,郭坤祺,曹亚兰,王思璇.一种多Agent系统频谱接入算法[J].无线通信技术,2015,24(4):7-12. 被引量：1

引证文献5

1徐琳,赵知劲.基于CBR与合作Q学习的分布式CRN资源分配算法[J].电信科学,2019,35(2):35-42. 被引量：3
2徐琳,赵知劲.基于分布式协作Q学习的信道与功率分配算法[J].计算机工程,2019,45(6):160-164. 被引量：7
3徐琳,赵知劲.基于案例推理和启发式Q学习的资源分配算法[J].计算机应用研究,2019,36(12):3657-3660. 被引量：2
4周凡,王鸿,宋荣方.密集异构蜂窝网络中基于深度强化学习的下行链路功率分配算法[J].南京邮电大学学报（自然科学版）,2021,41(2):12-19. 被引量：8
5魏守明,何晨光,卢佳琦.移动警务智能资源适配引擎机制研究与探讨[J].移动通信,2021,45(5):119-123. 被引量：1

二级引证文献21

1夏重阳,张剑书,吴晓富,靳越.面向抗干扰跳频通信的混合改进DQN决策算法[J].电子测量技术,2023,46(20):50-57.
2邓瑞.虚拟现实视频无线传输研究现状及发展动态分析[J].移动通信,2019,43(3):54-63. 被引量：1
3彭大芹,孙向月,王付龙.Femto网络中基于自适应定价的功率控制算法[J].计算机工程,2019,45(9):100-104.
4王佳骏,林承勋,陈瑾,李文轩.基于强化学习的通信网络入侵自适应检测方法[J].信息技术,2019,43(11):24-27. 被引量：6
5王伟,殷爽爽.基于深度双Q网络的多用户蜂窝网络功率分配算法研究[J].计算机应用研究,2021,38(5):1498-1502. 被引量：1
6黄月胜,王泓为,郭海涛.基于SNS技术的分布式网络协作学习系统设计[J].现代电子技术,2021,44(12):91-95.
7MA Ye,CHANG Tianqing,FAN Wenhui.A single-task and multi-decision evolutionary game model based on multi-agent reinforcement learning[J].Journal of Systems Engineering and Electronics,2021,32(3):642-657. 被引量：3
8陈捷洁.基于ZIPF分布的多址通讯快速动态信道分配方法[J].黑龙江工业学院学报（综合版）,2021,21(6):76-81.
9严纪珊.多信道无线通信功率分配的最优化决策分析[J].微型电脑应用,2022,38(3):206-208. 被引量：1
10赵知劲,朱家晟,叶学义,尚俊娜.基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法[J].电子与信息学报,2022,44(8):2814-2823. 被引量：4

1赵明.一种联邦云系统中的资源分配算法[J].科技和产业,2015,15(1):134-138.
2李千目,周枫,许满武,张宏.网格计算任务的资源管理算法[J].计算机工程,2007,33(10):66-69.
3康浩.多模式下VPN互联[J].中国计算机用户,2004(18).
4十大爆笑车站接人方式[J].网友世界,2006(5):89-89.
5FBox—IMS工业设备互联网平台[J].现代制造,2016,0(9):54-54.
6卞荣生.家庭上网的几种主要方式[J].农村电气化,2004(12):50-50.
7钱锋,李文文.WLAN在高校校园网中的应用[J].安徽水利水电职业技术学院学报,2006,6(1):73-75. 被引量：8
8胡雯蔷,徐筱龙,徐国华.基于小脑模型关节控制器的水下机械手复合运动控制的研究及仿真[J].中国机械工程,2008,19(16):1891-1894. 被引量：3
9蔡建兵,刘必雄.实时消息中间件设计及适配资源管理算法的应用[J].福建电脑,2005,21(2):25-26.
10李凌,梁亦慧.面向机载视频采集系统的自适应资源管理算法[J].舰船科学技术,2013,35(10):114-118.

电信科学

2015年第8期

浏览历史

内容加载中请稍等...

基于强化学习的异构无线网络资源管理算法被引量：5

参考文献21

二级参考文献10

共引文献8

同被引文献17

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于强化学习的异构无线网络资源管理算法 被引量：5

参考文献21

二级参考文献10

共引文献8

同被引文献17

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于强化学习的异构无线网络资源管理算法被引量：5