基于神经网络及强化学习的智能控制系统被引量：12

An Intelligent Control System Based on Neural Networks and Reinforcement Learning

下载PDF

导出

摘要将神经网络与强化学习结合,提出了一种新型算法模型.该模型应用于智能控制系统中将使智能体具有自主性、高效率、大容量等综合优势.最后,利用计算机软件仿真实验,验证了方案的有效性.本次实验对机器人使用基于试错改进机制的强化学习方式,与传统机器人研究领域大多使用的基于导师机制的监督学习相比,提高了机器人自主适应环境的能力,使机器人更加智能化.同时,将神经网络引入到强化学习中,使该智能系统较其他强化学习系统具有更快的处理信息的速率. With the rapid development of science and technology today, humans require robots to be more intelligent. Reinforcement learning is a kind of automatic learning algorithm, by which the intelligent agent can accumulate experience and improve strategies through constant trial and error, and ultimately get the optimal action strategies. Artificial neural network can process input data in parallel and has the advantage of high computation speed. Combining the neural network with reinforcement learning, this paper propo- ses a new algorithm model. Applied in the intelligent control system, this model may enable robots to have the advantage of automatic decision-making capacity, high efficiency of information processing and large capacity for input data. Finally, a simulation experiment based on computer software verifies the effective- ness of the scheme. In this study, the robot employs the reinforcement learning algorithm based on the mechanism of trial-and-error improvement. Compared with the traditional algorithm in robotics research areas such as supervision learning which is based on guiding, reinforcement learning improves the robots＇ ability to automatically adapt to the environment and makes the robot more intelligent. Meanwhile, the neural network is introduced into reinforcement learning, so that the intelligent system will have a higher rate of data processing than other reinforcement learning systems.

作者钟宇平王丽丹段书凯张凤运李波

机构地区西南大学电子信息工程学院

出处《西南大学学报（自然科学版）》 CAS CSCD 北大核心 2013年第11期172-179,共8页 Journal of Southwest University(Natural Science Edition)

基金国家大学生创新创业计划(201210635123) 国家自然科学基金资助项目(60972155 61101233) 中央高校基本科研业务费专项资金资助项目(XDJK2012A007 XDJK2013B011) 重庆市高等学校青年骨干教师资助计划和优秀人才支持计划(渝教人〔2011〕65号) 教育部"春晖计划"(z2011148) 留学人员科技活动项目择优资助经费(渝人社办〔2012〕186号) 重庆市高等教育教学改革研究重点项目(09-2-011)‘西南大学教育教学改革研究项目(2012JY201)的资助

关键词强化学习神经网络数值仿真智能控制 reinforcement learning neural network numerical simulation intelligent control

分类号 TP273.5 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献1

1杨善林,罗贺,胡小建.基于Q学习的自主Agent模型[J].微电子学与计算机,2006,23(9):203-205. 被引量：5

二级参考文献5

1Watkings P Dayan.Q-Learning[J].Machine Learning,1992,8(3):279～292
2Yichi Wang,John M Usher.Application of reinforcement learning for Agent-based production scheduling[J].Engineering Application of Artificial Intelligence,2005,18:73～82
3M Wooldridge,N R Jennings.Intelligent agent:Theory and Practice[J].The Knowledge Engineering Review,1995,10(2):115～152
4P R J Tillotsona,Q H Wua,P M Hughesb.Multi-agent learning for routing control within an Internet environment[J].Engineering Applications of Artificial Intelligence,2004,17:179～185
5A S Rao,M P Georgeff.BDI agents:from theory to practice[A].Proc of the 1st international Conf on Multiagent Systems[C].San Francisco:ACM Press,1995:312～319

共引文献4

1罗旭.基于Agent的防空兵群火力分配模型[J].舰船电子工程,2009,29(4):47-48. 被引量：1
2李炳星,季薇.基于强化学习的分布式智能入侵防御方案设计[J].计算机技术与发展,2019,29(1):118-123.
3杨善林,罗贺.面向主体的多源信息融合系统建模研究[J].信息系统学报,2007,1(1):92-101. 被引量：1
4贺鹏超,王宁,钱军,吴振华,刘曦.基于Q-learning算法的SAR导引头制导律设计研究[J].战术导弹技术,2023(5):124-130.

同被引文献125

1马加其.防夹电动车窗的改进[J].湖北汽车工业学院学报,2007,21(3):79-80. 被引量：10
2邹谊,庄镇泉,杨俊安.基于遗传算法的嵌入式系统软硬件划分算法[J].中国科学技术大学学报,2004,34(6):724-731. 被引量：14
3熊志辉,李思昆,陈吉华.遗传算法与蚂蚁算法动态融合的软硬件划分[J].软件学报,2005,16(4):503-512. 被引量：87
4汪千松,胡慧敏,陈阳.基于校园网的数字化网络多媒体教室设计[J].中国现代教育装备,2005(8):42-44. 被引量：7
5熊伟丽,徐保国,周其明.基于改进粒子群算法的PID参数优化方法研究[J].计算机工程,2005,31(24):41-43. 被引量：21
6郭兵,沈艳,王典辉,李志蜀.一种基于离散Hopfield神经网络的SoC嵌入式操作系统软/硬件划分方法[J].四川大学学报（工程科学版）,2006,38(5):122-127. 被引量：1
7房启超,徐林,王建辉,顾树生.改进的PSO及其在结晶器液位控制中的应用[J].仪器仪表学报,2006,27(11):1399-1402. 被引量：11
8杜选,高明峰.人工神经网络在数字识别中的应用[J].计算机系统应用,2007,16(2):21-22. 被引量：22
9曹光明,吴迪,张殿华.基于模糊自适应PID的铸轧机结晶器液位控制系统[J].控制与决策,2007,22(4):399-402. 被引量：27
10李涛,杨愚鲁,马平,柴欣.基于遗传算法的可重构系统软硬件划分[J].计算机工程与应用,2007,43(26):56-58. 被引量：9

引证文献12

1罗婉丽,吴晓燕.一种面向应用的电动车窗防夹控制算法研究[J].西南师范大学学报（自然科学版）,2015,40(1):96-101. 被引量：2
2李志鹏,邵宪友,张东兴,杨传英.基于BP神经网络的电控发动机故障诊断研究[J].重庆理工大学学报（自然科学）,2015,29(8):6-11. 被引量：10
3邓定胜.基于混合遗传算法和神经网络的软硬件划分算法[J].西南师范大学学报（自然科学版）,2015,40(10):29-34. 被引量：5
4张义,田爱奎,韩士元.一种自适应的混沌粒子群优化RBF神经网络算法[J].重庆理工大学学报（自然科学）,2015,29(11):126-130. 被引量：6
5田彦山,吴炯,王森,孙宏宇,周庆国.基于CNN的CAD模型到MCNP模型转换算法研究[J].西南大学学报（自然科学版）,2015,37(12):109-115. 被引量：2
6邵冬华,蒋敏.基于智慧校园多方式认证下的高校多媒体教室设计与实践[J].西南师范大学学报（自然科学版）,2016,41(3):101-106. 被引量：21
7王婷婷,丁世飞.基于资格迹的RBF非线性系统强化学习研究[J].小型微型计算机系统,2016,37(7):1508-1512. 被引量：1
8刘欣,陈武.基于视觉分析的机器人最优避障路径识别方法[J].西南大学学报（自然科学版）,2017,39(2):128-134. 被引量：3
9蔡延光,白帅星,蔡颢.基于BP神经网络的工业用户能效评估[J].东莞理工学院学报,2018,25(3):67-72. 被引量：1
10张浩杰,苏治宝,苏波.基于深度Q网络学习的机器人端到端控制方法[J].仪器仪表学报,2018,39(10):36-43. 被引量：27

二级引证文献83

1徐雪松,曾智,邵红燕,杨胜杰,李想.基于个体-协同触发强化学习的多机器人行为决策方法[J].仪器仪表学报,2020(5):66-75. 被引量：10
2高子航.基于5G通信的四足机器人控制系统设计[J].电子技术（上海）,2021,50(5):140-141. 被引量：3
3郑冰原,孙彦赞,吴雅婷,王涛.基于深度强化学习的超密集网络资源分配[J].电子测量技术,2020(9):133-138. 被引量：6
4樊国根,蒙芳.基于粒子群智能优化的机器人路径全局规划算法[J].电子测量技术,2020(7):41-45. 被引量：6
5许杨子,强文,刘俊,孙鸿雁,胡成刚.基于改进深度强化学习算法的电力市场监测模型研究[J].国外电子测量技术,2020,39(1):82-87. 被引量：5
6杰弗里.W.雅各布斯,朱晓红.密西西比河与湄公河流域开发经验的比较[J].水利水电快报,2000,21(8):8-12. 被引量：1
7代天,李军.路径识别和路径跟踪技术研究综述[J].装备机械,2018(4):1-4. 被引量：3
8窦俞雯.电动车窗控制器的防夹测控算法[J].山东工业技术,2015(11):248-248.
9李修云,陈帅.基于马尔科夫链理论的改进的最大Lyapunov指数混沌预测法[J].计算机科学,2016,43(4):270-273. 被引量：2
10尹庆民,焦晓东.应用投影寻踪-粒子群算法的江苏省交通适应性评价[J].重庆理工大学学报（自然科学）,2016,30(6):159-166. 被引量：2

1李伟,何雪松,叶庆泰,朱昌明.基于先验知识的强化学习系统[J].上海交通大学学报,2004,38(8):1362-1365. 被引量：5
2陆远蓉.基于移动云计算架构的移动学习系统构建研究[J].智能计算机与应用,2015,5(4):45-47. 被引量：7
3侯跃恩,李伟光.结构稀疏表示分类目标跟踪算法[J].计算机科学与探索,2016,10(7):1035-1043.
4武玉坤.基于云计算的移动学习平台的设计[J].电脑知识与技术,2016,12(7X):89-90. 被引量：2
5宣冬梅,王菊韵,于华,赵佳.深度学习中先验知识的应用[J].计算机工程与设计,2015,36(11):3087-3091. 被引量：9
6张汝波,顾国昌,张国印.强化学习系统的结构及算法[J].计算机科学,1999,26(10):53-56. 被引量：2
7王雪松,田西兰,程玉虎,马小平.最小二乘支持向量机在强化学习系统中的应用[J].系统仿真学报,2008,20(14):3702-3706. 被引量：3
8赵丹丹,潘新,刘霞,郜晓晶.基于提升小波和深度学习的掌纹识别[J].计算机仿真,2016,33(10):338-342.
9马莉,蔡自兴.基于强化学习的模糊自适应控制器[J].中南工业大学学报,1998,29(2):172-175. 被引量：1
10徐志洁.一种处理多类分类问题的强化支持向量机方法[J].计算机工程与应用,2009,45(26):176-178.

西南大学学报（自然科学版）

2013年第11期

浏览历史

内容加载中请稍等...

基于神经网络及强化学习的智能控制系统被引量：12

参考文献1

二级参考文献5

共引文献4

同被引文献125

引证文献12

二级引证文献83

相关作者

相关机构

相关主题

浏览历史

基于神经网络及强化学习的智能控制系统 被引量：12

参考文献1

二级参考文献5

共引文献4

同被引文献125

引证文献12

二级引证文献83

相关作者

相关机构

相关主题

浏览历史

基于神经网络及强化学习的智能控制系统被引量：12