一种基于强化学习的深度信念网络设计方法被引量：4

A Design Method for Deep Belief Network Based on Reinforcement Learning

下载PDF

导出

摘要近年来,基于深度学习思想发展起来的深度信念网络(Deep Belief Networks, DBN)在人工智能和大数据预测分析中得到了成功的应用。由于DBN的隐含层数较多,传统的DBN有监督精调(Fine-tuning)方法-BP算法很难得到令人满意的学习精度,甚至会因为梯度扩散(Gradient Diffusion)导致精度调节失败,且网络鲁棒性差。针对此问题,提出一种基于强化学习策略的DBN模型(RL-DBN)及其算法。首先利用自适应对比散度(Adaptive Contrastive Divergence, ACD)算法来快速预训练DBN的隐含层以获取较优的初始权值,然后用强化学习算法代替BP算法对DBN进行精调以提高有监督学习的精度和网络的鲁棒性。实验结果表明,相较于现有的类似模型,RL-DBN在学习速度、精度以及鲁棒性能等方面均有较大提高。 In recent years, deep learning-based deep belief network(DBN) has achieved successful applications in artificial intelligence and big data prediction analysis. However, too many hidden layers in DBN easily leads to a poor learning accuracy of supervised fine-tuning method(BP algorithm), even failure because of gradient diffusion, and robustness is poor. For this problem, an improved DBN based on reinforcement learning(RL-DBN) is proposed. First, adaptive contrastive divergence(ACD) algorithm is used to fast pre-train the hidden layers of DBN so that the better initial weight can be achieved, then the RL algorithm is used to replace BP algorithm to fine-tune DBN so that higher accuracy and better robustness can be achieved. The experimental results show that, compared with several existing similar models, the proposed RL-DBN achieves better performance in learning rate, accuracy and robustness.

作者邢海霞程乐 XING Hai-xia;CHENG Le(Jiangsu Software Testing Engineering Technology Research and Development Center,Huai'an 223003,China)

机构地区江苏省软件测试工程技术研究开发中心

出处《控制工程》 CSCD 北大核心 2019年第11期2115-2120,共6页 Control Engineering of China

基金江苏省高校自然科学基金项目(16KJB520049)

关键词深度信念网络强化学习自适应对比散度鲁棒性能 Deep belief network reinforcement learning adaptive contrastive divergence robustness

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1乔俊飞,王功明,李晓理,韩红桂,柴伟.基于自适应学习率的深度信念网设计与应用[J].自动化学报,2017,43(8):1339-1349. 被引量：18
2王功明,李文静,乔俊飞.基于PLSR自适应深度信念网络的出水总磷预测[J].化工学报,2017,68(5):1987-1997. 被引量：13

二级参考文献8

1邵美玲,韩新芹,谢志才,贾兴焕,刘瑞秋,蔡庆华.香溪河流域梯级水库底栖动物群落比较[J].生态学报,2007,27(12):4963-4971. 被引量：19
2许少鹏,韩红桂,乔俊飞.基于模糊递归神经网络的污泥容积指数预测模型[J].化工学报,2013,64(12):4550-4556. 被引量：9
3邵伟明,田学民,王平.基于局部PLS的多输出过程自适应软测量建模方法(英文)[J].Chinese Journal of Chemical Engineering,2014,22(7):828-836. 被引量：2
4乔俊飞,潘广源,韩红桂.一种连续型深度信念网的设计与应用[J].自动化学报,2015,41(12):2138-2146. 被引量：21
5马帅,沈韬,王瑞琦,赖华,余正涛.基于深层信念网络的太赫兹光谱识别[J].光谱学与光谱分析,2015,35(12):3325-3329. 被引量：8
6郭潇逍,李程,梅俏竹.深度学习在游戏中的应用[J].自动化学报,2016,42(5):676-684. 被引量：22
7耿志强,张怡康.一种基于胶质细胞链的改进深度信念网络模型[J].自动化学报,2016,42(6):943-952. 被引量：9
8贺昱曜,李宝奇.一种组合型的深度学习模型学习率策略[J].自动化学报,2016,42(6):953-958. 被引量：27

共引文献25

1岳兆新,艾萍,熊传圣,宋艳红,洪敏,于家瑞.基于改进深度信念网络模型的中长期径流预测[J].水力发电学报,2020,39(10):33-46. 被引量：18
2孙涛,王雷,付文博,傅罡,张颖.深度学习在水利行业上的应用综述[J].中国农村水利水电,2018(12):90-93. 被引量：16
3索明何,程乐.基于PLSR的深度信念网输出权值确定方法[J].控制工程,2018,25(4):668-676. 被引量：1
4王功明,乔俊飞,王磊.一种能量函数意义下的生成式对抗网络[J].自动化学报,2018,44(5):793-803. 被引量：15
5王献锋,张传雷,张善文,朱义海.基于自适应判别深度置信网络的棉花病虫害预测[J].农业工程学报,2018,34(14):157-164. 被引量：26
6邵双双,刘丽冰,谭志洪,孙世荣,王梦雅.改进的深度信念网络预测模型及其应用[J].计算机应用,2018,38(A01):28-31. 被引量：5
7刘冰尧,庞腾,雷菊阳.基于深度信念网络的变压器故障诊断[J].化工自动化及仪表,2018,45(11):873-878. 被引量：3
8徐宝昌,张华,王学敏.基于近似偏最小一乘准则的多变量非线性系统辨识方法[J].化工学报,2018,69(3):1129-1135. 被引量：2
9牟善仲,徐天赐,符奥,王萌,白茹.基于自适应深度学习模型的变压器故障诊断方法[J].南方电网技术,2018,12(10):14-19. 被引量：11
10鲁春燕,李炜.基于深度置信网络的炼化空压机故障诊断方法[J].化工学报,2019,70(2):757-763. 被引量：6

同被引文献35

1段勇,崔宝侠,徐心和.多智能体强化学习及其在足球机器人角色分配中的应用[J].控制理论与应用,2009,26(4):371-376. 被引量：26
2宋勇,李贻斌,李彩虹.移动机器人路径规划强化学习的初始化[J].控制理论与应用,2012,29(12):1623-1628. 被引量：24
3周颖,杨丽花,杨龙祥,倪梦.基于卡尔曼预测与压缩感知的WSN中高能效数据收集方法[J].电信科学,2019,35(1):74-80. 被引量：3
4秋向飞,余勇.PDCA在电力工程建设项目安全管理中的应用[J].电网与清洁能源,2016,32(5):12-15. 被引量：22
5袁红波,杨宏伟.基于B/S的电力营销管理系统的开发与设计[J].电子设计工程,2017,25(12):105-108. 被引量：8
6马星,王楠.基于大数据的高校教学质量评价体系构建[J].清华大学教育研究,2018,39(2):38-43. 被引量：105
7王晓建,朱婷涵,劳咏昶,黄丽丽.基于人工免疫优化神经网络的输变电工程造价评估[J].浙江电力,2018,37(7):62-67. 被引量：13
8朱云祥,夏华丽,劳咏昶,孙秋洁,刘提.BIM技术在输变电工程的应用成熟度评价研究[J].浙江电力,2018,37(9):84-89. 被引量：17
9黄波,朱昌平,黄健元,李峰.基于用户视角的教学管理信息化建设绩效评价——以教学管理信息系统建设为例[J].中国电化教育,2018(9):69-74. 被引量：16
10余丽霞,刘芬,李慧君.基于翻转课堂的高职英语新型混合教学策略[J].教育学术月刊,2018,0(11):104-111. 被引量：27

引证文献4

1刘沁.基于深度学习和聚类算法的电力工程建设数据分析系统设计[J].电子设计工程,2021,29(3):27-30. 被引量：7
2张思松.基于深度强化学习算法的高能效数据负载均衡方法[J].安阳工学院学报,2022,21(2):43-46. 被引量：1
3刘静.基于深度信念网络的高校教育管理模式评价研究[J].微型电脑应用,2023,39(1):7-10.
4赵德京,马洪聪,廖登宇,崔浩岩.一种基于动作采样的Q学习算法[J].控制工程,2024,31(1):70-79.

二级引证文献8

1侯伊楠,江再玉,方学民,王锦志,熊根鑫,苏占文.基于电力营销系统的业务对象设计方法[J].电力信息与通信技术,2022,20(6):98-103. 被引量：1
2陈利锋.基于优化聚类算法的多源大数据跨源调度系统设计[J].现代电子技术,2022,45(24):151-155.
3董华忠,蒋达飞,尹维波.电动汽车接入配电网不平衡负荷数据渐进学习方法[J].电子设计工程,2023,31(19):20-24.
4李玺,张维堂,常健翔,李敏银.基于海量数据分析的电力工程动态智能监控技术研究[J].电子设计工程,2023,31(21):65-69.
5黄亚飞,陈青云,张辽,庞杰.融合多特征参数的电力工程数据应用智能算法设计研究[J].电子设计工程,2023,31(21):109-113.
6苏雯婷.基于云平台的用电计量采集信息流分析系统[J].电工技术,2023(22):151-153.
7刘乃新.数据挖掘和神经网络技术在电力工程造价领域的运用[J].电气技术与经济,2024(2):253-256.
8李莹,刘忻,邱洋,武扬.云环境下基于AI知识分析的负载均衡方法[J].计算机科学与应用,2022,12(8):2050-2061. 被引量：1

1焦文正.如何切实落实初中数学中数学核心素养“数学抽象”[J].新一代（理论版）,2019,0(23):87-87.
2许慕竹,李璟,姜欢.浅谈孟加拉留学生在汉语学习初级阶段的常见问题及对策[J].休闲,2019,0(9):221-221.
3陈琳灵.小学数学教学中符号意识的培养策略思考[J].数学大世界（上旬）,2019,0(9):29-29.
4苏雪霞.基于深度学习的CT图像识别方法的研究[J].信息通信,2019,0(10):12-13. 被引量：1
5许冠亚,耿玲娜,邵平,赵肖旭,靳栋曼,谢添.基于深度强化学习的微电网储能调度策略研究[J].企业科技与发展,2019,0(11):59-60. 被引量：1
6丁月,汪学明.基于改进特征加权的朴素贝叶斯分类算法[J].计算机应用研究,2019,36(12):3597-3600. 被引量：24
7陈建平,陈其强,傅启明,高振,吴宏杰,陆悠.基于生成对抗网络的最大熵逆强化学习[J].计算机工程与应用,2019,55(22):119-126. 被引量：1
8徐梗,王晨.《哲学简史》对大学教育的思考[J].青年与社会,2019,0(31):89-90.
9陈善学,张燕琪.基于预测和矢量量化的高光谱图像压缩算法[J].重庆邮电大学学报（自然科学版）,2019,31(5):688-693. 被引量：4
10郑晓玲.浅谈高中语文教学中分层教学的运用[J].考试周刊,2019,0(85):70-70. 被引量：1

控制工程

2019年第11期

浏览历史

内容加载中请稍等...

一种基于强化学习的深度信念网络设计方法被引量：4

参考文献2

二级参考文献8

共引文献25

同被引文献35

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种基于强化学习的深度信念网络设计方法 被引量：4

参考文献2

二级参考文献8

共引文献25

同被引文献35

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种基于强化学习的深度信念网络设计方法被引量：4