推断网络辅助下的DQN在卷烟制丝过程控制中的实证被引量：3

DeepQ-Learning with inference netusedin cigarette silk process

下载PDF

导出

摘要针对DQN算法在工业环境维度或动作维度极高的情况下训练速度慢、不易收敛、复用性差的问题,提出了构建等价环境的方法,该方法基于MDP过程构建半增强训练模型,并在输入维度巨大的卷烟制丝过程控制中通过测试。通过分析MP过程,解释了DQN相对Q值学习更加有效的原因,分析了Q值学习本身忽略的环境压缩问题,提出构建环境等价网络的算法。实验表明,在工业环境中,该算法相对DQN明显提高了记忆的使用效率。可预见该算法能够将已完成训练的环境经验应用在新的任务中。同时该算法可推广至动作等价,以简化拥有连续动作或动作维度极高的环境训练问题。

作者陆帅丁香乾于树松 LU Shuai;DING Xiang-qian;YU Shu-song

机构地区中国海洋大学信息科学与工程学院

出处《制造业自动化》 CSCD 2020年第3期148-151,共4页 Manufacturing Automation

基金青岛市科技计划19-8-1-12-XX

关键词增强学习马尔科夫决策过程(MDP) 神经网络深度Q值学习(DQN) 降维

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

同被引文献28

1汪辉.卷烟制丝分组加工工艺特点及质量控制要点研究[J].科学之友（下）,2012(2):9-10. 被引量：6
2陈淑梅.关于卷烟制丝工艺质量控制的要点研究[J].财经界,2013(5):255-255. 被引量：14
3李铁军,杨得强,李强.SPC系统在卷烟制丝工艺质量控制的应用[J].中国质量,2013(4):87-88. 被引量：5
4宋耀辉,王献伟,王根旺.关于卷烟制丝工艺质量控制的要点分析[J].科技致富向导,2014,0(32):35-35. 被引量：3
5李山.制丝线主要工序对卷烟感官质量影响的分析[J].甘肃科技,2018,34(6):31-32. 被引量：5
6罗志雪,王昭焜,于静,罗垚昱.卷烟制丝过程参数稳定性评价指数的构建及应用[J].烟草科技,2018,51(5):76-80. 被引量：10
7李兆波.关于卷烟制丝加料加香和混丝掺配工艺过程的稳定度控制的探讨[J].科技风,2018(16):234-234. 被引量：3
8高长江,普绍清.自动控制技术在卷烟制丝设备控制中的应用探讨[J].山东工业技术,2018(13):31-31. 被引量：2
9关丽芬.卷烟烟丝纯度影响因素分析[J].安徽农学通报,2018,24(6):161-163. 被引量：3
10周丽娜,袁舒,杨波,魏毓,李富蓉,荔亮.卷烟制丝松散回潮工序与主流烟气中TSNAs的关系分析[J].现代农业科技,2018(20):230-231. 被引量：1

引证文献3

1仲崇宝,张磊,崔嵬,邱宇杰,于富冬,唐萍,吴连川.卷烟制丝加香工序加香均匀性及其影响因素研究[J].新型工业化,2021,11(4):130-131. 被引量：2
2唐芳丽,郑海伟.基于物联网技术的卷烟制丝现场工艺质量智能控制方法[J].信息与电脑,2022,34(24):53-55. 被引量：1
3王佳,马修.基于灰色系统法的卷烟制丝线松散润叶出料含水率稳定性研究[J].造纸装备及材料,2024,53(4):70-72.

二级引证文献3

1汪律,杨涛,张富坤,余明,陈昌盛.等长切刀对不同等级配方卷烟物理指标的影响分析[J].新型工业化,2022,12(9):60-63.
2沈宇浩,胡常林,李云豪,甘华,谢靖.加料机料液智能引射系统的设计与应用[J].科学技术创新,2023(8):209-212.
3黄仕强,鲍思成,张益,葛勇,尹毅,张昆翔,聂莉,符久红.一种制丝加香的烟丝流量控制系统的设计[J].自动化应用,2023,64(20):87-90.

1郑新雨.关于我国油气智能化发展的探讨[J].信息周刊,2019,0(51):0085-0085.
2陈婧,冯茜(通讯作者).腹腔镜头低脚高截石位摆放中渗透舒适体位护理的效果评价[J].现代消化及介入诊疗,2019,24(A01):0480-0480.
3李晓.探究小学语文读写结合训练形式——以四年级课文教学为例[J].新作文（中小学教学研究）,2019,2(1):36-37.
4钟艳棠.舞蹈训练在礼仪教学中的应用研究[J].下一代,2019(9):0027-0027.
5曹春华.当代书法创作中的设计意识探究[J].中国民族博览,2019,0(11):81-83.
6刘东杰,赵津,席阿行.基于时空特征融合的端到端无人车控制[J].科学技术与工程,2019,19(30):241-246. 被引量：2
7李嘉欣.创业企业外部环境影响研究——一个文献综述[J].中国商论,2020,0(5):248-250.
8黄曼曼,王兰.对在ICU接受机械通气治疗的ARDS患者进行护理风险管理对其VAP发生率的影响[J].当代医药论丛,2019,17(23):225-227. 被引量：4
9王芝辉,王晓东.基于神经网络的文本分类方法研究[J].计算机工程,2020,46(3):11-17. 被引量：14
10佚名.“熬夜变笨”终于被科学证实[J].东西南北,2019,0(24):76-77.

制造业自动化

2020年第3期

浏览历史

内容加载中请稍等...

推断网络辅助下的DQN在卷烟制丝过程控制中的实证被引量：3

同被引文献28

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

推断网络辅助下的DQN在卷烟制丝过程控制中的实证 被引量：3

同被引文献28

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

推断网络辅助下的DQN在卷烟制丝过程控制中的实证被引量：3