小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：2

Application of cerebellar model articulation controller network to learning optimization control in conveyor-serviced production station

下载PDF

导出

摘要研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度. This paper is concerned with the optimization of the look-ahead distance for a conveyor-serviced production station（CSPS） to improve the efficiency of operations.The optimal control process for CSPS is modeled by a semi-Markov decision process（SMDP）.Since the standard Q-learning is difficult to deal with the continuous variable optimal look-ahead control problem of CSPS directly,Cerebellar Model Articulation Controller（CMAC） for Q-values function approximation is combined with the online learning technology,and some online Q-learning and model-free online policy iteration algorithms are provided.Simulation results show that the proposed algorithms improve the learning speed and the precision of optimization.

作者周雷孔凤唐昊张建军

机构地区合肥工业大学计算机与信息学院安全关键工业测控技术教育部工程研究中心

出处《控制理论与应用》 EI CAS CSCD 北大核心 2011年第11期1665-1670,共6页 Control Theory & Applications

基金国家自然科学基金资助项目(60873003 61174186) 教育部留学回国人员科研启动基金资助项目(教外司留2008890) 安徽省自然科学基金资助项目(090412046) 安徽高校省级自然科学研究重点资助项目(KJ2008A058 KJ2011A230) 中日国际科技合作资助项目(2011FA10440)

关键词传送带给料生产加工站小脑模型关节控制器 Q学习在线策略迭代 conveyor-serviced production station cerebellar model articulation controller Q-learning online policy iteration

分类号 TP13 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献16

1MORRIS W T. Analysis for Material Handling Management[M]. Richard D: Irwin inc., 1962.
2MATSUI M. A study on optimal operating polices in conveyor- serviced production system[D]. Japan: Tokyo Institute of Technology, 1981.
3NAWIJN W M. Stochastic conveyor systems[D]. Netherlands: Twente University of Technology, 1983.
4MATSUI M. A generalized model of conveyor-serviced production station (CSPS)[J]. Journal o f Japan Industrial Management Associa- tion, 1993, 44(1): 25 - 32.
5MATSUI M. CSPS model: look-ahead controls and physics[J]. In- ternational Journal of Production Research, 2005, 43(10): 2001 - 2025.
6TANG H, ARAI TAMIO. Look-ahead control of conveyor-serviced production station by using potential-based online policy iteration[J]. International Journal of Control, 2009, 82(10): 1917 - 1928.
7MATSUI M. Manufacturing and Service Enterprise with Risk: A Stochastic ManagementApproach[M]. New York: Springer, 2009.
8ABE K, YAMADA T, MATSUI M. A design problem of assembly line systems using genetic algorithm under the BTO environment[J]. IEEJ Transactions on Electronics, Information and Systems, 2004, 124(10): 2006 - 2013.
9NAWIJN W M. The optimal look-ahead policy for admission to a sin- gle server system[J]. Operations Research, 1985, 33(3): 626 - 643.
10唐昊,万海峰,韩江洪,周雷.基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制[J].自动化学报,2010,36(2):289-296. 被引量：8

二级参考文献28

1朱大奇,张伟.基于平衡学习的CMAC神经网络非线性辨识算法[J].控制与决策,2004,19(12):1425-1428. 被引量：20
2TANGHao YUANJi-Bin LUYang CHENGWen-Juan.Performance Potential-based Neuro-dynamic Programming for SMDPs[J].自动化学报,2005,31(4):642-645. 被引量：10
3陈茂银,周东华.线性系统的鲁棒故障诊断[J].控制理论与应用,2005,22(5):718-722. 被引量：4
4唐昊,周雷,袁继彬.平均和折扣准则MDP基于TD(0)学习的统一NDP方法[J].控制理论与应用,2006,23(2):292-296. 被引量：5
5ZHU Da-Qi KONG Min.Fault-tolerant Control of Nonlinear System Using Credit Assign Fuzzy CMAC[J].自动化学报,2006,32(3):329-336. 被引量：8
6ALBUS J S.A new approach to manipulator control:the cerebellar model articulation controller (CMAC) [J].J of Dynamic Systems,Measurement,and Control Trans of ASME,1975,5(2):220-227.
7MILLER T W,GLANZ F H.An associative neural network alternative to backpropagation [J].Proceedings of IEEE,1990,78(10):1561-1567.
8MILLER T W.Real-time application of neural networks for sensor-based control of robots [J].IEEE Trans on Systems Man and Cybernetics,1989,19(4):825-831.
9WONG Y,SIDERIS A.Learning convergence in the cerebellar model articulation controller [J].IEEE Trans on Neural Networks,1992,3(1):115-121.
10CHANG C T,LIN C S.CMAC with general basis functions [J].Neural Networks,1996,9(7):1199-1211.

共引文献34

1吕雁,陈文楷,唐润宏.基于模糊CMAC的三连杆机械臂的最优控制器[J].现代电子技术,2007,30(11):98-99.
2杨武强,张华,刘继忠.一种基于模糊CMAC的机器人避障控制算法[J].机电工程技术,2007,36(6):31-33. 被引量：1
3刘珊,王永骥,方慧娟,徐琦.SFCMAC及其在仿人手臂控制中的应用[J].华中科技大学学报（自然科学版）,2008,36(10):1-4.
4王立辉,李磊,朱齐丹.液压并联平台神经元PSD与模糊CMAC复合控制[J].农业机械学报,2008,39(11):207-210. 被引量：2
5唐昊,万海峰,韩江洪,周雷.基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制[J].自动化学报,2010,36(2):289-296. 被引量：8
6刘士荣,周国成,吴秋轩,史先鹏.高精度伺服系统的模糊CMAC补偿控制[J].控制工程,2010,17(6):836-840. 被引量：4
7任付彪,周雷,马学森,魏振春.事件驱动Q学习在呼叫接入控制中的应用[J].合肥工业大学学报（自然科学版）,2011,34(1):76-79.
8闵华清,曾嘉安,罗荣华,朱金辉.一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法[J].控制理论与应用,2011,28(2):256-260. 被引量：3
9王华秋.一种变步长CMAC的沉降NARMAX模型[J].计算机应用研究,2011,28(4):1368-1371.
10孙开林,王宪,杨坤.基于FCMAC的鲁棒自适应迭代学习控制算法[J].计算机系统应用,2011,20(11):86-90.

同被引文献12

1周延佑,陈长年.多品种、单件、小批量生产和少品种、大批量生产解决方案的新发展——IMTS 2006观后感之二[J].制造技术与机床,2007(5):28-36. 被引量：12
2杨丽,王粮局,张铁中.植物培养瓶自动排序装置优化设计与试验[J].农业机械学报,2012,43(6):79-85. 被引量：2
3傅建中.智能制造装备的发展现状与趋势[J].机电工程,2014,31(8):959-962. 被引量：123
4周敬东,李敏慧,周明刚,黄云朋,王焱清.油茶果的模糊聚类色选算法[J].中国农机化学报,2015,36(4):94-99. 被引量：11
5周济.智能制造——“中国制造2025”的主攻方向[J].中国机械工程,2015,26(17):2273-2284. 被引量：1202
6周敬东,黄云朋,李敏慧,杨光友,周明刚.一种基于CCD相机的通道式油茶果色选机系统[J].中国农机化学报,2015,36(5):128-133. 被引量：10
7刘德强,刘德君.基于自抗扰的果仁色选机电磁振动给料控制系统[J].中国农机化学报,2016,37(6):110-112. 被引量：2
8沈宝国,董春旺,蒋修定.茶树鲜叶分选研究现状与展望[J].中国农机化学报,2016,37(8):87-90. 被引量：5
9陈丹,石国良.基于视觉几何的传送带测速方法研究[J].仪器仪表学报,2016,37(10):2307-2315. 被引量：6
10刘德君,段慧达,陈广大.自动松子破壳机设计与研究[J].中国农机化学报,2016,37(12):116-121. 被引量：2

引证文献2

1唐昊,杨羊,戴飞,谭琦.基于RBF-Q学习的多品种CSPS系统前视距离控制[J].控制与决策,2019,34(7):1456-1462. 被引量：1
2陈广大,刘德君,闫冠宇,邹青宇.果仁色选机传送带速度控制系统研究[J].中国农机化学报,2019,40(7):58-62. 被引量：1

二级引证文献2

1程莹,许亚男,侯浩楠,宁翠玲,杨成民,董学会,曹海,孙群.基于机器视觉技术的小粒中药材种子净度快速检测[J].中国农业大学学报,2022,27(5):114-122. 被引量：2
2司彦娜,普杰信,于晓升,司鹏举,孙力帆.基于径向基神经网络的多步Sarsa控制算法[J].控制与决策,2023,38(4):944-950. 被引量：1

1黄浩,唐昊,周雷,程文娟.服务率不确定的单站点传送带给料加工站系统鲁棒优化控制[J].计算机应用,2015,35(7):2067-2072.
2程正务.传送带给料自动控制系统[J].电子技术（上海）,1995,22(11):4-5.
3Lilli Manolis Sherman.带来巨大回报的订制化输送系统[J].现代塑料,2009(12):40-41.
4唐昊,万海峰,韩江洪,周雷.基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制[J].自动化学报,2010,36(2):289-296. 被引量：8
5刘冰,唐昊,周雷.基于CMAC神经网络的多工序CSPS系统分层优化控制[J].电子技术（上海）,2012,39(7):11-16.
6唐昊,裴荣,周雷,谭琦.基于状态聚类的多站点CSPS系统的协同控制方法[J].自动化学报,2014,40(5):901-908. 被引量：1
7唐昊,许玲玲,周雷,谭琦.可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制[J].控制理论与应用,2015,32(6):810-816. 被引量：2
8王海燕,欧阳丹彤,张永刚,张良.结合look-ahead值排序的自适应分支求解算法[J].通信学报,2013,34(6):102-107. 被引量：1
9吴玉华,唐昊,周雷.SMDP基于性能势的M步向前策略迭代[J].吉林大学学报（工学版）,2006,36(6):958-962.
10吕文杰,马戎,李岁劳,付维平.基于纯追踪模型的路径跟踪改进算法[J].测控技术,2011,30(7):93-96. 被引量：21

控制理论与应用

2011年第11期

浏览历史

内容加载中请稍等...

小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：2

参考文献16

二级参考文献28

共引文献34

同被引文献12

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用 被引量：2

参考文献16

二级参考文献28

共引文献34

同被引文献12

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：2