期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
分层强化学习研究进展 被引量:1
1
作者 程晓北 沈晶 +2 位作者 刘海波 顾国昌 张国印 《计算机工程与应用》 CSCD 北大核心 2008年第13期1-5,共5页
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但强化学习方法一直被维数灾难所困扰。近年来,分层强化学习方法在解决维数灾问题中取得了显著成果,并逐渐开始向多智能体系... 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但强化学习方法一直被维数灾难所困扰。近年来,分层强化学习方法在解决维数灾问题中取得了显著成果,并逐渐开始向多智能体系统推广,论文归纳分析这一领域目前的研究进展,并对迫切需要解决的一些问题和进一步的发展趋势作出探讨和展望。 展开更多
关键词 分层强化学习 多智能体系统 维数灾难
下载PDF
多智能体分层强化学习研究进展
2
作者 程晓北 顾国昌 《边疆经济与文化》 2007年第5期73-75,共3页
强化学习(RL)通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。多智能体强化学习(MARL)和分层强化学习(HRL)是该领域近年的两个研究热点,二者融合形成的多智能体分层强化学习(MAHRL)则... 强化学习(RL)通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。多智能体强化学习(MARL)和分层强化学习(HRL)是该领域近年的两个研究热点,二者融合形成的多智能体分层强化学习(MAHRL)则是当前一个新的研究方向。MARL、HRL和MAHRL虽已取得了研究成果,但也要指出MAHRL研究中尚未解决的问题及其研究思路。 展开更多
关键词 强化学习 多智能体强化学习 分层强化学习
下载PDF
动态环境中的分层强化学习 被引量:5
3
作者 沈晶 程晓北 +2 位作者 刘海波 顾国昌 张国印 《控制理论与应用》 EI CAS CSCD 北大核心 2008年第1期71-74,共4页
现有的强化学习方法都不能很好地处理动态环境中的学习问题,当环境变化时需要重新学习最优策略,若环境变化的时间间隔小于策略收敛时间,学习算法则不能收敛.本文在Option分层强化学习方法的基础上提出一种适应动态环境的分层强化学习方... 现有的强化学习方法都不能很好地处理动态环境中的学习问题,当环境变化时需要重新学习最优策略,若环境变化的时间间隔小于策略收敛时间,学习算法则不能收敛.本文在Option分层强化学习方法的基础上提出一种适应动态环境的分层强化学习方法,该方法利用学习的分层特性,仅关注分层任务子目标状态及当前Option内部环境状态的变化,将策略更新过程限制在规模较小的局部空间或维数较低的高层空间上,从而加快学习速度.以二维动态栅格空间内两点间最短路径规划为背景进行了仿真实验,实验结果表明,该方法策略学习速度明显高于以往的方法,且学习算法收敛性对环境变化频率的依赖性有所降低. 展开更多
关键词 分层强化学习 动态环境 OPTION 策略更新
下载PDF
创新方式 改进会风——农发行黑龙江省分行积极提高党员领导干部民主生活会质量
4
作者 程晓北 李纬安 李君仕 《农业发展与金融》 2013年第4期79-80,共2页
2011年以来,农发行黑龙江省分行逐步建立了“量化考评、积分管理、分类指导”的党员领导干部民主生活会模式,
关键词 民主生活会质量 党员领导干部 黑龙江省分行 农发行 创新方式 会风 量化考评
下载PDF
落实十九大精神 助推转型发展
5
作者 程晓北 《农业发展与金融》 2018年第6期34-35,共2页
党的十九大为中国特色社会主义伟大事业继续前进谋篇布局,提出了一系列新判断、新目标、新战略,开启了新时代中国特色社会主义伟大事业的新篇章,开辟了中国特色社会主义理论体系的新境界,实现了马克思主义中国化的新飞跃。作为农发行党... 党的十九大为中国特色社会主义伟大事业继续前进谋篇布局,提出了一系列新判断、新目标、新战略,开启了新时代中国特色社会主义伟大事业的新篇章,开辟了中国特色社会主义理论体系的新境界,实现了马克思主义中国化的新飞跃。作为农发行党员领导干部,要认真学习党的十九大精神,更要贯彻落实党的十九大精神,全力推进农发行转型发展。 展开更多
关键词 转型发展 中国特色社会主义理论体系 精神 马克思主义中国化 党员领导干部 谋篇布局 农发行 事业
下载PDF
赴新加坡学习考察收获和体会
6
作者 程晓北 段建军 武晓东 《农业发展与金融》 2011年第1期85-87,共3页
2010年8月23日至9月5日,我们参加了在新加坡举办的为期两周的高级管理人员培训班,培训内容主要有课堂授课与参观考察。课堂授课部分设置了《世界级银行服务体系的建立》、《银行业务同质化与核心竞争力的培养》、《银行高级经理人营销... 2010年8月23日至9月5日,我们参加了在新加坡举办的为期两周的高级管理人员培训班,培训内容主要有课堂授课与参观考察。课堂授课部分设置了《世界级银行服务体系的建立》、《银行业务同质化与核心竞争力的培养》、《银行高级经理人营销策略制定》等专题讲座, 展开更多
关键词 新加坡 学习考察 银行服务体系 高级管理人员 课堂授课 2010年 核心竞争力 高级经理人
下载PDF
农发行员工培养和提升个人核心竞争力的途径
7
作者 程晓北 宋骞 《农业发展与金融》 2011年第8期83-85,共3页
当今社会处处充满竞争,国家要在国际政治舞台中担当重要角色,必须有自己的核心竞争力;企业要在市场经济中生存和发展,必须有自己的核心竞争力;个人要想在工作中体现自身价值,也必须有个人核心竞争力。作为农发行的员工,特别是青... 当今社会处处充满竞争,国家要在国际政治舞台中担当重要角色,必须有自己的核心竞争力;企业要在市场经济中生存和发展,必须有自己的核心竞争力;个人要想在工作中体现自身价值,也必须有个人核心竞争力。作为农发行的员工,特别是青年员工正处在一个机遇和竞争并存的环境,要进步、要发展、要实现理想.首先要从自身抓起,通过不断培养和提升个人的核心竞争力,来适应工作、胜任工作、创新工作,从而把自己打造成为农发行需要的复合型或专家型人才。 展开更多
关键词 个人核心竞争力 员工培养 农发行 专家型人才 国际政治 市场经济 青年员工 复合型
下载PDF
发展规模最优化问题研究
8
作者 农发行总行党校(第29期)井冈山班课题组 程晓北 +2 位作者 黄志强 刘海军 于智源 《农业发展与金融》 2015年第5期18-21,共4页
研究农发行发展规模最优化的问题既有理论意义.更有现实意义。农发行要真正实现发展规模最优化.要同时达到支农效果最优、资产质量最优、经营效益最优、业务结构最优四个标准。
关键词 发展规模 最优化问题 金融市场体系 政策性金融机构 全面深化改革 发展阶段 规模经济 常务会议 存款规模 最优规模
下载PDF
基于半马尔可夫对策的多机器人分层强化学习 被引量:6
9
作者 沈晶 刘海波 +2 位作者 张汝波 吴艳霞 程晓北 《山东大学学报(工学版)》 CAS 北大核心 2010年第4期1-7,共7页
在多智能体分层强化学习研究成果的基础上,考虑多机器人系统经常面临的通信困难问题(如水下环境),提出一种基于半马尔可夫对策的多机器人分层强化学习方法,通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了... 在多智能体分层强化学习研究成果的基础上,考虑多机器人系统经常面临的通信困难问题(如水下环境),提出一种基于半马尔可夫对策的多机器人分层强化学习方法,通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了该方法的有效性。 展开更多
关键词 半马尔可夫对策 多机器人 分层强化学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部