-
题名基于MAXQ方法的分层强化学习
被引量:1
- 1
-
-
作者
庞士焕
朱相冰
张琦
汤萍萍
-
机构
安徽师范大学教育科学学院
安徽师范大学物理与电子信息工程学院
西北大学软件学院
东南大学计算机学院
-
出处
《计算机技术与发展》
2009年第4期154-156,169,共4页
-
基金
安徽省教育重点项目(KJ2008A142C)
安徽省自然科学基金项目(KJ2007B061)
-
文摘
强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成"维数灾"。为此提出了一种基于MAXQ的分层强化学习方法,通过引入抽象机制将强化学习任务分解到不同层次上来分别实现,使得每层上的学习任务仅需在较小的空间中进行,从而大大减少了学习的数量和规模。并给出具体算法——MAXQ-RLA。
-
关键词
分层强化学习
MAXQ
MDP
-
Keywords
hierarchical reinforcement learning
MAXQ
MDP
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于TLA的正确性验证方法
- 2
-
-
作者
庞士焕
朱相冰
张琦
汤萍萍
-
机构
安徽师范大学教育科学学院
安徽师范大学物理与电子信息工程学院
西北大学软件学院
东南大学计算机学院
-
出处
《计算机技术与发展》
2009年第3期55-58,共4页
-
基金
安徽省自然科学基金项目(KJ2007B061)
安徽省教育厅重点项目(KJ2008A142C)
-
文摘
随着面向服务的体系结构的发展,有效地组合单个分布的web服务以提供更有价值的服务成为新的热点问题。然而,在这一研究领域还存在诸多问题,比如web服务用哪种方式组合,能否实现自动组合,对组合服务进行正确性验证等等。文中主要是针对组合服务的正确性验证问题,引入时序逻辑TLA。通过把组合服务的BPEL描述转换为TLA可以理解的自动机的形式,这种方法可以很好地验证组合逻辑的正确性以及快速发现死锁等问题。
-
关键词
WEB服务
TLA
BPEL
Conversation模型
正确性验证
-
Keywords
Web service
TLA
BPEL
conversation model
verification
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名关于高校计算机基础课程实验的研究
被引量:1
- 3
-
-
作者
庞士焕
-
机构
安徽师范大学教育科学学院
-
出处
《电脑知识与技术》
2008年第10期151-152,共2页
-
文摘
计算机技术的迅速发展与广泛应用,已使其成为每位高校学生的必修课。计算机基础课程的实验教学具有专业性强、应用性广的重要特点。由于各院系专业多、实验内容、要求不同,怎样加强实验教学,如何科学的设计和组织实验课,将直接影响至计算机实验教学效果和学生动手能力的培养。经过多年的实践,这里总结出一套适应院系计算机基础课程的实验教学的模式,并取得较好的教学效果。
-
关键词
计算机基础课
实验模式
网络管理
-
Keywords
computer basic course
experiment teaching mode
networks manegment
-
分类号
TP308
[自动化与计算机技术—计算机系统结构]
-
-
题名关于高校院系计算机实验室管理的思考
- 4
-
-
作者
庞士焕
-
机构
安徽师范大学教育科学学院
-
出处
《科技风》
2008年第14期104-104,118,共2页
-
文摘
高校院系计算机实验室的地位和作用非常重要,其专业性、针对性更加突出,也直接影响专业教学质量的高低。因此,怎样有效地管理好院系的计算机实验室,使其充分发挥应有的作用,是许多高校计算机实验室管理人员共同关心和思考的课题。
-
关键词
高校
计算机
实验室
管理
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-