-
题名从规划解中学习一阶派生谓词规则
被引量:11
- 1
-
-
作者
饶东宁
蒋志华
姜云飞
刘强
-
机构
广东工业大学计算机学院
中山大学信息科技学院软件研究所
暨南大学计算机科学系
-
出处
《计算机学报》
EI
CSCD
北大核心
2010年第2期251-266,共16页
-
基金
国家自然科学基金(60173039)
广东工业大学博士启动基金项目(093032)资助~~
-
文摘
派生谓词是描述动作非直接效果的主要方式.但是由人类专家设计的派生谓词规则(即领域理论)不能保证总是正确或者完备的,因此有时很难解释一个观察到的规划解为什么是有效的.结合归纳学习与分析学习的优点,文中提出一种称为FODRL(First-Order Derived Rules Learning)的算法,在不完美的初始领域理论的引导下从观察到的规划解中学习一阶派生谓词规则.FODRL基于归纳学习算法FOIL(First-Order Inductive Learning),最主要的改进是可以使用派生谓词的激活集来扩大搜索步,从而提高学习到的规则的精确度.学习过程分为两个步骤:先从规划解中提取训练例,然后学习能够最好拟合训练例和初始领域理论的一阶规则集.在PSR和PROME-LA两个派生规划领域进行实验,结果表明,在大部分情况下FODRL比FOIL(甚至包括其变型算法FOCL)学习到的规则的精确度都要高.
-
关键词
人工智能
智能规划
派生谓词规则
归纳学习
激活集
-
Keywords
artificial intelligence
automated planning
derived predicate rules
inductive learning
activation set
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名利用派生谓词和偏好处理OSP问题的目标效益依赖
- 2
-
-
作者
蒋志华
饶东宁
姜云飞
翁健
-
机构
暨南大学信息科学技术学院计算机科学系
广东工业大学计算机学院
中山大学信息科学技术学院软件研究所
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第3期439-450,共12页
-
基金
国家自然科学基金(61100134
61003179
+1 种基金
60903178)
广东省自然科学基金(S2011040001427)
-
文摘
在过度规划问题(over-subscribed planning,简称OSP)研究中,如果目标之间不是相互独立的,那么目标间的效益依赖比单个目标效益更能提高规划解的质量.但是已有的描述模型不符合标准规划描述语言(planningdomain description language,简称PDDL)的语法规范,不能在一般的OSP规划系统上进行推广.提出了用派生谓词规则和目标偏好描述效益依赖的方法,这二者均为PDDL语言的基本要素.实质上,将已有的GAI模型转换为派生谓词规则和目标偏好,其中派生谓词规则显式描述目标子集的存在条件,偏好机制用来表示目标子集的效益,二者缺一不可.该转换算法既可以保持在描述依赖关系时GAI模型的易用性和直观性上,又可以扩展一般的OSP规划系统处理目标效益依赖的能力.从理论上可以证明该算法在转换过程中的语义不变性,在基准领域的实验结果表明其可行性和对规划解质量的改善能力.提出符合PDDL语言规范的目标效益依赖关系的描述形式,克服了已有模型不通用的缺点.
-
关键词
人工智能
智能规划
过度规划问题
目标效益依赖
派生谓词规则
偏好
-
Keywords
artificial intelligence (AI)
automated planning
over-subscribed planning (OSP)
goal utilitydependency
derived predicate rules
preference
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-