-
题名在部分观测环境下的不确定动作模型学习
被引量:2
- 1
-
-
作者
饶东宁
蒋志华
姜云飞
-
机构
广东工业大学计算机学院
暨南大学信息科学与技术学院计算机科学系
中山大学信息科学与技术学院软件研究所
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第1期51-63,共13页
-
基金
国家自然科学基金(61100134
61003179)
广东省自然科学基金(S2011040001427)
-
文摘
近年来,动作模型学习引起了研究人员的极大兴趣.可是,尽管不确定规划已经研究了十几年,动作模型学习的研究仍然集中于经典的确定性动作模型上.提出了在部分观测环境下学习不确定动作模型的算法,该算法可应用于假定人们对转移系统一无所知的情形下进行,输入只有动作-观测序列.在现实世界中,这样的场景很常见.致力于动作是由简单逻辑结构组成的、且观测以一定频率出现的一类问题的研究.学习过程分为3个步骤:首先,计算命题在状态中成立的概率;然后,将命题抽取成效果模式,再抽取前提;最后,对效果模式进行聚类以去除冗余.在基准领域上进行的实验结果表明,动作模型学习技术可推广到不确定的部分观测环境中.
-
关键词
人工智能
自动规划
动作模型学习
不确定动作
部分观测
-
Keywords
artificial intelligence
automated planning
learning action models
non-deterministic action
partial observability
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-