期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
动态不确定环境下的决策:一种分层决策模型 被引量:1
1
作者 杨洋 陈小平 《计算机科学》 CSCD 北大核心 2005年第1期151-154,共4页
本文提出一种智能体分层决策结构模型,试图通过分层决策技术有效地解决动态、不确定环境中的智能体的实时决策问题。本模型的高层采用BDI结构,以便为较长期任务的规划和推理提供充分的支持;模型的底层采用反应式结构,以保证对短期实时... 本文提出一种智能体分层决策结构模型,试图通过分层决策技术有效地解决动态、不确定环境中的智能体的实时决策问题。本模型的高层采用BDI结构,以便为较长期任务的规划和推理提供充分的支持;模型的底层采用反应式结构,以保证对短期实时任务的及时响应。实验结果表明了这种分层模型在某些复杂任务领域中的有效性。 展开更多
关键词 智能主体 动态不确定环境 信念-愿望-意图 BDI ROBOCUP 分层决策模型
下载PDF
基于兵棋推演的空战编组对抗智能决策方法
2
作者 陈晓轩 冯旸赫 +2 位作者 黄金才 刘忠 徐越 《指挥与控制学报》 CSCD 北大核心 2024年第2期213-219,共7页
基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大... 基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大时,算法收敛慢,且对仿真平台有较高的要求。针对上述问题,提出了一种融合知识数据和强化学习的空战编组对抗智能决策方法,该决策方法的输入是战场融合态势,使用分层决策框架控制算子选择并执行任务,上层包含使用专家知识驱动的动作选择器,下层包含使用专家知识和作战规则细化的避弹动作执行器、侦察动作执行器和使用强化学习算法控制的打击动作执行器。最后基于典型作战场景进行实验,验证了该方法的可行性和实用性,且具有建模准确、训练高效的优点。 展开更多
关键词 空战编组对抗 多算子的协作与控制 多智能体深度强化学习算法 分层决策模型
下载PDF
基于分层POMDP的智能轮椅行为控制方法 被引量:3
3
作者 陶永 王田苗 +1 位作者 魏洪兴 陈殿生 《高技术通讯》 CAS CSCD 北大核心 2010年第6期613-617,共5页
针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综... 针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综合了动作的不确定性和状态的部分可观测性,通过对环境的观测和信息的采集,得到不确定环境下的最优策略选择,进而选择相应的最优动作,从而提高了动作的执行效率。在室内家居环境下进行的交互任务与导航控制试验以及对实验结果进行的分析验证了这一方法的实时性、有效性和可靠性。 展开更多
关键词 智能轮椅 行为控制方法 分层的部分可观测马尔可夫决策过程(POMDP)模型
下载PDF
中职分层教学模式构建与实证研究 被引量:3
4
作者 邱爽 潘伟 《职业技术教育》 北大核心 2022年第20期35-40,共6页
当前中职传统班级教学模式忽视了学生的个体差异,导致学生创新精神和实践能力整体呈现不足,变革传统教学模式成为必然趋势。依据学生在能力水平、学习兴趣以及学习风格等方面存在的个体差异,构建了技术融合的分层教学模式,一方面能够满... 当前中职传统班级教学模式忽视了学生的个体差异,导致学生创新精神和实践能力整体呈现不足,变革传统教学模式成为必然趋势。依据学生在能力水平、学习兴趣以及学习风格等方面存在的个体差异,构建了技术融合的分层教学模式,一方面能够满足不同层次学生的学习需求,另一方面能够让教师根据学生差异灵活选择不同的教学方法。以中职《基础会计》课程为例,从实践层面验证了分层教学模式的有效性。 展开更多
关键词 中职教学 分层教学模式 分层教学策略 分层教学应用决策模型 实证研究
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部