期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于遗传算法的飞机战术飞行动作决策 被引量:17
1
作者 周德云 李 锋 +1 位作者 蒲小勃 周宗锡 《西北工业大学学报》 EI CAS CSCD 北大核心 2002年第1期109-112,共4页
给出基于遗传算法的飞机战术飞行动作决策方法和算法。为提高算法的有效性,对遗传算法的操作算子进行了相应的改进,以期达到快边、准确地进行战术飞行动作的最佳化组合决策的目的。双机空战仿真结果表明了改进的遗传算法及其战术飞行... 给出基于遗传算法的飞机战术飞行动作决策方法和算法。为提高算法的有效性,对遗传算法的操作算子进行了相应的改进,以期达到快边、准确地进行战术飞行动作的最佳化组合决策的目的。双机空战仿真结果表明了改进的遗传算法及其战术飞行动作决策方法的有效性。 展开更多
关键词 战术飞行动作决策 遗传算法 空战仿真 飞机 操作算子
下载PDF
基于动作决策的机器鱼顶球算法 被引量:21
2
作者 陶金 孔峰 谢广明 《兵工自动化》 2010年第11期70-73,共4页
为了使机器鱼的顶球兼备速度性和连贯性并提高进球效率,提出一种基于动作决策的顶球算法。在分析典型的顶球算法的基础上,设计了机器鱼5种简单动作,依据机器鱼、球和对方球门的坐标几何位置关系的设计决策机制来选择机器鱼下一步动作,... 为了使机器鱼的顶球兼备速度性和连贯性并提高进球效率,提出一种基于动作决策的顶球算法。在分析典型的顶球算法的基础上,设计了机器鱼5种简单动作,依据机器鱼、球和对方球门的坐标几何位置关系的设计决策机制来选择机器鱼下一步动作,并在机器人水球比赛平台上进行了单鱼顶球实验进行算法验证。实验结果表明,该算法能大大缩短一次进球所需要的时间。 展开更多
关键词 顶球算法 机器鱼 水球比赛 动作决策
下载PDF
RoboCup中基于动作序列模型的动作决策
3
作者 丁晨阳 《微型机与应用》 2013年第7期89-91,94,共4页
RoboCup机器人足球比赛是当前人工智能领域的一个研究热点,其目的在于为多智能体系统提供一个标准的研究平台。为了让RoboCup仿真比赛中球员智能体实时地作出合理的动作决策,提出一种基于动作序列模型的决策机制,通过对球员智能体的动... RoboCup机器人足球比赛是当前人工智能领域的一个研究热点,其目的在于为多智能体系统提供一个标准的研究平台。为了让RoboCup仿真比赛中球员智能体实时地作出合理的动作决策,提出一种基于动作序列模型的决策机制,通过对球员智能体的动作空间分解、建立动作序列并对动作序列进行评价,而让智能体选择出当前最优的动作执行。仿真结果表明应用这种决策机制提高了智能体对环境的适应性。 展开更多
关键词 动作决策 ROBOCUP 动作序列模型 评价
下载PDF
基于蚁群算法的仿真机器鱼动作决策策略 被引量:1
4
作者 张纯 邓彦松 《兵工自动化》 2011年第12期83-86,90,共5页
针对仿真机器鱼非对抗赛和对抗赛情况,为使求解结果在既不依赖初始路线的选择,也不需要外界的特定干预的情况下,实现鱼快速、准确的调整,分别提出2种基于蚁群算法的动作决策策略。基于蚁群算法的分支界限法,判断机器鱼关键物理量所在分... 针对仿真机器鱼非对抗赛和对抗赛情况,为使求解结果在既不依赖初始路线的选择,也不需要外界的特定干预的情况下,实现鱼快速、准确的调整,分别提出2种基于蚁群算法的动作决策策略。基于蚁群算法的分支界限法,判断机器鱼关键物理量所在分支,自主确定当前时刻的鱼的速度和角速度档位的最优组合;而基于蚁群算法的动态规划法,在每个周期内,根据机器鱼反馈回来的动态变量及时进行自主调整。以上2种方法经2D仿真平台验证结果表明:机器鱼可根据该策略调整路径,实现速度和方向的组合优化,以最短的时间和距离找到目标点。这说明基于蚁群算法的2种动作决策策略具有很强的适应能力,满足仿真机器鱼对于动作决策的要求。 展开更多
关键词 仿真机器鱼 蚁群算法 动作决策 分支界限 动态规划
下载PDF
由感知到动作决策一体化的类脑导航技术研究现状与未来发展 被引量:12
5
作者 杨闯 刘建业 +2 位作者 熊智 赖际舟 熊骏 《航空学报》 EI CAS CSCD 北大核心 2020年第1期30-44,共15页
随着脑与神经科学以及人工智能技术的持续发展,昆虫和哺乳动物大脑导航机理启发下的感知/认知/路径规划/动作决策一体化类脑导航技术得到了较大发展,可以实现由原始感知信息输入到导航动作决策的直接输出,呈现出接近动物端到端面向目标... 随着脑与神经科学以及人工智能技术的持续发展,昆虫和哺乳动物大脑导航机理启发下的感知/认知/路径规划/动作决策一体化类脑导航技术得到了较大发展,可以实现由原始感知信息输入到导航动作决策的直接输出,呈现出接近动物端到端面向目标导航的智能行为,具有提高密集型无人机集群导航鲁棒性、准确性、实时响应动作、自主智能性以及计算效率的潜力。阐述了昆虫和哺乳动物大脑导航机理及其互补对称关系,以及昆虫和哺乳动物大脑导航机理启发的端到端类脑导航技术内涵;论述了类脑导航技术研究进展,包括类脑环境感知、类脑空间认知、面向目标类脑导航;分析了类脑导航向智能化、神经形态系统以及群体导航发展的新趋势;最后讨论了类脑导航技术应用于无人机密集集群系统时存在的挑战。 展开更多
关键词 类脑导航 感知与动作决策一体化 大脑导航 神经形态系统 类脑集群导航 无人机密集集群 人工智能
原文传递
基于极限学习机的仿真机器鱼动作策略 被引量:1
6
作者 彭泽荣 张学习 王建桦 《电子世界》 2017年第4期17-18,共2页
针对URWPGSim2D仿真平台,为实现机器鱼快速、准确的调整,本文将机器鱼的状态定义为"调整"和"推球",并提出基于极限学习机的动作决策模型,利用此模型自主选择相应的动作策略。动作决策模型根据当前时刻周围的环境信... 针对URWPGSim2D仿真平台,为实现机器鱼快速、准确的调整,本文将机器鱼的状态定义为"调整"和"推球",并提出基于极限学习机的动作决策模型,利用此模型自主选择相应的动作策略。动作决策模型根据当前时刻周围的环境信息,利用极限学习机确定机器鱼的状态,自主选择当前时刻的最优击球点,并确定机器鱼速度和角速度档位的最优组合。经URWPGSim2D仿真平台验证结果表明:机器鱼可根据策略调整路径,选择合适的动作策略,以更少的时间代价完成比赛。这说明基于极限学习机的动作决策策略能充分考虑机器鱼和水球的实时信息,在不同情况下选择不同的策略,具有很强的适应能力,满足仿真机器鱼对于动作决策的要求。 展开更多
关键词 URWPGSim2D仿真 机器鱼 极限学习机 动作决策
下载PDF
基于Multi-Agent异步深度强化学习的居民住宅能耗在线优化调度研究 被引量:24
7
作者 张虹 申鑫 +2 位作者 穆昊源 刘艾冬 王鹤 《中国电机工程学报》 EI CSCD 北大核心 2020年第1期117-127,共11页
为促进居民用户柔性负荷高效参与需求响应,帮助用户从被动角色转变为主动角色,实现需求侧最大效益。该文在智能电网环境下,根据用电设备的特性,以概率论的角度对家电设备状态进行描述定义,基于异步深度强化学习(asynchronous deep reinf... 为促进居民用户柔性负荷高效参与需求响应,帮助用户从被动角色转变为主动角色,实现需求侧最大效益。该文在智能电网环境下,根据用电设备的特性,以概率论的角度对家电设备状态进行描述定义,基于异步深度强化学习(asynchronous deep reinforcement learning,ADRL)进行家庭能源管理系统调度的在线优化。学习过程采用异步优势演员–评判家(asynchronous advantage actor-critic,A3C)方法,联合用户历史用电设备运行状态的概率分布,通过多智能体利用CPU多线程功能同时执行多个动作的决策。该方法在包括光伏发电、电动汽车和居民住宅电器设备信息的某高维数据库上进行仿真验证。最后通过不同住宅情境下的优化决策效果对比分析可知,所提在线能耗调度策略可用于向电力用户提供实时反馈,以实现用户用电经济性目标。 展开更多
关键词 异步优势演员-评判家 需求响应 概率分布 在线优化 多智能体 动作决策
下载PDF
事件驱动的强化学习多智能体编队控制 被引量:9
8
作者 徐鹏 谢广明 +1 位作者 文家燕 高远 《智能系统学报》 CSCD 北大核心 2019年第1期93-98,共6页
针对经典强化学习的多智能体编队存在通信和计算资源消耗大的问题,本文引入事件驱动控制机制,智能体的动作决策无须按固定周期进行,而依赖于事件驱动条件更新智能体动作。在设计事件驱动条件时,不仅考虑智能体的累积奖赏值,还引入智能... 针对经典强化学习的多智能体编队存在通信和计算资源消耗大的问题,本文引入事件驱动控制机制,智能体的动作决策无须按固定周期进行,而依赖于事件驱动条件更新智能体动作。在设计事件驱动条件时,不仅考虑智能体的累积奖赏值,还引入智能体与邻居奖赏值的偏差,智能体间通过交互来寻求最优联合策略实现编队。数值仿真结果表明,基于事件驱动的强化学习多智能体编队控制算法,在保证系统性能的情况下,能有效降低多智能体的动作决策频率和资源消耗。 展开更多
关键词 强化学习 多智能体 事件驱动 编队控制 马尔可夫过程 集群智能 动作决策 粒子群算法
下载PDF
分层决策多机空战对抗方法 被引量:3
9
作者 王欢 周旭 +1 位作者 邓亦敏 刘小峰 《中国科学:信息科学》 CSCD 北大核心 2022年第12期2225-2238,共14页
在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练... 在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现. 展开更多
关键词 多机空战 动作决策网络 博弈 分层强化学习 决策收益
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部