期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于长短期记忆-深度Q值网络的异构机器人煤矸协同分选方法
1
作者 张杰 夏蕊 +3 位作者 李博 王学文 李娟莉 徐文军 《中国粉体技术》 CAS CSCD 2024年第3期28-38,共11页
【目的】提高传统的单一类别煤矸分选机器人在面对形状、尺寸差异较大的矸石时的适应性,分析异构机器人工作特性,实现异构机器人协同分选。【方法】基于深度Q值网络(deep Q network,DQN)提出异构机器人协同分选模型;分析协同工作分选流... 【目的】提高传统的单一类别煤矸分选机器人在面对形状、尺寸差异较大的矸石时的适应性,分析异构机器人工作特性,实现异构机器人协同分选。【方法】基于深度Q值网络(deep Q network,DQN)提出异构机器人协同分选模型;分析协同工作分选流程制定决策框架,根据强化学习所需,设计交互环境,构建智能体连续的状态空间奖惩函数,长短期记忆网络(long short term memory,LTSM)和全连接网络相结合,构建DQN价值和目标网络,实现强化学习模型在工作过程中的任务分配。【结果】协同分选模型与传统顺序分配模型相比,在不同含矸率工作负载下,可提高分选效益0.49%~17.74%;在样本含矸率为21.61%,传送带速度为0.4~0.6 m/s的条件下,可提高分选效率2.41%~8.98%。【结论】异构机器人协同分选方法可以在不同的工作负载下获得稳定的分拣效益,避免单一分配方案无法适应动态变化的矸石流缺陷。 展开更多
关键词 异构机器人 协同分选 强化学习 长短期记忆网络 深度q值网络
下载PDF
基于DQN的反舰导弹火力分配方法研究 被引量:10
2
作者 阎栋 苏航 朱军 《导航定位与授时》 2019年第5期18-24,共7页
反舰导弹作为海上作战的主战武器,由于其精度高、射程远、威力大等特性长期以来一直被当作舰艇编队的主要防御对象。针对反舰导弹打击舰艇编队的火力分配问题,我们提出了一种基于深度Q值网络求解反舰导弹火力分配策略的算法。不同于现... 反舰导弹作为海上作战的主战武器,由于其精度高、射程远、威力大等特性长期以来一直被当作舰艇编队的主要防御对象。针对反舰导弹打击舰艇编队的火力分配问题,我们提出了一种基于深度Q值网络求解反舰导弹火力分配策略的算法。不同于现有的基于领域知识的方法,深度Q值网络无需依赖任何先验信息,就能够通过与模拟器的交互自动求解最佳的攻击策略。该算法使用深度神经网络拟合Q值函数,解决了传统强化学习中的状态空间过大无法遍历的问题。实验结果表明,在各种不同的舰队防御配置下,深度Q值网络求解得到的攻击策略均获得了最佳的毁伤效果。 展开更多
关键词 反舰导弹 目标分配 深度q值网络
下载PDF
基于变作业窗深度强化学习的舰面保障动态调度方法 被引量:4
3
作者 白天 罗永亮 +2 位作者 刘敬 常智超 王泽 《船舶工程》 CSCD 北大核心 2021年第S02期117-123,共7页
在高动态、高风险舰面保障环境下,极易发生不确定性干扰事件,这使得构建具备快速响应能力的舰面重调度模型来提升大型舰船舰载机的出动能力变得至关重要。通过分析舰面保障调度任务特点,利用变作业窗的单步推进方式,构建多作业并行执行... 在高动态、高风险舰面保障环境下,极易发生不确定性干扰事件,这使得构建具备快速响应能力的舰面重调度模型来提升大型舰船舰载机的出动能力变得至关重要。通过分析舰面保障调度任务特点,利用变作业窗的单步推进方式,构建多作业并行执行的舰面保障马尔科夫决策过程(MDP),并基于改进的深度Q值网络(Deep Q-Network,DQN)高效生成多机并行保障重调度方案。经过仿真试验验证,所提出的动态调度策略符合舰面动态调度优化需求。 展开更多
关键词 深度q值网络 强化学习 舰面保障 动态调度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部