检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于信任域策略优化的末制导控制量学习算法: 1; 作者刘士荣王天一刘扬《导航定位与授时》 CSCD 2022年第6期77-84,共8页; 近年来,深度强化学习在解决序列决策问题上取得了很大进展,无模型强化学习算法在与环境不断交互的过程中学习策略,不需要提前对环境建模,使其适用于许多问题。针对以往使用强化学习进行末制导策略学习的训练不稳定问题,使用信任域策略... 展开更多; 关键词末制导控制量学习算法深度强化学习末制导信任域策略优化; 下载PDF 职称材料

拦截机动目标的信赖域策略优化制导算法被引量：1: 2; 作者陈文雪高长生荆武兴《航空学报》 EI CAS CSCD 北大核心 2023年第11期277-295,共19页; 针对临近空间高超声速飞行器的高速性、机动性等特性,为提高制导算法针对不同初始状态、不同机动性目标的准确性、鲁棒性及智能性,提出一种基于信赖域策略优化(TRPO)算法的深度强化学习制导算法。基于TRPO算法的制导算法由2个策略(动作... 展开更多; 关键词深度强化学习信任域策略优化临近空间拦截导弹末制导机动目标马尔可夫过程; 原文传递

基于Kriging模型和对偶理论的无约束全局优化方法被引量：5: 3; 作者李耀辉吴义忠王书亭《计算机集成制造系统》 EI CSCD 北大核心 2017年第8期1670-1678,共9页; 针对基于Kriging模型的全局优化方法收敛速度慢、优化效率低且无法跳出局部最优区域等缺点,提出一种基于Kriging模型和对偶理论的无约束全局优化方法,引入正则对偶变化将普通Kriging模型本身的非凸优化问题转换为凸优化问题,利用基于Kri... 展开更多; 关键词无约束全局优化代理模型 KRIGING模型对偶理论信任域策略; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部