期刊文献+
共找到141篇文章
< 1 2 8 >
每页显示 20 50 100
NONMONOTONIC REDUCED PROJECTED HESSIAN METHOD VIA AN AFFINE SCALING INTERIOR MODIFIED GRADIENT PATH FOR BOUNDED-CONSTRAINED OPTIMIZATION 被引量:4
1
作者 Peihua GUO Detong ZHU 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2008年第1期85-113,共29页
The authors propose an affine scaling modified gradient path method in association with reduced projective Hessian and nonmonotonic interior backtracking line search techniques for solving the linear equality constrai... The authors propose an affine scaling modified gradient path method in association with reduced projective Hessian and nonmonotonic interior backtracking line search techniques for solving the linear equality constrained optimization subject to bounds on variables. By employing the QR decomposition of the constraint matrix and the eigensystem decomposition of reduced projective Hes- sian matrix in the subproblem, the authors form affine scaling modified gradient curvilinear path very easily. By using interior backtracking line search technique, each iterate switches to trial step of strict interior feasibility. The global convergence and fast local superlinear/quadratical convergence rates of the proposed algorithm are established under some reasonable conditions. A nonmonotonic criterion should bring about speeding up the convergence progress in some ill-conditioned cases. The results of numerical experiments are reported to show the effectiveness of the proposed algorithm. 展开更多
关键词 Affine scaling convergence interior point modified gradient path nonmonotonic technique QR decomposition.
原文传递
AN AFFINE SCALING INTERIOR ALGORITHM VIA CONJUGATE GRADIENT PATH FOR SOLVING BOUND-CONSTRAINED NONLINEAR SYSTEMS
2
作者 Chunxia Jia Detong Zhu 《Journal of Computational Mathematics》 SCIE EI CSCD 2008年第4期578-597,共20页
In this paper we propose an affine scaling interior algorithm via conjugate gradient path for solving nonlinear equality systems subject to bounds on variables. By employing the affine scaling conjugate gradient path ... In this paper we propose an affine scaling interior algorithm via conjugate gradient path for solving nonlinear equality systems subject to bounds on variables. By employing the affine scaling conjugate gradient path search strategy, we obtain an iterative direction by solving the linearize model. By using the line search technique, we will find an acceptable trial step length along this direction which is strictly feasible and makes the objective func- tion nonmonotonically decreasing. The global convergence and fast local convergence rate of the proposed algorithm are established under some reasonable conditions. Furthermore, the numerical results of the proposed algorithm indicate to be effective. 展开更多
关键词 Conjugate gradient path Interior points Affine scaling.
原文传递
不同地形梯度下秦巴山区乡村振兴潜力及发展路径
3
作者 员学锋 安健吉 +2 位作者 杨悦 马超群 王晓峰 《地球科学与环境学报》 CAS 北大核心 2024年第1期1-13,共13页
我国山地丘陵地区在空间上相对孤立,乡村发展受到阻碍。开展不同地形梯度下乡村振兴潜力及发展路径研究,旨在为山区因地制宜推进乡村振兴提供理论与科学依据。基于陕南秦巴山区地形差异开展典型村域调研,构建评价指标体系测度乡村振兴潜... 我国山地丘陵地区在空间上相对孤立,乡村发展受到阻碍。开展不同地形梯度下乡村振兴潜力及发展路径研究,旨在为山区因地制宜推进乡村振兴提供理论与科学依据。基于陕南秦巴山区地形差异开展典型村域调研,构建评价指标体系测度乡村振兴潜力,结合相关性与障碍度模型,辨识不同地形梯度下乡村振兴的障碍因素,提出差异化发展建议。结果表明:①各地形梯度下乡村振兴综合潜力由大到小依次为低地形梯度、中低地形梯度、高地形梯度、中高地形梯度,地形梯度与秦巴山区乡村振兴综合潜力及区位条件、基础设施潜力成显著负相关关系;②随着地形梯度的上升,秦巴山区乡村主体、产业发展、人居环境、区位条件、基础设施潜力整体上呈减小趋势,资源禀赋潜力先减小后增大;③不同地形梯度下秦巴山区乡村振兴各维度潜力大小及其障碍因子皆存在明显差异。为优化山区乡村发展模式、全面推进乡村振兴,建议低地形梯度村庄重点防止人口、耕地等农业生产要素流失,中低地形梯度村庄优化基层组织、提升引领能力,中高梯度村庄加强基础设施建设、改善人居环境,高地形梯度村庄充分保护并合理利用林地资源,发展特色产业。 展开更多
关键词 乡村振兴 地形梯度 发展路径 熵权法 地形位指数 相关性 障碍度模型 秦巴山区
下载PDF
基于优化快速搜索随机树算法的全局路径规划 被引量:2
4
作者 杨炜 谭亮 +2 位作者 孙雪 杜亚峰 周晓冰 《汽车技术》 CSCD 北大核心 2024年第3期31-36,共6页
为了改善传统快速搜索随机树(RRT)算法在全局路径规划中存在的平滑度差、具有潜在碰撞性等问题,提出了一种双重优化的RRT算法。在传统RRT算法基础上,引入自适应目标偏向策略以缩短采样时间,引入角度约束采样策略以适应车辆极限转角。得... 为了改善传统快速搜索随机树(RRT)算法在全局路径规划中存在的平滑度差、具有潜在碰撞性等问题,提出了一种双重优化的RRT算法。在传统RRT算法基础上,引入自适应目标偏向策略以缩短采样时间,引入角度约束采样策略以适应车辆极限转角。得到初始路径后,建立二项优化函数(即降低路径曲率和远离障碍物),并将其作为基点进行梯度下降二次优化,生成可供车辆行驶、平滑性良好且碰撞概率低的路径,并进行仿真验证。结果表明:优化RRT算法相比于传统RRT算法、RRT-Connect算法和RRT算法,平均曲率分别降低了38.1%、36.4%和24.7%,曲率均方差分别降低了38.4%、38.4%和27.2%。 展开更多
关键词 快速搜索随机树 全局路径规划 避障 梯度下降法
下载PDF
执行时间预测驱动的工作流作业调度
5
作者 胡亚红 邱圆圆 毛家发 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期228-238,共11页
针对工作流作业调度问题,提出使用关键路径法进行工作流的执行时间预测和资源分配。工作流执行时间预测算法使用并行应用有向无环图描述工作流中子作业的执行顺序。基于此顺序,为子作业进行系统资源的逻辑分配。根据子作业的特征和资源... 针对工作流作业调度问题,提出使用关键路径法进行工作流的执行时间预测和资源分配。工作流执行时间预测算法使用并行应用有向无环图描述工作流中子作业的执行顺序。基于此顺序,为子作业进行系统资源的逻辑分配。根据子作业的特征和资源分配信息,使用梯度提升决策树进行子作业执行时间预测,并计算工作流的关键路径。关键路径上所有子作业的完成时间之和即为工作流的执行时间。若预测的工作流执行时间满足用户要求,则根据子作业执行顺序和资源分配方案进行作业调度,执行工作流。对比实验表明,两个工作流的执行时间预测误差分别为5.72%和1.57%。与Spark默认调度算法相比,工作流调度算法将两个工作流的完成时间分别缩短了15.71%和15.44%。 展开更多
关键词 工作流 时间预测 关键路径 调度算法 梯度提升决策树
下载PDF
结合SVM与XGBoost的链式多路径覆盖测试用例生成
6
作者 钱忠胜 俞情媛 +3 位作者 张丁 姚昌森 秦朗悦 成轶伟 《软件学报》 EI CSCD 北大核心 2024年第6期2795-2820,共26页
机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借... 机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借助遗传算法实现多路径测试数据生成.首先,利用一定样本训练若干个用于预测路径节点状态的子模型(SVM和XGBoost),通过子模型的预测精度值筛选最优子模型,并根据路径节点顺序将其依次链接,形成一个链式模型C-SVMXGBoost(chained SVM and XGBoost).在利用遗传算法生成测试用例时,使用训练好的链式模型代替插桩法获取测试数据覆盖路径(预测路径),寻找预测路径与目标路径相似的路径集,对存在相似路径集的预测路径进行插桩验证,获取精确路径,计算适应度值.在交叉变异过程中引入样本集中路径层级深度较大的优秀测试用例进行重用,生成覆盖目标路径的测试数据.最后,保留进化生成中产生的适应度较高的个体,更新链式模型C-SVMXGBoost,进一步提高测试效率.实验表明,C-SVMXGBoost较其他各对比链式模型更适合解决路径预测问题,可提高测试效率.并且通过与已有经典方法相比,所提方法在覆盖率上提高可达15%,平均进化代数也有所降低,在较大规模程序上其降低百分比可达65%. 展开更多
关键词 测试用例 SVM XGBoost 链式模型 多路径覆盖
下载PDF
基于深度强化学习的无人驾驶路径规划研究
7
作者 赵天亮 张小俊 +1 位作者 张明路 陈建文 《河北工业大学学报》 CAS 2024年第4期21-30,共10页
针对深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法在训练神经网络时出现收敛不稳定、学习效率低等问题,提出了一种基于奖励指导的深度确定性策略梯度(Reward Guidance DDPG,RG_DDPG)算法。该算法在回合内创建优秀... 针对深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法在训练神经网络时出现收敛不稳定、学习效率低等问题,提出了一种基于奖励指导的深度确定性策略梯度(Reward Guidance DDPG,RG_DDPG)算法。该算法在回合内创建优秀经验集合,便于指导智能汽车充分利用过往有效信息,得到稳定的控制策略;采用基于奖励的优先经验回放机制,打破数据之间的关联性,提高数据的利用率,减少搜索过程的盲目性,提高算法的收敛稳定性。基于ROS(Robot Operating System)操作系统对算法进行了验证。在Gazebo建模软件中,设计了智能汽车模型以及障碍物环境,利用决策算法规划智能汽车的安全行驶路径。数据结果验证了RG_DDPG算法在处理路径规划任务的有效性,相比于DDPG算法,改进后智能汽车的车速能够提升60.5%,获取奖励提升一倍多,算法的收敛稳定性更好。最后通过实车实验验证了该算法的实用性。 展开更多
关键词 智能汽车 无人驾驶 路径规划 深度确定性策略梯度 奖励指导
下载PDF
基于人工势场引力因子的机械臂避障规划算法
8
作者 苗田恬 方厚招 +3 位作者 安康 孙延博 方祖华 管西强 《计算机工程与设计》 北大核心 2024年第2期578-586,共9页
针对机械臂的安全避障问题,提出一种基于人工势场引力因子的机械臂最短避障路径规划模型。研究算法中各个参数对机械臂末端运动路径的影响;构建引力因子,提出一种基于引力因子的最短避障路径规划模型,利用梯度下降法求解机械臂末端的最... 针对机械臂的安全避障问题,提出一种基于人工势场引力因子的机械臂最短避障路径规划模型。研究算法中各个参数对机械臂末端运动路径的影响;构建引力因子,提出一种基于引力因子的最短避障路径规划模型,利用梯度下降法求解机械臂末端的最短避障路径及其最优解;研究分析不同障碍物大小和位置的最短路径特征,以工业SCARA机器人的平面模型分析关节角度路径特征。实验结果表明,模型参数决定避障路径的弧度变化。所提算法能够适应障碍物位置和大小的变化,使机械臂末端以最短路径避障的同时,其运动轨迹可以与障碍物相切。 展开更多
关键词 引力因子 人工势场 最短路径 机械臂 梯度下降法 避障 最优解
下载PDF
自动驾驶路径优化的RF-DDPG车辆控制算法研究
9
作者 焦龙飞 谷志茹 +2 位作者 舒小华 袁鹏 王建斌 《湖南工业大学学报》 2024年第1期62-69,共8页
针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法... 针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法的奖励函数,以此优化DDPG的参数,达到所需跟踪精度及稳定性。并且采用aopllo自动驾驶仿真平台,对原始的DDPG算法和改进的RF-DDPG路径跟踪控制算法进行了仿真实验。研究结果表明,所提出的RF-DDPG算法在路径跟踪精度以及鲁棒性能等方面均优于DDPG算法。 展开更多
关键词 自动驾驶 路径跟踪 深度强化学习 路径控制 DDPG算法
下载PDF
基于MATLAB改进Canny算子边缘检测路径提取立交桥曲线的研究
10
作者 李靖铭 毛世华 +2 位作者 王锲 林子扬 姜华根 《测绘与空间地理信息》 2024年第1期32-35,共4页
针对工程项目中涉及的遥感影像图、航摄正射影像图,基于MATLAB程序设计研究改进后的Canny算子在立交桥曲线提取的应用。通过图像增强、线性与非线性处理相结合、形态学处理以及梯度倒数加权平滑针对像素点创建结构元素修改边缘检测路径... 针对工程项目中涉及的遥感影像图、航摄正射影像图,基于MATLAB程序设计研究改进后的Canny算子在立交桥曲线提取的应用。通过图像增强、线性与非线性处理相结合、形态学处理以及梯度倒数加权平滑针对像素点创建结构元素修改边缘检测路径,较初始检测算法得到更具实用性的目标提取对象,改进的提取程序能有效滤除目标对象周围非目标提取物干扰,提取指向性显著提高。提出以像素点提取参考点范围坐标的思路,以点位中误差为基准计算提取精度,成果能满足工程中1∶1000比例尺下的生产应用,将程序封装在GUI界面中提供模块化处理和成果输出。 展开更多
关键词 公路桥梁 边缘检测路径 MATLAB提取 梯度倒数加权 GUI界面设计
下载PDF
自注意力机制结合DDPG的机器人路径规划研究
11
作者 王凤英 陈莹 +1 位作者 袁帅 杜利明 《计算机工程与应用》 CSCD 北大核心 2024年第19期158-166,共9页
为更好解决深度确定性策略梯度算法在路径规划中存在样本利用率低、奖励稀疏、网络模型稳定速度慢等问题,提出了一种改进DDPG的算法。通过对机器人相机传感器获取图片信息加入自注意力机制,利用Dotproduct方法计算图片之间的相关性,能... 为更好解决深度确定性策略梯度算法在路径规划中存在样本利用率低、奖励稀疏、网络模型稳定速度慢等问题,提出了一种改进DDPG的算法。通过对机器人相机传感器获取图片信息加入自注意力机制,利用Dotproduct方法计算图片之间的相关性,能够将较高权重精确聚焦在障碍物信息中。在复杂环境中,由于机器人缺乏经验导致难以获得正反馈的奖励,影响了机器人的探索能力。将DDPG算法与HER结合,提出DDPG-HER算法,有效利用正负反馈使机器人从成功和失败的经历中均可学习到适当奖励。通过Gazebo搭建静态和动态仿真环境进行训练和测试,实验结果表明所提出的算法能显著提高样本利用率,加快网络模型稳定的速度,解决奖励稀疏的问题,使机器人在环境未知的路径规划中能够高效地避开障碍物到达目标点。 展开更多
关键词 深度强化学习 深度确定性策略梯度算法(DDPG) 后见经验算法(HER) 自注意力机制 机器人路径规划
下载PDF
基于扰动流体与TD3的无人机路径规划算法
12
作者 陈康雄 刘磊 《电光与控制》 CSCD 北大核心 2024年第1期57-62,共6页
针对双延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动... 针对双延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动态未知环境下的无人机路径规划问题,实现了无人机路径规划方案的快速收敛。仿真结果表明,对算法的改进可大幅提升网络训练效率,且能在保证避障实时性的前提下,满足航迹质量需求,为路径规划任务中应用深度强化学习提供了新思路。 展开更多
关键词 无人机 路径规划 双延迟深度确定性策略梯度算法 深度强化学习 扰动流体动态系统
下载PDF
基于DDPG算法的海运船舶避碰路径规划方法
13
作者 初文忠 《科技通报》 2024年第8期51-54,共4页
针对多船舶会遇情况,以提高避碰路径规划能力,本文提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的海运船舶避碰路径规划方法。利用栅格法建立船舶航行路线的静态全局环境,并利用人工蜂群算法设计静态... 针对多船舶会遇情况,以提高避碰路径规划能力,本文提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,DDPG)的海运船舶避碰路径规划方法。利用栅格法建立船舶航行路线的静态全局环境,并利用人工蜂群算法设计静态初始路径。针对多船会遇情况,计算海运船舶与其他船舶发生碰撞的危险程度,以危险程度作为DDPG算法的输入参数,通过训练与学习输出海运船舶避碰路径的规划结果。实验表明:经过本文方法的规划后,海运船舶安全避开了另外三艘船舶,未发生碰撞事故,安全到达目标点,证明本文方法规划的线路避碰性能更强,提高了海运船舶航行的安全性。 展开更多
关键词 深度确定策略梯度算法 海运船舶 静态初始路径 碰撞危险程度 避碰路径 路径规划
下载PDF
基于MADDPG的多AGVs路径规划算法
14
作者 尹华一 尤雅丽 +1 位作者 黄新栋 段青娜 《厦门理工学院学报》 2024年第1期37-46,共10页
针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函... 针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函数和网络结构重新设计MADDPG算法的模型结构,通过OpenAI Gym接口搭建二维仿真环境用作多AGVs (agents)的训练平台。实验结果表明,相比于深度确定性策略梯度(DDPG)算法和双延迟深度确定性策略梯度(TD3)算法,基于MADDPG的多AGVs路径规划算法在智能仓储仿真环境下,多AGVs碰到货架的次数分别减少了21.49%、11.63%,碰到障碍物的次数分别减少了14.69%、10.12%,全部AGVs到达货物装卸点的成功率分别高出了17.22%、10.53%,表明学习后的AGV具有更高效的在线决策能力和自适应能力,能够找到较优的路径。 展开更多
关键词 自动导引车系统(AGVs) 路径规划 多智能体深度确定性策略梯度(MADDPG)算法 深度强化学习 多智能体
下载PDF
基于改进TD3的欠驱动无人水面艇路径跟踪控制
15
作者 曲星儒 江雨泽 +2 位作者 李初 龙飞飞 张汝波 《上海海事大学学报》 北大核心 2024年第3期1-9,共9页
针对模型参数未知和海洋环境干扰下的欠驱动无人水面艇(unmanned surface vehicles,USV)路径跟踪问题,提出一种基于改进双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)的控制方法。在运动学层次上,设... 针对模型参数未知和海洋环境干扰下的欠驱动无人水面艇(unmanned surface vehicles,USV)路径跟踪问题,提出一种基于改进双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)的控制方法。在运动学层次上,设计基于视线制导的航速航向联合制导律,引导USV准确跟踪期望路径。在动力学层次上,设计基于改进TD3的强化学习动力学控制器;采用基于时间差分误差的优先经验回放技术,建立包含路径跟踪成功和失败采样信息的双经验池,通过自适应比例系数调整每批次回放数据的组成结构;搭建包含长短期记忆网络的评价网络和策略网络,利用历史状态序列信息提高路径跟踪控制器的训练效率。仿真结果表明,基于改进TD3的控制方法可有效提高欠驱动USV的跟踪精度。该方法不依赖USV模型,可为USV路径跟踪控制提供参考。 展开更多
关键词 无人水面艇 路径跟踪控制 双延迟深度确定性策略梯度 优先经验回放 长短期记忆网络
下载PDF
主镜组件热光学特性分析与热控技术研究
16
作者 左晓舟 王惠林 +4 位作者 周云 惠刚阳 张云龙 赵红军 余炳伟 《应用光学》 CAS 北大核心 2023年第3期500-506,共7页
针对共光路系统对环境温度的适应性问题,以温度-光学变形特性研究为基础,提出了一种基于综合传热的主镜组件分区域热控方法。建立了主镜组件的传热模型并分析了典型热控工况下的温度分布特性;对不同材质的主镜进行了热仿真,以热光学试... 针对共光路系统对环境温度的适应性问题,以温度-光学变形特性研究为基础,提出了一种基于综合传热的主镜组件分区域热控方法。建立了主镜组件的传热模型并分析了典型热控工况下的温度分布特性;对不同材质的主镜进行了热仿真,以热光学试验结果修正模型,使主镜温度场的仿真与实测结果绝对偏差小于1.4℃,同时确定了主镜组件的温度梯度控制阈值;采用分区传热策略,使主镜组件达到高温升水平、低温度梯度的热控目标。以某主镜组件为对象进行了仿真与试验:当主镜平均温升达到16℃以上时,镜体轴向温度梯度≤2.5℃,径向与周向温度梯度≤2.4℃,主镜面形变化量小于0.005λ,该结果可为共光路系统的整体热控方案设计提供优化思路。 展开更多
关键词 共光路系统 主反射镜 温度梯度 热控
下载PDF
基于梯度统计变异量子遗传算法的车辆路径规划
17
作者 李晖 秦慧萍 +1 位作者 卢凯 韩子傲 《计算机系统应用》 2023年第12期161-170,共10页
针对传统路径规划算法收敛速度慢、稳定性差、易陷入局部极值的问题,提出一种基于梯度统计变异量子遗传算法的车辆路径规划方法.首先在依据染色体适应度值动态调整旋转角步长的基础上,引入梯度下降思想对量子旋转门调整策略进行改进;根... 针对传统路径规划算法收敛速度慢、稳定性差、易陷入局部极值的问题,提出一种基于梯度统计变异量子遗传算法的车辆路径规划方法.首先在依据染色体适应度值动态调整旋转角步长的基础上,引入梯度下降思想对量子旋转门调整策略进行改进;根据染色体变化趋势的统计特性,设计基于梯度统计的变异算子实现变异操作,提出基于量子位概率密度的自适应变异策略;以路径最短为指标建立车辆路径规划模型,通过仿真实验验证改进算法在车辆路径规划中的有效性,与其他优化算法相比,本文改进算法所规划路径长度更短,搜索稳定性更好,能有效控制算法陷入局部最优. 展开更多
关键词 量子遗传算法 路径规划 梯度下降 自适应变异算子 量子旋转门 变异策略
下载PDF
基于强化学习的改进三维A^(*)算法在线航迹规划 被引量:4
18
作者 任智 张栋 唐硕 《系统工程与电子技术》 EI CSCD 北大核心 2023年第1期193-201,共9页
针对飞行器在线航迹规划对算法实时性与结果最优性要求高的问题,基于强化学习方法改进三维A^(*)算法。首先,引入收缩因子改进代价函数的启发信息加权方法提升算法时间性能;其次,建立算法实时性与结果最优性的性能变化度量模型,结合深度... 针对飞行器在线航迹规划对算法实时性与结果最优性要求高的问题,基于强化学习方法改进三维A^(*)算法。首先,引入收缩因子改进代价函数的启发信息加权方法提升算法时间性能;其次,建立算法实时性与结果最优性的性能变化度量模型,结合深度确定性策略梯度方法设计动作-状态与奖励函数,对收缩因子进行优化训练;最后,在多场景下对改进后的三维A^(*)算法进行仿真验证。仿真结果表明,改进算法能够在保证航迹结果最优性的同时有效提升算法时间性能。 展开更多
关键词 改进A^(*)算法 收缩因子 强化学习 深度确定性策略梯度 在线航迹规划
下载PDF
基于深度强化学习的机械臂避障轨迹规划研究 被引量:1
19
作者 曹毅 郭银辉 +2 位作者 李磊 朱柏宇 赵治华 《机械传动》 北大核心 2023年第12期40-46,96,共8页
针对传统路径规划算法在机械臂避障运动时存在规划时间长、路径冗长等问题,提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的运动规划方法。首先,构建了机械臂数学模型和运动环境,并在PyBullet中搭建了DOBOT机械臂与操... 针对传统路径规划算法在机械臂避障运动时存在规划时间长、路径冗长等问题,提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的运动规划方法。首先,构建了机械臂数学模型和运动环境,并在PyBullet中搭建了DOBOT机械臂与操作环境,设置了DRL所需的奖励函数、动作变量和状态变量等参数。其次,针对静态障碍物规避问题的特点,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法,进行了运动仿真试验。仿真结果表明,相较于快速扩展随机树(Rapid-exploring Random Tree,RRT)算法以及改进RRT算法,所提出的DDPG算法在规划时间和路径长度方面均有一定程度提高。最后,在实验室中采用DOBOT机械臂对DDPG算法在多种障碍物环境下避障操作的有效性进行了验证。 展开更多
关键词 机械臂 深度强化学习 避障路径规划 深度确定性策略梯度算法
下载PDF
中小型共光路系统支撑结构设计和分析
20
作者 杨晓强 陶忠 刘莹奇 《应用光学》 CAS 北大核心 2023年第5期998-1009,共12页
主、次镜支撑技术是共光路光学系统的关键技术之一。针对在±60℃温度变化范围内工作的机载共光路光学系统,根据热膨胀系数匹配原则分别选择殷钢和ULE、钛合金和K9配对作为主、次镜及支撑结构的材料,并设计了高刚度无热化柔性支撑... 主、次镜支撑技术是共光路光学系统的关键技术之一。针对在±60℃温度变化范围内工作的机载共光路光学系统,根据热膨胀系数匹配原则分别选择殷钢和ULE、钛合金和K9配对作为主、次镜及支撑结构的材料,并设计了高刚度无热化柔性支撑结构。最后,利用自研的光机联合仿真程序对主、次镜面型及整个光学系统的成像质量进行了光机一体化分析。分析结果表明:殷钢和ULE配对时,在±60℃均匀温差和10℃轴向、径向温度梯度下,主、次镜去除离焦后面型优于(1/100)λ,整个光学系统点列图RMS半径小于艾里斑半径,相面中心波前优于(1/50)λ,MTF@63 lp/mm优于0.45,无热化柔性支撑的一阶固有频率高达263 Hz;钛合金和K9配对时,60℃均匀温差下系统成像指标满足使用要求,10℃轴向、径向温度下成像质量无法满足使用要求。对装调完的殷钢和ULE配对光机系统进行了低温下分辨率测试,分辨率无明显变化,说明设计及分析可行。 展开更多
关键词 共光路 光机一体化分析 柔性支撑 温度梯度
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部