期刊文献+
共找到530篇文章
< 1 2 27 >
每页显示 20 50 100
Path Following Control of A Deep-Sea Manned Submersible Based upon NTSM 被引量:7
1
作者 马岭 崔维成 《China Ocean Engineering》 SCIE EI 2005年第4期625-636,共12页
In this paper, a robust path following control law is proposed for a deep-sea manned submersible maneuvering along a predeterminated path. Developed in China, the submersible is underactuated in the horizontal plane i... In this paper, a robust path following control law is proposed for a deep-sea manned submersible maneuvering along a predeterminated path. Developed in China, the submersible is underactuated in the horizontal plane in that it is actuated by two perpendicular thrusts in this plane. The advanced non-singular terminal sliding mode (NTSM) is implemented for the design of the path following controller, which can ensure the convergence of the motion system in finite time and improve its robustness against parametric uncertainties and environmental disturbances. In the process of controller design, the close-loop stability is considered and proved by Lyapunov' s stability theory. With the experimental data, numerical simulations are provided to verify the control law for path following of the deep-sea manned submersible. 展开更多
关键词 path following deep-sea manned submersible terminal sliding mode control ROBUSTNESS
下载PDF
以ChatGPT为代表的AI技术与高等教育的深度融合 被引量:3
2
作者 蒋妮姗 《继续教育研究》 2024年第4期75-80,共6页
随着人工智能技术飞速发展,以ChatGPT为代表的人工智能技术已经逐渐成为人们关注的焦点。旨在探讨ChatGPT技术与高等教育的深度融合研究,分析其对高等教育的影响和挑战,并提出相应的解决方案。首先,介绍了ChatGPT技术的基本原理和特点,... 随着人工智能技术飞速发展,以ChatGPT为代表的人工智能技术已经逐渐成为人们关注的焦点。旨在探讨ChatGPT技术与高等教育的深度融合研究,分析其对高等教育的影响和挑战,并提出相应的解决方案。首先,介绍了ChatGPT技术的基本原理和特点,包括其语言生成模型的构建、预训练和优化等;然后,通过分析ChatGPT技术在高等教育中的应用场景,如智能教育、在线教学、个性化推荐等,探讨了其对高等教育的影响和挑战;最后,提出了一些解决方案,比如加强ChatGPT技术与高等教育的深度融合、建立完善的教育监管机制等,以应对ChatGPT技术在高等教育中面临的挑战。 展开更多
关键词 ChatGPT AI技术 高等教育 深度融合 融合路径
下载PDF
煤矿井下掘进机器人路径规划方法研究 被引量:1
3
作者 张旭辉 郑西利 +4 位作者 杨文娟 李语阳 麻兵 董征 陈鑫 《煤田地质与勘探》 EI CAS CSCD 北大核心 2024年第4期152-163,共12页
针对煤矿非全断面巷道条件下掘进机器人移机难度大、效率低下等问题,分析了煤矿井下非结构化环境特征及掘进机器人运动特性,提出了基于深度强化学习的掘进机器人机身路径规划方法。利用深度相机将巷道环境实时重建,在虚拟环境中建立掘... 针对煤矿非全断面巷道条件下掘进机器人移机难度大、效率低下等问题,分析了煤矿井下非结构化环境特征及掘进机器人运动特性,提出了基于深度强化学习的掘进机器人机身路径规划方法。利用深度相机将巷道环境实时重建,在虚拟环境中建立掘进机器人与巷道环境的碰撞检测模型,并使用层次包围盒法进行虚拟环境碰撞检测,形成巷道边界受限下的避障策略。考虑到掘进机器人形体大小且路径规划过程目标单一,在传统SAC算法的基础上引入后见经验回放技术,提出HER-SAC算法,该算法通过环境初始目标得到的轨迹扩展目标子集,以增加训练样本、提高训练速度。在此基础上,基于奖惩机制建立智能体,根据掘进机器人运动特性定义其状态空间与动作空间,在同一场景下分别使用3种算法对智能体进行训练,综合平均奖励值、最高奖励值、达到最高奖励值的步数以及鲁棒性4项性能指标进行对比分析。为进一步验证所提方法的可靠性,采用虚实结合的方式,通过调整目标位置设置2种实验场景进行掘进机器人的路径规划,并将传统SAC算法和HER-SAC算法的路径结果进行对比。结果表明:相较于PPO算法和SAC算法,HER-SAC算法收敛速度更快、综合性能达到最优;在2种实验场景下,HER-SAC算法相比传统SAC算法规划出的路径更加平滑、路径长度更短、路径终点与目标位置的误差在3.53 cm以内,能够有效地完成移机路径规划任务。该方法为煤矿掘进机器人的自主移机控制奠定了理论基础,为煤矿掘进设备自动化提供了新方法。 展开更多
关键词 掘进机器人 路径规划 深度强化学习 智能体 虚实结合 改进SAC算法 煤矿
下载PDF
教育信息化背景下信息技术与高校英语教学深度融合的路径 被引量:1
4
作者 张红梅 《西部学刊》 2024年第9期92-95,共4页
在教育信息化背景下,高校英语教学与信息技术的深度融合不仅能够增强学生的情境体验,提高英语教学效率,而且在高校英语的教学设计、课堂组织、学情评价等方面起到积极的推动作用。信息技术与高校英语教学深度融合体现了培养综合性人才... 在教育信息化背景下,高校英语教学与信息技术的深度融合不仅能够增强学生的情境体验,提高英语教学效率,而且在高校英语的教学设计、课堂组织、学情评价等方面起到积极的推动作用。信息技术与高校英语教学深度融合体现了培养综合性人才的理念。在对高校英语教师信息素养进行分析的基础上,提出了信息技术与高校英语教学深度融合的路径:加强高校英语教师信息化培训;建立英语学习平台;构建高校英语教学资源库;制定信息技术与英语教学融合指南;举行信息化教学竞赛等。 展开更多
关键词 英语教学 深度融合 信息技术 路径 信息素养
下载PDF
电力巡检机器人路径规划方法综述 被引量:2
5
作者 李刚 智宏鑫 《电力科学与工程》 2024年第4期1-11,共11页
随着电力系统规模和复杂性的不断增加,传统的人工巡检方式已很难满足当下电力巡检要求。巡检机器人因具有安全性、可靠性和智能性已被逐步应用到电力巡检中。机器人在运行过程中通过提前预测、自主决策或智能导航的方式完成全局遍历与... 随着电力系统规模和复杂性的不断增加,传统的人工巡检方式已很难满足当下电力巡检要求。巡检机器人因具有安全性、可靠性和智能性已被逐步应用到电力巡检中。机器人在运行过程中通过提前预测、自主决策或智能导航的方式完成全局遍历与避障。电力巡检的核心任务是规划出一条安全且最优的运行轨迹。系统地分析和梳理了巡检机器人巡检过程中的各类方法;阐述了在变电站和输电线路等不同场景中算法的应用;综述了各类路径规划算法的研究现状和改进方法。在此基础上,对未来电力巡检机器人路径规划的研究和发展方向做出了展望。 展开更多
关键词 电力巡检 巡检机器人 路径规划 智能算法 深度强化学习
下载PDF
基于改进DQN算法的应召搜潜无人水面艇路径规划方法
6
作者 牛奕龙 杨仪 +3 位作者 张凯 穆莹 王奇 王英民 《兵工学报》 EI CAS CSCD 北大核心 2024年第9期3204-3215,共12页
针对应召反潜中无人水面艇航向和航速机动的情形,提出一种基于改进深度Q学习(Deep Q-learning,DQN)算法的无人艇路径规划方法。结合应召搜潜模型,引入改进的深度强化学习(Improved-DQN,I-DQN)算法,通过联合调整无人水面艇(Unmanned Surf... 针对应召反潜中无人水面艇航向和航速机动的情形,提出一种基于改进深度Q学习(Deep Q-learning,DQN)算法的无人艇路径规划方法。结合应召搜潜模型,引入改进的深度强化学习(Improved-DQN,I-DQN)算法,通过联合调整无人水面艇(Unmanned Surface Vessel,USV)的动作空间、动作选择策略和奖励等,获取一条最优路径。算法采用时变动态贪婪策略,根据环境和神经网络的学习效果自适应调整USV动作选择,提高全局搜索能力并避免陷入局部最优解;结合USV所处的障碍物环境和当前位置设置分段非线性奖惩函数,保证不避碰的同时提升算法收敛速度;增加贝塞尔算法对路径平滑处理。仿真结果表明,在相同环境下新方法规划效果优于DQN算法、A^(*)算法和人工势场算法,具有更好的稳定性、收敛性和安全性。 展开更多
关键词 无人水面艇 路径规划 深度Q学习算法 应召搜索
下载PDF
智能仓储交通信号与多AGV路径规划协同控制方法 被引量:1
7
作者 司明 邬伯藩 +1 位作者 胡灿 邢伟强 《计算机工程与应用》 CSCD 北大核心 2024年第11期290-297,共8页
针对智能仓储多AGV(automated guided vehicle)路径规划实时性差,障碍物识别能力弱,多AGV碰撞、死锁和拥堵等问题,提出了一种智能仓储交通信号控制与多AGV路径规划协同控制方法,将交通信号与多AGV路径规划视为一个整体,设计一种交通信... 针对智能仓储多AGV(automated guided vehicle)路径规划实时性差,障碍物识别能力弱,多AGV碰撞、死锁和拥堵等问题,提出了一种智能仓储交通信号控制与多AGV路径规划协同控制方法,将交通信号与多AGV路径规划视为一个整体,设计一种交通信号与多AGV路径规划协同控制框架,并提出LS-A3C(long short-asynchronous advantage actor-critic)算法和Bi-LSTM-CBAM(bi-long short-term memory-convolutional block attention module)算法作为框架的核心算法。LS-A3C算法使用长短时编码器和注意力机制分别对交通信号的长期信息和短期信息进行编码,以学习元特征表示,并使用A3C框架计算元Q值和控制策略,实现交通信号时间自适应AGV流量,解决多AGV碰撞、死锁和拥堵等问题。Bi-LSTM-CBAM算法通过计算本时刻和前置时刻状态特征,对输出结果进行拼接处理,可以有效解决神经网络梯度消失和爆炸的问题,提高AGV路径规划实时性;引入注意力机制模块CBAM,根据输入信息重要程度分配权重,加强AGV对障碍物识别能力。在Sumo和Gazebo联合仿真平台进行仿真实验,实验结果表明,该协同控制方法使AGV碰撞、死锁及拥堵情况明显降低,障碍物识别能力显著提高,路径规划实时性大幅增强,达到提升AGV作业效率的目的。 展开更多
关键词 智能仓储 深度强化学习 路径规划 Bi-LSTM A3C CBAM
下载PDF
通信受限条件下多无人机协同环境覆盖路径规划
8
作者 陈洋 周锐 《中国惯性技术学报》 EI CSCD 北大核心 2024年第3期273-281,共9页
多无人机协同覆盖旨在有效分配多个无人机任务,实现给定区域的快速、高效全覆盖。然而,在现实应用场景中常常因为无人机之间距离超出通信范围,信号传输受阻,导致无人机之间的协作和信息交互面临极大挑战。为此,提出一种基于Deep Q Netwo... 多无人机协同覆盖旨在有效分配多个无人机任务,实现给定区域的快速、高效全覆盖。然而,在现实应用场景中常常因为无人机之间距离超出通信范围,信号传输受阻,导致无人机之间的协作和信息交互面临极大挑战。为此,提出一种基于Deep Q Networks(DQN)的多无人机路径规划方法。采用通信中断率和最大通信中断时间两个指标来评价路径质量,通过构建与指标相关的奖励函数,实现了无人机团队的自主路径决策。仿真实验表明,所提方法在最短路径上可以与传统优化算法效果保持一致,权衡路径下在增加20%路径长度的情况下可以降低80%通信中断率,在全通信路径下则可以实现100%的全过程连接通信,因此可以根据不同的通信环境生成高效覆盖所有环境节点的路径。 展开更多
关键词 环境覆盖 多无人机 通信约束 深度Q网络 路径规划
下载PDF
具有自适应贪婪因子的深度强化学习路径规划
9
作者 曾明如 涂佳昊 +1 位作者 祝琴 宋世杰 《计算机仿真》 2024年第9期416-423,共8页
深度强化学习的开创性(Deep Q-Network,DQN)算法,虽然其在路径规划中表现优异,但仍存在过估值、经验回放机制缺陷以及没有很好地平衡探索与利用的关系等问题。为了解决上述问题,提出了一种具有自适应贪婪因子的深度强化学习路径规划算... 深度强化学习的开创性(Deep Q-Network,DQN)算法,虽然其在路径规划中表现优异,但仍存在过估值、经验回放机制缺陷以及没有很好地平衡探索与利用的关系等问题。为了解决上述问题,提出了一种具有自适应贪婪因子的深度强化学习路径规划算法。首先,在D3QN算法的基础上引入了优先经验回放机制,解决过估值问题的同时增加了算法对重要样本的抽样概率,提高了算法的效率;其次,设计了一种新的奖励函数,提高了动作的区分度;最后,设计了一种能够自适应调节的贪婪因子,平衡了探索与利用的关系。采用Python中的TensorFlow框架和Tkinter库建立环境地图,验证算法的有效性。结果表明,改进的算法无论是得到的最优路径还是算法迭代次数都优于DQN算法。 展开更多
关键词 路径规划 深度强化学习 探索因子 经验回放
下载PDF
推动数字经济与实体经济的深度融合——逻辑机理、现实挑战与路径选择
10
作者 叶建亮 吕阳 《国家现代化建设研究》 2024年第3期136-145,共10页
加快实体经济和数字经济发展、促进实体经济与数字经济进一步深度融合,是经济高质量发展的强大内生动力,是建设现代化产业体系的必然要求,也是助力社会主义现代化建设的有力保障。在数字经济与实体经济融合程度不断加深的过程中,存在着... 加快实体经济和数字经济发展、促进实体经济与数字经济进一步深度融合,是经济高质量发展的强大内生动力,是建设现代化产业体系的必然要求,也是助力社会主义现代化建设的有力保障。在数字经济与实体经济融合程度不断加深的过程中,存在着数据要素流动不通畅、数字经济与实体经济融合不均衡、技术支撑要素储备不充足、数字经济生态体系不健全等制约因素。未来的优化路径主要在于:加强数字基础设施建设、促进数据要素流通、推动产业数字化升级、加强数字化人才培养、完善政策体系和监管机制。 展开更多
关键词 数字经济 实体经济 深度融合 路径选择
下载PDF
西南油气田天然气与新能源深度融合的路径探索
11
作者 文绍牧 何润民 +2 位作者 敬兴胜 李森圣 胡俊坤 《石油与天然气化工》 CAS CSCD 北大核心 2024年第5期1-6,共6页
中国石油西南油气田公司(以下简称西南油气田)正全力推进国家天然气(页岩气)千亿立方米级产能基地建设,面临绿色低碳转型发展和实现“双碳”目标的双重挑战,迫切需要推动天然气与新能源深度融合发展。为此,分析了融合发展的资源基础,梳... 中国石油西南油气田公司(以下简称西南油气田)正全力推进国家天然气(页岩气)千亿立方米级产能基地建设,面临绿色低碳转型发展和实现“双碳”目标的双重挑战,迫切需要推动天然气与新能源深度融合发展。为此,分析了融合发展的资源基础,梳理总结了过往融合发展的思路与探索历程,并明晰了当前面临的3方面挑战:内部资源禀赋差、外部资源获取难度大;新技术新装备不够成熟、经济效益偏差;新业务资源认识不系统、利用不充分。在此基础上,提出了天然气与新能源深度融合的路径思路:“区内有序、区外聚焦”发展风光地热业务;大力发展余压发电、伴生资源、CCUS、氢能等特色业务;探索发展地下空间利用和生物天然气等新赛道业务。最后,提出4方面建议:立足当前、着眼未来,统筹考虑经济性;考虑业务成长性及技术迭代需要,有序推进产业规模由小及大;培育市场竞争意识,深化合作交流,共同推动产业发展;创新机制,探索通过多种机制、模式助力产业发展。 展开更多
关键词 天然气 新能源 深度融合 绿色发展西南模式 路径探索
下载PDF
基于深度学习的烟厂制丝车间智能巡检机器人自主导航系统设计
12
作者 黄海松 韦福兴 +2 位作者 刘大卫 全志昭 邢予权 《计算机测量与控制》 2024年第11期161-168,共8页
烟厂制丝车间通常存在各种设备、管道等复杂的环境条件,智能巡检机器人难以准确辨别和识别这些复杂的场景,导致避障精度下降;为了提高智能巡检机器人的避障精度,提出了基于深度学习的烟厂制丝车间智能巡检机器人自主导航系统设计;通过... 烟厂制丝车间通常存在各种设备、管道等复杂的环境条件,智能巡检机器人难以准确辨别和识别这些复杂的场景,导致避障精度下降;为了提高智能巡检机器人的避障精度,提出了基于深度学习的烟厂制丝车间智能巡检机器人自主导航系统设计;通过电源模块的设计为系统提供电能,结合射频模块和基带信号处理模块的设计,完成巡检机器人导航系统的硬件设计;在系统的软件设计中,根据导航路径标记图像的角点在视觉差异、距离和颜色等维度的特性,识别智能巡检机器人导航路径标记,通过计算发生碰撞的预警距离,得到碰撞概率的估计值,利用深度学习的卷积神经网络模型,规划巡检机器人避撞路径,实现智能巡检机器人的自主导航;测试结果表明,文中系统可以使巡检机器人成功绕过障碍物,将避障精度提高到95.5%,为提高车间巡检效率和安全性提供了一种新的解决方案。 展开更多
关键词 深度学习 导航系统 巡检机器人 路径标记 制丝车间 概率估计
下载PDF
基于深度强化学习的多路径调度模型
13
作者 赵静 《甘肃科技纵横》 2024年第4期58-65,共8页
文章提出一种基于深度强化学习的多路径调度模型,在聚合场景中将深度学习技术应用于流量管理,以解决多路径环境下的数据包调度问题。文章使用了一个多路径快速UDP网络连接协议(MPQUIC)来实现多路径场景中的路径选择,并训练了一个代理人(... 文章提出一种基于深度强化学习的多路径调度模型,在聚合场景中将深度学习技术应用于流量管理,以解决多路径环境下的数据包调度问题。文章使用了一个多路径快速UDP网络连接协议(MPQUIC)来实现多路径场景中的路径选择,并训练了一个代理人(Agent)来改进最优选择路径的算法,展示了将深度Q网络代理(DQN Agent)应用于数据流量管理问题的优势。实验证明了在实时环境中使用DQNAgent来提高包调度器性能的可行性,以及使用该技术对新的5G网络进行优化的潜力。实验结果表明:基于深度强化学习的多路径调度模型能够自适应地调整路径选择策略,从而提高网络的稳定性和可靠性。改进的模型不仅具有理论价值,还为实际应用提供了有益的参考和借鉴。 展开更多
关键词 5G网络 多路径 分组调度 深度强化学习 QUIC MPTCP
下载PDF
深度学习视域下的阅读教学标识及其实现路径
14
作者 陈尚达 刘仁金 毕美娟 《江苏第二师范学院学报》 2024年第3期25-31,124,共8页
深度学习的三个视点即主体性、对话性和协同性,深度学习视域下的阅读教学标识包括主体意识挺立、思辨能力生长与人际关系和合。浅度学习视域下的阅读教学反思指涉主体意识消解、思辨能力缺乏和人际关系疏离三个维度。主体性回归、对话... 深度学习的三个视点即主体性、对话性和协同性,深度学习视域下的阅读教学标识包括主体意识挺立、思辨能力生长与人际关系和合。浅度学习视域下的阅读教学反思指涉主体意识消解、思辨能力缺乏和人际关系疏离三个维度。主体性回归、对话性理解和协作性共生,是深度学习视域下的阅读教学标识实现路径。 展开更多
关键词 深度学习 阅读教学 阅读教学标识 实现路径
下载PDF
改进的UNet3+网络高分辨率遥感影像道路提取 被引量:2
15
作者 周家厚 普运伟 +3 位作者 陈如俊 邓云龙 周鑫城 李俊 《激光杂志》 CAS 北大核心 2024年第2期161-168,共8页
为解决UNet3+网络随深度加深出现大量融合冗余操作以至于模型训练时间过长而导致在道路提取中运用较少的问题,对UNet3+网络进行改进,通过删减UNet3+的网络层级使用Bottleneck模块替换原有网络中的卷积层,保留网络特征融合能力的同时降... 为解决UNet3+网络随深度加深出现大量融合冗余操作以至于模型训练时间过长而导致在道路提取中运用较少的问题,对UNet3+网络进行改进,通过删减UNet3+的网络层级使用Bottleneck模块替换原有网络中的卷积层,保留网络特征融合能力的同时降低网络复杂度,并引入混合注意力机制优化模型,构建了一个新的网络模型。将改进方法与几种典型的道路提取模型做对比。实验结果表明:(1)所提方法相较于Unet3+网络在、Recall、IOU、ACC四个指标上分别提升了4.72%、2.46%、4.84%、2.01%,均优于对比算法;(2)对比几个经典的特征提取模型,改进的模型具有更好的识别效果,在道路提取的精度、连接性、完整性等方面均表现出优越性。 展开更多
关键词 深度学习 注意力机制 UNet3+ 道路提取 跳跃连接
下载PDF
基于深度强化学习的移动机器人三维路径规划方法
16
作者 马天 席润韬 +3 位作者 吕佳豪 曾奕杰 杨嘉怡 张杰慧 《计算机应用》 CSCD 北大核心 2024年第7期2055-2064,共10页
针对三维未知环境中存在的高复杂度和不确定性的问题,提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法。首先,在有限观测空间下采用深度图信息作为智能体的输入,模拟移动受限且未知的复杂三维空间环境;... 针对三维未知环境中存在的高复杂度和不确定性的问题,提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法。首先,在有限观测空间下采用深度图信息作为智能体的输入,模拟移动受限且未知的复杂三维空间环境;其次,设计了两阶段离散动作空间下的动作选择策略,包括方向动作和位移动作,以减少搜索步数和时间;最后,在近端策略优化(PPO)算法基础上,添加门控循环单元(GRU)结合历史状态信息,以提升未知环境中搜索策略的稳定性,进而提高规划路径准确度和平滑度。实验结果表明,相较于A2C(Advantage ActorCritic),所提方法的平均搜索时间缩短了49.07%,平均规划路径长度缩短了1.04%,同时能够完成线性时序逻辑约束下的多目标路径规划任务。 展开更多
关键词 深度强化学习 移动机器人 三维路径规划 近端策略优化 深度图
下载PDF
基于深度Q网络的机器人路径规划研究综述 被引量:1
17
作者 卢锦澎 梁宏斌 《传感器与微系统》 CSCD 北大核心 2024年第6期1-5,共5页
随着深度强化学习的不断发展,深度Q网络(DQN)在机器人路径规划中得到广泛关注和研究。首先,简要介绍DQN以及Nature DQN、Double DQN、Dueling DQN和D3QN等算法的基本原理和改进思想。针对算法存在的样本获取成本高和交互效率低的问题,... 随着深度强化学习的不断发展,深度Q网络(DQN)在机器人路径规划中得到广泛关注和研究。首先,简要介绍DQN以及Nature DQN、Double DQN、Dueling DQN和D3QN等算法的基本原理和改进思想。针对算法存在的样本获取成本高和交互效率低的问题,系统梳理并总结了从奖励函数、探索能力、样本利用率等方面进行优化的研究成果和思路。最后,讨论了DQN在现代物流中进行机器人路径规划的优势,对每个场景提出了算法的优化方向,涵盖状态空间、动作空间以及奖励函数等多个关键方面。 展开更多
关键词 机器人 路径规划 深度Q网络 现代物流
下载PDF
基于深度强化学习和历史轨迹的船舶路径规划 被引量:2
18
作者 欧昌奎 谢磊 +2 位作者 查天奇 杨洋 胡昕源 《中国航海》 CSCD 北大核心 2024年第1期36-44,51,共10页
为减少船舶在航行过程中人为操作不当或者没有及时对障碍风险做出反应而造成的船舶碰撞事故,增加船舶航行的安全性,提出一种船舶路径规划方法。将船舶历史的船舶自动识别系统(AIS)数据进行相应的预处理后,运用K-means聚类算法对相应数... 为减少船舶在航行过程中人为操作不当或者没有及时对障碍风险做出反应而造成的船舶碰撞事故,增加船舶航行的安全性,提出一种船舶路径规划方法。将船舶历史的船舶自动识别系统(AIS)数据进行相应的预处理后,运用K-means聚类算法对相应数据进行聚类,得到的一条特征轨迹,并将其作为船舶在该区域的全局静态路径规划轨迹。设计一种基于深度确定性策略梯度(DDPG)算法的局部路径避碰方法和基于深度强化学习(DQN)的局部路径回归方法,使船舶可对局部动态风险做出有效的反应。分析全局静态路径的效果,并对局部动态路径规划方法做了仿真验证,结果表明:该方法可得到一条较为安全的全局路径,并且可规避航行时的局部动态风险,为船舶安全航行提供一定的参考。 展开更多
关键词 水上交通 路径规划 K-MEANS聚类 深度强化学习
下载PDF
自动驾驶路径优化的RF-DDPG车辆控制算法研究
19
作者 焦龙飞 谷志茹 +2 位作者 舒小华 袁鹏 王建斌 《湖南工业大学学报》 2024年第1期62-69,共8页
针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法... 针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法的奖励函数,以此优化DDPG的参数,达到所需跟踪精度及稳定性。并且采用aopllo自动驾驶仿真平台,对原始的DDPG算法和改进的RF-DDPG路径跟踪控制算法进行了仿真实验。研究结果表明,所提出的RF-DDPG算法在路径跟踪精度以及鲁棒性能等方面均优于DDPG算法。 展开更多
关键词 自动驾驶 路径跟踪 深度强化学习 路径控制 DDPG算法
下载PDF
基于端到端深度强化学习求解有能力约束的车辆路径问题
20
作者 葛斌 田文智 +1 位作者 夏晨星 秦望博 《计算机应用研究》 CSCD 北大核心 2024年第11期3245-3250,共6页
有能力约束的车辆路径问题(CVRP)是现阶段供应链应用最常见的问题模型,现多采用启发式算法求解。但随着问题规模增大,启发式算法求解速度慢且无法保证解的质量。提出端到端深度强化学习(DRL)网络框架对CVRP进行研究。首先利用边聚合图... 有能力约束的车辆路径问题(CVRP)是现阶段供应链应用最常见的问题模型,现多采用启发式算法求解。但随着问题规模增大,启发式算法求解速度慢且无法保证解的质量。提出端到端深度强化学习(DRL)网络框架对CVRP进行研究。首先利用边聚合图注意力网络编码器(EGATE)对车辆路径规划问题的图表示进行特征嵌入编码;然后设计多头注意力解码器(MAD)进行解码,并提出多解码策略以增加解的空间多样性;接着利用带回滚基线的基线REINFORCE算法对端到端网络模型进行训练,基线可自适应性更新以提升模型训练效果,并利用奖励函数归一化和Adam优化器对算法进行优化。最后通过对不同规模问题的实验以及与其他算法进行对比,验证了所提出端到端DRL框架的可行性与有效性,经过训练的模型在CVRPLIB公共数据集上的平均求解时间仅需0.189 s即可得到较优解。 展开更多
关键词 车辆路径问题 路径规划 端到端模型 深度强化学习 基线REINFORCE算法
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部