期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于自适应启发PSO的零件在线智能定位
1
作者 刘华森 郭子豪 +1 位作者 聂海平 彭志军 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第8期1367-1379,共13页
工业流水线生产环境下,多种类小批次中小型航空零件在自动化喷涂作业等过程中,往往面临着零件摆放位姿不固定而难以自动化测量与定位的问题。为实现综合满足喷涂效率与精度的零件定位,应用基于自适应启发改进的粒子群算法,随配准情况自... 工业流水线生产环境下,多种类小批次中小型航空零件在自动化喷涂作业等过程中,往往面临着零件摆放位姿不固定而难以自动化测量与定位的问题。为实现综合满足喷涂效率与精度的零件定位,应用基于自适应启发改进的粒子群算法,随配准情况自适应地采用不同启发方案与尺度,实现了较强后景影响下快速地点云配准。从全局搜索与局部搜索两方面进行优化,在应用随配准状态自适应的学习系数与惯性系数基础上,引入自适应尺度的滞步系数与类梯度下降运算,解决粒子群算法收敛速度缓慢与易陷入局部最优问题。基于正态分布置信度准则剔除适应度离群值降低后景点云对配准的影响,实现分割后点云与理论数模的智能配准,获得零件摆放的精确位姿。应用二维(2D)视觉减少测量时间、提供点云分割的依据,并多线程并发同步运算提高效率。最终实现了在3 min的节拍内完成三维(3D)点云的自动化扫描,以及在平均2.5 min节拍内实现2 mm精度的多种零件自主配准定位。 展开更多
关键词 点云配准 粒子群算法 自适应启发 自动化定位 2D-3D视觉融合
原文传递
启发式自适应步长优化Informed-RRT^(*)算法
2
作者 葛启兴 章伟 +2 位作者 陈浩 胡陟 谢贵亮 《无线电工程》 2024年第10期2446-2452,共7页
Informed-RRT^(*)算法是解决全局路径规划问题常用的算法。当处理狭窄环境时,Informed-RRT^(*)算法往往容易陷入局部最优解,而在复杂环境中路径规划的成本又往往过高。为了解决这些问题,提出了一种基于启发式自适应步长的采样策略,以改... Informed-RRT^(*)算法是解决全局路径规划问题常用的算法。当处理狭窄环境时,Informed-RRT^(*)算法往往容易陷入局部最优解,而在复杂环境中路径规划的成本又往往过高。为了解决这些问题,提出了一种基于启发式自适应步长的采样策略,以改进Informed-RRT^(*)算法的不足之处。通过在随机节点周围扩展采样点集来计算启发式值,选择最优节点并按照其生长方向进行扩张。通过计算最优节点与最近节点的距离,确定下一次采样的步长。这使得机器人能够更好地适应二维和三维环境中的狭窄区域和复杂环境。将改进的算法在二维和三维环境中进行仿真验证,实验结果表明了该算法的有效性和鲁棒性较为优异。 展开更多
关键词 路径规划 启发自适应步长 Informed-RRT^(*) 三维场景
下载PDF
启发式算法的孔群加工路线模糊多目标优化 被引量:3
3
作者 曾议 孙莉 +3 位作者 孙友文 刘凤垒 薛辉 司福祺 《现代制造工程》 CSCD 北大核心 2016年第4期44-50,151,共8页
研究一类在加工中广泛存在的孔群加工(Hole Group Machining,HGM)优化问题。孔群加工是多孔类零件加工中重要的工艺过程,研究其加工路线优化方法对于提高多孔类零件的加工效率、降低加工成本有重要意义。与传统的多孔加工点位优化不同,... 研究一类在加工中广泛存在的孔群加工(Hole Group Machining,HGM)优化问题。孔群加工是多孔类零件加工中重要的工艺过程,研究其加工路线优化方法对于提高多孔类零件的加工效率、降低加工成本有重要意义。与传统的多孔加工点位优化不同,综合考虑了刀具选择、加工参数、加工次序及刀具路径的影响,以加工效率和成本为目标,建立优化问题数学模型。采用改进启发式算法克服了传统算法早熟、爬山能力弱,以及收敛性能不理想等缺点,并引入交互式多优先级控制,对加工工艺进行模糊多目标优化,提高了算法实用性。最后通过实例计算证明了算法的有效性。 展开更多
关键词 孔群加工 模糊多目标优化 优先级控制 自适应启发式算法 计算机辅助工艺规划
下载PDF
风帆助航船舶自启发评价迭代滑模航向控制 被引量:3
4
作者 沈智鹏 张晓玲 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第11期1727-1732,共6页
针对风帆助航船舶运动模型具有时变非线性和受海洋环境扰动作用的特点,本文提出一种带自适应启发评价的模糊非线性迭代滑模航向控制方法。该方法采用双曲正切函数构造系统状态的迭代滑模函数,利用滑模面反馈设计控制增量,避免了对系统... 针对风帆助航船舶运动模型具有时变非线性和受海洋环境扰动作用的特点,本文提出一种带自适应启发评价的模糊非线性迭代滑模航向控制方法。该方法采用双曲正切函数构造系统状态的迭代滑模函数,利用滑模面反馈设计控制增量,避免了对系统未知项和外界扰动的观测,并结合模糊系统对滑模控制参数进行优化,增强控制器的自适应性。通过定义一种控制舵角抖振观测变量与自适应启发评价函数,对所构建模糊系统的结构参数进行动态调节和优化,以进一步降低控制舵角的抖振作用。应用"文竹海"号散货船数学模型进行控制仿真,结果表明所设计控制器能有效地处理模型参数摄动和海洋环境扰动,控制性能良好,具有强鲁棒性。 展开更多
关键词 风帆助航船 航向控制 自适应启发评价 模糊系统 迭代滑模 控制器设计 舵角 抖振 鲁棒性
下载PDF
基于动态扩展邻域蚁群算法的移动机器人路径规划 被引量:2
5
作者 潘玉恒 奥日格拉 +3 位作者 鲁维佳 丛佳 王世通 陈阳 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期423-432,449,共11页
针对蚁群算法易陷入局部最优、路径转折点多、收敛速度慢的问题,提出一种基于动态扩展邻域蚁群算法(Dynamic extended neighbourhoods ant colony optimization,DENACO)。在蚂蚁搜索方式上采用动态扩展邻域方法,并定义新的信息素计算方... 针对蚁群算法易陷入局部最优、路径转折点多、收敛速度慢的问题,提出一种基于动态扩展邻域蚁群算法(Dynamic extended neighbourhoods ant colony optimization,DENACO)。在蚂蚁搜索方式上采用动态扩展邻域方法,并定义新的信息素计算方式和增量规则,在取得更优收敛路径长度的同时,减少路径转折点数量及路径节点数量;引入自适应调整因子改进启发函数,提高算法的全局搜索能力,并设定迭代阈值,提升算法的收敛速度;提出一种路径节点双优化策略,对规划好的路径进一步优化,提高路径综合质量。不同复杂度及不同规模栅格地图中的仿真实验表明,DENACO算法所规划的路径更优,路径转折点数量减少,收敛速度加快,路径节点数量明显减少,表明算法具有更高的可行性和适用性。 展开更多
关键词 移动机器人 蚁群算法 路径规划 动态扩展邻域 自适应启发函数
下载PDF
软件定义网络系统中面向流的调度算法 被引量:17
6
作者 宛考 罗雪峰 +1 位作者 江勇 徐恪 《计算机学报》 EI CSCD 北大核心 2016年第6期1208-1223,共16页
软件定义网络(Software Defined Networking,SDN)由于其控制和转发分离的特性,在学术研究和工程上广泛应用于数据中心等领域.SDN体系结构中没有规定特定转发机制,而是通过更改控制模块或者开发具体的控制器App来实现.NOX是斯坦福大学在2... 软件定义网络(Software Defined Networking,SDN)由于其控制和转发分离的特性,在学术研究和工程上广泛应用于数据中心等领域.SDN体系结构中没有规定特定转发机制,而是通过更改控制模块或者开发具体的控制器App来实现.NOX是斯坦福大学在2008年提出的第1种OpenFlow控制器,它基于OpenFlow协议提出了类似传统路由器OSPF协议的最短路径转发算法,即NOX路由模块(NOX routing module).该算法通过SDN系统控制链路收集全局交换机静态参数,并没有利用SDN系统的优势来获得交换机运行时的状态信息来提高转发性能.该文根据SDN集中控制以及控制器计算能力可扩展等特性,设计SDN结点、路径和流的评价体系,将各体系分支的评价指标作为交换机运行时的状态信息参数,在此基础上提出均衡算法.该Online算法具有自适应性和启发性,有效地提高了SDN在转发过程中(特别是针对大数据量)的运行效率. 展开更多
关键词 软件定义网络 自适应启发式算法 集中控制 流分析 下一代互联网
下载PDF
进化操作行为学习模型及在移动机器人避障上的应用 被引量:4
7
作者 郜园园 朱凡 宋洪军 《计算机应用》 CSCD 北大核心 2013年第8期2283-2288,共6页
针对移动机器人避障上存在的自适应能力较差的问题,结合遗传算法(GA)的进化思想,以自适应启发评价(AHC)学习和操作条件反射(OC)理论为基础,提出了一种基于进化操作行为学习模型(EOBLM)的移动机器人学习避障行为的方法。该方法是一种改进... 针对移动机器人避障上存在的自适应能力较差的问题,结合遗传算法(GA)的进化思想,以自适应启发评价(AHC)学习和操作条件反射(OC)理论为基础,提出了一种基于进化操作行为学习模型(EOBLM)的移动机器人学习避障行为的方法。该方法是一种改进的AHC学习模式,评价单元采用多层前向神经网络来实现,利用TD算法和梯度下降法进行权值更新,这一阶段学习用来生成取向性信息,作为内在动机决定进化的方向;动作选择单元主要用来优化操作行为以实现状态到动作的最佳映射。优化过程分两个阶段来完成,第一阶段通过操作条件反射学习算法得到的信息熵作为个体适应度,执行GA学习算法搜索最优个体;第二阶段由OC学习算法选择最优个体内的最优操作行为,并得到新的信息熵值。通过移动机器人避障仿真实验,结果表明所设计的EOBLM能使机器人通过不断与外界未知环境进行交互主动学会避障的能力,与传统的AHC方法相比其自学习自适应的能力得到加强。 展开更多
关键词 移动机器人 自适应启发评价 操作条件反射 遗传算法 避障
下载PDF
基于增强学习的无人直升机姿态控制器设计 被引量:1
8
作者 蔡文澜 王俊生 +2 位作者 税海涛 马宏绪 黄茜薇 《弹箭与制导学报》 CSCD 北大核心 2008年第2期73-76,共4页
自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。通过将AHC增强学习和策略梯度增强学习相结合,对PID控制器参数进... 自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。通过将AHC增强学习和策略梯度增强学习相结合,对PID控制器参数进行在线自适应整定,实现对无人直升机姿态控制性能的在线优化。仿真结果表明,与固定PID参数控制器相比,该算法能在线调整控制器参数,并很好地控制了无人直升机的悬停姿态。 展开更多
关键词 无人直升机 增强学习 自适应启发评价 策略梯度 PEGASUS
下载PDF
改进的离散小波-优化极限学习机在倾转旋翼机故障诊断中的应用 被引量:9
9
作者 严峰 陈晓 +2 位作者 王新民 彭程 胡亚洲 《兵工学报》 EI CAS CSCD 北大核心 2014年第11期1914-1921,共8页
针对倾转旋翼机飞控系统的故障诊断问题,提出一种改进的离散小波-优化极限学习机(OMELM)的故障诊断算法。提出自适应启发式小波去噪方法对采集的信号进行消噪,定义了帕塞瓦尔能量用来提取测量信号经离散小波变换分解后的特征,并对OMELM... 针对倾转旋翼机飞控系统的故障诊断问题,提出一种改进的离散小波-优化极限学习机(OMELM)的故障诊断算法。提出自适应启发式小波去噪方法对采集的信号进行消噪,定义了帕塞瓦尔能量用来提取测量信号经离散小波变换分解后的特征,并对OMELM进行了改进。将提取的故障能量特征进行归一化后输入到改进的OMELM多分类器中进行分类,以美国XV-15倾转旋翼机为例进行仿真验证。结果表明文中方法平均辨识率高,诊断时间短,对未来我国进行倾转旋翼机故障诊断的研究有一定参考价值。 展开更多
关键词 航空、航天系统工程 倾转旋翼机 故障诊断 离散小波 优化极限学习机 自适应启发式小波去噪
下载PDF
改进A^(*)算法的水面舰艇静态航路规划 被引量:6
10
作者 武善平 黄炎焱 陈天德 《计算机工程与应用》 CSCD 北大核心 2022年第23期307-315,共9页
针对复杂海洋环境下水面舰艇航路规划时出现的大地图寻路速度慢、航路安全性差、航路不平滑等难题,结合电子海图提出了一种改进A^(*)算法的航路规划方法。提出一种自适应的改进启发函数,在搜索节点时加入目标节点的方位信息,加快了A^(*... 针对复杂海洋环境下水面舰艇航路规划时出现的大地图寻路速度慢、航路安全性差、航路不平滑等难题,结合电子海图提出了一种改进A^(*)算法的航路规划方法。提出一种自适应的改进启发函数,在搜索节点时加入目标节点的方位信息,加快了A^(*)算法搜索路径的速度;加入迫使航路远离障碍物的安全距离,解决了传统A^(*)算法沿障碍物边缘寻路导致航路安全性差的问题;对原始航路进行二次优化,在对原始路径提取转折点后,通过判断任意两个转折节点的直线可达性,将转折节点之间的实际距离转化为距离矩阵,使用Dijkstra算法优选出航路长度更短的关键转折点,最终使用二阶贝塞尔曲线对航路转折处进行平滑处理,以满足航路平滑且易跟随的要求。仿真实验表明,相对于传统A^(*)算法,改进算法规划的路径具有寻路速度更快、航路距离更短、航路安全性更高的特点。 展开更多
关键词 A^(*)算法 自适应启发函数 DIJKSTRA算法 贝塞尔曲线 电子海图
下载PDF
多种会遇状态下基于强化学习的船舶自动避碰路径仿真 被引量:3
11
作者 赵舟 王俊雄 《科学技术与工程》 北大核心 2018年第18期218-223,共6页
为实现海域中多会遇局面的船舶自动避碰,依据船舶间状态信息的实时获取,构建了自适应启发评价的船舶避碰算法。算法中通过再励信号由强化学习训练得到船舶从会遇形成到驶过让清动态过程的优化转向决策,模拟给出了两船会遇局面、多船会... 为实现海域中多会遇局面的船舶自动避碰,依据船舶间状态信息的实时获取,构建了自适应启发评价的船舶避碰算法。算法中通过再励信号由强化学习训练得到船舶从会遇形成到驶过让清动态过程的优化转向决策,模拟给出了两船会遇局面、多船会遇局面下的避碰优化路径。结果表明算法能够满足避碰规则并完成安全避碰,与已有分布式避碰决策方法对比,显示了更好的实时性和经济性。 展开更多
关键词 船舶自动避碰 强化学习 自适应启发评价 避碰路径
下载PDF
基于改进蝴蝶算法的协同干扰资源分配方法 被引量:1
12
作者 陈振坤 程嗣怡 +1 位作者 刘丹 商犇 《现代雷达》 CSCD 北大核心 2023年第3期98-106,共9页
针对协同对抗下雷达干扰资源的管理决策问题开展研究,提出了一种基于改进蝴蝶算法的干扰资源分配方法。首先,用模糊综合评价的方法量化影响辐射源威胁等级和干扰效能的因素;然后,确定目标函数并计算干扰效能矩阵,建立干扰资源分配模型;... 针对协同对抗下雷达干扰资源的管理决策问题开展研究,提出了一种基于改进蝴蝶算法的干扰资源分配方法。首先,用模糊综合评价的方法量化影响辐射源威胁等级和干扰效能的因素;然后,确定目标函数并计算干扰效能矩阵,建立干扰资源分配模型;最后,把自适应启发项和劣解接纳操作引入蝴蝶算法(BOA)对模型求解。仿真结果表明:引入改进项提高BOA探索能力和搜索效率,有效解决算法局部收敛的缺陷。对比四种经典算法和两种改进BOA算法,该算法在收敛精度和算法稳定性方面均更优,制定的干扰资源分配方案可信度更高。 展开更多
关键词 协同对抗 干扰资源分配 蝴蝶算法 干扰效能 自适应启发
下载PDF
提高强化学习速度的方法研究 被引量:8
13
作者 张汝波 《计算机工程与应用》 CSCD 北大核心 2001年第22期38-40,共3页
强化学习一词出自于行为心理学,这门学科把学习看作为反复试验的过程,以便把环境的状态映射为动作。强化学习的这种特性必然增加智能系统的困难性,学习时间增长。强化学习学习速度较慢的原因是没有明确的监督信号。因此,强化学习系统在... 强化学习一词出自于行为心理学,这门学科把学习看作为反复试验的过程,以便把环境的状态映射为动作。强化学习的这种特性必然增加智能系统的困难性,学习时间增长。强化学习学习速度较慢的原因是没有明确的监督信号。因此,强化学习系统在与环境交互时不得不采取反复试验的方法依靠外部评价信号来调整自己的行为。智能系统必然经过很长的学习过程。如何提高强化学习速度是一个最重要的研究问题。该文从几个方面来讨论提高强化学习速度的方法。 展开更多
关键词 强化学习 机器学习 Q-学习 自适应启发评价方法 学习速度
下载PDF
基于AHMRRT的移动机器人路径规划算法 被引量:5
14
作者 阮晓钢 刘少达 朱晓庆 《北京工业大学学报》 CAS CSCD 北大核心 2022年第2期121-128,共8页
为解决单向快速探索随机树(rapid exploring random tree,RRT)算法路径规划效率低且易陷入局部极小点的问题,提出了一种自适应启发式多快速探索随机树(adaptive heuristic multiple rapid exploring random tree,AHMRRT)路径规划算法.... 为解决单向快速探索随机树(rapid exploring random tree,RRT)算法路径规划效率低且易陷入局部极小点的问题,提出了一种自适应启发式多快速探索随机树(adaptive heuristic multiple rapid exploring random tree,AHMRRT)路径规划算法.一方面,基于多随机树构建策略的AHMRRT算法可以在起始点、目标点、子目标点生成4棵随机树,同时进行扩展搜索,从而提高路径规划效率;另一方面,通过在单棵随机树生长过程中添加自适应启发式偏置因子,AHMRRT算法可以根据环境中障碍物的情况自适应地改变新节点的生成策略.探索自由空间时,该算法可以在偏置因子的作用下迅速向目标点扩展以提高搜索效率;探索多障碍物空间时,该算法将调用随机采样函数以防止落入局部最优.在仿真实验中,设计了4种环境下AHMRRT算法与随机概率目标快速探索随机树(probability goal RRT,PGRRT)、双向快速探索随机树(bidirectional RRT,BRRT)算法的对比实验,仿真实验结果证明了该算法的可行性和高效性. 展开更多
关键词 移动机器人 快速探索随机树 路径规划 多随机树构建策略 自适应启发式偏置因子 局部最优
下载PDF
一种改进的蚁群路径规划算法 被引量:2
15
作者 王天生 张峰 《装备制造技术》 2018年第3期183-186,203,共5页
针对传统蚁群算法在路径规划中搜索时间长,迭代速度慢等问题,提出了一种改进的蚁群优化算法。首先建立了启发函数自适应调整机制,增强了算法在搜索过程中对终点的指向性;其次加入了局部最优方向引导机制,并提出了局部方向因素强度系数... 针对传统蚁群算法在路径规划中搜索时间长,迭代速度慢等问题,提出了一种改进的蚁群优化算法。首先建立了启发函数自适应调整机制,增强了算法在搜索过程中对终点的指向性;其次加入了局部最优方向引导机制,并提出了局部方向因素强度系数、局部方向因素衰减系数,以提高局部最优方向在算法初期的引导能力,降低局部方向在算法后期的影响,并构建了新的路径选择概率。仿真结果表明,改进的蚁群算法在二维环境的路径规划中有较高的收敛速度。 展开更多
关键词 蚁群算法 路径规划 自适应启发函数 转移概率
下载PDF
并行自动拣选系统品项拣选量拆分优化 被引量:5
16
作者 王艳艳 吴耀华 吴颖颖 《机械工程学报》 EI CAS CSCD 北大核心 2013年第16期177-184,共8页
分析并行自动分拣系统的作业模式,发现各分拣机的分拣延迟时间是影响分拣效率的关键因素之一,建立基于虚拟视窗的拣选时间模型;分析品项拣选量拆分对并行分拣系统分拣延迟时间模型的影响,建立大批量分拣时总分拣延迟时间最短为目标的拣... 分析并行自动分拣系统的作业模式,发现各分拣机的分拣延迟时间是影响分拣效率的关键因素之一,建立基于虚拟视窗的拣选时间模型;分析品项拣选量拆分对并行分拣系统分拣延迟时间模型的影响,建立大批量分拣时总分拣延迟时间最短为目标的拣选量拆分优化模型;提出并证明拣选量拆分优化的必要条件,降低模型求解的复杂度,并设计启发式自适应遗传算法对拣选量拆分优化模型进行求解,仿真结果显示与常用的拣选量平均拆分法相比拣选作业时间缩短9%左右。 展开更多
关键词 并行自动拣选系统 拣选量拆分 延迟时间 启发自适应遗传算法
下载PDF
WDM光网络中虚拓扑重构算法研究
17
作者 钟华 《计算机技术与发展》 2007年第5期217-220,224,共5页
介绍了WDM光网络中当网络需求发生改变时,如何对现有的光网络进行重构,从而达到既满足新的业务量需求;又使原来的虚拓扑改变尽量少;同时使正在运行的分组数据没有任何损伤(或损伤小),即实现无损伤重构。方法的主要思想是通过光连通性去... 介绍了WDM光网络中当网络需求发生改变时,如何对现有的光网络进行重构,从而达到既满足新的业务量需求;又使原来的虚拓扑改变尽量少;同时使正在运行的分组数据没有任何损伤(或损伤小),即实现无损伤重构。方法的主要思想是通过光连通性去测量在光路连通(以测量周期为基础定期地测量)情况下实际负载的业务量,当遭遇到负载不平衡的时候,可以通过去卸载一条轻负载的光路或者重新建立一条新的光路当拥塞发生的时候去解决。并且引入光路负载上的高和低的水印参数去探测任何没有被充分利用的光路。对虚拓扑进行重构提出一种自适应启发式算法。 展开更多
关键词 WDM 虚拓扑重构 水印参数 自适应启发式算法
下载PDF
基于ELM-BP的强化学习在倒立摆控制中的研究
18
作者 王婷婷 《电子设计工程》 2019年第6期55-58,63,共5页
解决拥有连续状态空间以及模型未知的倒立摆系统长久以来是个难题。文章将强化学习(Reinforcement Learning)与神经网络(ELM力,采用Actor-Critic架构,提出基于ELM-BP动作网络,根据输入的状态映射出要执行的动作,ELM数值,输出评价。同时... 解决拥有连续状态空间以及模型未知的倒立摆系统长久以来是个难题。文章将强化学习(Reinforcement Learning)与神经网络(ELM力,采用Actor-Critic架构,提出基于ELM-BP动作网络,根据输入的状态映射出要执行的动作,ELM数值,输出评价。同时为了降低样本空间大小提高收敛速度,引入滚动时间窗机制和适合度轨迹。经过训练和学习,能够有效解决具有连续状态空间的倒立摆系统的问题。通过Matlab软件仿真模拟倒立摆的环境进行实验,运用提出的新方法进行控制,在衡量倒立摆算法的几个指标上(尝试次数,所需时间,角度最大绝对值,位移最大绝对值等)均得到了良好的效果。 展开更多
关键词 强化学习 倒立摆 自适应启发式算法 BP ELM神经网络 连续空间
下载PDF
进化强化学习及其在机器人路径跟踪中的应用 被引量:6
19
作者 段勇 崔宝侠 徐心和 《控制与决策》 EI CSCD 北大核心 2009年第4期532-536,541,共6页
研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(... 研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(FIS)构成.ACE网络的输出构成二次强化信号,用于指导ASE的学习.最后将所提出的算法应用于移动机器人的行为学习,较好地解决了机器人的复杂路径跟踪问题. 展开更多
关键词 强化学习 自适应启发评价 遗传算法 路径跟踪
原文传递
基于改进蚁群算法的水面无人艇路径规划 被引量:31
20
作者 孙功武 苏义鑫 +2 位作者 顾轶超 谢基榕 王俊轩 《控制与决策》 EI CSCD 北大核心 2021年第4期847-856,共10页
针对水面无人艇路径规划问题,提出一种改进蚁群算法进行求解.该算法建立作用时效不同的局部禁忌表和全局禁忌表,实现对蚂蚁途经栅格的分类存储,在蚂蚁发生障碍死锁和自死锁时分别采取不同的死锁处理策略,从而降低无效蚂蚁产生的概率,提... 针对水面无人艇路径规划问题,提出一种改进蚁群算法进行求解.该算法建立作用时效不同的局部禁忌表和全局禁忌表,实现对蚂蚁途经栅格的分类存储,在蚂蚁发生障碍死锁和自死锁时分别采取不同的死锁处理策略,从而降低无效蚂蚁产生的概率,提高解的多样性;引入当前蚂蚁所处栅格与终点栅格之间的欧式距离,设计自适应启发函数,以避免蚂蚁路径搜索的初期盲目性与后期单一性;适时采用历史最优路径替换本轮迭代中的最差路径,保证已搜索到的最优路径不会丢失.在不同规模、不同复杂度地图中的仿真结果表明,所提出改进算法能够大幅度提高搜索过程中有效蚂蚁的数量,其收敛速度与精度两方面性能均优于未改进算法.在规模较大、复杂度较高的地图中,更能体现应用改进算法的优越性. 展开更多
关键词 水面无人艇 路径规划 蚁群算法 死锁 自适应启发函数 最优路径
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部