期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于MAPPO的无信号灯交叉口自动驾驶决策
1
作者 许曼晨 于镝 +1 位作者 赵理 郭陈栋 《吉林大学学报(信息科学版)》 CAS 2024年第5期790-798,共9页
针对自动驾驶在通过无信号灯交叉口由于车流密集且车辆行为随机不确定的问题,提出一种基于MAPPO(Multi-Agent Proximal Policy Optimization)算法的无信号灯交叉口自动驾驶决策方案。通过MetaDrive仿真环平台搭建多智能体仿真环境,并且... 针对自动驾驶在通过无信号灯交叉口由于车流密集且车辆行为随机不确定的问题,提出一种基于MAPPO(Multi-Agent Proximal Policy Optimization)算法的无信号灯交叉口自动驾驶决策方案。通过MetaDrive仿真环平台搭建多智能体仿真环境,并且设计了综合考虑交通规则、安全到达或发生碰撞等安全性以及交叉口车辆最大、最小速度等车流效率的奖励函数,旨在实现安全高效的自动驾驶决策。仿真实验表明,所提出的自动驾驶决策方案在训练中相较于其他算法具有更出色的稳定性和收敛性,在不同车流密度下均呈现出更高的成功率和安全性。该自动驾驶决策方案在解决无信号灯交叉口环境方面具有显著潜力,并且为复杂路况自动驾驶决策的研究起到促进作用。 展开更多
关键词 自动驾驶 智能决策 无信号灯交叉口 MAPPO算法
下载PDF
基于CQL-SAC的自动驾驶防撞决策方法
2
作者 刘玉辉 于镝 《北京信息科技大学学报(自然科学版)》 2024年第3期16-24,共9页
针对深度强化学习在自动驾驶任务中存在价值函数过估计、学习效率低、安全性差等问题,提出了一种自动驾驶防撞决策方法。首先,将保守Q学习(conservative Q-learning, CQL)算法与软行动评论(soft actor-critic, SAC)算法融合,提出CQL-SA... 针对深度强化学习在自动驾驶任务中存在价值函数过估计、学习效率低、安全性差等问题,提出了一种自动驾驶防撞决策方法。首先,将保守Q学习(conservative Q-learning, CQL)算法与软行动评论(soft actor-critic, SAC)算法融合,提出CQL-SAC算法,以缓解价值过估计问题。然后,在算法训练过程中引入专家经验,实现算法快速收敛,以解决学习效率低的问题。最后,利用防撞模块对CQL-SAC算法输出的动作进行安全检查和矫正,避免车辆碰撞。在基于高速公路的仿真场景下对方法有效性进行验证。仿真结果表明,在训练阶段,CQL-SAC算法相比SAC算法和样本内行动评论(in-sample actor-critic, InAC)算法收敛速度分别提升12.5%、5.4%,引入专家经验后算法收敛速度进一步提升14.3%;在测试阶段,本文算法与SAC和InAC算法相比,成功率分别提升17、12百分点,平均回合奖励分别提升23.1%、10.7%。 展开更多
关键词 智慧交通 自动驾驶决策 保守Q学习算法 软行动评论算法 专家经验 防撞策略
下载PDF
多注多采条件下水驱油藏区域影响估计方法 被引量:7
3
作者 于镝 霍凤财 +2 位作者 张雯 胡绍彬 孙兰佳 《东北石油大学学报》 CAS 北大核心 2015年第2期102-107,11,共6页
为评估多注多采条件下注水井对水驱油藏区域产量的影响,提出区域影响定义并建立多注多采情况下的井网模型,为避免滤波过程中出现被估参数为负值的情况,采用改进的扩展Kalman滤波方法,应用注水量和采液量的实时数据给出区域影响的最优估... 为评估多注多采条件下注水井对水驱油藏区域产量的影响,提出区域影响定义并建立多注多采情况下的井网模型,为避免滤波过程中出现被估参数为负值的情况,采用改进的扩展Kalman滤波方法,应用注水量和采液量的实时数据给出区域影响的最优估值;通过河道沉积非均质油藏反九点法开发井网的ECLIPSE模拟仿真,验证方法的有效性.该方法可为注采井网调整及注水井调剖、采油井堵水及酸化压裂等油层改造提供指导,与传统的地质研究与开采动态分析相结合的估计方法相比,具有简单高效的特点. 展开更多
关键词 水驱油藏 扩展Kalman滤波 区域影响估计 多注多采情况
下载PDF
高阶多智能体网络在固定和动态拓扑下的一致性分析 被引量:5
4
作者 于镝 伍清河 王寅秋 《兵工学报》 EI CAS CSCD 北大核心 2012年第1期56-62,共7页
针对已有的一阶有向网络一致性分析结果在高阶网络的应用问题,从图论角度入手,给出了高阶多智能体网络一致性分析的新结果。通过模型变换,在一定条件下,将个体动态为高阶积分器模型的有向网络的系统矩阵变换为具有零行和的Metzler矩阵... 针对已有的一阶有向网络一致性分析结果在高阶网络的应用问题,从图论角度入手,给出了高阶多智能体网络一致性分析的新结果。通过模型变换,在一定条件下,将个体动态为高阶积分器模型的有向网络的系统矩阵变换为具有零行和的Metzler矩阵。由此采用图论、非负矩阵理论和控制理论工具,将一阶有向网络的一致性分析结果拓展到了高阶情况。针对固定拓扑,分别给出无领航和领航—跟随两种情况下的一致性条件及一致状态。并且证明动态拓扑情况下,在有限的拓扑切换时间间隔内,若有向图联合具有生成树,则整个闭环动态网络实现渐近一致。仿真实例和多车辆编队控制仿真验证了分析结果的正确性。 展开更多
关键词 自动控制技术 一致性 高阶多智能体网络 动态拓扑 多车辆编队控制
下载PDF
油田开采智能评价有用规则提取方法 被引量:3
5
作者 于镝 宋盛瑶 +2 位作者 任伟建 康朝海 刘玉敏 《东北石油大学学报》 CAS 北大核心 2016年第3期111-117,共7页
基于油田开采智能评价的有用规则是通过专家问卷调查产生的,受专家选择和实践检验的难度,以及某些专家经验规则可能与实际数据不一致影响而具有明显的局限性。采用基于区间Ⅱ型模糊集合的语言摘要方法,从油田开采数据库中产生IF-THEN规... 基于油田开采智能评价的有用规则是通过专家问卷调查产生的,受专家选择和实践检验的难度,以及某些专家经验规则可能与实际数据不一致影响而具有明显的局限性。采用基于区间Ⅱ型模糊集合的语言摘要方法,从油田开采数据库中产生IF-THEN规则,并根据真实度、覆盖度、可靠度和离群度等4个质量测度提取油田开采评价有用规则;进而基于平行坐标法及GUI界面建立可视化逻辑规则群。应用结果表明:该方法节省专家的时间,有助于在经验与实际数据不一致基础上完善专家经验规则。 展开更多
关键词 区间Ⅱ型模糊集合 语言摘要 规则提取 智能评价 可视化 逻辑规则群 油田开采
下载PDF
非线性多智能体网络的分布式包容控制 被引量:3
6
作者 于镝 白丽娟 李铖 《复杂系统与复杂性科学》 EI CSCD 北大核心 2013年第2期63-68,共6页
针对具有本质非线性动态的多智能体网络,研究分布式包容控制问题。假设只有部分个体已知领航者信息,依据相对位置和速度信息设计分布式控制律。基于代数图论、矩阵理论和Lyapunov稳定性分析方法,得出非线性网络实现渐近包容控制的充分... 针对具有本质非线性动态的多智能体网络,研究分布式包容控制问题。假设只有部分个体已知领航者信息,依据相对位置和速度信息设计分布式控制律。基于代数图论、矩阵理论和Lyapunov稳定性分析方法,得出非线性网络实现渐近包容控制的充分条件。当跟随者之间有向强连通且每个跟随者都至少存在一个领航者与其通信,可选取合适的控制增益使得跟随者渐近收敛到由多个领航者所围成的静态凸包中。仿真实例验证了理论分析的正确性和有效性。 展开更多
关键词 非线性动态 多智能体网络 分布式包容控制
下载PDF
多智能体网络有限时间聚集控制 被引量:2
7
作者 于镝 董巍 任伟建 《吉林大学学报(信息科学版)》 CAS 2016年第3期345-350,共6页
为解决个体动态为一阶积分器的多智能体网络的有限时间聚集控制问题,提出基于势能函数的控制方案。依据状态信息采用势能函数法设计了分布式非线性非光滑控制协议。基于微分包含、广义梯度和集值李导数的定义以及非光滑分析中不变集原理... 为解决个体动态为一阶积分器的多智能体网络的有限时间聚集控制问题,提出基于势能函数的控制方案。依据状态信息采用势能函数法设计了分布式非线性非光滑控制协议。基于微分包含、广义梯度和集值李导数的定义以及非光滑分析中不变集原理,进行了有限时间稳定性分析,给出网络可实现有限时间聚集控制的充分条件。最后通过仿真验证了理论方案的有效性。 展开更多
关键词 协调控制 有限时间控制 聚集控制 非光滑分析
下载PDF
基于二阶Adaline网络的滑模变结构控制器 被引量:2
8
作者 于镝 刘严崴 李艳辉 《吉林大学学报(信息科学版)》 CAS 2007年第6期668-673,共6页
针对一般神经网络滑模控制系统在线训练时间长、实时性差的问题,提出一种自适应神经滑模变结构控制系统。该系统主要由二阶Adaline网络辨识器、滑模控制器和变结构二阶学习算法估值器组成。其中二阶Adaline网络是对原Adaline网络的改进... 针对一般神经网络滑模控制系统在线训练时间长、实时性差的问题,提出一种自适应神经滑模变结构控制系统。该系统主要由二阶Adaline网络辨识器、滑模控制器和变结构二阶学习算法估值器组成。其中二阶Adaline网络是对原Adaline网络的改进,在其输入样本向量中增广了有关样本的二次项,相当于用时变二次多项式去逼近非线性系统,既有原Adaline网络训练速度快的优点,又具有一定非线性逼近能力;滑模控制器根据辨识误差自适应调整趋近律中的增益参数;而变结构二阶学习算法首先对递推近似Newton法进行简化,然后将其改造成一种新型的变结构算法,具有较快的收敛速度。针对同一非线性系统,采用常规神经滑模变结构控制存在较小的抖振,平均调节误差为0.0913;而采用自适应神经滑模变结构控制很快趋于平稳,几乎消除高频抖振,平均调节误差为0.0109。仿真结果证明了该方案的有效性。 展开更多
关键词 滑模变结构控制 二阶Adaline网络 变结构学习算法
下载PDF
时变领航情况下多智能体网络一致性分析与应用 被引量:1
9
作者 于镝 李铖 +1 位作者 冷传英 任伟建 《东北石油大学学报》 CAS 北大核心 2014年第2期109-113,12,共5页
针对个体动态为一阶积分器的多智能体网络,研究时变领航情况下网络的一致性.当只有部分个体已知领航者状态时,基于智能体间的相对状态,提出分布式控制协议,应用图论、矩阵理论和稳定性理论给出有向固定拓扑网络实现一致的充要条件及算法... 针对个体动态为一阶积分器的多智能体网络,研究时变领航情况下网络的一致性.当只有部分个体已知领航者状态时,基于智能体间的相对状态,提出分布式控制协议,应用图论、矩阵理论和稳定性理论给出有向固定拓扑网络实现一致的充要条件及算法.拓展算法至当智能体间具有固定相对状态偏差时,给出分布式控制协议和网络实现一致的充要条件及算法.仿真实验结果表明:基于文中算法的控制协议可以实现只有部分智能体已知时变领航情况下的一致性追踪,基于拓展算法的控制协议可使多车辆在一定时间保持理想编队.该研究结果对于多智能体协调控制问题具有参考意义,也为多车辆编队控制问题提出新的思路. 展开更多
关键词 多智能体网络 一致性 时变领航 多车辆编队控制 拓扑网络
下载PDF
约束通信情况下非线性网络有限时间跟踪控制 被引量:1
10
作者 于镝 杨文君 +1 位作者 任伟建 康朝海 《吉林大学学报(信息科学版)》 CAS 2016年第1期92-97,共6页
针对具有本质非线性动态的多智能体网络,研究个体传感范围有限情况下的有限时间协调跟踪控制问题。假设非线性动态满足Lipschitz条件且初始网络拓扑无向连通,基于智能体间的相对状态信息设计拓扑连通保持的非光滑控制协议。应用非光滑... 针对具有本质非线性动态的多智能体网络,研究个体传感范围有限情况下的有限时间协调跟踪控制问题。假设非线性动态满足Lipschitz条件且初始网络拓扑无向连通,基于智能体间的相对状态信息设计拓扑连通保持的非光滑控制协议。应用非光滑稳定性分析方法给出实现有限时间跟踪控制的充分条件,即选取合适的控制增益参数,以实现保持网络拓扑连通的有限时间跟踪控制。最后通过仿真验证该方案有效且可行。 展开更多
关键词 非线性网络 有限时间跟踪控制 非光滑稳定性分析 拓扑连通保持
下载PDF
复杂网络的有限时间同步控制 被引量:1
11
作者 于镝 白雪峰 +1 位作者 任伟建 康朝海 《吉林大学学报(信息科学版)》 CAS 2014年第4期423-429,共7页
针对线性耦合的复杂网络有限时间同步控制问题,在非线性动态满足一定条件的情况下,基于同步误差,结合线性反馈原理和有限时间控制思想,提出两种不同的连续非光滑控制协议。并应用矩阵理论和有限时间稳定性引理,给出复杂网络实现有限时... 针对线性耦合的复杂网络有限时间同步控制问题,在非线性动态满足一定条件的情况下,基于同步误差,结合线性反馈原理和有限时间控制思想,提出两种不同的连续非光滑控制协议。并应用矩阵理论和有限时间稳定性引理,给出复杂网络实现有限时间同步的充分条件。若选取合适的反馈控制增益,可使复杂非线性耦合网络实现有限时间同步。最后通过仿真实例验证了该方案的可行性和有效性。 展开更多
关键词 复杂网络 有限时间 同步控制
下载PDF
机器人的非奇异终端神经滑模轨迹跟踪控制 被引量:2
12
作者 于镝 《计算机仿真》 CSCD 北大核心 2009年第8期162-166,共5页
针对具有不确定性的机器人系统,为提高系统的稳态跟踪精度,提出一种非奇异终端神经滑模轨迹跟踪控制方案。控制器采用改进的非奇异终端滑模面,并基于径向基函数神经网络自适应调整控制律的切换项,不但克服了在设计中需要知道系统不确定... 针对具有不确定性的机器人系统,为提高系统的稳态跟踪精度,提出一种非奇异终端神经滑模轨迹跟踪控制方案。控制器采用改进的非奇异终端滑模面,并基于径向基函数神经网络自适应调整控制律的切换项,不但克服了在设计中需要知道系统不确定性的上界的限制,而且平滑了控制信号。可应用Lyapunov稳定性理论证明了系统的渐近稳定性和跟踪误差的渐近收敛性。仿真结果验证了控制方法不仅能够保证机器人系统轨迹跟踪控制的快速性和鲁棒性,而且有效地削弱了抖振,可见方案是可行且有效的。 展开更多
关键词 机器人 非奇异终端滑模控制 神经网络 轨迹跟踪
下载PDF
动态事件触发机制下多智能体系统固定时间跟踪 被引量:1
13
作者 于镝 王亚洁 +1 位作者 赵博 刘琼 《兵工学报》 EI CAS CSCD 北大核心 2023年第5期1403-1413,共11页
针对受扰非线性多智能体系统跟踪控制问题,提出一种基于动态事件触发机制的固定时间积分滑模控制方法。设计与相对状态信息相关的新型积分滑模面且提出分布式控制协议,基于测量误差和滑模面构造动态变量和动态事件触发函数。采用固定时... 针对受扰非线性多智能体系统跟踪控制问题,提出一种基于动态事件触发机制的固定时间积分滑模控制方法。设计与相对状态信息相关的新型积分滑模面且提出分布式控制协议,基于测量误差和滑模面构造动态变量和动态事件触发函数。采用固定时间稳定性原理证明,若选取适当的控制参数则可使多智能体系统在固定时间内实现动态事件触发机制下的跟踪控制,且避免Zeno现象。该控制方案能够有效抑制系统扰动的影响,减少多智能体系统通信和计算资源的消耗,且避免收敛时间对系统初始状态的依赖。仿真结果表明,新提出的动态事件触发控制器使得多智能体系统在固定时间内实现跟踪控制,降低触发频率而节省资源,更适用于实际应用。 展开更多
关键词 多智能体系统 动态事件触发机制 固定时间控制 积分滑模
下载PDF
新型模糊基函数神经网络及应用
14
作者 于镝 骆华锋 周广静 《大庆石油学院学报》 CAS 北大核心 2004年第5期61-64,共4页
针对非线性多峰函数系统辨识问题,提出了一种新型模糊基函数神经网络.依据Stone-Weierstrass定理,证明了新型模糊基函数神经网络的函数逼近能力.仿真结果表明,新型模糊基函数神经网络与多层前向神经网络相比,计算简单、精度高.
关键词 模糊基函数 函数逼近能力 非线性多峰函数
下载PDF
机器人的自适应神经全局滑模轨迹跟踪控制
15
作者 于镝 王亚立 《科学技术与工程》 2009年第15期4358-4362,共5页
针对具有不确定性的机器人系统,提出一种自适应神经全局滑模轨迹跟踪控制方案。控制器采用一种新的全局滑模面,使得系统在整个响应时间内都具有鲁棒性;并基于径向基函数神经网络自适应学习不确定性的未知上界,从而自适应调整控制律的切... 针对具有不确定性的机器人系统,提出一种自适应神经全局滑模轨迹跟踪控制方案。控制器采用一种新的全局滑模面,使得系统在整个响应时间内都具有鲁棒性;并基于径向基函数神经网络自适应学习不确定性的未知上界,从而自适应调整控制律的切换增益。而且基于Lyapunov稳定性理论证明这种新型控制器能够保证机器人系统关节角位置矢量和角速度矢量的跟踪误差渐近收敛于0。仿真结果表明提出的控制策略能够使机器人系统仅在0.5s内就实现快速的轨迹跟踪,可见该方案是可行且有效的。 展开更多
关键词 机器人 全局滑模控制 神经网络 轨迹跟踪
下载PDF
多层前向神经网络的新型二阶学习算法 被引量:6
16
作者 刘铁男 段玉波 +3 位作者 陈广义 任伟建 徐宝昌 于镝 《控制理论与应用》 EI CAS CSCD 北大核心 2000年第5期721-724,共4页
提出了多层前向神经网络的新型二阶递推学习算法 .该算法不仅能使网络各层误差而且使二阶导数信息因子反向传播 .证明了新算法等价于Newton迭代法并且有二阶收敛速度 .它实现了Newton搜索方向和Hessian阵逆的递推运算 ,其计算量几乎与... 提出了多层前向神经网络的新型二阶递推学习算法 .该算法不仅能使网络各层误差而且使二阶导数信息因子反向传播 .证明了新算法等价于Newton迭代法并且有二阶收敛速度 .它实现了Newton搜索方向和Hessian阵逆的递推运算 ,其计算量几乎与普通递推最小二乘法相当 .由算法性能分析证明新算法优于Karayiannis等人的二阶学习算法 . 展开更多
关键词 BP算法 二阶学习算法 多层前向神经网络
下载PDF
遗传算法的收敛性分析 被引量:6
17
作者 刘铁男 姜建国 +2 位作者 陈继刚 张长江 于镝 《大庆石油学院学报》 CAS 北大核心 2000年第3期40-42,共3页
用随机过程论中的马尔克夫链理论研究了几种遗传算法的收敛性 .提出了 6个引理 ,3个定理和 3个推论 ,证明了最优保存遗传算法和作者提出的 2种新型遗传算法 :模拟生物种族进化的遗传算法 ,带罗盘算法的GA是全局收敛的 ,而简单遗传算法... 用随机过程论中的马尔克夫链理论研究了几种遗传算法的收敛性 .提出了 6个引理 ,3个定理和 3个推论 ,证明了最优保存遗传算法和作者提出的 2种新型遗传算法 :模拟生物种族进化的遗传算法 ,带罗盘算法的GA是全局收敛的 ,而简单遗传算法不是全局收敛的 . 展开更多
关键词 遗传算法 收敛性 马氏链 模拟 生物种族进化
下载PDF
神经网络的新型二阶学习算法及其应用 被引量:4
18
作者 刘铁男 段玉波 +2 位作者 于镝 刘志德 张长江 《控制与决策》 EI CSCD 北大核心 2001年第5期627-629,共3页
针对 BP算法和 Karayiannis的二阶学习算法存在的不足 ,提出多层前向网络的新型二阶学习算法。该算法具有二阶收敛速度 ,其计算量与通常的递推最小二乘法相当。
关键词 二阶学习算法 Newton算法 神经网络 目标函数
下载PDF
基于复杂网络的电网元件脆弱性分析 被引量:3
19
作者 关学忠 刘金龙 +1 位作者 高哲 于镝 《化工自动化及仪表》 CAS 2015年第10期1104-1108,共5页
把电网看成是由节点和线路组成的复杂网络,分别通过节点和线路的脆弱性来分析电网的脆弱性。提出用电气度介数指标和电气三重数指标来评价线路的脆弱性和节点的脆弱性。在IEEE-118总线系统中采用联锁故障模拟,用全局效能来衡量电网的脆... 把电网看成是由节点和线路组成的复杂网络,分别通过节点和线路的脆弱性来分析电网的脆弱性。提出用电气度介数指标和电气三重数指标来评价线路的脆弱性和节点的脆弱性。在IEEE-118总线系统中采用联锁故障模拟,用全局效能来衡量电网的脆弱性。仿真结果表明:保护电气三重数指标高的节点和电气度介数指标高的线路可以有效保障电网的安全稳定工作。 展开更多
关键词 电网 脆弱性分析 复杂网络 电气度介数指标 电气三重数指标 全局效能 移除策略
下载PDF
小波奇异性分析在输油管道泄漏检测中的应用 被引量:3
20
作者 任伟建 康朝海 于镝 《计算机测量与控制》 CSCD 2006年第7期855-857,共3页
针对目前输油管道泄漏检测准确率低的现状,采用小波奇异性分析的方法,对管道压力信号进行小波分析,检测出信号的奇异点,采用了能够抑制模极大值漂移的改进的ad hoc算法,对奇异点进行定位,对4条管线检测结果表明,该方法可以用于输油管道... 针对目前输油管道泄漏检测准确率低的现状,采用小波奇异性分析的方法,对管道压力信号进行小波分析,检测出信号的奇异点,采用了能够抑制模极大值漂移的改进的ad hoc算法,对奇异点进行定位,对4条管线检测结果表明,该方法可以用于输油管道泄漏监测,并可进行精确的定位。 展开更多
关键词 小波变换 奇异性检测 泄漏检测 模极大值漂移抑制
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部