期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
采用资格迹的神经网络学习控制算法 被引量:4
1
作者 刘智斌 曾晓勤 +1 位作者 徐彦 禹继国 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第7期887-894,共8页
强化学习是解决自适应问题的重要方法,被广泛地应用于连续状态下的学习控制,然而存在效率不高和收敛速度较慢的问题.在运用反向传播(back propagation,BP)神经网络基础上,结合资格迹方法提出一种算法,实现了强化学习过程的多步更新.解... 强化学习是解决自适应问题的重要方法,被广泛地应用于连续状态下的学习控制,然而存在效率不高和收敛速度较慢的问题.在运用反向传播(back propagation,BP)神经网络基础上,结合资格迹方法提出一种算法,实现了强化学习过程的多步更新.解决了输出层的局部梯度向隐层节点的反向传播问题,从而实现了神经网络隐层权值的快速更新,并提供一个算法描述.提出了一种改进的残差法,在神经网络的训练过程中将各层权值进行线性优化加权,既获得了梯度下降法的学习速度又获得了残差梯度法的收敛性能,将其应用于神经网络隐层的权值更新,改善了值函数的收敛性能.通过一个倒立摆平衡系统仿真实验,对算法进行了验证和分析.结果显示,经过较短时间的学习,本方法能成功地控制倒立摆,显著提高了学习效率. 展开更多
关键词 强化学习 神经网络 资格迹 倒立摆 梯度下降
下载PDF
基于Matlab的非精确倒立摆系统模糊控制 被引量:1
2
作者 余昌盛 杨煦 +1 位作者 许力 张伟 《江南大学学报(自然科学版)》 CAS 2004年第2期156-159,163,共5页
针对一种实际非精确的单级倒立摆系统,提出了一种专家模糊控制方法,在Matlab环境下编程,通过MEX接口与数据采集卡进行数据交换,将传感器检测到的角度和位移变量及其变化率经过模糊化,通过在线查询规则库的方式进行实时模糊推理,并通过... 针对一种实际非精确的单级倒立摆系统,提出了一种专家模糊控制方法,在Matlab环境下编程,通过MEX接口与数据采集卡进行数据交换,将传感器检测到的角度和位移变量及其变化率经过模糊化,通过在线查询规则库的方式进行实时模糊推理,并通过解模糊运算给出控制信号作用于倒立摆系统.实验结果表明,采用此方法,在Matlab环境下进行实时控制可以获得满意的效果. 展开更多
关键词 MATLAB 非精确倒立摆系统 专家模糊控制 在线应用
下载PDF
一类欠驱动机械系统的嵌套饱和控制
3
作者 高丙团 陈宏钧 《系统仿真学报》 CAS CSCD 北大核心 2009年第5期1436-1438,1442,共4页
针对一类欠驱动机械系统,设计了将系统动力学转换成严格前馈级联非线性系统的坐标和控制变换,基于得到的严格前馈形式的级联非线性系统,给出了系统的嵌套饱和控制器。结合欠驱动车摆系统,采用提出的嵌套饱和控制方案进行了系统的稳定设... 针对一类欠驱动机械系统,设计了将系统动力学转换成严格前馈级联非线性系统的坐标和控制变换,基于得到的严格前馈形式的级联非线性系统,给出了系统的嵌套饱和控制器。结合欠驱动车摆系统,采用提出的嵌套饱和控制方案进行了系统的稳定设计,对得到的稳定的控制系统进行了仿真实验,结果表明所提出的控制策略能够有效解决系统动力学可转换成前馈级联非线性系统形式的这类欠驱动机械系统的稳定控制。 展开更多
关键词 欠驱动机械系统 嵌套饱和控制 级联系统 车摆系统 仿真
下载PDF
小车倒立摆的自适应动态面控制 被引量:3
4
作者 黄辉先 丁灿 刘嘉婷 《控制理论与应用》 EI CAS CSCD 北大核心 2019年第6期1002-1008,共7页
针对一类含有参数扰动和外部扰动的不确定欠驱动系统提出了一种改进自适应动态面控制方法.首先通过坐标变换,小车倒立摆模型转换成部分反馈形式,由半严格形式模型设计动态面控制器.利用模糊逻辑处理系统不确定性的能力设计自适应控制器... 针对一类含有参数扰动和外部扰动的不确定欠驱动系统提出了一种改进自适应动态面控制方法.首先通过坐标变换,小车倒立摆模型转换成部分反馈形式,由半严格形式模型设计动态面控制器.利用模糊逻辑处理系统不确定性的能力设计自适应控制器,然后在传统动态面控制器设计中采用跟踪微分器来得到原稳定化函数的精确微分,解决传统反步法的"微分爆炸",显著提升闭环系统的性能.采用李雅普洛夫方法,设计适当的参数,系统跟踪误差能收敛到原点,仿真结果验证了该方法的有效性. 展开更多
关键词 小车倒立摆 动态面控制 模糊系统 跟踪为微分器 稳定性
下载PDF
可编程模糊逻辑控制器芯片的应用研究 被引量:1
5
作者 潘承志 靳东明 《微电子学》 CAS CSCD 北大核心 2001年第1期70-73,共4页
研究了一种电流型可编程模糊逻辑控制器芯片 ( PFLC)的两种典型应用。在智能控制领域 ,利用 PFLC设计并调试了倒立摆模糊控制系统 ,系统参数可由线性二次型最优控制的方法导出。在信号处理领域 ,设计了一种基于 PFLC的模糊自适应非线性... 研究了一种电流型可编程模糊逻辑控制器芯片 ( PFLC)的两种典型应用。在智能控制领域 ,利用 PFLC设计并调试了倒立摆模糊控制系统 ,系统参数可由线性二次型最优控制的方法导出。在信号处理领域 ,设计了一种基于 PFLC的模糊自适应非线性均衡器 ,学习算法采用 LMS算法 ,只需 8次乘法运算 ,易于将 PFLC扩展成自学习模糊控制器芯片。 展开更多
关键词 可编程模糊逻辑控制器 智能控制 倒立摆模糊控制系统 专用集成电路
下载PDF
小车-倒摆控制系统的Takagi-Sugeno模糊模型研究 被引量:1
6
作者 彭良智 戴金海 +1 位作者 桂先洲 单懿 《计算机仿真》 CSCD 2000年第4期43-46,共4页
文章以系统的输入输出测试数据为依据,讨论了系统的Taksgi-Sugeno模糊模型的辨识方法,并基于此设计了小车-倒摆系统的模糊控制器。实验结果表明,本方法具有较高的可靠性和应用价值。
关键词 系统辨识 T-S模型 小车-倒摆控制系统
下载PDF
Opponent cart-pole dynamics for reinforcement learning of competing agents
7
作者 Xun Huang 《Acta Mechanica Sinica》 SCIE EI CAS CSCD 2022年第5期125-134,I0003,共11页
In this work,the classical single cart-pole dynamic system is extended to the double cart-pole dynamic system with the inclusion of a competing target,which enables the study of multi-agent deep learning problems at a... In this work,the classical single cart-pole dynamic system is extended to the double cart-pole dynamic system with the inclusion of a competing target,which enables the study of multi-agent deep learning problems at an affordable cost.The corresponding important issues,such as system dynamics,reward function and simultaneous training of opponent agents,are discussed in details.To showcase the system dynamics,a couple of agents are trained and the analysis of the competing results reveals the key pattern for winning the competition.It appears that a defensive agent is always defeated by an offensive agent,albeit the associated neural network has a very limited intelligence.When both agents are defensive,the system dynamics will remain stable and achieve the Nash equilibrium.Overall,the proposed dynamic system could serve a surrogate model and assist the study about how to escape the so-called Thucydides trap. 展开更多
关键词 cart-pole dynamics Reinforcement learning Thucydides trap Inverted pendulum
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部