期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
竞争式Takagi-Sugeno模糊再励学习 被引量:5
1
作者 晏雄伟 邓志东 孙增圻 《自动化学报》 EI CSCD 北大核心 2002年第6期873-880,共8页
针对连续空间的复杂学习任务 ,提出了一种竞争式 Takagi- Sugeno模糊再励学习网络(CTSFRLN) ,该网络结构集成了 Takagi- Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法 .文中相应提出了两种学习算法 ,即竞争式 Takagi- Sugen... 针对连续空间的复杂学习任务 ,提出了一种竞争式 Takagi- Sugeno模糊再励学习网络(CTSFRLN) ,该网络结构集成了 Takagi- Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法 .文中相应提出了两种学习算法 ,即竞争式 Takagi- Sugeno模糊 Q-学习算法和竞争式 Takagi- Sugeno模糊优胜学习算法 ,其把 CTSFRLN训练成为一种所谓的 Takagi- Sugeno模糊变结构控制器 .以二级倒立摆控制系统为例 ,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法 . 展开更多
关键词 学习 函数逼近 T-S模糊推理系统 机器学习 神经网络
下载PDF
面向语言评价的Takagi-Sugeno模糊再励学习
2
作者 晏雄伟 邓志东 孙增圻 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第10期1393-1396,共4页
综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模糊再励学习。该学习智能体构建在 Q-学习方法和 Takagi-Sugeno模糊推理系统的基础上 ,适于处理连续域的复... 综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模糊再励学习。该学习智能体构建在 Q-学习方法和 Takagi-Sugeno模糊推理系统的基础上 ,适于处理连续域的复杂学习任务 ,亦可用于设计 Takagi-Sugeno模糊逻辑控制器。以二级倒立摆控制系统为例 。 展开更多
关键词 语言评价 takagi-sugeno模糊再励学习 T-S模糊推理系统 神经-模糊控制 函数逼近 Q-学习 专家系统
原文传递
基于Takagi-Sugeno的再励学习模糊神经网络控制 被引量:3
3
作者 马力佳 高岩 《微计算机信息》 北大核心 2006年第06S期7-9,共3页
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算... 提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。 展开更多
关键词 倒立摆 Takagi—Sugeno 模糊推理系统 学习 模糊神经网络
下载PDF
卫星姿态再励学习的模糊神经控制 被引量:6
4
作者 管萍 刘星桥 陈家斌 《北京理工大学学报》 EI CAS CSCD 北大核心 2003年第3期313-316,326,共5页
将再励学习的模糊神经控制引入卫星姿态控制中,给出详尽的实现方法,推导了模糊神经控制器的自学习算法.直接利用再励信号,对控制器的参数进行在线调节,不需要控制器的学习样本.仿真结果表明该控制算法能有效地克服卫星的不确定性,具有... 将再励学习的模糊神经控制引入卫星姿态控制中,给出详尽的实现方法,推导了模糊神经控制器的自学习算法.直接利用再励信号,对控制器的参数进行在线调节,不需要控制器的学习样本.仿真结果表明该控制算法能有效地克服卫星的不确定性,具有较强的鲁棒性,可实现较高精度的卫星姿态控制. 展开更多
关键词 姿态控制 模糊神经控制 学习 神经网络
下载PDF
一种改进的基于再励学习算法的模糊神经BOXES控制系统 被引量:2
5
作者 马勇 许晓鸣 张卫东 《模糊系统与数学》 CSCD 2000年第1期78-83,共6页
本文给出了一种改进的基于再励算法的神经网络 BOXES控制系统 ,引入超维椭球体模糊划分状态空间的概念 ,并且通过神经网络的再励学习实现了对状态空间的自动划分。最后 ,应用到倒立摆控制中的仿真结果展示了控制系统的有效性。
关键词 模糊BOXES控制系统 学习算法 模糊控制
下载PDF
基于T-S模糊再励学习的稳定双足步态生成算法 被引量:2
6
作者 胡凌云 孙增圻 《机器人》 EI CSCD 北大核心 2004年第5期461-466,共6页
提出了一种基于T S模糊再励学习的稳定双足步态生成算法 .将再励学习引入T S模糊神经网学习增益参数 ,从而采用较少的模糊规则充分逼近了由ZMP曲线到髋关节轨迹的非线性变化关系 ,并将连续空间的多变量变化转换为一维独立动作增益的并... 提出了一种基于T S模糊再励学习的稳定双足步态生成算法 .将再励学习引入T S模糊神经网学习增益参数 ,从而采用较少的模糊规则充分逼近了由ZMP曲线到髋关节轨迹的非线性变化关系 ,并将连续空间的多变量变化转换为一维独立动作增益的并行搜索 .仿真结果和双足机器人Luna的实验数据都验证了算法的可行性 . 展开更多
关键词 双足机器人 T-S模糊学习网络 稳定
下载PDF
基于再励学习的交流调速系统模糊神经网络控制 被引量:1
7
作者 杨威 赵金 张华军 《微电机》 北大核心 2011年第1期27-30,共4页
针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在线训练方法,仿真对比了输入空间的划分即模糊子集数量对模糊神经网络控制器的训练及其控制效果的影响。... 针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在线训练方法,仿真对比了输入空间的划分即模糊子集数量对模糊神经网络控制器的训练及其控制效果的影响。仿真结果表明该速度控制器能通过在线训练方式获得最优参数以适应被控对象的参数变化,能使系统获得优良的动态和静态性能。 展开更多
关键词 模糊神经网络 遗传算法 学习 交流调速
下载PDF
基于再励学习的地铁列车运行过程的模糊自适应控制
8
作者 滕振宇 武妍 《计算机工程》 CAS CSCD 北大核心 2003年第20期63-65,共3页
提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案,解决了多控制目标下列车控制问题,确保了列车准确运行。仿真取得了令人满意的结果。结果表明,这种将模糊控制和再励学习相结合的智能控制方法综合用于列车运... 提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案,解决了多控制目标下列车控制问题,确保了列车准确运行。仿真取得了令人满意的结果。结果表明,这种将模糊控制和再励学习相结合的智能控制方法综合用于列车运行控制是可行的,可以较好地保证舒适性、停车准确性和正点性。 展开更多
关键词 ATO 模糊控制 学习 多目标控制 地铁列车 自适应控制
下载PDF
基于模糊神经网络再励学习控制器设计及其在倒车模型中的应用
9
作者 陈涌 陈涛 马勇 《电机与控制学报》 EI CSCD 北大核心 2003年第3期264-266,共3页
考虑到神经网络学习算法的特点,给出了一种基于再励学习的自组织模糊CPN。它结合了模糊自组织CPN和再励算法的优点,在控制过程中在线调整网络结构以及对网络参数学习,学习效率高,控制结构简单。可以不要求受控对象的学习模型,实现在线控... 考虑到神经网络学习算法的特点,给出了一种基于再励学习的自组织模糊CPN。它结合了模糊自组织CPN和再励算法的优点,在控制过程中在线调整网络结构以及对网络参数学习,学习效率高,控制结构简单。可以不要求受控对象的学习模型,实现在线控制,应用在倒车模型中仿真结果展示了所设计系统的良好控制性能。 展开更多
关键词 学习控制器 设计 模糊神经网络 倒车模型
下载PDF
基于再励学习蚁群算法的多约束QoS路由方法 被引量:10
10
作者 陈岩 杨华江 沈林成 《计算机科学》 CSCD 北大核心 2007年第5期25-27,44,共4页
本文研究了多约束QoS路由问题,给出基于模糊评判的路由模型,实现了多QoS约束的综合优化;同时提出一种再励学习蚁群路由算法对该问题进行求解,算法通过对蚂蚁搜索路径进行评价产生再励信号,并根据再励信号采取了不同的信息素更新策略,提... 本文研究了多约束QoS路由问题,给出基于模糊评判的路由模型,实现了多QoS约束的综合优化;同时提出一种再励学习蚁群路由算法对该问题进行求解,算法通过对蚂蚁搜索路径进行评价产生再励信号,并根据再励信号采取了不同的信息素更新策略,提高了算法的寻优能力和收敛速度。仿真实验表明,该算法能快速得到较大程度满足业务QoS要求的路径。 展开更多
关键词 多约束QOS 模糊评判 网络路由 学习 蚁群算法
下载PDF
面向多机器人路径规划的一种基于模糊模型的再励函数结构 被引量:3
11
作者 张芳 颜国正 林良明 《光学精密工程》 EI CAS CSCD 2002年第2期148-153,共6页
再励学习 ,作为一种新兴的智能学习模式 ,由于学习机制简单 ,不需要任何先验知识 ,也不需要样本数据 ,被越来越多地用于未知环境模型系统的学习。而目前再励学习存在的问题之一是学习速度不高 ,难以保证系统的实时性。在已有的再励学习... 再励学习 ,作为一种新兴的智能学习模式 ,由于学习机制简单 ,不需要任何先验知识 ,也不需要样本数据 ,被越来越多地用于未知环境模型系统的学习。而目前再励学习存在的问题之一是学习速度不高 ,难以保证系统的实时性。在已有的再励学习系统中 ,再励函数多采用无模型表示结构 ,这种结构过于简单粗糙 ,也是再励学习学习效率低下的主要原因之一。因此 ,本文结合多机器人协调避障路径规划问题 ,提出一种新的基于模糊模型的再励函数结构 ,这种结构将反映机器人基本行为如躲避障碍物、其它机器人和趋向目标等的再励函数子函数进行分层建模 ,并取模糊加权和来表示总的再励函数。仿真试验表明 ,使用基于模糊模型的再励函数结构使再励学习的收敛速度要高于无模型结构。 展开更多
关键词 机器人 学习 函数 模糊模型 避障路径规划
下载PDF
一类再励学习控制器设计及其在倒车模型中的应用 被引量:1
12
作者 马勇 杨煜普 +3 位作者 许晓鸣 石坚 卓斌 吴远朋 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第12期1661-1663,共3页
考虑到神经网络学习算法的特点 ,给出了一种基于再励学习的自组织模糊 CPN,它结合了自组织模糊 CPN和再励算法的优点 ,在控制过程中在线调整网络结构以及对网络参数学习 ,学习效率高 ,控制结构简单 .可以不要求受控对象的学习模型 ,实... 考虑到神经网络学习算法的特点 ,给出了一种基于再励学习的自组织模糊 CPN,它结合了自组织模糊 CPN和再励算法的优点 ,在控制过程中在线调整网络结构以及对网络参数学习 ,学习效率高 ,控制结构简单 .可以不要求受控对象的学习模型 ,实现在线控制 ,应用在倒车模型中仿真结果展示了所设计系统的良好控制性能 . 展开更多
关键词 自组织对传网络 学习 模糊控制 在线学习
下载PDF
TD再励学习在卫星姿态控制中的应用 被引量:1
13
作者 刘向东 崔晓婷 +1 位作者 王华 张宇河 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期248-250,共3页
随着卫星姿态控制系统对控制精度、鲁棒性和抗干扰要求的不断提高,将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,并采用基于时差(TD)法的再励学习来解决模糊神经网络参数在线调整的问题,可以在无需训练样本的前提下实现控制器的... 随着卫星姿态控制系统对控制精度、鲁棒性和抗干扰要求的不断提高,将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,并采用基于时差(TD)法的再励学习来解决模糊神经网络参数在线调整的问题,可以在无需训练样本的前提下实现控制器的在线学习.仿真结果表明,这种结合再励学习的控制算法不仅可以满足对姿态控制精度的要求,有效地抵制了外界干扰,并对卫星的不确定性有较强的鲁棒性. 展开更多
关键词 模糊神经网络 学习 时差法(TD)
下载PDF
再励学习在卫星姿态控制中的仿真研究
14
作者 崔晓婷 刘向东 张宇河 《计算机仿真》 CSCD 2006年第10期19-22,共4页
为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,即可以在不需要被控卫星的精确数学模型的前提下解决网络参数在线调整的问题,又可以在无需训练样本的前... 为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,即可以在不需要被控卫星的精确数学模型的前提下解决网络参数在线调整的问题,又可以在无需训练样本的前提下实现控制器的在线学习。最后同传统PID控制相比的仿真结果表明,基于再励学习的三轴稳定卫星姿态控制系统不仅可以达到卫星姿态控制任务对控制精度的要求,还可以有效地克服干扰,从而达到了在线学习的目的。 展开更多
关键词 学习 卫星姿态控制 模糊神经网络
下载PDF
基于再励模糊神经网络的三轴稳定卫星姿态智能控制
15
作者 王华 刘向东 《航天控制》 CSCD 北大核心 2005年第2期21-26,共6页
将再励学习引入模糊神经网络的T-S模型,建立了模糊神经网络控制器和控制评估网络的再励学习算法,并应用于三轴稳定卫星的姿态控制。这种再励模糊神经网络不需要精确的卫星数学模型和学习样本,通过再励学习实现控制网络/评估网络参数的... 将再励学习引入模糊神经网络的T-S模型,建立了模糊神经网络控制器和控制评估网络的再励学习算法,并应用于三轴稳定卫星的姿态控制。这种再励模糊神经网络不需要精确的卫星数学模型和学习样本,通过再励学习实现控制网络/评估网络参数的在线调节,具有比较强的适应性和学习能力。仿真结果表明,这种智能控制方法可以有效解决卫星的模型不确定性问题,提高了卫星姿态控制的精度和鲁棒性。 展开更多
关键词 三轴稳定卫星 姿态控制 模糊神经网络 学习 智能控制
下载PDF
再励学习在交通信号控制中的应用
16
作者 李丹 孙云兰 何希勤 《鞍山科技大学学报》 2003年第5期329-332,336,共5页
再励学习是一种利用评价信息 (而不是网络实际输出与期望输出之差 )来改善行为的神经模糊算法 ,采用“奖”“罚”信号训练控制器 .用再励学习的目的建立一个可调的模糊交通信号控制器 ,它能在不同交通情况下修改隶属函数参数 ,以达到较... 再励学习是一种利用评价信息 (而不是网络实际输出与期望输出之差 )来改善行为的神经模糊算法 ,采用“奖”“罚”信号训练控制器 .用再励学习的目的建立一个可调的模糊交通信号控制器 ,它能在不同交通情况下修改隶属函数参数 ,以达到较好的控制效果 .其评价指标是车辆延误 .仿真结果表明 。 展开更多
关键词 模糊 神经网络 交通信号控制 学习 车辆延误 仿真
下载PDF
基于Q-学习的卫星姿态在线模糊神经网络控制 被引量:2
17
作者 王华 崔晓婷 +1 位作者 刘向东 张宇河 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第3期226-229,共4页
将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,结合Q-学习和BP神经网络来解决模糊神经网络参数在线调整问题,在无需训练样本的前提下实现控制器的在线学习.仿真结果表明,这种基于Q-学习的模糊神经网络控制不仅可以满足对姿态控制... 将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,结合Q-学习和BP神经网络来解决模糊神经网络参数在线调整问题,在无需训练样本的前提下实现控制器的在线学习.仿真结果表明,这种基于Q-学习的模糊神经网络控制不仅可以满足对姿态控制精度的要求,还有效地抵制了外界干扰,提高了姿态稳定度,对卫星的不确定性有较强的鲁棒性. 展开更多
关键词 姿态控制 Q-学习 模糊神经网络 学习
下载PDF
基于模糊推理的踢球技术在足球机器人中的实现 被引量:2
18
作者 刘峻峰 顾洋 任雪梅 《北京理工大学学报》 EI CAS CSCD 北大核心 2003年第5期571-575,共5页
提出一种基于模糊规则作为先验知识的启发式搜索算法,解决足球机器人中的踢球问题.算法借助球员控球空间的离散化,采用模糊规则对离散后的动作进行评价,成功地描述了球在状态空间任意一对离散点间移动的代价值.以此作为路径寻找的启发... 提出一种基于模糊规则作为先验知识的启发式搜索算法,解决足球机器人中的踢球问题.算法借助球员控球空间的离散化,采用模糊规则对离散后的动作进行评价,成功地描述了球在状态空间任意一对离散点间移动的代价值.以此作为路径寻找的启发性知识,通过启发式搜索算法可寻找到最优的解决方案. 展开更多
关键词 模糊推理系统 启发式搜索 学习
下载PDF
程序控制、计算机控制系统
19
《电子科技文摘》 2000年第8期138-139,共2页
Y2000-62202-2315 0013932型Ⅱ模糊系统的再励调整=Reinforcement tuning oftype Ⅱ fuzzy systems[会,英]/Davis,C.& Peng,P.Y.//1999 IEEE Proceedings of American Control Con-ference,Vol.4 of 6.—2315~2319(NiD)本文研究了... Y2000-62202-2315 0013932型Ⅱ模糊系统的再励调整=Reinforcement tuning oftype Ⅱ fuzzy systems[会,英]/Davis,C.& Peng,P.Y.//1999 IEEE Proceedings of American Control Con-ference,Vol.4 of 6.—2315~2319(NiD)本文研究了型Ⅱ模糊系统的再励学习方案。通过调整型Ⅱ模糊控制器的参数,再励学习控制能够达到很高的控制性能。论文通过与其它不同模糊控制方案的比较,给出了杆平衡问题的例子。研究表示学习型Ⅱ模糊控制器具有与其它模糊控制方案类似的性能。 展开更多
关键词 计算机控制系统 模糊控制器 模糊系统 学习 程序控制 控制方案 控制性能 平衡问题 学习 调整型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部