期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种新的连续动作集学习自动机 被引量:2
1
作者 刘晓 毛宁 《数据采集与处理》 CSCD 北大核心 2015年第6期1310-1317,共8页
学习自动机(Learning automation,LA)是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,... 学习自动机(Learning automation,LA)是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,并且学习的精度取决于离散化的粒度。本文提出一种新的连续动作集学习自动机(Continuous action-set learning automaton,CALA),其动作集为一个可变区间,同时按照均匀分布方式选择输出动作。学习算法利用来自环境的二值反馈信号对动作区间的端点进行自适应更新。通过一个多模态学习问题的仿真实验,演示了新算法相对于3种现有CALA算法的优越性。 展开更多
关键词 机器学习 强化学习 在线学习 学习自动机 连续动作集学习自动机
下载PDF
一种求解动态及不确定性优化问题的新方法 被引量:1
2
作者 刘晓 《微电子学与计算机》 CSCD 北大核心 2016年第7期83-88,共6页
动态和不确定性优化问题,是许多智能优化算法面临的巨大挑战.介绍了一种可求解这类问题的连续动作学习自动机(Continuous-Action Learning Automaton,CALA).该自动机利用一个可变区间作为其动作集,并依照均匀分布方式产生输出动作.根据... 动态和不确定性优化问题,是许多智能优化算法面临的巨大挑战.介绍了一种可求解这类问题的连续动作学习自动机(Continuous-Action Learning Automaton,CALA).该自动机利用一个可变区间作为其动作集,并依照均匀分布方式产生输出动作.根据一个滑动窗口内的最佳的历史动作,对区间的两个端点进行更新.通过两个仿真实验,演示了该算法在时变的随机环境下的优异性能.相对于三种传统的CALA算法,新算法的学习精度、反应速度以及在最坏情况下的行为表现都非常出色. 展开更多
关键词 学习自动机 连续动作学习自动机 动态环境 不确定性环境 在线学习
下载PDF
一种用于随机优化的连续动作学习自动机 被引量:1
3
作者 刘晓 《航空计算技术》 2015年第5期73-77,共5页
学习自动机(LA)是一种随机优化技术,其中自动机的目标是从一个允许的动作集里选择最优的动作。现有LA的动作集大多都是有限集,因此对于连续参数学习问题,需要将动作空间离散化,并且解的精度取决于离散化的颗粒度。提出一种新的连续动作... 学习自动机(LA)是一种随机优化技术,其中自动机的目标是从一个允许的动作集里选择最优的动作。现有LA的动作集大多都是有限集,因此对于连续参数学习问题,需要将动作空间离散化,并且解的精度取决于离散化的颗粒度。提出一种新的连续动作学习自动机(CALA),其动作集为一个可变区间,并依照均匀分布选择输出动作。算法通过一种类似提高拟退火的方式确定一个"最新且最好"的动作,并根据该动作对区间的两个端点进行更新。通过优化一个被噪声污损的多模态函数的仿真实验,演示了新算法相对于三种现有的CALA算法的优越性。 展开更多
关键词 强化学习 在线学习 随机优化 学习自动机 连续动作学习自动机
下载PDF
基于学习自动机的容噪模式分类 被引量:1
4
作者 刘晓 《航空科学技术》 2020年第10期75-80,共6页
在模式分类学习问题中,训练数据中的标注差错(也称类别噪声)对分类器的性能有很大的影响。本文将一种新近提出的连续动作学习自动机(即聚焦区间学习自动机)应用于针对类别噪声的容噪学习问题。分类器采用简单的单隐层前馈神经网络,利用... 在模式分类学习问题中,训练数据中的标注差错(也称类别噪声)对分类器的性能有很大的影响。本文将一种新近提出的连续动作学习自动机(即聚焦区间学习自动机)应用于针对类别噪声的容噪学习问题。分类器采用简单的单隐层前馈神经网络,利用一个由这种学习自动机组成的自动机团队,对神经网络的权值参数进行学习。通过广义异或问题和Iris数据集的仿真试验,将该算法与两种基于群体搜索的优化算法——粒子群优化(PSO)和差分进化(DE)进行了比较研究。结果表明,新算法具有更好的容噪学习性能。 展开更多
关键词 模式分类 类别噪声 容噪学习 学习自动机 连续动作学习自动机
下载PDF
基于CARLA-PSO组合模型的智能控制器参数学习优化 被引量:4
5
作者 谷学静 张明儒 +1 位作者 王志良 郭宇承 《计算机应用研究》 CSCD 北大核心 2019年第3期677-680,共4页
对连续动作强化学习自动机(CARLA)进行了改进,应用改进后的CARLA结合粒子群优化算法(PSO)优化PID参数。以CARLA为基础,建立了CARLA和PSO的组合优化学习模型CARLA-PSO,该模型包含CAR-LA学习环路和PSO学习环路两个部分,通过优化策略选择... 对连续动作强化学习自动机(CARLA)进行了改进,应用改进后的CARLA结合粒子群优化算法(PSO)优化PID参数。以CARLA为基础,建立了CARLA和PSO的组合优化学习模型CARLA-PSO,该模型包含CAR-LA学习环路和PSO学习环路两个部分,通过优化策略选择器进行学习环路的选择,通过与环境进行相互作用,获得最优控制。对连铸结晶器液位控制进行了仿真实验,实验结果表明,CARLA-PSO在进行PID参数优化时寻优效率高,全局搜索能力强,能够达到理想的控制效果,具有较好的应用前景。 展开更多
关键词 连续动作学习强化自动机 粒子群优化算法 智能PID控制器 结晶器液位
下载PDF
A Reinforcement-learning-based Bidding Strategy for Power Suppliers with Limited Information 被引量:3
6
作者 Qiangang Jia Yiyan Li +2 位作者 Zheng Yan Chengke Xu Sijie Chen 《Journal of Modern Power Systems and Clean Energy》 SCIE EI CSCD 2022年第4期1032-1039,共8页
The power market is a typical imperfectly competitive market where power suppliers gain higher profits through strategic bidding behaviors.Most existing studies assume that a power supplier is accessible to the suffic... The power market is a typical imperfectly competitive market where power suppliers gain higher profits through strategic bidding behaviors.Most existing studies assume that a power supplier is accessible to the sufficient market information to derive an optimal bidding strategy.However,this assumption may not be true in reality,particularly when a power market is newly launched.To help power suppliers bid with the limited information,a modified continuous action reinforcement learning automata algorithm is proposed.This algorithm introduces the discretization and Dyna structure into continuous action reinforcement learning automata algorithm for easy implementation in a repeated game.Simulation results verify the effectiveness of the proposed learning algorithm. 展开更多
关键词 Power market bidding strategy limited information repeated game continuous action reinforcement learning automata
原文传递
高超声速飞行器滑模控制参数整定方法设计 被引量:1
7
作者 程志浩 王鹏 汤国建 《飞控与探测》 2022年第6期19-25,共7页
针对高超声速飞行器滑模控制人工试凑的参数整定方法较为繁琐和效率低的问题,改进了连续动作学习自动机(CARLA)算法,并将其应用于滑模控制参数整定问题中,改进后的算法通过对回报函数的设计有效克服了常规CARLA算法收敛速度慢、易受干... 针对高超声速飞行器滑模控制人工试凑的参数整定方法较为繁琐和效率低的问题,改进了连续动作学习自动机(CARLA)算法,并将其应用于滑模控制参数整定问题中,改进后的算法通过对回报函数的设计有效克服了常规CARLA算法收敛速度慢、易受干扰、求解效率低的问题。该算法引入控制性能指标评价函数,在迭代中学习阶跃响应的经验数据,实现了控制参数自整定。仿真结果表明,对于阶跃响应问题,该算法能够在100次迭代中整定出一组高品质的控制参数,完成对给定指令的快速准确跟踪,与遗传算法和模拟退火算法相比,在求解速度上具有显著优势。由于该方法不依赖于模型,除了滑模控制器参数整定外,对其他控制方法的控制参数整定问题也有一定适用性,具有推广应用价值。 展开更多
关键词 高超声速飞行器 姿态控制 控制参数整定 连续动作学习自动机 滑模控制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部