期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
平均排队长度差最小的单交叉口在线Q学习模型
被引量:
6
1
作者
卢守峰
张术
刘喜敏
《公路交通科技》
CAS
CSCD
北大核心
2014年第11期116-122,共7页
为改善交叉口排队长度管理,避免交叉口某个方向排队长度过长,采用强化学习理论建立了以平均排队长度差最小为优化目标的在线Q学习模型。针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造...
为改善交叉口排队长度管理,避免交叉口某个方向排队长度过长,采用强化学习理论建立了以平均排队长度差最小为优化目标的在线Q学习模型。针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性。集成Excel VBA,Vissim,Matlab建立了在线仿真平台,作为计算环境对算例进行了计算。算例中利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定。计算结果表明以平均排队长度差作为优化目标能够提高各个方向排队长度的平衡性,优化整个交叉口的时空资源;建立的在线Q模型具有学习能力和较快的计算速度,模型能否收敛受到周期取值和可选行为数量的影响。
展开更多
关键词
交通工程
在线q学习
配时优化
排队长度
下载PDF
职称材料
平均排队长度差最小的单交叉口在线Q学习模型
2
作者
张术
韦钦平
《湖南理工学院学报(自然科学版)》
CAS
2013年第4期22-25,共4页
建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成Exce...
建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成Excel VBA、Vissim、Matlab建立了在线仿真平台,作为计算环境对模型进行了计算.利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定.计算结果表明以平均排队长度差作为优化目标能够优化整个交叉口的时空资源,本文建立的在线Q学习模型具有较快的收敛速度和鲁棒性,通过学习能够实现优化目标.
展开更多
关键词
交通控制
配时优化
排队长度
在线q学习
下载PDF
职称材料
基于在线附加Q学习的伺服电机速度最优跟踪控制方法
被引量:
6
3
作者
邹晓敏
肖曦
+1 位作者
何琪
Shkodyrev Vyacheslav
《电工技术学报》
EI
CSCD
北大核心
2019年第5期917-923,共7页
该文将在线Q学习方法与附加控制思想相结合,讨论了其在伺服系统中电机速度最优跟踪控制问题上的应用。首先在线性二次型跟踪器问题的框架下对待求解问题进行了定义;然后给出了在线附加Q学习迭代式地进行策略评价、策略改善的具体算法。...
该文将在线Q学习方法与附加控制思想相结合,讨论了其在伺服系统中电机速度最优跟踪控制问题上的应用。首先在线性二次型跟踪器问题的框架下对待求解问题进行了定义;然后给出了在线附加Q学习迭代式地进行策略评价、策略改善的具体算法。仿真测试中,首先为电机速度跟踪问题设计了传统的PI控制器,然后将基于该文思路所设计的附加控制器与其并联,组成新的速度控制器。仿真结果表明,附加控制器显著改善了电机速度跟踪的动态响应特性,并且具备在被控系统参数发生改变时自动调优的自适应能力。非线性系统在特定条件下可进行局部线性化时,也可用该方法来得到更优的控制性能。
展开更多
关键词
在线q学习
最优跟踪控制
附加控制
电机控制
速度控制
下载PDF
职称材料
基于在线附加Q学习的伺服电机速度最优跟踪控制方法研究
4
作者
刘辉
《中文科技期刊数据库(文摘版)工程技术》
2022年第1期113-116,共4页
本文对在线Q学习的方法和附加理论相结合,对伺服电机的最优跟踪控制方法进行相关研究。在线性二次跟踪模型的基础上,对其进行相应的定义,之后提出一种迭代式的在线附加Q学习策略,并结合仿真模型对其进行测试和评价,按照仿真结果来看,该...
本文对在线Q学习的方法和附加理论相结合,对伺服电机的最优跟踪控制方法进行相关研究。在线性二次跟踪模型的基础上,对其进行相应的定义,之后提出一种迭代式的在线附加Q学习策略,并结合仿真模型对其进行测试和评价,按照仿真结果来看,该方法具有良好的动态响应能力,能够根据实际变化进行自适应,在特定条件下对局部线性进行优化的过程中,该方法同样具有良好的适应性。
展开更多
关键词
在线q学习
伺服电机速度
最优跟踪控制
附加控制
优化策略
下载PDF
职称材料
题名
平均排队长度差最小的单交叉口在线Q学习模型
被引量:
6
1
作者
卢守峰
张术
刘喜敏
机构
长沙理工大学交通运输工程学院
出处
《公路交通科技》
CAS
CSCD
北大核心
2014年第11期116-122,共7页
基金
国家自然科学基金项目(71071024)
湖南省自然科学基金项目(12JJ2025)
长沙市科技局重点项目(K1106004-11)
文摘
为改善交叉口排队长度管理,避免交叉口某个方向排队长度过长,采用强化学习理论建立了以平均排队长度差最小为优化目标的在线Q学习模型。针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性。集成Excel VBA,Vissim,Matlab建立了在线仿真平台,作为计算环境对算例进行了计算。算例中利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定。计算结果表明以平均排队长度差作为优化目标能够提高各个方向排队长度的平衡性,优化整个交叉口的时空资源;建立的在线Q模型具有学习能力和较快的计算速度,模型能否收敛受到周期取值和可选行为数量的影响。
关键词
交通工程
在线q学习
配时优化
排队长度
Keywords
traffic engineering
on-line
q
learning
timing optimization
q
ueue length
分类号
U491 [交通运输工程—交通运输规划与管理]
下载PDF
职称材料
题名
平均排队长度差最小的单交叉口在线Q学习模型
2
作者
张术
韦钦平
机构
长沙理工大学交通运输工程学院
出处
《湖南理工学院学报(自然科学版)》
CAS
2013年第4期22-25,共4页
基金
湖南省自然科学基金重点项目(12JJ2025)
长沙市科技局重点项目(K1106004-11)
文摘
建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成Excel VBA、Vissim、Matlab建立了在线仿真平台,作为计算环境对模型进行了计算.利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定.计算结果表明以平均排队长度差作为优化目标能够优化整个交叉口的时空资源,本文建立的在线Q学习模型具有较快的收敛速度和鲁棒性,通过学习能够实现优化目标.
关键词
交通控制
配时优化
排队长度
在线q学习
Keywords
traffic control
timing optimization
q
ueue length
on-line
q
learning
分类号
U491 [交通运输工程—交通运输规划与管理]
下载PDF
职称材料
题名
基于在线附加Q学习的伺服电机速度最优跟踪控制方法
被引量:
6
3
作者
邹晓敏
肖曦
何琪
Shkodyrev Vyacheslav
机构
清华大学电机工程与应用电子技术系
陕西航空电气有限责任公司
圣彼得堡彼得大帝理工大学
出处
《电工技术学报》
EI
CSCD
北大核心
2019年第5期917-923,共7页
基金
国家自然科学基金(51577095)
清华大学自主科研计划支持项目资助
文摘
该文将在线Q学习方法与附加控制思想相结合,讨论了其在伺服系统中电机速度最优跟踪控制问题上的应用。首先在线性二次型跟踪器问题的框架下对待求解问题进行了定义;然后给出了在线附加Q学习迭代式地进行策略评价、策略改善的具体算法。仿真测试中,首先为电机速度跟踪问题设计了传统的PI控制器,然后将基于该文思路所设计的附加控制器与其并联,组成新的速度控制器。仿真结果表明,附加控制器显著改善了电机速度跟踪的动态响应特性,并且具备在被控系统参数发生改变时自动调优的自适应能力。非线性系统在特定条件下可进行局部线性化时,也可用该方法来得到更优的控制性能。
关键词
在线q学习
最优跟踪控制
附加控制
电机控制
速度控制
Keywords
Online
q
-learning
optimal tracking control
supplementary control
electric machine control
speed control
分类号
TM301.2 [电气工程—电机]
下载PDF
职称材料
题名
基于在线附加Q学习的伺服电机速度最优跟踪控制方法研究
4
作者
刘辉
机构
浙江卧龙伺服技术有限公司
出处
《中文科技期刊数据库(文摘版)工程技术》
2022年第1期113-116,共4页
文摘
本文对在线Q学习的方法和附加理论相结合,对伺服电机的最优跟踪控制方法进行相关研究。在线性二次跟踪模型的基础上,对其进行相应的定义,之后提出一种迭代式的在线附加Q学习策略,并结合仿真模型对其进行测试和评价,按照仿真结果来看,该方法具有良好的动态响应能力,能够根据实际变化进行自适应,在特定条件下对局部线性进行优化的过程中,该方法同样具有良好的适应性。
关键词
在线q学习
伺服电机速度
最优跟踪控制
附加控制
优化策略
分类号
TM3 [电气工程—电机]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
平均排队长度差最小的单交叉口在线Q学习模型
卢守峰
张术
刘喜敏
《公路交通科技》
CAS
CSCD
北大核心
2014
6
下载PDF
职称材料
2
平均排队长度差最小的单交叉口在线Q学习模型
张术
韦钦平
《湖南理工学院学报(自然科学版)》
CAS
2013
0
下载PDF
职称材料
3
基于在线附加Q学习的伺服电机速度最优跟踪控制方法
邹晓敏
肖曦
何琪
Shkodyrev Vyacheslav
《电工技术学报》
EI
CSCD
北大核心
2019
6
下载PDF
职称材料
4
基于在线附加Q学习的伺服电机速度最优跟踪控制方法研究
刘辉
《中文科技期刊数据库(文摘版)工程技术》
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部