期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进PPO算法的自动驾驶技术研究
1
作者
姚悦
吉明佳
杨霄
《电子测量技术》
北大核心
2023年第8期162-168,共7页
针对强化学习在解决端到端自动驾驶行为决策问题时面临采样效率低、环境适应性差、决策效果不佳的问题,提出循环近端策略优化算法(RPPO),采用LSTM与移动翻转瓶颈卷积模块构建策略网络与价值网络,有效整合前后帧的关联信息,实现智能体对...
针对强化学习在解决端到端自动驾驶行为决策问题时面临采样效率低、环境适应性差、决策效果不佳的问题,提出循环近端策略优化算法(RPPO),采用LSTM与移动翻转瓶颈卷积模块构建策略网络与价值网络,有效整合前后帧的关联信息,实现智能体对多变情况的预测,提高智能体对环境的快速认知能力,并在价值网络添加L2正则化层,进一步提高算法的泛化能力,最后手动设置智能体在2个连续帧中保持动作不变,引入先验知识约束搜索空间,加快算法收敛。通过CARLA开源模拟环境测试,该改进方法与传统方法相比,奖励曲线明显占优,且直行、转弯、指定路线行驶3类任务的成功率分别提高了10%、16%、30%,证明提出的方法更有效。
展开更多
关键词
自动驾驶
强化学习
移动翻转瓶颈卷积
LSTM
下载PDF
职称材料
基于双生成器生成对抗网络的电力系统暂态稳定评估方法
被引量:
16
2
作者
杨东升
吉明佳
+2 位作者
周博文
卜思齐
胡博
《电网技术》
EI
CSCD
北大核心
2021年第8期2934-2944,共11页
当前采用深度学习网络实现电力系统暂态稳定评估,由于样本多样性不足,抗干扰性差等问题导致评估算法的分类性能受到很大的影响。针对上述问题提出了一种基于双生成器生成对抗网络(double generator LSTM-generative adversarial network...
当前采用深度学习网络实现电力系统暂态稳定评估,由于样本多样性不足,抗干扰性差等问题导致评估算法的分类性能受到很大的影响。针对上述问题提出了一种基于双生成器生成对抗网络(double generator LSTM-generative adversarial network,DGL-GAN)的暂态稳定评估方法。DGL-GAN中批量样本生成器与判别器构成对抗网络,通过交替训练学习暂态数据的分布特性,批量生成符合真实分布的新样本,解决样本多样性不足的问题;修复生成器由LSTM自编码器构成,其作用不但可以去除电力系统暂态数据中的噪声而且可以补偿仿真或量测缺失的片段,解决评估算法抗干扰能力差的问题。此外,提出的基于多层LSTM的网络结构设计可以进一步提高模型对暂态时序数据的特征提取能力。IEEE-39节点系统仿真结果表明:所提方法能够有效增强样本多样性,显著提升暂态稳定评估性能,同时还使得模型具有良好的抗干扰能力。
展开更多
关键词
电力系统
暂态稳定评估
生成对抗网络
长短期记忆网络
下载PDF
职称材料
题名
基于改进PPO算法的自动驾驶技术研究
1
作者
姚悦
吉明佳
杨霄
机构
北方自动控制技术研究所
出处
《电子测量技术》
北大核心
2023年第8期162-168,共7页
基金
军委科技委预先研究项目(2016330ZD01200101)资助。
文摘
针对强化学习在解决端到端自动驾驶行为决策问题时面临采样效率低、环境适应性差、决策效果不佳的问题,提出循环近端策略优化算法(RPPO),采用LSTM与移动翻转瓶颈卷积模块构建策略网络与价值网络,有效整合前后帧的关联信息,实现智能体对多变情况的预测,提高智能体对环境的快速认知能力,并在价值网络添加L2正则化层,进一步提高算法的泛化能力,最后手动设置智能体在2个连续帧中保持动作不变,引入先验知识约束搜索空间,加快算法收敛。通过CARLA开源模拟环境测试,该改进方法与传统方法相比,奖励曲线明显占优,且直行、转弯、指定路线行驶3类任务的成功率分别提高了10%、16%、30%,证明提出的方法更有效。
关键词
自动驾驶
强化学习
移动翻转瓶颈卷积
LSTM
Keywords
autonomous driving
reinforcement learning
mobile inverted bottleneck convolution
LSTM
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于双生成器生成对抗网络的电力系统暂态稳定评估方法
被引量:
16
2
作者
杨东升
吉明佳
周博文
卜思齐
胡博
机构
东北大学信息科学与工程学院
香港理工大学电机工程系
国网辽宁省电力有限公司
出处
《电网技术》
EI
CSCD
北大核心
2021年第8期2934-2944,共11页
基金
国家自然科学基金资助项目(U1908217)
辽宁省“兴辽英才计划”资助项目(XLYC1902055,XLYC1902090)
中央高校基本科研项目(N180415004)。
文摘
当前采用深度学习网络实现电力系统暂态稳定评估,由于样本多样性不足,抗干扰性差等问题导致评估算法的分类性能受到很大的影响。针对上述问题提出了一种基于双生成器生成对抗网络(double generator LSTM-generative adversarial network,DGL-GAN)的暂态稳定评估方法。DGL-GAN中批量样本生成器与判别器构成对抗网络,通过交替训练学习暂态数据的分布特性,批量生成符合真实分布的新样本,解决样本多样性不足的问题;修复生成器由LSTM自编码器构成,其作用不但可以去除电力系统暂态数据中的噪声而且可以补偿仿真或量测缺失的片段,解决评估算法抗干扰能力差的问题。此外,提出的基于多层LSTM的网络结构设计可以进一步提高模型对暂态时序数据的特征提取能力。IEEE-39节点系统仿真结果表明:所提方法能够有效增强样本多样性,显著提升暂态稳定评估性能,同时还使得模型具有良好的抗干扰能力。
关键词
电力系统
暂态稳定评估
生成对抗网络
长短期记忆网络
Keywords
power system
transient stability assessment
generative adversarial network
long short term memory
分类号
TM721 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进PPO算法的自动驾驶技术研究
姚悦
吉明佳
杨霄
《电子测量技术》
北大核心
2023
0
下载PDF
职称材料
2
基于双生成器生成对抗网络的电力系统暂态稳定评估方法
杨东升
吉明佳
周博文
卜思齐
胡博
《电网技术》
EI
CSCD
北大核心
2021
16
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部