检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于多步回溯Q(λ)学习算法的多目标最优潮流计算被引量：7: 1; 作者余涛胡细兵刘靖《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2010年第10期139-145,共7页; 为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成... 展开更多; 关键词电力系统最优潮流 q(λ)学习算法多目标优化强化学习; 下载PDF 职称材料

基于自加强学习算法的发电商报价策略研究被引量：17: 2; 作者马豫超蒋传文 +2 位作者候志俭 Ettore Bompard 王承民《中国电机工程学报》 EI CSCD 北大核心 2006年第17期12-17,共6页; 电力市场中发电商的决策过程和多发电商的相互作用过程是个复杂动态问题,很难用传统的解析方法进行分析计算,这在考虑中长时间段交易时尤为突出,且多代理作用机制是个很好的补充。文中提出了一个能够模拟发电商在市场中进行策略性报价... 展开更多; 关键词电力市场最优报价策略多代理自加强Watkins's q(λ)学习算法; 下载PDF 职称材料

基于Q(λ)-learning的移动机器人路径规划改进探索方法被引量：4: 3; 作者王健赵亚川 +1 位作者赵忠英张平陆《自动化与仪表》 2019年第11期39-41,67,共4页; 强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法... 展开更多; 关键词路径规划强化学习 q(λ)学习算法移动机器人搜索策略; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部