期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
启发式强化学习机制的异构双种群蚁群算法
被引量:
6
1
作者
刘中强
游晓明
刘升
《计算机科学与探索》
CSCD
北大核心
2020年第3期460-469,共10页
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替...
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替换。算法初期利用启发式算子自适应地控制两个种群的交流频率,通过偏离度系数控制解的交换方式。前期让子种群的最优解去替换主种群的随机解,增加解的多样性,同时引入强化学习机制对交流后主种群最优路径上的信息素进行自适应的奖赏,以增大最优公共路径以后被选择的概率。后期则控制子种群的最优解去替换主种群的最差解,强化最优路径上信息素的量,并对主种群最优路径上的信息素进行奖赏,进一步提高算法的收敛速度。实验仿真表明,算法能够有效地跳出局部最优,并且解的质量在大规模测试集上有明显的改善。
展开更多
关键词
商旅问题(TSP)
异构双种群
偏离度系数
启发式强化学习
下载PDF
职称材料
基于启发式强化学习的多智能体覆盖问题研究
2
作者
贺荟霖
《现代计算机(中旬刊)》
2018年第5期8-11,共4页
针对多智能体覆盖问题存在的计算量大、收敛速度慢等问题,提出一种基于启发式强化学习的多智能体覆盖算法。利用智能体收集到的环境信息作为先验知识,对强化学习中智能体的行动选择进行引导。仿真实验表明,该算法在不影响覆盖效果的情...
针对多智能体覆盖问题存在的计算量大、收敛速度慢等问题,提出一种基于启发式强化学习的多智能体覆盖算法。利用智能体收集到的环境信息作为先验知识,对强化学习中智能体的行动选择进行引导。仿真实验表明,该算法在不影响覆盖效果的情况下有效提高覆盖问题的学习收敛速度。
展开更多
关键词
多智能体
启发式强化学习
覆盖问题
下载PDF
职称材料
基于启发式强化学习的空战机动智能决策
被引量:
51
3
作者
左家亮
杨任农
+2 位作者
张滢
李中林
邬蒙
《航空学报》
EI
CAS
CSCD
北大核心
2017年第10期212-225,共14页
空战机动智能决策一直是研究热点,现有的空战机动决策主要采用优化理论和传统的人工智能算法,是在相对固定的环境下进行决策序列计算研究。但实际空战是动态变化的,且有很多不确定性因素。采用传统的理论方法进行求解,很难获取与实际情...
空战机动智能决策一直是研究热点,现有的空战机动决策主要采用优化理论和传统的人工智能算法,是在相对固定的环境下进行决策序列计算研究。但实际空战是动态变化的,且有很多不确定性因素。采用传统的理论方法进行求解,很难获取与实际情况相符的决策序列。提出了基于启发式强化学习的空战机动智能决策方法,在与外界环境动态交互的过程中,采用"试错"的方式计算相对较优的空战机动决策序列,并采用神经网络方法对强化学习的过程进行学习,积累知识,启发后续的搜索过程,很大程度上提高了搜索效率,实现空战决策过程中决策序列的实时动态迭代计算。最后仿真实验结果表明本文提出的算法所计算的决策序列与实际情况相符。
展开更多
关键词
空战机动
智能决策
启发式强化学习
神经网络
决策序列
原文传递
移动机器人自主寻路避障启发式动态规划算法
被引量:
7
4
作者
方啸
郑德忠
《农业机械学报》
EI
CAS
CSCD
北大核心
2014年第7期73-78,共6页
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定...
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定义了连续型强化信号,使机器人通过学习,对优先寻路还是优先避障做出决策判断。为验证启发式动态规划算法在移动机器人寻路、避障问题上的学习能力,设计了3种不同的寻路、避障仿真实验:同目标、不同起始点,同起始点、不同目标,和移动目标仿真实验。仿真结果表明,对于不同的寻路、避障要求,基于启发式动态规划算法的移动机器人具有良好的学习及适应能力。
展开更多
关键词
移动机器人
寻路避障
启发
式
动态规划
强化
学习
下载PDF
职称材料
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
5
作者
胡馨允
沈悦
戴俊毅
《心理学报》
CSCD
北大核心
2023年第11期1793-1805,共13页
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷...
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷在于忽视了个体在任务过程中转换决策策略的可能性。通过开发允许在强化学习策略和启发式策略间转换的针对爱荷华赌博任务的计算认知模型,并将此类模型同单一策略模型进行对比,研究1提供了个体在该系列决策任务中会改变决策策略的明确证据。研究2则发现,随着试次数的增加,发生策略转换的可能性也会上升。这些结果表明,为了正确认识各种决策任务的决策策略,需要充分考虑在系列决策任务过程中发生策略转换的可能性,尤其是试次较多的系列任务。未来研究可以探讨策略转换的多种可能形式,以及导致策略转换的任务和个体因素,以便进一步深化对于系列决策任务的心理机制的认识。
展开更多
关键词
系列决策任务
爱荷华赌博任务
策略转换
计算认知建模
强化
学习
和
启发
式
策略
下载PDF
职称材料
题名
启发式强化学习机制的异构双种群蚁群算法
被引量:
6
1
作者
刘中强
游晓明
刘升
机构
上海工程技术大学电子电气工程学院
上海工程技术大学管理学院
出处
《计算机科学与探索》
CSCD
北大核心
2020年第3期460-469,共10页
基金
国家自然科学基金 Nos.61673258,61075115,61403249,61603242~~
文摘
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替换。算法初期利用启发式算子自适应地控制两个种群的交流频率,通过偏离度系数控制解的交换方式。前期让子种群的最优解去替换主种群的随机解,增加解的多样性,同时引入强化学习机制对交流后主种群最优路径上的信息素进行自适应的奖赏,以增大最优公共路径以后被选择的概率。后期则控制子种群的最优解去替换主种群的最差解,强化最优路径上信息素的量,并对主种群最优路径上的信息素进行奖赏,进一步提高算法的收敛速度。实验仿真表明,算法能够有效地跳出局部最优,并且解的质量在大规模测试集上有明显的改善。
关键词
商旅问题(TSP)
异构双种群
偏离度系数
启发式强化学习
Keywords
travelling salesman problem(TSP)
heterogeneous dual population
deviation coefficient
heuristic reinforcement learning
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于启发式强化学习的多智能体覆盖问题研究
2
作者
贺荟霖
机构
西南交通大学电气工程学院
出处
《现代计算机(中旬刊)》
2018年第5期8-11,共4页
文摘
针对多智能体覆盖问题存在的计算量大、收敛速度慢等问题,提出一种基于启发式强化学习的多智能体覆盖算法。利用智能体收集到的环境信息作为先验知识,对强化学习中智能体的行动选择进行引导。仿真实验表明,该算法在不影响覆盖效果的情况下有效提高覆盖问题的学习收敛速度。
关键词
多智能体
启发式强化学习
覆盖问题
Keywords
Multi-Agent
Heuristic Reinforcement Leanfing
Coverage
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于启发式强化学习的空战机动智能决策
被引量:
51
3
作者
左家亮
杨任农
张滢
李中林
邬蒙
机构
空军工程大学航空航天工程学院
空军驻沪宁地区军代表室
出处
《航空学报》
EI
CAS
CSCD
北大核心
2017年第10期212-225,共14页
文摘
空战机动智能决策一直是研究热点,现有的空战机动决策主要采用优化理论和传统的人工智能算法,是在相对固定的环境下进行决策序列计算研究。但实际空战是动态变化的,且有很多不确定性因素。采用传统的理论方法进行求解,很难获取与实际情况相符的决策序列。提出了基于启发式强化学习的空战机动智能决策方法,在与外界环境动态交互的过程中,采用"试错"的方式计算相对较优的空战机动决策序列,并采用神经网络方法对强化学习的过程进行学习,积累知识,启发后续的搜索过程,很大程度上提高了搜索效率,实现空战决策过程中决策序列的实时动态迭代计算。最后仿真实验结果表明本文提出的算法所计算的决策序列与实际情况相符。
关键词
空战机动
智能决策
启发式强化学习
神经网络
决策序列
Keywords
air combat maneuvering
intelligence decision-making
heuristic reinforcement learning
neural network
de-cision sequence
分类号
V323 [航空宇航科学与技术—人机与环境工程]
原文传递
题名
移动机器人自主寻路避障启发式动态规划算法
被引量:
7
4
作者
方啸
郑德忠
机构
燕山大学电气工程学院
罗德岛大学电气工程学院
出处
《农业机械学报》
EI
CAS
CSCD
北大核心
2014年第7期73-78,共6页
基金
国家火炬计划资助项目
国家重点新产品专项基金资助项目(2009GJA20001)
文摘
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定义了连续型强化信号,使机器人通过学习,对优先寻路还是优先避障做出决策判断。为验证启发式动态规划算法在移动机器人寻路、避障问题上的学习能力,设计了3种不同的寻路、避障仿真实验:同目标、不同起始点,同起始点、不同目标,和移动目标仿真实验。仿真结果表明,对于不同的寻路、避障要求,基于启发式动态规划算法的移动机器人具有良好的学习及适应能力。
关键词
移动机器人
寻路避障
启发
式
动态规划
强化
学习
Keywords
Mobile robot Goal seeking with obstacle avoidance Heuristic dynamic programming Reinforcement learning
分类号
O221.3 [理学—运筹学与控制论]
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
5
作者
胡馨允
沈悦
戴俊毅
机构
浙江大学心理与行为科学系
出处
《心理学报》
CSCD
北大核心
2023年第11期1793-1805,共13页
基金
中央高校基本科研业务费专项资金(2018QNA3014)资助。
文摘
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷在于忽视了个体在任务过程中转换决策策略的可能性。通过开发允许在强化学习策略和启发式策略间转换的针对爱荷华赌博任务的计算认知模型,并将此类模型同单一策略模型进行对比,研究1提供了个体在该系列决策任务中会改变决策策略的明确证据。研究2则发现,随着试次数的增加,发生策略转换的可能性也会上升。这些结果表明,为了正确认识各种决策任务的决策策略,需要充分考虑在系列决策任务过程中发生策略转换的可能性,尤其是试次较多的系列任务。未来研究可以探讨策略转换的多种可能形式,以及导致策略转换的任务和个体因素,以便进一步深化对于系列决策任务的心理机制的认识。
关键词
系列决策任务
爱荷华赌博任务
策略转换
计算认知建模
强化
学习
和
启发
式
策略
Keywords
decision task with a sequence of trials
The Iowa Gambling Task
strategy switching
computational cognitive modeling
reinforcement learning and heuristic strategies
分类号
B842.1 [哲学宗教—基础心理学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
启发式强化学习机制的异构双种群蚁群算法
刘中强
游晓明
刘升
《计算机科学与探索》
CSCD
北大核心
2020
6
下载PDF
职称材料
2
基于启发式强化学习的多智能体覆盖问题研究
贺荟霖
《现代计算机(中旬刊)》
2018
0
下载PDF
职称材料
3
基于启发式强化学习的空战机动智能决策
左家亮
杨任农
张滢
李中林
邬蒙
《航空学报》
EI
CAS
CSCD
北大核心
2017
51
原文传递
4
移动机器人自主寻路避障启发式动态规划算法
方啸
郑德忠
《农业机械学报》
EI
CAS
CSCD
北大核心
2014
7
下载PDF
职称材料
5
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
胡馨允
沈悦
戴俊毅
《心理学报》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部