-
题名自注意力与强化学习耦合的多智能体通信
- 1
-
-
作者
韩兆荣
钱宇华
刘郭庆
-
机构
山西大学大数据科学与产业研究院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第6期1134-1139,共6页
-
基金
国家自然科学基金项目(61672332)资助
山西省重点研发计划项目(201903D421003)资助
山西省教育厅科技成果转化与培育项目(2020CG001)资助.
-
文摘
利用通信规则的多智能体算法通过智能体间交互信息进行协作,而其中信息质量决定了智能体协作能力与完成任务的能力,是提升智能体表现的关键因素.目前通信规则型算法存在通信信息产生方式单一、信息冗余等问题.针对以上问题本文提出了基于自注意力机制的信息处理模块TDU以及适配的信息产生智能体算法.首先,通过改进适配信息生成的强化学习算法作为智能体网络,通过网络学习生成适配信息,提高了智能体间信息产生的适配性并固定了信息选择的范围,降低了信息处理的难度.之后,利用基于自注意力机制的信息处理模块,对生成的信息进行筛选,提取高价值信息进行传输,提高智能体传递信息质量.本文提出的算法在经典智能体通信规则测试环境Swtich Riddle中进行了大量实验,并与主流通信规则型算法进行对比.实验结果表明,本文提出算法有效提高了智能体信息质量,加快了智能体学习速度,增强了智能体通信能力.
-
关键词
强化学习
多智能体
不完全观测环境
自注意力机制
多智能体通信规则方法
-
Keywords
reinforcement lerning
multi-agent
inperfect observation environment
self-attention mechanism
communication rule-based multi-agent algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-