期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多智能体增强学习的公交驻站控制方法 被引量:6
1
作者 陈春晓 陈治亚 陈维亚 《计算机工程与应用》 CSCD 北大核心 2015年第17期8-13,27,共7页
车辆驻站是减少串车现象和改善公交服务可靠性的常用且有效控制策略,其执行过程需要在随机交互的系统环境中进行动态决策。考虑实时公交运营信息的可获得性,研究智能体完全合作环境下公交车辆驻站增强学习控制问题,建立基于多智能体系... 车辆驻站是减少串车现象和改善公交服务可靠性的常用且有效控制策略,其执行过程需要在随机交互的系统环境中进行动态决策。考虑实时公交运营信息的可获得性,研究智能体完全合作环境下公交车辆驻站增强学习控制问题,建立基于多智能体系统的单线公交控制概念模型,描述学习框架下包括智能体状态、动作集、收益函数、协调机制等主要元素,采用hysteretic Q-learning算法求解问题。仿真实验结果表明该方法能有效防止串车现象并保持单线公交服务系统车头时距的均衡性。 展开更多
关键词 驻站 智能增强学习 智能系统 控制策略
下载PDF
面向灾害预警的空间数据概念增强 被引量:4
2
作者 张晓辉 刘涛 杜萍 《自然灾害学报》 CSCD 北大核心 2020年第5期191-201,共11页
现阶段,灾害应急的空间数据为多源异构数据,存在质量良莠不齐、语义模型不统一、数学基础和分辨率不明确等问题。为了提高应急数据处理效率,有必要对现有空间数据进行概念增强处理。在研究了多种空间数据结构之后,本文提出了建立通用元... 现阶段,灾害应急的空间数据为多源异构数据,存在质量良莠不齐、语义模型不统一、数学基础和分辨率不明确等问题。为了提高应急数据处理效率,有必要对现有空间数据进行概念增强处理。在研究了多种空间数据结构之后,本文提出了建立通用元数据模型以进行高层次的结构与模式匹配,同时建立空间数据概念增强范式,以此对空间地物中单目标特征度量、目标间关系识别、群目标重要性排序、群目标聚类分析、群目标结构关系识别进行研究,提取灾害信息数据并对其进行本体建模,组合形成数据概念增强智能体。实验结果表明,此智能体可挖掘灾害隐藏信息,提高预警效率,实现可视化的空间数据概念增强。 展开更多
关键词 通用元数据 空间数据概念增强 灾害本 增强智能体 灾害预警
下载PDF
面向工业5G+时间敏感网络的分布式流调度策略
3
作者 李明妍 刘厚灵 古富强 《移动通信》 2023年第8期2-8,共7页
5G和时间敏感网络的融合是工业制造无线升级的关键技术。在3GPP发布的版本16中,研究的关键方向之一是增强5G系统以满足TSN支持的工业应用,助力提升工业互联网的实时转发与泛在感知能力。由于TSN和5G系统的服务质量保证机制相互独立,目... 5G和时间敏感网络的融合是工业制造无线升级的关键技术。在3GPP发布的版本16中,研究的关键方向之一是增强5G系统以满足TSN支持的工业应用,助力提升工业互联网的实时转发与泛在感知能力。由于TSN和5G系统的服务质量保证机制相互独立,目前5G系统仅作为逻辑网桥接入TSN网络中,因此5G与TSN联合部署仍处于融合初期。首先研究了5G和TSN协同流调度问题,基于5G低时延免授权接入技术和TSN循环排队转发协议,提出一种基于多智能体深度增强学习的5G+TSN分布式流调度策略,联合优化时效敏感流在5G和TSN网络中的调度决策,从而实现5G上行链路的无冲突传输并缓解TSN网络的队列溢出问题。通过仿真实验证明了该策略在学习环境非平稳下的鲁棒性。 展开更多
关键词 5G+工业互联网 时间敏感网络 智能深度增强学习
下载PDF
A distributed algorithm for signal coordination of multiple agents with embedded platoon dispersion model
4
作者 别一鸣 王殿海 +1 位作者 马东方 朱自博 《Journal of Southeast University(English Edition)》 EI CAS 2011年第3期311-315,共5页
In order to reduce average arterial vehicle delay, a novel distributed and coordinated traffic control algorithm is developed using the multiple agent system and the reinforce learning (RL). The RL is used to minimi... In order to reduce average arterial vehicle delay, a novel distributed and coordinated traffic control algorithm is developed using the multiple agent system and the reinforce learning (RL). The RL is used to minimize average delay of arterial vehicles by training the interaction ability between agents and exterior environments. The Robertson platoon dispersion model is embedded in the RL algorithm to precisely predict platoon movements on arteries and then the reward function is developed based on the dispersion model and delay equations cited by HCM2000. The performance of the algorithm is evaluated in a Matlab environment and comparisons between the algorithm and the conventional coordination algorithm are conducted in three different traffic load scenarios. Results show that the proposed algorithm outperforms the conventional algorithm in all the scenarios. Moreover, with the increase in saturation degree, the performance is improved more significantly. The results verify the feasibility and efficiency of the established algorithm. 展开更多
关键词 multiple agents signal coordination reinforce learning platoon dispersion model
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部