期刊文献+

基于强化学习的动态事故疏散 被引量:2

Dynamic Accident Evacuation Based on Reinforcement Learning
下载PDF
导出
摘要 随着现代城市的发展,智能建筑系统对事故的决策尤为重要。事故发生时往往具有极高的随机性,这给疏散带来了巨大的挑战。本文提出一种网格化的马尔科夫决策过程的动态事故模型,其中对事故高发区域进行了合理的仿真。进一步地,本文应用Q学习方法,通过动态探索以及合理的更新率,实现了动态事故的自适应决策方法。 With the development of modern city,intelligent building system is very important for accident decision.Accidents tend to occur with a high degree of randomness,which makes evacuation a huge challenge.In this paper,a dynamic accident model of Markov decision process based on grid is proposed.Furthermore,this paper applies Q learning method to realize the adaptive decision-making method of dynamic accidents through dynamic exploration and reasonable update rate.
作者 尉雅晨 Wei Yachen(Lanzhou Resources&Environment Voc-tech University,Lanzhou,China)
出处 《科学技术创新》 2023年第20期129-132,共4页 Scientific and Technological Innovation
关键词 动态事故模型 马尔科夫决策过程 Q学习 事故疏散 dynamic accident model markov decision process Q learning accident evacuation
  • 相关文献

参考文献3

二级参考文献9

共引文献147

同被引文献18

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部