已有关于系统惯性时空分布(spatial-temporal distribution of system inertia,SDSI)的研究大多聚焦于惯量估计,而对其概念的表征并不统一,也缺乏对其性质的深入剖析与相关概念的系统梳理与辨析。该文试图探索大扰动下系统惯性时空分布...已有关于系统惯性时空分布(spatial-temporal distribution of system inertia,SDSI)的研究大多聚焦于惯量估计,而对其概念的表征并不统一,也缺乏对其性质的深入剖析与相关概念的系统梳理与辨析。该文试图探索大扰动下系统惯性时空分布特性的表征形式。基于频率动态过程分析剖析了惯性时空分布特性,提出系统节点惯量概念并给出该参量的性质描述参量,基于惯性物理机理提出了这些参量的量化分析方法并推导了相关系数的差分计算公式。仿真算例验证了对系统惯性时空分布特性所做的分析与判断,利用所提出的表征形式可全面而规范地表征系统惯性时空分布特征。研究可为电力系统惯性时空分布特性表征体系的构建提供参考。展开更多
无人驾驶技术的关键是决策层根据感知环节输入信息做出准确指令。强化学习和模仿学习比传统规则更适用于复杂场景。但以行为克隆为代表的模仿学习存在复合误差问题,使用优先经验回放算法对行为克隆进行改进,提升模型对演示数据集的拟合...无人驾驶技术的关键是决策层根据感知环节输入信息做出准确指令。强化学习和模仿学习比传统规则更适用于复杂场景。但以行为克隆为代表的模仿学习存在复合误差问题,使用优先经验回放算法对行为克隆进行改进,提升模型对演示数据集的拟合能力;原DDPG(deep deterministic policy gradient)算法存在探索效率低下问题,使用经验池分离以及随机网络蒸馏技术(random network distillation,RND)对DDPG算法进行改进,提升DDPG算法训练效率。使用改进后的算法进行联合训练,减少DDPG训练前期的无用探索。通过TORCS(the open racing car simulator)仿真平台验证,实验结果表明该方法在相同的训练次数内,能够探索出更稳定的道路保持、速度保持和避障能力。展开更多
文摘已有关于系统惯性时空分布(spatial-temporal distribution of system inertia,SDSI)的研究大多聚焦于惯量估计,而对其概念的表征并不统一,也缺乏对其性质的深入剖析与相关概念的系统梳理与辨析。该文试图探索大扰动下系统惯性时空分布特性的表征形式。基于频率动态过程分析剖析了惯性时空分布特性,提出系统节点惯量概念并给出该参量的性质描述参量,基于惯性物理机理提出了这些参量的量化分析方法并推导了相关系数的差分计算公式。仿真算例验证了对系统惯性时空分布特性所做的分析与判断,利用所提出的表征形式可全面而规范地表征系统惯性时空分布特征。研究可为电力系统惯性时空分布特性表征体系的构建提供参考。
文摘无人驾驶技术的关键是决策层根据感知环节输入信息做出准确指令。强化学习和模仿学习比传统规则更适用于复杂场景。但以行为克隆为代表的模仿学习存在复合误差问题,使用优先经验回放算法对行为克隆进行改进,提升模型对演示数据集的拟合能力;原DDPG(deep deterministic policy gradient)算法存在探索效率低下问题,使用经验池分离以及随机网络蒸馏技术(random network distillation,RND)对DDPG算法进行改进,提升DDPG算法训练效率。使用改进后的算法进行联合训练,减少DDPG训练前期的无用探索。通过TORCS(the open racing car simulator)仿真平台验证,实验结果表明该方法在相同的训练次数内,能够探索出更稳定的道路保持、速度保持和避障能力。