期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于梯度奖励的深度强化学习移动机器人路径规划
1
作者 喻凯旋 林富生 +1 位作者 宋志峰 余联庆 《机床与液压》 北大核心 2023年第17期32-38,共7页
针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也... 针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也能获得正向奖励。首先输入机器人当前的位置坐标,经过神经网络后估计4个动作的Q值,随后通过去首动态贪婪策略达到最大化探索,最后采用基于均方误差的优先经验回放抽取样本进行梯度下降更新网络。实验结果表明:在小范围环境内探索效率可提升近40%,在大范围环境下成功率高于80%,而且在提高探索效率的同时增强了鲁棒性。 展开更多
关键词 深度强化学习 路径规划 梯度奖励 区域分割 去首动态贪婪策略
下载PDF
顾客忠诚的实施机理研究
2
作者 吴康善 《活力》 2008年第6期49-50,共2页
顾客忠诚计划之所以缺乏有效性,关键是企业缺乏足够的忠诚顾客存量。企业只有确保一定的忠诚顾客存量,并在此基础上开发新顾客和增加忠诚顾客数量,让忠诚顾客人气效应提高,忠诚顾客才能稳固和不断增加,即实施增量忠诚顾客战略。增... 顾客忠诚计划之所以缺乏有效性,关键是企业缺乏足够的忠诚顾客存量。企业只有确保一定的忠诚顾客存量,并在此基础上开发新顾客和增加忠诚顾客数量,让忠诚顾客人气效应提高,忠诚顾客才能稳固和不断增加,即实施增量忠诚顾客战略。增量忠诚顾客是在企业有足够忠诚顾客存量下,使忠诚顾客数量和质量有突破性的增加。 展开更多
关键词 顾客忠诚 增量忠诚顾客 人气效应 梯度奖励计划 忠诚顾客存量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部