无线传感器网络中Re In For M多路径协议能保证网络可靠性,但未考虑节点能量动态变化和通信路径工况,随机选取下一跳转发节点的方式使得部分节点因被反复使用而快速失效,缩短了网络生命周期。针对该问题,在蚁群优化算法的基础上,结合蚁...无线传感器网络中Re In For M多路径协议能保证网络可靠性,但未考虑节点能量动态变化和通信路径工况,随机选取下一跳转发节点的方式使得部分节点因被反复使用而快速失效,缩短了网络生命周期。针对该问题,在蚁群优化算法的基础上,结合蚁群信息素浓度和节点剩余能量等因素,提出一种Re In For M协议多目标优化条件下的动态路由选择算法,将能耗和剩余能量作为多路径选择指标,共同决定下一跳最优节点。仿真结果表明,与原有Re In For M路由算法相比,该算法能够在保证数据传输可靠率的同时,更有效地均衡节点能耗。展开更多
针对移动智能体在未知环境下的路径规划问题,提出了基于探索-利用权衡优化的Q学习路径规划。对强化学习方法中固有的探索-利用权衡问题,提出了探索贪婪系数ε值随学习幕数平滑衰减的εDBE(ε-decreasing based episodes)方法和根据Q表...针对移动智能体在未知环境下的路径规划问题,提出了基于探索-利用权衡优化的Q学习路径规划。对强化学习方法中固有的探索-利用权衡问题,提出了探索贪婪系数ε值随学习幕数平滑衰减的εDBE(ε-decreasing based episodes)方法和根据Q表中的状态动作值判断到达状态的陌生/熟悉程度、做出探索或利用选择的AεBS(adaptive ε based state)方法,这一改进确定了触发探索和触发利用的情况,避免探索过度和利用过度,能加快找到最优路径。在未知环境下对基于探索-利用权衡优化的Q学习路径规划与经典的Q学习路径规划进行仿真实验比较,结果表明该方法的智能体在未知障碍环境情况下具有快速学习适应的特性,最优路径步数收敛速度更快,能更高效实现路径规划,验证了该方法的可行性和高效性。展开更多
文摘无线传感器网络中Re In For M多路径协议能保证网络可靠性,但未考虑节点能量动态变化和通信路径工况,随机选取下一跳转发节点的方式使得部分节点因被反复使用而快速失效,缩短了网络生命周期。针对该问题,在蚁群优化算法的基础上,结合蚁群信息素浓度和节点剩余能量等因素,提出一种Re In For M协议多目标优化条件下的动态路由选择算法,将能耗和剩余能量作为多路径选择指标,共同决定下一跳最优节点。仿真结果表明,与原有Re In For M路由算法相比,该算法能够在保证数据传输可靠率的同时,更有效地均衡节点能耗。
文摘针对移动智能体在未知环境下的路径规划问题,提出了基于探索-利用权衡优化的Q学习路径规划。对强化学习方法中固有的探索-利用权衡问题,提出了探索贪婪系数ε值随学习幕数平滑衰减的εDBE(ε-decreasing based episodes)方法和根据Q表中的状态动作值判断到达状态的陌生/熟悉程度、做出探索或利用选择的AεBS(adaptive ε based state)方法,这一改进确定了触发探索和触发利用的情况,避免探索过度和利用过度,能加快找到最优路径。在未知环境下对基于探索-利用权衡优化的Q学习路径规划与经典的Q学习路径规划进行仿真实验比较,结果表明该方法的智能体在未知障碍环境情况下具有快速学习适应的特性,最优路径步数收敛速度更快,能更高效实现路径规划,验证了该方法的可行性和高效性。
基金Supported by National Natural Science Foundation of China(61273126)Research Foundation for the Doctoral Program of Higher Education of China(20130172110027)+1 种基金Fundamental Research Funds for the Central Universities(2013ZZ0056,2015ZM073)Ph.D Start-up Fund of Natural Science Foundation of Guangdong Province(2014A030310388)