针对深度增强学习算法中探索开发策略的平衡问题,提出一种基于VDBE(Value-Difference Based Exploration)扩展的自适应探索改进算法.该算法依赖于值函数差异提出一种基于状态的探索控制策略,以达到在初始学习阶段不熟悉周围环境时agent...针对深度增强学习算法中探索开发策略的平衡问题,提出一种基于VDBE(Value-Difference Based Exploration)扩展的自适应探索改进算法.该算法依赖于值函数差异提出一种基于状态的探索控制策略,以达到在初始学习阶段不熟悉周围环境时agent采取积极探索策略,而随着深入学习和周边环境的熟悉,agent逐渐降低探索率的自适应探索/开发平衡的理想行为状态.展开更多
针对新一代多用途视频编码(versatile video coding,VVC)标准相比上一代高效视频编码(high efficiency video coding,HEVC)采用了更多数目的时空预测模式,为相邻编码帧带来了更强的帧间相关性的问题,基于深度增强学习方法提出了一种适用...针对新一代多用途视频编码(versatile video coding,VVC)标准相比上一代高效视频编码(high efficiency video coding,HEVC)采用了更多数目的时空预测模式,为相邻编码帧带来了更强的帧间相关性的问题,基于深度增强学习方法提出了一种适用于VVC编码器的码率控制算法。首先选择合适的模型输入信息,包括帧间相关信息、分层编码结构信息和视频内容信息等;其次利用上述信息,结合长短期记忆(long short-term memory,LSTM)神经网络和增强学习方法,构建基于深度增强学习的帧间量化参数预测模型,以优化VVC编码器的码率控制过程;最后验证所提出算法的性能,将所提出算法在VTM 5.1平台实现,并与VVC源编码器进行性能对比。测试结果表明,在相同码率条件下,所提出算法相比于VVC源编码器,实现了BDBR平均节省1.81%和BDPSNR提升0.14 dB。展开更多
为了解决多路传输中子流耦合感知缺乏与传输控制效率低下等的问题,针对未来异构、动态的网络环境,提出了一种基于耦合感知与深度Q网络的多路传输控制机制(WaveLet and Deep Q Network based multipath transmission control mechanism,W...为了解决多路传输中子流耦合感知缺乏与传输控制效率低下等的问题,针对未来异构、动态的网络环境,提出了一种基于耦合感知与深度Q网络的多路传输控制机制(WaveLet and Deep Q Network based multipath transmission control mechanism,WL-DQN).利用小波去噪技术,消除子流单向传输时延中由非耦合路段及系统随机产生的噪声,并基于子流互相关系数对子流耦合特性进行提取;在此基础上,依据深度增强学习理论对多路传输控制进行建模,并提出多路DQN拥塞控制算法,实现了异构、动态网络环境下的智能多路拥塞控制.仿真结果表明,所提算法在传输吞吐量、传输时延、数据包重传避免等方面均优于标准及相似的代表性解决方案.展开更多
文摘针对深度增强学习算法中探索开发策略的平衡问题,提出一种基于VDBE(Value-Difference Based Exploration)扩展的自适应探索改进算法.该算法依赖于值函数差异提出一种基于状态的探索控制策略,以达到在初始学习阶段不熟悉周围环境时agent采取积极探索策略,而随着深入学习和周边环境的熟悉,agent逐渐降低探索率的自适应探索/开发平衡的理想行为状态.
文摘针对新一代多用途视频编码(versatile video coding,VVC)标准相比上一代高效视频编码(high efficiency video coding,HEVC)采用了更多数目的时空预测模式,为相邻编码帧带来了更强的帧间相关性的问题,基于深度增强学习方法提出了一种适用于VVC编码器的码率控制算法。首先选择合适的模型输入信息,包括帧间相关信息、分层编码结构信息和视频内容信息等;其次利用上述信息,结合长短期记忆(long short-term memory,LSTM)神经网络和增强学习方法,构建基于深度增强学习的帧间量化参数预测模型,以优化VVC编码器的码率控制过程;最后验证所提出算法的性能,将所提出算法在VTM 5.1平台实现,并与VVC源编码器进行性能对比。测试结果表明,在相同码率条件下,所提出算法相比于VVC源编码器,实现了BDBR平均节省1.81%和BDPSNR提升0.14 dB。
文摘为了解决多路传输中子流耦合感知缺乏与传输控制效率低下等的问题,针对未来异构、动态的网络环境,提出了一种基于耦合感知与深度Q网络的多路传输控制机制(WaveLet and Deep Q Network based multipath transmission control mechanism,WL-DQN).利用小波去噪技术,消除子流单向传输时延中由非耦合路段及系统随机产生的噪声,并基于子流互相关系数对子流耦合特性进行提取;在此基础上,依据深度增强学习理论对多路传输控制进行建模,并提出多路DQN拥塞控制算法,实现了异构、动态网络环境下的智能多路拥塞控制.仿真结果表明,所提算法在传输吞吐量、传输时延、数据包重传避免等方面均优于标准及相似的代表性解决方案.
文摘针对现有的深度获取方式存在数据缺失、分辨率低等问题,提出一种基于软聚类的深度图增强方法,称为软聚类求解器.该方法利用软聚类的强边缘保持特性提高深度图增强的精度.将软聚类仿射矩阵和加权最小二乘模型有机结合,构建了软聚类求解器中的置信加权最小二乘模型,提出了基于迭代的求解方法.为评估所提出的方法,在多项深度图增强任务上进行试验,包括深度图补洞、深度图超分辨率和深度图纠正,评价指标包含了峰值信噪比(PSNR)、结构相似度(SSIM)、均方根差(RMSE)和运行效率.结果表明:文中方法在深度图补洞任务中的平均PSNR达到了42.28,平均SSIM达到了98.83%;在深度图超分辨率、深度图纠正任务中的平均RMSE达到了8.96、 2.36.文中方法处理1张分辨率为2 048×1 024像素的图像仅需5.03 s.