期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
结合向前状态预测和隐空间约束的强化学习表示算法 被引量:4
1
作者 项宇 秦进 袁琳琳 《计算机系统应用》 2022年第11期148-156,共9页
虽然深度强化学习能够解决很多复杂的控制问题,但是需要付出的代价是必须和环境进行大量的交互,这是深度强化学习所面临的一大挑战.造成这一问题的原因之一是仅依靠值函数损失难以让智能体从高维的复杂输入中提取有效特征.导致智能体对... 虽然深度强化学习能够解决很多复杂的控制问题,但是需要付出的代价是必须和环境进行大量的交互,这是深度强化学习所面临的一大挑战.造成这一问题的原因之一是仅依靠值函数损失难以让智能体从高维的复杂输入中提取有效特征.导致智能体对所处状态理解不足,从而不能正确给状态分配价值.因此,为了让智能体认识所处环境,提高强化学习样本效率,本文提出一种结合向前状态预测与隐空间约束的表示学习方法(regularized predictive representation learning,RPRL).帮助智能体从高维视觉输入中学习并提取状态特征,以此来提高强化学习样本效率.该方法用前向的状态转移损失作为辅助损失,使智能体学习到的特征包含环境转移的相关动态信息.同时在向前预测的基础上添加正则化项对隐空间的状态表示进行约束,进一步帮助智能体学习到高维度输入的平滑、规则表示.该方法在DeepMind Control(DMControl)环境中与其他的基于模型的方法以及加入了表示学习的无模型方法进行比较,都获得了更好的性能. 展开更多
关键词 强化学习 表示方法 状态转移 隐空间约束 连续控制 高维度输入
下载PDF
基于多级隐空间信息约束的噪声人脸超分辨率算法
2
作者 滕辎 于晓升 吴成东 《控制与决策》 EI CSCD 北大核心 2024年第5期1469-1477,共9页
为了实现强噪声和模糊干扰下的低清人脸图像重建,提出一种基于多级隐空间信息约束的噪声人脸超分辨率算法.首先设计一个用于人脸有效信息提取的特征蒸馏网络,并通过统计性抗干扰模型和隐空间特征对比算法移除噪声等无效信息,构建一个具... 为了实现强噪声和模糊干扰下的低清人脸图像重建,提出一种基于多级隐空间信息约束的噪声人脸超分辨率算法.首先设计一个用于人脸有效信息提取的特征蒸馏网络,并通过统计性抗干扰模型和隐空间特征对比算法移除噪声等无效信息,构建一个具有高噪声鲁棒性的人脸信息提取模型;然后,设计人脸重建网络,该网络利用提取的人脸特征重建高清人脸图像;最后,通过人脸身份嵌入模型和离散小波变换模型,分别从超球面身份度量空间和小波域进一步对重建人脸的身份信息和空间结构进行约束.实验结果表明,所提出的算法不仅能够有效去除高噪声环境下的人脸噪声,而且还能有效提升人脸图像分辨率,获得更高的峰值信噪比(peak signal-to-noise ratio, PSNR)和结构相似度(structural similarity index, SSIM),具有较好的实用性. 展开更多
关键词 特征蒸馏 空间信息约束 图像超分辨率 图像去噪 深度神经网络 超球面度量空间 小波变换
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部