-
题名结合向前状态预测和隐空间约束的强化学习表示算法
被引量:4
- 1
-
-
作者
项宇
秦进
袁琳琳
-
机构
贵州大学计算机科学与技术学院
贵州开放大学信息工程学院
-
出处
《计算机系统应用》
2022年第11期148-156,共9页
-
基金
国家自然科学基金(61562009)
贵州省科学技术基金(黔科合基础[2020]1Y275)
贵州省科技计划(黔科合基础[2019]1130号)
-
文摘
虽然深度强化学习能够解决很多复杂的控制问题,但是需要付出的代价是必须和环境进行大量的交互,这是深度强化学习所面临的一大挑战.造成这一问题的原因之一是仅依靠值函数损失难以让智能体从高维的复杂输入中提取有效特征.导致智能体对所处状态理解不足,从而不能正确给状态分配价值.因此,为了让智能体认识所处环境,提高强化学习样本效率,本文提出一种结合向前状态预测与隐空间约束的表示学习方法(regularized predictive representation learning,RPRL).帮助智能体从高维视觉输入中学习并提取状态特征,以此来提高强化学习样本效率.该方法用前向的状态转移损失作为辅助损失,使智能体学习到的特征包含环境转移的相关动态信息.同时在向前预测的基础上添加正则化项对隐空间的状态表示进行约束,进一步帮助智能体学习到高维度输入的平滑、规则表示.该方法在DeepMind Control(DMControl)环境中与其他的基于模型的方法以及加入了表示学习的无模型方法进行比较,都获得了更好的性能.
-
关键词
强化学习
表示方法
状态转移
隐空间约束
连续控制
高维度输入
-
Keywords
reinforcement learning
representation method
state transition
latent space constraint
continuous control
high dimensional input
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多级隐空间信息约束的噪声人脸超分辨率算法
- 2
-
-
作者
滕辎
于晓升
吴成东
-
机构
东北大学机器人科学与工程学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2024年第5期1469-1477,共9页
-
基金
国家自然科学基金项目(U20A20197,61973063)
辽宁省重点研发计划项目(2020JH2/10100040)
+1 种基金
辽宁省自然科学基金项目(2021-KF-12-01)
中国科学院光电信息处理重点实验室开放基金项目(OEIP-O-202005)。
-
文摘
为了实现强噪声和模糊干扰下的低清人脸图像重建,提出一种基于多级隐空间信息约束的噪声人脸超分辨率算法.首先设计一个用于人脸有效信息提取的特征蒸馏网络,并通过统计性抗干扰模型和隐空间特征对比算法移除噪声等无效信息,构建一个具有高噪声鲁棒性的人脸信息提取模型;然后,设计人脸重建网络,该网络利用提取的人脸特征重建高清人脸图像;最后,通过人脸身份嵌入模型和离散小波变换模型,分别从超球面身份度量空间和小波域进一步对重建人脸的身份信息和空间结构进行约束.实验结果表明,所提出的算法不仅能够有效去除高噪声环境下的人脸噪声,而且还能有效提升人脸图像分辨率,获得更高的峰值信噪比(peak signal-to-noise ratio, PSNR)和结构相似度(structural similarity index, SSIM),具有较好的实用性.
-
关键词
特征蒸馏
隐空间信息约束
图像超分辨率
图像去噪
深度神经网络
超球面度量空间
小波变换
-
Keywords
feature distillation
latent information constraint
image super-resolution
image denoising
deep neural network
hypersphere metric space
wavelet transform
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-