-
题名基于状态-动作联合掩码的自监督学习算法
- 1
-
-
作者
刘宇昕
项刘宇
何召锋
魏运
吴惠甲
王永钢
-
机构
北京邮电大学理学院
北京邮电大学人工智能学院
北京市地铁运营有限公司
-
出处
《计算机技术与发展》
2024年第11期125-132,共8页
-
基金
国家重点研发计划(2022YFB4501600)
国家自然科学基金(62176025)
北京市科技新星计划(20220484161)。
-
文摘
视觉强化学习以原始图像作为输入,面临着观测空间维度高、冗余信息多、采样效率低等挑战。现有研究大多通过构建一个自监督辅助任务来获取高维观测中的有效表征,然而这类方法仅关注状态特征,却忽略了动作空间中丰富的语义信息。针对这一问题,提出一种基于状态-动作联合掩码的自监督学习算法,通过对状态和动作进行联合掩码重构,从而学习到真正与任务相关的表征信息,提高采样效率。此外,为提高模型的鲁棒性,引入测试时自适应方法,在环境变化时冻结强化学习策略网络,仅对状态-动作联合掩码模块进行少量更新,利用自监督信号帮助智能体快速适应新环境。实验结果表明,该方法相比现有算法,在DMControl环境上的平均回报奖励提升了4.5%,在DMControl-GB环境上的平均回报奖励提升了20.2%,有效提升了模型的性能。
-
关键词
视觉强化学习
自监督学习
掩码模型
测试时自适应
鲁棒性
-
Keywords
visual reinforcement learning
self-supervision learning
mask model
test time adaptation
robustness
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名先验引导的虹膜图像盲修复算法
- 2
-
-
作者
王甲
项刘宇
黄昱博
夏玉峰
田青
何召锋
-
机构
北京邮电大学人工智能学院
北京邮电大学集成电路学院
北京邮电大学现代邮政学院(自动化学院)
北方工业大学信息学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第12期148-155,共8页
-
基金
国家自然科学基金(62176025,62106015,U21B2045)。
-
文摘
虹膜识别作为最有潜力的生物特征识别技术之一,已得到广泛应用。然而,现有的虹膜识别系统在图像采集过程中易受外界因素干扰,存在采集的虹膜图像分辨率不足、易模糊等问题。为解决以上问题,提出了一种先验引导的虹膜图像盲修复算法,利用生成对抗网络和虹膜先验知识对低分辨率、运动模糊、离焦模糊等降质因素混合的未知退化虹膜图像进行盲修复。修复网络包括退化去除子网络、先验估计子网络和先验融合子网络,其中先验估计子网络对输入的风格信息进行分布建模,并将其作为先验知识来指导生成网络;先验融合子网络利用注意力融合机制来整合多层级的风格特征,提高了信息的利用率。实验结果表明,所提方法在定性和定量指标上都优于其他算法,实现了退化虹膜的盲修复,提高了虹膜识别的鲁棒性。
-
关键词
虹膜修复
虹膜识别
虹膜分割
风格信息
注意力融合
-
Keywords
Iris restoration
Iris recognition
Iris segmentation
Style information
Attentive fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名当人类失去了右脑
- 3
-
-
作者
项刘宇
-
机构
湖北省武汉市外国语学校
-
出处
《课堂内外(创新作文)(高中版)》
2012年第10期22-23,共2页
-
文摘
人之所以为万物之灵长,大概是因为拥有发达的大脑吧,或者说,拥有发达的左脑。于是我们在进化的马拉松中超过了其他生物,在左脑的帮助下遥遥领先。
-
关键词
右脑
人类
马拉松
左脑
生物
-
分类号
G44
[哲学宗教—发展与教育心理学]
-
-
题名扬州第九“怪”
- 4
-
-
作者
项刘宇
王海蓉
-
机构
湖北省武汉市洪山区鲁巷小学五(
湖北省武汉市洪山区鲁巷小学
-
出处
《小星星(作文100分)(小学3-6年级)》
2006年第12期24-25,共2页
-
-
关键词
课堂练习
数学游戏
武汉市洪山区
游戏软件
停笔
珠心算
大群
大师级人物
惊险刺激
十年
-
分类号
G624.24
[文化科学—教育学]
-