检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

结合新颖性和风险评估的内在奖励方法被引量：1: 1; 作者赵英秦进袁琳琳《计算机工程与应用》 CSCD 北大核心 2023年第5期148-154,共7页; 强化学习算法依赖于精心设计的外在奖励,然而Agent在和环境交互过程中,环境反馈给Agent的外在奖励往往是非常稀少的或延迟,这导致了Agent无法学习到一个好的策略。为了解决该问题,从新颖性和风险评估这两方面设计一个内在奖励,使Agent... 展开更多; 关键词强化学习新颖性风险评估内在奖励; 下载PDF 职称材料

基于ECA和YOLOv4的轻量级目标检测网络设计: 2; 作者李秉涛何勇袁琳琳《传感器与微系统》 CSCD 北大核心 2023年第9期100-104,共5页; 针对传统的目标检测网络存在参数量大、检测速度慢等不足,在计算资源受限的设备上难以满足实时性需求的问题,提出一种改进的YOLOv4-tiny目标检测算法,使用Bneck_E替换主特征提取网络的CSP结构,在深层特征提取网络中,增加轻量级注意力机... 展开更多; 关键词目标检测 YOLOv4-tiny算法深度可分离卷积高效通道注意力; 下载PDF 职称材料

有限理性下不确定参数多目标博弈平衡的稳定性: 3; 作者陈聪利汤卫王春《运筹与模糊学》 2023年第2期1242-1257,共16页; 本文从有限理性的角度,建立了不确定参数下多目标博弈的有限理性模型,并通过构造特殊的理性函数,证明了在支付函数发生扰动的情况下,该有限理性模型是结构稳定的,并且对弱 ε-Pareto-NS平衡也是鲁棒的。进一步,我们通过具体算例对其平... 展开更多; 关键词有限理性多目标博弈不确定参数弱Pareto-NS平衡稳定性; 下载PDF 职称材料

结合向前状态预测和隐空间约束的强化学习表示算法被引量：4: 4; 作者项宇秦进袁琳琳《计算机系统应用》 2022年第11期148-156,共9页; 虽然深度强化学习能够解决很多复杂的控制问题,但是需要付出的代价是必须和环境进行大量的交互,这是深度强化学习所面临的一大挑战.造成这一问题的原因之一是仅依靠值函数损失难以让智能体从高维的复杂输入中提取有效特征.导致智能体对... 展开更多; 关键词强化学习表示方法状态转移隐空间约束连续控制高维度输入; 下载PDF 职称材料

基于遗传交叉算子的深度Q网络样本扩充被引量：1: 5; 作者杨彤秦进 +1 位作者谢仲涛袁琳琳《计算机系统应用》 2021年第12期155-162,共8页; 区别于传统深度强化学习中通过从经验回放单元逐个选择的状态转移样本进行训练的方式,针对采用整个序列轨迹作为训练样本的深度Q网络(Deep Q Network,DQN),提出基于遗传算法的交叉操作扩充序列样本的方法.序列轨迹是由智能体与环境交互... 展开更多; 关键词深度强化学习经验回放样本效率遗传算法; 下载PDF 职称材料

不确定参数下多目标博弈平衡的通有稳定性: 6; 作者陈聪利杨辉 +1 位作者王国玲汤卫《系统科学与数学》 CSCD 北大核心 2024年第3期711-722,共12页; 文章研究了不确定参数下多目标博弈平衡的存在性及通有稳定性.首先,文章运用向量值Ky Fan不等式证明了该博弈弱Pareto-NS平衡的存在性.其次,运用Fort定理,证明了大多数不确定参数下多目标博弈弱Pareto-NS平衡都是本质稳定的.最后,通过... 展开更多; 关键词不确定参数多目标博弈弱Pareto-NS平衡存在性通有稳定性; 原文传递

一种基于条件生成对抗网络的强化学习数据增强方法: 7; 作者项宇秦进袁琳琳《计算机与数字工程》 2024年第6期1739-1745,共7页; 强化学习用于序列决策问题上取得的成功越来越受到人们的重视,但是当使用高维状态作为输入时,仍然存在数据效率低下的问题。造成这个问题的原因之一是智能体难以从高维空间提取有效的特征。为了提高数据效率,论文提出一种适用于强化学... 展开更多; 关键词强化学习数据增强数据效率条件生成对抗网络雅达利游戏; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部