检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到6篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

突破假设:走出探索与利用的管理困境: 1; 作者王侃《中国软科学》 CSSCI CSCD 北大核心 2019年第S01期100-106,共7页; 美国管理学家马奇教授于1991年首次提出普遍存在于管理实践中的探索与利用的管理困境问题,而后引发了学术界大量文献的探讨,然而已有研究仍未提供走出困境的清晰方案.本文首先通过引入西方冲突管理理论中的双重关怀模型,将探索与利用之... 展开更多; 关键词探索与利用的管理困境零和博弈假设正交假设静态假设战略学习; 下载PDF 职称材料

探索-利用困境再审视——基于主动推理的视角: 2; 作者王姝彦柴新《自然辩证法通讯》北大核心 2024年第7期24-31,共8页; 探索-利用困境是当代行为心理学和人工智能等研究领域中的难点问题之一。近些年来,随着神经科学、认知心理学、智能科学、管理科学等学科的不断发展以及脑成像技术的日益进步,有关探索-利用困境的探问也得到了多向路的推展和深化。其中... 展开更多; 关键词探索-利用困境主动推理预期自由能整合; 原文传递

联合随机性策略的深度强化学习探索方法: 3; 作者杨尚彤王子磊《信息技术与网络安全》 2021年第6期43-49,共7页; 目前深度强化学习算法已经可以解决许多复杂的任务,然而如何平衡探索和利用的关系仍然是强化学习领域的一个基本的难题,为此提出一种联合随机性策略的深度强化学习探索方法。该方法利用随机性策略具有探索能力的特点,用随机性策略生成... 展开更多; 关键词强化学习深度强化学习探索利用困境; 下载PDF 职称材料

一种新的蚁群优化算法信息素更新策略及其性能分析被引量：2: 4; 作者颜晨阳张友鹏熊伟清《计算机应用研究》 CSCD 北大核心 2007年第7期86-88,91,共4页; 针对蚁群优化算法的关键步骤——信息素轨迹更新过程进行了深入分析。通过理论上的证明和实验验证,提出了信息素轨迹更新中存在着一个利用—探索困境;在此基础上针对这个现象提出了一种基于Metrop-olis接受准则的信息素更新策略,并通过... 展开更多; 关键词蚁群优化算法信息素更新策略利用-探索困境 Metropolis接受准则; 下载PDF 职称材料

深度强化学习理论及其应用综述被引量：65: 5; 作者万里鹏兰旭光 +1 位作者张翰博郑南宁《模式识别与人工智能》 EI CSCD 北大核心 2019年第1期67-81,共15页; 一方面,随着深度强化学习理论和应用研究不断深入,其在游戏、机器人控制、对话系统、自动驾驶等领域发挥重要作用;另一方面,深度强化学习受到探索-利用困境、奖励稀疏、样本采集困难、稳定性较差等问题的限制,存在很多不足.面对这些问题... 展开更多; 关键词深度强化学习马尔科夫决策过程探索-利用困境稀疏奖励; 下载PDF 职称材料

一种核的上下文多臂赌博机推荐算法被引量：2: 6; 作者王鼎门昌骞王文剑《智能系统学报》 CSCD 北大核心 2022年第3期625-633,共9页; 个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不... 展开更多; 关键词个性化推荐变化场景多臂赌博机线性上下文多臂赌博机核方法点击率非线性探索–利用困境; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部