期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于动态Q学习算法的情感自动机模型研究 被引量:1
1
作者 于冬梅 方建安 《计算机科学》 CSCD 北大核心 2008年第5期172-173,176,共3页
让计算机具有认知和表达自己情感的能力,培养其智能地对人类的情感做出反应是现阶段信息科学研究的热点内容。本文构建了基于动态Q学习算法的情感自动机模型,在该模型中,定义了情感元的概念,情感元应用动态Q学习算法来预测并感知环境的... 让计算机具有认知和表达自己情感的能力,培养其智能地对人类的情感做出反应是现阶段信息科学研究的热点内容。本文构建了基于动态Q学习算法的情感自动机模型,在该模型中,定义了情感元的概念,情感元应用动态Q学习算法来预测并感知环境的变化,从而改变自身情感来适应周围环境。 展开更多
关键词 动态q学习算法 情感自动机 情感元
下载PDF
基于DP-SAMQ行为树的智能体决策模型研究 被引量:2
2
作者 陈妙云 王雷 丁治强 《计算机仿真》 北大核心 2021年第2期301-307,共7页
在多智能体仿真中使用行为树进行决策具有直观、易扩展等优点,但行为树的设计过程过于复杂,人工调试时效率低下。引入Q-Learning来实现行为树的自动设计。为解决传统Q-Learning的收敛速度慢的问题,将模拟退火算法中的Metropolis准则应... 在多智能体仿真中使用行为树进行决策具有直观、易扩展等优点,但行为树的设计过程过于复杂,人工调试时效率低下。引入Q-Learning来实现行为树的自动设计。为解决传统Q-Learning的收敛速度慢的问题,将模拟退火算法中的Metropolis准则应用到动作选择策略中,随着学习过程自适应改变次优动作的选择概率以及将动态规划思想应用到Q值更新策略。实验结果证明,基于改进的多步Q-Learning行为树的智能体决策模型具有更快的收敛速度,并且能够实现行为树的自动设计和优化。 展开更多
关键词 多智能体 行为树 模拟退火 动态规划 动态规划和模拟退火改进的多步q学习
下载PDF
基于改进Q学习的知识化制造自适应动态调度策略 被引量:4
3
作者 王玉芳 严洪森 《控制与决策》 EI CSCD 北大核心 2015年第11期1930-1936,共7页
针对知识化制造系统生产环境的不确定性,构建一个基于多Agent的知识化动态调度仿真系统.为了保证设备Agent能够根据当前的系统状态选择合适的中标作业,提出一种基于聚类-动态搜索的改进Q学习算法,以指导不确定生产环境下动态调度策略的... 针对知识化制造系统生产环境的不确定性,构建一个基于多Agent的知识化动态调度仿真系统.为了保证设备Agent能够根据当前的系统状态选择合适的中标作业,提出一种基于聚类-动态搜索的改进Q学习算法,以指导不确定生产环境下动态调度策略的自适应选择,并给出算法的复杂性分析.所提出的动态调度策略采用顺序聚类以降低系统状态维数,根据状态差异度和动态贪婪搜索策略进行学习.通过仿真实验验证了所提出动态调度策略的适应性和有效性. 展开更多
关键词 知识化制造 自适应 动态调度 基于聚类-动态搜索的改进q学习算法 多Agent
原文传递
面向用户的智能搜索引擎模型UOISE的研究 被引量:2
4
作者 柯佳 程显毅 李晓薇 《计算机工程与应用》 CSCD 北大核心 2006年第35期175-177,232,共4页
分析了传统搜索引擎所存在的问题,提出了一种面向用户的智能搜索引擎模型(User-Oriented Intelligence Search Engine,UOISE)和动态Q学习算法,UOISE模型由若干个Agent和知识库组成,针对用户个人信息以及用户的上网行为,分析用户的兴趣所... 分析了传统搜索引擎所存在的问题,提出了一种面向用户的智能搜索引擎模型(User-Oriented Intelligence Search Engine,UOISE)和动态Q学习算法,UOISE模型由若干个Agent和知识库组成,针对用户个人信息以及用户的上网行为,分析用户的兴趣所在,从而推断出用户的意图,能有效地为用户提供真正需要的、即时的信息,为用户提供多层次个性化的信息服务。动态Q学习算法实现了Agent跟踪用户行为、推断用户兴趣的过程。对比实验表明,UOISE比普通检索工具具有更高的查全率和查准率。 展开更多
关键词 智能搜索引擎 多AGENT系统 动态q学习 兴趣度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部