-
题名基于动态Q学习算法的情感自动机模型研究
被引量:1
- 1
-
-
作者
于冬梅
方建安
-
机构
东华大学信息科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2008年第5期172-173,176,共3页
-
基金
国家自然科学基金(60674088)
-
文摘
让计算机具有认知和表达自己情感的能力,培养其智能地对人类的情感做出反应是现阶段信息科学研究的热点内容。本文构建了基于动态Q学习算法的情感自动机模型,在该模型中,定义了情感元的概念,情感元应用动态Q学习算法来预测并感知环境的变化,从而改变自身情感来适应周围环境。
-
关键词
动态q学习算法
情感自动机
情感元
-
Keywords
Dynamic q-learning arithmetic, Emotion-automaton, Emotional unit
-
分类号
TP271.8
[自动化与计算机技术—检测技术与自动化装置]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于DP-SAMQ行为树的智能体决策模型研究
被引量:2
- 2
-
-
作者
陈妙云
王雷
丁治强
-
机构
中国科学技术大学信息科技学院
-
出处
《计算机仿真》
北大核心
2021年第2期301-307,共7页
-
基金
中科院创新基金(高技术项目CXJJ-17-M139)
中科院重大专项课题(KGFZD-135-18-027)。
-
文摘
在多智能体仿真中使用行为树进行决策具有直观、易扩展等优点,但行为树的设计过程过于复杂,人工调试时效率低下。引入Q-Learning来实现行为树的自动设计。为解决传统Q-Learning的收敛速度慢的问题,将模拟退火算法中的Metropolis准则应用到动作选择策略中,随着学习过程自适应改变次优动作的选择概率以及将动态规划思想应用到Q值更新策略。实验结果证明,基于改进的多步Q-Learning行为树的智能体决策模型具有更快的收敛速度,并且能够实现行为树的自动设计和优化。
-
关键词
多智能体
行为树
模拟退火
动态规划
用动态规划和模拟退火改进的多步q学习
-
Keywords
Multi-agent
Behavior tree
Simulated annealing
Dynamic programming
DP-SAMq
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进Q学习的知识化制造自适应动态调度策略
被引量:4
- 3
-
-
作者
王玉芳
严洪森
-
机构
东南大学复杂工程系统测量与控制教育部重点实验室
东南大学自动化学院
南京信息工程大学自动化系
-
出处
《控制与决策》
EI
CSCD
北大核心
2015年第11期1930-1936,共7页
-
基金
国家自然科学基金重点项目(60934008)
中央高校基本科研业务费专项资金项目(2242014K10031)
-
文摘
针对知识化制造系统生产环境的不确定性,构建一个基于多Agent的知识化动态调度仿真系统.为了保证设备Agent能够根据当前的系统状态选择合适的中标作业,提出一种基于聚类-动态搜索的改进Q学习算法,以指导不确定生产环境下动态调度策略的自适应选择,并给出算法的复杂性分析.所提出的动态调度策略采用顺序聚类以降低系统状态维数,根据状态差异度和动态贪婪搜索策略进行学习.通过仿真实验验证了所提出动态调度策略的适应性和有效性.
-
关键词
知识化制造
自适应
动态调度
基于聚类-动态搜索的改进q学习算法
多Agent
-
Keywords
knowledgeable manufacturing
self-adaptive
dynamic scheduling
CDq algorithm
multi-Agent
-
分类号
TH165
[机械工程—机械制造及自动化]
-
-
题名面向用户的智能搜索引擎模型UOISE的研究
被引量:2
- 4
-
-
作者
柯佳
程显毅
李晓薇
-
机构
江苏大学工商管理学院
江苏大学计算机科学与通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第35期175-177,232,共4页
-
基金
江苏省研究生创新基金(xm-35)。
-
文摘
分析了传统搜索引擎所存在的问题,提出了一种面向用户的智能搜索引擎模型(User-Oriented Intelligence Search Engine,UOISE)和动态Q学习算法,UOISE模型由若干个Agent和知识库组成,针对用户个人信息以及用户的上网行为,分析用户的兴趣所在,从而推断出用户的意图,能有效地为用户提供真正需要的、即时的信息,为用户提供多层次个性化的信息服务。动态Q学习算法实现了Agent跟踪用户行为、推断用户兴趣的过程。对比实验表明,UOISE比普通检索工具具有更高的查全率和查准率。
-
关键词
智能搜索引擎
多AGENT系统
动态q学习
兴趣度
-
Keywords
intelligence search engine
multi-agent systems
dynamic q learning algorithm
user's interest
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-