-
题名深度强化学习局部策略迁移方法
- 1
-
-
作者
史腾飞
王莉
臧嵘
-
机构
北方自动控制技术研究所
太原理工大学计算机与科学技术学院(大数据学院)
山西证券股份有限公司
-
出处
《太原理工大学学报》
CAS
北大核心
2024年第4期705-711,共7页
-
文摘
【目的】强化学习策略迁移是一条降低深度强化学习训练消耗的有效途径,其中,局部策略迁移是在较小粒度上实现策略的迁移,它对整体策略性能的提升和策略灵活组合形成新整体策略有重要意义。提出了深度强化学习局部策略迁移方法。【方法】借鉴了软件工程中“高内聚,低耦合”的思想,通过对作为策略载体的神经网络进行划分,使得不同子神经网络承载不同局部策略,然后通过对子神经网络的迁移,实现局部策略迁移。该方法支持局部策略灵活替换和组合,形成性能更优秀和适应新环境的新总策略。选取经典深度强化学习算法DQN作为实验算法,对比DQN算法使用本文方法前后的迁移能力和表现性能。【结果】结果表明,DQN算法使用本文方法后实现了局部策略迁移的同时表现性能还提升了约27.5%.
-
关键词
深度强化学习
局部策略迁移
DQN
-
Keywords
deep reinforcement learning
local policy transfer
DQN
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名无线传感器网络LEACH路由协议改进算法
被引量:5
- 2
-
-
作者
白凤娥
孔新店
牟汇慧
-
机构
太原理工大学计算机与科学技术学院
-
出处
《计算机与数字工程》
2011年第2期44-46,101,共4页
-
文摘
路由协议是无线传感器网络网络层的核心技术,而路由协议中的路由算法却起着至关重要的作用。文章在LEACH协议基础上,提出了一种改进的LPEA路由算法。经过仿真分析,LPEA路由算法与LEACH算法相比,能进一步降低网络能量消耗,延长了网络生存周期。验证了该协议算法具有一定的可行性和有效性。
-
关键词
无线传感器网络
LEACH算法
LPEA算法
分簇
-
Keywords
wireless sensor network
LEACH algorithm
LPEA algorithm
clustering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于内容的图像情感语义检索研究
- 3
-
-
作者
张宇楠
陈俊杰
-
机构
太原理工大学计算机与科学技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第5期197-201,共5页
-
基金
国家自然科学基金资助项目(60970059
61070077
+2 种基金
61170136)
山西省自然科学基金项目(2010011020-2
2011011015-4)
-
文摘
基于内容的图像检索是使用图像的底层视觉特征对图像进行检索,使检索结果在视觉角度上尽可能相似。但能否通过图像的底层特征来准确体现人对图像的视觉感知(即图像的情感语义)有待于进一步的探索。首先构建检索性能较好的基于内容的图像检索系统,并针对分类标准不同的两类图像库进行多次实验。实验证明,图像的情感语义无法通过单一的图像底层特征描述。
-
关键词
图像
基于内容图像检索
情感语义
情感图像库
-
Keywords
Image Content-based image retrieval Affective semantics Affective image database
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-