-
题名安全约束下合作型多智能体TD3算法
- 1
-
-
作者
郝禹哲
王振雷
-
机构
华东理工大学能源化工过程智能制造教育部重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第6期1692-1696,1701,共6页
-
基金
国家自然科学基金重大项目课题(62293502,62173147)
中央高校基本科研业务费专项资金资助项目(222202317006)
+1 种基金
高等学校学科创新引智计划资助项目(B17017)
上海人工智能实验室资助项目。
-
文摘
合作马尔可夫博弈中,每个智能体不仅要实现共同的目标,还需要保证联合动作能够满足设定的约束条件。为此提出了安全约束下的合作型多智能体TD3算法MACTD3(multi-agent constrainted twin delayed deep deterministic policy gradient)。首先,结合注意力机制对各个智能体采取的动作与决策过程约束条件进行了协调。然后利用拉格朗日乘子构造了修正的代价函数。进而为保证算法的收敛性,保证每一个智能体能够满足预先设定的约束条件,设计了不同时间尺度分学习策略:在短时间尺度上执行Actor-Critic网络的梯度下降,在长时间尺度上对拉格朗日参数进行迭代。最后在异质和同质的合作型多智能体环境下进行实验。实验结果表明,与其他算法相比,提出的MACTD3算法始终能够获得最小的惩罚成本;通过数量的扩展性实验表明了MACTD3在不同数量智能体的情况下仍然能够满足约束条件,证明了算法的有效性与扩展性。
-
关键词
安全强化学习
多智能体
拉格朗日乘子法
-
Keywords
safe reinforcement learning
multi-agent
Lagrangian multipliers
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于卷积神经网络的手势识别方法
被引量:11
- 2
-
-
作者
郝禹哲
张玉金
田海越
彭冬生
余洛
袁天夫
-
机构
上海工程技术大学电子电气工程学院
上海工程技术大学机械与汽车工程学院
无锡江南计算技术研究所
-
出处
《传感器与微系统》
CSCD
2020年第5期48-50,共3页
-
基金
上海市大学生创新项目(CS1802006)
上海市科委重点资助项目(18511101600)
上海市自然科学基金资助项目(17ZR1411900)。
-
文摘
使用手势图像作为输入,通过4个卷积层,每2个卷积层后接1个池化层。第一个卷积层利用64个3×3的3通道卷积核对128×128的原始手势图像进行特征提取,第二个卷积层利用32个3×3卷积核进行特征提取,并采用2×2的池化窗口进行降维,第三和第四个卷积层分别利用32个3×3的卷积核和16个3×3的卷积核提取特征,再用2×2的池化窗口进行降维。网络经过全连接后,利用Dropout技术移除一些节点及其相关的输入、输出连接后,将其送入SoftMax层进行分类判决。实验结果表明:所提方法的手势识别准确率可达到97%左右,验证了该模型的有效性。
-
关键词
手势识别
卷积神经网络
池化
深度学习
-
Keywords
gesture recognition
convolutional neural network(CNN)
pooling
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP212
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名关于残差网络的手势识别算法实现
被引量:1
- 3
-
-
作者
郝禹哲
袁天夫
田海越
-
机构
上海工程技术大学电子电气工程学院
上海工程技术大学机械与汽车工程学院
-
出处
《智能计算机与应用》
2020年第7期64-66,共3页
-
基金
国家大学生创新项目(201910856009)
-
文摘
残差网络作为卷积神经网络中的经典模型,受到了研究者的广泛关注,因此产生了多种衍生模型。同时,手势识别也是当前的热点研究领域,在利用残差网络实现手势识别方面已有大量研究成果。本文利用了多种残差网络模型的衍生模型,对ASL手势数据集进行训练,得到了不同模型下的实验结果。其中,训练结果最好的模型是Res Net18v1,它的识别正确率最高可达到93.3%。研究结果表明:在残差网络的衍生模型中,所堆叠的卷积层数越多,对准确率的提升效果不一定越强,需要根据任务要求,灵活选择模型并应用。
-
关键词
手势识别
卷积神经网络
残差网络
-
Keywords
Gesture recognition
Convolutional neural network
Residual Network
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于脸部特征分析的无人机跟拍系统
被引量:1
- 4
-
-
作者
顾佳欣
郝禹哲
苏婷婷
皇甫萍萍
段淇超
-
机构
上海工程技术大学电子电气工程学院
-
出处
《智能计算机与应用》
2019年第4期326-326,F0003,共2页
-
基金
国家大学生创新项目(201810856009)
上海市大学生创新训练项目(cs1802001,cs1802006)
-
文摘
目前四旋翼无人机的应用十分广泛,可用于新闻拍摄和高空拍摄.通过对人脸部进行特征分析,可以做到低空下的人脸识别和跟拍.本文针对动态人脸目标,采用Haar特征提取,其优势在于量化了人脸特征,可以较为容易地区分出人脸区域和非人脸区域,即使存在一定干扰如佩戴脸部饰品、帽子等情况下,也具有较好的识别准确度,因此本系统具有一定的应用价值.
-
关键词
四旋翼无人机
人脸识别
PID算法
-
Keywords
quadrotor
face recognition
PID algorithm
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于背景感知相关滤波的无人机目标跟踪算法
- 5
-
-
作者
苏婷婷
郝禹哲
顾佳欣
-
机构
上海工程技术大学电子电气工程学院
-
出处
《智能计算机与应用》
2019年第4期192-193,197,共3页
-
基金
国家大学生创新项目(201810856009)
上海市大学生创新训练项目(cs1802001,cs1802006)
-
文摘
四旋翼无人机可广泛适用于各种地形中,完成目标物的实时捕捉、动态跟踪等任务,商用前景非常可观.本文针对无人机目标跟踪问题,设计了一种基于背景感知相关滤波的目标跟踪系统.背景感知相关滤波算法与现有文献中的目标跟踪算法相比,其优势在于提取深度特征与空间约束相结合,目标跟踪拥有更高的实时性与准确性.实验结果表明,本文设计的无人机目标跟踪算法能够有效地识别与跟踪预设目标,本系统具有一定的应用价值.
-
关键词
四旋翼无人机
目标跟踪
相关滤波
背景感知相关滤波
-
Keywords
quad-rotor UAV
target tracking
correlation filters
background-aware correlation filters
-
分类号
TN2
[电子电信—物理电子学]
-