基于分数阶网络和强化学习的图像实例分割模型被引量：2

Image instance segmentation model based on fractional-order network and reinforcement learning

下载PDF

导出

摘要针对目前的分数阶非线性模型图像特征提取能力不足导致分割精度较低的问题,提出一种基于分数阶网络和强化学习(RL)的图像实例分割模型,用来分割出图像中目标实例的高质量轮廓曲线。该模型共包含两层模块:1)第一层为二维分数阶非线性网络,主要采用混沌同步方法来获取图像中像素点的基础特征,并通过根据像素点间的相似性进行耦合连接的方式获取初步的图像分割结果;2)第二层通过RL思想将图像实例分割建立为一个马尔可夫决策过程(MDP),并利用建模过程中的动作−状态对、奖励函数和策略的设计来获取图像的区域结构和类别信息。最后将第一层获取到的像素特征和初步的图像分割结果与第二层获取到的区域结构和类别信息联合起来进行实例分割。在Pascal VOC2007和Pascal VOC2012数据集上的实验结果表明,这种基于连续决策的图像实例分割模型与传统的分数阶模型相比,平均精度(AP)至少提升了15个百分点,不仅能够获取图像中目标物体的类别信息,而且进一步提升了对图像轮廓细节和细粒度信息的提取能力。 Aiming at the low segmentation precision caused by the lack of image feature extraction ability of the existing fractional-order nonlinear models,an instance segmentation model based on fractional-order network and Reinforcement Learning(RL)was proposed to generate high-quality contour curves of target instances in the image.The model consists of two layers of modules:1)the first layer was a two-dimensional fractional-order nonlinear network in which the chaotic synchronization method was mainly utilized to obtain the basic characteristics of the pixels in the image,and the preliminary segmentation result of the image was acquired through the coupling and connection according to the similarity among the pixels;2)the second layer was to establish instance segmentation as a Markov Decision Process(MDP)based on the idea of RL,and the action-state pairs,reward functions and strategies during the modeling process were designed to extract the region structure and category information of the image.Finally,the pixel features and preliminary segmentation result of the image obtained from the first layer were combined with the region structure and category information obtained from the second layer for instance segmentation.Experimental results on datasets Pascal VOC2007 and Pascal VOC2012 show that compared with the existing fractional-order nonlinear models,the proposed model has the Average Precision(AP)improved by at least 15 percentage points,verifying that the sequential decision-based instance segmentation model not only can obtain the class information of the target objects in the image,but also further enhance the ability to extract contour details and fine-grained information of the image.

作者李学明吴国豪周尚波林晓然谢洪斌 LI Xueming;WU Guohao;ZHOU Shangbo;LIN Xiaoran;XIE Hongbin(College of Computer Science,Chongqing University,Chongqing 400044,China;School of Information Technology,Hebei University of Economics and Business,Shijiazhuang Hebei 050061,China;Chongqing Key Laboratory of Exogenic Mineralization and Mine Environment(Chongqing Institute of Geology and Mineral Resources),Chongqing 400042,China)

机构地区重庆大学计算机学院河北经贸大学信息技术学院外生成矿与矿山环境重庆市重点实验室(重庆地质矿产研究院)

出处《计算机应用》 CSCD 北大核心 2022年第2期574-583,共10页 journal of Computer Applications

基金河北省高等学校科学技术研究项目(QN2019069) 重庆市自然科学基金面上项目(cstc2019jcyj-msxmX0657)。

关键词强化学习分数阶网络混沌同步混沌吸引子马尔可夫决策过程像素−动作策略 Reinforcement Learning(RL) fractional-order network chaos synchronization chaotic attractor Markov Decision Process(MDP) pixel-action strategy

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：482
2禹思敏,林清华,丘水生.四维系统中多涡卷混沌与超混沌吸引子的仿真研究[J].物理学报,2003,52(1):25-33. 被引量：43

二级参考文献13

1魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
2高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
3王皓,高阳,陈兴国.强化学习中的迁移:方法和进展[J].电子学报,2008,36(B12):39-43. 被引量：27
4罗晓曙.利用相空间压缩实现混沌与超混沌控制[J].物理学报,1999,48(3):402-407. 被引量：33
5罗晓曙,方锦清,屈万里.用延长信号等效关联时间的方法实现超混沌控制[J].物理学报,1999,48(4):589-595. 被引量：7
6孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：625
7余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：614
8傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：26
9杨世平,牛海燕,田钢,袁国勇,张闪.用驱动参量法实现混沌系统的同步[J].物理学报,2001,50(4):619-623. 被引量：33
10岳丽娟,陈艳艳,彭建华.用系统变量比例脉冲方法控制超混沌的电路实验研究[J].物理学报,2001,50(11):2097-2102. 被引量：15

共引文献523

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：3
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：47
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4张磊,母亚双,潘泉.基于改进深度双Q网络的移动机器人路径规划算法[J].信息与控制,2024,53(3):365-376. 被引量：1
5李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
6周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：7
7李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
8王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.
9刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：2
10蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.

同被引文献12

1周宏宇,严春峰,宋旭,刘国英.基于加权三视角运动历史图像与时序分割的动作识别算法[J].电子测量与仪器学报,2020(11):194-203. 被引量：6
2Xi ZHANG,Ran-chao WU.Modified Projective Synchronization of Fractional-order Chaotic Systems with Different Dimensions[J].Acta Mathematicae Applicatae Sinica,2020,36(2):527-538. 被引量：2
3刘雨,周继和.对世界优秀男子网球运动员不同站位发球技术的运动学对比分析[J].体育科学,2020,40(8):58-64. 被引量：10
4田治国.基于特征提取的武术散打鞭腿动作视觉图像识别方法[J].齐齐哈尔大学学报（自然科学版）,2021,37(1):51-55. 被引量：2
5李庆宾,程春蕊,毛北行,薛均晓.分数阶化学反应混沌系统的滑模同步[J].数学的实践与认识,2021,51(13):189-193. 被引量：1
6金爱云,毛北行,王东晓.分数阶不确定混沌Tang系统的自适应滑模同步[J].数学的实践与认识,2021,51(14):247-252. 被引量：1
7张伟.基于图像分割的网球发球动作误差识别方法[J].宜春学院学报,2021,43(9):102-105. 被引量：1
8李娜,谭韶生.基于空间邻域信息的击剑连续动作图像分割[J].吉林大学学报（工学版）,2022,52(7):1639-1644. 被引量：2
9任欣雨,温华放,王飞,孙婧玥,孙敏.BGA焊点的图像分割识别方法[J].科技风,2023(1):10-12. 被引量：1
10覃学标,黄冬梅,宋巍,贺琪,杜艳玲,徐慧芳.基于目标检测及边缘支持的鱼类图像分割方法[J].农业机械学报,2023,54(1):280-286. 被引量：8

引证文献2

1柏宁,孙永梅.深度掩码下的网球运动员发球技术动作轮廓识别方法[J].安徽师范大学学报（自然科学版）,2024,47(1):69-74.
2颜闽秀,接敬锋.新分数阶混沌系统的电路仿真及自适应滑模控制[J].数学的实践与认识,2024,54(8):237-247.

1李茜,叶莎,李松阳,李德华.基于聚类算法的医院门诊预约调度模型研究[J].中国医学装备,2022,19(2):142-146. 被引量：2
2徐明.基于改进深度学习的变电站机器人巡检路径规划研究[J].自动化与仪表,2022,37(1):36-39. 被引量：4
3国子婧,冯旸赫,姚晨蝶,许乃夫.基于人类先验知识的强化学习综述[J].计算机应用,2021,41(S02):1-4. 被引量：2
4王昊,颜承昊,任俊丽,邵思扬.基于视觉的AUV自主水下管线跟踪方法[J].现代信息科技,2021,5(20):16-19.
5陈咏晖,胡矗明.移动众包平台的任务定价模型优化策略研究[J].科技管理研究,2022,42(1):149-155.
6武茜,贾世杰.基于多通道注意力机制的人脸替换鉴别[J].计算机工程,2022,48(2):180-185. 被引量：2
7沈国辉,赵荣生,董晓,邢强,陈中,袁浩,耿爱国,刘纪民.基于多信息交互与深度强化学习的电动汽车充电导航策略[J].南方电网技术,2022,16(1):108-116. 被引量：18
8李晓,许剑冰,李满礼,倪明,童和钦.考虑信息失效影响的配电网信息物理系统安全性评估方法[J].中国电力,2022,55(2):73-81. 被引量：10
9贺俊杰,张洁,张朋,汪俊亮,郑鹏,王明.基于长短期记忆近端策略优化强化学习的等效并行机在线调度方法[J].中国机械工程,2022,33(3):329-338. 被引量：8
10李琳,李玉泽,张钰嘉,魏巍.基于多估计器平均值的深度确定性策略梯度算法[J].郑州大学学报（工学版）,2022,43(2):15-21. 被引量：2

计算机应用

2022年第2期

浏览历史

内容加载中请稍等...

基于分数阶网络和强化学习的图像实例分割模型被引量：2

参考文献2

二级参考文献13

共引文献523

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分数阶网络和强化学习的图像实例分割模型 被引量：2

参考文献2

二级参考文献13

共引文献523

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分数阶网络和强化学习的图像实例分割模型被引量：2