基于回归与深度强化学习的目标检测算法被引量：2

Deep Reinforcement Learning for Object Detection with Regression

下载PDF

导出

摘要基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为,其产生的候选区域形状和尺寸变化单一,导致目标检测精确度较低。为此,在基于深度强化学习的视觉目标检测算法基础上,提出联合回归与深度强化学习的目标检测算法。首先,深度强化学习agent根据初始候选区域所提取的信息决定相应搜索行动,根据行动选择下一个逼近真实目标的候选区域;然后,重复上述过程,直至agent能确定当前区域为目标区域时终止搜索过程;最后,由回归网络对当前区域坐标进行回归,达到精确定位目的。实验结果显示,在单类别目标检测中,与原算法相比其精度提高了5.4%,表明通过引入回归有效提高了目标检测精确度。 The object detection algorithm based on reinforcement learning usually adopts predefined search actions in the detection process and the shape and size of the proposal regions generated by them are not changed much,resulting in low accuracy of object detection.For this reason,based on the deep reinforcement object detection algorithm,we proposed an object detection algorithm by combining regression with deep reinforcement learning.Firstly,the agent determines the search action according to the information extracted from the initial proposal regions,and then selects the next proposal region approaching the ground truth according to the action.Then the above process is repeated until agent has enough confidence to determine the current region as the ground truth,and then the search process is terminated.Finally,the current region coordinates are regressed by the regression network to achieve a better localization.Compared with the original algorithm,the accuracy of single-class object detection is improved by5.4%,which indicates that the accuracy of visual object detection is improved effectively by introducing regression.

作者舒朗郭春生 SHU Lang;GUO Chun-sheng(School of Communication Engineering, HangZhou DianZi University, Hangzhou 310018, China)

机构地区杭州电子科技大学通信工程学院

出处《软件导刊》 2018年第12期56-60,共5页 Software Guide

基金国家自然科学基金项目(F010403)

关键词目标检测强化学习深度学习回归网络 object detection reinforcement learning deep learning regression network

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：268
2刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：475

二级参考文献12

1魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
2高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
3王皓,高阳,陈兴国.强化学习中的迁移:方法和进展[J].电子学报,2008,36(B12):39-43. 被引量：27
4蒋国飞,吴沧浦.Q学习算法在库存控制中的应用[J].自动化学报,1999,25(2):236-241. 被引量：20
5高阳,周志华,何佳洲,陈世福.基于Markov对策的多Agent强化学习模型及算法研究[J].计算机研究与发展,2000,37(3):257-263. 被引量：30
6孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：624
7余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：611
8傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：26
9李宁,高阳,陆鑫,陈世福.一种基于强化学习的学习Agent[J].计算机研究与发展,2001,38(9):1051-1056. 被引量：26
10杨煜普,欧海涛.基于再励学习与遗传算法的交通信号自组织控制[J].自动化学报,2002,28(4):564-568. 被引量：12

共引文献718

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：3
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：46
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4张磊,母亚双,潘泉.基于改进深度双Q网络的移动机器人路径规划算法[J].信息与控制,2024,53(3):365-376. 被引量：1
5项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
6李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
7周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：7
8安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：8
9李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
10王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.

同被引文献26

1张磊,李升波,王建强,李克强.基于神经网络方法的集成式驾驶员跟车模型[J].清华大学学报（自然科学版）,2008,48(11):1985-1988. 被引量：13
2徐志,杨孝宽,赵晓华,李玲洁.基于神经网络的应急疏散状态下车辆跟驰模型[J].北京工业大学学报,2011,37(6):882-887. 被引量：3
3程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：120
4许轲,吴凤鸽,赵军锁.基于深度强化学习的软件定义卫星姿态控制算法[J].北京航空航天大学学报,2018,44(12):2651-2659. 被引量：5
5欧阳森,冯天瑞,李翔,王克英.基于Odds-Matrix算法的中长期电量组合预测方法及其应用[J].华南理工大学学报（自然科学版）,2014,42(8):39-44. 被引量：5
6谭运生,沈峘,黄满洪,梁中汉.采用方向预瞄的内模驾驶员模型[J].中国科技论文,2014,9(11):1275-1278. 被引量：4
7肖献强,任春燕.个性化驾驶人驾驶行为操纵模式建模方法[J].中国科技论文,2014,9(11):1292-1295. 被引量：3
8任其亮,孙丰瑞.基于动态交通诱导信息的驾驶员刺激-反应模型[J].重庆交通大学学报（自然科学版）,2015,34(5):100-105. 被引量：3
9郭鸿业,陈启鑫,夏清,邹鹏.电力市场中的灵活调节服务:基本概念、均衡模型与研究方向[J].中国电机工程学报,2017,37(11):3057-3066. 被引量：55
10刘威,张东霞,王新迎,侯金秀,刘丽平.基于深度强化学习的电网紧急控制策略研究[J].中国电机工程学报,2018,38(1):109-119. 被引量：106

引证文献2

1许杨子,强文,刘俊,孙鸿雁,胡成刚.基于改进深度强化学习算法的电力市场监测模型研究[J].国外电子测量技术,2020,39(1):82-87. 被引量：5
2赵栓峰,危培,王超,许倩.基于深度跟驰网络的驾驶行为预测[J].中国科技论文,2021,16(10):1105-1111.

二级引证文献5

1李瑜,张占强,孟克其劳,魏皓天.基于改进深度确定性策略梯度算法的微电网能量优化调度[J].电子测量技术,2023,46(2):73-80. 被引量：5
2彭超逸,张昆,胡亚平,聂涌泉.动态监测系统在电力市场环境下的应用[J].发电技术,2021,42(5):595-603. 被引量：4
3董礼,王胜华,华回春,郭海朝.中国现货电力市场中发电企业滥用市场力违规识别[J].中国电机工程学报,2021,41(24):8397-8407. 被引量：10
4王慧琴,苗国英,孙英博.基于多智能体强化学习值分解的优化算法[J].电子测量技术,2023,46(7):73-79. 被引量：1
5丁嘉伟.面向簇化移动机器人的网络资源调度算法[J].机床与液压,2024,52(11):47-52.

1宋婉娟,张剑.融合回归网络和多尺度特征表示的实时行人检测[J].电子测量与仪器学报,2018,32(7):15-20. 被引量：5
2赵国弟.与未来有约:深度职业体验引领学生生涯发展[J].上海教育,2018,0(30):34-34. 被引量：1
3肖君拥,牛春伊男.试析国际契约社会的实现路径——以国际公法为视角[J].清华法治论衡,2017(1):30-83.
4罗山.一种基于形态学与区域分析的车牌定位方法[J].山西电子技术,2018(6):11-14. 被引量：4
5程刚,郭永存,胡坤,王鹏彧.永磁涡流调速器传动性能分析与正交实验优化[J].机械科学与技术,2018,37(12):1948-1955. 被引量：6
6郭璘,王波.交叉路口摄像头视觉目标标定及误差校正仿真[J].计算机仿真,2018,35(11):141-144. 被引量：1
7刘宽斌,张涛.利用网络搜索大数据实现对CPI的短期预报及拐点预测——基于混频抽样数据模型的实证研究[J].当代财经,2018(11):3-15. 被引量：26
8郑晶翔,曹博,毕树生,杨东升.基于动态T-S模糊控制的视觉目标跟随[J].哈尔滨工业大学学报,2019,51(1):178-183. 被引量：3
9李佳华,马连博,王兴伟,程适,邵一川.基于多目标蜂群进化优化的微电网能量调度方法[J].郑州大学学报（工学版）,2018,39(6):50-58. 被引量：13
10张敏,车雨霏,张艳.差异性任务情境下用户移动诊疗信息搜索行为分析——一项实验研究[J].现代情报,2019,39(1):51-59. 被引量：12

软件导刊

2018年第12期

浏览历史

内容加载中请稍等...

基于回归与深度强化学习的目标检测算法被引量：2

参考文献2

二级参考文献12

共引文献718

同被引文献26

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于回归与深度强化学习的目标检测算法 被引量：2

参考文献2

二级参考文献12

共引文献718

同被引文献26

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于回归与深度强化学习的目标检测算法被引量：2