基于视觉注意机制深度强化学习的行人检测方法被引量：10

Deep reinforcement learning with visual attention for pedestrian detection

下载PDF

导出

摘要结合视觉注意机制,并用深度强化学习训练视点选择模型,模拟人类视觉搜索局部关键部位,提出了新的行人检测方法,通过视点选择模型生成聚焦图像,不断地叠加搜索关键区域,由检测网络对关键区域进行行人判别,并通过信息熵度量检测结果的可信度,作为奖赏通过深度强化学习优化视点选择模型。视点选择模型和检测网络协同迭代训练,使该方法具有很强的局部关键区域选择和判别能力,减少了形变和遮挡的影响。与经典的基于部位的行人检测方法在公开的行人检测数据集进行对比实验,结果表明,所提出的行人检测方法可以有效地提高行人检测精度。 The visual attention mechanism is introduced proposes A new pedestrian detection method is proposed,by introducing visual attention mechanism.Meanwhile,the deep reinforcement learning is applied to train the viewpoint selection model to simulate how human visual search local key parts.The method generates focused images by viewpoint selection model to search and overlay them together for key areas.The detecting network is used to identify pedestrian in these key areas.Then,information entropy is computed for measuring the reliability of the result and optimizes the viewpoint selection model as a reward for deep reinforcement learning.The collaborative iterative training with viewpoint selection model and detection network are integrated to improve the ability for searching and detecting local key areas,and reduce the influence for posture changing with body deformation and occlusion.The comparisons with classic part-based pedestrian detection method on public pedestrian detection data sets show that the proposed method can effectively improve the pedestrian detection accuracy.

作者马技李晶皎李珍妮

机构地区东北大学计算机科学与工程学院辽宁大学信息学院东北大学信息科学与工程学院

出处《中国科技论文》北大核心 2017年第14期1570-1577,共8页 China Sciencepaper

基金辽宁省教育厅科学研究一般项目(LYB201616)

关键词视觉注意深度强化学习行人检测信息熵深度学习 visual attention deep reinforcement learning pedestrian detection information entropy deep learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
2傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：25

二级参考文献15

1Puterman M L.Markov Decision Process:Discrete Dynamic Dtochastic Programming.New-York:Wiley,1994
2Kaya M,Alhajj R.Fuzzy olap association rules mining based modular reinforcement learning approach for multiagent systems.IEEE Transactions on Systems,Man and Cybernetics part B:Cybernetics,2005,35(2):326-338
3Singh S,Bertsekas D.Reinforcement learning for dynamic channel allocation in cellular telephone systems//Mozer M C,Jordan M L,Petsche T.Proceedings of the NIPS-9.Cambridge MA:MIT Press,1997:974
4Vengerov D N,Berenji H R.A fuzzy reinforcement learning approach to power control in wireless transmitters.IEEE Transactions on Systems,Man,and Cybernetics part B:Cybernetics,2005,35(4):768-778
5Critesl R H,Barto A G.Elevator group control using multiple reinforcement learning Agents.Machine Learning,1998,33(2/3):235-262
6Kaelbling L P,Littman M L,Moore A P.Reinforcement learning:A survey.Journal of Artificial Intelligence Research,1996,4:237-285
7Sutton R S,Barto A G.Reinforcement Learning:An Introduction.Cambridge MA:MIT Press,1998
8Schwartz A.A reinforcement learning method for maximizing undiscounted rewards//Huns M N,Singh M P eds.Proceedings of the 10th Annual Conference on Machine Learning.San Francisco:Morgan Kaufmann,1993:298-305
9Tadepalli P,Ok D.Model-based average reward reinforcement learning.Artificial Intelligence,1998,100(1/2):177-224
10Gosavi A.Reinforcement learning for long run average cost.European Journal of Operational Research,2004,155 (3):654-674

共引文献53

1Di Cao,Weihao Hu,Junbo Zhao,Guozhou Zhang,Bin Zhang,Zhou Liu,Zhe Chen,Frede Blaabjerg.Reinforcement Learning and Its Applications in Modern Power and Energy Systems: A Review[J].Journal of Modern Power Systems and Clean Energy,2020,8(6):1029-1042. 被引量：24
2李瑾,刘全,杨旭东,杨凯,翁东良.一种改进的平均奖赏强化学习方法在RoboCup训练中的应用[J].苏州大学学报（自然科学版）,2012,28(2):21-26. 被引量：2
3张捍东,吴玉秀,岑豫皖.多机器人合作与协调研究进展[J].计算机工程与应用,2008,44(24):238-241. 被引量：4
4王巍巍,陈兴国,高阳.一种结合Tile Coding的平均奖赏强化学习算法[J].模式识别与人工智能,2008,21(4):446-452.
5王冠军,王茂励,赵莹.基于马尔可夫决策模型的测试向量排序新方法[J].计算机科学,2010,37(5):287-290. 被引量：1
6付燕宁,张家臣,刘磊.面向预定义过程的强化学习WS组合[J].吉林大学学报（工学版）,2010,40(5):1313-1317.
7刘全,傅启明,龚声蓉,伏玉琛,崔志明.最小状态变元平均奖赏的强化学习方法[J].通信学报,2011,32(1):66-71. 被引量：15
8彭正辉.摩天大楼里的复仇女郎[J].传奇故事（百家讲堂）,2000(8):4-24.
9李誌,胡坤,余雪丽.基于半马氏博弈模型的分层强化学习研究[J].计算机工程与设计,2012,33(9):3558-3562. 被引量：2
10付燕宁,赵东范,赵健.持续自适应的Web服务组合方法[J].吉林大学学报（理学版）,2012,50(5):972-978.

同被引文献81

1Janak Parmar,Pritikana Das,Sanjaykumar M.Dave.Study on demand and characteristics of parking system in urban areas:A review[J].Journal of Traffic and Transportation Engineering(English Edition),2020,7(1):111-124. 被引量：6
2刘晓东,马强,邓忠军,朱翊.突发事件的地理信息定位匹配方法研究[J].地理信息世界,2011,9(3):34-37. 被引量：1
3卞超轶,常乐,严伟.基于室内位置信息的服务推送系统的设计与实现[J].中国科技论文,2012,7(10):766-772. 被引量：4
4JERMSURAWONG Jermsak,AHSAN Umair,HAIDAR Abdulhamid,DONG Haiwei,MAVRIDIS Nikolaos.基于单摄像机空位检测技术的全天停车需求分析[J].交通运输系统工程与信息,2014,14(2):33-44. 被引量：6
5吴志强,张俊峰.基于深度强化学习的自动态势估计研究[J].军事运筹与系统工程,2018,32(2):42-46. 被引量：13
6耿磊,邱玲,吴骏,肖志涛,张芳.结合深度可分离卷积与通道加权的全卷积神经网络视网膜图像血管分割[J].生物医学工程学杂志,2019,36(1):107-115. 被引量：12
7叶青,安瑞虹.基于移动互联网的业务质量和用户感知评测方法研究[J].邮电设计技术,2014(9):40-44. 被引量：8
8张青,严宇,张慧嫦.基于移动互联网客户感知的分析技术研究[J].广东通信技术,2015,35(7):2-8. 被引量：5
9沈振一,孙韶媛,赵海涛.基于PP-MRF模型的单目车载红外图像三维重建[J].东华大学学报（自然科学版）,2015,41(3):341-347. 被引量：9
10刘瑞,张柏林,王成猛.面向电信网络运营价值挖掘的大数据技术研究与应用[J].江苏通信,2015,31(5):15-18. 被引量：6

引证文献10

1程乔,王映华,李冉,刘文雯.重点业务感知监测分析机器人在网优智能化中应用的研究[J].广西通信技术,2019,0(3):48-54.
2梁建,王坚.基于楼层匹配的启发式高程约束室内定位算法[J].中国科技论文,2018,13(15):1805-1810. 被引量：1
3何杨,肖基毅.基于深度强化学习的网络共享资源智能调度方法[J].自动化与仪器仪表,2019,0(6):80-82. 被引量：3
4彭熹,肖奕,肖萍,印奇,李寻.基于深度学习的变电站多目标行人检测算法研究[J].电子设计工程,2019,27(19):6-9. 被引量：5
5龙劲峄,周骅.基于AlexNet神经网络的户外车位实时检测[J].中国科技论文,2021,16(3):295-300. 被引量：2
6王奕婷,高美珍,洪家平,陈英豪,乔丰收.基于选择性注意机制的目标区域提取研究[J].舰船电子工程,2021,41(5):39-43. 被引量：1
7何东,陈金令,王熙.基于改进YOLOv3的红外行人目标检测[J].中国科技论文,2021,16(7):762-769. 被引量：9
8陈金令,李洁,赵成明,刘鑫.面向WSI的乳腺病理亚型分类研究[J].计算机应用研究,2022,39(10):3167-3173. 被引量：1
9高正中,于明沆,孟晗,殷秀程.基于改进YOLOv5算法的红外图像行人目标检测[J].中国科技论文,2024,19(2):209-214.
10李新羽,徐野.基于深度强化学习的行人检测研究[J].工业控制计算机,2024,37(3):73-74.

二级引证文献22

1单凯强,桑海峰.基于全景视频下标记点特征的停车位检测技术研究[J].电子测量与仪器学报,2022,36(2):203-210. 被引量：2
2刘典恩,邵萍.医学思维与哲学思维的结构及其关系刍议[J].医学与哲学,2000,21(5):38-40. 被引量：7
3张明.实时行人检测算法的研究与应用[J].电子设计工程,2021,29(2):133-136. 被引量：1
4张宏伟,吕雪霞.基于深度学习的发电厂变频器过压故障检测[J].电子设计工程,2021,29(5):71-74. 被引量：4
5孙建强,尚俊娜,刘新华,施浒立,张东丽.气压计辅助的UWB室内定位方法[J].传感器与微系统,2021,40(6):30-33. 被引量：6
6缪巍巍,吴海洋,陈鹏,李伟,蒋春霞,朱鹏宇.基于深度强化学习的通信网故障智能感知与预警模型研究[J].机械设计与制造工程,2021,50(6):102-104. 被引量：11
7陶伟琪,魏宇.战场资源统一管理和调度技术综述[J].自动化与仪器仪表,2021(7):55-57. 被引量：2
8顾晨亮,杨恒,刘友波,张晗,张劲,何凌.基于自适应局部斥力与归一化面积损失的工程车辆目标检测[J].中国安全生产科学技术,2021,17(11):40-47. 被引量：2
9杨富强,余波,赵嘉彬,闫涛,唐伟.基于改进YOLOv3的桥梁底部裂缝目标检测方法[J].中国科技论文,2022,17(3):252-259. 被引量：7
10陆江东,弭博岩,郑奋.边缘计算环境下基于深度学习的目标检测系统[J].自动化与仪器仪表,2022(4):85-88. 被引量：3

1任汉俊,宋晓宁,於东军.一种新型粗-精表达策略行人检测方法[J].南京理工大学学报,2017,41(5):646-652. 被引量：2
2郭荣幸,李涛,李旭冬,马鹏阁.基于上下文信息的监控场景行人检测方法[J].电视技术,2017,41(6):83-87. 被引量：1
3刘喜阳.浅论工笔花鸟的思想表达[J].景德镇陶瓷,2017,27(4):22-23.
4吕国宁,高敏.视觉感知式场景文字检测定位方法[J].智能系统学报,2017,12(4):563-569. 被引量：2
5黄银色.初中数学课堂如何培养学生的元认知能力[J].成功,2017(5):65-66.
6郑海啸.你连春天都不爱[J].检察风云,2017,0(21):87-87.
7干红琼.柔性管理，经营人心[J].四川教育,2017,0(16):53-53.
8张玉斌.南航在支线航空方面的发展状况[J].空运商务,2017,0(9):25-26.
9顾磊,李振华,王晓田,卜凡丽,燕霞凤,马凯.区域救治体系中急性ST段抬高型心肌梗死溶栓后早期介入与直接介入的疗效比较[J].中国老年学杂志,2017,37(19):4791-4793. 被引量：8
10胡朋志.翻译认知过程中的注意机制:表征、扩展与转换[J].解放军外国语学院学报,2017,40(4):100-107.

中国科技论文

2017年第14期

浏览历史

内容加载中请稍等...

基于视觉注意机制深度强化学习的行人检测方法被引量：10

参考文献2

二级参考文献15

共引文献53

同被引文献81

引证文献10

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于视觉注意机制深度强化学习的行人检测方法 被引量：10

参考文献2

二级参考文献15

共引文献53

同被引文献81

引证文献10

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于视觉注意机制深度强化学习的行人检测方法被引量：10