基于改进Faster-RCNN的自然场景人脸检测被引量：16

Face Detection in Natural Scene Based on Improved Faster-RCNN

下载PDF

导出

摘要为实现对自然场景下小尺度人脸的准确检测,提出一种改进的Faster-RCNN模型。采用ResNet-50提取卷积特征,对不同卷积层的特征图进行多尺度融合,同时将区域建议网络产生的锚框由最初的9个改为15个,以更好地适应小尺度人脸检测场景。在此基础上,利用在线难例挖掘算法优化训练过程,采用软非极大值抑制方法解决漏检重叠人脸的问题,并在训练阶段通过多尺度训练提高模型的泛化能力。实验结果表明,该模型在Wider Face数据集上平均精度为89.0%,较原Faster-RCNN模型提升3.5%,在FDDB数据集上检出率也高达95.6%。 To realize accurate detection of small-scale faces in natural scene,this paper constructs an improved Faster-RCNN model.The model uses ResNet-50 to extract convolution features,and performs multi-scale fusion for feature maps of different convolutional layers.At the same time,the number of Anchors generated by the Regional Proposal Network(RPN)has been changed from 9 to 15 to better adapt to the small-scale face detection scenes.On this basis,the Online Hard Example Mining(OHEM)algorithm is used to optimize the training process.Soft-Non-Maximum Suppression(Soft-NMS)method is used to reduce the missed detection of overlapping faces,and in the training phase the multiscale training method is adopted to improve the generalization ability of the model.Experimental results show that the average precision of the proposed model is 89.0%on the Wider Face dataset,which is 3.5%higher than that of the original Fast-RCNN model.The relevance ratio of the proposed model reaches 95.6%on the FDDB dataset.

作者李祥兵陈炼 LI Xiangbing;CHEN Lian(College of Information Engineering,Nanchang University,Nanchang 330000,China)

机构地区南昌大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第1期210-216,共7页 Computer Engineering

基金国家自然科学基金(61862043)。

关键词人脸检测 Faster-RCNN模型多尺度融合在线难例挖掘软非极大值抑制 face detection Faster-RCNN model multi-scale fusion Online Hard Example Mining(OHEM) Soft-Non-Maximum Suppression(Soft-NMS)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1陈泽,叶学义,钱丁炜,魏阳洋.基于改进Faster R-CNN的小尺度行人检测[J].计算机工程,2020,46(9):226-232. 被引量：21
2张泽苗,霍欢,赵逢禹.深层卷积神经网络的目标检测算法综述[J].小型微型计算机系统,2019,40(9):1825-1831. 被引量：60
3戴海能,茅耀斌.一种改进的基于R-FCN模型的人脸检测算法[J].计算机与现代化,2018(8):12-15. 被引量：4
4庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：466

二级参考文献93

1Ben-David S,Blitzer J,Crammer K,Pereira F.Analysis of representations for domain adaptation.In:Platt JC,Koller D,Singer Y,Roweis ST,eds.Proc.of the Advances in Neural Information Processing Systems 19.Cambridge:MIT Press,2007.137-144.
2Blitzer J,McDonald R,Pereira F.Domain adaptation with structural correspondence learning.In:Jurafsky D,Gaussier E,eds.Proc.of the Int’l Conf.on Empirical Methods in Natural Language Processing.Stroudsburg PA:ACL,2006.120-128.
3Dai WY,Xue GR,Yang Q,Yu Y.Co-Clustering based classification for out-of-domain documents.In:Proc.of the 13th ACM Int’l Conf.on Knowledge Discovery and Data Mining.New York:ACM Press,2007.210-219.[doi:10.1145/1281192.1281218].
4Dai WY,Xue GR,Yang Q,Yu Y.Transferring naive Bayes classifiers for text classification.In:Proc.of the 22nd Conf.on Artificial Intelligence.AAAI Press,2007.540-545.
5Liao XJ,Xue Y,Carin L.Logistic regression with an auxiliary data source.In:Proc.of the 22nd lnt*I Conf.on Machine Learning.San Francisco:Morgan Kaufmann Publishers,2005.505-512.[doi:10.1145/1102351.1102415].
6Xing DK,Dai WY,Xue GR,Yu Y.Bridged refinement for transfer learning.In:Proc.of the Ilth European Conf.on Practice of Knowledge Discovery in Databases.Berlin:Springer-Verlag,2007.324-335.[doi:10.1007/978-3-540-74976-9_31].
7Mahmud MMH.On universal transfer learning.In:Proc.of the 18th Int’l Conf.on Algorithmic Learning Theory.Sendai,2007.135-149.[doi:10,1007/978-3-540-75225-7_14].
8Samarth S,Sylvian R.Cross domain knowledge transfer using structured representations.In:Proc.of the 21st Conf.on Artificial Intelligence.AAAI Press,2006.506-511.
9Bel N,Koster CHA,Villegas M.Cross-Lingual text categorization.In:Proc.of the European Conf.on Digital Libraries.Berlin:Springer-Verlag,2003.126-139.[doi:10.1007/978-3-540-45175-4_13].
10Zhai CX,Velivelli A,Yu B.A cross-collection mixture model for comparative text mining.In:Proc.of the 10th ACM SIGKDD Int’l Conf.on Knowledge Discovery and Data Mining.New York:ACM,2004.743-748.[doi:10.1145/1014052.1014150].

共引文献547

1康文杰,田苗,林岚,孙珅,吴水才.深度卷积生成对抗网络对神经影像通用数据特征的学习[J].智慧健康,2020(31):1-4. 被引量：2
2张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：23
3陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
4吴锐帆,代海洋,杨坦,江颖,蔡志杰.直肠癌淋巴结转移的智能诊断研究[J].数学建模及其应用,2019,8(4):30-37. 被引量：2
5刘世晶,刘阳春,钱程,郑浩君,周捷,张成林.基于CycleGAN和注意力增强迁移学习的小样本鱼类识别[J].农业机械学报,2023,54(S01):296-302. 被引量：3
6张璐,黄琳,李备备,陈鑫,段青玲.基于多尺度融合与无锚点YOLO v3的鱼群计数方法[J].农业机械学报,2021,52(S01):237-244. 被引量：16
7张红洋,田瑞盟.基于SOLO分类理论的科学思维学业质量评价[J].湖南中学物理,2021(2):1-4. 被引量：1
8杨栩.基于卷积神经网络的数字图像特征降维算法[J].信息通信,2019,0(11):42-44.
9林峰,郭鹏,刘旭斌.基于叶片表面污垢预处理与CNN的风电机组叶片表面损伤识别[J].动力工程学报,2020(12):975-981. 被引量：5
10颜宏文,陈金鑫.基于改进YOLOv3的绝缘子串定位与状态识别方法[J].高电压技术,2020,46(2):423-432. 被引量：76

同被引文献142

1南晓虎,丁雷.深度学习的典型目标检测算法综述[J].计算机应用研究,2020,37(S02):15-21. 被引量：55
2邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：39
3曹莹,苗启广,刘家辰,高琳.AdaBoost算法研究进展与展望[J].自动化学报,2013,39(6):745-758. 被引量：267
4黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
5陈州尧,徐敏,苏鹭梅.一种码垛视觉系统中物料袋的识别与定位方法[J].制造业自动化,2015,37(3):47-49. 被引量：5
6孙波,刘永娜,陈玖冰,罗继鸿,张迪.智慧学习环境中基于面部表情的情感分析[J].现代远程教育研究,2015,27(2):96-103. 被引量：66
7王道明,鲁昌华,蒋薇薇,肖明霞,李必然.基于粒子群算法的决策树SVM多分类方法研究[J].电子测量与仪器学报,2015,29(4):611-615. 被引量：90
8李学勇,钟湘琼,潘文静.二维码在工具设备管理的现代化应用优势[J].物流工程与管理,2015,37(5):117-118. 被引量：9
9宋晓琳,邬紫阳,张伟伟.基于阴影和类Haar特征的动态车辆检测[J].电子测量与仪器学报,2015,29(9):1340-1347. 被引量：21
10徐渊,许晓亮,李才年,姜梅,张建国.结合SVM分类器与HOG特征提取的行人检测[J].计算机工程,2016,42(1):56-60. 被引量：77

引证文献16

1薛继伟,吕福娟,刘显德.基于改进ResNet的人脸表情识别研究[J].河南科学,2021,39(8):1205-1210. 被引量：3
2陶施帆,李玉峰,黄煜峰,蓝晓宇.基于深度残差网络和注意力机制的人脸检测算法[J].计算机工程,2021,47(11):276-282. 被引量：6
3余胜,谢莉.非限定条件下的基于全卷积神经网络的人脸检测算法研究[J].韶关学院学报,2021,42(9):11-15. 被引量：2
4张艳珠,刘彬.基于YOLO v4网络的房屋目标检测研究[J].信息技术与信息化,2022(1):53-56. 被引量：1
5王鑫鹏,王晓强,林浩,李雷孝,杨艳艳,孟闯,高静.深度学习典型目标检测算法的改进综述[J].计算机工程与应用,2022,58(6):42-57. 被引量：27
6王彦雅.基于Two-Stage的目标检测算法综述[J].河北省科学院学报,2022,39(2):14-22. 被引量：6
7李柯泉,陈燕,刘佳晨,牟向伟.基于深度学习的目标检测算法综述[J].计算机工程,2022,48(7):1-12. 被引量：85
8何禹潼,卢迪.基于百度AI的室内监控系统研究[J].电子设计工程,2023,31(17):192-195.
9董子平,陈世国,廖国清.基于YOLOv5s的密集多人脸检测算法[J].计算机工程与科学,2023,45(10):1838-1846. 被引量：4
10刘啸虎,肖德琴,刘又夫,王春桃,周敏.基于Faster R-CNN和时序统计的肉鸭行为节律分析[J].中国家禽,2023,45(11):95-104.

二级引证文献135

1邹剑,陈征,刘长龙,张乐,张玺亮,蓝飞,王威.基于YOLOv5s-CBAM的海上平台注水流程现场漏液智能检测[J].系统仿真技术,2024,20(2):175-179.
2夏晨翕,何智杰,王森弘,景益娟.基于Faster R-CNN算法实现航空照片的目标检测与识别[J].网络安全与数据治理,2023,42(S01):201-206. 被引量：1
3杨洁亮,彭召旺,郭奕丰.边缘计算在智慧城市社区级感知层的应用[J].电子技术与软件工程,2021(23):58-61.
4焦爽,范亚冰,孙立群,丁小龙.基于深度细节加强网络模型的去雨方法研究[J].电脑知识与技术,2021,17(35):80-84.
5张永宏,许帆,阚希,曹海啸.基于多尺度特征融合网络的新疆积雪覆盖度估算[J].计算机工程,2022,48(3):288-295.
6朱联祥,徐莉娟.基于改进YOLOv3-tiny的车辆目标检测[J].信息技术与信息化,2022(3):9-12. 被引量：2
7程祥鸣,邓春华.基于无标签知识蒸馏的人脸识别模型的压缩算法[J].计算机科学,2022,49(6):245-253. 被引量：5
8臧国强,刘晓莉,徐颖菲,陈雨露,李文波.深度学习在电力设备缺陷识别中的应用进展[J].电气技术,2022,23(6):1-7. 被引量：14
9李刚,齐铭伟,张飞扬,吴凡.基于RepVGG-YOLOv4的焦罐提升机状态检测[J].工业控制计算机,2022,35(6):43-45. 被引量：2
10朱福珍,王帅,巫红.改进的PP-YOLO网络遥感图像目标检测[J].高技术通讯,2022,32(5):528-534. 被引量：5

1吴宝莉.重视阅读训练提高阅读能力[J].今天,2021(1):98-98.
2车兆利.青少年速滑运动员心理训练的方法探究[J].当代体育,2020(17):170-170.
3杨丹,刘国如,任梦成,裴宏杨.多尺度卷积核U-Net模型的视网膜血管分割方法[J].东北大学学报（自然科学版）,2021,42(1):7-14. 被引量：5
4徐龙壮,彭力,朱凤增.多任务金字塔重叠匹配的行人重识别方法[J].计算机工程,2021,47(1):239-245. 被引量：6

计算机工程

2021年第1期

浏览历史

内容加载中请稍等...

基于改进Faster-RCNN的自然场景人脸检测被引量：16

参考文献4

二级参考文献93

共引文献547

同被引文献142

引证文献16

二级引证文献135

相关作者

相关机构

相关主题

浏览历史

基于改进Faster-RCNN的自然场景人脸检测 被引量：16

参考文献4

二级参考文献93

共引文献547

同被引文献142

引证文献16

二级引证文献135

相关作者

相关机构

相关主题

浏览历史

基于改进Faster-RCNN的自然场景人脸检测被引量：16