融合Transformer和CNN的轻量级人脸识别算法被引量：1

Lightweight Face Recognition Algorithm Combining Transformer and CNN

下载PDF

导出

摘要随着深度学习的发展,卷积神经网络通过堆叠卷积层逐步扩大感受野以融合局部特征的方式已经成为人脸识别(FR)的主流方法,但这种方法存在因忽略人脸全局语义信息和缺乏对人脸重点特征信息的关注造成识别准确率不高,以及大参数量层数的堆叠导致网络难以部署于资源受限设备的问题。因此提出一种融合Transformer和CNN的极其轻量级FR算法gcsamTfaceNet。使用深度可分离卷积构建主干网络以降低算法的参数量;引入通道-空间注意力机制,从通道和空间两个域最优化选择特征以提高对人脸重点区域的关注度;在此基础上,融合Transformer模块以捕获特征图的全局语义信息,克服卷积神经网络在长距离语义依赖性建模方面的局限性,提高算法的全局特征感知能力。参数量仅为6.5×10^(5)的gcsamTfaceNet在9个验证集(LFW、CA-LFW、CP-LFW、CFP-FP、CFP-FF、AgeDB-30、VGG2-FP、IJB-B以及IJB-C)上实验评估,分别取得99.67%、95.60%、89.32%、93.67%、99.65%、96.35%、93.36%、89.43%和91.38%的平均准确率,达到参数量和性能之间较好的权衡。 With the development of deep learning,convolutional neural networks have become the mainstream approach for face recognition(FR)by gradually expanding the receptive field through stacking convolutional layers to integrate local features.However,this approach suffers from the drawbacks of neglecting global semantic information of faces and lacking attention to important facial features,resulting in low recognition accuracy.Additionally,the stacking of a large number of parameters and layers poses challenges for deploying the network on resource-constrained devices.Therefore,a highly lightweight face recognition algorithm called gcsamTfaceNet is proposed,which combines Transformer and CNN.Firstly,a depthwise separable convolution is used to construct the backbone network in order to reduce the parameter count of the algorithm.Secondly,a channel-spatial attention mechanism is introduced to optimize the selection of features in both the channel and spatial domains,thereby improving the attention given to important facial regions.Building upon this,the Transformer module is integrated to capture the global semantic information of the feature maps,overcoming the limitations of convolutional neural networks in modeling long-range semantic dependencies and enhancing the algorithm’s ability to perceive global features.The gcsamTfaceNet,with a parameter count of only 6.5×10^(5),is evaluated on nine validation datasets including LFW,CA-LFW,CP-LFW,CFP-FP,CFP-FF,AgeDB-30,VGG2-FP,IJB-B,and IJB-C.It achieves average accuracies of 99.67%,95.60%,89.32%,93.67%,99.65%,96.35%,93.36%,89.43%,and 91.38%on these datasets,respectively.This demonstrates a good balance between parameter count and performance.

作者李明党青霞 LI Ming;DANG Qingxia(Engineering Research Center of Hubei Province for Clothing Information,Wuhan Textile University,Wuhan 430200,China;Hubei Key Laboratory of Digital Textile Equipment,Wuhan Textile University,Wuhan 430200,China)

机构地区武汉纺织大学湖北省服装信息化工程技术研究中心武汉纺织大学湖北省数字化纺织装备重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2024年第14期96-104,共9页 Computer Engineering and Applications

基金湖北省数字化纺织装备重点实验室开放基金(DTL2018021) 湖北省服装信息化工程技术研究中心开放基金(184084004)。

关键词轻量级人脸识别卷积神经网络 TRANSFORMER 注意力机制 lightweight face recognition convolutional neural network Transformer attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1杨鹤,柏正尧.CoT-TransUNet:轻量化的上下文Transformer医学图像分割网络[J].计算机工程与应用,2023,59(3):218-225. 被引量：10
2项剑文,陈泯融,杨百冰.结合Swin及多尺度特征融合的细粒度图像分类[J].计算机工程与应用,2023,59(20):147-157. 被引量：3
3张朝阳,张上,王恒涛,冉秀康.多尺度下遥感小目标多头注意力检测[J].计算机工程与应用,2023,59(8):227-238. 被引量：9

二级参考文献6

1丁文谦,余鹏飞,李海燕,陆鑫伟.基于Xception网络的弱监督细粒度图像分类[J].计算机工程与应用,2022,58(2):235-243. 被引量：6
2李宽宽,刘立波.双线性聚合残差注意力的细粒度图像分类模型[J].计算机科学与探索,2022,16(4):938-949. 被引量：3
3廖育荣,王海宁,林存宝,李阳,方宇强,倪淑燕.基于深度学习的光学遥感图像目标检测研究进展[J].通信学报,2022,43(5):190-203. 被引量：24
4闫钧华,张琨,施天俊,朱桂熠,刘勇,张寅.融合多层级特征的遥感图像地面弱小目标检测[J].仪器仪表学报,2022,43(3):221-229. 被引量：32
5魏秀参,许玉燕,杨健.网络监督数据下的细粒度图像识别综述[J].中国图象图形学报,2022,27(7):2057-2077. 被引量：7
6张寅,朱桂熠,施天俊,张琨,闫钧华.基于特征融合与注意力的遥感图像小目标检测[J].光学学报,2022,42(24):132-142. 被引量：37

共引文献19

1黄昊,李海涛.基于CotNet改进YOLOv5的接地线目标检测[J].计算机系统应用,2023,32(5):283-290.
2赵敏.基于改进遗传算法的二维图像智能分割方法[J].信息与电脑,2023,35(6):197-199.
3王悦炜,焦良葆,高阳.基于改进YOLOv5s的遥感目标检测[J].计算机测量与控制,2023,31(8):70-76. 被引量：2
4祁宣豪,智敏.图像处理中注意力机制综述[J].计算机科学与探索,2024,18(2):345-362. 被引量：12
5庄先艳,郑小琴,秦丹丹,王秀华.面向神经重症患者护理的脑电双频谱指数监测仪优化设计[J].自动化与仪器仪表,2024(1):243-246.
6白俊卿,常文文,程国建,黄小朋.基于改进的YOLOv7油田井场压力表小目标识别[J].西安石油大学学报（自然科学版）,2024,39(2):120-127. 被引量：1
7孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.
8白宇,周艳媛,安胜彪.改进YOLOv5的无人机小目标检测方法研究[J].计算机工程与应用,2024,60(10):276-284. 被引量：1
9崔珂,田启川,廉露.基于U-Net变体的医学图像分割算法综述[J].计算机工程与应用,2024,60(11):32-49.
10王一中,胡亚琦,吴小所,闫浩文,王小成.基于改进Swin Transformer的遥感图像语义分割方法[J].计算机工程与应用,2024,60(11):194-203.

同被引文献13

1高志辉,秦琦,段暕,沈旭,计效园,刘智勇,廖广兰.基于实时Web技术的车间监测系统设计与实现[J].计算机应用,2023,43(S01):201-206. 被引量：5
2刘军,戴金山.基于Spring MVC与iBATIS的轻量级Web应用研究[J].计算机应用,2006,26(4):840-843. 被引量：40
3谢靖,马自卫.基于WebService的数字资源集成与服务平台的研究与实现[J].现代图书情报技术,2008(11):7-12. 被引量：5
4王迪.《关于加快药学服务高质量发展的意见》印发[J].中医药管理杂志,2018,26(23):94-94. 被引量：10
5马梓昂,贾克斌.基于Web的高性能智能快递柜管理系统[J].计算机应用与软件,2020,37(4):1-5. 被引量：15
6陈静娴.基于二维码技术·微信小程序技术的实验室设备管理的设计与实现[J].计算机科学,2020,47(S02):673-677. 被引量：40
7王丰,王牛民,李鹏飞,孙金钥,董海燕,范园园.信息药师提升门诊药房自动化发药系统效率实践[J].医药导报,2022,41(7):1048-1051. 被引量：12
8陈成群,任清华,王松,裴健颖,张书伟,张祥,齐跃东,杜书章,张晓坚.数字化药房建设与智慧调剂系统的应用与实践[J].中国现代应用药学,2022,39(21):2770-2774. 被引量：4
9蒋婷婷,鲜秋婉,李晨.医院门诊药房自动化发药系统应用效果分析[J].中国药业,2023,32(4):15-18. 被引量：11
10李颖,边山,王春桃,卢伟.CNN结合Transformer的深度伪造高效检测[J].中国图象图形学报,2023,28(3):804-819. 被引量：7

引证文献1

1宋伟泽.基于智能机器人的医院药房系统应用[J].智能计算机与应用,2024,14(9):140-144.

1齐凯,张衡,周杨,刘一帆,李庆祥.综合局部莫兰指数和PageRank算法的网络空间资源节点隐喻可视化表达[J].地球信息科学学报,2024,26(5):1283-1295.
2李成岗,孟雨,谷绍福,李双双.天津某养老活动用房结构设计与消能减震分析[J].中文科技期刊数据库（文摘版）工程技术,2024(6):0131-0134.
3吴晓,肖珍.用二阶共轭方程近似解研究楔形杆振动及屈曲[J].湖南师范大学自然科学学报,2024,47(3):137-142.
4李柳,罗跃,王晨宇,安治钢,王艳丽.电磁层析成像技术中的谱参数混合共轭梯度法[J].沈阳师范大学学报（自然科学版）,2024,42(1):23-29.
5宋庆,马米米,邓淼磊,左志斌.轻量级的两方认证密钥协商协议[J].计算机工程与应用,2024,60(14):283-293.
6郑云水,刘恒江,董昱.基于区块链高效安全的多部门铁路工程数据访问控制策略[J].铁道科学与工程学报,2024,21(6):2488-2498.

计算机工程与应用

2024年第14期

浏览历史

内容加载中请稍等...

融合Transformer和CNN的轻量级人脸识别算法被引量：1

参考文献3

二级参考文献6

共引文献19

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合Transformer和CNN的轻量级人脸识别算法 被引量：1

参考文献3

二级参考文献6

共引文献19

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合Transformer和CNN的轻量级人脸识别算法被引量：1