摘要
为了更加准确地对驾驶员的人脸进行定位并进行驾驶状态分析,本文提出一种基于改进YOLOv5及ConvNeXt的级联分类算法。算法首先采用引入注意力机制的YOLOv5作为人脸定位器,然后将定位裁剪后的图片输入到ConvNeXt的卷积神经网络中进行分类。引入的卷积注意力机制YOLOv5网络不仅增强了网络对复杂背景中目标区域的感知能力,同时减少了网络参数量和计算复杂度,与此同时,采用3:3:9:3的卷积模块数量比例的ConvNeXt增强了网络对特征的提取能力,并且与Swin Transformer相比拥有更快的推理速度以及更高的准确率。最终,在实验评估中该模型在FER2013数据集上可达到73.65%的准确率,在KMU⁃FED数据集上达到了97.73%的准确率,较好地实现了驾驶员的人脸表情识别及状态分析。
出处
《信息记录材料》
2024年第3期108-111,114,共5页
Information Recording Materials