本研究利用空间金字塔池化(Spatial Pyramid Pooling,SPP)和全局平均池化(Global Average Pooling,GAP)优化传统的AlexNet架构,并将其应用于无人驾驶汽车的视觉识别系统中。这项研究旨在提高无人驾驶车辆通过摄像头感知环境的准确性和...本研究利用空间金字塔池化(Spatial Pyramid Pooling,SPP)和全局平均池化(Global Average Pooling,GAP)优化传统的AlexNet架构,并将其应用于无人驾驶汽车的视觉识别系统中。这项研究旨在提高无人驾驶车辆通过摄像头感知环境的准确性和效率。首先,笔者对AlexNet算法进行了改进,集成了SPP和GAP。SPP的引入使网络能够更有效地处理不同尺寸的图像,得到改进的AlexNet-SG网络,从而捕捉更多的空间信息。GAP的应用减少了模型的参数数量,从而降低了过拟合的风险并加快了训练速度。这些改进不仅增强了模型的泛化能力,还提高了网络对复杂场景的识别能力。本研究使用真实世界的交通环境数据对改进后的模型进行了测试,实验涵盖了多种交通场景,包括直车道、弯车道、人行道等。研究结果表明,AlexNet-SG在处理复杂交通场景时的表现明显优于原始模型,特别是在识别距离和准确率方面取得了显著提升。展开更多
目的人脸识别技术在很多领域起着重要作用,但大量的欺诈攻击对人脸识别产生了威胁,比如打印攻击和重放攻击。传统的活体检测方法是以手工方式提取特征且缺乏对时间维度的考虑,导致检测效果不佳。针对以上问题,提出一种结合混合池化的双...目的人脸识别技术在很多领域起着重要作用,但大量的欺诈攻击对人脸识别产生了威胁,比如打印攻击和重放攻击。传统的活体检测方法是以手工方式提取特征且缺乏对时间维度的考虑,导致检测效果不佳。针对以上问题,提出一种结合混合池化的双流活体检测网络。方法对数据集提取光流图像并进行面部检测,得到双流网络的两个输入;在双流网络末端加入空间金字塔和全局平均混合池化,利用全连接层对池化后的特征进行分类并进行分数层面的融合;对空间流网络和时间流网络进行融合得到一个最优结果,同时考虑了不同颜色空间对检测性能的影响。结果在CASIA-FASD(CASIA face anti-spoofing database)和replay-attack两个数据集上做了多组对比实验,在CASIA-FASD数据集上,等错误率(equal error rate,EER)为1.701%;在replay-attack数据集上,等错误率和半错误率(half total error rate,HTER)分别为0.091%和0.082%。结论结合混合池化的双流活体检测网络充分考虑时间维度,提出的空间金字塔和全局平均混合池化策略能有效地利用特征。针对包含多种攻击类型、图像质量差异较大的数据集,本文提出的网络模型均能取得较低的错误率。展开更多
文摘本研究利用空间金字塔池化(Spatial Pyramid Pooling,SPP)和全局平均池化(Global Average Pooling,GAP)优化传统的AlexNet架构,并将其应用于无人驾驶汽车的视觉识别系统中。这项研究旨在提高无人驾驶车辆通过摄像头感知环境的准确性和效率。首先,笔者对AlexNet算法进行了改进,集成了SPP和GAP。SPP的引入使网络能够更有效地处理不同尺寸的图像,得到改进的AlexNet-SG网络,从而捕捉更多的空间信息。GAP的应用减少了模型的参数数量,从而降低了过拟合的风险并加快了训练速度。这些改进不仅增强了模型的泛化能力,还提高了网络对复杂场景的识别能力。本研究使用真实世界的交通环境数据对改进后的模型进行了测试,实验涵盖了多种交通场景,包括直车道、弯车道、人行道等。研究结果表明,AlexNet-SG在处理复杂交通场景时的表现明显优于原始模型,特别是在识别距离和准确率方面取得了显著提升。
文摘目的人脸识别技术在很多领域起着重要作用,但大量的欺诈攻击对人脸识别产生了威胁,比如打印攻击和重放攻击。传统的活体检测方法是以手工方式提取特征且缺乏对时间维度的考虑,导致检测效果不佳。针对以上问题,提出一种结合混合池化的双流活体检测网络。方法对数据集提取光流图像并进行面部检测,得到双流网络的两个输入;在双流网络末端加入空间金字塔和全局平均混合池化,利用全连接层对池化后的特征进行分类并进行分数层面的融合;对空间流网络和时间流网络进行融合得到一个最优结果,同时考虑了不同颜色空间对检测性能的影响。结果在CASIA-FASD(CASIA face anti-spoofing database)和replay-attack两个数据集上做了多组对比实验,在CASIA-FASD数据集上,等错误率(equal error rate,EER)为1.701%;在replay-attack数据集上,等错误率和半错误率(half total error rate,HTER)分别为0.091%和0.082%。结论结合混合池化的双流活体检测网络充分考虑时间维度,提出的空间金字塔和全局平均混合池化策略能有效地利用特征。针对包含多种攻击类型、图像质量差异较大的数据集,本文提出的网络模型均能取得较低的错误率。