研究基于计算机视觉的视线估计方法,对驾驶员视线估计的暨有研究成果加以回顾与评述,并对可能的发展趋势进行分析。主要针对3类基于计算机视觉的方法展开论述:基于PCCR(Pupil Center Corneal Reflection)技术的视线估计方法;基于AAM模型...研究基于计算机视觉的视线估计方法,对驾驶员视线估计的暨有研究成果加以回顾与评述,并对可能的发展趋势进行分析。主要针对3类基于计算机视觉的方法展开论述:基于PCCR(Pupil Center Corneal Reflection)技术的视线估计方法;基于AAM模型(Active Appearance Model)的视线估计方法;基于统计模式识别的视线估计方法。总体上讲各种技术都是基于图像传感器的,很难突破图像传感器特有的鲁棒性不强、难以适应全天候工作要求的缺点,但各种技术有着各自的特点,因此也很难用统一的标准去衡量各种监测技术的优劣。本文给出了几种有代表性系统的性能比较。展开更多
基于表观的视线估计方法主要是在二维的三原色(red green blue,RGB)图像上进行,当头部在自由运动时视线估计精度较低,且目前基于卷积神经网络的表观视线估计都普遍使用池化来增大特征图中像素点的感受野,导致了特征图的信息损失,提出一...基于表观的视线估计方法主要是在二维的三原色(red green blue,RGB)图像上进行,当头部在自由运动时视线估计精度较低,且目前基于卷积神经网络的表观视线估计都普遍使用池化来增大特征图中像素点的感受野,导致了特征图的信息损失,提出一种基于膨胀卷积神经网络的多模态融合视线估计模型。在该模型中,利用膨胀卷积设计了一种叫GENet(gaze estimation network)的网络提取眼睛的RGB和深度图像的特征图,并利用卷积神经网络的全连接层自动融合头部姿态和2种图像的特征图,从而进行视线估计。实验部分在公开数据集Eyediap上验证了设计的模型,并将设计的模型同其他视线估计模型进行比较。实验结果表明,提出的视线估计模型可以在自由的头部运动下准确地估计视线方向。展开更多
文摘基于表观的视线估计方法主要是在二维的三原色(red green blue,RGB)图像上进行,当头部在自由运动时视线估计精度较低,且目前基于卷积神经网络的表观视线估计都普遍使用池化来增大特征图中像素点的感受野,导致了特征图的信息损失,提出一种基于膨胀卷积神经网络的多模态融合视线估计模型。在该模型中,利用膨胀卷积设计了一种叫GENet(gaze estimation network)的网络提取眼睛的RGB和深度图像的特征图,并利用卷积神经网络的全连接层自动融合头部姿态和2种图像的特征图,从而进行视线估计。实验部分在公开数据集Eyediap上验证了设计的模型,并将设计的模型同其他视线估计模型进行比较。实验结果表明,提出的视线估计模型可以在自由的头部运动下准确地估计视线方向。