-
题名基于CB-ViT的青少年视线估计算法研究
- 1
-
-
作者
严青松
毛建华
刘志
陆小锋
-
机构
上海大学通信与信息工程学院
上海大学温州研究院
-
出处
《现代电子技术》
北大核心
2024年第15期146-150,共5页
-
基金
温州市重大科技创新攻关项目(ZY2023003)。
-
文摘
视线估计技术在人机交互、虚拟现实和医学辅助诊断等领域有着广泛应用。然而,现有的公开数据集主要针对成年人,导致基于这些数据集训练的视线估计算法在应用于青少年群体时效果通常不尽如人意。为了解决这一问题,收集了一个名为“Young-Gaze”的青少年视线数据集,涵盖了107位青少年的视线数据。还提出了一种2D视线估计算法,该算法基于ViT并引入了一个名为上下文广播的模块,同时通过融合左眼和右眼的不同层次特征,显著增强了网络模型在特征表达上的能力。在实验中,该算法在Young-Gaze数据集上展现了出色的性能,达到了5.42 cm的误差,性能优于当前其他同类2D视线估计算法。除了在Young-Gaze数据集上取得显著性能外,该算法同样在公开的2D视线估计数据集如GazeCapture和MPIIFaceGaze上进行了训练和测试,也展现了良好的性能,表明该算法不仅适用于青少年群体,也能够在成人群体中得到有效应用。
-
关键词
视线估计
头部姿态
CNN
特征融合
VIT
上下文广播
-
Keywords
gaze estimation
head posture
CNN
feature fusion
ViT
CB
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
-