针对传统的形态分割和模板匹配文字识别方法存在着识别精度低和不稳定的问题,为工业检测领域的芯片字符识别设计了一套基于深度学习的智能光学字符识别系统。该系统基于可微分二值化网络(detection with differentiable binarization ne...针对传统的形态分割和模板匹配文字识别方法存在着识别精度低和不稳定的问题,为工业检测领域的芯片字符识别设计了一套基于深度学习的智能光学字符识别系统。该系统基于可微分二值化网络(detection with differentiable binarization network,DBNet)、方向分类器和卷积网络,3个阶段分别训练深度模型实现文本区域的检测、文本方向分类和字符识别,最后进行串联推理完成微观芯片字符的自动化识别。同时针对显微场景下芯片字符图像易受光照干扰,采用数据增强与扩充、更换网络骨架、更改网络卷积步长,解决了复杂背景下微观芯片字符识别易误检的问题。工业生产线上的实际测试结果表明,该系统的识别准确率达到99.9%,误检率3.4?,速度0.56 s/张,极大地提升了字符识别正确率和效率,降低了误检率。最终的识别结果可以直接在云端远程实时查看,简化了传统工业字符识别流程,有助于工业智能化检测进一步发展和提高。展开更多
针对疲劳驾驶检测问题,提出一种以softmax损失与中心损失相结合的深度卷积神经网络算法。首先,利用含有方向的梯度直方图(histogram of oriented gridients,HOG)和级联分类器(support vector machine,SVM)算法的Dlib库中预训练的人脸检...针对疲劳驾驶检测问题,提出一种以softmax损失与中心损失相结合的深度卷积神经网络算法。首先,利用含有方向的梯度直方图(histogram of oriented gridients,HOG)和级联分类器(support vector machine,SVM)算法的Dlib库中预训练的人脸检测器,来检测驾驶员的脸部区域。其次,使用级联回归(ensemble of regression trees,ERT)算法实现脸部68个关键点标定及眼睛和嘴巴的定位。最后,为了优化softmax损失在深度卷积网络分类中出现的类内间距大的问题,加入中心损失函数,提高类间差异性、类内紧密性以及驾驶员脸部疲劳状态识别准确率。在自建测试集和YawDD哈欠数据集中的实验结果显示,该方法能够准确地识别检测驾驶员疲劳表情,平均识别准确率达到98.81%。与传统的疲劳驾驶检测识别方法相比,该方法可以自动进行疲劳特征提取,并且训练准确率、检测识别率及鲁棒性得到提高;与未改进的深度卷积网络相比,检测识别的概率平均提高了约5.09%。展开更多
文摘针对疲劳驾驶检测问题,提出一种以softmax损失与中心损失相结合的深度卷积神经网络算法。首先,利用含有方向的梯度直方图(histogram of oriented gridients,HOG)和级联分类器(support vector machine,SVM)算法的Dlib库中预训练的人脸检测器,来检测驾驶员的脸部区域。其次,使用级联回归(ensemble of regression trees,ERT)算法实现脸部68个关键点标定及眼睛和嘴巴的定位。最后,为了优化softmax损失在深度卷积网络分类中出现的类内间距大的问题,加入中心损失函数,提高类间差异性、类内紧密性以及驾驶员脸部疲劳状态识别准确率。在自建测试集和YawDD哈欠数据集中的实验结果显示,该方法能够准确地识别检测驾驶员疲劳表情,平均识别准确率达到98.81%。与传统的疲劳驾驶检测识别方法相比,该方法可以自动进行疲劳特征提取,并且训练准确率、检测识别率及鲁棒性得到提高;与未改进的深度卷积网络相比,检测识别的概率平均提高了约5.09%。