目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字...目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。展开更多
本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务...本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务系统所需录入文档能够在短时间内识别完成,并集成于OCR平台进行存储和管控,进而提升处理效率,在企业的研发、生产以及运营环节节省更多人力。展开更多
电子评标过程中,由于目前的辅助招评标系统在智能化程度方面有所欠缺,在评标效率、准确率等方面仍有提升进步的区间。例如,在获取招投标文件图片信息中,现有的辅助招评标系统识别效果较差。为解决现有问题,提出了一种通过使用光学字符识...电子评标过程中,由于目前的辅助招评标系统在智能化程度方面有所欠缺,在评标效率、准确率等方面仍有提升进步的区间。例如,在获取招投标文件图片信息中,现有的辅助招评标系统识别效果较差。为解决现有问题,提出了一种通过使用光学字符识别(Optical Character Recognition,OCR)技术获取招投标文件内容,并对上传图片进行灰度值、图像预处理。该方法可大幅度增强系统智能辅助招评标功能,使用公章检测算法判断招投标文件中公章使用情况,划分标书文字块,从而缩短评标时间,减轻评审标书的工作强度,解决了评标过程中的评审不公正、评标效率低等问题,使招投标项目的评标更加公平、公正、公开。展开更多
文本识别技术可以分为光学字符识别(optical character recognition,OCR)和场景文本识别(scene text recog⁃nition,STR),其中STR是在OCR基础上针对日益复杂的应用场景衍生出来的。依托深度学习,OCR技术近年来取得了长足进步并大规模商...文本识别技术可以分为光学字符识别(optical character recognition,OCR)和场景文本识别(scene text recog⁃nition,STR),其中STR是在OCR基础上针对日益复杂的应用场景衍生出来的。依托深度学习,OCR技术近年来取得了长足进步并大规模商业落地,但深度学习面临的对抗样本攻击问题也给OCR带来了安全威胁。目前大多数OCR模型均存在识别自然扰动和防御对抗样本攻击能力差的问题,如OCR模型在噪声、水印和梯度等攻击算法下的识别准确率大大降低。相比图像领域,文本识别领域的对抗样本攻击研究还远远不够。文本识别通常被视为一个序列到序列的问题,其中输入(如图像中的像素)和输出(像素对应的字符)都是序列,这使得对抗样本的生成更具挑战性。本文对文本识别的对抗样本攻击和防御方法进行研究综述,梳理了近年来文本识别领域的对抗样本攻击方法并进行对比分析,根据攻击类型、应用场景和模型可知性,对攻击方式进行了系统分类。具体来说,按照攻击类型,可分为基于梯度的攻击、基于优化的攻击和基于生成模型的攻击;按照应用场景,可以分为OCR攻击和STR攻击;按照模型可知性,可分为白盒攻击和黑盒攻击。除了回顾文本识别对抗样本攻击方法,还简要介绍了防御技术,具体分为数据预处理、文本篡改检测和传统对抗防御技术。通过这些技术的应用,可以有效地提升文本识别模型的安全性和鲁棒性。最后,总结了文本识别领域对抗样本攻击及防御面临的挑战,并对未来发展方向做出展望。展开更多
针对传统课堂考勤中耗时长、效率低等问题,提出了一种基于计算机视觉的考勤系统,利用深度学习进行人脸识别与手机入袋检测,记录学生的到课情况与手机上交情况。为将考勤信息可视化,设计了3种登录模式的综合考勤系统。实验结果表明,该系...针对传统课堂考勤中耗时长、效率低等问题,提出了一种基于计算机视觉的考勤系统,利用深度学习进行人脸识别与手机入袋检测,记录学生的到课情况与手机上交情况。为将考勤信息可视化,设计了3种登录模式的综合考勤系统。实验结果表明,该系统不仅能在毫秒级的时间内完成检测,而且平均准确率(mean Average Precision,mAP)0.5达到0.990,保证了精确率和召回率。展开更多
文摘目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。
文摘本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务系统所需录入文档能够在短时间内识别完成,并集成于OCR平台进行存储和管控,进而提升处理效率,在企业的研发、生产以及运营环节节省更多人力。
文摘电子评标过程中,由于目前的辅助招评标系统在智能化程度方面有所欠缺,在评标效率、准确率等方面仍有提升进步的区间。例如,在获取招投标文件图片信息中,现有的辅助招评标系统识别效果较差。为解决现有问题,提出了一种通过使用光学字符识别(Optical Character Recognition,OCR)技术获取招投标文件内容,并对上传图片进行灰度值、图像预处理。该方法可大幅度增强系统智能辅助招评标功能,使用公章检测算法判断招投标文件中公章使用情况,划分标书文字块,从而缩短评标时间,减轻评审标书的工作强度,解决了评标过程中的评审不公正、评标效率低等问题,使招投标项目的评标更加公平、公正、公开。
文摘文本识别技术可以分为光学字符识别(optical character recognition,OCR)和场景文本识别(scene text recog⁃nition,STR),其中STR是在OCR基础上针对日益复杂的应用场景衍生出来的。依托深度学习,OCR技术近年来取得了长足进步并大规模商业落地,但深度学习面临的对抗样本攻击问题也给OCR带来了安全威胁。目前大多数OCR模型均存在识别自然扰动和防御对抗样本攻击能力差的问题,如OCR模型在噪声、水印和梯度等攻击算法下的识别准确率大大降低。相比图像领域,文本识别领域的对抗样本攻击研究还远远不够。文本识别通常被视为一个序列到序列的问题,其中输入(如图像中的像素)和输出(像素对应的字符)都是序列,这使得对抗样本的生成更具挑战性。本文对文本识别的对抗样本攻击和防御方法进行研究综述,梳理了近年来文本识别领域的对抗样本攻击方法并进行对比分析,根据攻击类型、应用场景和模型可知性,对攻击方式进行了系统分类。具体来说,按照攻击类型,可分为基于梯度的攻击、基于优化的攻击和基于生成模型的攻击;按照应用场景,可以分为OCR攻击和STR攻击;按照模型可知性,可分为白盒攻击和黑盒攻击。除了回顾文本识别对抗样本攻击方法,还简要介绍了防御技术,具体分为数据预处理、文本篡改检测和传统对抗防御技术。通过这些技术的应用,可以有效地提升文本识别模型的安全性和鲁棒性。最后,总结了文本识别领域对抗样本攻击及防御面临的挑战,并对未来发展方向做出展望。
文摘针对传统课堂考勤中耗时长、效率低等问题,提出了一种基于计算机视觉的考勤系统,利用深度学习进行人脸识别与手机入袋检测,记录学生的到课情况与手机上交情况。为将考勤信息可视化,设计了3种登录模式的综合考勤系统。实验结果表明,该系统不仅能在毫秒级的时间内完成检测,而且平均准确率(mean Average Precision,mAP)0.5达到0.990,保证了精确率和召回率。