光学字符识别(Optical Character Recognition,OCR)能够从图像数据中自动检测和识别文本区域,将其转换成可编辑和可搜索的数字化文本,在提升工作效率、缩短人力成本中扮演重要角色。文本检测是OCR技术的前提,目前已有许多成功的研究。然...光学字符识别(Optical Character Recognition,OCR)能够从图像数据中自动检测和识别文本区域,将其转换成可编辑和可搜索的数字化文本,在提升工作效率、缩短人力成本中扮演重要角色。文本检测是OCR技术的前提,目前已有许多成功的研究。然而,现有方法在训练过程中未充分利用人工标注信息,导致监督信号的精度受限,进而影响文本检测模型的检测精度。针对此问题,提出了一种基于完备监督训练的可微分二值化文本检测模型(Differentiable Binarized Net based on Complete Supervised Training,DBNet-CST),它能够充分利用人工标注的文本区域信息,优化监督信号的精度,从而提高文本检测模型的性能。实验证明,该方法在自然场景文本检测任务中能够取得更为精确的结果。展开更多
文摘光学字符识别(Optical Character Recognition,OCR)能够从图像数据中自动检测和识别文本区域,将其转换成可编辑和可搜索的数字化文本,在提升工作效率、缩短人力成本中扮演重要角色。文本检测是OCR技术的前提,目前已有许多成功的研究。然而,现有方法在训练过程中未充分利用人工标注信息,导致监督信号的精度受限,进而影响文本检测模型的检测精度。针对此问题,提出了一种基于完备监督训练的可微分二值化文本检测模型(Differentiable Binarized Net based on Complete Supervised Training,DBNet-CST),它能够充分利用人工标注的文本区域信息,优化监督信号的精度,从而提高文本检测模型的性能。实验证明,该方法在自然场景文本检测任务中能够取得更为精确的结果。