-
题名不定长数据中识别模糊文本的数据加载方法
- 1
-
-
作者
苗小爱
-
机构
青岛酒店管理职业技术学院
-
出处
《软件导刊》
2023年第5期177-183,共7页
-
文摘
随着人工智能的发展,越来越多的企业开始构建智能应用,OCR即是人工智能落地应用之一,也是当前研究热点。在自然场景下,由于拍摄环境复杂、拍摄设备质量参差不齐,以及拍摄的图片存在文字模糊、文本部分缺失、背景复杂等情况,会造成在不定长数据集上训练文本识别模型困难的问题。针对此情况,提出一种新的数据加载方法以加快收敛速度,提高模型识别准确率。该方法主要包括两部分:(1)设计近似背景填充以适当增加负样本比例;(2)设定图像放缩阈值,保证真实数据形状并对数据进行适度放缩以达到自然场景下文本数据样式效果。与常用的经典数据加载方法相比,该数据加载方法具有更快的拟合速度和识别准确率。
-
关键词
文本识别
文字模糊
数据加载
图像放缩阈值
近似背景填充
-
Keywords
text recognition
text blur
data loading
image scaling threshold
approximate background fill
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-