-
题名应用轻量模型的半自动标注试卷版面拆解研究
被引量:1
- 1
-
-
作者
周家丰
杨蕾
-
机构
武汉轻工大学电气与电子工程学院
-
出处
《应用科技》
CAS
2023年第1期26-32,共7页
-
基金
湖北省教育厅科技基金项目(Q20191602)。
-
文摘
为了提升数据标注速率,本文采用了一种应用轻量模型、后处理实施半自动化标注的方法,实现试卷版面拆解的快速开发与应用。使用LCNet改进PicoDet网络的轻量预训练模型,对已经标注的小样本训练基础模型修改网络输出,基础模型预测剩余样本的数据转换为标注格式,经过人工校验以后的全样本标注数据使用更大规模主干网络的PicoDet网络训练最终模型。经过实验验证,本文提出的半自动标注的方法与人工标注相比,数据标注速率提升195%,标注所花费时间周期缩短86.47%,项目开发周期得到大幅度缩短,经过版面拆解处理的文档图像调用百度OCR接口,可快速实现文档图像到文档的转换。
-
关键词
数据标注速率
轻量模型
后处理
半自动标注
版面拆解
图像版面
Picodet网络
文档图像
-
Keywords
data labeling rate
lightweight model
post-processing
semi-automatic labeling
layout disassembly
image layout
Picodet network
document image
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-