期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融入单元格结构信息的表格抽取方法
1
作者 乔岩 吴至友 +1 位作者 高桓 段旭祥 《重庆师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期137-144,共8页
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增... 现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。 展开更多
关键词 表格信息抽取 单元格结构信息 表格识别算法 单元格区域识别
原文传递
融合多尺度特征的核电施工图纸表格单元格识别
2
作者 徐雨晴 陈金强 +2 位作者 黄杉杉 魏婕 黄琼 《上海电力大学学报》 CAS 2024年第2期185-190,共6页
在核电企业数字化转型过程中,人工识别图纸误差较高,易造成企业损失,有必要利用自动化提取表格信息技术代替人工。表格结构识别是表格信息提取的关键技术,但核电施工图纸表格结构复杂且样本少,影响了识别效果。针对这一问题,提出了结合... 在核电企业数字化转型过程中,人工识别图纸误差较高,易造成企业损失,有必要利用自动化提取表格信息技术代替人工。表格结构识别是表格信息提取的关键技术,但核电施工图纸表格结构复杂且样本少,影响了识别效果。针对这一问题,提出了结合高效注意力机制的多尺度扩展模型EPNet,引入了渐进式尺度扩展模块,增强了有效特征通道权重,实现了少样本的有效特征信息获取。另外,利用局部特征中的文本区域和全局特征中单元关系的视觉信息来获得可靠的单元格边界,提高边缘拟合的精细度。实验结果表明,该模型在识别核电施工图纸中的表格单元格结构方面表现出色,与Mask R-CNN模型相比,精确度提高了1%,F1值提高了3%,具有较高的准确性和鲁棒性。 展开更多
关键词 核电施工图纸 表格 单元格结构 多尺度特征
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部