期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融入单元格结构信息的表格抽取方法
1
作者 乔岩 吴至友 +1 位作者 高桓 段旭祥 《重庆师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期137-144,共8页
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增... 现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。 展开更多
关键词 表格信息抽取 单元格结构信息 表格识别算法 单元格区域识别
原文传递
表格识别技术研究进展 被引量:16
2
作者 高良才 李一博 +6 位作者 都林 张新鹏 朱子仪 卢宁 金连文 黄永帅 汤帜 《中国图象图形学报》 CSCD 北大核心 2022年第6期1898-1917,共20页
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识... 表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。 展开更多
关键词 表格区域检测 表格结构识别 表格内容识别 深度学习 单元格识别 表格信息抽取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部