期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融入单元格结构信息的表格抽取方法
1
作者
乔岩
吴至友
+1 位作者
高桓
段旭祥
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024年第2期137-144,共8页
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增...
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。
展开更多
关键词
表格信息抽取
单元格
结构信息
表格
识别
算法
单元格
区域
识别
原文传递
表格识别技术研究进展
被引量:
16
2
作者
高良才
李一博
+6 位作者
都林
张新鹏
朱子仪
卢宁
金连文
黄永帅
汤帜
《中国图象图形学报》
CSCD
北大核心
2022年第6期1898-1917,共20页
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识...
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。
展开更多
关键词
表格区域检测
表格结构
识别
表格内容
识别
深度学习
单元格识别
表格信息抽取
原文传递
题名
融入单元格结构信息的表格抽取方法
1
作者
乔岩
吴至友
高桓
段旭祥
机构
重庆师范大学数学科学学院
英特尔边缘智能联合研究院
重庆大学数学与统计学院
出处
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024年第2期137-144,共8页
基金
国家自然科学基金面上项目(No.12371258)。
文摘
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。
关键词
表格信息抽取
单元格
结构信息
表格
识别
算法
单元格
区域
识别
Keywords
table information extraction
cell structural information
table recognition algorithm
cell range recognition
分类号
O224 [理学—运筹学与控制论]
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
表格识别技术研究进展
被引量:
16
2
作者
高良才
李一博
都林
张新鹏
朱子仪
卢宁
金连文
黄永帅
汤帜
机构
北京大学王选计算机研究所
华为技术有限公司AI应用研究中心
华南理工大学电子与信息学院
出处
《中国图象图形学报》
CSCD
北大核心
2022年第6期1898-1917,共20页
基金
国家重点研发计划资助(2019YFB1406303)。
文摘
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。
关键词
表格区域检测
表格结构
识别
表格内容
识别
深度学习
单元格识别
表格信息抽取
Keywords
table area detection
table structure recognition
table content recognition
deep learning
table cell recognition
table information extraction
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
融入单元格结构信息的表格抽取方法
乔岩
吴至友
高桓
段旭祥
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024
0
原文传递
2
表格识别技术研究进展
高良才
李一博
都林
张新鹏
朱子仪
卢宁
金连文
黄永帅
汤帜
《中国图象图形学报》
CSCD
北大核心
2022
16
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部