期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合边特征与注意力的表格结构识别模型
被引量:
1
1
作者
吕学强
张煜楠
+2 位作者
韩晶
崔运鹏
李欢
《计算机应用》
CSCD
北大核心
2023年第3期752-758,共7页
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上...
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。
展开更多
关键词
图神经网络
图注意力网络
特征融合
表格
结构识别
表格解析
下载PDF
职称材料
融合容错机制的基于Attention-Mask RCNN地质表格信息抽取方法
被引量:
1
2
作者
董家慧子
谢忠
+3 位作者
邱芹军
马凯
田苗
陶留锋
《地质科学》
CAS
CSCD
北大核心
2023年第3期1147-1163,共17页
地质表格信息提取是地质报告从信息转换到知识阶段的重要任务之一,对将非结构化的数据转化为结构化的地学知识具有重要意义,同时还为文本与表格的知识关联提供了技术支撑。然而现有的表格解析方法在地学领域存在局限性,在单元格提取中,...
地质表格信息提取是地质报告从信息转换到知识阶段的重要任务之一,对将非结构化的数据转化为结构化的地学知识具有重要意义,同时还为文本与表格的知识关联提供了技术支撑。然而现有的表格解析方法在地学领域存在局限性,在单元格提取中,地质表格中大量的合并单元格造成了不同单元格间大小差异大,大量小面积单元格无法被提取;在表格解析方面地质表格包含了大量的被斜线分割的特殊表头,难以自动化解析。为解决上述问题,本文提出了一种基于注意力机制的Mask RCNN单元格提取模型及基于OpenCV框架的表格结构解析方法。主要包括两个步骤:1)上下文注意模块(CAM)学习上下文特征以识别不同大小单元格;2)一种标准容错机制的复杂表头解析方法,解析含斜线分割的复杂表头单元格。在构建的地质表格数据集上进行模型性能评估,该方法对于多数地质表格的解析准确率达到95%以上;相比其他单元格识别和表格结构解析方法,该方法解析效果更优。
展开更多
关键词
地质报告
地质
表格
结构
解析
Mask
RCNN
容错机制
注意力机制
下载PDF
职称材料
题名
融合边特征与注意力的表格结构识别模型
被引量:
1
1
作者
吕学强
张煜楠
韩晶
崔运鹏
李欢
机构
网络文化与数字传播北京市重点实验室(北京信息科技大学)
农业农村部农业大数据重点实验室(中国农业科学院农业信息研究所)
出处
《计算机应用》
CSCD
北大核心
2023年第3期752-758,共7页
基金
国家自然科学基金资助项目(62171043)。
文摘
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。
关键词
图神经网络
图注意力网络
特征融合
表格
结构识别
表格解析
Keywords
graph neural network
graph attention network
feature fusion
table structure recognition
table parsing
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合容错机制的基于Attention-Mask RCNN地质表格信息抽取方法
被引量:
1
2
作者
董家慧子
谢忠
邱芹军
马凯
田苗
陶留锋
机构
中国地质大学(武汉)计算机与信息学院
自然资源部城市国土资源监测与仿真重点实验室
三峡大学计算机与信息学院
三峡大学基于智能视觉的水电工程监测湖北省重点实验室
出处
《地质科学》
CAS
CSCD
北大核心
2023年第3期1147-1163,共17页
基金
国家重点研发计划项目(编号:2022YFF0711601)
国家自然科学基金原创探索计划项目(编号:42050101)
+1 种基金
湖北省自然科学基金项目(编号:2022CFB640)
自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题项目(编号:KF-2022-07-014)资助。
文摘
地质表格信息提取是地质报告从信息转换到知识阶段的重要任务之一,对将非结构化的数据转化为结构化的地学知识具有重要意义,同时还为文本与表格的知识关联提供了技术支撑。然而现有的表格解析方法在地学领域存在局限性,在单元格提取中,地质表格中大量的合并单元格造成了不同单元格间大小差异大,大量小面积单元格无法被提取;在表格解析方面地质表格包含了大量的被斜线分割的特殊表头,难以自动化解析。为解决上述问题,本文提出了一种基于注意力机制的Mask RCNN单元格提取模型及基于OpenCV框架的表格结构解析方法。主要包括两个步骤:1)上下文注意模块(CAM)学习上下文特征以识别不同大小单元格;2)一种标准容错机制的复杂表头解析方法,解析含斜线分割的复杂表头单元格。在构建的地质表格数据集上进行模型性能评估,该方法对于多数地质表格的解析准确率达到95%以上;相比其他单元格识别和表格结构解析方法,该方法解析效果更优。
关键词
地质报告
地质
表格
结构
解析
Mask
RCNN
容错机制
注意力机制
Keywords
Geological report
Analysis of geological table structure
Mask RCNN
Fault‑tolerant mechanism
Attention mechanism
分类号
P628.4 [天文地球—地质矿产勘探]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合边特征与注意力的表格结构识别模型
吕学强
张煜楠
韩晶
崔运鹏
李欢
《计算机应用》
CSCD
北大核心
2023
1
下载PDF
职称材料
2
融合容错机制的基于Attention-Mask RCNN地质表格信息抽取方法
董家慧子
谢忠
邱芹军
马凯
田苗
陶留锋
《地质科学》
CAS
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部