期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融入单元格结构信息的表格抽取方法
1
作者
乔岩
吴至友
+1 位作者
高桓
段旭祥
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024年第2期137-144,共8页
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增...
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。
展开更多
关键词
表格信息抽取
单元格结构
信息
表格识别算法
单元格
区域识别
原文传递
融合多尺度特征的核电施工图纸表格单元格识别
2
作者
徐雨晴
陈金强
+2 位作者
黄杉杉
魏婕
黄琼
《上海电力大学学报》
CAS
2024年第2期185-190,共6页
在核电企业数字化转型过程中,人工识别图纸误差较高,易造成企业损失,有必要利用自动化提取表格信息技术代替人工。表格结构识别是表格信息提取的关键技术,但核电施工图纸表格结构复杂且样本少,影响了识别效果。针对这一问题,提出了结合...
在核电企业数字化转型过程中,人工识别图纸误差较高,易造成企业损失,有必要利用自动化提取表格信息技术代替人工。表格结构识别是表格信息提取的关键技术,但核电施工图纸表格结构复杂且样本少,影响了识别效果。针对这一问题,提出了结合高效注意力机制的多尺度扩展模型EPNet,引入了渐进式尺度扩展模块,增强了有效特征通道权重,实现了少样本的有效特征信息获取。另外,利用局部特征中的文本区域和全局特征中单元关系的视觉信息来获得可靠的单元格边界,提高边缘拟合的精细度。实验结果表明,该模型在识别核电施工图纸中的表格单元格结构方面表现出色,与Mask R-CNN模型相比,精确度提高了1%,F1值提高了3%,具有较高的准确性和鲁棒性。
展开更多
关键词
核电施工图纸
表格
单元格结构
多尺度特征
下载PDF
职称材料
题名
融入单元格结构信息的表格抽取方法
1
作者
乔岩
吴至友
高桓
段旭祥
机构
重庆师范大学数学科学学院
英特尔边缘智能联合研究院
重庆大学数学与统计学院
出处
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024年第2期137-144,共8页
基金
国家自然科学基金面上项目(No.12371258)。
文摘
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。
关键词
表格信息抽取
单元格结构
信息
表格识别算法
单元格
区域识别
Keywords
table information extraction
cell structural information
table recognition algorithm
cell range recognition
分类号
O224 [理学—运筹学与控制论]
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
融合多尺度特征的核电施工图纸表格单元格识别
2
作者
徐雨晴
陈金强
黄杉杉
魏婕
黄琼
机构
上海电力大学
中国核工业第五建设有限公司
出处
《上海电力大学学报》
CAS
2024年第2期185-190,共6页
文摘
在核电企业数字化转型过程中,人工识别图纸误差较高,易造成企业损失,有必要利用自动化提取表格信息技术代替人工。表格结构识别是表格信息提取的关键技术,但核电施工图纸表格结构复杂且样本少,影响了识别效果。针对这一问题,提出了结合高效注意力机制的多尺度扩展模型EPNet,引入了渐进式尺度扩展模块,增强了有效特征通道权重,实现了少样本的有效特征信息获取。另外,利用局部特征中的文本区域和全局特征中单元关系的视觉信息来获得可靠的单元格边界,提高边缘拟合的精细度。实验结果表明,该模型在识别核电施工图纸中的表格单元格结构方面表现出色,与Mask R-CNN模型相比,精确度提高了1%,F1值提高了3%,具有较高的准确性和鲁棒性。
关键词
核电施工图纸
表格
单元格结构
多尺度特征
Keywords
nuclear power construction drawings
table
cell structure
multi-scale features
分类号
TM02 [电气工程—电工理论与新技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融入单元格结构信息的表格抽取方法
乔岩
吴至友
高桓
段旭祥
《重庆师范大学学报(自然科学版)》
CAS
北大核心
2024
0
原文传递
2
融合多尺度特征的核电施工图纸表格单元格识别
徐雨晴
陈金强
黄杉杉
魏婕
黄琼
《上海电力大学学报》
CAS
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部