期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于规则匹配与深度学习AbTransformer的渔业标准表格信息抽取方法
1
作者 孙哲涛 于红 +5 位作者 宋奇书 李光宇 邵立铭 杨惠宁 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2023年第1期140-148,共9页
为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模... 为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模板与BERT-BiLSTM-CRF模型进行信息抽取,对非规则类表格信息采用改进的Transformer进行抽取,即在位置编码模块中引入行位置编码,与特征向量拼接以获取表格行列位置。结果表明:本文中提出的AbTransformer模型相较于机器学习MLP模型,AUC值提升了1.46%,相较于TabTransformer模型,AUC值提高了1.18%;本文中提出的RBM-AbTransformer模型与AbTransformer模型相比,准确率、召回率和F1值分别提高了7.78%、4.19%和5.27%。研究表明,结合RBM与AbTransformer的渔业标准表格信息抽取方法,有效解决了表格结构多样、表头位置不固定的问题,提升了渔业标准表格信息抽取的整体效果。 展开更多
关键词 渔业标准 实体识别 表格信息抽取 深度学习 Transformer模型
下载PDF
基于本体的WEB表格信息抽取 被引量:17
2
作者 王放 顾宁 吴国文 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2142-2146,共5页
本文给出了一个基于本体的WEB表格信息抽取方法 ,在信息的抽取过程中 ,利用学习手段 ,逐渐完善本体的构造 ,从而增强本体对应用领域的描述能力 ,使系统的信息抽取自动化程度逐渐提高 .
关键词 数据抽取 应用本体 对象联系模型 WEB页面 表格信息
下载PDF
面向工程图纸离线式表格信息提取与识别方法研究 被引量:3
3
作者 董玉德 刘孙 +3 位作者 朱长江 杜立 王仁敏 马云峰 《工程图学学报》 CSCD 北大核心 2009年第1期17-25,共9页
工程图纸中标题栏与明细表信息是产品数据管理(PDM)系统的重要信息来源。为自动提取这些数据,实现CAD与PDM的无缝集成,提出了离线式自动提取表格信息的方法。通过分析工程图纸中表格结构的特点,提出了系统的工作原理、体系结构和工作流... 工程图纸中标题栏与明细表信息是产品数据管理(PDM)系统的重要信息来源。为自动提取这些数据,实现CAD与PDM的无缝集成,提出了离线式自动提取表格信息的方法。通过分析工程图纸中表格结构的特点,提出了系统的工作原理、体系结构和工作流程,详细介绍了各功能模块和关键技术。进行了系统开发并应用在工程项目中。 展开更多
关键词 计算机应用 离线式信息提取 工程图纸 表格信息
下载PDF
建筑工程资料表格信息标准化研究 被引量:4
4
作者 马智亮 李浩 《施工技术》 CAS 北大核心 2007年第12期36-39,71,共5页
在建筑施工过程中,有关参与方通过利用表格交换大量信息实现协同工作。将表格信息结构化,并通过网络传递,可提高信息检索与再利用的效率,为此有必要建立针对这些信息的标准。对工程中各参与方交换的信息进行归纳,提出表格信息通用模型,... 在建筑施工过程中,有关参与方通过利用表格交换大量信息实现协同工作。将表格信息结构化,并通过网络传递,可提高信息检索与再利用的效率,为此有必要建立针对这些信息的标准。对工程中各参与方交换的信息进行归纳,提出表格信息通用模型,并以此为基础,借鉴相关国际标准,确立表格信息标准化方法。应用该方法起草的标准草案已成功应用在北京2008年奥运会主会场——国家体育场工程中。该方法作为先进的建筑工程资料表格信息标准化方法是可行的。 展开更多
关键词 建筑工程 表格信息 通用模型 标准化方法 标准
下载PDF
基于树结构的Web表格信息抽取方法 被引量:1
5
作者 孙全红 张贞贞 《华北水利水电学院学报》 2011年第3期108-110,共3页
针对目前国内外多种信息抽取方法中存在不同程度的局限性,提出一种基于DOM树和二叉树结构的Web表格信息抽取方法.该方法提供了以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具.该工具将Html文档解析成DOM树,再将DOM... 针对目前国内外多种信息抽取方法中存在不同程度的局限性,提出一种基于DOM树和二叉树结构的Web表格信息抽取方法.该方法提供了以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具.该工具将Html文档解析成DOM树,再将DOM树构建成一棵含有文本信息的二叉树,最后通过遍历二叉树实现对Web表格信息的抽取. 展开更多
关键词 表格信息 HTML文档 DOM树 二叉树
下载PDF
Word文档表格信息入库方法研究
6
作者 姜法明 张瑜伟 《现代测绘》 2011年第2期61-61,64,共2页
在全国第二次土地调查的过程中,部份地区协议书、地调表的制作是采用Word文档,其成果资料整洁美观,保存安全性高。通过专用工具开发,文档信息可以自动连接图形文件和数据库,减少了出错环节,保证了调查信息和数据库的一致性,提高了工作... 在全国第二次土地调查的过程中,部份地区协议书、地调表的制作是采用Word文档,其成果资料整洁美观,保存安全性高。通过专用工具开发,文档信息可以自动连接图形文件和数据库,减少了出错环节,保证了调查信息和数据库的一致性,提高了工作效率。 展开更多
关键词 农村宅基地调查 工具开发 文档表格信息入库
下载PDF
面向海量地质文档的表格信息快速抽取方法研究 被引量:3
7
作者 李杨 朱月琴 +3 位作者 李朝奎 肖克炎 范建福 李秋平 《中国矿业》 北大核心 2017年第9期98-103,共6页
以Hadoop分布式系统架构中最核心的HDFS和MapReduce为基础,提出了一种面向海量地质文档的表格信息快速抽取的方法。为了提高地质文档表格信息抽取速度,首先利用关键词查找文档在HDFS中存储的根目录,其次利用Hadoop分布式集群中Map函数和... 以Hadoop分布式系统架构中最核心的HDFS和MapReduce为基础,提出了一种面向海量地质文档的表格信息快速抽取的方法。为了提高地质文档表格信息抽取速度,首先利用关键词查找文档在HDFS中存储的根目录,其次利用Hadoop分布式集群中Map函数和Reduce函数实现单元格信息的抽取和信息还原显示,最后对重庆市矿产资源潜力评价成果数据中WORD文档进行表格快速抽取实验。实验证明,本文提出的地质文档表格信息快速抽取方法可以大幅缩减传统单机串行地质文档表格信息抽取所需的时间。 展开更多
关键词 地质文档 表格信息 快速抽取
下载PDF
PDF文档表格信息的识别与提取 被引量:8
8
作者 田翠华 张一平 +2 位作者 胡志钢 高静敏 李西雨 《厦门理工学院学报》 2020年第3期70-76,共7页
为编辑PDF文档中的表格信息,设计一种基于Python平台的,包含文件选取与文件转换两大功能模块的信息提取软件。该软件利用Python内置库,针对PDF中不同表格的结构设计算法,识别表格内的文字信息与表格结构,将得到的表格结构还原至Word与Ex... 为编辑PDF文档中的表格信息,设计一种基于Python平台的,包含文件选取与文件转换两大功能模块的信息提取软件。该软件利用Python内置库,针对PDF中不同表格的结构设计算法,识别表格内的文字信息与表格结构,将得到的表格结构还原至Word与Excel文档中,文字信息同样复原至对应单元格内。实验表明:开发的软件完整快速地提取了PDF中的表格信息,并将其转化为易于编辑的Excel和Word文档,达到了预期目的;其转换速度与收费软件WPS相当,转换速度明显快于其他免费转换软件;识别精确度与迅捷PDF转换器、Smallpdf等相比有所提高。 展开更多
关键词 PDF文档 表格信息 信息识别 信息提取 Python开发平台
下载PDF
中考数学表格信息题
9
作者 赵汀 《中学教与学》 2004年第7期12-13,共2页
关键词 中考 数学 表格信息 解题方法 方程 不等式
下载PDF
生物学表格信息题解析 被引量:1
10
作者 张南荣 李学红 +2 位作者 黄冬梅 谭兴光 卢开雄 《中学生物学》 2010年第3期58-60,共3页
从表格信息题特点、解题思路等方面归类解析2009年生物高考的部分试题。
关键词 表格信息 数据表格 过程表格 条件表格 材料表格
下载PDF
表格信息题的求解策略
11
作者 严士海 《中学数学(初中版)》 2012年第3期80-81,共2页
纵观近些年的全国各地中考试题,有不少试题都是以表格的形式出现,分布于填空、选择、解答及综合题之中.表格类问题往往因为数据众多、关系量复杂而使同学们感到为难.本文结合实例介绍求解表格类问题的几种策略,供参考.
关键词 表格信息 求解策略 中考试题 综合题 关系量 填空 同学
下载PDF
一种对大表格信息的滚动界面处理方法
12
作者 管丽 《计算机技术》 CSCD 1995年第4期25-26,共2页
本文介绍一种实用的滚屏处理方法,可用于解决纵横尺寸都远超出一屏显示范围的大表格信息的连续输入,修改及显示。
关键词 管理信息系统 表格信息 滚动界面处理法
下载PDF
例析遗传题中表格信息类题型的解法
13
作者 刘健 《中学教学参考》 2019年第26期96-96,共1页
遗传题是每年高考生物的必考题型,其中遗传题中表格信息类题型常通过文字、表格等给定信息考查表现型与基因型的推导,并要求计算相关比例,难度较大。基于此,以一道典型的例题分析说明遗传题中表格信息类题型的解法。
关键词 遗传题 表格信息类题型 分离定律
下载PDF
表格信息问题
14
作者 万新峰 《中小学数学(初中学生版)》 2003年第12期17-19,共3页
关键词 表格信息问题 2003年 中考 数学 试题分析 考查内容
下载PDF
表格信息型应用题分类解析
15
作者 龙志明 《中学生数理化(高二数学、高考数学)》 2006年第5期65-68,共4页
关键词 分类解析 表格信息型应用题 数学 高中
下载PDF
勘察报告表格和文本信息提取算法研究
16
作者 李浩 《铁道技术标准(中英文)》 2024年第3期39-46,共8页
当前,勘察报告作为重要的工程设计依据,其中有大量表格和文本信息未被有效识别利用,为进一步打通专业软件研发的数据壁垒,有效识别和提取勘察报告信息迫在眉睫。针对该现状,本文设计Word表格及文本信息提取算法,并提出信息提取、显示和... 当前,勘察报告作为重要的工程设计依据,其中有大量表格和文本信息未被有效识别利用,为进一步打通专业软件研发的数据壁垒,有效识别和提取勘察报告信息迫在眉睫。针对该现状,本文设计Word表格及文本信息提取算法,并提出信息提取、显示和利用的一整套解决方案。基于文件读写库遍历Word表格,计算每个单元格的行列合并数,进而实现Word表格精准识别至Excel;基于文档自动化技术,记录Word表格范围,反向搜索获取表格标题。基于栈数据结构和匹配算法,遍历Word段落进行大纲匹配和范围计算,实现Word文本大纲信息识别;通过程序后台模拟复制粘贴操作将数据呈现在软件界面上。引入多线程机制,防止勘察报告信息提取操作阻塞主线程,引入并行分析机制,加速文本分析效率,进而提升软件的综合用户体验。以某一实际工程勘察报告为案例进行分析,验证该算法的适用性和准确性。 展开更多
关键词 算法 表格信息提取 文本信息提取 多线程
下载PDF
项目教学法在《表格信息的加工与表达》中的应用 被引量:1
17
作者 吴帆 《中小学电教(下)》 2017年第1期58-58,共1页
《表格信息的加工与表达》内容是高二信息技术学业水平考试的重点,虽然不少学生在初中阶段都学习过,有一定的基础,但如果是一味枯燥的数据统计和计算肯定让学生毫无兴趣可言,只是应付老师布置的操作任务而已。采用项目教学法无疑是... 《表格信息的加工与表达》内容是高二信息技术学业水平考试的重点,虽然不少学生在初中阶段都学习过,有一定的基础,但如果是一味枯燥的数据统计和计算肯定让学生毫无兴趣可言,只是应付老师布置的操作任务而已。采用项目教学法无疑是一个理想的尝试。 展开更多
关键词 项目教学 表格信息加工 情境创设
原文传递
“间接设元”巧解表格信息题
18
作者 毛艳华 《初中数学教与学》 2009年第12期12-13,共2页
用表格的形式,给出已知信息,解决实际问题,是中考中的常见题型.解决这类问题,可在读懂表格信息及其数据间相互关系的前提下,选择合理的设元,这是顺利解决问题的一个重要方法.本文举例如下:
关键词 表格信息 间接 已知信息 常见题型 中考
原文传递
信息差在英语教学活动中的运用 被引量:3
19
作者 张广军 《中小学英语教学与研究》 北大核心 2003年第9期15-16,共2页
关键词 动作信息 英语教学活动 感觉信息 图画信息 表格信息
下载PDF
融入单元格结构信息的表格抽取方法
20
作者 乔岩 吴至友 +1 位作者 高桓 段旭祥 《重庆师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期137-144,共8页
现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增... 现有的端到端方法和基于预训练模型的方法在训练过程中未有效利用表格单元格的结构信息,从而影响了表格文本在模型中的向量表示和最终的语义信息抽取精确率;因此提出了进一步利用单元格结构信息来改进光学字符识别效果的端到端方法和增加单元格序列预测任务的预训练方法。实验结果显示改进后的2种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。改进后的方法加强了单元格结构信息在表格中的重要性,提高了表格语义信息抽取的精确率。 展开更多
关键词 表格信息抽取 单元格结构信息 表格识别算法 单元格区域识别
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部