期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多特征融合的网页表格数据提取方法
1
作者
马佳芸
杨林峰
《工业控制计算机》
2022年第11期81-83,86,共4页
随着工业互联网的快速发展,工业管理网站获得大量应用,网页内容防篡改成为重要的安全问题。在面向工业管理网站的篡改检测问题中,网页表格数据检测是其中的重要环节,实现网页表格数据的自动化提取成为研究人员关注的重点问题。现有的网...
随着工业互联网的快速发展,工业管理网站获得大量应用,网页内容防篡改成为重要的安全问题。在面向工业管理网站的篡改检测问题中,网页表格数据检测是其中的重要环节,实现网页表格数据的自动化提取成为研究人员关注的重点问题。现有的网页表格数据提取方法通常集中于表格自身的结构特征,且多数方法只针对由标签构成的规范化表格,无法提取由其他标签构成的非规范化表格,因此提出了一种基于多特征融合的表格数据提取方法。该方法首先对网页进行预处理,然后根据DOM树节点的标签特征和属性特征进行过滤,再通过相似度聚类算法对路径相似的节点进行分组,最后结合节点簇的尺寸特征和空间特征确定表格区域。实验结果表明,该方法适用于规范化表格和非规范化表格的数据提取任务,具有较高的准确性和通用性。
展开更多
关键词
表格数据提取
多特征融合
DOM树
节点聚类
下载PDF
职称材料
数据自动采集在煤层气生产中的应用——以沁水盆地柿庄南区块煤层气井为例
被引量:
1
2
作者
陈慧
郭晖
《西北地质》
CAS
CSCD
北大核心
2021年第2期203-211,共9页
为了提高煤层气生产数据采集效率,笔者建立了数据自动采集系统。该系统可以自动识别、采集并处理不同格式、不同结构和不同类别的生产数据,形成具有统一结构的数据格式。系统可分别针对Word文件和Excel文件查找表格标题和分析表格结构,...
为了提高煤层气生产数据采集效率,笔者建立了数据自动采集系统。该系统可以自动识别、采集并处理不同格式、不同结构和不同类别的生产数据,形成具有统一结构的数据格式。系统可分别针对Word文件和Excel文件查找表格标题和分析表格结构,并利用整表识别或者关键字识别对单个单元格、连续多个单元格、单元格内的键值对和按行/列增长的数据表进行表格识别,从而实现数据自动采集。柿庄南煤层气生产数据自动采集结果表明,该系统可以准确和高效地提取和采集生产数据,为提高煤层气田生效效率提供有效技术支撑。
展开更多
关键词
数据
自动采集系统
查找
表格
标题
分析
表格
结构
提取
表格
数据
煤层气
下载PDF
职称材料
题名
基于多特征融合的网页表格数据提取方法
1
作者
马佳芸
杨林峰
机构
上海大学通信与信息工程学院
出处
《工业控制计算机》
2022年第11期81-83,86,共4页
基金
上海市科委重点项目(19DZ1205802)资助。
文摘
随着工业互联网的快速发展,工业管理网站获得大量应用,网页内容防篡改成为重要的安全问题。在面向工业管理网站的篡改检测问题中,网页表格数据检测是其中的重要环节,实现网页表格数据的自动化提取成为研究人员关注的重点问题。现有的网页表格数据提取方法通常集中于表格自身的结构特征,且多数方法只针对由标签构成的规范化表格,无法提取由其他标签构成的非规范化表格,因此提出了一种基于多特征融合的表格数据提取方法。该方法首先对网页进行预处理,然后根据DOM树节点的标签特征和属性特征进行过滤,再通过相似度聚类算法对路径相似的节点进行分组,最后结合节点簇的尺寸特征和空间特征确定表格区域。实验结果表明,该方法适用于规范化表格和非规范化表格的数据提取任务,具有较高的准确性和通用性。
关键词
表格数据提取
多特征融合
DOM树
节点聚类
Keywords
table data extraction
multi-feature fusion
DOM tree
node clustering
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
数据自动采集在煤层气生产中的应用——以沁水盆地柿庄南区块煤层气井为例
被引量:
1
2
作者
陈慧
郭晖
机构
北京中煤矿山工程有限公司
中联煤层气有限责任公司
出处
《西北地质》
CAS
CSCD
北大核心
2021年第2期203-211,共9页
基金
中海石油(中国)有限公司信息化建设项目“中联公司生产操控中心试点及配套基础设施改造”(中海油科信【2020】426号)。
文摘
为了提高煤层气生产数据采集效率,笔者建立了数据自动采集系统。该系统可以自动识别、采集并处理不同格式、不同结构和不同类别的生产数据,形成具有统一结构的数据格式。系统可分别针对Word文件和Excel文件查找表格标题和分析表格结构,并利用整表识别或者关键字识别对单个单元格、连续多个单元格、单元格内的键值对和按行/列增长的数据表进行表格识别,从而实现数据自动采集。柿庄南煤层气生产数据自动采集结果表明,该系统可以准确和高效地提取和采集生产数据,为提高煤层气田生效效率提供有效技术支撑。
关键词
数据
自动采集系统
查找
表格
标题
分析
表格
结构
提取
表格
数据
煤层气
Keywords
automatic data acquisition system
searching table title
analyze table structure
extract table data
coalbed methane
分类号
TD712 [矿业工程—矿井通风与安全]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多特征融合的网页表格数据提取方法
马佳芸
杨林峰
《工业控制计算机》
2022
0
下载PDF
职称材料
2
数据自动采集在煤层气生产中的应用——以沁水盆地柿庄南区块煤层气井为例
陈慧
郭晖
《西北地质》
CAS
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部