摘要
为了提高煤层气生产数据采集效率,笔者建立了数据自动采集系统。该系统可以自动识别、采集并处理不同格式、不同结构和不同类别的生产数据,形成具有统一结构的数据格式。系统可分别针对Word文件和Excel文件查找表格标题和分析表格结构,并利用整表识别或者关键字识别对单个单元格、连续多个单元格、单元格内的键值对和按行/列增长的数据表进行表格识别,从而实现数据自动采集。柿庄南煤层气生产数据自动采集结果表明,该系统可以准确和高效地提取和采集生产数据,为提高煤层气田生效效率提供有效技术支撑。
The automatic data acquisition system identifies,collects and processes production data automatically in different formats,structures and categories,which helps improvethe data acquisition efficiency of coalbed methane production.The system search table title and analyze table structure of Word file and Excel file,and use table recognition or keyword recognition to identify single cell,continuous multiple cells,key value pairs and data table.Results from coalbed methane wells of south Shizhuang block show that the system can extract and collect production data accurately and efficiently,providing an effective technical approach for the coalbed methane fields.
作者
陈慧
郭晖
CHEN Hui;GUO Hui(Beijing China Coal Mine Engineering Co.,Ltd.,Beijing 100013,China;China United Coalbed Methane Company,Beijing 100015,China)
出处
《西北地质》
CAS
CSCD
北大核心
2021年第2期203-211,共9页
Northwestern Geology
基金
中海石油(中国)有限公司信息化建设项目“中联公司生产操控中心试点及配套基础设施改造”(中海油科信【2020】426号)。
关键词
数据自动采集系统
查找表格标题
分析表格结构
提取表格数据
煤层气
automatic data acquisition system
searching table title
analyze table structure
extract table data
coalbed methane