基于改进集成学习的测井岩性识别方法研究被引量：4

Logging lithology identification method based on improved ensemble learning

下载PDF

导出

摘要测井数据中存在大量与岩性无关的冗余信息,且各类岩性标签数据分布不均匀,严重影响岩性识别准确率,现有测井岩性识别算法无法有效解决岩性类间不平衡问题。为此提出了一种针对不平衡样本集的集成学习岩性预测方法KSMOSEL:首先以录井岩性数据为岩性样本标签,将测井曲线作为模型输入;然后将K-means算法与合成少数类过采样技术(SMOTE)相结合形成K-means-合成过采样算法,即KS采样算法,对岩性样本集进行平衡化处理;最后将采样后的数据集用于构建集成学习模型并训练,采用多个分类器模型融合构成强学习器,通过“软投票”方式预测岩性类型。以Hugoton油气田测井岩性数据为基础,采用改进不平衡样本集的集成学习岩性预测方法对岩性进行分类,并将识别效果与传统的分类模型:支持向量机、K最近邻分类、决策树、XGBoost和随机森林等模型进行对比。试验结果表明:KSMOSEL方法具有更高的精度,岩性识别准确率达到94.28%;KS采样之后,支持向量机、K最近邻分类、决策树、XGBoost、随机森林、GBDT和集成学习等模型岩性识别准确率分别提高了18.68%,12.03%,3.77%,10.23%,24.77%,16.69%,19.37%,在测井岩性数据分布比例不平衡时极大地提升了岩性识别的准确率。 Logging data contains a lot of redundant information that is irrelevant to lithology,and the distribution of various lithology label data is uneven,which substantially impacts the accuracy of lithology recognition.The commonly used classification algorithms cannot effectively solve the problem of imbalance between lithology classes.Therefore,for unbalanced sample sets,a k-means Synthetic Minority Over Sampling Ensemble Learning(KSMOSEL)lithology prediction method is suggested.Firstly,logging lithology data were used as lithology sample labels and logging data are used as lithology sample features in this study.Secondly,the k-means algorithm was combined with Synthetic Minority Over-sampling Technique(SMOTE)to form a k-means-synthesized oversampling(KS)algorithm,to balance the lithology sample set.Then,the sampled data sets were used to build and train the integrated learning model.Multiple classifier models were fused to form a strong learner.The new training data were modeled and the"soft voting"method was used to predict the lithology types.Finally,based on the logging lithology data from the Hugoton oil and gas field,the lithology identification method of over-sampling integrated learning with an improved unbalanced sample set was adopted to classify lithology,and the identification effect was compared with the traditional classification models:Support vector machine(SVM),k-nearest neighbor classification(KNN),Decision Tree,XGBoost,and random forest models.The experimental results revealed that KSMOSEL method had the highest accuracy,with a lithology identification accuracy of 94.28%.The accuracy of lithologic identification of SVM,KNN,Decision Tree,XGBoost,random forest,GBDT and integrated learning models increased by 18.68%,12.03%,3.77%,10.23%,24.77%,16.69%,and 19.37%,respectively.It can be promoted as a lithology identification technique that can greatly improve the accuracy of lithology identification with an unbalanced distribution ratio of logging lithology data.

作者罗仁泽庹娟娟倪华玲李兴宇雷璨如郭亮 LUO Renze;TUO Juanjuan;NI Hualing;LI Xingyu;LEI Canru;GUO Liang(State Key Laboratory of Oil and Gas Reservoir Geology and Exploitation,Southwest Petroleum University,School of Earth Science and Technology,Chengdu 610500,China;Southwest Geophysical Exploration Bureau of Geophysical Prospecting,China National Petroleum Corporation,Chengdu 610500,China)

机构地区西南石油大学油气藏地质及开发工程国家重点实验室中国石油东方地球物理公司西南物探研究院

出处《石油物探》 CSCD 北大核心 2023年第2期212-224,共13页 Geophysical Prospecting For Petroleum

基金国家重点研发计划深地专项项目(2016YFC0601100) 四川省科技项目(2019CXRC0027)共同资助。

关键词岩性识别非平衡数据过采样 KSMOSEL 测井数据 lithology identification unbalanced data oversampling KSMOSEL logging data

分类号 P631 [天文地球—地质矿产勘探]

引文网络
相关文献

参考文献12

1韩启迪,张小桐,申维.基于决策树特征提取的支持向量机在岩性分类中的应用[J].吉林大学学报（地球科学版）,2019,49(2):611-620. 被引量：12
2张晗,卢双舫,李文浩,田伟超,胡莹,何涛华,谭昭昭.ΔLogR技术与BP神经网络在复杂岩性致密层有机质评价中的应用[J].地球物理学进展,2017,32(3):1308-1313. 被引量：16
3洪忠,张猛刚,朱筱敏.基于岩石物理的致密碎屑岩气藏岩性及流体概率预测[J].石油物探,2015,54(6):735-744. 被引量：18
4董金伟,张宏,黄凯,张群英,姚奇.GBDT识别致密砂岩储层岩性[J].地球物理学进展,2021,36(5):1956-1965. 被引量：8
5张野,李明超,韩帅.基于岩石图像深度学习的岩性自动识别与分类方法[J].岩石学报,2018,34(2):333-342. 被引量：109
6李曦,范翔宇,王兆峰,李永新,陈科贵,马小林.基于PSO-SVM的测井岩性识别方法研究——以南图尔盖盆地K油田古生界(Pz)储层为例[J].地球物理学进展,2022,37(2):617-626. 被引量：8
7王恒,姜亚楠,张欣,仲鸿儒,陈庆轩,高世臣.基于梯度提升算法的岩性识别方法[J].吉林大学学报（地球科学版）,2021,51(3):940-950. 被引量：17
8赵武生,谭伏霖,王志章,隆山,董延喜.准噶尔盆地腹部火成岩岩性识别[J].天然气工业,2010,30(2):21-25. 被引量：14
9王宗俊,董洪超,范廷恩,胡光义,高云峰.基于无监督学习的测井岩相分析技术及其应用[J].石油物探,2021,60(3):403-413. 被引量：7
10段友祥,赵云山,马存飞,姜文煊.基于多层集成学习的岩性识别方法[J].数据采集与处理,2020,35(3):572-581. 被引量：5

二级参考文献168

1张涛,莫修文.基于交会图与模糊聚类算法的复杂岩性识别[J].吉林大学学报（地球科学版）,2007,37(S1):109-113. 被引量：34
2张旗,金惟俊,李承东,王元龙.再论花岗岩按照Sr-Yb的分类:标志[J].岩石学报,2010,26(4):985-1015. 被引量：158
3张旗,金惟俊,李承东,王元龙.三论花岗岩按照Sr-Yb的分类:应用[J].岩石学报,2010,26(12):3431-3455. 被引量：48
4巴晶,晏信飞,陈志勇,徐光成,卞从胜,曹宏,姚逢昌,孙卫涛.非均质天然气藏的岩石物理模型及含气饱和度反演[J].地球物理学报,2013,56(5):1696-1706. 被引量：41
5冯翠菊,王敬岩,冯庆付.利用测井资料识别火成岩岩性的方法[J].大庆石油学院学报,2004,28(4):9-11. 被引量：38
6胡元现,M.Chan,S.Bharatha,G.Gurba,D.Lee,S.Papadimitrio.西加拿大盆地油砂储层中的泥夹层特征[J].地球科学（中国地质大学学报）,2004,29(5):550-554. 被引量：17
7李盼池,许少华.支持向量机在模式识别中的核函数特性分析[J].计算机工程与设计,2005,26(2):302-304. 被引量：98
8张杨.利用Xu-White模型估算地震波速度[J].成都理工大学学报（自然科学版）,2005,32(2):188-195. 被引量：29
9于代国,孙建孟,王焕增,陈伟中,李召成,张振成.测井识别岩性新方法——支持向量机方法[J].大庆石油地质与开发,2005,24(5):93-95. 被引量：43
10吴磊,徐怀民,季汉成.基于交会图和多元统计法的神经网络技术在火山岩识别中的应用[J].石油地球物理勘探,2006,41(1):81-86. 被引量：34

共引文献215

1杨远宏.基于SSA-BP神经网络的岩性识别研究[J].长春工程学院学报（自然科学版）,2021,22(1):87-91. 被引量：2
2丁磊,陈殿远,胡向阳,张恒荣,王一.加速动态时间规整算法在测井曲线相似性度量中的改进及其应用[J].吉林大学学报（地球科学版）,2022,52(6):2042-2050.
3张强,李家金,王毛毛,唐湘飞.基于改进主成分分析法的测井曲线岩性分层技术[J].吉林大学学报（地球科学版）,2022,52(4):1369-1376. 被引量：6
4邓呈祥,高文利,潘和平,孔广胜,方思南,林振洲.庐枞矿集区科学钻探的岩性识别方法[J].物探与化探,2015,39(6):1144-1149. 被引量：5
5蒲勇.致密砂岩气藏高产富集带逐级深入的预测方法[J].西南石油大学学报（自然科学版）,2016,38(2):59-67. 被引量：1
6朱林奇,张冲.谱聚类-Adaboost集成数据挖掘算法在岩性识别中的应用[J].中国科技论文,2016,11(5):545-550. 被引量：9
7王高山.准噶尔盆地滴西地区石炭系火山岩测井气层识别技术研究[J].石油化工应用,2016,35(7):100-102. 被引量：3
8张兆辉,陈华勇,高艳玲,于红果,杜社宽.克拉美丽气田火山岩岩性测井识别技术研究[J].石油物探,2016,55(5):764-770. 被引量：17
9张福明,侯颖,朱明,崔文宁,胡婷婷,陈国军,邵才瑞.火山岩储层测井评价技术现状及发展趋势[J].地球物理学进展,2016,31(4):1732-1751. 被引量：18
10王飞,边会媛,张永浩,段朝伟,陈刚.Hilbert-Huang变换联合平滑伪Wigner-Ville时频分布识别储层流体性质[J].石油物探,2016,55(6):851-860. 被引量：3

同被引文献71

1ZHOU Lu,ZHONG Feiyan,YAN Jiachen,ZHONG Kexiu,WU Yong,XU Xihui,LU Peng,ZHANG Wenji,LIU Yi.Prestack inversion identification of organic reef gas reservoirs of Permian Changxing Formation in Damaoping area, Sichuan Basin, SW China[J].Petroleum Exploration and Development,2020,47(1):89-100. 被引量：1
2罗群,黄捍东,庞雄奇,边树涛,姜振学,常洪刚.自然界可能存在的断层体圈闭[J].石油勘探与开发,2004,31(3):148-150. 被引量：18
3田中元,卞德智,陈昊,巨石,闫伟林.改进的PICKETT法在Y油田低阻油层识别中的应用[J].石油学报,2005,26(4):81-84. 被引量：13
4黄志龙,蒲秀刚,梁春秀,魏志平.松辽盆地南部低阻储层特征及其形成机理[J].天然气工业,2006,26(8):27-29. 被引量：7
5邹文,贺振华,陈爱萍,杜洪,梁波,汤述安.定量交会图技术及其在流体识别中的应用[J].石油物探,2008,47(1):45-48. 被引量：20
6张银德,童凯军,郑军,王道串.支持向量机方法在低阻油层流体识别中的应用[J].石油物探,2008,47(3):306-310. 被引量：31
7张平,潘保芝,张莹,王鹏,董瑞新.自组织神经网络在火成岩岩性识别中的应用[J].石油物探,2009,48(1):53-56. 被引量：24
8吴智平,陈伟,薛雁,宋国奇,刘惠民.断裂带的结构特征及其对油气的输导和封堵性[J].地质学报,2010,84(4):570-578. 被引量：137
9张齐.三孔隙度重叠法和三孔隙度差值及比值法在保山盆地永铸街气田气层识别中的应用[J].石油天然气学报,2010,32(2):90-93. 被引量：16
10陈伟,吴智平,侯峰,孔菲.断裂带内部结构特征及其与油气运聚关系[J].石油学报,2010,31(5):774-780. 被引量：80

引证文献4

1张卫峰,张晓明,王晓畅,张国灿,肖红琳,李清松.顺北地区断控缝洞体测井响应特征和类型识别方法[J].石油物探,2024,63(1):254-264.
2王婷婷,王振豪,李方,赵万春.基于增强多头注意力机制的Optuna-BiGRU测井岩性识别[J].地球科学与环境学报,2024,46(1):127-142.
3曹原,赵元良,袁雪花,袁龙,荣俊卿,赵盼,别康.基于随机森林算法的深层低对比度气藏流体识别[J].测井技术,2023,47(6):671-678.
4史鹏宇,徐思慧,冯加明,史鹏达,赵培强,毛志强.基于改进Stacking算法的致密砂岩储层测井流体识别[J].地球物理学进展,2024,39(1):280-290.

1顾清华,张晓玥,陈露.基于改进集成学习分类的代理辅助进化算法[J].控制与决策,2022,37(10):2456-2466. 被引量：1
2姜世公,王云飞,吴志力,崔凯,陈庆.基于改进集成学习的交直流配电系统短期负荷预测方法[J].科技通报,2021,37(7):68-73. 被引量：1
3曹茂俊,巩维嘉,高志勇.基于Stacking集成学习的岩性识别研究[J].计算机技术与发展,2022,32(7):161-166. 被引量：3
4方绍荣.云南省民族团结进步促进会在昆明成立[J].今日民族,2022(12):8-8.
5中国石油集团测井有限公司简介[J].非常规油气,2022,9(4).
6钟华明,梁玉楠,何胜林,胡向阳,曾少军.基于KNN-Fisher算法的测井解释知识库构建方法[J].石油物探,2021,60(3):395-402. 被引量：2
7无.国家卫生健康委员会通告国卫通[2020]4号[J].中华人民共和国国家卫生健康委员会公报,2020(3):1-2.
8张骁,吕继宇,赵爽,吴羽纶,王春乐.基于多卷积神经网络融合的SAR舰船分类[J].计算机与现代化,2023(1):37-42.
9苏瑞国,阳建,秦继伟,武晓雄,贾振红.基于物联网区块链的轻量级共识算法研究[J].计算机工程,2023,49(2):175-180. 被引量：1
10中国石油集团测井有限公司简介[J].非常规油气,2021,8(5).

石油物探

2023年第2期

浏览历史

内容加载中请稍等...

基于改进集成学习的测井岩性识别方法研究被引量：4

参考文献12

二级参考文献168

共引文献215

同被引文献71

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进集成学习的测井岩性识别方法研究 被引量：4

参考文献12

二级参考文献168

共引文献215

同被引文献71

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进集成学习的测井岩性识别方法研究被引量：4