不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环...不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环境因子进行组合;利用单随机欠采样、频率比法及改进频率比法等负样本选取策略构建与正样本等量的负样本数据集;采用随机森林模型进行易发性评价,并对评价结果进行对比分析。结果表明:1)3种负样本选取策略下的模型精度随着因子数量的增加先下降再上升,考虑4个环境因子的模型AUC(area under curve)值分别为0.729、0.909和0.909,较最优环境因子组合仅相差0.020~0.038,说明考虑主控环境因子,即可得到较为理想的精度;2)通过频率比法选取的负样本数据集更具合理性;3)研究区内高和极高易发区主要分布在兴国县西南部,而极低易发区主要分布在兴国县北部及东部,这与实际情况较吻合。该研究通过探究不同环境因子组合和负样本选取策略对崩岗易发性评价的影响,可为花岗岩区崩岗的防灾减灾提供科学依据。展开更多
随着复杂储层地震资料特征筛选的机器学习技术的进步,如何有效地对参与地震属性优选和储层反演的地震样本进行采集和分析,成为目前智能地震预测领域的一个研究热点。目前的方法多着重于模型分类算法的改进,在标签的制作和采集方面不仅...随着复杂储层地震资料特征筛选的机器学习技术的进步,如何有效地对参与地震属性优选和储层反演的地震样本进行采集和分析,成为目前智能地震预测领域的一个研究热点。目前的方法多着重于模型分类算法的改进,在标签的制作和采集方面不仅耗费大量时间进行人工标注,还存在标签不平衡情况下类内可靠性、类间平衡性不强等问题。为此,提出基于稀疏强特征提取的三维地震数据完备方法。首先,基于多数决原则的样本分割(Sample Segmentation Based on Majority Rule,SSMR)寻迹多尺度、多标签三维地震样本,进行采集、自动标注;然后,改进标签洗牌平衡方法(Improved Label Shuffling Balance Method,ILSB),通过“2+1”的样本增广平衡策略进行数据完备处理,改善样本采样不平衡性导致的模型训练偏向性;最后,利用基于最小L_(1)范数稀疏表示对奇异值分解结果进行强特征提取(Minimum L_(1)-norm Based Sparse Representation for Feature Extraction,L_(1)-SRFE)和可视化表示。实际资料应用表明,实钻井与验证井预测结果吻合度高,该方法具有较高的标签分类准确率。展开更多
文摘不同环境因子组合和负样本选取策略对崩岗易发性评价结果存在较多不确定性。为探究其对评价结果的影响,该研究以江西省兴国县花岗岩区为例,利用地理探测器探测17个环境因子的统计量q值,根据累计q值百分比大小依次选择4、7、10和17个环境因子进行组合;利用单随机欠采样、频率比法及改进频率比法等负样本选取策略构建与正样本等量的负样本数据集;采用随机森林模型进行易发性评价,并对评价结果进行对比分析。结果表明:1)3种负样本选取策略下的模型精度随着因子数量的增加先下降再上升,考虑4个环境因子的模型AUC(area under curve)值分别为0.729、0.909和0.909,较最优环境因子组合仅相差0.020~0.038,说明考虑主控环境因子,即可得到较为理想的精度;2)通过频率比法选取的负样本数据集更具合理性;3)研究区内高和极高易发区主要分布在兴国县西南部,而极低易发区主要分布在兴国县北部及东部,这与实际情况较吻合。该研究通过探究不同环境因子组合和负样本选取策略对崩岗易发性评价的影响,可为花岗岩区崩岗的防灾减灾提供科学依据。
文摘随着复杂储层地震资料特征筛选的机器学习技术的进步,如何有效地对参与地震属性优选和储层反演的地震样本进行采集和分析,成为目前智能地震预测领域的一个研究热点。目前的方法多着重于模型分类算法的改进,在标签的制作和采集方面不仅耗费大量时间进行人工标注,还存在标签不平衡情况下类内可靠性、类间平衡性不强等问题。为此,提出基于稀疏强特征提取的三维地震数据完备方法。首先,基于多数决原则的样本分割(Sample Segmentation Based on Majority Rule,SSMR)寻迹多尺度、多标签三维地震样本,进行采集、自动标注;然后,改进标签洗牌平衡方法(Improved Label Shuffling Balance Method,ILSB),通过“2+1”的样本增广平衡策略进行数据完备处理,改善样本采样不平衡性导致的模型训练偏向性;最后,利用基于最小L_(1)范数稀疏表示对奇异值分解结果进行强特征提取(Minimum L_(1)-norm Based Sparse Representation for Feature Extraction,L_(1)-SRFE)和可视化表示。实际资料应用表明,实钻井与验证井预测结果吻合度高,该方法具有较高的标签分类准确率。