土壤-表层岩溶带厚度是喀斯特地球关键带的关键指标,明确其空间异质性特征对于理解地球关键带结构演化机理以及评估水源涵养功能具有重要意义。在广西环江木连小流域1.4 km 2范围内,通过高密度电法(ERT)探测45条样线,共获取1731个样点...土壤-表层岩溶带厚度是喀斯特地球关键带的关键指标,明确其空间异质性特征对于理解地球关键带结构演化机理以及评估水源涵养功能具有重要意义。在广西环江木连小流域1.4 km 2范围内,通过高密度电法(ERT)探测45条样线,共获取1731个样点的土壤-表层岩溶带厚度及环境因子数据资料,研究了土壤和表层岩溶带厚度的空间分布格局及其影响因素。结果表明,土壤和表层岩溶带厚度平均值分别为1.15 m和6.44 m,且分别呈现强变异程度和中等变异程度。地统计分析结果表明球状模型和指数模型分别可以反映土壤和表层岩溶带的空间结构特征。土壤厚度呈现中等空间自相关性,变程长,空间连续性好;而表层岩溶带呈现强烈的空间自相关性,变程短,空间依赖性强。土壤厚度受到环境因子(地形湿度指数、垂直曲率、曲率、坡向、坡度、高程、覆盖度、出露基岩率和植被归一化指数)的多重影响,而表层岩溶带厚度受部分环境因子影响的同时,与土壤厚度和植被类型的相关性更高。研究结果有助于喀斯特区土壤-表层岩溶带演化机理认识,并为土壤-表层岩溶带厚度的空间预测提供科学依据。展开更多
大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同...大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能.展开更多
文摘土壤-表层岩溶带厚度是喀斯特地球关键带的关键指标,明确其空间异质性特征对于理解地球关键带结构演化机理以及评估水源涵养功能具有重要意义。在广西环江木连小流域1.4 km 2范围内,通过高密度电法(ERT)探测45条样线,共获取1731个样点的土壤-表层岩溶带厚度及环境因子数据资料,研究了土壤和表层岩溶带厚度的空间分布格局及其影响因素。结果表明,土壤和表层岩溶带厚度平均值分别为1.15 m和6.44 m,且分别呈现强变异程度和中等变异程度。地统计分析结果表明球状模型和指数模型分别可以反映土壤和表层岩溶带的空间结构特征。土壤厚度呈现中等空间自相关性,变程长,空间连续性好;而表层岩溶带呈现强烈的空间自相关性,变程短,空间依赖性强。土壤厚度受到环境因子(地形湿度指数、垂直曲率、曲率、坡向、坡度、高程、覆盖度、出露基岩率和植被归一化指数)的多重影响,而表层岩溶带厚度受部分环境因子影响的同时,与土壤厚度和植被类型的相关性更高。研究结果有助于喀斯特区土壤-表层岩溶带演化机理认识,并为土壤-表层岩溶带厚度的空间预测提供科学依据。
文摘大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能.