-
题名基于随机森林算法的水土流失影响因子重要性分析
被引量:15
- 1
-
-
作者
陈妙金
汪小钦
吴思颖
-
机构
福州大学空间数据挖掘和信息共享教育部重点实验室卫星空间信息技术综合应用国家地方联合工程研究中心
-
出处
《自然灾害学报》
CSCD
北大核心
2019年第4期209-219,共11页
-
基金
国家重点研发计划资助(2017YFB0504203)
福建省高校产学研重点项目(2017Y4010)
中央引导地方发展专项(2017L3012)~~
-
文摘
水土流失是诸多因素综合所致,确定水土流失因子的重要性具有重要意义。本文以福建省为例,利用土壤侵蚀强度等级数据及导致水土流失的年侵蚀降雨量、土壤类型、坡度、坡长、植被覆盖度及土地利用类型等数据,引入随机森林算法,提出通过平均精确率减少值(MDA)和平均不纯度减少值(MDG)归一化相加的方法确定要素重要性,并与MDA和MDG排序赋值相加的方法进行对比。结果表明:随机森林算法适用于水土流失影响因子重要性分析;归一化相加法对因子重要性的表征效果较好,优于排序赋值相加法,不仅能判别因子的相对重要性,还可定量表达因子间差异的显著性;在所分析的六个要素中,植被覆盖度最为重要,地形特征次之,而土壤类型对是否发生水土流失重要性影响较弱,与已有的实验和研究结果吻合,结果合理。在判断无流失与其它流失等级间关系时,植被覆盖度的重要性具有很大的优势,量级上是第二位的2倍以上。
-
关键词
水土流失
因子重要性
随机森林算法
平均精确率减少值(mda)
平均不纯度减少值(MDG)
-
Keywords
soil erosion
importance of factors
random forest
mean decrease accuracy
mean decrease Gini
-
分类号
S157
[农业科学—土壤学]
X43
[环境科学与工程—灾害防治]
-
-
题名一种供水管网泄漏区域定位的机器学习方法
被引量:3
- 2
-
-
作者
陈京钰
肖诗云
冯新
-
机构
大连理工大学建设工程学部
-
出处
《中国给水排水》
CAS
CSCD
北大核心
2021年第7期58-65,共8页
-
基金
国家重点研发计划项目(2016YFC0802400)
中央高校基本科研业务费重点实验室专题(DUT20LAB133)。
-
文摘
当采用模式识别方法识别供水管网的泄漏时,如果将每一个节点作为分类器的一个标签,由于供水管网节点泄漏特征的相似性,模型训练的准确率会比较低,因此可以通过聚类泄漏特征相似的节点形成区域,以每个区域作为分类器的标签从而提高模型训练的准确率。提出了一种基于随机森林分类器的二分迭代法识别泄漏区域,根据上一级分类器识别的泄漏区域的节点泄漏变化矩阵,采用k-means聚类将上一级迭代识别的泄漏区域聚类为两类(包含泄漏节点的区域和不包含泄漏节点的区域),从而识别包含泄漏节点的区域。随着候选泄漏区域的缩小,对识别泄漏区域有帮助的测点数量也逐渐减少,因此采用平均准确率减少(MDA)进行分类器特征(所需测点)的选择,在保证识别准确率不变的情况下减少分类器训练时所需的特征。与直接进行区域分块的识别方法相比,二分迭代法降低了选择区域分块数目时的盲目性,对于泄漏区域的识别更有目的性,提高了泄漏区域识别的准确率和效率。
-
关键词
泄漏区域识别
二分迭代法
K-meanS
随机森林分类器
特征选择
平均准确率减少
-
Keywords
leakage zone identification
binary iteration method
k-means
random forest classifier
feature selection
mean decrease accuracy(mda)
-
分类号
TU990.3
[建筑科学—市政工程]
-