摘要
为快速获得水体中总氮含量,采用随机森林方法建立总氮预测回归模型。结果显示,较少的数据异常值仍会造成随机森林模型较大的误差,去除4.6%的异常值后,模型均方根误差(MSE)降低了42.4%。随机森林模型可对自变量的相对重要性做出评估,对总氮而言,最重要的变量是氨氮,模型2个主要参数随机树数量(ntree)和随机分割变量数(mtry)的值分别为400和2。在选择合适的参数值时,随机森林模型不易出现过拟合显示,建立的随机森林模型可以快速预测水体中总氮的含量。
出处
《浙江农业科学》
2017年第7期1269-1272,1276,共5页
Journal of Zhejiang Agricultural Sciences
基金
温州市水体污染控制与治理科技创新项目(S20140041
S20140040
S20140039
S20140038
S20140037)