基于机器学习的稀疏样本下的土壤有机质估算方法被引量：11

Estimating Soil Organic Matter based on Machine Learning Under Sparse Sample

导出

摘要采用GRNN(Generalized Regression Neural Network)和RF(Random Forest)2种机器学习方法构建土壤有机质预测模型,以提高稀疏样本情况下的土壤有机质估算精度。依据北京市大兴区农用地2007年的土壤有机质采样数据,按MMSD准则(Minimization of the Mean of the Shortest Distances)抽稀为8种不同采样密度的样本(分别为2703、1352、676、339、169、85、43、22个样本),分别采用GRNN、RF和Ordinary kriging对各采样密度下的未知采样点进行预测,采用交叉检验的方式验证各采样密度下未知样点的预测精度。随着采样点密度的下降,样点间的空间自相关性逐渐减弱,半变异函数的拟和精度变差,预测点结果误差增大,预测的置信度降低。当抽稀到43个和22个采样点时,样点间的空间自相关性接近歼灭,半变异函数的决定系数较低且残差较大。普通克里格受到采样点数量和采样密度、样点的空间结构的影响比较明显,其预测精度随采样点数量的下降而下降。在85个采样点及以下时,其预测值与观测值之间没有显著的相关性。GRNN和RF的预测精度受采样密度的影响不大,其预测精度在一个较小的范围内波动,其预测值围绕观测值在一定阈值空间内震荡波动,具有较好的相关性,在85个及以下的采样密度时,预测精度相对普通克里格有较大的提升。普通克里格法不适合在稀疏样本条件下空间插值计算,尤其是在空间自相关性比较弱的情况下。机器学习模型能充分学习土壤间环境信息、样点空间邻近效应信息,兼顾属性相似性和空间自相关,具有更好的稳定性和适应性,不容易受到采样点数量、构型和采样密度等因素的影响,即使在采样点空间自相关性很弱的情况下也能做出稳定预测精度。 To improve the accuracy of soil organic estimation in the case of sparse samples and to construct the soil organic predictive models applying the machine learning methods,GRNN(Generalized Regression Neural Network)and RF(Random Forest).The soil was diluted into 8 samples with different sampling density(2703,1352,676,339,169,85,43,22 samples)according to the soil organic matter sampling data of Daxing agricultural land in 2007 applying the MMSD(Minimization of the Mean of the Shortest Distances)criterion.GRNN(Generalized Regression Neural Network),RF(random forest)and Ordinary Kriging are applied to predict each sampling density espectively.Cross Validation is used to verify the prediction accuracy of unknown samples at each sampling density.With the decrease of sampling point density,the spatial correlation between sampling points decreases gradually,thus the semivariogram’s fitting precision deteriorates,the errorofprediction point result increases,and the confidence of the prediction decreases.The spatial correlation between sampling points is close to disappear when the sample is diluted under 43 and 22 samples,and the coefficient of determination of the semivariogram function is low and the residual is large.The impacts the Ordinary Kriging receives,which are from the changes in the number of the sampling points,sampling density and spatial structures of samples is obvious.The prediction accuracy of the method decreases with the decrease of the number of sampling points.There is no significant correlation between the predicted values and the observed values at or below 85 sampling points.The prediction accuracy of GRNN and RF is almost independent of the sampling density.The predicted values fluctuate within a certain threshold space around the observed values,and has good correlation.At sampling points of 85 and below,the prediction accuracy is greatly improved compared with Ordinary Kriging.Ordinary Kriging is not suitable for spatial interpolating calculation in the case of sparse samples,especially in the case of weak spatial correlation.The machine learning models can fully learn the environmental information and spatial proximity information of soil sampling points.They combine attribute similarity and spatial correlation and have better stability and adaptability,not being easy to be affected by the number of sampling points,configuration and sampling density,and can make stable and accurate predictions even when the spatial autocorrelation between sampling points is very weak.

作者刘明杰徐卓揆郜允兵杨晶潘瑜春高秉博周艳兵周万鹏王凌 LIU Mingjie;XU Zhuokui;GAO Yunbing;YANG Jing;PAN Yuchun;GAO Bingbo;ZHOU Yanbing;ZHOU Wanpeng;WANG Ling(School of Traffic and Transportation Engineering,Changsha University of Science and Technology,Changsha 410114,China;Beijing Research Center for Information Technology in Agriculture,Beijing 100097,China;Engineering Laboratory of Spatial Information Technology of Highway Geological Disaster Early Warning in Hunan Province(Changsha University of Science&Technology),Changsha 410114,China;National Engineering Research Center for Information Technology in Agriculture,Beijing 100097,China;China Agricultural University,Beijing 100083,China;Henan Polytechnic University,Jiaozuo 454003,China;Institute of Agricultural Resources and Environment,Hebei Academy of Agriculture and Forestry Sciences,Shijiazhuang 050051,China)

机构地区长沙理工大学交通运输学院国家农业信息化工程技术研究中心长沙理工大学公路地质灾变预警空间信息技术湖南省工程实验室北京农业信息技术研究中心中国农业大学河南理工大学河北省农林科学院农业资源环境研究所

出处《地球信息科学学报》 CSCD 北大核心 2020年第9期1799-1813,共15页 Journal of Geo-information Science

基金国家重点研发计划课题(2017YFD0801205) 北京市农林科学院科技创新能力建设专项(KJCX20170407、KJCX20200414) 湖南省教育厅资助科研项目(13B129) 湖南省工程实验室开放基金资助项目(KFJ180602)。

关键词土壤有机质空间插值机器学习属性相似性空间自相关大兴区稀疏样本采样密度 soil organic matter spatial interpolation machine learning attribute similarity spatial correlation Daxing County sparse sample sampling density

分类号 S153.621 [农业科学—土壤学]

引文网络
相关文献

参考文献23

1孔祥斌,张凤荣,王茹.近20年城乡交错带土壤养分时间空间变异特征分析——以北京市大兴区为例[J].土壤,2004,36(6):636-643. 被引量：31
2王宗明,张柏,宋开山,刘殿伟,李建平,黄健,张惠琳.东北平原典型农业县农田土壤养分空间分布影响因素分析[J].水土保持学报,2007,21(2):73-77. 被引量：46
3江叶枫,郭熙,叶英聪,孙凯,饶磊.应用集成BP神经网络模型预测土壤有机质空间分布[J].江苏农业学报,2017,33(5):1044-1050. 被引量：11
4宋英强,杨联安,冯武焕,于世锋,许婧婷,王晶,杨煜岑,任丽.基于多源辅助变量和极限学习机的蔬菜地土壤有机质预测研究[J].土壤通报,2017,48(1):118-126. 被引量：5
5李启权,王昌全,岳天祥,张文江,余勇.基于神经网络模型的中国表层土壤有机质空间分布模拟方法[J].地球科学进展,2012,27(2):175-184. 被引量：23
6任丽,杨联安,王辉,杨粉莉,陈卫军,张林森,徐瑾昊.基于随机森林的苹果区土壤有机质空间预测[J].干旱区资源与环境,2018,32(8):141-146. 被引量：24
7秦静,孔祥斌,姜广辉,刘怡,李翠珍.北京典型边缘区25年来土壤有机质的时空变异特征[J].农业工程学报,2008,24(3):124-129. 被引量：46
8范曼曼,吴鹏豹,张欢,魏晓,陈富荣,高超.采样密度对土壤有机质空间变异解析的影响[J].农业现代化研究,2016,37(3):594-600. 被引量：7
9徐云鹤,方斌.江浙典型茶园土壤有机质空间异质性分析[J].地球信息科学学报,2015,17(5):622-630. 被引量：11
10宋莎,李廷轩,王永东,张锡洲.县域农田土壤有机质空间变异及其影响因素分析[J].土壤,2011,43(1):44-49. 被引量：39

二级参考文献294

1柴旭荣,黄元仿,苑小勇.用高程辅助提高土壤属性的空间预测精度[J].中国农业科学,2007,40(12):2766-2773. 被引量：14
2高翔,王爱民,张德利.皋兰县城郊化过程中土地利用变化响应[J].人文地理,2001,16(5):76-79. 被引量：3
3王兆军,张怀成,刘键,郑雯,高洪江.规模化畜禽养殖污染有效防治途径探讨[J].中国人口·资源与环境,2001,11(S1):73-75. 被引量：39
4吴才武,夏建新,段峥嵘.土壤有机质预测性制图方法研究进展[J].土壤通报,2015,46(1):239-247. 被引量：18
5张若兮,杨勇,张楚天.基于范畴型变量和贝叶斯最大熵的土壤有机质空间预测[J].土壤通报,2015,46(2):312-318. 被引量：6
6朱会义,刘述林,贾绍凤.自然地理要素空间插值的几个问题[J].地理研究,2004,23(4):425-432. 被引量：179
7王洪杰,史学正,李宪文,于东升,孙维侠,曹志洪.小流域尺度土壤养分的空间分布特征及其与土地利用的关系[J].水土保持学报,2004,18(1):15-18. 被引量：36
8刘世全,高丽丽,蒲玉琳,邓良基,张世熔.西藏土壤有机质和氮素状况及其影响因素分析[J].水土保持学报,2004,18(6):54-57. 被引量：74
9李晓燕,张树文,王宗明,张惠琳.吉林省德惠市土壤特性空间变异特征与格局[J].地理学报,2004,59(6):989-997. 被引量：45
10李文芳,杨世俊,文赤夫,田春莲.土壤有机质的环境效应[J].环境科学动态,2004(4):31-33. 被引量：54

共引文献540

1陈强,杨劲松,姚荣江,王相平,谢文萍,郑复乐,朱海,王树林.河套平原典型县域耕地土壤养分空间变异特征研究[J].中国农学通报,2020,0(10):102-108. 被引量：10
2秦富仓,刘力川,杨振奇,牛晓乐,李晓琴.阿荣旗地形对耕地养分的影响研究[J].内蒙古农业大学学报（自然科学版）,2019,40(6):35-40. 被引量：1
3祝亚飞,刘俊,王阳,齐晓波,汪建飞.基于生态位理论的土壤硒资源评价及利用[J].安徽理工大学学报（自然科学版）,2022,42(3):78-85.
4孙冬晓,杨旗,赵正勇,丁晓纲,朱航勇,李莹莹.云浮市森林土壤养分垂直分布模型的构建[J].林业与环境科学,2020,0(1):1-8. 被引量：9
5周峰,檀满枝,陈杰,李桂林.苏州市城市边缘带土壤肥力特征分析[J].土壤,2007,39(5):837-839. 被引量：3
6霍霄妮,李红,张微微,孙丹峰,周连第,李保国.北京耕作土壤重金属多尺度空间结构[J].农业工程学报,2009,25(3):223-229. 被引量：61
7麻万诸,章明奎,吕晓男,张天雨,陈晓佳,任周桥,邓勋飞.普通克里金模型对同尺度下不同土壤肥力指标的空间解析力比较[J].西北农林科技大学学报（自然科学版）,2010,38(10):199-204. 被引量：7
8李朝奎,王利东,李吟,周新邵.土壤重金属污染评价方法研究进展[J].矿产与地质,2011,25(2):172-176. 被引量：43
9唐雪梦,陈理,董仁杰,庞昌乐.北京市大中型沼气工程调研分析与建议[J].农机化研究,2012,34(3):206-211. 被引量：8
10卢彩云,王庆杰,何进,李洪文,Rabi G.Rasaily,乔晓东,李慧.炭化秸秆覆盖用于保护性耕作的试验研究[J].农业工程学报,2012,28(S1):238-243. 被引量：6

同被引文献225

1奚雪,赵庚星.基于无人机多光谱遥感的冬小麦叶绿素含量反演及监测[J].中国农学通报,2020(20):119-126. 被引量：16
2Jing YANG,Wenhao YANG,Fan WANG,Liming ZHANG,Biqing ZHOU,Rubab SARFRAZ,Shihe XING.Driving factors of soluble organic nitrogen dynamics in paddy soils:Structure equation modeling analysis[J].Pedosphere,2020,30(6):801-809. 被引量：5
3王琦,常庆瑞,落莉莉,蒋丹垚,黄勇.陕西省农田土壤有机质时空变异与驱动因子定量研究[J].农业机械学报,2022,53(11):349-359. 被引量：5
4薛明月,王成新,窦旺胜,王召汉.黄河流域传统村落空间分布特征及其影响因素研究[J].干旱区资源与环境,2020,34(4):94-99. 被引量：80
5程朋根,吴剑,李大军,何挺.土壤有机质高光谱遥感和地统计定量预测[J].农业工程学报,2009,25(3):142-147. 被引量：32
6周清,周斌,张杨珠,王人潮.成土母质对水稻土高光谱特性及其有机质含量光谱参数模型影响的初步研究[J].土壤学报,2004,41(6):905-911. 被引量：36
7李亮亮,依艳丽,凌国鑫,王甦.地统计学在土壤空间变异研究中的应用[J].土壤通报,2005,36(2):265-268. 被引量：140
8赵永存,史学正,于东升,赵彦锋,孙维侠,王洪杰.不同方法预测河北省土壤有机碳密度空间分布特征的研究[J].土壤学报,2005,42(3):379-385. 被引量：69
9何挺,王静,程烨,林宗坚.土壤氧化铁光谱特征研究[J].地理与地理信息科学,2006,22(2):30-34. 被引量：68
10黄耀,孙文娟.近20年来中国大陆农田表土有机碳含量的变化趋势[J].科学通报,2006,51(7):750-763. 被引量：178

引证文献11

1纪伟帅,陈红艳,王淑婷,张玉婷.基于无人机多光谱的华北平原花铃期棉花叶片SPAD建模方法研究[J].中国农学通报,2021,37(22):143-150. 被引量：12
2高文龙,张圣微,林汐,雒萌,任照怡.煤矿开采中SOM的遥感估算和时空动态分析[J].自然资源遥感,2021,33(4):235-242. 被引量：2
3曹佳萍,张黎明,邱龙霞,邢世和,马丹.基于稀疏样点的南方丘陵地区耕地土壤有效磷制图[J].中国生态农业学报（中英文）,2022,30(2):290-301. 被引量：6
4高浩然,周勇,王丽,吴正祥.基于Geodetector模型的鄂北岗地土壤有机质空间格局及影响因素分析——以枣阳市为例[J].长江流域资源与环境,2022,31(1):166-178. 被引量：5
5张鑫,杨超,刘洪斌,武伟.基于机器学习的植烟区土壤有机质和全氮含量预测[J].烟草科技,2022,55(8):20-27. 被引量：4
6高浩然,周勇,刘甲康,王丽,吴飞,田杨.湖北省两种地形区耕地土壤肥力指标空间格局与主控因素[J].水土保持通报,2022,42(5):283-292. 被引量：3
7黎钰鑫,赵小敏,郭熙,赵丽红.南昌市近郊耕层土壤有机质空间格局及其影响因素分析[J].江西农业大学学报,2023,45(3):749-758. 被引量：3
8唐茂淞,张楠,李国辉,赵泽艺,李明发,王兴鹏.基于机器学习算法的棉田土壤钾、钠离子量预测[J].灌溉排水学报,2023,42(9):32-39. 被引量：3
9聂小军,赵星辉,AMMARA Gill,洪雯雯,张合兵.基于光谱特征指数与机器学习的矿区土壤煤源碳质量分数反演[J].煤炭学报,2023,48(7):2869-2880.
10张佳琦,潘瑜春,高世臣,赵亚楠,景胜强,周艳兵,郜允兵.基于稀疏样点的土壤重金属含量模拟方法[J].环境科学,2024,45(4):2417-2427.

二级引证文献38

1车紫进,李会宾,贾曲,宋佳运,史云.土壤调查成果制图软件设计与实现[J].中国农业信息,2022,34(6):59-66. 被引量：1
2曹英丽,江凯伦,刘亚帝,于正鑫,肖文,于丰华.基于高光谱红边位置提取的水稻叶绿素反演研究[J].沈阳农业大学学报,2021,52(6):718-728. 被引量：4
3郑德有,顾爱星,左东云,王巧莲,张友平,吕丽敏,程海亮,宋国立.3种植物生长调节剂对杀菌剂防治棉花枯萎病效果的影响[J].中国棉花,2022,49(5):14-18. 被引量：1
4江凯伦,安吉庆,赵雨薇,罗俊盈,曹英丽.采用RNCA-PSO-ELM的水稻叶绿素光谱特征分析与反演[J].农业工程学报,2022,38(8):178-186. 被引量：5
5田宸宇,鲁逸飞,刘永建,简思春,曾银锐,杨兴有,鲁黎明.基于无人机遥感的田间农作物表型反演建模方法[J].智慧农业导刊,2022,2(21):1-3.
6严薇,唐乐,彭佳元,刘文祥,张振乾.无人机可见光谱识别越冬期油菜叶片叶绿素含量估测研究[J].作物研究,2022,36(6):514-518.
7王淑婷,孔雨光,张赞,陈红艳,刘鹏.基于星-机光谱融合的棉花叶片SPAD值反演[J].中国农业科学,2022,55(24):4823-4839.
8马纬,武志明,余科松.基于无人机多光谱的不同施硒水平荞麦冠层叶绿素估测模型研究[J].河南农业科学,2023,52(3):161-172.
9黎钰鑫,赵小敏,郭熙,赵丽红.南昌市近郊耕层土壤有机质空间格局及其影响因素分析[J].江西农业大学学报,2023,45(3):749-758. 被引量：3
10鲁向晖,王倩,张海娜,龚荣新,张杰,杨宝城.基于无人机多光谱遥感的芳樟矮林SPAD反演[J].农业机械学报,2023,54(5):201-209. 被引量：3

1李树文,蔡晓芳,田晓婷.山西夏季极端降水日数变化规律[J].山西科技,2020,35(1):50-53. 被引量：1
2王莹.韧性视角下新时代城市安全风险治理策略研究[J].领导科学,2020(16):37-40. 被引量：8
3王涛,王明悦,胡薇,周云平,郑玉新,冷曙光.中国2018年PM2.5的空间分布特征——基于地理信息系统的研究[J].环境与职业医学,2020,37(6):553-557. 被引量：9
4陈涛,韩波,肖兰,郭黎民,肖美英.1964年—2016年湖南省日照时空变化特征分析[J].衡阳师范学院学报,2019,40(6):70-75. 被引量：1
5刘道荣.浙西丘陵区不同采样密度富硒土壤评价研究[J].华东地质,2020,41(2):177-183.
6王鑫,姚尧,徐梦洁,庄舜尧.宜兴市稻田表层土壤生物固氮量的空间分异特征[J].土壤,2020,52(3):618-624. 被引量：2
7魏祥坡,余旭初,张鹏强,职露,杨帆.联合局部二值模式的CNN高光谱图像分类[J].遥感学报,2020,24(8):1000-1009. 被引量：16
8刘峰民,白冰,赵小娟.基于DEM的甘肃降水空间分布[J].甘肃科技,2020,36(15):50-53. 被引量：3
9盘华,钟正,陈卫东.基于移动AR的幼儿学习资源设计与应用[J].教育研究与实验,2020(3):76-79. 被引量：4
10邹艳红,阳宽达.基于杨赤中推估法的降雨空间插值应用研究[J].测绘与空间地理信息,2020,43(2):17-20. 被引量：1

地球信息科学学报

2020年第9期

浏览历史

内容加载中请稍等...

基于机器学习的稀疏样本下的土壤有机质估算方法被引量：11

参考文献23

二级参考文献294

共引文献540

同被引文献225

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于机器学习的稀疏样本下的土壤有机质估算方法 被引量：11

参考文献23

二级参考文献294

共引文献540

同被引文献225

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于机器学习的稀疏样本下的土壤有机质估算方法被引量：11