样本特征对参数/非参数分类器分类精度的影响分析被引量：2

Influence on the Accuracies of Parametric and Non-parametric Classifiers from Sample Characteristics

导出

摘要为验证理论训练数量（10～30 p）对参数分类器（如最大似然分类）、非参数分类器（如支撑向量机）的适用性以及样本特征（光谱统计、空间分布特征）对分类器分类精度的影响,选择不同规模的训练样本进行最大似然分类和支撑向量机分类,分析分类精度与样本之间的关系。实验结果表明：随着样本量的增加,最大似然、支撑向量机分类精度均随样本量增多而提高并趋于稳定,最大似然分类精度的增长速度要快于支撑向量机。MLC受样本量的影响较大,在小样本的时候（5个）,分类精度不稳定,超过30个样本的时候,分类精度稳定下来;对于SVM分类器,在小样本的时候（5个）,分类精度较高且稳定,因此SVM分类适合于小样本分类,不受限于理论样本量的影响。当样本量超过最小理论样本量值（30个）的时候,最大似然分类精度要优于支撑向量机,主要是由于当样本量增加后,最大似然更易于获得有效的信息量样本,而对于支撑向量机边缘信息样本的增加数量不大。研究结果为进一步优化样本进行分类打下前期的实验基础。 It is of great significance for parametric and non-parametric classifiers to assess their classification accuracy and performance influenced from the training sample size.The theoretical training sample size（10～30 p,pdenotes the bands number of remote sensing image）is widely used as a criteria for training sample selection.The principals of classifiers,such as parameter and non-parameter classifiers,are different,and the theoretical training may be not universal and suitable for all the parameters.This paper carried out a study focusing on the analysis of classification accuracy with different training sample size,and the maximum likelihood classification（MLC）as parametric classifier and support vector machines（SVM）as non-parametric classifier are the typical and popular classifiers were introduced.The results demonstrated that the accuracies of MLC and SVM are improved and tend to be stable accompanying with the sample amount increment.It was interesting that the increasing speed of MLC is higher than that of SVM because there are more informative training samples which can describe the land cover information for MLC,while the edge pixels of land cover feature space is the informative training sample for SVM.For MLC,the accuracy fluctuation with 5training samples is obvious,while stable results with more than 30 training samples can be achieved,which represents the MLC classifier is sensitive to the training sample amount.For SVM as non-parameters classifier,the higher stable accuracy compared to MLC could be also obtained with little sample,even with 5samples,representing small training sample is suitable for SVM and break the limitation of theoretical training sample size.MLC could achieve higher accuracy than that of SVM when theoretical training samples as more than 30 were used.Under such condition,the training sample set can describe the normal spectral feature space for MLC,while the sampled selected randomly from the training sample collection has not enough informative pixels to construct the support vectors which is the basis for SVM.Analysis on the principle of different classifier,the classification accuracy for land cover mapping is different influenced from the different training sample size,and the theory of theoretical training sample is not the sole criteria for training sample size determination.The different optimized training sample selection according to classifier＇s principle is further explored based on above research results.

作者朱爽张锦水

机构地区北京工业职业技术学院北京师范大学资源学院/地表过程与资源生态国家重点实验室

出处《遥感技术与应用》 CSCD 北大核心 2016年第4期748-755,共8页 Remote Sensing Technology and Application

基金国家自然科学基金青年项目(41301444) 北京市教育委员会北京市高等学校"青年英才计划"项目北京工业职业技术学院校内一般课题(bgzyky201518) 国家重大专项高分辨率对地观测系统专项重大科技工程资助

关键词样本特征分类精度光谱离散重叠度最大似然分类支撑向量机 Sample characteristic Classification accuracy Spectral Discrete Overlap Degree（SDOD） Maximum Likelihood Classification（MLC） Support Vector Machine（SVM）

分类号 TP79 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1朱秀芳,潘耀忠,张锦水,王双,顾晓鹤,徐超.训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅰ)——训练样本与分类方法间分类精度响应关系研究[J].遥感学报,2007,11(6):826-837. 被引量：36
2赵德刚,占玉林,刘翔,刘成林,庄大方.基于波段选择的MODIS全国土地覆盖分类[J].国土资源遥感,2010,22(3):108-113. 被引量：5

二级参考文献60

1梁欣廉,李海涛,张继贤.未辐射校正高光谱数据应用于分类的可行性分析——应用光谱角制图法[J].测绘科学,2004,29(4):37-39. 被引量：2
2曹卫彬,杨邦杰,宋金鹏.TM影像中基于光谱特征的棉花识别模型[J].农业工程学报,2004,20(4):112-116. 被引量：37
3周清波.国内外农情遥感现状与发展趋势[J].中国农业资源与区划,2004,25(5):9-14. 被引量：87
4吴炳方,许文波,孙明,李强子,黄慧萍.高精度作物分布图制作[J].遥感学报,2004,8(6):688-695. 被引量：20
5王乃斌,覃平,周迎春.应用TM图像采用模式识别技术自动提取冬小麦播种面积的研究[J].遥感技术与应用,1993,8(4):28-33. 被引量：18
6蒋旭东,徐振宇,娄径.应用CBERS—1卫星数据进行安徽省北部冬小麦播种面积监测研究[J].安徽地质,2001,11(4):297-302. 被引量：8
7程乾,王人潮.数字高程模型和多时相MODIS数据复合的水稻种植面积遥感估算方法研究[J].农业工程学报,2005,21(5):89-92. 被引量：42
8刘勇洪,牛铮,王长耀.基于MODIS数据的决策树分类方法研究与应用[J].遥感学报,2005,9(4):405-412. 被引量：89
9张树文,郑洪来,赵华昌.长春净月潭遥感实验区玉米遥感估产模式研究[J].遥感技术与应用,1995,10(2):14-19. 被引量：5
10张养贞,张树文,常丽萍,张柏,陈春.县级玉米遥感估产实验及其效果研究[J].地理科学,1995,15(2):144-153. 被引量：11

共引文献39

1杨勇强,王振锡,师玉霞,连玲,高亚利.基于无人机遥感的天山云杉林密度估测研究[J].新疆农业大学学报,2019,42(3):194-201. 被引量：4
2张焕雪,李强子.空间分辨率对作物识别及种植面积估算的影响研究[J].遥感信息,2014,29(2):36-40. 被引量：11
3齐腊,赵春江,李存军,刘良云,谭昌伟,黄文江.基于多时相中巴资源卫星影像的冬小麦分类精度[J].应用生态学报,2008,19(10):2201-2208. 被引量：17
4朱秀芳,潘耀忠,王双,韩立建,徐超.训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅱ)--样本质量对小麦测量精度的影响分析[J].测绘科学,2009,34(5):132-135. 被引量：10
5王伶俐,朱文泉,姜楠,牟敏杰,刘建红.植被指数时序数据距离测度方法评价[J].遥感学报,2012,16(3):644-662. 被引量：2
6杨莹,刘元波,阮仁宗,叶春,卢盼盼.MODIS土地覆盖分类的尺度不确定性研究[J].遥感学报,2012,16(4):868-880. 被引量：6
7赵慧,汪云甲.影响ETM影像土地利用/覆盖分类精度因素的研究[J].遥感技术与应用,2012,27(4):600-608. 被引量：11
8朱良,平博,苏奋振,杜云艳,苏伟光.多时相TM影像决策树模型的水稻识别提取[J].地球信息科学学报,2013,15(3):446-451. 被引量：15
9蒋金豹,Michael D Steven,何汝艳,蔡庆空,陈云浩,徐谨.利用大豆光谱特征判定地下封存CO_2泄漏[J].农业工程学报,2013,29(12):163-169. 被引量：7
10肖锦成,欧维新,符海月.基于BP神经网络与ETM+遥感数据的盐城滨海自然湿地覆被分类[J].生态学报,2013,33(23):7496-7504. 被引量：39

同被引文献16

1张锦水,何春阳,潘耀忠,李京.基于SVM的多源信息复合的高空间分辨率遥感数据分类研究[J].遥感学报,2006,10(1):49-57. 被引量：132
2朱宝田,肖俊锋,祁文玉.某电厂3号燃气轮机压气机叶片故障的原因分析[J].热力透平,2007,36(1):67-70. 被引量：7
3吴柯,张良培,李平湘.一种端元变化的神经网络混合像元分解方法[J].遥感学报,2007,11(1):20-26. 被引量：25
4陈冬林,李慧勇,周臻,刘唐庆.基于数字图像的单只燃烧器射流几何特征参数提取[J].电力科学与技术学报,2007,22(3):41-45. 被引量：1
5张锦水,潘耀忠,韩立建,苏伟,何春阳.光谱与纹理信息复合的土地利用/覆盖变化动态监测研究[J].遥感学报,2007,11(4):500-510. 被引量：28
6胡潭高,潘耀忠,张锦水,李苓苓,李乐.基于线性光谱模型和支撑向量机的软硬分类方法[J].光谱学与光谱分析,2011,31(2):508-511. 被引量：8
7刘志刚,王英,范福强.基于内禀模态奇异值伪熵特征提取的电能质量扰动识别[J].电力科学与技术学报,2013,28(2):3-9. 被引量：4
8蓝敏,李朔宇,李锡祺,曾耀英.基于聚类分群的线损特征分析方法[J].电力科学与技术学报,2013,28(4):54-58. 被引量：11
9张英堂,马超,李志宁,范红波.基于快速留一交叉验证的核极限学习机在线建模[J].上海交通大学学报,2014,48(5):641-646. 被引量：27
10李宏伟.燃气轮机结垢性能退化仿真研究[J].装备制造技术,2015,0(6):41-44. 被引量：4

引证文献2

1朱爽,张锦水,李长青,郑阔.土地覆盖遥感制图方法研究现状与展望[J].测绘通报,2019(11):8-11. 被引量：4
2黄佳林,茅大钧,倪新宇.上下文感知的局部线性特征排序算法用于设备故障诊断[J].电力科学与技术学报,2019,34(4):48-53. 被引量：4

二级引证文献8

1万欣,艾新波.基于多信息融合的设备管理策略模型研究[J].水电站机电技术,2021,44(S01):5-10.
2刘子英,张靖,付智辉,朱琛磊.基于光纤角度传感器的高压隔离开关角度测量技术研究[J].高压电器,2021,57(10):9-17. 被引量：7
3万欣,艾新波.基于多信息融合的设备管理策略模型研究[J].水电与抽水蓄能,2021,7(6):91-97.
4朱爽,张锦水.中低分冬小麦分布提取模型效率的样本特征分析[J].遥感技术与应用,2022,37(3):608-619.
5崔健,林琪凯,张智璇.行政区划调整对城市土地利用变化的影响研究——以济南市为例[J].国土与自然资源研究,2023(1):40-45.
6胡丛慧,刘勇,侯建西,刘东杰,刘怡.基于IA_UNet模型的陇西黄土高原土地覆被分类[J].兰州大学学报（自然科学版）,2023,59(3):295-302. 被引量：1
7曹玮,肖瑶,梁迅,关庆锋.耦合混合像元分解和混合元胞模拟的土地覆盖变化推演[J].地球信息科学学报,2024,26(7):1611-1628.
8宋玲玲,王琳,钟丽,李晨曦.融合多特征信息与GWO-SVM的机械关键设备故障诊断[J].机械设计与制造,2024(11):116-121.

1胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6
2罗艳芬,万国金.基于BP神经网络模型的信息处理系统的应用分析[J].计算机与现代化,2004(11):7-8. 被引量：1
3李先倞,王庆人.快速非参数分类器BDPATCH-GBB[J].自动化学报,1990,16(2):179-182.
4孙永奎,陈光,李辉.支持向量机在模拟电路故障诊断中应用[J].电子测量与仪器学报,2008,22(2):72-75. 被引量：20
5孙娅琴,田淑芳,王兴振,高雅洁.基于光谱匹配的热红外高光谱数据岩性分类研究[J].现代地质,2016,30(1):239-246. 被引量：6
6姚明煌,骆炎民.改进的随机森林及其在遥感图像中的应用[J].计算机工程与应用,2016,52(4):168-173. 被引量：9
7徐尽.添加均匀分布噪声的数据扰动小样本分类算法[J].科技通报,2013,29(6):122-124. 被引量：1
8陈中杰,蒋刚,蔡勇.基于SVM一对一多分类算法的二次细分法研究[J].传感器与微系统,2013,32(4):44-47. 被引量：19
9朱秀芳,潘耀忠,顾晓鹤,韩立建,王双,庞新华.遥感影像的分类自校正方法研究[J].遥感信息,2007,29(5):61-64.
10高国龙.用于辨别生物危害的紫外增强红外喇曼系统[J].红外,2004,25(3):45-45.

遥感技术与应用

2016年第4期

浏览历史

内容加载中请稍等...

样本特征对参数/非参数分类器分类精度的影响分析被引量：2

参考文献2

二级参考文献60

共引文献39

同被引文献16

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

样本特征对参数/非参数分类器分类精度的影响分析 被引量：2

参考文献2

二级参考文献60

共引文献39

同被引文献16

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

样本特征对参数/非参数分类器分类精度的影响分析被引量：2