一种基于局部加权回归的分类方法被引量：4

A novel classification method based on locally weighted regression

下载PDF

导出

摘要分类是数据挖掘和数据分析中最有应用价值的技术之一。传统的积极学习方法需要预先对模型空间进行假设,并且没有充分考虑到实例之间的相关性,其泛化能力将会受到一定程度的影响。针对上述问题,提出了一种基于新型映射关系的局部加权回归方法 MLWR。该算法首先找出测试样本在训练集中的近邻样本,然后建立测试样本和近邻样本的回归函数,根据建立的回归模型和近邻样本的标签,计算得到测试样本的标签。实验与当前流行的多种分类方法在UCI的9个数据集上进行测试。实验结果表明我们的方法能有效地提高分类精度,对较大样本数据也有较好的适用性。 Classification is one of the most practical techniques in data mining and analysis. Existing classification algorithms based on eager learning require a model assumption and do not address the correlations between individual instances, such that their performance can be affected. In this paper, we propose a new learning method based on the locally weighted regression, called MLWR. For a given test example, the MLWR firstly identifies the neighboring instances in the training set, and a locally weighted regression model is generated from the test instance and its neighboring instances. Then the test label is calculated by using the regression model and the neighboring labels. In the experiments, five classification methods are tested on 9 data sets of UCI. Experiment results show that the performance of the MLWR is superior to other methods and also suitable for big data.

作者徐晓丹刘华文姚明海刘日仙

机构地区浙江工业大学信息工程学院浙江师范大学数理与信息工程学院

出处《计算机工程与科学》 CSCD 北大核心 2015年第10期1959-1964,共6页 Computer Engineering & Science

基金浙江省教育厅资助项目(Y201328291) 浙江省自然科学基金资助项目(LZ14F030001 LY14F020012)

关键词分类映射关系局部加权回归 K-NN 懒惰学习 classification mapping relationship locally weighted regression k-NN lazy learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量：39
2王惠文,叶明,Gilbert Saporta.多元线性回归模型的聚类分析方法研究[J].系统仿真学报,2009,21(22):7048-7050. 被引量：23
3郝秀兰,陶晓鹏,徐和祥,胡运发.kNN文本分类器类偏斜问题的一种处理对策[J].计算机研究与发展,2009,46(1):52-61. 被引量：33
4尹航,常桂然,王兴伟.采用聚类算法优化的K近邻协同过滤算法[J].小型微型计算机系统,2013,34(4):806-809. 被引量：20

二级参考文献85

1周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：72
2苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386
3吴文丽,刘玉树,赵基海.一种新的混合聚类算法[J].系统仿真学报,2007,19(1):16-18. 被引量：18
4王惠文,孟洁.多元线性回归的预测建模方法[J].北京航空航天大学学报,2007,33(4):500-504. 被引量：241
5Japkowicz N. Learning from imbalanced data sets: A comparison of various strategies, WS-00-05 [R]. Menlo Park, CA: AAAI Press, 2000
6Chawla N V, Japkowicz N, Kotcz A. Editorial: Special issue on learning from imbalaneed data sets [J]. Sigkdd Explorations Newsletters, 2004, 6( 1 ) : 1-6
7Weiss Gary M. Mining with rarity: A unifying frameworks [J]. SIGKDD Explorations Newsletters, 2004, 6(1): 7-19
8Maloof M A. Learning when data sets are imbalanced and when costs are unequal and unknown [OL]. [2008-01-06]. http://www. site. uottawa. ca/-nat/workshop2003/workshop 2003. html
9Chawla N V, Hall L O, Bowyer K W, et al. SMOTE: Synthetic minority oversampling technique [J]. Journal of Artificial Intelligence Research, 2002, 16 : 321-357
10Jo Taeho, Japkowicz Nathalie. Class imbalances versus small disjunets [J]. SIGKDD Explorations Newsletters, 2004, 6 (1): 40-49

共引文献111

1隋国华,李春雷.基于组合分类器的地层含油情况智能决策系统[J].计算机研究与发展,2011,48(S3):476-479.
2罗俊.一种基于图的层次多标记文本分类方法[J].计算机应用研究,2010,27(3):909-912. 被引量：1
3么炜,吴玉洁,董素芬.基于多元线性回归分析的设施农业信息系统[J].河北农业大学学报,2011,34(1):123-126. 被引量：2
4袁鼎荣,钟宁,张师超.文本信息处理研究述评[J].计算机科学,2011,38(2):9-13. 被引量：11
5丁小东,徐菱,姚志刚.基于DEA方法中国交通运输行业绩效评价[J].武汉理工大学学报,2011,33(3):77-81. 被引量：25
6庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量：33
7刘赫,张相洪,刘大有,李燕军,尹立军.一种基于最大边缘相关的特征选择方法[J].计算机研究与发展,2012,49(2):354-360. 被引量：9
8赵一丁,李志民,楚纪正.一种关联历史数据的催化裂化在线仿真[J].系统仿真学报,2012,24(7):1373-1377. 被引量：3
9王超学,潘正茂,马春森,董丽丽,张涛.改进型加权KNN算法的不平衡数据集分类[J].计算机工程,2012,38(20):160-163. 被引量：26
10王超学,潘正茂,董丽丽,马春森,张星.基于改进SMOTE的非平衡数据集分类研究[J].计算机工程与应用,2013,49(2):184-187. 被引量：19

同被引文献27

1郭云开,苟叶培.路域植被叶面积指数变化遥感监测[J].遥感信息,2013,28(6):92-95. 被引量：6
2蔡博峰,绍霞.基于PROSPECT+SAIL模型的遥感叶面积指数反演[J].国土资源遥感,2007,19(2):39-43. 被引量：45
3林文鹏,赵敏,张翼飞,柳云龙,刘冬燕,高峻.基于SPOT5遥感影像的城市森林叶面积指数反演[J].测绘科学,2008,33(2):57-59. 被引量：25
4张婷,丁建丽,王飞.基于实测端元光谱的多光谱图像光谱模拟研究[J].光谱学与光谱分析,2010,30(11):2889-2893. 被引量：8
5张祥,陆必应,宋千.地基SAR差分干涉测量大气扰动误差校正[J].雷达科学与技术,2011,9(6):502-506. 被引量：19
6周校,王鹏,邢诚.基于GB-SAR的建筑物微变形测量研究[J].测绘地理信息,2012,37(5):40-43. 被引量：16
7吴伶,刘湘南,周博天,刘川浩,李露锋.利用PROSPECT+SAIL模型反演植物生化参数的植被指数优化模拟[J].应用生态学报,2012,23(12):3250-3256. 被引量：23
8陆成,陈圣波,刘万崧.叶片辐射传输模型PROSPECT理论研究[J].世界地质,2013,32(1):177-188. 被引量：8
9张金艺,张晶晶,李若涵,徐德政,徐秦乐.流水线型局部加权回归RFID室内定位[J].应用科学学报,2014,32(2):125-132. 被引量：8
10朱佳明,郭云开,刘海洋,蒋明.一种组合反演叶面积指数的方法[J].测绘科学,2019,44(1):60-65. 被引量：7

引证文献4

1朱佳明,郭云开,刘海洋,蒋明.一种组合反演叶面积指数的方法[J].测绘科学,2019,44(1):60-65. 被引量：7
2杨光,宋昕.基于改进的局部加权回归的同步带齿形重构算法[J].科学大众（科技创新）,2021(7):71-72.
3吴昊,刘毓,邓云开,田卫明.基于气象数据辅助的GB-InSAR大气相位补偿方法[J].信号处理,2021,37(8):1496-1506. 被引量：2
4郭云开,刘建琴,章琼,曹骁,郭燕青.GF-6影像下的南方路域针叶植被LAI反演研究[J].测绘科学,2021,46(9):136-143. 被引量：1

二级引证文献10

1姜海玲,赵艺源,李耀,郑世欣.扬花期冬小麦叶面积指数高光谱遥感反演研究[J].吉林师范大学学报（自然科学版）,2020,41(1):135-140. 被引量：5
2郭云开,许敏,张晓炯,刘雨玲.结合PRO-4SAIL和BP神经网络的叶绿素含量高光谱反演[J].测绘通报,2020(3):21-24. 被引量：6
3栾青,郭建平,马雅丽,张丽敏,王婧瑄.玉米叶面积指数估算通用模型[J].中国农业气象,2020,41(8):506-519. 被引量：6
4郭云开,刘建琴,郭燕青,曹骁,谢琼.GLIBERTY-DSAIL耦合模型反演南方混交林植被LAI[J].测绘通报,2020(11):39-42. 被引量：1
5郭云开,郭燕青,刘建琴,曹骁,王路.叶片表面蜡质层对植被光谱反射率的影响[J].北京测绘,2021,35(4):436-439.
6郭云开,刘建琴,章琼,曹骁,郭燕青.GF-6影像下的南方路域针叶植被LAI反演研究[J].测绘科学,2021,46(9):136-143. 被引量：1
7安德帅,徐丹丹,刘月,朱建琴.高光谱与拟合多光谱植被指数反演武夷山亚高山草甸LAI的对比研究[J].生态科学,2022,41(5):187-196. 被引量：5
8武红敢,米国兵,曾庆伟.高分六号宽幅数据的森林植被黄化监测应用[J].卫星应用,2022,30(10):37-42. 被引量：2
9金重阳,刘毓,邓云开,田卫明,胡政权.面向复杂大气扰动的GB-InSAR相位误差补偿方法[J].信号处理,2022,38(11):2432-2442. 被引量：1
10张占丰.合成孔径干涉雷达监测(InSAR)技术在公路滑坡监测中的研究[J].宜春学院学报,2023,45(9):37-40.

1虞乐,肖基毅.数据挖掘中强局部加权回归算法实现[J].电脑知识与技术,2012,8(3):1493-1495. 被引量：1
2孙江文,王崇骏,王珺,陈世福.L^2DLNB:懒惰学习双层朴素贝叶斯分类器[J].计算机科学,2007,34(1):136-139. 被引量：1
3田卫东,温勇.基于懒惰学习的显露模式分类[J].小型微型计算机系统,2016,37(4):753-757.
4赵海峰,余强,曹俞旦.基于粒计算的多标签懒惰学习算法[J].计算机科学,2014,41(12):160-163. 被引量：2
5张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量：39
6刘文静,贾振红,杨杰,庞韶宁.一种新的含噪遥感图像Otsu分割算法研究[J].激光杂志,2010,31(6):28-30. 被引量：4
7张小庆.高效能云计算虚拟机优化部署策略[J].计算机工程与应用,2016,52(15):1-7. 被引量：5
8蒋乐天,徐国治,周玲玲.基于强局部加权回归算法的软件老化趋势提取[J].上海交通大学学报,2006,40(11):1951-1954. 被引量：6
9苏连成,刘鑫,李小俚,冯文鹏.一种基于局部加权回归的润滑油磨粒在线分析算法[J].失效分析与预防,2014,9(1):6-10. 被引量：4
10修国明,张积滨,潘启树.基于实例的POMDP问题的近似求解[J].计算机工程与应用,2008,44(29):82-85.

计算机工程与科学

2015年第10期

浏览历史

内容加载中请稍等...

一种基于局部加权回归的分类方法被引量：4

参考文献4

二级参考文献85

共引文献111

同被引文献27

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

一种基于局部加权回归的分类方法 被引量：4

参考文献4

二级参考文献85

共引文献111

同被引文献27

引证文献4

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

一种基于局部加权回归的分类方法被引量：4