一种新的Boosting回归树方法被引量：5

A New Boosting Regression Tree Method

下载PDF

导出

摘要梯度Boosting思想在解释Boosting算法的运行机制时基于基学习器张成的空间为连续泛函空间,但是实际上在有限样本条件下形成的基学习器空间不一定是连续的。针对这一问题,从可加模型的角度出发,基于平方损失,提出一种重抽样提升回归树的新方法。该方法是一种加权的加法模型的逐步更新算法。实验结果表明,这种方法可以显著地提升一棵回归树的效果,减小预测误差,并且能得到比L2Boost算法更低的预测误差。 The basis of gradient boosting idea aimed to explain the working of boosting is that the space spaned by base learner is continuous functional space. But in practice,this space is not continuous under limited sample.To this problem,under the point of additive model view,in this study,a new resample boosting regression tree algorithm is proposed.This algorithm is a stage wise method in resample additive model.Our numerical experiments demonstrate the algorithm can improve results of a regression tree,reduce prediction errors evidently and get lower prediction error than L2Boost algorithm.

作者宋捷吴喜之

机构地区中国人民大学统计学院中国人民大学应用统计研究中心

出处《统计与信息论坛》 CSSCI 2010年第5期9-13,共5页 Journal of Statistics and Information

基金教育部重点基地重大项目<空间统计学及其应用研究>(05JJD910001)

关键词 BOOSTING regression TREE 重抽样预测误差 boosting regression tree resample prediction error

分类号 O212.1 [理学—概率论与数理统计]

引文网络
相关文献

参考文献11

1Breiman L.Arcing classifiers[J].Annals of Statistics,1998,26(3):801-849.
2Breiman L.Prediction games and arcing algorithms[J].Neural Computation,1999(11):1493-1517.
3Friedman J,Hastie T,Tibshirani R.Additive logistic regression:a statistical view of boosting[J].Annals of Statistics,2000,28(2):337-407.
4Freund Y,Schapire R E.A decision-theoretic generalization of on-line learning and a application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
5Breiman L.Arcing the edge[R].Technical Report 486,Statistics Department,Univercisty of California at Berkeley,1997.
6Drucker H.Improving regressors using boosting techniques[C].San Francisco:Morgan Kaufman.Proceedings of the 14th International Conference on Machine Learning,1997:107-115.
7Avnimelech R,Intrator N.Boosting regression estimators[J].Neural Computation,1999,11(2):499-520.
8Ridgeway G,Madigan D,Richardson T.Boosting Methodology for Regression Problems[C].San Francisco:Morgan Kaufman.Proceedings of Seventh Int'l Workshop on Artificial Intelligence and Statistics,1999:152-161.
9Friedman J.Greedy function approximation:a gradient boosting machine[J].Annals of Statistics,1999,29(15):1189-1232.
10Duffy N,Hehnbold D N.Boosting methods for regression[J].Machine Learning,2002,47(2):153-200.

同被引文献58

1叶阿忠.多元非参数计量经济模型的变窗宽局部线性估计[J].数学的实践与认识,2005,35(10):94-98. 被引量：3
2蒋学军,夏天,唐年胜.变窗宽局部线性回归中的M-估计[J].云南大学学报（自然科学版）,2006,28(1):12-15. 被引量：1
3王鸿斌,张立毅,胡志军.人工神经网络理论及其应用[J].山西电子技术,2006(2):41-43. 被引量：34
4黎夏,叶嘉安,刘小平.地理模拟系统在城市规划中的应用[J].城市规划,2006,30(6):69-74. 被引量：23
5李闯,丁晓青,吴佑寿.一种改进的AdaBoost算法——AD AdaBoost[J].计算机学报,2007,30(1):103-109. 被引量：53
6谷彬,赵彦云.非参数统计作用与发展[J].中国统计,2007,22(4):56-56. 被引量：17
7黎夏,杨青生,刘小平.基于CA的城市演变的知识挖掘及规划情景模拟[J].中国科学（D辑）,2007,37(9):1242-1251. 被引量：43
8温小霓,蔡汝骏.分类与回归树及其应用研究[J].统计与决策,2007,23(23):14-16. 被引量：14
9李凯,崔丽娟.集成学习算法的差异性及性能比较[J].计算机工程,2008,34(6):35-37. 被引量：22
10胡文瑜,孙志挥,张柏礼.分布式数据挖掘中的最优K相异性取样技术[J].东南大学学报（自然科学版）,2008,38(3):385-389. 被引量：5

引证文献5

1武靖娜,杨姝,王剑辉.一种分布式大数据挖掘的快速在线学习算法[J].沈阳师范大学学报（自然科学版）,2016,34(1):100-104. 被引量：3
2张连增,申晴.提升算法对传统车险索赔频率建模模型的改进——基于我国五省交强险保单数据[J].保险研究,2019,0(7):67-78. 被引量：3
3杨晓明,蔡宇阳,巫雨洋,翁敏.城市扩展模拟预测:多种机器学习算法的比较[J].测绘地理信息,2021,46(5):98-101. 被引量：2
4刘晓芳,王合玲,张辉国.树结构变窗宽局部多项式拟合方法[J].数学的实践与认识,2023,53(11):142-149.
5饶炜东.机器学习在混凝土抗压强度预测中的应用[J].统计学与应用,2017,6(1):1-6. 被引量：1

二级引证文献9

1陆孟杰,陈磊,李彪,邱人大,江山.基于长短时记忆网络预测的高强混凝土力学性能研究[J].建筑结构,2023,53(S02):1371-1375.
2杨品林.彩色图像数据库中目标特征数据挖掘方法[J].沈阳工业大学学报,2018,40(1):60-64. 被引量：13
3谢修娟,李香菊,操凤平,孙丽.基于改进C4.5的E-learning教学辅助系统的研究与实现[J].佳木斯大学学报（自然科学版）,2018,36(1):64-67. 被引量：4
4张宁,陈浩,周亮,包竹青,高珊,赵颖旭.基于机器学习模型的糖尿病带病人群医疗险风险保费测算[J].保险研究,2020(11):79-95. 被引量：5
5张姝,陶宏才.基于改进DeepFM的车险索赔预测模型的研究[J].成都信息工程大学学报,2021,36(3):311-315.
6信晓艺.基于分布式数据的学习分类器的研究[J].蚌埠学院学报,2022,11(2):76-80. 被引量：1
7王玉琳,张晓青.山东省县级城市扩展时空演变及影响因素研究[J].湖南师范大学自然科学学报,2023,46(2):64-75. 被引量：2
8冯一凡,冯君明,李翅.生态韧性视角下绿色空间时空演变及优化研究进展[J].生态学报,2023,43(14):5648-5661. 被引量：10
9司晶硕.基于两层Stacking模型的累积索赔额预测及定价研究[J].应用数学进展,2022,11(5):2858-2867.

1李毓,张春霞,王冠伟.线性回归模型的Boosting变量选择方法[J].工程数学学报,2015,32(5):677-689. 被引量：3
2宋捷,吕晓玲,吴喜之.两分类不平衡数据的Boosting算法[J].统计与决策,2010,26(10):8-10.
3葛新权.线性回归与时间序列加法预测模型[J].预测,2000,19(1):50-50. 被引量：7
4袁修久,张文修.自变量含有类型变量的线性回归模型的树方法[J].工程数学学报,2003,20(6):106-110.
5古平,朱庆生.一种可并行的贝叶斯集合在线学习算法[J].计算机科学,2006,33(4):159-161. 被引量：2
6窦霁虹,郭明焕,崔志明.棋子的颜色变化问题[J].西北大学学报（自然科学版）,2000,30(6):470-472. 被引量：4
7王洪礼,李胜朋,冯剑丰.赤潮随机梯度回归分析[J].海洋技术,2005,24(3):65-69. 被引量：4
8牛艳庆,胡宝清.基于模糊Adaboost算法的支持向量回归机[J].模糊系统与数学,2006,20(2):140-145. 被引量：4
9赵秀丽,赵俊龙,吴喜之.结合降维思想的BinomialBoosting方法[J].统计与决策,2009,25(21):13-15.
10尚小舟,石艳平.基于Boosting方法的混合正态模型选择[J].甘肃联合大学学报（自然科学版）,2008,22(4):3-6.

统计与信息论坛

2010年第5期

浏览历史

内容加载中请稍等...

一种新的Boosting回归树方法被引量：5

参考文献11

同被引文献58

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种新的Boosting回归树方法 被引量：5

参考文献11

同被引文献58

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种新的Boosting回归树方法被引量：5