-
题名基于数据集成的随机森林算法
被引量:14
- 1
-
-
作者
谢坤
容钰添
胡奉平
陈桓
姚小龙
-
机构
顺丰科技有限公司大数据与区块链研发中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第12期290-298,共9页
-
基金
深圳市发展改革委战略性新兴产业发展专项“基于人工智能技术的智慧物流系统研发与产业化项目”。
-
文摘
用于销售预测的历史数据存在稀疏性与波动性等特点,当预测周期较长时,传统统计学或者机器学习领域预测算法的预测效果较差。为此,利用随机森林的集成思想与训练数据集的随机分割重组,提出一种基于数据集成的随机森林算法。该算法通过随机重组将原始的一维预测变量重组为高维变量,并将输出求和值作为最终预测值。实验结果表明,与ARIMA、RF、GBDT等传统算法相比,该算法在实际数据集上的预测效果取得显著提高。同时,拓展实验表明数据集成还可应用在ARIMA算法上,使预测准确率提高约3%。
-
关键词
销量预测
时间序列预测
机器学习
数据集成
随机森林
-
Keywords
sales forecasting
time series prediction
machine learning
data integration
Random Forest(RF)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-