-
题名基于Spark的分布式交通流数据预测系统
被引量:19
- 1
-
-
作者
黄廷辉
王玉良
汪振
崔更申
-
机构
桂林电子科技大学计算机与信息安全学院
桂林电子科技大学广西可信软件重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2018年第2期405-409,416,共6页
-
基金
赛尔网络下一代互联网技术创新项目(NGII20160306)
广西科技攻关项目(PD160189)
-
文摘
在大数据时代,在城市复杂交通环境中,实现实时、准确的交通流预测,是实现智能交通系统的必要前提。提出了一种在Spark平台上基于梯度优化决策树的分布式城市交通流预测模型(distributed urban traffic prediction with GBDT,DUTP-GBDT);并提出了分布式情况下梯度优化决策树模型实现的优化方法,包括切分点抽样、特征装箱和逐层训练三种,提高了分布式情况下梯度优化决策树训练效率。基于Spark分布式计算平台高效、可靠、弹性可扩展的优势,以及梯度优化决策树模型准确率较高和时间复杂度较低的优点,利用时间特征、道路状况特征以及天气特征等特征参数,建立了DUTP-GBDT模型,实现了实时、准确的交通流预测。通过与GABP、GA-KNN、MSTAR等模型的对比,证明了利用Spark平台,DUTP-GBDT模型在分布式环境下准确率和训练速度方面均有所提高,符合城市交通流预测系统的各项要求。
-
关键词
交通流预测
分布式计算
Spark平台
梯度优化决策树模型
-
Keywords
traffic flow forecast
distributed computing
Spark platform
gradient optimization decision tree model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-