-
题名基于随机森林和最近邻插值法的交通流量数据修复方法
- 1
-
-
作者
汤伟
漆苏应
杨晓东
李国强
-
机构
陕西科技大学电气与控制工程学院
西安金路交通工程科技发展有限责任公司
-
出处
《科学技术与工程》
北大核心
2024年第32期14056-14065,共10页
-
基金
陕西重点研发计划(2022GY-335)。
-
文摘
针对目前传感器在采集数据过程中由于受到天气或者自身设备故障等原因,造成数据缺失或者数据异常,导致不能从采集的数据中获得准确的交通变化规律等问题,分别提出基于改进最近邻插值算法和基于随机森林插补的交通流量数据缺失修复模型。由于交通数据缺失场景和缺失类型以及时空关联的差异性,将数据缺失类型划分为简单随机缺失和复杂连续缺失两种;利用改进的最近邻插值算法建立模型处理简单随机缺失,建立随机森林模型进行迭代插补处理复杂连续缺失;面对两种不同的数据缺失类型,利用期望最大化算法、深度信念网络、季节性差分自回归滑动平均模型分别搭建模型对比交叉验证改进的最近邻插值算法和随机森林插补方法。数据来源于美国加利福尼亚州PeMS(performance measurement system)实时采集的2022年6月1日—2022年7月31日以5 min为采样时间间隔的交通流量数据,为了模拟数据的缺失状况,将完整数据按照一定比例进行缺失,来模拟数据缺数的情况,得到简单随机缺失和复杂连续缺失分布的交通流量缺失数据集。结果表明:本实验在不同的缺失比例下均有良好的表现,通过设计不同的缺失比例和类型,各项评估指标均有明显优势,验证了两种数据缺失填充模型的有效性。
-
关键词
智能交通
缺失数据修复
随机森林(RF)
最近邻插值算法
交通运营管理
-
Keywords
intelligent transportation
missing data repair
random forest(RF)
nearest neighbor interpolation algorithm
traffic operation management
-
分类号
U491.5
[交通运输工程—交通运输规划与管理]
-