基于改进随机森林算法的共享单车需求量预测被引量：1

Forecast of Shared Bicycle Demand Based on Improved Random Forest

下载PDF

导出

摘要在预测共享单车需求量的问题上,随机森林算法与其他算法相比具有显著优势。然而在处理存在大量冗余数据的数据集方面,随机森林算法会导致过拟合。为此,论文提出一种基于随机森林的改进算法—FWRF算法,预测共享单车需求量。该算法首先利用相关系数对每个特征进行加权,然后将特征区间划分为高相关区间与低相关区间,让特征选择限制在特定范围,实现降低泛化误差的目标,增强算法的学习性能,提高算法的预测精度。最后,论文将FWRF算法应用到NewYork CityBike的公开数据集上,分析多维异构数据影响下共享单车需求量变化。与原有算法相比,在预测精度上提高了5.1345%,证明了该改进算法的有效性和可行性。 Random forest algorithms have significant advantages over other algorithms in predicting the demand for shared bicycles.However,random forest algorithms can lead to overfitting in dealing with data sets with large amounts of redundant data.To this end,this paper proposes an improved algorithm based on random forest-FWRF algorithm to predict the demand for shared bicycles.Firstly,each algorithm is weighted by correlation coefficient,and then the feature interval is divided into high correlation interval and low correlation interval,so that feature selection is limited to a specific range,the goal of reducing generalization error is achieved,the learning performance of the algorithm is enhanced,and the prediction accuracy of the algorithm is improved.Finally,this paper applies the FWRF algorithm to NewYork CityBike's public dataset to analyze the changes in shared bicycle demand under the influence of multi-dimensional heterogeneous data.Compared with the original algorithm,the prediction accuracy is improved by 5.1345%,which proves the effectiveness and feasibility of the improved algorithm.

作者张徐聂文惠 ZHANG Xu;NIE Wenhui(School of Computer Science and Telecommunication Engineering,Jiangsu University,Zhenjiang 212013)

机构地区江苏大学计算机科学与通信工程学院

出处《计算机与数字工程》 2021年第9期1860-1865,共6页 Computer & Digital Engineering

关键词随机森林 FWRF 相关系数多维异构需求预测 random forest FWRF correlation coefficient scores multidimensional heterogeneous demand forecast

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1张辉,郑彭军.基于蚁群算法的城市公共自行车调度研究[J].科技与管理,2015,17(6):32-36. 被引量：8
2吴满金,董红召,刘冬旭,陈宁.公共自行车多目标动态调度建模与算法研究[J].机电工程,2015,32(7):1006-1010. 被引量：19
3董红召,史彩霞,陈宁,刘冬旭.基于关联规则的公共自行车调度区域聚类划分[J].科技通报,2013,29(9):209-212. 被引量：13
4杜韬,曲守宁,崔广强.多值属性的数据处理与关联规则挖掘方法研究[J].计算机应用研究,2009,26(8):2915-2917. 被引量：2
5李建更,高志坤.随机森林针对小样本数据类权重设置[J].计算机工程与应用,2009,45(26):131-134. 被引量：19

二级参考文献51

1张启蕊,张凌,董守斌,谭景华.训练集类别分布对文本分类的影响[J].清华大学学报（自然科学版）,2005,45(S1):1802-1805. 被引量：27
2Breiman L.Random forest[J].Machine Learning,2001,45 : 5-32.
3Stolfo S .J Fan D W S,Lee W,et al.Credit card fraud detection using meta-learning:Issues~nd initial resuhs[C]//AAAI-97 Wrokshop on AI Methods in Fraud and Risk Mangement,1997.
4Pednanlt E P D,Rosen B K,Apte C.Handling imbalanced data sets in insurance risk modeling,Technical Report RC-21731[R].IBM Research Report, 2000-03.
5Batista G E A P A,Bazzan A L C.Balancing training data for automated annotation of keywords:A case study[C]//Proe of the Second Brazilian Workshop on Bioinformaties,SBC,2003.
6Kubar M,Matwin S.Addressing the course of imbalanced training sets:One-sided selection[C]//Proceedings of 14th International Conference in Machine Learning,San Francisco,CA,1997:179-186.
7Breiman L,Freidman J.Classification and regression trees [M].[S.l.]: Wadsworth, 1984.
8Liu X Y,Wu J.Exploratory under-sampling for class-imbalance learning[C]//Proceedings of the 6th IEEE International Conference on Data Mining(ICDM'06),Hong Kong,China,2006.
9Chawla N V,Bowyer K W.SMOTE:Synthetic minority over-sampling technique[J].Journal of Artificial Intelligence Research,2002,16: 321-357.
10Chen C,Liaw A,Breiman L.Using random forest to learn imbalanced data,Technical Report 666[R].Statistics Department,University of California at Berkeley, 2003.

共引文献53

1杨鸿雁,田英杰.机器学习在食品安全风险预警及抽检方案制订中的应用研究[J].管理评论,2022,34(11):315-323. 被引量：3
2卢文跃,刘彦斌.基于复杂网络的公共自行车调度区域划分方法研究[J].智能物联技术,2020,52(6):9-15.
3李军华,吴炜,何艳,姚金铸,吴晓红,邓波.近红外光谱对天然岩石中矿物成分含量测定的研究[J].光谱学与光谱分析,2013,33(1):85-88. 被引量：21
4黄衍,查伟雄.随机森林与支持向量机分类性能比较[J].软件,2012,33(6):107-110. 被引量：74
5郭丽娟,倪子伟,江弋,邹权.集成降采样不平衡数据分类方法研究[J].计算机科学与探索,2013,7(7):630-638. 被引量：3
6董红召,史彩霞,陈宁,刘冬旭.基于关联规则的公共自行车调度区域聚类划分[J].科技通报,2013,29(9):209-212. 被引量：13
7张红,周迪新,程传祺,沙毓.共享单车运营分析及决策研究[J].大数据,2019,5(1):87-97.
8郭天楚,吴晓雨,杨磊,黄向生.基于改进的随机森林的人体部件识别[J].中国传媒大学学报（自然科学版）,2014,21(5):32-38. 被引量：1
9张辉,郑彭军.基于蚁群算法的城市公共自行车调度研究[J].科技与管理,2015,17(6):32-36. 被引量：8
10林棋,张宏,李千目.一种基于MA-LSSVM的封装式特征选择算法[J].南京理工大学学报,2016,40(1):10-16. 被引量：7

同被引文献9

1李福,徐良杰,朱然博,罗浩顺,陈国俊.基于XGBoost算法的共享单车借车需求量预测[J].武汉理工大学学报（交通科学与工程版）,2021,45(5):880-884. 被引量：8
2孙胜男,方润涛,叶波.基于出行需求的共享单车总量预测分析[J].西部交通科技,2021(9):169-171. 被引量：4
3刘恒孜,贺玉龙,宋太龙,许鹏.共享单车需求预测及调度优化[J].科学技术与工程,2021,21(35):15247-15254. 被引量：3
4孙启鹏,曾开邦,张锴琦,杨艺琛,张士行.北京市共享单车出行的时空规律与需求预测研究[J].交通运输系统工程与信息,2022,22(1):332-338. 被引量：13
5丁一丹,张福鼎.城市公共自行车智能需求预测及调度管理系统[J].电子测试,2022(7):24-26. 被引量：1
6李浩,曹元密,涂辉招.共享单车骑行需求预测研究[J].综合运输,2022,44(5):92-101. 被引量：3
7刘本兴.基于LightGBM的共享单车短时需求量预测[J].现代信息科技,2022,6(20):84-89. 被引量：3
8蒋璇,徐铖铖,张靖,梁启宇.校园无桩共享单车时空动态需求预测[J].长安大学学报（自然科学版）,2022,42(5):105-115. 被引量：1
9马云鹤,王玉玫,赵宇帆.基于时空融合图的共享单车需求预测系统[J].计算机测量与控制,2023,31(2):97-103. 被引量：1

引证文献1

1王俊,于爱荣.基于ConvLSTM的南京地区共享单车需求预测研究[J].软件工程,2024,27(2):55-59.

1郑州地铁5号线“7·20事件”中有14人不幸遇难[J].城市轨道交通研究,2021,24(8):164-164. 被引量：5
2杨玉花,白志元,卫保国,雷阳,张瑞军.基于BSA和SLAF-Seq技术对大豆主茎节数QTL精细定位[J].核农学报,2021,35(9):1953-1963. 被引量：3
3徐勇,向运琨,曾麟,何哲.基于分段加Nuttall窗插值FFT的电压暂降检测方法[J].自动化仪表,2021,42(9):54-60. 被引量：2
4宁保江,贾怡健,阎宏涛,郭可敬.有机金属络合物激光直接成型天线研究[J].测控与通信,2021,45(2):55-59.
5陈智君,郝奇,伍永健,郑亮.基于二元正态分布匹配和非线性优化的激光SLAM研究[J].组合机床与自动化加工技术,2021(9):19-23. 被引量：3
6禹洪波,袁婉玲,汪敏,张杭,熊炜,袁旭峰,邹晓松.基于非对称贴近度证据云物元模型的电力变压器综合状态评估方法[J].电网技术,2021,45(9):3706-3713. 被引量：20
7赵靖英,张珂,刘建猛.基于加速应力试验的钽电容性能退化分析与建模研究[J].仪器仪表学报,2021,42(7):177-188. 被引量：4

计算机与数字工程

2021年第9期

浏览历史

内容加载中请稍等...

基于改进随机森林算法的共享单车需求量预测被引量：1

参考文献5

二级参考文献51

共引文献53

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进随机森林算法的共享单车需求量预测 被引量：1

参考文献5

二级参考文献51

共引文献53

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进随机森林算法的共享单车需求量预测被引量：1