基于Spark回归分析的共享单车需求量研究被引量：1

Research on bike⁃sharing demand based on Spark regression analysis

下载PDF

导出

摘要共享单车作为一项科技创新产品,解决了城市最后一公里的难题。针对共享单车供需关系不平衡且复杂多变的特性,以及解决传统机器学习工具工作复杂、流程不清晰等问题,采用Spark计算框架以及Spark机器学习管道将UCI实验室共享单车数据集应用到Spark平台,并结合线性回归、决策树、随机森林、梯度提升树这四种机器学习方法分别构建了不同的回归模型。得出随机森林的预测效果最好,RMSE、MAE和R^(2)分别为50.95、34.67和0.92。该模型具有较高的准确率,可为单车调度和预测提供较好的参考。 As a technological innovation,shared bicycles solve the problem of the last mile in the city.Aiming at the unbalanced and complex characteristics of the supply and demand of shared bicycles,as well as the complex work and unclear process of traditional machine learning tools,the Spark computing framework and Spark machine learning pipeline are used to build the Spark platform from the shared bicycle data set of the UCI laboratory.Combined with the four machine learning methods of linear regression,decision tree,random forest,and gradient boosting tree,different regression models were constructed.It is concluded that the prediction effect of random forest is the best,with RMSE,MAE and R^(2) of 50.95,34.67 and 0.92,respectively.The model has high accuracy and can provide a better reference for scheduling and forecasting of bicycles.

作者殷丽凤李钊 YIN Lifeng;LI Zhao(College of Software,Dalian Jiaotong University,Dalian 116028,China)

机构地区大连交通大学软件学院

出处《电子设计工程》 2023年第8期5-9,共5页 Electronic Design Engineering

基金国家自然科学基金(61771087)。

关键词机器学习回归分析需求量预测 SPARK machine learning regression analysis demand forecast Spark

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1朱虎明,李佩,焦李成,杨淑媛,侯彪.深度神经网络并行化研究综述[J].计算机学报,2018,41(8):1861-1881. 被引量：53
2王奕森,夏树涛.集成学习之随机森林算法综述[J].信息通信技术,2018,12(1):49-55. 被引量：177
3罗干,蒋煜楷,陈文婷,吴镇州,施运梅,宋莹.基于线性回归算法的电影票房预测研究[J].电脑知识与技术,2019,15(1):202-203. 被引量：3
4彭焱,张伟,万方.一种用于共享单车站点群的需求预测方法[J].计算机应用与软件,2021,38(9):92-98. 被引量：2
5曹旦旦,范书瑞,张艳,夏克文.基于长短期记忆神经网络模型的共享单车短时需求量预测[J].科学技术与工程,2020,20(20):8344-8349. 被引量：14
6徐长兴,汪伟平,昌锡铭,包旭,吴建军.基于因果分析和相似日选择的共享单车需求量预测组合模型[J].山东科学,2021,34(2):54-64. 被引量：3
7宋鹏,黄同愿,刘渝桥.基于SVM的共享单车需求预测[J].重庆理工大学学报（自然科学）,2019,33(7):187-194. 被引量：11
8李龙旭.规范共享单车的对策思考[J].价值工程,2017,36(35):205-206. 被引量：3
9王光荣.共享单车发展问题系统探究[J].长安大学学报（社会科学版）,2017,19(2):30-35. 被引量：50

二级参考文献36

1张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2268
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：606
3张长水.机器学习面临的挑战[J].中国科学：信息科学,2013,43(12):1612-1623. 被引量：33
4李育恒,赵峰.支持向量机在变压器故障诊断中的应用[J].科技创新与应用,2014,4(16):46-47. 被引量：5
5曾毅,刘成林,谭铁牛.类脑智能研究的回顾与展望[J].计算机学报,2016,39(1):212-222. 被引量：121
6黄同愿,陈芳芳.基于SVM股票价格预测的核函数应用研究[J].重庆理工大学学报（自然科学）,2016,30(2):89-94. 被引量：16
7焦李成,赵进,杨淑媛,刘芳,谢雯.稀疏认知学习、计算与识别的研究进展[J].计算机学报,2016,39(4):835-852. 被引量：18
8马天男,牛东晓,黄雅莉,杜振东.基于Spark平台和多变量L_2-Boosting回归模型的分布式能源系统短期负荷预测[J].电网技术,2016,40(6):1642-1649. 被引量：34
9Eric P. Xing,Qirong Ho,Dai Wei,Pengtao Xie.Strategies and Principles of Distributed Machine Learning on Big Data[J].Engineering,2016,2(2):179-195. 被引量：17
10焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：364

共引文献301

1杨雨菲,韩浩武,陈荣,黄魏,傅佩红.数字土壤制图的推理方法对比研究[J].土壤通报,2020(5):1016-1023. 被引量：1
2温学兵,谢维,姚佳宜.基于随机森林和支持向量机模型的期刊评价[J].沈阳师范大学学报（自然科学版）,2022,40(2):174-179.
3冯建英,苏允汇,龚劭齐,王智,穆维松.基于集成学习的农业生产技术效率评价方法[J].农业机械学报,2021,52(S01):148-155. 被引量：6
4吴东隆.基于Markov-GNNM的煤炭需求量预测模型研究[J].煤炭经济研究,2020(6):27-31. 被引量：2
5宣华,俞通海.温州市区共享单车使用现状调查及改进建议[J].科技经济导刊,2020,0(1):211-212. 被引量：1
6周锐,鲍沛泽,孔钦,万凯.基于TensorFlow框架的可视化大学生行为分析系统设计[J].智能计算机与应用,2020,10(7):227-233. 被引量：1
7石虹薇.论我国共享单车的法律监管[J].区域治理,2017,0(1):174-174.
8杨岩,佟贺丰,徐丽萍,姚长青.基于系统动力学模型的北京市共享单车保有量研究[J].生态经济,2018,34(12):117-122.
9刘斌,郭星,朱宇恩.基于随机森林模型的土壤重金属源解析——以晋中盆地为例[J].干旱区资源与环境,2019,33(1):106-111. 被引量：23
10张红,周迪新,程传祺,沙毓.共享单车运营分析及决策研究[J].大数据,2019,5(1):87-97.

同被引文献1

1李军言,李越.我国入境旅游人数预测和分析——基于ARIMA乘积季节模型[J].内蒙古统计,2019,0(5):26-30. 被引量：3

引证文献1

1刘方磊.基于SSM框架的旅游大数据分析系统设计与实现[J].中国新技术新产品,2023(21):22-25.

1刘霞.应用型本科高校实验室资源共享现状及对策[J].枣庄学院学报,2021,38(2):134-137. 被引量：6
2高国军,刘小妹.高校实验室开放共享的实践研究和探索[J].科技创新导报,2021,18(24):152-154.
3瞿绍军,邓月明,刘慧,谢超.院级实验室管理平台的建设与实践[J].实验室研究与探索,2022,41(5):280-284. 被引量：6
4沈明卫,吴晓琴,徐惠荣.应用型专业探究性实验深入开展的探索实践--以浙江大学农业工程专业为例[J].教育教学论坛,2021(3):109-112. 被引量：4
5钱叶牛,赵薇,张鹏程,王仕杰.基于极限学习机与小波变换的配电网故障定位[J].信息技术,2023,47(3):177-183. 被引量：1
6陈思.高校实验室面向本科生开放的管理模式研究[J].视界观,2021(3):0356-0357.
7盛洁,吴澄.基于智慧云桌面系统的人工智能实验室共享云平台的建设研究[J].电子元器件与信息技术,2022,6(11):124-127. 被引量：1
8朱婷婷,曹冠柏,高芹.卷积神经网络在压力性损伤图像分析应用中的研究进展[J].中文科技期刊数据库（引文版）医药卫生,2021(12):477-479.
9沈明卫,郝飞麟,何勇,冯雷,叶章颖.基于探究性实验的农业工程专业教学实验室优化配置和管理思考[J].实验室研究与探索,2022,41(3):262-265. 被引量：2
10张聪,刘杰,解树一,徐斌,尹海清,刘斌斌,曲选辉.高通量计算与机器学习驱动高熵合金的研究进展[J].材料工程,2023,51(3):1-16. 被引量：8

电子设计工程

2023年第8期

浏览历史

内容加载中请稍等...

基于Spark回归分析的共享单车需求量研究被引量：1

参考文献9

二级参考文献36

共引文献301

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Spark回归分析的共享单车需求量研究 被引量：1

参考文献9

二级参考文献36

共引文献301

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Spark回归分析的共享单车需求量研究被引量：1