基于深度强化学习的智联网汽车感知任务分配被引量：11

Near-Optimal Vehicular Crowdsensing Task Allocation Empowered by Deep Reinforcement Learning

下载PDF

导出

摘要随着智能/辅助/自动驾驶以及电动汽车技术的飞速发展,当前智联网汽车配备越来越多的传感器,拥有越来越强大的计算、存储和通信能力.作为智联网汽车中重要一类,出租车、滴滴等网约车(Mobility-on-demand vehicles)具有城市覆盖规模大和粒度细,以及空闲时间充足的优点.因此,利用这些智联网汽车现有的移动感知设备能够为城市大规模、细粒度、低成本的感知提供很好的机会.本文以出租车、滴滴等这一类重要的智联网汽车为研究对象,重点研究它们的感知任务分配问题,主要面临两方面挑战:一是智联网汽车载客收益(如出租车载客收入)以及汽车/感知任务分布具有时空动态性,导致智联网汽车的感知成本具有高时空动态性且很难建模和学习.二是感知任务的最优分配问题是NP-hard问题,具有指数级时间复杂度.同时,高移动性的智联网汽车对任务的实时分配要求很高.因此,如何对大规模的智联网汽车实现任务的最优实时分配具有挑战性.为了解决这两个挑战,本文提出基于深度强化学习的智联网汽车感知任务分配方法.通过深度强化学习模型对高时空动态性的汽车感知成本进行精确学习,然后基于学习结果进行感知任务的实时最优分配.具体地,针对挑战一,利用基于双注意力机制的循环神经网络挖掘汽车载客收益的时空相关性,并结合驾驶耗费模型,学习智联网汽车的感知成本.针对挑战二,首先通过问题等价转换和理论分析,证明该任务的最优分配问题具有单调子模目标函数和q-独立系统约束条件.然后,基于子模优化理论,联合考虑整体收益和边际效益,提出多项式时间复杂度的近似最优分配算法(近似率为1/2+c_(max)/c_(min)),其中c_(max)和c_(min)分别表示所有感知成本的最大和最小值.最后,基于两个大规模的智联网汽车数据集(重庆市,约12493辆车;纽约市,约超过1.13亿个行程),对所提方法进行深入全面的评估.实验结果表明,所提方法比7种对比方法平均提高载客收益的预测精度25.1%,提高任务分配的总感知效益37.7%.同时,面向城市道路违规停车监测应用,构建智联网汽车感知原型系统.基于该系统验证了所提方法的可行性和实际应用价值. With the rapid development of intelligent vehicular technologies,such as Self-driving systems and Advanced Driver Assistance systems,off-the-shelf intelligent vehicles are equipped with more and more sensors,including GPS,camera,Lidar,etc.,thus possessing powerful capabilities of computation and communication along with large-scale storage capacity.As an important kind of the intelligent vehicle,the Mobility-On-Demand(MOD)vehicles(such as Uber,DiDi,and connected taxis)have large-scale,fine-grained coverage in cities along with non-negligible amounts of spare time.Hence,utilizing their available sensors provides promising opportunities in achieving large-scale,fine-grained,and low-cost vehicular crowdsensing for smart cities.As a result,this paper focuses on these MOD vehicles and studies how to optimally allocate the vehicular crowdsensing tasks for the MOD vehicles.It chiefly involves two main challenges:(1)Both the distributions of the MOD vehicles and the sensing tasks have spatial-temporal differences.Also,the pick-up earnings of MOD vehicles vary with the location and time.Hence,it renders the sensing cost highly dynamic in both temporal and spatial dimensions.Even worse,such sensing cost is hard to model because of its highly dynamic nature.(2)The optimal sensing task allocation is a NP-hard problem,which has exponential time complexity.Furthermore,owing to the high mobility of the vehicles,it requires real-time task allocation in vehicular crowdsensing.To address these challenges,we propose a deep reinforcement learning-empowered near-optimal task allocation method for vehicular crowdsensing.We utilize deep reinforcement learning to extract the highly dynamic sensing cost of vehicles,which is fed back to optimally allocate the sensing tasks for each MOD vehicle.Specifically,targeting the first challenge,we deploy the Encoder-Decoder Recurrent Neural Network based on dual attentions(including the spatial attention and the temporal attention)to extract the spatial-temporal correlations of pick-up earnings,which are then used to learn the sensing cost according to the driving cost model.Furthermore,through the equivalent problem transformation,we prove that the task allocation problem has a submodular objective function and a q-dependent constraint.Hence,based on the sub-modularity theory,we propose a near-optimal task allocation algorithm,jointly considering the total utility and marginal utility.It is proved to achieve a 1/2+c_(max)/c_(min)-approximation ratio in polynomial time,where c_(max) and c_(min) represent the maximal and minimal values of the sensing costs for all the vehicles,respectively.Finally,we exploit two large-scale datasets to evaluate the performance of the proposed method.One dataset is about 12493 MOD vehicles in Chongqing City,China,while the other is about 113 million vehicle trips in New York City,America.The results demonstrate that our method averagely improves the prediction accuracy of pick-up earnings and the allocation utility of sensing tasks by 25.1%and 37.7%,respectively,compared with seven baselines.Moreover,we implement a prototype system for on-road illegal parking detection,i.e.,leveraging the smartphone sensor(such as camera and GPS)of massive MOD vehicles to detect the on-road illegal parking events when driving on roads.Based on this system,we validate the proposed method is feasible and significant in practical applications.

作者向朝参李耀宇冯亮陈超郭松涛杨盘隆 XIANG Chao-Can;LI Yao-Yu;FENG Liang;CHEN Chao;GUO Song-Tao;YANG Pan-Long(College of Computer Science,Chongqing University,Chongqing 400044;Key Laboratory of Dependable Service Computing in Cyber Physical Society(Chongqing University),Ministry of Education,Chongqing 400044;School of Computer Science and Technology,University of Science and Technology of China,Hefei 230026)

机构地区重庆大学计算机学院信息物理社会可信服务计算教育部重点实验室中国科学技术大学计算机科学与技术学院

出处《计算机学报》 EI CAS CSCD 北大核心 2022年第5期918-934,共17页 Chinese Journal of Computers

基金国家自然科学基金项目(62172063,61872447)资助。

关键词智联网汽车感知任务分配深度强化学习子模优化循环神经网络 vehicular crowdsensing sensing task allocation deep reinforcement learning sub-modularity recurrent neural network

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1赵东,马华东.群智感知网络的发展及挑战[J].信息通信技术,2014,8(5):66-70. 被引量：19
2李静林,袁泉,杨放春.车联网群智感知与服务[J].中兴通讯技术,2015,21(6):6-9. 被引量：12
3朱斐,吴文,伏玉琛,刘全.基于双深度网络的安全深度强化学习方法[J].计算机学报,2019,42(8):1812-1826. 被引量：26
4廖晓闽,严少虎,石嘉,谭震宇,赵钟灵,李赞.基于深度强化学习的蜂窝网资源分配算法[J].通信学报,2019,40(2):11-18. 被引量：36
5刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：456
6刘媛妮,李垚焬,李慧聪,李万林,张建辉,赵国锋.基于拍卖模型的移动群智感知网络激励机制[J].通信学报,2019,40(7):208-222. 被引量：9
7谢昭,周义,吴克伟,张顺然.基于时空关注度LSTM的行为识别[J].计算机学报,2021,44(2):261-274. 被引量：16

二级参考文献41

1魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
2高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
3刘云浩.群智感知计算[J].中国计算机学会通讯,2012,8(10):38-41.
4Ganti R K,Ye F,Lei H.Mobile crowdsensing:Currentstate and future challenges[J].IEEE CommunicationsMagazine,2011,49(11):32–39.
5Huadong Ma,Dong Zhao,Peiyan Yuan.Opportunitiesin Mobile Crowd Sensing[J].IEEE CommunicationsMagazine,2014,52(8):29–35.
6Dutta P,Aoki P,Kumar N,et al.Common Sense:participatory urban sensing using a network of handheldair quality monitors[C]//ACM SenSys,2009: 349–350.
7Stevens M,D'Hondt E.Crowdsourcing of pollution datausing smartphones[C].In Workshop on UbiquitousCrowdsourcing,2010.
8Rana R,Chou C,Kanhere S,et al.Ear-phone:an end-toendparticipatory urban noise mapping system[C]//ACM/IEEE IPSN,2010:105–116.
9Kim S,Robson C,Zimmerman T,et al.Creek watch:pairing usefulness and usability for successful citizenscience[C]//ACM SIGCHI,2011:2125–2134.
10Hul l B,By chkov s k y V,Zhang Y,et al .CarTel :adistributed mobile sensor computing system[C]//ACMSenSys,2006:125–138.

共引文献556

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：2
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：42
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：40
5王帆,陆雯霞,黄婷婷,李凌凯.基于群体感知的景区质量评价系统设计与实现[J].现代商业,2020,0(1):47-49. 被引量：1
6周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：5
7李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
8王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.
9刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：1
10蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.

同被引文献47

1邱彬,王芳,刘万祥.中国汽车产业发展趋势分析[J].汽车工业研究,2022(1):2-9. 被引量：12
2吴文乐,郭斌,於志文.基于群智感知的城市噪声检测与时空规律分析[J].计算机辅助设计与图形学学报,2014,26(4):638-643. 被引量：20
3黄涵霞,丁强,李莉,娄梦茜,孙知信.移动终端群智感知研究[J].计算机技术与发展,2014,24(6):6-9. 被引量：10
4陈荟慧,郭斌,於志文.移动群智感知应用[J].中兴通讯技术,2014,20(1):35-37. 被引量：18
5赵东,马华东.群智感知网络的发展及挑战[J].信息通信技术,2014,8(5):66-70. 被引量：19
6李静林,袁泉,杨放春.车联网群智感知与服务[J].中兴通讯技术,2015,21(6):6-9. 被引量：12
7何宏,向朝参,肖书成,沈鑫,杨盘隆,苟继彬.群智感知网络研究现状与发展[J].吉林大学学报（信息科学版）,2016,34(3):374-383. 被引量：12
8刘琰,郭斌,吴文乐,於志文,张大庆.移动群智感知多任务参与者优选方法研究[J].计算机学报,2017,40(8):1872-1887. 被引量：23
9刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：456
10朱钧宇,黄传河,范茜莹,覃匡宇,付斌.城市环境车联网中基于近似算法的RSU部署方案[J].通信学报,2018,39(1):78-89. 被引量：8

引证文献11

1程文辉,张乾元,程梁华,向朝参,杨振东,沈鑫,张乃凡.空地协同移动群智感知研究综述[J].计算机科学,2022,49(11):242-249. 被引量：1
2李晓波,陈鹏,帅彬,夏云霓,李建岐.边缘环境下轨迹预测性感知的在线边缘服务分配[J].计算机科学,2022,49(11):277-283.
3杨子.浅析汽车功能域的关键技术[J].电子产品世界,2022,29(11):55-58. 被引量：2
4刘文彬,杨永健,王恩.合作性移动群智感知中具有一般效用和成本的用户招募方法[J].计算机学报,2022,45(12):2576-2591. 被引量：2
5代亮,吴益钵,汪贵平.蜂窝车联网连通性研究综述与展望[J].计算机科学,2023,50(1):285-293. 被引量：1
6张彬,徐疏峰,苏东辉.新能源汽车到智联网汽车整车电气系统发展研究[J].时代汽车,2023(15):93-95. 被引量：1
7陈瑞,沈鑫,万得胜,周恩亦.面向绿色节能的智能网联电动车调度方法[J].计算机科学,2023,50(12):285-293. 被引量：1
8熊明福,肖应雄,陈佳,胡新荣,彭涛.二次聚类的无监督行人重识别方法[J].计算机工程与应用,2024,60(1):227-235. 被引量：1
9俞冠珉.基于深度学习技术的汽车减振器阀片自动化检测与分类研究[J].中国机械,2024(3):84-87.
10冯涣婷,程玉虎,王雪松.基于不确定性估计的离线确定型Actor-Critic[J].计算机学报,2024,47(4):717-732.

二级引证文献9

1石晶晶,黄立鑫,王振宇.无人机影像重叠度对航空摄影测量精度的影响分析[J].江西科学,2023,41(3):574-577. 被引量：2
2庞仁勇,陈文庆,姚昂,吴凡,黄丽芳,徐伟.软件定义汽车的功能架构设计过程研究[J].汽车电器,2023(11):35-37.
3王波.智能控制技术在新能源汽车中的应用[J].汽车测试报告,2023(14):31-33. 被引量：2
4牟星宇,陈晖,徐昕,江晓玲,李云峰,张鑫晶.基于Tangle网络的群智感知隐私保护激励方法[J].科学技术与工程,2024,24(3):1138-1145.
5蒋伟进,张婉清,蒋意容.基于隐式关系挖掘的群智感知任务分配机制[J].系统科学与数学,2024,44(2):577-594. 被引量：1
6向辉,吴校生.人工神经网络和电阻抗谱法压电材料快速表征[J].压电与声光,2024,46(2):234-240.
7闵锋,毛一新,况永刚,彭伟明,郝琳琳,吴波.图采样泛化行人重识别算法[J].计算机工程与应用,2024,60(14):219-227.
8夏飞.新能源汽车电气架构设计与优化探讨[J].汽车测试报告,2024(8):47-49.
9戴润佳,刘晓锋,郭蓬,邱洁.通讯网络影响下多车协同驾驶控制策略研究[J].交通技术,2023,12(5):394-402.

1赵玲玲.自然资源部全面推进实景三维中国建设[J].资源导刊,2022(4). 被引量：3
2柳长源,何先平,毕晓君.融合注意力机制的高效率网络车型识别[J].浙江大学学报（工学版）,2022,56(4):775-782. 被引量：3
3杨光.PID控制算法在无人驾驶汽车横向控制中的应用[J].汽车测试报告,2022(7):57-59.
4亓伟敬,宋清洋,郭磊.面向软件定义多模态车联网的双时间尺度RAN切片资源分配[J].通信学报,2022,43(4):60-70. 被引量：5
5张旭东,马振华,王海玲,赵冬泉,刘旦宇.基于排水系统提质增效的集约治滇探索与实践[J].中国给水排水,2022,38(4):125-132. 被引量：5
6袁伟,白学文,王静丽,李蕊,乔夏君.以信息化手段强化宇航型号研制生产进度管理[J].航天工业管理,2022(3):3-5.
7张舒.例谈解答零点问题的两个技巧[J].语数外学习（高中版）（上）,2021(10):42-42. 被引量：1
8王汝言,刘佳,何鹏,崔亚平.偏好感知的边云协同群智感知参与者选择策略[J].西安电子科技大学学报,2022,49(1):142-151. 被引量：2
9李睿,胡粤鹏.投资者关注对股票市场影响的实证分析[J].投资与创业,2021(22):7-9.
10杨喜梅,洪岚,唐仁菊.硕士研究生移动学习使用意向影响因素研究[J].兵团教育学院学报,2022,32(2):48-53. 被引量：1

计算机学报

2022年第5期

浏览历史

内容加载中请稍等...

基于深度强化学习的智联网汽车感知任务分配被引量：11

参考文献7

二级参考文献41

共引文献556

同被引文献47

引证文献11

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的智联网汽车感知任务分配 被引量：11

参考文献7

二级参考文献41

共引文献556

同被引文献47

引证文献11

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的智联网汽车感知任务分配被引量：11