基于Spark的分布式机器人强化学习训练框架被引量：1

Training Framework of Distributed Robot Reinforcement Learning Based on Spark

下载PDF

导出

摘要强化学习能够通过自主学习的方式对机器人难以利用控制方法实现的各种任务进行训练完成,有效避免了系统设计人员对系统建模或制定规则。然而,强化学习在机器人开发应用领域中训练成本高昂,需要花费大量时间成本、硬件成本实现学习训练,虽然基于仿真可以一定程度减少硬件成本,但对类似Gazebo这样的复杂机器人训练平台,仿真过程工作效率低,数据采样耗时长。为了有效解决这些问题,针对机器人仿真过程的平台易用性、兼容性等方面进行优化,提出一种基于Spark的分布式强化学习框架,为强化学习的训练与机器人仿真采样提供分布式支持,具有高兼容性、健壮性的特性。通过实验数据分析对比,表明本系统框架不仅可有效提高机器人的强化学习模型训练速度,缩短训练时间花费,且有助于节约硬件成本。 Through autonomous learning, reinforcement learning can train robots to complete various tasks that are difficult for them to implement with control methods, and this can effectively avoid system designers from systemic modeling or rules making. However, the training cost of reinforcement learning in the field of robot development and application is high, and it takes a large amount of time cost and hardware cost to realize learning and training. Although the hardware cost can be reduced to some extent based on simulation, for the complicated robot training platform such as Gazebo, the working efficiency of simulation process is low, and it takes a long time for data sampling. In order to effectively solve these problems, a distributed reinforcement learning framework based on Spark is put forward, which optimizes the usability and compatibility of platform of robot simulation process, offers distributed support for the training of reinforcement learning and robot simulation sampling, and has the characteristics of high compatibility and robustness. Through analyzing and contrasting the experimental data, the system framework can not only effectively improve the training speed of reinforcement learning model of robot and shorten the training time, but also help with the saving of hardware cost.

作者方伟黄增强徐建斌黄羿马新强 FANG Wei;HUANG Zeng-qiang;XU Jian-bin;HUANG Yi;MA Xin-qiang(Institute of Cyber Systems and Control,Zhejiang University,Hangzhou Zhejiang 310027,China;Department of Computer Science and Technology,Huaibei Vocational and Technical College,Huaibei Anhui 235000,China;School of Computer Science,Hangzhou Dianzi University,Hangzhou Zhejiang 310018,China;Materials Branch,State Grid Zhejiang Electric Power Company,LTD,Hangzhou Zhejiang 310000,China;Institute of Intelligent Computing and Visualization Based on Big Data,Chongqing University of Arts and Sciences,Chongqing 402160,China)

机构地区浙江大学智能系统与控制研究所淮北职业技术学院计算机科学技术系杭州电子科技大学计算机学院国家电网浙江省电力有限公司物资分公司重庆文理学院大数据智能计算与可视化研究所

出处《图学学报》 CSCD 北大核心 2019年第5期852-857,共6页 Journal of Graphics

基金浙江大学工业控制技术国家重点实验室开放课题项目(ICT1800413) 重庆市发改委重大产业技术研发项目(2018148208) 重庆市教委科技项目(KJ1601129) 安徽省高校自然科学研究重点项目(KJ2018A0713) 安徽高校优秀青年骨干人才国内访问研修项目(gxgnfx2018108) 广东省重点领域研发计划项目(2019B010120001)

关键词机器人强化学习 SPARK 分布式数据管道 robot reinforcement learning Spark distribute data pipeline

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献8

1胡俊,胡贤德,程家兴.基于Spark的大数据混合计算模型[J].计算机系统应用,2015,24(4):214-218. 被引量：56
2陈虹君,吴雪琴.基于Hadoop平台的Spark快数据推荐算法分析与应用[J].现代电子技术,2016,39(10):18-20. 被引量：12
3卜尧,吴斌,陈玉峰,白德盟.BDAP——一个基于Spark的数据挖掘工具平台[J].中国科学技术大学学报,2017,47(4):358-368. 被引量：9
4张繁,袁兆康,肖凡平,尤堃,王章野.基于Spark的大数据热图可视化方法[J].计算机辅助设计与图形学学报,2016,28(11):1881-1886. 被引量：11
5乔非,葛彦昊,孔维畅.基于MapReduce的分布式改进随机森林学生就业数据分类模型研究[J].系统工程理论与实践,2017,37(5):1383-1392. 被引量：7
6皮艾迪,喻剑,周笑波.基于学习的容器环境Spark性能监控与分析[J].计算机应用,2017,37(12):3586-3591. 被引量：3
7赵玲玲,刘杰,王伟.基于Spark的流程化机器学习分析方法[J].计算机系统应用,2016,25(12):162-168. 被引量：9
8XI Ning,SUN Cong,MA Jianfeng,CHEN Xiaofeng,SHEN Yulong.Distributed Information Flow Verification for Secure Service Composition in Smart Sensor Network[J].China Communications,2016,13(4):119-130. 被引量：3

二级参考文献50

1杨微,刘纪平,王勇.基于Heatmap的地理对象空间分布热度计算方法[J].测绘通报,2012(S1):391-393. 被引量：10
2刘海宝,蔡皖东,许俊杰,王黎.分布式网络行为监控系统设计与实现[J].微电子学与计算机,2006,23(3):76-79. 被引量：10
3夏俊鸾,邵赛赛.Spark Streaming: 大规模流式数据处理的新贵. http://www.csdn.net/article/2014-01-28/2818282-Spark -Streaming-big-data. 2014.
4Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters. Communications of the ACM, 2008, 3(51-1): 107-113.
5耿益锋,陈冠诚.Impala:新一代开源大数据分析引擎. http://www.csdn.net/article/2013-12-04/2817707-ImpalaBig- Data-Engine. 2013.12.
6Strom. http://storm.incubator.apache.org/. 2014.
7Zaharia M, Chowdhury M, Das T, et al. Resilient distributed datasets: A fault-tolerant abstration for in-memory cluster computing. Proc. of the 9th USENIX Conference on NetWorked System Design and Implementation. 2012. 2-16.
8Gonzalez J, Low Y, Gu H. PowerGraph: Distributed garph-p arallel computation on natural graphs. Proc. of the 10th USENIX Symposium on Operating Systems Design and Implementatin. 2012. 17-30.
9Zaharia M, Chowdhury M, Franklin MJ, Shenker S, Stoica I. Spark: Cluster Computing with Working Sets. Technical Report No. UCB/ EECS- 2010-53May 7, 2010.
10Xin R, Rosen J, et al. Shark: SQL and Rich Analytics at Scale. Technical Report UCB/EECS. 2012.11.

共引文献95

1李燕,贺亚男,张定堃,韩丽,慈志敏,林俊芝,许润春.泥附子一步煎煮制备附子配方颗粒的创新工艺与质量评价研究[J].辽宁中医杂志,2020,47(1):135-140. 被引量：5
2胡常礼,邵剑飞.基于分布式计算框架的机器学习系统分析[J].电视技术,2021,45(11):115-118. 被引量：2
3韩亚兰,韩学明,白玲.用电子冷热针灸仪治疗糖尿病50例疗效观察[J].针灸临床杂志,2000,16(2):33-34. 被引量：1
4叶小榕,邵晴.基于Spark的大规模社交网络社区发现原型系统[J].科技导报,2018,36(23):93-101. 被引量：8
5陆韦,朱捷飞,崔德义,孟飞.基于“互联网+”的电网用电监察平台设计[J].自动化与仪器仪表,2019(1):103-105. 被引量：2
6汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(1):178-180. 被引量：2
7汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(2):193-196. 被引量：1
8张雄,陆路,石宣化.分布式数据处理系统内存对象管理问题分析[J].中兴通讯技术,2016,22(2):19-22. 被引量：2
9陈羽中,郭松荣,陈宏,李婉华,郭昆,黄启成.基于并行分类算法的电力客户欠费预警[J].计算机应用,2016,36(6):1757-1761. 被引量：11
10林穗,赵菲.基于Spark的线性模型在广告投放系统中的应用研究[J].广东工业大学学报,2016,33(5):28-33. 被引量：4

同被引文献4

1付宜利,刘诚.虚拟装配中基于生理约束的虚拟手建模与抓持规划[J].计算机集成制造系统,2009,15(4):681-684. 被引量：4
2蔡娴娟,程成,Alhazmi Marwah,Mostafa Hamdy Salem,MongHeng Ear.虚拟制造环境中虚拟手的行为构造[J].计算机辅助设计与图形学学报,2015,27(3):499-507. 被引量：8
3王晓媛,田浩,王长波.虚拟手自然抓取动作生成研究[J].计算机辅助设计与图形学学报,2020,32(9):1502-1508. 被引量：5
4刘乃军,鲁涛,蔡莹皓,王硕.机器人操作技能学习方法综述[J].自动化学报,2019,45(3):458-470. 被引量：39

引证文献1

1伍一鹤,张振宁,仇栋,李蔚清,苏智勇.基于深度强化学习的虚拟手自适应抓取研究[J].图学学报,2021,42(3):462-469. 被引量：3

二级引证文献3

1杨曦中,万华根.一种基于LeapMotion的灵巧虚拟手抓取交互方法[J].航空电子技术,2021,52(3):1-8. 被引量：3
2王铮,成尔卓,史建新,杨博,廖浩添.一种脑卒中手部康复设备研究[J].物联网技术,2022,12(6):74-77. 被引量：1
3陈立家,张子健,郝国柱,李世刚,王凯,黄立文.面向VR航海模拟器的虚拟手交互方法研究[J].中国航海,2023,46(3):135-144. 被引量：1

1余伶俐,邵玄雅,龙子威,魏亚东,周开军.智能车辆深度强化学习的模型迁移轨迹规划方法[J].控制理论与应用,2019,36(9):1409-1422. 被引量：25
2李艳梅,王新悦.民间育种家：坚守育种推广一线[J].中国花卉园艺,2019,0(15):34-38.
3孙小婉,王英,王鑫,孙玉东.面向双注意力网络的特定方面情感分析模型[J].计算机研究与发展,2019,56(11):2384-2395. 被引量：18
4陈祺雯.合理规范促成长——班级管理问题的思考与解决[J].下一代,2019,0(12):0040-0040.
5赵盼,高中文,韩华,李国庆.基于分层树回归模型的快速图像超分辨率重建算法[J].数学的实践与认识,2019,0(17):171-180. 被引量：1
6刘伟芬.打开禁锢之门还游戏海阔天空——对提升中班幼儿自定角色游戏规则能力的探究[J].好日子,2019(8):63-63.
7林弘杰,田颖,刘鹏飞,吴楠,潘亮.内蒙古气象业务考试系统应用前景分析[J].内蒙古科技与经济,2019(19):66-67.
8徐敬宏,郭婧玉,游鑫洋.2014-2018年中国网络空间治理的政策走向与内在逻辑[J].郑州大学学报（哲学社会科学版）,2019,0(5):20-24. 被引量：4
9谭菊华.磁耦合谐振式无线电能传输的系统建模分析[J].电脑乐园,2019,4(8):164-164.
10张倩,于瑞东,鲁彦志,刘国威.盾构机再制造清洗技术概述[J].现代制造技术与装备,2019,55(10):153-154. 被引量：5

图学学报

2019年第5期

浏览历史

内容加载中请稍等...

基于Spark的分布式机器人强化学习训练框架被引量：1

参考文献8

二级参考文献50

共引文献95

同被引文献4

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Spark的分布式机器人强化学习训练框架 被引量：1

参考文献8

二级参考文献50

共引文献95

同被引文献4

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Spark的分布式机器人强化学习训练框架被引量：1