基于k-最近邻分类增强学习的除冰机器人抓线控制被引量：8

Line-grasping control of de-icing robot based on k-nearest neighbor reinforcement learning

下载PDF

导出

摘要输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.根据加权结果决定当前最优动作.该方法可以得到机器人连续状态的离散表达形式,从而有效解决传统连续状态泛化方法带来的计算收敛性和维数灾难问题.借助增强学习算法探测和适应环境的能力,该方法能够克服机器人模型误差和姿态误差,以及环境干扰等因素对抓线控制的影响.文中给出了算法具体实现步骤,并给出了应用此方法控制除冰机器人抓线的仿真实验. The flexible mechanical characteristic of power lines induces difficulties for line-grasping control for de-icing robots.To deal with this difficulty,we propose for de-icing robots a line-grasping control approach which combines the k-nearest neighbor（KNN） algorithm and the reinforcement-learning（RL）.In the learning iteration,the state-perception mechanism of the KNN algorithm selects k-nearest states and weights;from k-weighted states,an optimal action is determined.By expressing a continuous state by k-nearest discrete states in this way,this approach effectively ensures the convergence for the computation and avoids the curse of dimensionality occurred in traditional continuous state-space generalization methods.Abilities of RL in perception and adaptation to the environment make the line-grasping control to tolerate possible errors in robot model,errors of robot arm attitudes and interferences from the environment.The design procedures are presented in details.Simulation results of line-grasping control based on this approach are given.

作者魏书宁王耀南印峰杨易旻

机构地区湖南大学电气与信息工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2012年第4期470-476,共7页 Control Theory & Applications

基金国家科技支撑计划资助项目(2008BAF36B01)

关键词除冰机器人 k–最近邻分类算法增强学习维数灾难 de-icing robot k-nearest neighbor reinforcement learning curse of dimension

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献17

1TOUSSAINT K, NPOULIOT S, MONTAMBAUL T. Transmission line maintenance robots capable of crossing obstacles: state-of-the- art review and challenges ahead[J]. Journal of Field Robotics, 2009, 26(5): 477 - 499.
2POULIOT N, MONTAMBAULT S. Geometric design of the LineScout:a teleoperated robot for power line inspection and main- tenance[C] //Proceedings of IEEE International Conference on Robotics and Automation. New York: IEEE, 2008:3970 - 3977.
3周风余,吴爱国,李贻斌,王吉岱,梁自泽.高压架空输电线路自动巡线机器人的研制[J].电力系统自动化,2004,28(23):89-91. 被引量：55
4印峰,王耀南,余洪山.基于蒙特卡罗方法的除冰机器人作业空间边界提取[J].控制理论与应用,2010,27(7):891-896. 被引量：18
5李恩,梁自泽,谭民.基于规则库的巡线机器人自主越障动作规划[J].机器人,2005,27(5):400-405. 被引量：20
6王鲁单,王洪光,房立金,赵明扬.基于视觉伺服的输电线巡检机器人抓线控制[J].机器人,2007,29(5):451-455. 被引量：17
7张运楚,梁自泽,谭民,叶文波,练波.架空输电线路巡线机器人越障视觉伺服控制[J].机器人,2007,29(2):111-116. 被引量：10
8陈中伟,肖华,吴功平.高压巡线机器人电磁传感器导航方法[J].传感器与微系统,2006,25(9):33-35. 被引量：26
9RUMMERY G, ANIRANJAN M. On-line Q-learning Using Connec- tionist Systems[M]. England, Cambridge: Citeseer, 1994.
10RUMMERY G A, NIRANJAN M. On-line Q-learning using con- nectionist systems[R]. England: Engineering Department, Cambridge University, 1994.

二级参考文献48

1张运楚,梁自泽,谭民.架空电力线路巡线机器人的研究综述[J].机器人,2004,26(5):467-473. 被引量：122
2付双飞,王洪光,房立金,姜勇.超高压输电线路巡检机器人越障控制问题的研究[J].机器人,2005,27(4):341-345. 被引量：30
3蔡自兴.一种用于机器人高层规划的专家系统[J].高技术通讯,1995,5(1):21-24. 被引量：3
4李恩,梁自泽,谭民.约束条件下的巡线机器人逆运动学求解[J].控制理论与应用,2006,23(1):43-48. 被引量：8
5周风余,李贻斌,吴爱国,肖海荣,刘文江.高压巡线机器人的设计与实现[J].机械科学与技术,2006,25(5):623-626. 被引量：19
6曹毅,李秀娟,宁祎,杨冠英.三维机器人工作空间及几何误差分析[J].机械科学与技术,2006,25(12):1458-1461. 被引量：39
7熊有伦.机器人技术基础[M].武汉:华中科技大学出版社,2008:32-50.
8POULIOT N,MONTAMBAULT S.Geometric design of the Linescout,a teleoperated robot for power line inspection and maintenance[C] //2008 IEEE International Conference on Robotics & Automation.Pasadena:IEEE,2008:3970-3977.
9WANG Y F,CHIRIKJIAN G S.A diffusion-based algorithm for workspace generation of highly articulated manipulators[C] //Proceedings of IEEE International Conference on Robotics & Automation.Washington:IEEE,2002:1525-1530.
10CHEN X,GUPTA K C.Geometric modeling and visualization of manipulator workplace[J].ASME Computers in Engineering,1991,1(5):469-474.

共引文献125

1王成,王朝立,赵忆文.基于改进粒子群优化的乒乓球发球机械手轨迹规划[J].智能计算机与应用,2022,12(4):1-9. 被引量：5
2袁野,付子峰,李响,吴星奇,于江.架空输电线路无人机自适应拍摄算法研究[J].湖北电力,2023,47(2):125-132. 被引量：2
3丁鸿昌,王吉岱,杨前明,王琼.高压输电线路自动巡检机器人的研制与开发[J].现代制造技术与装备,2006,42(4):10-12. 被引量：15
4吴俊飞,王新智,姜生元,吴爽.高压线检测机器人吊臂式越障机构的研制[J].机械工程师,2006(11):35-37. 被引量：8
5张吴明,阎广建,李巧枝,赵伟.直升机电力巡线系统中利用核线约束进行线路三维重建[J].北京师范大学学报（自然科学版）,2006,42(6):629-632. 被引量：18
6左岐,谢植,梁自泽,唐健隆,孙德辉,刘仁学.巡线机器人的发展与应用[J].机器人技术与应用,2007(2):37-42. 被引量：16
7王新智,姜生元,吴俊飞,吴爽.基于虚拟样机技术的X型放大杆系的优化设计[J].机械传动,2007,31(3):43-44. 被引量：2
8邬大为,阮毅,任志斌.高压输电线路巡线机器人智能控制系统[J].电气自动化,2007,29(6):26-29. 被引量：3
9宋立博,徐子力,吕恬生.飞行巡线机器人悬停控制系统仿真与设计[J].系统仿真学报,2008,20(1):124-127.
10彭力静,梁克,周兴社.基于有限自动机和规则库的智能打结机控制系统设计[J].微电子学与计算机,2008,25(3):93-96. 被引量：1

同被引文献78

1梁显涛,廖梓杰,林俞先.一种新型的高压线巡检除冰设备[J].广西农业机械化,2020,0(1):39-39. 被引量：3
2齐国光,郭木河,马少平,归柽华.轮式机器人最优控制的研究[J].机器人,1996,18(1):21-27. 被引量：7
3常春光,汪定伟,胡琨元,陶志.基于粗糙集的案例属性约简技术[J].控制理论与应用,2006,23(6):867-872. 被引量：7
4Viet, Hoang Huu. Simulation based evaluations of reinforcement learning algorithms for autonomous mobile robot path planning [J]. Springer Science Business Media B. V. 2012:467 - 476.
5Wagner M, Chen X Q, Nayyerloo M, et al. A Novel Wall Climbing Robot Based on Bernoulli Effect [J]. Meehtronie and Embedded Systems and Applications, 2008= 210- 215.
6Martin H J A, de Lope J. The kNN TD Reinforcement Learning Algorithm [J]. Springer Verlag Berlin Heidelberg, 2009= 305 -312.
7Martin H, De Lope J. Exaan effective algorithm for continuous actions reinforcement learning problems [A]. //Proceedings of the 35th Annual Conference of the IEEE Industrial Electronics Society [C]. New York: IEEE, 2010: 2063-2068.
8SCHANK R. Dynamic Memory [M]. New York: Cambridge Univer- sity Press, 1982.
9AAMODT A, PLAZA E. Case-based reasoning: foundational issues, methodological variations, and system approaches [J]. AI Communi- cations, 1994, 7(1): 39- 59.
10FENTON B, MCGINNITY M, MAGUIRE L. Fault diagnosis of elec- tronic system using artificial intelligence [J]. IEEE Instrumentation & Measurement Magazine, 2006, 5(3): 16 - 20.

引证文献8

1王金秋,孙晓松,秦华.基于强化学习的爬壁机器人路径规划方法[J].计算机测量与控制,2013,21(11):3093-3095. 被引量：4
2赵辉,严爱军,王普.基于权重阈值寻优的案例推理分类器特征约简[J].控制理论与应用,2015,32(4):533-539. 被引量：5
3李同英,朱洪波.分布式包装实时数据库ARS算法应用[J].包装工程,2017,38(11):88-91. 被引量：3
4毛盾,邹德华,江维,叶高呈.高压双分裂输电线路四轮机器人动力学建模与仿真研究[J].武汉纺织大学学报,2021,34(2):15-20. 被引量：4
5牛捷,邹德华,邝江华,刘兰兰,江维.绝缘子串激光除冰机器人人机交互控制系统设计[J].武汉纺织大学学报,2021,34(4):33-37. 被引量：1
6王永,李金泽.基于Dueling Network与RRT的机械臂抓放控制[J].机床与液压,2021,49(17):59-64. 被引量：2
7叶高呈,邹德华,邝江华,江维.基于移动机载平台的输电线绝缘子激光除冰机构设计[J].武汉纺织大学学报,2022,35(4):33-37. 被引量：2
8王俊伟.移动机器人轨迹跟踪控制研究[J].内燃机与配件,2024(15):61-63.

二级引证文献21

1康俊杰,牛玉广,张国斌,张佳辉,罗桓桓.电站锅炉燃烧系统案例推理自适应寻优方法及应用研究[J].仪器仪表学报,2019,40(12):214-223. 被引量：10
2李静静.基于模糊K均值聚类和Sarsa(λ)算法的自适应爬壁机器人路径规划[J].计算机测量与控制,2014,22(9):2879-2881. 被引量：2
3王辉,宋昌统.基于自适应状态聚集Q学习的移动机器人动态规划方法[J].计算机测量与控制,2014,22(10):3419-3422. 被引量：3
4张佰尚,李向阳,王铁男,Shirley Gregor.集成案例推理综述[J].计算机应用研究,2016,33(3):641-647. 被引量：6
5何宏,赵磊,张志宏.基于ARM-Linux的爬壁机器人远程自动控制系统[J].国外电子测量技术,2016,35(12):56-60. 被引量：7
6方小菊.基于强化学习的采摘机器人采摘臂避碰设计[J].农机化研究,2017,39(11):198-202. 被引量：4
7陈志旺,王小飞,邵玉杰,张子振,李国强.三参数区间数多属性决策的后悔理论方法[J].控制理论与应用,2016,33(9):1214-1224. 被引量：10
8朱建勇,杨辉,陆荣秀,徐芳萍,余运俊.基于静态设定和动态补偿的铈镨/钕萃取过程药剂量优化控制[J].自动化学报,2019,45(6):1186-1197. 被引量：3
9廖立君,吴岳忠,李长云.中国包装产业大数据知识图谱应用系统的设计[J].包装工程,2019,40(21):140-150. 被引量：7
10吴小欣.突出实时测控软件数据库系统设计与实现[J].电子设计工程,2020,28(1):23-26. 被引量：2

1高攀,但菲.K-最近邻分类常见优化策略及特点[J].信息与电脑,2016,28(5):71-71. 被引量：1
2冷明伟,陈晓云,谭国律.基于小样本集弱学习规则的KNN分类算法[J].计算机应用研究,2011,28(3):915-917. 被引量：8
3刘志勇,袁媛.基于测地距离的半监督增强[J].计算机工程与应用,2011,47(21):202-204. 被引量：3
4张浩.中小型网络IPv6过渡成本与机制选择[J].电脑知识与技术（过刊）,2011,17(12X):9059-9060.
5徐晓颖,王晓晔,杜太行.基于Fuzzy ART的K-最近邻分类改进算法[J].河北工业大学学报,2004,33(6):1-5. 被引量：4
6孙灿宇.增强学习算法寻找最优策略分析[J].电子技术与软件工程,2017(4):183-183.
7庄严,白振林,许云峰.基于蚁群算法的支持向量机参数选择方法研究[J].计算机仿真,2011,28(5):216-219. 被引量：33
8孙中廷.基于NoSQL数据库的大数据存储技术的研究与应用[J].计算机时代,2014(7):7-9. 被引量：10
9汤沛.基于云理论的数据预处理方法[J].新乡学院学报,2008,25(4):52-54. 被引量：1
10黄清元,曾迎之,苏金树.ASR:一种自适应移动自组网安全路由协议[J].计算机研究与发展,2008,45(12):2087-2094. 被引量：1

控制理论与应用

2012年第4期

浏览历史

内容加载中请稍等...

基于k-最近邻分类增强学习的除冰机器人抓线控制被引量：8

参考文献17

二级参考文献48

共引文献125

同被引文献78

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于k-最近邻分类增强学习的除冰机器人抓线控制 被引量：8

参考文献17

二级参考文献48

共引文献125

同被引文献78

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于k-最近邻分类增强学习的除冰机器人抓线控制被引量：8