期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于视角选择经验增强算法的机器人抓取策略 被引量:5
1
作者 王高 陈晓鸿 +1 位作者 柳宁 李德平 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第9期126-137,共12页
针对混杂物体散乱堆叠下的机器人抓取场景,使用固定视角相机的视觉抓取存在成功率低的问题,提出一种基于深度强化学习框架的眼-手随动相机视角选择策略,令机器人能够自主地学习如何选择合适的末端相机位姿,以提高机器人视觉抓取的准确... 针对混杂物体散乱堆叠下的机器人抓取场景,使用固定视角相机的视觉抓取存在成功率低的问题,提出一种基于深度强化学习框架的眼-手随动相机视角选择策略,令机器人能够自主地学习如何选择合适的末端相机位姿,以提高机器人视觉抓取的准确率和速度。首先,面向机器人主动视觉抓取任务建立马尔科夫决策过程模型,将视角选择问题转化为对视角价值函数的求解问题。使用编码解码器结构的反卷积网络近似视角动作价值函数,并基于深度Q网络框架进行强化学习训练。然后,针对训练过程中存在的稀疏奖励问题,提出一种新的视角经验增强算法,分别对抓取成功和抓取失败的过程设计不同的增强方式,将奖励区域从单一点拓展到圆形区域,提高了视角动作价值函数近似网络的收敛速度。先期实验部署在仿真平台中,通过搭建机器人模型及仿真抓取环境实施离线强化学习训练。过程中,使用提出的视角经验增强算法可以有效提高样本利用率,加快训练的收敛速度。基于所提出的视角经验增强算法,视角动作价值函数近似网络在2 h以内可达到收敛。为验证所提视角选择策略的实际应用效果,将视角经验增强算法实施在真实场景下的机器人主动视觉抓取实验中。实验结果表明,采用该策略进行的视角优化有效提高了机器人的抓取准确率和抓取速度。相较其他方法,所提出的视角选择策略在实际机器人抓取中只需进行一次视角选择即可获得抓取成功率高的区域,进一步提高了最佳视角选择的处理效率。相对于单视角方法,混杂场景的抓取成功率提升22.8%,每小时平均抓取个数达到294个,具备了进入工业应用的可行性。 展开更多
关键词 机器人抓取 强化学习 机器人视觉 视角选择 视角预测 主动感知方法 经验增强
下载PDF
视角相关的车辆型号精细识别方法 被引量:1
2
作者 朱文佳 付源梓 +1 位作者 金强 余烨 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2020年第2期205-210,279,共7页
文章针对车辆型号分类中存在车辆不同视角影响的问题,提出了一个视角相关的卷积神经网络(viewing angle relative convolutional neural network,VAR-NET)模型。该模型包含视角预测和分类2个子网络,其中视角预测子网络用于提取车辆的拍... 文章针对车辆型号分类中存在车辆不同视角影响的问题,提出了一个视角相关的卷积神经网络(viewing angle relative convolutional neural network,VAR-NET)模型。该模型包含视角预测和分类2个子网络,其中视角预测子网络用于提取车辆的拍摄视角信息,分类子网络用于提取车辆特征并实现其分类。在公开数据集CompCars和Standford Cars上的实验结果表明,VAR-NET模型在多视角车辆图像上取得了很好的识别效果,其识别率高于一些其他经典的网络模型。 展开更多
关键词 车型识别 卷积神经网络(CNN) 精细分类 视角预测
下载PDF
Efficient fast mode decision using mode complexity for multi-view video coding 被引量:1
3
作者 王凤随 沈庆宏 都思丹 《Journal of Central South University》 SCIE EI CAS 2014年第11期4244-4253,共10页
The variable block-size motion estimation(ME) and disparity estimation(DE) are adopted in multi-view video coding(MVC) to achieve high coding efficiency. However, much higher computational complexity is also introduce... The variable block-size motion estimation(ME) and disparity estimation(DE) are adopted in multi-view video coding(MVC) to achieve high coding efficiency. However, much higher computational complexity is also introduced in coding system, which hinders practical application of MVC. An efficient fast mode decision method using mode complexity is proposed to reduce the computational complexity. In the proposed method, mode complexity is firstly computed by using the spatial, temporal and inter-view correlation between the current macroblock(MB) and its neighboring MBs. Based on the observation that direct mode is highly possible to be the optimal mode, mode complexity is always checked in advance whether it is below a predefined threshold for providing an efficient early termination opportunity. If this early termination condition is not met, three mode types for the MBs are classified according to the value of mode complexity, i.e., simple mode, medium mode and complex mode, to speed up the encoding process by reducing the number of the variable block modes required to be checked. Furthermore, for simple and medium mode region, the rate distortion(RD) cost of mode 16×16 in the temporal prediction direction is compared with that of the disparity prediction direction, to determine in advance whether the optimal prediction direction is in the temporal prediction direction or not, for skipping unnecessary disparity estimation. Experimental results show that the proposed method is able to significantly reduce the computational load by 78.79% and the total bit rate by 0.07% on average, while only incurring a negligible loss of PSNR(about 0.04 d B on average), compared with the full mode decision(FMD) in the reference software of MVC. 展开更多
关键词 multi-view video coding mode decision mode complexity computational complexity
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部