期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
视觉语言导航研究进展 被引量:2
1
作者 司马双霖 黄岩 +3 位作者 何科技 安东 袁辉 王亮 《自动化学报》 EI CAS CSCD 北大核心 2023年第1期1-14,共14页
视觉语言导航,即在一个未知环境中,智能体从一个起始位置出发,结合指令和周围视觉环境进行分析,并动态响应生成一系列动作,最终导航到目标位置.视觉语言导航有着广泛的应用前景,该任务近年来在多模态研究领域受到了广泛关注.不同于视觉... 视觉语言导航,即在一个未知环境中,智能体从一个起始位置出发,结合指令和周围视觉环境进行分析,并动态响应生成一系列动作,最终导航到目标位置.视觉语言导航有着广泛的应用前景,该任务近年来在多模态研究领域受到了广泛关注.不同于视觉问答和图像描述生成等传统多模态任务,视觉语言导航在多模态融合和推理方面,更具有挑战性.然而由于传统模仿学习的缺陷和数据稀缺的现象,模型面临着泛化能力不足的问题.系统地回顾了视觉语言导航的研究进展,首先对于视觉语言导航的数据集和基础模型进行简要介绍;然后全面地介绍视觉语言导航任务中的代表性模型方法,包括数据增强、搜索策略、训练方法和动作空间四个方面;最后根据不同数据集下的实验,分析比较模型的优势和不足,并对未来可能的研究方向进行了展望. 展开更多
关键词 视觉语言导航 视觉语言理解 跨模态匹配 具身智能
下载PDF
机器人“大脑”有多强
2
作者 余山 《紫光阁》 2017年第4期86-86,共1页
最近以"阿尔法狗"为代表的一系列新进展说明,最新的人工智能已经不光靠计算速度了,而是具有了以往不具备的重要能力。这一突破来源于人工智能采取了类似大脑的工作方式。传统上,计算机程序员的工作是把一个任务分解成一步一步的数字... 最近以"阿尔法狗"为代表的一系列新进展说明,最新的人工智能已经不光靠计算速度了,而是具有了以往不具备的重要能力。这一突破来源于人工智能采取了类似大脑的工作方式。传统上,计算机程序员的工作是把一个任务分解成一步一步的数字和逻辑运算,计算机执行完所有这些步骤,也就得到了问题的解决方案。 展开更多
关键词 大脑 机器人 人工智能 计算速度 逻辑运算 任务分解 计算机 程序员
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部