In recent years, developing AI for robotics has raised much attention. The interaction of vision and language of robots is particularly difficult. We consider that giving robots an understanding of visual semantics and language semantics will improve inference ability. In this paper, we propose a novel method-VSGM (Visual Semantic Graph Memory), which uses the semantic graph to obtain better visual image features, improve the robot's visual understanding ability. By providing prior knowledge of the robot and detecting the objects in the image, it predicts the correlation between the attributes of the object and the objects and converts them into a graph-based representation; and mapping the object in the image to be a top-down egocentric map. Finally, the important object features of the current task are extracted by Graph Neural Networks. The method proposed in this paper is verified in the ALFRED (Action Learning From Realistic Environments and Directives) dataset. In this dataset, the robot needs to perform daily indoor household tasks following the required language instructions. After the model is added to the VSGM, the task success rate can be improved by 6~10%.


翻译:近些年来,开发机器人的人工智能引起了人们的极大关注。机器人的视觉和语言的相互作用特别困难。我们认为,让机器人了解视觉语义和语言语义将提高推论能力。在本文中,我们建议采用新颖的方法VSGM(视觉语义图像内存),使用语义图获得更好的视觉图像特征,提高机器人的视觉理解能力。通过提供机器人先前的知识并探测图像中的天体,它预测了天体属性与天体的关联性,并将其转换成图形表示法;在图像中绘制天体图,成为自上而下的自我中心图。最后,当前任务的重要对象特征由图形神经网络提取。本文中提议的方法在ALFRED(从现实环境和指令中学习的行动)数据集中得到验证。在这个数据集中,机器人需要按照所需的语言指示执行日常室内任务。在VSGGM中添加模型后,任务成功率可以提高6-10%。

0
下载
关闭预览

相关内容

专知会员服务
54+阅读 · 2021年6月30日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
167+阅读 · 2020年3月18日
2019年机器学习框架回顾
专知会员服务
36+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
已删除
将门创投
7+阅读 · 2020年3月13日
Arxiv
5+阅读 · 2018年10月15日
VIP会员
最新内容
无人机自主控制与人工智能:系统性综述
专知会员服务
2+阅读 · 52分钟前
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
1+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
1+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
1+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
6+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
7+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
10+阅读 · 6月24日
相关资讯
已删除
将门创投
7+阅读 · 2020年3月13日
Top
微信扫码咨询专知VIP会员