事件-基础图：基于机器人观测的统一时空场景图 (Event-Grounding Graph: Unified Spatio-Temporal Scene Graph from Robotic Observations) - 专知论文

会员服务 ·

0

事件 · 机器人 · 构建 · 场景图 · 自主机器人 ·

Event-Grounding Graph: Unified Spatio-Temporal Scene Graph from Robotic Observations

翻译：事件-基础图：基于机器人观测的统一时空场景图

Phuoc Nguyen,Francesco Verdoja,Ville Kyrki

from arxiv, Submitted to RA-L

A fundamental aspect for building intelligent autonomous robots that can assist humans in their daily lives is the construction of rich environmental representations. While advances in semantic scene representations have enriched robotic scene understanding, current approaches lack a connection between spatial features and dynamic events; e.g., connecting the blue mug to the event washing a mug. In this work, we introduce the event-grounding graph (EGG), a framework grounding event interactions to spatial features of a scene. This representation allows robots to perceive, reason, and respond to complex spatio-temporal queries. Experiments using real robotic data demonstrate EGG's capability to retrieve relevant information and respond accurately to human inquiries concerning the environment and events within. Furthermore, the EGG framework's source code and evaluation dataset are released as open-source at: https://github.com/aalto-intelligent-robotics/EGG.

翻译：构建能够协助人类日常生活的智能自主机器人的一个基本方面在于构建丰富的环境表征。尽管语义场景表征的进展丰富了机器人场景理解，但现有方法缺乏空间特征与动态事件之间的关联；例如，将蓝色马克杯与清洗马克杯的事件联系起来。在本研究中，我们提出了事件-基础图（EGG），这是一个将事件交互与场景空间特征相连接的理论框架。该表征使机器人能够感知、推理并响应复杂的时空查询。使用真实机器人数据的实验证明，EGG能够检索相关信息，并准确响应关于环境及其中事件的人类查询。此外，EGG框架的源代码与评估数据集已在以下地址开源发布：https://github.com/aalto-intelligent-robotics/EGG。

0

相关内容

机器人领域中最佳的三维场景表示是什么？——从几何表示到基础模型

机器人领域中最佳的三维场景表示是什么？——从几何表示到基础模型

专知会员服务

16+阅读 · 2025年12月4日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【CMU博士论文】观看、预测、行动：机器人学习遇上网络视频

【CMU博士论文】观看、预测、行动：机器人学习遇上网络视频

专知会员服务

14+阅读 · 2025年5月23日

时空基础模型：愿景、挑战与机遇

时空基础模型：愿景、挑战与机遇

专知会员服务

41+阅读 · 2025年1月18日

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

专知会员服务

65+阅读 · 2023年12月16日

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

专知会员服务

63+阅读 · 2022年12月18日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

场景图生成:一个全面综述

场景图生成:一个全面综述

专知会员服务

67+阅读 · 2022年1月4日

事件研究进展到哪？ACL2021这份《事件自然语言处理》教程必看！附269页ppt

事件研究进展到哪？ACL2021这份《事件自然语言处理》教程必看！附269页ppt

专知会员服务

77+阅读 · 2021年7月13日

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知

25+阅读 · 2020年8月6日

通俗易懂！《图机器学习导论》附69页PPT

通俗易懂！《图机器学习导论》附69页PPT

专知

55+阅读 · 2019年12月27日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

泡泡机器人SLAM

47+阅读 · 2018年8月1日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

融入时空关系联合判别学习的地基云图序列分类方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于关系语义的空间场景信息理解

国家自然科学基金

5+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Arxiv

0+阅读 · 2月18日

INHerit-SG: Incremental Hierarchical Semantic Scene Graphs with RAG-Style Retrieval

Arxiv

0+阅读 · 2月13日

MomaGraph: State-Aware Unified Scene Graphs with Vision-Language Model for Embodied Task Planning

Arxiv

0+阅读 · 2月9日

Continuum Robot Localization using Distributed Time-of-Flight Sensors

Arxiv

0+阅读 · 2月6日

Differentiable Inverse Graphics for Zero-shot Scene Reconstruction and Robot Grasping

Arxiv

0+阅读 · 2月4日

Language Movement Primitives: Grounding Language Models in Robot Motion

Arxiv

0+阅读 · 2月2日

Relationship-Aware Hierarchical 3D Scene Graph for Task Reasoning

Arxiv

0+阅读 · 2月2日

LIEREx: Language-Image Embeddings for Robotic Exploration

Arxiv

0+阅读 · 2月2日

Generation of Real-time Robotic Emotional Expressions Learning from Human Demonstration in Mixed Reality

Arxiv

0+阅读 · 1月17日

Look as You Leap: Planning Simultaneous Motion and Perception for High-DOF Robots

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

自主机器人

相关VIP内容

机器人领域中最佳的三维场景表示是什么？——从几何表示到基础模型

机器人领域中最佳的三维场景表示是什么？——从几何表示到基础模型

专知会员服务

16+阅读 · 2025年12月4日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【CMU博士论文】观看、预测、行动：机器人学习遇上网络视频

【CMU博士论文】观看、预测、行动：机器人学习遇上网络视频

专知会员服务

14+阅读 · 2025年5月23日

时空基础模型：愿景、挑战与机遇

时空基础模型：愿景、挑战与机遇

专知会员服务

41+阅读 · 2025年1月18日

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

专知会员服务

65+阅读 · 2023年12月16日

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

专知会员服务

63+阅读 · 2022年12月18日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

场景图生成:一个全面综述

场景图生成:一个全面综述

专知会员服务

67+阅读 · 2022年1月4日

事件研究进展到哪？ACL2021这份《事件自然语言处理》教程必看！附269页ppt

事件研究进展到哪？ACL2021这份《事件自然语言处理》教程必看！附269页ppt

专知会员服务

77+阅读 · 2021年7月13日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知

25+阅读 · 2020年8月6日

通俗易懂！《图机器学习导论》附69页PPT

通俗易懂！《图机器学习导论》附69页PPT

专知

55+阅读 · 2019年12月27日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

【泡泡一分钟】Grad-CAM（加权梯度类激活映射）：可视化解释基于梯度定位的深度网络（ICCV2017-60）

泡泡机器人SLAM

47+阅读 · 2018年8月1日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Arxiv

0+阅读 · 2月18日

INHerit-SG: Incremental Hierarchical Semantic Scene Graphs with RAG-Style Retrieval

Arxiv

0+阅读 · 2月13日

MomaGraph: State-Aware Unified Scene Graphs with Vision-Language Model for Embodied Task Planning

Arxiv

0+阅读 · 2月9日

Continuum Robot Localization using Distributed Time-of-Flight Sensors

Arxiv

0+阅读 · 2月6日

Differentiable Inverse Graphics for Zero-shot Scene Reconstruction and Robot Grasping

Arxiv

0+阅读 · 2月4日

Language Movement Primitives: Grounding Language Models in Robot Motion

Arxiv

0+阅读 · 2月2日

Relationship-Aware Hierarchical 3D Scene Graph for Task Reasoning

Arxiv

0+阅读 · 2月2日

LIEREx: Language-Image Embeddings for Robotic Exploration

Arxiv

0+阅读 · 2月2日

Generation of Real-time Robotic Emotional Expressions Learning from Human Demonstration in Mixed Reality

Arxiv

0+阅读 · 1月17日

Look as You Leap: Planning Simultaneous Motion and Perception for High-DOF Robots

Arxiv

0+阅读 · 1月13日

相关基金

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

融入时空关系联合判别学习的地基云图序列分类方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于关系语义的空间场景信息理解

国家自然科学基金

5+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员