EgoMoD: Predicting Global Maps of Dynamics from Local Egocentric Observations - 专知论文

会员服务 ·

0

结构 · 视频 · 机器人 · 动态环境 · 运动模式 ·

EgoMoD: Predicting Global Maps of Dynamics from Local Egocentric Observations

翻译：EgoMoD：从局部自我中心观测预测全局动态地图

Iacopo Catalano,David Morilla-Cabello,Jorge Pena-Queralta,Eduardo Montijano

Efficient navigation in dynamic environments requires anticipating how motion patterns evolve beyond the robot's immediate perceptual range, enabling preemptive rather than purely reactive planning in crowded scenes. Maps of Dynamics (MoDs) offer a structured representation of motion tendencies in space useful for long-term global planning, but constructing them traditionally requires global environment observations over extended periods of time. We introduce EgoMoD, the first approach that learns to predict future MoDs directly from short egocentric video clips collected during robot operation. Our method learns to infer environment-wide motion tendencies from local dynamic cues using a video- and pose-conditioned architecture trained with MoDs computed from external observations as privileged supervision, allowing local observations to serve as predictive signals of global motion structure. Thanks to this, we offer the capacity to forecast future motion dynamics over the whole environment rather than merely extend past patterns in the robot's field of view. As a site-specific dynamic prior, EgoMoD replaces the external global sensing infrastructure required by prior MoD methods at inference time with standard onboard sensors. Experiments in large simulated environments show that EgoMoD predicts future MoDs under limited observability, while evaluation with real images showcases its zero-shot transferability to real systems.

翻译：在动态环境中高效导航需要预判超越机器人即时感知范围的运动模式演化，从而在拥挤场景中实现先发制人而非纯粹反应式规划。动态地图（MoDs）提供了空间中运动倾向的结构化表示，有助于长期全局规划，但传统构建方法需要长时段全局环境观测。我们提出EgoMoD——首个学习从机器人运行期间采集的短时自我中心视频片段直接预测未来MoDs的方法。该方法利用视频与姿态条件架构，通过外部观测计算所得的MoDs作为特权监督进行训练，从而从局部动态线索推断环境全局运动倾向，使局部观测成为全局运动结构的预测信号。由此，我们具备预测全环境未来运动动态的能力，而非仅扩展机器人视野中的历史模式。作为场景特定的动态先验，EgoMoD在推理时以标准车载传感器替代先前MoD方法所需的外部全局感知基础设施。大规模仿真环境实验表明，EgoMoD能在有限可观测性下预测未来MoDs，而真实图像评估则展示了其向真实系统的零样本迁移能力。

0

相关内容

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

专知会员服务

14+阅读 · 6月9日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

自动驾驶地图：全流程综述与前沿进展

自动驾驶地图：全流程综述与前沿进展

专知会员服务

21+阅读 · 2025年9月20日

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

《动态对抗环境下无人机路径规划算法》

《动态对抗环境下无人机路径规划算法》

专知会员服务

42+阅读 · 2025年7月22日

《主动地形辅助导航》176页论文

《主动地形辅助导航》176页论文

专知会员服务

48+阅读 · 2023年12月21日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

IROS2020|机器人自主探索与建图算法，代码已开源！

IROS2020|机器人自主探索与建图算法，代码已开源！

中国图象图形学报

34+阅读 · 2020年9月8日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

最新！《2019 智能驾驶高精度地图行业研究报告》发布，19家巨头与初创公司如何定位行业？

最新！《2019 智能驾驶高精度地图行业研究报告》发布，19家巨头与初创公司如何定位行业？

新智驾

14+阅读 · 2019年6月17日

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

泡泡机器人SLAM

15+阅读 · 2019年5月22日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

Elasticsearch地理信息存储及查询之Geo_Point

Elasticsearch地理信息存储及查询之Geo_Point

Analysys易观

13+阅读 · 2018年12月29日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

利用GPS观测资料反演高时空分辨率局部地表质量变化的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation

Arxiv

0+阅读 · 6月16日

FLAP: FOV-Constrained Active Perception Planning for Prior-Map-Free 3D Navigation

Arxiv

0+阅读 · 6月16日

GraphWorld: Long-Horizon Planning with World Models for End-to-End Autonomous Driving

Arxiv

0+阅读 · 6月15日

VANDERER: Map-Free Exploration using Future-Aware and Visual-Curiosity-Guided Diffusion Policy

Arxiv

0+阅读 · 6月12日

COGENT: Continuous Graph Emulators with Neural Ordinary Differential Equations for Long-Term Physical Forecasting

Arxiv

0+阅读 · 6月9日

EgoPriMo: Egocentric Motion Generation for Interactive Humanoid Control

Arxiv

0+阅读 · 6月7日

Meridian: Metric-Semantic Primitive Matching for Cross-View Geo-Localization Beyond Urban Environments

Arxiv

0+阅读 · 6月4日

MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction

Arxiv

0+阅读 · 5月22日

Spatially Prompted Visual Trajectory Prediction for Egocentric Manipulation

Arxiv

0+阅读 · 5月19日

MotionScape: A Large-Scale Real-World Highly Dynamic UAV Video Dataset for World Models

Arxiv

0+阅读 · 4月9日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

7+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

6+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

8+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

《基于DIJKSTRA最短路径算法在AFSIM框架中实现高效动态威胁规避路径规划》

专知会员服务

14+阅读 · 6月9日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

自动驾驶地图：全流程综述与前沿进展

自动驾驶地图：全流程综述与前沿进展

专知会员服务

21+阅读 · 2025年9月20日

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

《动态对抗环境下无人机路径规划算法》

《动态对抗环境下无人机路径规划算法》

专知会员服务

42+阅读 · 2025年7月22日

《主动地形辅助导航》176页论文

《主动地形辅助导航》176页论文

专知会员服务

48+阅读 · 2023年12月21日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

IROS2020|机器人自主探索与建图算法，代码已开源！

IROS2020|机器人自主探索与建图算法，代码已开源！

中国图象图形学报

34+阅读 · 2020年9月8日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

最新！《2019 智能驾驶高精度地图行业研究报告》发布，19家巨头与初创公司如何定位行业？

最新！《2019 智能驾驶高精度地图行业研究报告》发布，19家巨头与初创公司如何定位行业？

新智驾

14+阅读 · 2019年6月17日

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

【泡泡一分钟】变化环境下激光地图辅助视觉惯性定位

泡泡机器人SLAM

15+阅读 · 2019年5月22日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

Elasticsearch地理信息存储及查询之Geo_Point

Elasticsearch地理信息存储及查询之Geo_Point

Analysys易观

13+阅读 · 2018年12月29日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

相关论文

MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation

Arxiv

0+阅读 · 6月16日

FLAP: FOV-Constrained Active Perception Planning for Prior-Map-Free 3D Navigation

Arxiv

0+阅读 · 6月16日

GraphWorld: Long-Horizon Planning with World Models for End-to-End Autonomous Driving

Arxiv

0+阅读 · 6月15日

VANDERER: Map-Free Exploration using Future-Aware and Visual-Curiosity-Guided Diffusion Policy

Arxiv

0+阅读 · 6月12日

COGENT: Continuous Graph Emulators with Neural Ordinary Differential Equations for Long-Term Physical Forecasting

Arxiv

0+阅读 · 6月9日

EgoPriMo: Egocentric Motion Generation for Interactive Humanoid Control

Arxiv

0+阅读 · 6月7日

Meridian: Metric-Semantic Primitive Matching for Cross-View Geo-Localization Beyond Urban Environments

Arxiv

0+阅读 · 6月4日

MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction

Arxiv

0+阅读 · 5月22日

Spatially Prompted Visual Trajectory Prediction for Egocentric Manipulation

Arxiv

0+阅读 · 5月19日

MotionScape: A Large-Scale Real-World Highly Dynamic UAV Video Dataset for World Models

Arxiv

0+阅读 · 4月9日

相关基金

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

利用GPS观测资料反演高时空分辨率局部地表质量变化的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员