ATLAS: An Annotation Tool for Long-horizon Robotic Action Segmentation - 专知论文

会员服务 ·

0

标注 · 工具 · 数据集 · 动作分割 · 分割 ·

ATLAS: An Annotation Tool for Long-horizon Robotic Action Segmentation

翻译：ATLAS：面向长程机器人动作分割的标注工具

Sergej Stanovcic,Daniel Sliwowski,Dongheui Lee

from arxiv, 7 pages, 2 figures, 2 tables

Annotating long-horizon robotic demonstrations with precise temporal action boundaries is crucial for training and evaluating action segmentation and manipulation policy learning methods. Existing annotation tools, however, are often limited: they are designed primarily for vision-only data, do not natively support synchronized visualization of robot-specific time-series signals (e.g., gripper state or force/torque), or require substantial effort to adapt to different dataset formats. In this paper, we introduce ATLAS, an annotation tool tailored for long-horizon robotic action segmentation. ATLAS provides time-synchronized visualization of multi-modal robotic data, including multi-view video and proprioceptive signals, and supports annotation of action boundaries, action labels, and task outcomes. The tool natively handles widely used robotics dataset formats such as ROS bags and the Reinforcement Learning Dataset (RLDS) format, and provides direct support for specific datasets such as REASSEMBLE. ATLAS can be easily extended to new formats via a modular dataset abstraction layer. Its keyboard-centric interface minimizes annotation effort and improves efficiency. In experiments on a contact-rich assembly task, ATLAS reduced the average per-action annotation time by at least 6% compared to ELAN, while the inclusion of time-series data improved temporal alignment with expert annotations by more than 2.8% and decreased boundary error fivefold compared to vision-only annotation tools.

翻译：对长程机器人演示进行精确的时间动作边界标注，对于训练和评估动作分割及操作策略学习方法至关重要。然而，现有标注工具往往存在局限：它们主要针对纯视觉数据设计，不支持机器人特有的时间序列信号（如夹爪状态或力/力矩）的同步可视化，或者需要大量工作才能适应不同数据集格式。本文介绍了ATLAS，一种专为长程机器人动作分割定制的标注工具。ATLAS提供多模态机器人数据的时间同步可视化，包括多视角视频和本体感知信号，并支持动作边界、动作标签和任务结果的标注。该工具原生支持广泛使用的机器人数据集格式，如ROS bag和强化学习数据集（RLDS）格式，并直接支持特定数据集（如REASSEMBLE）。通过模块化数据集抽象层，ATLAS可轻松扩展至新格式。其以键盘为中心的界面最大限度地减少了标注工作量并提高了效率。在接触密集型装配任务的实验中，与ELAN相比，ATLAS将每次动作的平均标注时间减少了至少6%，同时通过包含时间序列数据，将时间对齐与专家标注的差异降低了超过2.8%，并将边界误差降低至纯视觉标注工具的五分之一。

0

相关内容

长时程具身智能安全综述：机器人操作的跨层分析

长时程具身智能安全综述：机器人操作的跨层分析

专知会员服务

14+阅读 · 6月6日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【CVPR2025】CrayonRobo：面向机器人操作的以对象为中心的提示驱动视觉-语言-动作模型

【CVPR2025】CrayonRobo：面向机器人操作的以对象为中心的提示驱动视觉-语言-动作模型

专知会员服务

11+阅读 · 2025年5月6日

标注受限场景下的视觉表征与理解

标注受限场景下的视觉表征与理解

专知会员服务

14+阅读 · 2025年2月6日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

人形机器人行业深度：具身智能，迈向广阔蓝海市场

人形机器人行业深度：具身智能，迈向广阔蓝海市场

专知会员服务

51+阅读 · 2023年7月2日

《人工智能面向机器学习的数据标注规程》国家标准意见稿

《人工智能面向机器学习的数据标注规程》国家标准意见稿

专知会员服务

115+阅读 · 2022年2月24日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

专知会员服务

59+阅读 · 2019年12月14日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

泡泡机器人SLAM

14+阅读 · 2019年1月9日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

Polygon-RNN++图像分割数据集自动标注

Polygon-RNN++图像分割数据集自动标注

论智

10+阅读 · 2018年8月16日

一次拍摄搞定多相机自动化标定

一次拍摄搞定多相机自动化标定

计算机视觉life

12+阅读 · 2018年4月1日

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

AI科技评论

13+阅读 · 2018年3月17日

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

北京思腾合力科技有限公司

21+阅读 · 2017年11月24日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

STARRY: Spatial-Temporal Action-Centric World Modeling for Robotic Manipulation

Arxiv

0+阅读 · 4月29日

ST-$π$: Structured SpatioTemporal VLA for Robotic Manipulation

Arxiv

0+阅读 · 4月20日

DEX-Mouse: A Low-cost Portable and Universal Interface with Force Feedback for Data Collection of Dexterous Robotic Hands

Arxiv

0+阅读 · 4月16日

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

Arxiv

0+阅读 · 4月1日

LiPS: Lightweight Panoptic Segmentation for Resource-Constrained Robotics

Arxiv

0+阅读 · 4月1日

ViPRA: Video Prediction for Robot Actions

Arxiv

0+阅读 · 3月30日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems

Arxiv

0+阅读 · 3月29日

Chameleon: Episodic Memory for Long-Horizon Robotic Manipulation

Arxiv

0+阅读 · 3月25日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

长时程具身智能安全综述：机器人操作的跨层分析

长时程具身智能安全综述：机器人操作的跨层分析

专知会员服务

14+阅读 · 6月6日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【CVPR2025】CrayonRobo：面向机器人操作的以对象为中心的提示驱动视觉-语言-动作模型

【CVPR2025】CrayonRobo：面向机器人操作的以对象为中心的提示驱动视觉-语言-动作模型

专知会员服务

11+阅读 · 2025年5月6日

标注受限场景下的视觉表征与理解

标注受限场景下的视觉表征与理解

专知会员服务

14+阅读 · 2025年2月6日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

人形机器人行业深度：具身智能，迈向广阔蓝海市场

人形机器人行业深度：具身智能，迈向广阔蓝海市场

专知会员服务

51+阅读 · 2023年7月2日

《人工智能面向机器学习的数据标注规程》国家标准意见稿

《人工智能面向机器学习的数据标注规程》国家标准意见稿

专知会员服务

115+阅读 · 2022年2月24日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

专知会员服务

59+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

【泡泡图灵智库】DynaSLAM：动态场景中的追踪、建图和修复（arXiv）

泡泡机器人SLAM

14+阅读 · 2019年1月9日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

Polygon-RNN++图像分割数据集自动标注

Polygon-RNN++图像分割数据集自动标注

论智

10+阅读 · 2018年8月16日

一次拍摄搞定多相机自动化标定

一次拍摄搞定多相机自动化标定

计算机视觉life

12+阅读 · 2018年4月1日

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

视频 | 论文最爱的变分自编码器（ VAE），不了解一下？

AI科技评论

13+阅读 · 2018年3月17日

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

北京思腾合力科技有限公司

21+阅读 · 2017年11月24日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

相关论文

STARRY: Spatial-Temporal Action-Centric World Modeling for Robotic Manipulation

Arxiv

0+阅读 · 4月29日

ST-$π$: Structured SpatioTemporal VLA for Robotic Manipulation

Arxiv

0+阅读 · 4月20日

DEX-Mouse: A Low-cost Portable and Universal Interface with Force Feedback for Data Collection of Dexterous Robotic Hands

Arxiv

0+阅读 · 4月16日

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

Arxiv

0+阅读 · 4月1日

LiPS: Lightweight Panoptic Segmentation for Resource-Constrained Robotics

Arxiv

0+阅读 · 4月1日

ViPRA: Video Prediction for Robot Actions

Arxiv

0+阅读 · 3月30日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems

Arxiv

0+阅读 · 3月29日

Chameleon: Episodic Memory for Long-Horizon Robotic Manipulation

Arxiv

0+阅读 · 3月25日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

相关基金

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员