Constrained Decoding for Safe Robot Navigation Foundation Models - 专知论文

会员服务 ·

0

解码 · 约束 · 机器人导航 · 机器人 · 大模型 ·

Constrained Decoding for Safe Robot Navigation Foundation Models

翻译：约束解码实现安全机器人导航基础模型

Parv Kapoor,Akila Ganlath,Michael Clifford,Changliu Liu,Sebastian Scherer,Eunsuk Kang

Recent advances in the development of robotic foundation models have led to promising end-to-end and general-purpose capabilities in robotic systems. Trained on vast datasets of simulated and real-world trajectories, these policies map multimodal observations directly to action sequences for physical execution. Despite promising real-world capabilities, these models are still data-driven and, therefore, lack explicit notions of behavioral correctness. We address this gap by introducing SafeDec, a constrained decoding framework for autoregressive, transformer-based robot navigation foundation models that enforces safety specifications expressed as Signal Temporal Logic (STL) formulas. Our method ensures that generated actions provably satisfy STL specifications under assumed dynamics at runtime without retraining while remaining agnostic of the underlying policy. We evaluate SafeDec on tasks from the CHORES benchmark for state-of-the-art embodied navigation policies across hundreds of procedurally generated environments and show that our decoding-time interventions are useful not only for filtering unsafe actions but also for conditional action generation. Videos are available at constrained-robot-fms.github.io

翻译：近期机器人基础模型的发展使机器人系统具备了令人瞩目的端到端通用能力。这些策略通过海量仿真与现实世界轨迹数据集训练，能够将多模态观测结果直接映射为物理执行的动作序列。尽管展现出强大的现实世界应用潜力，但这些模型仍为数据驱动型，缺乏对行为正确性的显式概念。为弥补这一缺陷，我们提出SafeDec——面向自回归、基于Transformer的机器人导航基础模型的约束解码框架，该框架能够实施以信号时序逻辑（STL）公式表达的安全规范。该方法可在运行时确保生成动作在假设动力学条件下可证明地满足STL规范，无需重新训练且与底层策略无关。我们在CHORES基准测试的系列任务上评估SafeDec，覆盖数百个程序化生成环境中的最先进具身导航策略，结果表明我们的解码时干预不仅可用于过滤不安全动作，还能进行条件性动作生成。视频资料见constrained-robot-fms.github.io

0

相关内容

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

10+阅读 · 6月3日

工业控制场景下的机器人基础模型：综述及其应用就绪度评估体系

工业控制场景下的机器人基础模型：综述及其应用就绪度评估体系

专知会员服务

11+阅读 · 3月10日

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

专知会员服务

23+阅读 · 1月5日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

20+阅读 · 2025年3月11日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

23+阅读 · 2025年2月9日

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

56+阅读 · 2024年2月11日

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

专知会员服务

65+阅读 · 2023年12月16日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复

专知会员服务

54+阅读 · 2023年2月5日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

产业智能官

29+阅读 · 2018年10月13日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Arxiv

0+阅读 · 5月1日

Mask World Model: Predicting What Matters for Robust Robot Policy Learning

Arxiv

0+阅读 · 4月22日

Mask World Model: Predicting What Matters for Robust Robot Policy Learning

Arxiv

0+阅读 · 4月21日

Ro-SLM: Onboard Small Language Models for Robot Task Planning and Operation Code Generation

Arxiv

0+阅读 · 4月14日

ComSim: Building Scalable Real-World Robot Data Generation via Compositional Simulation

Arxiv

0+阅读 · 4月13日

Dialogue based Interactive Explanations for Safety Decisions in Human Robot Collaboration

Arxiv

0+阅读 · 4月10日

Adapting Neural Robot Dynamics on the Fly for Predictive Control

Arxiv

0+阅读 · 4月5日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

Task-Specified Compliance Bounds for Humanoids via Lipschitz-Constrained Policies

Arxiv

0+阅读 · 3月20日

Specification-Aware Distribution Shaping for Robotics Foundation Models

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

机器人导航

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

1+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

10+阅读 · 6月3日

工业控制场景下的机器人基础模型：综述及其应用就绪度评估体系

工业控制场景下的机器人基础模型：综述及其应用就绪度评估体系

专知会员服务

11+阅读 · 3月10日

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

【牛津博士论文】机器学习模型的知识编码机制及其对模型可解释性的启示

专知会员服务

23+阅读 · 1月5日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

20+阅读 · 2025年3月11日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

23+阅读 · 2025年2月9日

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

56+阅读 · 2024年2月11日

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

大模型如何用于机器人？CMU谷歌等最新《基于基础模型的通用机器人》综述，详解机器人技术基础模型

专知会员服务

65+阅读 · 2023年12月16日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复

专知会员服务

54+阅读 · 2023年2月5日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

产业智能官

29+阅读 · 2018年10月13日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

相关论文

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Arxiv

0+阅读 · 5月1日

Mask World Model: Predicting What Matters for Robust Robot Policy Learning

Arxiv

0+阅读 · 4月22日

Mask World Model: Predicting What Matters for Robust Robot Policy Learning

Arxiv

0+阅读 · 4月21日

Ro-SLM: Onboard Small Language Models for Robot Task Planning and Operation Code Generation

Arxiv

0+阅读 · 4月14日

ComSim: Building Scalable Real-World Robot Data Generation via Compositional Simulation

Arxiv

0+阅读 · 4月13日

Dialogue based Interactive Explanations for Safety Decisions in Human Robot Collaboration

Arxiv

0+阅读 · 4月10日

Adapting Neural Robot Dynamics on the Fly for Predictive Control

Arxiv

0+阅读 · 4月5日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

Task-Specified Compliance Bounds for Humanoids via Lipschitz-Constrained Policies

Arxiv

0+阅读 · 3月20日

Specification-Aware Distribution Shaping for Robotics Foundation Models

Arxiv

0+阅读 · 3月18日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员