模块化安全护栏是现实世界中基于基础模型的机器人所必需的 (Modular Safety Guardrails Are Necessary for Foundation-Model-Enabled Robots in the Real World) - 专知论文

会员服务 ·

0

机器人 · 约束 · 协同 · 设计 · 大模型 ·

Modular Safety Guardrails Are Necessary for Foundation-Model-Enabled Robots in the Real World

翻译：模块化安全护栏是现实世界中基于基础模型的机器人所必需的

Joonkyung Kim,Wenxi Chen,Davood Soleymanzadeh,Yi Ding,Xiangbo Gao,Zhengzhong Tu,Ruqi Zhang,Fan Fei,Sushant Veer,Yiwei Lyu,Minghui Zheng,Yan Gu

The integration of foundation models (FMs) into robotics has accelerated real-world deployment, while introducing new safety challenges arising from open-ended semantic reasoning and embodied physical action. These challenges require safety notions beyond physical constraint satisfaction. In this paper, we characterize FM-enabled robot safety along three dimensions: action safety (physical feasibility and constraint compliance), decision safety (semantic and contextual appropriateness), and human-centered safety (conformance to human intent, norms, and expectations). We argue that existing approaches, including static verification, monolithic controllers, and end-to-end learned policies, are insufficient in settings where tasks, environments, and human expectations are open-ended, long-tailed, and subject to adaptation over time. To address this gap, we propose modular safety guardrails, consisting of monitoring (evaluation) and intervention layers, as an architectural foundation for comprehensive safety across the autonomy stack. Beyond modularity, we highlight possible cross-layer co-design opportunities through representation alignment and conservatism allocation to enable faster, less conservative, and more effective safety enforcement. We call on the community to explore richer guardrail modules and principled co-design strategies to advance safe real-world physical AI deployment.

翻译：将基础模型（FMs）集成到机器人学中加速了其在现实世界的部署，同时也带来了由开放式语义推理和具身物理行为所引发的新安全挑战。这些挑战要求的安全概念超越了物理约束满足的范畴。本文中，我们从三个维度刻画基于基础模型的机器人安全：行为安全（物理可行性与约束合规性）、决策安全（语义与情境适当性）以及以人为中心的安全（符合人类意图、规范与期望）。我们认为，在任务、环境及人类期望具有开放性、长尾性并随时间动态适应的场景下，现有方法——包括静态验证、单体控制器和端到端学习策略——均存在不足。为弥补这一差距，我们提出模块化安全护栏，其由监控（评估）层与干预层构成，作为在整个自主栈中实现全面安全的架构基础。除了模块化，我们强调了通过表征对齐和保守性分配实现跨层协同设计的可能性，以实现更快速、更少保守且更有效的安全执行。我们呼吁学界探索更丰富的护栏模块和原则性的协同设计策略，以推动安全的现实世界物理人工智能部署。

0

相关内容

机器人

机器人（英语：Robot）包括一切模拟人类行为或思想与模拟其他生物的机械（如机器狗，机器猫等）。狭义上对机器人的定义还有很多分类法及争议，有些电脑程序甚至也被称为机器人。在当代工业中，机器人指能自动运行任务的人造机器设备，用以取代或协助人类工作，一般会是机电设备，由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

6+阅读 · 2月25日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

【博士论文】面向未知感知的机器学习基础

【博士论文】面向未知感知的机器学习基础

专知会员服务

17+阅读 · 2025年5月22日

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

专知会员服务

15+阅读 · 2025年5月9日

《设定人工智能武器在现代战争形态演变中的边界》最新报告

《设定人工智能武器在现代战争形态演变中的边界》最新报告

专知会员服务

39+阅读 · 2025年4月26日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

多视角看大模型安全及实践

多视角看大模型安全及实践

专知会员服务

69+阅读 · 2024年4月1日

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

56+阅读 · 2024年2月11日

大模型与医疗如何结合？上交大等最新《计算医疗健康中的以数据为中心的基础模型》综述

大模型与医疗如何结合？上交大等最新《计算医疗健康中的以数据为中心的基础模型》综述

专知会员服务

70+阅读 · 2024年1月8日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

16+阅读 · 2023年7月4日

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

专知

10+阅读 · 2022年11月3日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

机器学习必备的数学基础有哪些？

机器学习必备的数学基础有哪些？

人工智能头条

12+阅读 · 2019年10月18日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

产业智能官

29+阅读 · 2018年10月13日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向踩踏事故防范的运动人群无人机协同航拍及风险演化态势计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

一种新型的基于行人检测与行走方向识别的辅助驾驶安全系统的设计与开发

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

I-FailSense: Towards General Robotic Failure Detection with Vision-Language Models

I-FailSense: Towards General Robotic Failure Detection with Vision-Language Models

Arxiv

0+阅读 · 2月19日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月17日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月13日

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

A Multimodal Manufacturing Safety Chatbot: Knowledge Base Design, Benchmark Development, and Evaluation of Multiple RAG Approaches

Arxiv

0+阅读 · 2月10日

CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment

Arxiv

0+阅读 · 2月10日

CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment

Arxiv

0+阅读 · 2月8日

SafePred: A Predictive Guardrail for Computer-Using Agents via World Models

Arxiv

0+阅读 · 2月2日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

SPARK: Safe Protective and Assistive Robot Kit

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

6+阅读 · 2月25日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

【博士论文】面向未知感知的机器学习基础

【博士论文】面向未知感知的机器学习基础

专知会员服务

17+阅读 · 2025年5月22日

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

专知会员服务

15+阅读 · 2025年5月9日

《设定人工智能武器在现代战争形态演变中的边界》最新报告

《设定人工智能武器在现代战争形态演变中的边界》最新报告

专知会员服务

39+阅读 · 2025年4月26日

针对自动驾驶智能模型的攻击与防御

针对自动驾驶智能模型的攻击与防御

专知会员服务

19+阅读 · 2024年6月25日

多视角看大模型安全及实践

多视角看大模型安全及实践

专知会员服务

69+阅读 · 2024年4月1日

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

56+阅读 · 2024年2月11日

大模型与医疗如何结合？上交大等最新《计算医疗健康中的以数据为中心的基础模型》综述

大模型与医疗如何结合？上交大等最新《计算医疗健康中的以数据为中心的基础模型》综述

专知会员服务

70+阅读 · 2024年1月8日

《结合机器人行为以实现安全、智能的执行》

《结合机器人行为以实现安全、智能的执行》

专知会员服务

16+阅读 · 2023年7月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

专知

10+阅读 · 2022年11月3日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

机器学习必备的数学基础有哪些？

机器学习必备的数学基础有哪些？

人工智能头条

12+阅读 · 2019年10月18日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

【知识图谱】基于知识图谱的安保机器人、知识图谱为电商而生如何感应用户需求、知识图谱在运维中的应用

产业智能官

29+阅读 · 2018年10月13日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

相关论文

I-FailSense: Towards General Robotic Failure Detection with Vision-Language Models

I-FailSense: Towards General Robotic Failure Detection with Vision-Language Models

Arxiv

0+阅读 · 2月19日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月17日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月13日

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

A Multimodal Manufacturing Safety Chatbot: Knowledge Base Design, Benchmark Development, and Evaluation of Multiple RAG Approaches

Arxiv

0+阅读 · 2月10日

CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment

Arxiv

0+阅读 · 2月10日

CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment

Arxiv

0+阅读 · 2月8日

SafePred: A Predictive Guardrail for Computer-Using Agents via World Models

Arxiv

0+阅读 · 2月2日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

SPARK: Safe Protective and Assistive Robot Kit

Arxiv

0+阅读 · 1月14日

相关基金

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向踩踏事故防范的运动人群无人机协同航拍及风险演化态势计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

一种新型的基于行人检测与行走方向识别的辅助驾驶安全系统的设计与开发

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员