EAIRiskBench：面向基础模型具身智能体任务规划的物理风险意识评估框架 (EAIRiskBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents)

Embodied artificial intelligence (EAI) integrates advanced AI models into physical entities for real-world interaction. The emergence of foundation models as the "brain" of EAI agents for high-level task planning has shown promising results. However, the deployment of these agents in physical environments presents significant safety challenges. For instance, a housekeeping robot lacking sufficient risk awareness might place a metal container in a microwave, potentially causing a fire. To address these critical safety concerns, comprehensive pre-deployment risk assessments are imperative. This study introduces EAIRiskBench, a novel framework for automated physical risk assessment in EAI scenarios. EAIRiskBench employs a multi-agent cooperative system that leverages various foundation models to generate safety guidelines, create risk-prone scenarios, make task planning, and evaluate safety systematically. Utilizing this framework, we construct EAIRiskDataset, comprising diverse test cases across various domains, encompassing both textual and visual scenarios. Our comprehensive evaluation of state-of-the-art foundation models reveals alarming results: all models exhibit high task risk rates (TRR), with an average of 95.75% across all evaluated models. To address these challenges, we further propose two prompting-based risk mitigation strategies. While these strategies demonstrate some efficacy in reducing TRR, the improvements are limited, still indicating substantial safety concerns. This study provides the first large-scale assessment of physical risk awareness in EAI agents. Our findings underscore the critical need for enhanced safety measures in EAI systems and provide valuable insights for future research directions in developing safer embodied artificial intelligence system.

翻译：具身人工智能（EAI）将先进的人工智能模型集成到物理实体中，以实现与现实世界的交互。以基础模型作为EAI智能体进行高层任务规划的“大脑”已展现出显著成效。然而，这些智能体在物理环境中的部署带来了严峻的安全挑战。例如，一个缺乏充分风险意识的家务机器人可能将金属容器放入微波炉，从而引发火灾。为解决这些关键安全问题，全面的部署前风险评估势在必行。本研究提出了EAIRiskBench，一个用于EAI场景中自动化物理风险评估的新型框架。EAIRiskBench采用多智能体协同系统，利用多种基础模型来生成安全准则、创建高风险场景、制定任务规划并进行系统性安全评估。基于该框架，我们构建了EAIRiskDataset，包含跨多个领域的多样化测试用例，涵盖文本与视觉场景。我们对前沿基础模型的综合评估揭示了令人警觉的结果：所有模型均表现出较高的任务风险率（TRR），所有评估模型的平均TRR高达95.75%。为应对这些挑战，我们进一步提出了两种基于提示的风险缓解策略。虽然这些策略在降低TRR方面显示出一定效果，但改进有限，仍表明存在重大安全隐患。本研究首次对EAI智能体的物理风险意识进行了大规模评估。我们的发现强调了增强EAI系统安全措施的迫切性，并为未来开发更安全的具身人工智能系统提供了重要的研究方向参考。

相关内容

MoDELS

关注 45

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

专知会员服务

66+阅读 · 2023年6月10日

Linux导论，Introduction to Linux，96页ppt

专知会员服务

82+阅读 · 2020年7月26日

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

专知会员服务

34+阅读 · 2019年10月18日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日