ARTIS：基于迭代模拟的具身风险感知测试时扩展 (ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation) - 专知论文

会员服务 ·

0

风险感知 · 测试时扩展 · 交互 · 语言模型 · 计算资源 ·

ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation

翻译：ARTIS：基于迭代模拟的具身风险感知测试时扩展

Xingshan Zeng,Lingzhi Wang,Weiwen Liu,Liangyou Li,Yasheng Wang,Lifeng Shang,Xin Jiang,Qun Liu

Current test-time scaling (TTS) techniques enhance large language model (LLM) performance by allocating additional computation at inference time, yet they remain insufficient for agentic settings, where actions directly interact with external environments and their effects can be irreversible and costly. We propose ARTIS, Agentic Risk-Aware Test-Time Scaling via Iterative Simulation, a framework that decouples exploration from commitment by enabling test-time exploration through simulated interactions prior to real-world execution. This design allows extending inference-time computation to improve action-level reliability and robustness without incurring environmental risk. We further show that naive LLM-based simulators struggle to capture rare but high-impact failure modes, substantially limiting their effectiveness for agentic decision making. To address this limitation, we introduce a risk-aware tool simulator that emphasizes fidelity on failure-inducing actions via targeted data generation and rebalanced training. Experiments on multi-turn and multi-step agentic benchmarks demonstrate that iterative simulation substantially improves agent reliability, and that risk-aware simulation is essential for consistently realizing these gains across models and tasks.

翻译：当前的测试时扩展技术通过在推理时分配额外计算资源来提升大语言模型性能，但这些方法在具身智能场景中仍显不足——此类场景中智能体的行为会直接与外部环境交互，且其影响可能不可逆转并伴随高昂代价。我们提出ARTIS框架（基于迭代模拟的具身风险感知测试时扩展），该框架通过在执行真实操作前进行模拟交互来实现测试时探索，从而将探索过程与执行决策解耦。该设计可在不引发环境风险的前提下，通过扩展推理时计算来提升行为级可靠性与鲁棒性。我们进一步发现，基于大语言模型的简易模拟器难以捕捉罕见但影响重大的故障模式，这严重限制了其在具身决策中的有效性。为解决此局限，我们引入风险感知工具模拟器，该模拟器通过定向数据生成与重平衡训练，着重提升对诱发故障行为的模拟保真度。在多轮多步具身基准测试上的实验表明：迭代模拟能显著提升智能体可靠性，而风险感知模拟对于在不同模型与任务中持续实现这些性能增益至关重要。

0

相关内容

风险感知

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

11+阅读 · 2月20日

具身智能中的语义生命周期：基于基础模型的获取、表征与存储

具身智能中的语义生命周期：基于基础模型的获取、表征与存储

专知会员服务

16+阅读 · 1月15日

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

专知会员服务

26+阅读 · 1月2日

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

专知会员服务

21+阅读 · 2025年11月23日

大语言模型推理时扩展：从子问题结构视角的综述

大语言模型推理时扩展：从子问题结构视角的综述

专知会员服务

17+阅读 · 2025年11月20日

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

专知会员服务

10+阅读 · 2025年6月8日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

在ISR中利用人工智能：跨多种数据的威胁识别，用于综合辐射源分析

在ISR中利用人工智能：跨多种数据的威胁识别，用于综合辐射源分析

专知会员服务

46+阅读 · 2024年1月12日

数字世界中的大模型Agent：机遇与风险

数字世界中的大模型Agent：机遇与风险

专知会员服务

60+阅读 · 2023年12月25日

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

专知会员服务

48+阅读 · 2023年9月20日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

基于稀有事件模拟技术的金融衍生品组合风险度量及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

Unsafer in Many Turns: Benchmarking and Defending Multi-Turn Safety Risks in Tool-Using Agents

Arxiv

0+阅读 · 2月13日

Agentic Test-Time Scaling for WebAgents

Arxiv

0+阅读 · 2月12日

SAGE: Scalable Agentic 3D Scene Generation for Embodied AI

Arxiv

0+阅读 · 2月10日

SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs

Arxiv

0+阅读 · 2月10日

SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs

Arxiv

0+阅读 · 2月6日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models

Arxiv

0+阅读 · 2月2日

ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation

Arxiv

0+阅读 · 2月2日

Timely Machine: Awareness of Time Makes Test-Time Scaling Agentic

Arxiv

0+阅读 · 1月23日

Efficient Test-Time Scaling of Multi-Step Reasoning by Probing Internal States of Large Language Models

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

测试时扩展

相关VIP内容

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

11+阅读 · 2月20日

具身智能中的语义生命周期：基于基础模型的获取、表征与存储

具身智能中的语义生命周期：基于基础模型的获取、表征与存储

专知会员服务

16+阅读 · 1月15日

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

专知会员服务

26+阅读 · 1月2日

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

专知会员服务

21+阅读 · 2025年11月23日

大语言模型推理时扩展：从子问题结构视角的综述

大语言模型推理时扩展：从子问题结构视角的综述

专知会员服务

17+阅读 · 2025年11月20日

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

专知会员服务

10+阅读 · 2025年6月8日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

在ISR中利用人工智能：跨多种数据的威胁识别，用于综合辐射源分析

在ISR中利用人工智能：跨多种数据的威胁识别，用于综合辐射源分析

专知会员服务

46+阅读 · 2024年1月12日

数字世界中的大模型Agent：机遇与风险

数字世界中的大模型Agent：机遇与风险

专知会员服务

60+阅读 · 2023年12月25日

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

专知会员服务

48+阅读 · 2023年9月20日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Unsafer in Many Turns: Benchmarking and Defending Multi-Turn Safety Risks in Tool-Using Agents

Arxiv

0+阅读 · 2月13日

Agentic Test-Time Scaling for WebAgents

Arxiv

0+阅读 · 2月12日

SAGE: Scalable Agentic 3D Scene Generation for Embodied AI

Arxiv

0+阅读 · 2月10日

SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs

Arxiv

0+阅读 · 2月10日

SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs

Arxiv

0+阅读 · 2月6日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models

Arxiv

0+阅读 · 2月2日

ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation

Arxiv

0+阅读 · 2月2日

Timely Machine: Awareness of Time Makes Test-Time Scaling Agentic

Arxiv

0+阅读 · 1月23日

Efficient Test-Time Scaling of Multi-Step Reasoning by Probing Internal States of Large Language Models

Arxiv

0+阅读 · 1月14日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

基于稀有事件模拟技术的金融衍生品组合风险度量及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员