The transition from automated data collection to fully autonomous discovery requires a shared vocabulary to benchmark progress. While the automotive industry relies on the SAE J3016 standard, current taxonomies for autonomous science presuppose an owner-operator model that is incompatible with the operational rigidities of Large-Scale User Facilities. Here, we propose the Benchmarking Autonomy in Scientific Experiments (BASE) Scale, a 6-level taxonomy (Levels 0-5) specifically adapted for these unique constraints. Unlike owner-operator models, User Facilities require zero-shot deployment where agents must operate immediately without extensive training periods. We define the specific technical requirements for each tier, identifying the Inference Barrier (Level 3) as the critical latency threshold where decisions shift from scalar feedback to semantic digital twins. Fundamentally, this level extends the decision manifold from spatial exploration to temporal gating, enabling the agent to synchronise acquisition with the onset of transient physical events. By establishing these operational definitions, the BASE Scale provides facility directors, funding bodies, and beamline scientists with a standardised metric to assess risk, define liability, and quantify the intelligence of experimental workflows.


翻译:从自动化数据采集向完全自主科学发现的转型需要建立统一的术语体系以衡量进展。尽管汽车行业依赖SAE J3016标准,当前科学自主化分类体系仍预设了所有者-运营者模式,这与大型用户装置固有的运行刚性不相容。本文提出科学实验自主性基准测试(BASE)分级体系——专为此类特殊约束条件设计的六级分类标准(0-5级)。与所有者-运营者模式不同,用户装置需要零样本部署能力,即智能体必须在未经长期训练的情况下立即投入运行。我们明确定义了每个层级的具体技术要求,并将推理屏障(第3级)确定为关键延迟阈值——该层级决策机制从标量反馈转向语义数字孪生。本质上,该层级将决策流形从空间探索扩展到时序门控,使智能体能够将数据采集与瞬态物理事件的发生实现同步。通过建立这些操作性定义,BASE分级体系为装置负责人、资助机构和光束线科学家提供了标准化度量工具,用以评估风险、界定责任并量化实验工作流的智能水平。

0
下载
关闭预览

相关内容

美国防部自主系统研制试验与鉴定指南 | 2025年最新200页
专知会员服务
40+阅读 · 2025年10月23日
从面向科学的人工智能到智能体科学:自主科学发现综述
《自主系统的分析和评估》24页报告
专知会员服务
57+阅读 · 2024年3月29日
专知会员服务
31+阅读 · 2021年10月4日
专知会员服务
98+阅读 · 2021年1月24日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
装备作战试验标准体系研究
科技导报
18+阅读 · 2019年4月2日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
《美陆军条例:陆军指挥政策(2026版)》
专知会员服务
6+阅读 · 今天8:10
《军用自主人工智能系统的治理与安全》
专知会员服务
5+阅读 · 今天8:02
《系统簇式多域作战规划范畴论框架》
专知会员服务
8+阅读 · 4月20日
高效视频扩散模型:进展与挑战
专知会员服务
4+阅读 · 4月20日
乌克兰前线的五项创新
专知会员服务
8+阅读 · 4月20日
 军事通信系统与设备的技术演进综述
专知会员服务
7+阅读 · 4月20日
《北约标准:医疗评估手册》174页
专知会员服务
6+阅读 · 4月20日
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员