Agentic artificial intelligence systems promise to accelerate scientific workflows, but neuroimaging poses unique challenges: heterogeneous modalities (sMRI, fMRI, dMRI, EEG), long multi-stage pipelines, and persistent reproducibility risks. To address this gap, we present NeuroClaw, a domain-specialized multi-agent research assistant for executable and reproducible neuroimaging research. NeuroClaw operates directly on raw neuroimaging data across formats and modalities, grounding decisions in dataset semantics and BIDS metadata so users need not prepare curated inputs or bespoke model code. The platform combines harness engineering with end-to-end environment management, including pinned Python environments, Docker support, automated installers for common neuroimaging tools, and GPU configuration. In practice, this layer emphasizes checkpointing, post-execution verification, structured audit traces, and controlled runtime setup, making toolchains more transparent while improving reproducibility and auditability. A three-tier skill/agent hierarchy separates user-facing interaction, high-level orchestration, and low-level tool skills to decompose complex workflows into safe, reusable units. Alongside the NeuroClaw framework, we introduce NeuroBench, a system-level benchmark for executability, artifact validity, and reproducibility readiness. Across multiple multimodal LLMs, NeuroClaw-enabled runs yield consistent and substantial score improvements compared with direct agent invocation. Project homepage: https://cuhk-aim-group.github.io/NeuroClaw/index.html


翻译:智能体人工智能系统有望加速科学工作流程,但神经影像学面临独特挑战:异质性模态(sMRI、fMRI、dMRI、EEG)、长程多阶段处理流程及持续存在的可重复性风险。为应对这一空白,我们提出NeuroClaw,一个面向可执行与可重复神经影像研究的领域专用多智能体研究助手。NeuroClaw直接对跨格式与跨模态的原始神经影像数据进行操作,基于数据集语义和BIDS元数据进行决策,因此用户无需准备精心整理的输入或定制模型代码。该平台将集成工程与端到端环境管理相结合,包括固定Python环境、Docker支持、通用神经影像工具的自动安装程序及GPU配置。在实际应用中,该层强调检查点机制、执行后验证、结构化审计追踪及受控运行时设置,从而在提升工具链透明度的同时改善可重复性与可审计性。三层技能/智能体层级结构将用户交互、高层次编排与低层次工具技能分离,将复杂工作流分解为安全、可复用的单元。伴随NeuroClaw框架,我们引入NeuroBench,一个面向可执行性、工件有效性及可重复性准备度的系统级基准测试。在多种多模态大语言模型中,启用NeuroClaw的运行相比直接智能体调用能产生一致且显著的分数提升。项目主页:https://cuhk-aim-group.github.io/NeuroClaw/index.html

0
下载
关闭预览

相关内容

最新,DeepSeek-R1论文登上Nature封面,附83页补充材料
专知会员服务
27+阅读 · 2025年9月18日
《高级AI带来的多智能体风险》最新97页干活技术报告
专知会员服务
47+阅读 · 2025年3月4日
最全面《DeepSeek R1》技术文章
专知会员服务
90+阅读 · 2025年1月29日
上交大ReThinklab实验室NeurIPS2024十六篇论文工作简介
专知会员服务
29+阅读 · 2024年10月10日
自动化所11篇NeurIPS 2022新作速览!
专知会员服务
40+阅读 · 2022年10月5日
[ICML2022] NeuroFluid: 流体仿真的人工智能新范式
专知会员服务
27+阅读 · 2022年6月8日
NeurIPS 2019 | 中科院、武大、微软等8篇论文解读
学术头条
10+阅读 · 2019年11月29日
NeurIPS2019机器学习顶会接受论文列表!
GAN生成式对抗网络
17+阅读 · 2019年9月6日
深度解读:小米AI实验室AutoML团队最新成果FairNAS
PaperWeekly
32+阅读 · 2019年7月11日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月15日
Arxiv
0+阅读 · 6月5日
Arxiv
0+阅读 · 6月4日
Arxiv
0+阅读 · 5月18日
Arxiv
0+阅读 · 5月6日
Arxiv
18+阅读 · 2024年12月27日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
最新,DeepSeek-R1论文登上Nature封面,附83页补充材料
专知会员服务
27+阅读 · 2025年9月18日
《高级AI带来的多智能体风险》最新97页干活技术报告
专知会员服务
47+阅读 · 2025年3月4日
最全面《DeepSeek R1》技术文章
专知会员服务
90+阅读 · 2025年1月29日
上交大ReThinklab实验室NeurIPS2024十六篇论文工作简介
专知会员服务
29+阅读 · 2024年10月10日
自动化所11篇NeurIPS 2022新作速览!
专知会员服务
40+阅读 · 2022年10月5日
[ICML2022] NeuroFluid: 流体仿真的人工智能新范式
专知会员服务
27+阅读 · 2022年6月8日
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员