Agentic artificial intelligence systems promise to accelerate scientific workflows, but neuroimaging poses unique challenges: heterogeneous modalities (sMRI, fMRI, dMRI, EEG), long multi-stage pipelines, and persistent reproducibility risks. To address this gap, we present NeuroClaw, a domain-specialized multi-agent research assistant for executable and reproducible neuroimaging research. NeuroClaw operates directly on raw neuroimaging data across formats and modalities, grounding decisions in dataset semantics and BIDS metadata so users need not prepare curated inputs or bespoke model code. The platform combines harness engineering with end-to-end environment management, including pinned Python environments, Docker support, automated installers for common neuroimaging tools, and GPU configuration. In practice, this layer emphasizes checkpointing, post-execution verification, structured audit traces, and controlled runtime setup, making toolchains more transparent while improving reproducibility and auditability. A three-tier skill/agent hierarchy separates user-facing interaction, high-level orchestration, and low-level tool skills to decompose complex workflows into safe, reusable units. Alongside the NeuroClaw framework, we introduce NeuroBench, a system-level benchmark for executability, artifact validity, and reproducibility readiness. Across multiple multimodal LLMs, NeuroClaw-enabled runs yield consistent and substantial score improvements compared with direct agent invocation. Project homepage: https://cuhk-aim-group.github.io/NeuroClaw/index.html


翻译:智能体人工智能系统有望加速科学研究流程,但神经影像学面临独特挑战:多模态异质性(sMRI、fMRI、dMRI、EEG)、冗长的多阶段处理管线以及持续存在的可重复性风险。为应对这一缺口,我们提出了NeuroClaw——一个面向领域特化的多智能体研究助手,专为可执行且可复现的神经影像学研究设计。NeuroClaw可直接作用于跨格式和模态的原始神经影像数据,其决策基于数据集语义和BIDS元数据,因此用户无需准备精选输入或定制模型代码。该平台将工程化编排与端到端环境管理相结合,包括固定Python环境、Docker支持、常见神经影像工具自动安装程序以及GPU配置。在实践中,这一层次架构强调检查点设置、执行后验证、结构化审计轨迹以及受控运行时环境,从而使工具链更加透明,同时提高可重复性和可审计性。三级技能/智能体层级结构将用户交互、高层编排和底层工具技能分离,将复杂工作流分解为安全、可复用的单元。除NeuroClaw框架外,我们还引入了NeuroBench——一个面向可执行性、产物有效性和可复现性准备度的系统级基准测试。在多种多模态大语言模型上,与直接智能体调用相比,NeuroClaw驱动的运行持续产生一致且显著的得分提升。项目主页:https://cuhk-aim-group.github.io/NeuroClaw/index.html

0
下载
关闭预览

相关内容

最新,DeepSeek-R1论文登上Nature封面,附83页补充材料
专知会员服务
27+阅读 · 2025年9月18日
《高级AI带来的多智能体风险》最新97页干活技术报告
专知会员服务
47+阅读 · 2025年3月4日
最全面《DeepSeek R1》技术文章
专知会员服务
90+阅读 · 2025年1月29日
自动化所11篇NeurIPS 2022新作速览!
专知会员服务
40+阅读 · 2022年10月5日
NeurIPS 2019 | 中科院、武大、微软等8篇论文解读
学术头条
10+阅读 · 2019年11月29日
NeurIPS2019机器学习顶会接受论文列表!
GAN生成式对抗网络
17+阅读 · 2019年9月6日
深度解读:小米AI实验室AutoML团队最新成果FairNAS
PaperWeekly
32+阅读 · 2019年7月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月5日
Arxiv
0+阅读 · 4月27日
Arxiv
0+阅读 · 3月26日
Arxiv
0+阅读 · 3月26日
Arxiv
0+阅读 · 3月20日
Arxiv
18+阅读 · 2024年12月27日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员