Large Language Model (LLM)-based agent systems are increasingly being used for scientific discovery, yet their practical capability remains constrained by a narrow and manually curated tool layer. Much scientific computational capability already exists in open-source repositories, software packages and APIs, but these resources remain difficult to standardize, operationalize and invoke reliably. Here we present ToolRosetta, a framework that equips LLM-based agent systems with scalable, open-world computational access by automatically transforming heterogeneous computational programs into validated, callable tools. ToolRosetta integrates repository retrieval, tool standardization, execution testing, iterative repair and security-aware governance. Across 122 GitHub repositories spanning 35 subdisciplines in 6 domains, ToolRosetta standardizes 1,580 callable tools. These tools support an average verified task success rate of 84.0\% across domains and substantially enhance existing agentic AI systems, including OpenClaw, particularly on out-of-distribution tasks beyond fixed curated tool inventories.


翻译:基于大型语言模型(LLM)的智能体系统正日益被用于科学发现,然而其实际能力仍受限于狭窄且人工精心策划的工具层。大量科学计算能力已存在于开源代码库、软件包和应用程序接口(API)中,但这些资源难以标准化、操作化并可靠调用。本文提出 ToolRosetta 框架,通过自动将异构计算程序转化为经过验证、可调用的工具,为基于 LLM 的智能体系统提供可扩展的开放世界计算访问能力。ToolRosetta 整合了代码库检索、工具标准化、执行测试、迭代修复和安全感知治理。在覆盖 6 个领域 35 个子学科的 122 个 GitHub 代码库中,ToolRosetta 标准化了 1,580 个可调用工具。这些工具在各领域实现了平均 84.0% 的已验证任务成功率,并显著增强了现有智能体 AI 系统(尤其是 OpenClaw),在处理超出固定精选工具库范围的分布外任务时表现尤为突出。

0
下载
关闭预览

相关内容

OpenAI 32页《智能体》指南,如何构建首个智能体系统
专知会员服务
50+阅读 · 2025年4月18日
走向通用虚拟智能体
专知会员服务
76+阅读 · 2023年11月26日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
11+阅读 · 2023年8月28日
VIP会员
相关主题
最新内容
21世纪的无人机战争
专知会员服务
0+阅读 · 24分钟前
《量子技术的军事任务技术适配与利用》
专知会员服务
0+阅读 · 38分钟前
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员