Terminal agents have demonstrated strong potential for autonomous command-line execution, yet their training remains constrained by the scarcity of high-quality and diverse execution trajectories. Existing approaches mitigate this bottleneck by synthesizing large-scale terminal task instances for trajectory sampling. However, they primarily focus on scaling the number of tasks while providing limited control over the diversity of execution trajectories that agents actually experience during training. In this paper, we present SkillSynth, an automated framework for terminal task synthesis built on a scenario-mediated skill graph. SkillSynth first constructs a large-scale skill graph, where scenarios serve as intermediate transition nodes that connect diverse command-line skills. It then samples paths from this graph as abstractions of real-world workflows, and uses a multi-agent harness to instantiate them into executable task instances. By grounding task synthesis in graph-sampled workflow paths, SkillSynth explicitly controls the diversity of minimal execution trajectories required to solve the synthesized tasks. Experiments on Terminal-Bench demonstrate the effectiveness of SkillSynth. Moreover, task instances synthesized by SkillSynth have been adopted to train Hy3 Preview, contributing to its enhanced agentic capabilities in terminal-based settings.


翻译:终端智能体在自主命令行执行方面展现出强大潜力,但其训练仍受限于高质量、多样化执行轨迹的匮乏。现有方法通过综合大规模终端任务实例进行轨迹采样来缓解这一瓶颈,然而它们主要致力于扩展任务数量,对智能体在训练过程中实际经历的执行轨迹多样性控制有限。本文提出SkillSynth——一种基于场景中介技能图的终端任务综合自动化框架。SkillSynth首先构建大规模技能图,其中场景作为连接多样化命令行技能的中间过渡节点;随后从该图中采样路径作为真实工作流的抽象表示,并利用多智能体协作系统将其实例化为可执行任务。通过将任务综合锚定在图采样的工作流路径上,SkillSynth明确控制了解答综合任务所需最小执行轨迹的多样性。在Terminal-Bench上的实验验证了SkillSynth的有效性。此外,由SkillSynth综合的任务实例已被用于训练Hy3 Preview模型,显著增强了其在终端环境中的智能体能力。

0
下载
关闭预览

相关内容

面向大语言模型的智能体化强化学习图景:综述
专知会员服务
55+阅读 · 2025年9月3日
《面向人机协作的扩展型信念-愿望-意图模型》最新111页
《基于二元优化与图学习的多智能体行动方案自动生成》
「可解释知识图谱推理」最新方法综述
专知会员服务
89+阅读 · 2022年12月17日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
VIP会员
最新内容
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
人工智能如何变革军事C5ISR作战
专知会员服务
12+阅读 · 5月8日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员