Recent advances in large language models (LLMs) transform how machine learning (ML) pipelines are developed and evaluated. LLMs enable a new type of workload, agentic pipeline search, in which autonomous or semi-autonomous agents generate, validate, and optimize complete ML pipelines. These agents predominantly operate over popular Python ML libraries and exhibit highly exploratory behavior. This results in thousands of executions for data profiling, pipeline generation, and iterative refinement of pipeline stages. However, the existing Python-based ML ecosystem is built around libraries such as Pandas and scikit-learn, which are designed for human-centric, interactive, sequential workflows and remain constrained by Python's interpretive execution model, library-level isolation, and limited runtime support for executing large numbers of pipelines. Meanwhile, many high-performance ML systems proposed by the systems community either target narrow workload classes or require specialized programming models, which limits their integration with the Python ML ecosystem and makes them largely ill-suited for LLM-based agents. This growing mismatch exposes a fundamental systems challenge in supporting agentic pipeline search at scale. We therefore propose stratum, a unified system infrastructure that decouples pipeline execution from planning and reasoning during agentic pipeline search. Stratum integrates seamlessly with existing Python libraries, compiles batches of pipelines into optimized execution graphs, and efficiently executes them across heterogeneous backends, including a novel Rust-based runtime. We present stratum's architectural vision along with an early prototype, discuss key design decisions, and outline open challenges and research directions. Finally, preliminary experiments show that stratum can significantly speed up large-scale agentic pipeline search up to 16.6x.


翻译:近年来,大型语言模型(LLM)的进展正在改变机器学习(ML)流水线的开发与评估方式。LLM催生了一种新型工作负载——智能体驱动的流水线搜索,其中自主或半自主的智能体能够生成、验证并优化完整的ML流水线。这些智能体主要基于流行的Python ML库运行,并表现出高度探索性行为,从而在数据剖析、流水线生成及流水线阶段迭代优化过程中产生数千次执行实例。然而,现有的Python ML生态系统围绕Pandas、scikit-learn等库构建,这些库专为以人为中心的交互式顺序工作流设计,仍受限于Python的解释执行模型、库级别的隔离性以及对大规模流水线执行有限的运行时支持。与此同时,系统研究领域提出的许多高性能ML系统要么针对特定狭窄的工作负载类型,要么需要专用编程模型,这限制了它们与Python ML生态系统的集成,使其难以适配基于LLM的智能体工作模式。这种日益凸显的错配揭示了在规模化支持智能体流水线搜索时面临的系统性挑战。为此,我们提出stratum——一个统一的系统基础设施,其在智能体流水线搜索过程中将流水线执行与规划推理解耦。stratum能够与现有Python库无缝集成,将批量流水线编译为优化的执行图,并高效地在异构后端(包括一个基于Rust的新型运行时)上执行。本文阐述了stratum的架构愿景与早期原型,讨论了关键设计决策,并展望了开放挑战与研究方向。初步实验表明,stratum能够将大规模智能体流水线搜索速度显著提升至16.6倍。

0
下载
关闭预览

相关内容

【新书】AI智能体与应用:基于 LangChain、LangGraph 与 MCP
专知会员服务
63+阅读 · 2025年9月12日
面向大语言模型的智能体化强化学习图景:综述
专知会员服务
55+阅读 · 2025年9月3日
图结构遇上智能体:分类方法、研究进展与未来机遇
专知会员服务
59+阅读 · 2025年6月24日
基于大型语言模型的软件工程智能体综述
专知会员服务
58+阅读 · 2024年9月6日
走向通用虚拟智能体
专知会员服务
75+阅读 · 2023年11月26日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员