Learning to Ideate for Machine Learning Engineering Agents

Existing machine learning engineering (MLE) agents struggle to iteratively optimize their implemented algorithms for effectiveness. To address this, we introduce MLE-Ideator, a dual-agent framework that separates ideation from implementation. In our system, an implementation agent can request strategic help from a dedicated Ideator. We show this approach is effective in two ways. First, in a training-free setup, our framework significantly outperforms implementation-only agent baselines on MLE-Bench. Second, we demonstrate that the Ideator can be trained with reinforcement learning (RL) to generate more effective ideas. With only 1K training samples from 10 MLE tasks, our RL-trained Qwen3-8B Ideator achieves an 11.5% relative improvement compared to its untrained counterpart and surpasses Claude Sonnet 3.5. These results highlights a promising path toward training strategic AI systems for scientific discovery.

翻译：现有机器学习工程（MLE）智能体在迭代优化其实现算法的有效性方面存在困难。为解决此问题，我们提出了MLE-Ideator，一种将构思与实现分离的双智能体框架。在我们的系统中，实现智能体可以向一个专门的构思器请求策略性帮助。我们从两个方面证明了该方法的有效性。首先，在无需训练的设置下，我们的框架在MLE-Bench基准上显著优于仅包含实现智能体的基线方法。其次，我们证明了构思器可以通过强化学习（RL）进行训练，以生成更有效的构思。仅使用来自10个MLE任务的1K训练样本，我们经过RL训练的Qwen3-8B构思器相较于未经训练的版本实现了11.5%的相对性能提升，并且超越了Claude Sonnet 3.5。这些结果突显了一条训练用于科学发现的策略性人工智能系统的可行路径。

相关内容

极大似然估计

关注 5

极大似然估计方法（Maximum Likelihood Estimate，MLE）也称为最大概似估计或最大似然估计，是求估计的另一种方法，最大概似是1821年首先由德国数学家高斯（C. F. Gauss）提出，但是这个方法通常被归功于英国的统计学家罗纳德·费希尔（R. A. Fisher）它是建立在极大似然原理的基础上的一个统计方法，极大似然原理的直观想法是，一个随机试验如有若干个可能的结果A，B，C，... ，若在一次试验中，结果A出现了，那么可以认为实验条件对A的出现有利，也即出现的概率P(A)较大。极大似然原理的直观想法我们用下面例子说明。设甲箱中有99个白球，1个黑球；乙箱中有1个白球．99个黑球。现随机取出一箱，再从抽取的一箱中随机取出一球，结果是黑球，这一黑球从乙箱抽取的概率比从甲箱抽取的概率大得多，这时我们自然更多地相信这个黑球是取自乙箱的。一般说来，事件A发生的概率与某一未知参数theta有关， theta取值不同，则事件A发生的概率P(A/theta)也不同，当我们在一次试验中事件A发生了，则认为此时的theta值应是t的一切可能取值中使P(A/theta)达到最大的那一个，极大似然估计法就是要选取这样的t值作为参数t的估计值，使所选取的样本在被选的总体中出现的可能性为最大。

构建面向终端的 AI 编程智能体：脚手架、测试环境、上下文工程及实践经验

专知会员服务

25+阅读 · 3月8日

伯克利最新《智能体 AI (Agentic AI)》课程

专知会员服务

48+阅读 · 3月1日

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

69+阅读 · 1月6日

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

专知会员服务

29+阅读 · 1月2日