Reinforcement learning has emerged as a promising paradigm for aligning diffusion and flow-matching models with human preferences, yet practitioners face fragmented codebases, model-specific implementations, and engineering complexity. We introduce Flow-Factory, a unified framework that decouples algorithms, models, and rewards through through a modular, registry-based architecture. This design enables seamless integration of new algorithms and architectures, as demonstrated by our support for GRPO, DiffusionNFT, and AWM across Flux, Qwen-Image, and WAN video models. By minimizing implementation overhead, Flow-Factory empowers researchers to rapidly prototype and scale future innovations with ease. Flow-Factory provides production-ready memory optimization, flexible multi-reward training, and seamless distributed training support. The codebase is available at https://github.com/X-GenGroup/Flow-Factory.


翻译:强化学习已成为将扩散模型和流匹配模型与人类偏好对齐的一种前景广阔的方法,然而实践者面临着代码库碎片化、模型特定实现以及工程复杂性等挑战。我们提出了Flow-Factory,这是一个通过模块化、基于注册表的架构将算法、模型和奖励解耦的统一框架。该设计实现了新算法与架构的无缝集成,这体现在我们对GRPO、DiffusionNFT和AWM算法在Flux、Qwen-Image和WAN视频模型上的支持中。通过最小化实现开销,Flow-Factory使研究人员能够轻松地快速原型化和扩展未来的创新。Flow-Factory提供了生产就绪的内存优化、灵活的多奖励训练以及无缝的分布式训练支持。代码库发布于 https://github.com/X-GenGroup/Flow-Factory。

0
下载
关闭预览

相关内容

Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
TensorFlowLite:端侧机器学习框架
专知会员服务
33+阅读 · 2020年8月27日
【Texas 大学】强化学习领域的课程学习:一个框架和综述
专知会员服务
73+阅读 · 2020年3月22日
强化学习开篇:Q-Learning原理详解
AINLP
37+阅读 · 2020年7月28日
17种深度强化学习算法用Pytorch实现
新智元
31+阅读 · 2019年9月16日
基于强化学习的量化交易框架
机器学习研究会
30+阅读 · 2018年2月22日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
tensorflow系列笔记:流程,概念和代码解析
北京思腾合力科技有限公司
30+阅读 · 2017年11月11日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
0+阅读 · 1月30日
VIP会员
相关资讯
强化学习开篇:Q-Learning原理详解
AINLP
37+阅读 · 2020年7月28日
17种深度强化学习算法用Pytorch实现
新智元
31+阅读 · 2019年9月16日
基于强化学习的量化交易框架
机器学习研究会
30+阅读 · 2018年2月22日
入门 | 从Q学习到DDPG,一文简述多种强化学习算法
tensorflow系列笔记:流程,概念和代码解析
北京思腾合力科技有限公司
30+阅读 · 2017年11月11日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员