Multimodal LLM datasets are inherently heterogeneous, with significant data variability. Although each modality exhibits independent variability, sample-level entanglement makes it difficult to balance workloads across both modalities and batches. We present Entrain, a distributed MLLM training framework that addresses both heterogeneity and variability in multimodal training workloads. Entrain challenges the intuition that dynamic data variability requires dynamic model parallelism by shifting the profiling paradigm from micro-level samples to macroscopic batches. We prove that a single, static model-parallel configuration suffices for optimal load balancing under this paradigm. At the microscopic scale, Entrain introduces a hierarchical microbatch assignment algorithm that defers excess workload within each iteration to stabilize variability across microbatches. Evaluations show that Entrain reduces workload variability across microbatches by up to 10.6$\times$, improving end-to-end training throughput by up to 1.40$\times$ over existing baselines.


翻译:多模态大语言模型数据集天然具有异质性,数据变异性显著。尽管每种模态表现出独立变异,但样本级别的纠缠使得跨模态和跨批次的负载均衡困难。我们提出Entrain,一种分布式多模态大语言模型训练框架,旨在解决多模态训练负载中的异质性与变异性。该框架通过将剖析范式从微观样本转向宏观批次,挑战了“动态数据变异性需要动态模型并行”的传统直觉。我们证明,在此范式下,单个静态模型并行配置足以实现最优负载均衡。在微观尺度上,Entrain引入了一种分层微批次分配算法,通过推迟每次迭代中的超额负载来稳定微批次间的变异性。评估表明,Entrain将微批次间工作负载变异性降低达10.6倍,相较现有基线方法,端到端训练吞吐量提升达1.40倍。

0
下载
关闭预览

相关内容

专知会员服务
38+阅读 · 2021年8月2日
异质信息网络分析与应用综述,软件学报-北京邮电大学
专知会员服务
186+阅读 · 2020年6月21日
专知会员服务
236+阅读 · 2020年5月6日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
19+阅读 · 2020年4月3日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月8日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
9+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
专知会员服务
38+阅读 · 2021年8月2日
异质信息网络分析与应用综述,软件学报-北京邮电大学
专知会员服务
186+阅读 · 2020年6月21日
专知会员服务
236+阅读 · 2020年5月6日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员