模型并行论文 - 专知

会员服务 ·

模型并行

Heterogeneous Low-Bandwidth Pre-Training of LLMs

Arxiv

0+阅读 · 1月5日

HiGen: Hierarchical Graph Generative Networks

Arxiv

0+阅读 · 2025年12月30日

Arbitrage: Efficient Reasoning via Advantage-Aware Speculation

Arxiv

0+阅读 · 2025年12月4日

Arbitrage: Efficient Reasoning via Advantage-Aware Speculation

Arxiv

0+阅读 · 2025年12月9日

LLM Inference Beyond a Single Node: From Bottlenecks to Mitigations with Fast All-Reduce Communication

Arxiv

0+阅读 · 2025年11月13日

LLM Inference Beyond a Single Node: From Bottlenecks to Mitigations with Fast All-Reduce Communication

Arxiv

0+阅读 · 2025年12月15日

Synergistic Tensor and Pipeline Parallelism

Synergistic Tensor and Pipeline Parallelism

Arxiv

0+阅读 · 2025年10月31日

Model Parallelism With Subnetwork Data Parallelism

Arxiv

0+阅读 · 2025年10月2日

Model Parallelism With Subnetwork Data Parallelism

Arxiv

0+阅读 · 2025年10月1日

Oases: Efficient Large-Scale Model Training on Commodity Servers via Overlapped and Automated Tensor Model Parallelism

Arxiv

0+阅读 · 2025年6月30日

Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems

Arxiv

0+阅读 · 2025年6月21日

Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems

Arxiv

0+阅读 · 2025年6月24日

Ladder-residual: parallelism-aware architecture for accelerating large model inference with communication overlapping

Arxiv

0+阅读 · 2025年1月11日

Adaptive Batch Size Schedules for Distributed Training of Language Models with Data and Model Parallelism

Arxiv

0+阅读 · 2024年12月30日

Malleus: Straggler-Resilient Hybrid Parallel Training of Large-scale Models via Malleable Data and Model Parallelization

Arxiv

0+阅读 · 2024年10月17日

参考链接

微信扫码咨询专知VIP会员