高效训练论文 - 专知

会员服务 ·

高效训练

Preference Packing: Efficient Preference Optimization for Large Language Models

Arxiv

0+阅读 · 2月27日

Privacy-Preserving Logistic Regression Training with A Faster Gradient Variant

Arxiv

0+阅读 · 2月28日

MoE Parallel Folding: Heterogeneous Parallelism Mappings for Efficient Large-Scale MoE Model Training with Megatron Core

Arxiv

0+阅读 · 3月2日

Cooperative-Competitive Team Play of Real-World Craft Robots

Arxiv

0+阅读 · 2月24日

FlashOptim: Optimizers for Memory Efficient Training

Arxiv

0+阅读 · 2月26日

Efficient Post-Training Pruning of Large Language Models with Statistical Correction

Arxiv

0+阅读 · 2月7日

Sparse-to-Sparse Training of Diffusion Models

Arxiv

0+阅读 · 2月4日

Fast-Slow Efficient Training for Multimodal Large Language Models via Visual Token Pruning

Arxiv

0+阅读 · 2月3日

Efficient Training of Boltzmann Generators Using Off-Policy Log-Dispersion Regularization

Arxiv

0+阅读 · 2月3日

Training-Efficient Text-to-Music Generation with State-Space Modeling

Arxiv

0+阅读 · 1月21日

Training Tensor Attention Efficiently: From Cubic to Almost Linear Time

Arxiv

0+阅读 · 1月25日

FLOP-Efficient Training: Early Stopping Based on Test-Time Compute Awareness

Arxiv

0+阅读 · 1月4日

DiT-HC: Enabling Efficient Training of Visual Generation Model DiT on HPC-oriented CPU Cluster

Arxiv

0+阅读 · 1月4日

BLISS: Bandit Layer Importance Sampling Strategy for Efficient Training of Graph Neural Networks

Arxiv

0+阅读 · 2025年12月26日

Tiny-TSM: Efficiently Training a Lightweight SOTA Time Series Foundation Model

Arxiv

0+阅读 · 2025年11月24日

参考链接

微信扫码咨询专知VIP会员