并行计算论文 - 专知

会员服务 ·

并行计算

EchoFlow: A Workload-Aware Parameter Tuning Method for Blockchain Systems

Arxiv

0+阅读 · 6月22日

Clutch: High Performance Vector-Scalar Comparison using DRAM via Chunked Temporal Coding

Arxiv

0+阅读 · 6月22日

Accelerating Disaggregated RL for Visual Generative LLMs with Diffusion-Based Parallelism and Trainer-Assisted Generation

Arxiv

0+阅读 · 6月23日

Node-Level Performance and Energy Characterization of Flagship Science Applications on SuperMUC-NG Phase 2

Arxiv

0+阅读 · 6月22日

MTGenRec: An Efficient Distributed Training System for Generative Recommendation Models in Meituan

Arxiv

0+阅读 · 6月22日

VoltanaLLM: Energy-Efficient and SLO-Aware Disaggregated LLM Serving via Adaptive Frequency Control and State-Space Routing

Arxiv

0+阅读 · 6月22日

LiveServe: Interaction-Aware Serving for Real-Time Omni-Modal LLMs

Arxiv

0+阅读 · 6月22日

Leader Rotation Is Not Enough: Scrutinizing Leadership Democracy of Chained BFT Consensus

Arxiv

0+阅读 · 6月23日

Asymmetry PRISM: A CPU/GPU Portfolio Optimization Engine for Deadline-Bounded Institutional Rebalancing

Arxiv

0+阅读 · 6月22日

Hash Table Design for RDMA:Challenges and Opportunities

Arxiv

0+阅读 · 6月23日

An Efficient Construction of Completely Independent Spanning Trees in Dense Gaussian Networks

Arxiv

0+阅读 · 6月22日

CrossPool: Efficient Multi-LLM Serving for Cold MoE Models through KV-Cache and Weight Disaggregation

Arxiv

0+阅读 · 6月23日

Committee Configuration Optimization for Parallel Byzantine Consensus in a Trusted Execution Environment

Arxiv

0+阅读 · 6月22日

Quantum ring all-reduce: communication and privacy advantages for distributed learning

Arxiv

0+阅读 · 6月23日

FP8 is All You Need (Part 2): Efficient Ozaki-Bailey Style FFT Through Tensor-core Garner Reformulation and Kulisch Escape Route

Arxiv

0+阅读 · 5月28日

参考链接

微信扫码咨询专知VIP会员