成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
并行计算
关注
14
综合
百科
VIP
热门
动态
论文
精华
ZipServ: Fast and Memory-Efficient LLM Inference with Hardware-Aware Lossless Compression
Arxiv
0+阅读 · 3月18日
HierarchicalKV: A GPU Hash Table with Cache Semantics for Continuous Online Embedding Storage
Arxiv
0+阅读 · 3月17日
Multi-stage Flow Scheduling for LLM Serving
Arxiv
0+阅读 · 3月18日
The 1/W Law: An Analytical Study of Context-Length Routing Topology and GPU Generation Gains for LLM Inference Energy Efficiency
Arxiv
0+阅读 · 3月18日
CurvFed: Curvature-Aligned Federated Learning for Fairness without Demographics
Arxiv
0+阅读 · 3月17日
Biased Compression in Gradient Coding for Distributed Learning
Arxiv
0+阅读 · 3月17日
Building a Correct-by-Design Lakehouse. Data Contracts, Versioning, and Transactional Pipelines for Humans and Agents
Arxiv
0+阅读 · 3月17日
Equivalence and Separation between Heard-Of and Asynchronous Message-Passing Models
Arxiv
0+阅读 · 3月17日
ODIN-Based CPU-GPU Architecture with Replay-Driven Simulation and Emulation
Arxiv
0+阅读 · 3月17日
Accelerating the Particle-In-Cell code ECsim with OpenACC
Arxiv
0+阅读 · 3月17日
Unifying Optimization and Dynamics to Parallelize Sequential Computation: A Guide to Parallel Newton Methods for Breaking Sequential Bottlenecks
Arxiv
0+阅读 · 3月17日
Dataflow-Oriented Classification and Performance Analysis of GPU-Accelerated Homomorphic Encryption
Arxiv
0+阅读 · 3月17日
AI4EOSC: a Federated Cloud Platform for Artificial Intelligence in Scientific Research
Arxiv
0+阅读 · 3月17日
Looking for (Genomic) Needles in a Haystack: Sparsity-Driven Search for Identifying Correlated Genetic Mutations in Cancer
Arxiv
0+阅读 · 3月17日
FleetOpt: Analytical Fleet Provisioning for LLM Inference with Compress-and-Route as Implementation Mechanism
Arxiv
0+阅读 · 3月17日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top