成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
负载
关注
0
综合
百科
VIP
热门
动态
论文
精华
Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines
Arxiv
0+阅读 · 3月17日
ODIN-Based CPU-GPU Architecture with Replay-Driven Simulation and Emulation
Arxiv
0+阅读 · 3月17日
FleetOpt: Analytical Fleet Provisioning for LLM Inference with Compress-and-Route as Implementation Mechanism
Arxiv
0+阅读 · 3月17日
Serving Hybrid LLM Loads with SLO Guarantees Using CPU-GPU Attention Piggybacking
Arxiv
0+阅读 · 3月17日
Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective
Arxiv
0+阅读 · 3月17日
Workload-Aware Incremental Reclustering in Cloud Data Warehouses
Arxiv
0+阅读 · 3月16日
PAT: Accelerating LLM Decoding via Prefix-Aware Attention with Resource Efficient Multi-Tile Kernel
Arxiv
0+阅读 · 3月16日
Multi-Objective Load Balancing for Heterogeneous Edge-Based Object Detection Systems
Arxiv
0+阅读 · 3月16日
Co-Design of Memory-Storage Systems for Workload Awareness with Interpretable Models
Arxiv
0+阅读 · 3月16日
A Texture Lookup Approach to Bézier Curve Evaluation on the GPU
Arxiv
0+阅读 · 3月16日
LMetric: Simple is Better - Multiplication May Be All You Need for LLM Request Scheduling
Arxiv
0+阅读 · 3月16日
Idiosyncrasies of Programmable Caching Engines
Arxiv
0+阅读 · 3月15日
The Big Send-off: Scalable and Performant Collectives for Deep Learning
Arxiv
0+阅读 · 3月15日
A New Construction Structure on Multi-access Coded Caching with Linear Subpacketization: Cyclic Multi-Access Non-Half-Sum Disjoint Packing
Arxiv
0+阅读 · 3月14日
A Target-Agnostic Protocol-Independent Interface for the Transport Layer
Arxiv
0+阅读 · 3月14日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top