成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
感知路由
关注
0
综合
百科
VIP
热门
动态
论文
精华
DecoSearch: Complexity-Aware Routing and Plan-Level Repair for Text-to-SQL
Arxiv
0+阅读 · 6月16日
Solyx AI Grid: Hardware-Telemetry-Aware Routing Across Geographically Distributed GPU Clusters
Arxiv
0+阅读 · 6月13日
GRACE-MoE: Grouping and Replication with Locality-Aware Routing for Efficient Distributed MoE Inference
Arxiv
0+阅读 · 5月6日
Trust-Aware Routing for Distributed Generative AI Inference at the Edge
Arxiv
0+阅读 · 3月30日
Route to Rome Attack: Directing LLM Routers to Expensive Models via Adversarial Suffix Optimization
Arxiv
0+阅读 · 4月16日
Accuracy Is Speed: Towards Long-Context-Aware Routing for Distributed LLM Serving
Arxiv
0+阅读 · 4月17日
PROTEUS: SLA-Aware Routing via Lagrangian RL for Multi-LLM Serving Systems
Arxiv
0+阅读 · 2月3日
CALM: A Self-Adaptive Orchestration Approach for QoS-Aware Routing in Small Language Model based Systems
Arxiv
0+阅读 · 2月3日
GRACE-MoE: Grouping and Replication with Locality-Aware Routing for Efficient Distributed MoE Inference
Arxiv
0+阅读 · 1月24日
PROTEUS: SLA-Aware Routing via Lagrangian RL for Multi-LLM Serving Systems
Arxiv
0+阅读 · 1月27日
EndoIR: Degradation-Agnostic All-in-One Endoscopic Image Restoration via Noise-Aware Routing Diffusion
Arxiv
0+阅读 · 2025年11月8日
HERMES: Heterogeneous Application-Enabled Routing Middleware for Edge-IoT Systems
Arxiv
0+阅读 · 2025年12月8日
Urgency-aware Routing in Single Origin-destination Itineraries through Artificial Currencies
Arxiv
0+阅读 · 2023年3月29日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top