成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
模型推理
关注
1
综合
百科
VIP
热门
动态
论文
精华
Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning
Arxiv
0+阅读 · 3月17日
FlashHead: Efficient Drop-In Replacement for the Classification Head in Language Model Inference
Arxiv
0+阅读 · 3月15日
Buffer Matters: Unleashing the Power of Off-Policy Reinforcement Learning in Large Language Model Reasoning
Arxiv
0+阅读 · 3月16日
Multi-Layer Scheduling for MoE-Based LLM Reasoning
Arxiv
0+阅读 · 3月2日
ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs
Arxiv
0+阅读 · 3月8日
SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference
Arxiv
0+阅读 · 3月5日
Thinking by Subtraction: Confidence-Driven Contrastive Decoding for LLM Reasoning
Arxiv
0+阅读 · 2月20日
Ouroboros: Wafer-Scale SRAM CIM with Token-Grained Pipelining for Large Language Model Inference
Arxiv
0+阅读 · 3月3日
Inference-Time Toxicity Mitigation in Protein Language Models
Arxiv
0+阅读 · 3月4日
λScale: Enabling Fast Scaling for Serverless Large Language Model Inference
Arxiv
0+阅读 · 3月5日
SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models
Arxiv
0+阅读 · 3月5日
Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference
Arxiv
0+阅读 · 3月11日
DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models
Arxiv
0+阅读 · 2月21日
HillInfer: Efficient Long-Context LLM Inference on the Edge with Hierarchical KV Eviction using SmartSSD
Arxiv
0+阅读 · 2月21日
Watson & Holmes: A Naturalistic Benchmark for Comparing Human and LLM Reasoning
Arxiv
0+阅读 · 2月23日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top