模型推理论文 - 专知

会员服务 ·

模型推理

MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference

Arxiv

0+阅读 · 6月15日

Localizing Credit at the Divergence: Path-Conditioned Self-Distillation for LLM Reasoning

Arxiv

0+阅读 · 6月14日

Privacy from Symmetry: Orthogonally Equivariant Transformers for LLM Inference

Arxiv

0+阅读 · 6月15日

Understanding Diversity Collapse in RLVR via the Lens of Overtraining

Arxiv

0+阅读 · 6月13日

A Spatio-Temporal Expert Prefetching Framework for Efficient MoE-based LLM Inference

Arxiv

0+阅读 · 6月13日

Frontier: Towards Comprehensive and Accurate LLM Inference Simulation

Arxiv

0+阅读 · 6月13日

Less is More: Improving LLM Reasoning with Minimal Test-Time Intervention

Arxiv

0+阅读 · 6月14日

A Gradient Perspective on RLVR Stability and Winner Advantage Policy Optimization

Arxiv

0+阅读 · 6月15日

AdaSTORM: Scaling LLM Reasoning on Dynamic Graphs via Adaptive Spatio-Temporal Multi-Agent Collaboration

Arxiv

0+阅读 · 6月15日

CentroidKV: Efficient Long-Context LLM Inference via KV Cache Clustering

Arxiv

0+阅读 · 6月14日

Communication-Efficient Verifiable Attention for LLM Inference

Arxiv

0+阅读 · 6月15日

Enhanced and Efficient Reasoning in Large Learning Models

Arxiv

0+阅读 · 5月13日

Distilling LLM Reasoning into an Interpretable Policy Tree for Human-AI Collaboration

Arxiv

0+阅读 · 6月7日

Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning

Arxiv

0+阅读 · 5月14日

Entity Binding Failures in Speech LLM Reasoning: Diagnosis and Chain-of-Thought Intervention

Arxiv

0+阅读 · 6月11日

参考链接

微信扫码咨询专知VIP会员