成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
大语言模型推理
关注
2
综合
百科
VIP
热门
动态
论文
精华
UltraLogic: Enhancing LLM Reasoning through Large-Scale Data Synthesis and Bipolar Float Reward
Arxiv
0+阅读 · 1月6日
ATLAS: Adaptive Test-Time Latent Steering with External Verifiers for Enhancing LLMs Reasoning
Arxiv
0+阅读 · 1月6日
Improving Human Verification of LLM Reasoning through Interactive Explanation Interfaces
Arxiv
0+阅读 · 1月2日
Less is More: Improving LLM Reasoning with Minimal Test-Time Intervention
Arxiv
0+阅读 · 2025年12月31日
iCLP: Large Language Model Reasoning with Implicit Cognition Latent Planning
Arxiv
0+阅读 · 2025年12月30日
Argus: Token Aware Distributed LLM Inference Optimization
Arxiv
0+阅读 · 2025年12月28日
Learning to Reason in LLMs by Expectation Maximization
Arxiv
0+阅读 · 2025年12月23日
FlowRL: Matching Reward Distributions for LLM Reasoning
Arxiv
0+阅读 · 2025年11月4日
Verifying LLM Inference to Prevent Model Weight Exfiltration
Arxiv
0+阅读 · 2025年11月4日
Verifying LLM Inference to Detect Model Weight Exfiltration
Arxiv
0+阅读 · 2025年12月10日
T-SAR: A Full-Stack Co-design for CPU-Only Ternary LLM Inference via In-Place SIMD ALU Reorganization
Arxiv
0+阅读 · 2025年11月17日
Stepwise Think-Critique: A Unified Framework for Robust and Interpretable LLM Reasoning
Arxiv
0+阅读 · 2025年12月17日
Mirror Speculative Decoding: Breaking the Serial Barrier in LLM Inference
Arxiv
0+阅读 · 2025年12月11日
Position: On the Methodological Pitfalls of Evaluating Base LLMs for Reasoning
Arxiv
0+阅读 · 2025年11月13日
Well Begun, Half Done: Reinforcement Learning with Prefix Optimization for LLM Reasoning
Arxiv
0+阅读 · 2025年12月17日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top