成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
不稳定
关注
0
综合
百科
VIP
热门
动态
论文
精华
Quantum-Enhanced Neural Contextual Bandit Algorithms
Arxiv
0+阅读 · 1月6日
DoPE: Denoising Rotary Position Embedding
Arxiv
0+阅读 · 1月6日
Output Embedding Centering for Stable LLM Pretraining
Arxiv
0+阅读 · 1月5日
BeatlesFC: Harmonic function annotations of Isophonics' The Beatles dataset
Arxiv
0+阅读 · 1月5日
From Commits to Confidence: Towards Stability-Informed Risk Assessment in Open Source Software
Arxiv
0+阅读 · 1月5日
VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation
Arxiv
0+阅读 · 1月5日
Identifying recurrent flows in high-dimensional dissipative chaos from low-dimensional embeddings
Arxiv
0+阅读 · 1月4日
Correctness isnt Efficiency: Runtime Memory Divergence in LLM-Generated Code
Arxiv
0+阅读 · 1月3日
Moments Matter:Stabilizing Policy Optimization using Return Distributions
Arxiv
0+阅读 · 1月5日
Dichotomous Diffusion Policy Optimization
Arxiv
0+阅读 · 2025年12月31日
Bridging Geometry and Appearance: Topological Features for Robust Self-Supervised Segmentation
Arxiv
0+阅读 · 1月4日
Physio-DPO: Aligning Large Language Models with the Protein Energy Landscape to Eliminate Structural Hallucinations
Arxiv
0+阅读 · 1月2日
Learning Temporally Consistent Turbulence Between Sparse Snapshots via Diffusion Models
Arxiv
0+阅读 · 2025年12月31日
DaGRPO: Rectifying Gradient Conflict in Reasoning via Distinctiveness-Aware Group Relative Policy Optimization
Arxiv
0+阅读 · 2025年12月31日
Understanding and Steering the Cognitive Behaviors of Reasoning Models at Test-Time
Arxiv
0+阅读 · 2025年12月31日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top