值函数论文 - 专知

会员服务 ·

值函数

Approximating Gaussian Whittle-Matern Fields over Well-Centered Triangulations of Riemannian Manifolds

Arxiv

0+阅读 · 6月15日

Learning Upper Lower Value Envelopes to Shape Online RL: A Principled Approach

Arxiv

0+阅读 · 6月16日

Why Tree-Style Branching Matters for Thought Advantage Estimation in GRPO

Arxiv

0+阅读 · 6月15日

Value Functions as Supermartingale Certificates

Arxiv

0+阅读 · 5月29日

Almost All Vectorial Functions Have Trivial Extended-Affine Stabilizers

Arxiv

0+阅读 · 5月22日

Reinforcement Learning Measurement Model

Arxiv

0+阅读 · 5月10日

The Boolean surface area of polynomial threshold functions

Arxiv

0+阅读 · 4月27日

Semiparametric Bayesian Difference-in-Differences

Arxiv

0+阅读 · 6月4日

The Value Function Semi-Algebraic Set in Partially Observable Markov Decision Processes

Arxiv

0+阅读 · 6月2日

Spline Interpolation on Compact Riemannian Manifolds

Arxiv

0+阅读 · 3月27日

Value Functions for Temporal Logic: Optimal Policies and Safety Filters

Arxiv

0+阅读 · 5月1日

Bifunction and Interlevel Delaunay Trifiltrations

Arxiv

0+阅读 · 5月20日

On Cutting Cakes and Crossing Curves

Arxiv

0+阅读 · 6月11日

A Counterexample to EFX $n \ge 3$ Agents, $m \ge n + 5$ Items, Submodular Valuations via SAT-Solving

Arxiv

0+阅读 · 5月14日

Knowing When to Quit: A Principled Framework for Dynamic Abstention in LLM Reasoning

Arxiv

0+阅读 · 6月12日

参考链接

微信扫码咨询专知VIP会员