势函数论文 - 专知

会员服务 ·

势函数

Rethinking Groups in Critic-Free RLVR

Arxiv

0+阅读 · 6月15日

Automated Amortised Analysis of Skew Heaps and Leftist Heaps (Extended Version)

Arxiv

0+阅读 · 5月12日

An Entropy Potential for Type-Composition Games

Arxiv

0+阅读 · 6月12日

Fast Rates in $α$-Potential Games via Regularized Mirror Descent

Arxiv

0+阅读 · 5月18日

Snowveil: A Framework for Decentralised Preference Discovery

Arxiv

0+阅读 · 5月26日

Learning Equilibria in Coordination Games via Minorization-Maximization

Arxiv

0+阅读 · 5月13日

Learning Equilibria in Coordination Games via Minorization-Maximization

Arxiv

0+阅读 · 5月20日

A Behavioral Micro-foundation for Cross-sectional Network Models

Arxiv

0+阅读 · 5月4日

Data-driven construction of machine-learning-based interatomic potentials for gas-surface scattering dynamics: the case of NO on graphite

Arxiv

0+阅读 · 3月19日

A Note on How to Remove the $\ln\ln T$ Term from the Squint Bound

Arxiv

0+阅读 · 4月29日

Regularity of Solutions to Beckmann's Parametric Optimal Transport

Arxiv

0+阅读 · 3月20日

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 4月4日

Alternating Diffusion for Proximal Sampling with Zeroth Order Queries

Arxiv

0+阅读 · 3月20日

$k$-server-bench: Automating Potential Discovery for the $k$-Server Conjecture

Arxiv

0+阅读 · 4月8日

Crack detection by holomorphic neural networks and transfer-learning-enhanced genetic optimization

Arxiv

0+阅读 · 3月13日

参考链接

微信扫码咨询专知VIP会员