策略迭代论文 - 专知

会员服务 ·

策略迭代

Gaussian process policy iteration with additive Schwarz acceleration for forward and inverse HJB and mean field game problems

Arxiv

0+阅读 · 6月21日

RoboLineage: Agent-Native Data Lifecycle Governance Across Robot Policy Iterations

Arxiv

0+阅读 · 6月20日

Approximate Next Policy Sampling: Replacing Conservative Target Policy Updates in Deep RL

Arxiv

0+阅读 · 6月17日

Robust Regularized Policy Iteration under Transition Uncertainty

Arxiv

0+阅读 · 6月17日

Scalar-Stepsize Nonuniform Monte Carlo Optimistic Policy Iteration: A Certified Counterexample

Arxiv

0+阅读 · 6月14日

Strongly Polynomial Time Complexity of Policy Iteration for $L_\infty$ Robust MDPs

Arxiv

0+阅读 · 6月2日

On the Complexity of Discounted Robust MDPs with $L_p$ Uncertainty Sets

Arxiv

0+阅读 · 5月8日

Policy Iteration for Two-Player General-Sum Stochastic Stackelberg Games

Arxiv

0+阅读 · 3月16日

Robust Regularized Policy Iteration under Transition Uncertainty

Arxiv

0+阅读 · 3月14日

Robust Regularized Policy Iteration under Transition Uncertainty

Arxiv

0+阅读 · 3月10日

Frozen Policy Iteration: Computationally Efficient RL under Linear $Q^π$ Realizability for Deterministic Dynamics

Arxiv

0+阅读 · 2月28日

A Policy Iteration Method for Inverse Mean Field Games

Arxiv

0+阅读 · 2月11日

Decentralized Federated Learning With Energy Harvesting Devices

Arxiv

0+阅读 · 2月15日

Gaussian-Mixture-Model Q-Functions for Policy Iteration in Reinforcement Learning

Arxiv

0+阅读 · 2025年12月21日

Convergence of Fast Policy Iteration in Markov Games and Robust MDPs

Arxiv

0+阅读 · 2025年11月16日

参考链接

微信扫码咨询专知VIP会员